Del Big Data al Machine Learning



Por María Elena Barros, presidente de Semperti.

 La inmensa acumulación de datos enfrentó al mundo con la problemática del volumen de información en cantidades nunca antes vistas. Así nació el Big Data, como una solución para capturar, gestionar, procesar y analizar combinaciones de conjuntos de datos cuyo tamaño (volumen), complejidad (variabilidad) y velocidad de crecimiento (velocidad) no pueden ser manejadas por herramientas tradicionales tales como bases de datos relacionales y estadísticas convencionales o paquetes de visualización dentro del tiempo necesario para que sean útiles.

Se estima que si toda la información producida por los seres humanos en el mundo se guardara en CDs se formaría una montaña tan alta que llegaría desde la Tierra hasta la Luna y volvería. En este contexto, entender qué es Big Data y la importancia que su correcta gestión produce en las empresas se convierte en un hito central para el crecimiento del revenue en los balances de negocio.

La creación y almacenamiento masivo de datos no es exclusiva de una industria ni tampoco de los seres humanos. Las compañías privadas de diversos sectores, e incluso el sector público, mantienen grandes cantidades de datos transaccionales reuniendo información sobre clientes, proveedores y operaciones, datos de censo de población, registros médicos, impuestos, transacciones financieras realizadas en línea o por dispositivos móviles, análisis de redes sociales y ubicación geográfica mediante coordenadas GPS, por mencionar algunas.

Pero, como dije al principio, no sólo los seres humanos contribuimos a este crecimiento enorme de información, existe también la comunicación denominada máquina a máquina (M2M machine-to-machine) cuyo valor en la creación de grandes cantidades de datos también es muy importante: sensores digitales instalados en contenedores para determinar la ruta generada, sensores en medidores eléctricos para determinar el consumo de energía a intervalos regulares, entre otros.

En la Argentina, una de las primeras industrias en las que la explosión de información disponible vivió las consecuencias de buscar una aguja en un pajar fueron las compañías telefónicas con los análisis de los CDR (Call Detail Record), es decir, todos los datos que genera cada línea de celular. Cuando, por ejemplo, un edicto judicial pedía el historial de una línea, implicaba un reporte que se tenía que sacar de un repositorio de CDRs en los que se tenía que consultar registro por registro hasta recuperar todo lo solicitado. Esta actividad llevaba muchísimo tiempo e involucraba aún más recursos. Por lo que hubo que encontrar una solución eficiente. Esta solución vino de la mano de aplicar técnicas de Big Data como almacenamiento de datos distribuidos y algoritmos de map-reduce para el recupero de los datos.

El siguiente nivel en manejo de volúmenes de datos consistirá en contar con la capacidad de predecir la conducta. Machine Learning, disciplina científica del ámbito de la Inteligencia Artificial, crea sistemas que aprenden automáticamente, lo que significa identificar patrones complejos en millones de datos. En pocas palabras, con Machine Learning las organizaciones pasarán de ser reactivas a proactivas. Por ejemplo, podrían utilizarse este tipo de técnicas para hacer un análisis previo de las tomografías para que un sistema informático le indique al radiólogo cuales imágenes merecen particular atención en función de la presencia de anomalías.

En Semperti, con el objeto de acompañar a nuestros clientes en la transformación digital de sus negocios, hemos formado una práctica profesional en Big Data para ayudar a las empresas a integrar grandes volúmenes de datos, adquirir nuevas habilidades tecnológicas y vincular los silos de información para que puedan gestionar complejas transformaciones de datos garantizando la entrega de información de valor para el negocio en tiempo real.


Acerca de Semperti
Semperti diseña e implementa soluciones de infraestructura tecnológica, business intelligence, integración de software, hardware y servicios para mejorar los procesos críticos de negocio en organizaciones y empresas. Provee soluciones y servicios en la Argentina desde 2003, en Ecuador desde el 2014 y en Chile desde 2016.
Las alianzas estratégicas son una pieza clave en la propuesta de valor de Semperti que es Platinum Business Partner de IBM, Red Hat Advanced Business Partner, Oracle Gold Business Partner y Lenovo Tier 1. Además, cuenta con la certificación ISO-9001 desde 2008 como proveedor de servicios profesionales de TI, licencias de software y distribución de suscripciones y diseño de software a medida.