Por primera vez en la historia de la humanidad tenemos más información de la que podemos procesar. Los datos constituyen un activo imprescindible para las compañías y se han convertido en una potente herramienta estratégica para la toma de decisiones que generan impacto de negocio.
En Hiberus nos gusta contar con los mejores, así que hoy conocemos más de cerca a los responsables de nuestra área de Data & Analytics, dedicada al desarrollo de soluciones y proyectos basados en tecnologías de datos.
Mariano Minoli está vinculado al mundo de los datos desde hace 20 años. Este argentino comenzó su andadura profesional a los 19 años, estando a cargo de un centro de procesamiento de datos (5 millones de transacciones al día). Trabajó en entornos relacionales y Data Warehousing, en plataformas de Oracle y de Microsoft.
Tras la realización de un doctorado que le hizo acercarse a la Ontologías y Semántica, volvió a la industria en 2012 para trabajar en Big Data y Machine Learning (formado en MIT). Además, colabora con un proyecto de investigación en Argentina especializado en el área de Procesamiento del Lenguaje Natural.
¡Mariano incluso ha sido el presentador oficial de la versión de SQL server para Microsoft!
Alejandro Moreno realizó como proyecto de fin de carrera una plataforma de Data Warehouse enfocada en analizar y mostrar información para una start-up cuyo negocio era la seguridad. Tras ese período desarrollándose profesionalmente en Suiza volvió a Zaragoza como responsable técnico de la plataforma de Business Intelligence de una gran entidad de derecho público. Se montó una plataforma nueva de Business Intelligence y Data Warehouse con los nuevos productos de Oracle, y se presentaron los primeros casos de uso en diferentes eventos a lo largo de toda España (Barcelona, Madrid y Málaga).
Se incorporó a una multinacional para trabajar como analista y desarrollador de proyectos de Business Intelligence y con el tiempo evolucionó hacia diferentes tecnologías Big Data, como Hadoop o productos como Vertica ( es una base de datos columnar) y Idol (plataforma de indexación de contenidos).
Después de trabajar en diferentes proyectos para muchos clientes, en 2015 Alejandro arrancó y lideró un proyecto para una gran entidad bancaria del IBEX 35 que empezó con un equipo de 3 personas y que en los últimos años se ha mantenido estable en 30 personas dedicadas a proyectos de modelado corporativo, visualización, ingesta en tiempo real y machine learning.
¿Qué es lo que más os interesa del mundo Data?
Mariano: Por primera vez en la historia, la humanidad está generando más datos que los que puede procesar… me parece un reto aprovechar toda esta información para superar los desafíos actuales de las organizaciones.
Alejandro: El conocimiento del negocio que tiene que haber detrás. Así, como en otras áreas puedes trabajar son conocer el negocio en sí, aquí sin conocer el negocio y el contexto es imposible que trabajes.
Sabemos que Data Science no se trata sólo de cuadros de mando, reports, modelos o algoritmos, sino que va más allá de todo eso. ¿Podrías explicarnos para qué sirve la ciencia de datos a nivel empresarial?
Mariano: Actualmente todos tenemos claro el valor que se puede obtener de los datos. Durante años el mercado no les ha dado la importancia que se les asigna hoy en día. Eso ha hecho que las empresas inicien procesos de transformación digital y tiendan a modelos DDD (Decision Data Driven). Las empresas, ahora más que nunca, están preocupadas en obtener información a partir de los datos de las herramientas que disponen. Hay mucha gente que considera que ¡Los datos son el nuevo petróleo!
Alejandro: Todo viene con la explosión de internet y de las redes sociales. Muchos datos ya se estaban obteniendo, pero no se estaban analizando. Las propias herramientas de Big Data y visualización de datos han evolucionado y ahora es más fácil obtener más información. El desarrollo de las plataformas de cloud en los últimos años también lo ha facilitado.
Muchas veces la gente confunde erróneamente el data o el business intelligence con un cuadro de mando o un report. ¿Podéis contarnos más sobre el proceso que hay detrás de todo?
Alejandro: Detrás del cuadro de mando hay una estrategia de análisis de datos. El proceso que llevamos a cabo consiste en detectar las necesidades de información de cada organización, identificar las fuentes de información adecuadas, analizar cómo se combina la información y cómo se ofrece su visualización.
Mariano: Cuando comenzamos a trabajar con un cliente, una de las primeras cosas que hacemos es analizar la madurez de su ecosistema de datos. Muchas veces los clientes quieren obtener la información, pero sus entornos de datos no tienen la madurez necesaria para estos procesos.
¿Qué perfil tiene un profesional de los datos?
Alejandro: Un profesional de los datos es un perfil complejo porque la tecnología avanza muy rápido y eso hace que tengas que estar en formación continua. Muchas de las tecnologías con las que trabajas hoy en día, hace algunos años prácticamente no existían. En nuestro equipo identificamos distintos tipos de perfiles:
- Un perfil de data que trata y procesa la información. Suele tener una base analítica y estructurada.
- Un perfil de data que muestra la información. Un perfil imaginativo normalmente vinculado al diseño y a la usabilidad, que esté más cerca de lo que el cliente espera.
Mariano: Hace 5 años no existían la mayoría de las herramientas que utilizamos por lo que no es posible tener una gran experiencia. Hace falta ser estar siempre motivado y abierto a formarse constantemente.
¿Cómo están cambiando los grandes datos el mundo? ¿Algún ejemplo?
Mariano: Están cambiado el mundo, la forma de hacer negocios y la forma de dar servicios. Hoy en día todos interactuamos con servicios de datos y ni siquiera nos damos cuenta. Google es, por ejemplo, uno de los primeros sistemas de Big Data de la historia y su éxito se debe a algunas estrategias en ese aspecto. También Uber, Trivago, Booking, todas las apps… están obteniendo datos de nuestro uso y realizan recomendaciones en base a eso.
Alejandro: No sabemos cómo los datos están cambiando nuestro día a día. Hay un video de The Economist en el que puede verse como los datos han cambiado la forma de jugar al baloncesto en los Estados Unidos porque en los años 80 cuando se inventaron los triples, apenas se tiraban triples; sin embargo, conforme se han pudieron a analizar los movimientos de los jugadores, las posibilidades de tiro desde las diferentes zonas desde las que puedes tirar a canasta, se ha visto que es mejor tirar de triple aunque tengas un menor porcentaje porque anotas más puntos.… es decir, el tipo de jugador que juega en la NBA se ha visto modificado debido a los datos.
Ahora son jugadores más atléticos que pueden anotar desde cualquier posición. De hecho, la evolución misma se puede haber observado en Marc Gasol que ha pasado a lanzar y anotar triples, algo impensable en los inicios de su carrera.
¿Cuáles son las grandes tendencias en visualización y analítica de datos?
Mariano: En tema de visualización hay una tendencia hacia entornos selfservice analytics. Desde hace años las gerencias medias analizan sus datos con herramientas como Excel. Ahora se trabaja con herramientas de visualización mucho más potentes como Power BI, Qlik o Tableau…
¿Cómo está evolucionando el uso de los datos en las empresas españolas? ¿Cuánto de maduras son respecto a su capacidad de explotar las posibilidades del big data?
Alejandro: En España las grandes empresas ya están analizando datos a la hora de tomar decisiones en su día a día. Ahora es necesario que poco a poco vayan dado el salto las empresas de siguiente nivel.
El mundo digital en el que estamos y hacia el que avanzamos, necesita adaptarse a trabajar con los datos o no tiene ninguna posibilidad de supervivencia. El que no esté actualizado desaparecerá.
¿De qué manera los datos aportan valor de negocio? ¿Cómo compensa la inversión inicial necesaria?
Alejandro: Como aporta valor, provoca un retorno de la inversión. En banca se mueven muchos sistemas antiguos y mover esos datos cuesta mucho dinero. Con plataformas nuevas, los datos se mueven de una manera mucho más ágil. Ahí hay un retorno de la inversión bastante claro. Otro retorno de la inversión, pero es un poco más difícil de cuantificar, es cuando hemos implementado un sistema de machine learning donde puedes hacer que los algoritmos realicen acciones que los empleados harían de forma manual.
Podemos remplazar trabajo manual y rutinario de un empleado por una herramienta tecnológica, dedicándose así los empleados a tareas que aporten más valor y que sean menos mecánicas.
¿Qué impacto tienen las tecnologías de machine learning en datos?
Mariano: Estamos viviendo una tendencia que hasta ahora no se había visto, de utilizar técnicas de inteligencia artificial sobre grandes volúmenes de datos para devolver resultados inmediatamente a los sistemas operacionales de la empresa.
Un ejemplo de este comportamiento es el que tiene Netflix con el catálogo personalizado de películas.
Estas tecnologías y algoritmos existen desde hace años, pero no se habían combinado. Hemos pasado de un reporte mensual donde se explica que pasó a un punto en el que se analiza que está pasando, porqué, y qué pasaría en el futuro si tomo una decisión y qué tengo que hacer ahora para que esto pase en el futuro.
El Machine Learning va hacia adelante, toma decisiones en base a los datos. Estamos viviendo un momento de Accionable Information.
Otro ejemplo es Waze, que está dirigiendo el tráfico mundial, o más en nuestro día a día Google Maps. Hay muchas tareas diarias que están pasando a dirigirse a través de sistemas basados en datos.
¿En qué consiste la unidad Data de Hiberus?
Una empresa que quiere dar el salto al business Intelligence debería contar con Hiberus Data & Analytics porque lo formamos un equipo de perfiles hiperespecializados y certificados que están a la última.
Tenemos organizada nuestra unidad de datos en 4 líneas de trabajo diferentes y complementarias, siempre aplicado a cada empresa/organización.
- Sistemas de inteligencia de negocio (business intelligence), tradicionales (tecnologías maduras que pueden ser micro strategy, análisis services, obi, coptos…)
- Ingeniería de datos (data engineering). Procesamiento de grandes volúmenes de datos con procesamiento paralelo. Es lo que antes se llamaba Big Data, plataformas como Cloudera, Amazon, Spark, Azure o Google…
- Data Science. Inteligencia artificial, machine learning… trabajamos con esas técnicas con maneras muy aplicada a la industria/organización. Otras áreas de Hiberus
- Perfiles IA engineer, DATA Scientist… y las herramientas son frameworks como Tensorflow, Keras, Pytorch, Jupyter, Python (lenguaje)
- BI 2.0. Ingeligencia de negocio 2.0. Con herramientas nuevas y modernas, trabajar sobre proyectos de entornos de inteligencia de negocio. Visualización y data merge/warehouse sobre plaraformas cloud. No todo el mundo necesita Big Data, pero todo el mundo necesita analizar sus datos.
En Machine learning, somos capaces de llevar a entornos de producción técnicas y herramientas de machine learning y no solo proponer ideas. No empezamos un proyecto de machine learning hasta que no hemos identificado cual es la ventaja competitiva, el retorno de inversión… y si no lo saben, les ayudamos a definirlo.
La industria se encuentra en un punto de madurez y en Hiberus Data & Analytics contamos con un equipo hiperespecializado para dar soluciones de inicio a fin.
Si quieres conocer más de cerca nuestro área de Data & Analytics de Hiberus, no dudes en contactar con nosotros. ¡Estaremos encantados de ayudarte!
¿Quieres más información sobre nuestros servicios de Data & Analytics?
Contacta con nuestro equipo de expertos en Data & Analytics