Big Data

¡Nuestros Ingenieros de datos le ayudaran a dar valor a los datos del negocio!

Habilite su lago de datos donde se centralizará data estructurada, semiestructurada y no estructurada en grandes volúmenes y alinearlo a los objetivos del negocio.

Conociendo y aplicando los procesos, adecuadamente

1

Ingesta

- Implemente pipelines de ingesta de grandes volúmenes de datos (GB to TB).
- Herramientas Open Source con respaldo activo de comunidades.
- Monitoreo y control a medida de acuerdo a los requerimientos de su negocio.
2

Almacenamiento

- Defina las capas de su datalake para obtener el mejor acceso a su data.
- Comprima su data a nivel de parquet, ORC o Avro, para incrementar el performance.
- Implemente puntos de control dentro de cada capa en el datalake para asegurar la trazabilidad y la calidad del dato.
3

Procesamiento

- Implemente y configure cluster de servidores con Hadoop y Spark para manejo de Big Data.
- Aproveche los beneficios del In memory de Spark para procesos de machine learning.
- Defina el estándar de código para la extracción y disponibilizacion de datos entre RBDMS y el datalake y visceversa.
4

Consumo

- Configure y habilite las herramientas del ecosistema Hadoop, como Impala, Hive o Pig para análisis y consumo de la data.
- Acceda a los datos a través de herramientas de visualización como Tableau, Infoview, Qlickview, etc
- Impulse el Self-Service de los datos con una correcta organización y disponibilidad hacia los usuarios.

Stack Tecnológico