Archivo de tags: Integración de datos

En anteriores entradas hemos hablado del uso del BI (Business Intelligence) para el tratamiento de los datos de una empresa con el fin de obtener información. Hoy hablaremos de un proceso para integrar datos con el fin de obtener esta información: ETL.

¿Qué significa ETL?

ETL son las siglas en inglés de los pasos que conforman el proceso: Extract, Transform, Load. (Extracción, Transformación, Carga).

  • Extracción: Consiste en obtener datos de una o varias fuentes. Estas pueden ser: Bases de datos, APIs, documentos CSV, ficheros Excel, etc.
  • Transformación: En este paso se realizan los cálculos, validaciones y limpieza de los datos obtenidos de la extracción, adecuándolos con el objetivo de obtener la información necesaria.
  • Carga: Los datos, una vez modificados para la obtención de información, se vuelcan en almacenes de datos, que al igual que en la extracción, puede ser de diferentes tipos: ficheros, bases de datos, Data Warehouse, etc.

En resumen, estos procesos nos permiten obtener una gran cantidad de información de diversos medios, transformarla, adaptarla a nuestras necesidades y almacenarla de forma que podamos hacer uso de esta información.

Si todavía no comprendes el objetivo de un ETL no te preocupes, lo verás más claro con el siguiente ejemplo:

Ejemplo: ThunderBolt Sunglasses

ThunderBolt Sunglasses es una compañía de venta de gafas de sol que está arrasando en la industria. Esta empresa desea conocer los índices de venta de sus productos en España. La información de estas ventas las tiene en una base de datos MySQL desde su tienda online, archivos CSV desde su ERP y en ficheros Excel desde sus franquicias y representantes.

Mediante el proceso de extracción, un ETL permite trabajar con orígenes de datos distintos, por lo que la diversidad de orígenes de datos no supone un impedimento.

Una vez realizada la extracción, se necesitan realizar los cálculos que permitan obtener los valores que se desean. Este paso lo realiza el proceso de transformación de datos, en el cual se realizan las transformaciones necesarias para convertir los datos en información.

Por último, realizando una carga de estos datos en un Data Warehouse permitirá acceder a la información de los índices de ventas.

Ejemplo de flujo ETL

Aplicaciones

Como habrás visto en el ejemplo, los procesos ETL resultan ser una herramienta bastante potente a la hora de importar y procesar datos, pero… ¿Es la única utilidad que tienen? Ya te adelanto que en sumamoOs empleamos herramientas ETL para muchas más áreas. Por nombrar algunas, vamos a ver una lista de funciones que se pueden realizar a partir de un proceso ETL:

 

  • Mover datos desde una o varias fuentes de datos.
  • Dar formato a los datos y limpiarlos para poder mostrarlos en informes, cuadros de mando e información unificada.
  • Migrar los datos de una fuente a otra, como una base de datos, un Data Mart o un Data Warehouse.
  • Tareas de base de datos, como consolidar, migrar y sincronizar bases de datos.
  • Migración de datos de aplicaciones entre versiones.
  • Sincronizar entre diferentes sistemas operacionales, como entre un entorno ERP y un entorno Web.
  • Interfaz con sistemas externos, ya sea para entrada como salida de datos, con APIs, ficheros…
  • Preparación de procesos masivos (Mailings, Newsletter, etc).

¿Quieres conocer más detalles?

En sumamoOs tenemos un gran conocimiento en el desarrollo de procesos ETL. De modo que, si quieres averiguar más detalles sobre el manejo de datos para la obtención de información, puedes consultar nuestra sección sobre el tratamiento de datoso  contactar con nosotros para conocer cómo transformar la operativa de tu empresa aprovechando estas herramientas.