Big Data: Componentes del Business Intelligence

Big Data: Componentes del Business Intelligence

BIG DATA

         Seguramente te preguntarás qué componentes hay en un Business Intelligence que hace posible que el análisis de datos se haya convertido en algo tan rápido y fácil para el usuario que se pueda obtener en varios “clics”, dejando de lado la cantidad de horas que antes de la aparición de Business Intelligence  debíamos invertir para la búsqueda, clasificación y análisis de datos que nos ayudaran a la toma de decisiones.

.         La definición de Business Intelligence nos dice que es el conjunto de estrategias, aplicaciones, datos, productos, tecnologías y arquitecturas técnicas, los cuales están enfocados a la administración y creación de conocimiento sobre el medio, a través del análisis de los datos existentes en una empresa u organización. Este conjunto de metodologías y aplicaciones tecnológicas nos permiten reunir, depurar y transformar datos de los sistemas transaccionales e información desestructurada en información estructurada, para su explotación directa (análisis o reporting) o para su análisis y conversión en conocimiento, dando así soporte a la toma de decisiones sobre el negocio.

       En el post de hoy explicaremos las aplicaciones, tecnologías y arquitectura de una solución Business Intelligence que hacen posible esta explotación de datos, sus componentes básicos y la función que tiene cada uno de ellos.

             ARQUITECTURA DE UNA SOLUCIÓN BUSINESS INTELLIGENCE Y FLUJO DE DATOS

            El punto de partida de una solución de Business Intelligence son los sistemas de organización como son bases de datos, ERP’s, ficheros de texto, ficheros xls, etc., sobre los se le debe aplicar una transformación estructural con el fin de optimizar el proceso de análisis.

            Para ello se realiza una primera fase de extracción, transformación y carga de datos, proceso conocido como ETL. Esta etapa suele apoyarse en un almacén intermedio, llamado ODS, que actúa como pasarela entre los sistemas fuente y los sistemas destino que generalmente son un datawarehouse. Su objetivo es evitar la saturación de los servidores funcionales de la organización.

             La información resultante del proceso ETL, ya unificada, depurada y consolidada, se almacena en un datawarehouse, que sirve como base para la construcción de distintos datamarts departamentales. Estos datamarts tienen una estructura óptima para el análisis de los datos de esa área de la empresa, este análisis puede ser mediante bases de datos transaccionales o mediante bases de datos analíticas.

             Los datos que se encuentran almacenados en el datawarehouse o en cada datamart se explotan utilizando herramientas comerciales de análisis o reporting.

             COMPONENTES DE UN SISTEMA DE BUSINESS INTELLIGENCE

            Como hemos visto, la arquitectura de un sistema de Business Intelligence está compuesta por una serie de componentes que se relacionan entre sí y que tienen cada uno su función específica. A continuación explicamos cada uno de estos componentes y su función dentro de la arquitectura de BI.

  • Fuentes de datos: de las fuentes de datos es de donde se obtiene toda la información. Es clave que se garantice la calidad de los datos, que sean válidos para el uso requerido. Tenemos dos tipos de fuentes de datos:

De origen interno de la organización: donde encontramos sistemas CRM (Customer Relationship Management), ERP (Entreprise Resource Planning) o bases de datos.

De origen externo a la organización: como son redes sociales o fuentes de datos abiertos gubernamentales.

Una vez identificadas todas las fuentes de datos donde extraeremos aquellos datos que nos interesan, empiezan los procesos ETL.

  • Procesos ETL: Los procesos ETL ejecutan 3 acciones para llevar los datos de un sitio a otro, estas 3 acciones son::

Extracción de los datos de fuentes internas y/o externas.

Transformar estos datos en un formato homogéneo para que se pueden relacionar unos con otros.

Carga de los datos en un Data Warehouse para su posterior análisis.

  • Data Warehouse: es un almacén de datos, una base de datos que se compone de datos agregados de numerosas fuentes de datos que han pasado por un proceso ETL para integrarse de forma homogénea. La base de datos resultante está diseñada para organizar y optimizar los datos para posteriores análisis complejos.
  • Online Analytical Processing (OLAP): los cubos OLAP son herramientas muy potentes para usuarios avanzados de BI porque da a éstos la posibilidad de agrupar, agregar y ordenar los datos el usuario quiera para dar respuesta a preguntas muy específicas. Es una forma de visualizar los datos muy completa pero que presenta algún tipo de complejidad para usuarios que no están familiarizados. Es una herramienta muy práctica para analistas.
  • Herramientas de visualización: son la parte visible de un sistema de BI para los usuarios finales. Agrupan y relacionan gráficos de diferentes tipos, mapas interactivos e indicadores de rendimiento (KPIs) en una hoja a la que se llamada Dashboard.

            Encontramos algunas herramientas que combinan diferentes dashboards y reúnen una series de indicadores que miden objetivos alienados entre sí, ligados a planes de acción que permiten alinear el comportamiento de los miembros de la organización con la estrategia de la empresa.

Ahora que sabemos la arquitectura de un sistema BI y sus componentes, ¿de qué tipo de fuentes de datos dispone tu empresa u organización? ¿Nos proporciona la calidad de datos requerida para un proceso de Business Intelligence? 

Curso relacionado:  Curso de Big Data