Business intelligence se está convirtiendo en una pieza clave para muchas empresas, una herramienta esencial para muchas de ellas. Utilizan BI para aumentar la capacidad de tomar decisiones estructuradas más rápido y con menos esfuerzo, incluso reducir los costes o incrementar las ventas. Sin embargo al explorar las soluciones de BI nos encontramos con algunos tecnicismo que pueden llegar a ser un poco confusos.
La idea de esta y las siguientes entradas es tratar de arrojar luz sobre esos conceptos un tanto desconcertantes, los que trataré hoy aquí se refieren a los datos:
Data Warehouse
El concepto de data warehouse es tan interesante como complejo de definir debido a todas las areas que cubre.
Según uno de los autores conocidos en la materia, »Ralph kimball», data warehouse es
una copia de las transacciones de datos específicamente estructurada para la consulta y el análisis.
Otro autor conocido »Bill Imon», quién fue uno de los primeros autores en escribir sobre el tema de los almacenes de datos, define un data warehouse en términos de las características del repositorio de datos:
Data warehouse es una base de datos que integra y depura los datos de una o más fuentes distintas, para luego procesar y así permitir su análisis desde distintas de pespectivas con velocidades altas de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence.
La ventaja de su arquitectura radica en el diseño de las estructuras de almacenamiento de la información. La persistencia ofrecida por este tipo de sistemas es homogénea y fiable, además permite la consulta y el tratamiento jerarquizado por lo que acerca a convertir los datos en información más valiosa.
Data Mart
En resumen y sin profundizar demasiado en el concepto, un data mart es un pequeño data warehouse. La diferencia radica en que están diseñados para cubrir únicamente un área de negocio especifica, una función o hecho del negocio; marketing, ventas, compras, servicios…
De hecho los diseños más modernos de los actuales Data warehouse con realmente desarrollados iterativamente con una serie de pequeños data marts.
Data Mining
El nombre del Blog está basado en este concepto, por lo que me parece imprescindible presentaros qué es una de mis pasiones, y quizás así dar a entender por qué he utilizado Todo Data Mining para bautizar este pequeño proyecto.
El data mining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes colecciones de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto o incluso de hacer predicciones que nos adelanten información.En definitiva la minería de datos es una de las diferentes etapas posibles en un proyecto de BI y no el propio BI como algunos expertos definen equivocadamente.
Y como el objeto de este blog se centra en la extracción de conocimiento desde distintas fuentes, ¿Se os ocurre un mejor nombre para bautizar el proyecto? Se aceptan sugerencias.