¿Quieres desarrollar BI? Conceptos que no puedes dejar escapar

Business intelligence se está convirtiendo en una pieza clave para muchas empresas, una herramienta esencial para muchas de ellas. Utilizan BI para aumentar la capacidad de tomar decisiones estructuradas más rápido y con menos esfuerzo, incluso reducir los costes o incrementar las ventas. Sin embargo al explorar las soluciones de BI nos encontramos con algunos tecnicismo que pueden llegar a ser un poco confusos.

La idea de esta y las siguientes entradas es tratar de arrojar luz sobre esos conceptos un tanto desconcertantes, los que trataré hoy aquí se refieren a los datos:

Data Warehouse

El concepto de data warehouse es tan interesante como complejo de definir debido a todas las areas que cubre.

Según uno de los autores conocidos en la materia, »Ralph kimball», data warehouse es
una copia de las transacciones de datos específicamente estructurada para la consulta y el análisis.

Otro autor conocido »Bill Imon», quién fue uno de los primeros autores en escribir sobre el tema de los almacenes de datos, define un data warehouse en términos de las características del repositorio de datos:

  • Orientado a temas: Los datos en la base de datos están organizados de manera que todos los elementos de datos relativos al mismo evento u objeto del mundo real queden unidos entre sí.
  • Variante en el tiempo: Los cambios producidos en los datos a lo largo del tiempo quedan registrados para que los informes que se puedan generar reflejen esas variaciones.
  • No volátil: La información no se modifica ni se elimina, una vez almacenado un dato, éste se convierte en información de sólo lectura, y se mantiene para futuras consultas.
  • Integrado: La base de datos contiene los datos de todos los sistemas operacionales de la organización, y dichos datos deben ser consistentes.
  • Data warehouse es una base de datos que integra y depura los datos de una o más fuentes distintas, para luego procesar y así permitir su análisis desde distintas de pespectivas con velocidades altas de respuesta. La creación de un datawarehouse representa en la mayoría de las ocasiones el primer paso, desde el punto de vista técnico, para implantar una solución completa y fiable de Business Intelligence.

    La ventaja de su arquitectura radica en el diseño de las estructuras de almacenamiento de la información. La persistencia ofrecida por este tipo de sistemas es homogénea y fiable, además permite la consulta y el tratamiento jerarquizado por lo que acerca a convertir los datos en información más valiosa.

    Data Mart

    Datamart multidemensional

    En resumen y sin profundizar demasiado en el concepto, un data mart es un pequeño data warehouse. La diferencia radica en que están diseñados para cubrir únicamente un área de negocio especifica, una función o hecho del negocio; marketing, ventas, compras, servicios…
    De hecho los diseños más modernos de los actuales Data warehouse con realmente desarrollados iterativamente con una serie de pequeños data marts.

    Data Mining

    El nombre del Blog está basado en este concepto, por lo que me parece imprescindible presentaros qué es una de mis pasiones, y quizás así dar a entender por qué he utilizado Todo Data Mining para bautizar este pequeño proyecto.

    El data mining (minería de datos), es el conjunto de técnicas y tecnologías que permiten explorar grandes colecciones de datos, de manera automática o semiautomática, con el objetivo de encontrar patrones repetitivos, tendencias o reglas que expliquen el comportamiento de los datos en un determinado contexto o incluso de hacer predicciones que nos adelanten información.En definitiva la minería de datos es una de las diferentes etapas posibles en un proyecto de BI y no el propio BI como algunos expertos definen equivocadamente.

    Y como el objeto de este blog se centra en la extracción de conocimiento desde distintas fuentes, ¿Se os ocurre un mejor nombre para bautizar el proyecto? Se aceptan sugerencias.

    Mis planes para Todo Data Mining

    ¡¡TORTUREMOS LOS DATOS HASTA QUE CONFIESEN!!icondm

     

    2015 es el año del Big Data, del Internet of Thinks y la democratización del conocimiento es la clave , quiero aprender más y lo quiero hacer compartiendo. He buscado referentes en Google con la palabra clave  «Minería de datos» y no he encontrado a nadie de habla hispana como referente en esta temática, seguro que conseguimos obtener una fuente de conocimiento en la que apoyarnos.

    Trataré de compartir mi conocimiento a través de tutoriales y de diferentes posts sobre tendencias y software opensource en el campo de la minería de datos y del business intelligence, espero ansioso vuestros aportes.