Almacén de datos
Un almacén de datos es un sistema en el que se guardan, organizan y tratan datos para un objetivo final.
Por tanto, estamos ante un espacio físico o virtual en el que se recopila información con múltiples objetivos. Este espacio permite la organización y consulta de los datos en el momento en el que el usuario que tiene acceso lo considere oportuno.
Los objetivos varían en función de la entidad que posea el almacén, ya que las metas finales de una empresa, una institución pública o una organización sin ánimo de lucro son en el fondo distintas.
Además, un almacén de datos es también conocido como base de datos, la cual si la traducimos al inglés (data warehouse) puede que nos suene más en ámbitos donde la informática está muy presente.
Características de un almacén de datos
Un almacén de datos se diseña, construye y carga con datos para un propósito específico.
Por ello, un almacén o base de datos necesita de fuentes en las que basar su entrada de datos, ya que una base de datos no es una lista de datos, sino que necesita continuamente de datos para poder ser de alguna forma útil.
A modo de símil, no es lo mismo realizar un top 10 futbolistas que más goles han marcado en el año 2020, que un top 10 futbolistas que más goles han marcado desde el inicio del fútbol hasta el presente. Lo primero es una lista de datos ordenados que no se actualiza, y para lo segundo, se necesita una base de datos que esté en continua actualización de datos e información.
Así pues, para que un almacén de datos pueda funcionar de forma satisfactoria, necesita de un software que lo actualice y lo mantenga activo en sus tareas. Estos software suelen ser sistemas de gestión especializados en bases de datos (del inglés, database management system).
Por ende, un sistema de gestión especializado en bases de datos logrará dar una definición a los datos, almacenarlos, y cuando sea necesario, modificarlos.
Por lo que, fruto de estas, se podrán generar análisis, informes de reporte y minería de datos que nos puedan ser relevantes. Este aspecto es clave porque conseguir información que a priori no se puede ver de forma directa, pueden vislumbrarse realizando ciertas técnicas estadísticas. Un ejemplo sería la correlación entre elementos. Conseguir asociar una correlación de forma correcta puede llegar a ser una gran ventaja competitiva para cualquier empresa.
Tipos de almacén de datos
Los almacenes de datos se pueden clasificar de multitud de formas, ya que no existe una clasificación formal. Sin embargo, la tipología que más se suele dar es según los siguientes factores:
- Relacional o no.
- Local o en la nube.
- Dinámicas o estáticas.
- Orientación a objetos o no.
En primer lugar, cuando nos referimos a si son relacionales o no, estamos diferenciando si los datos medibles (números o grados de clasificación: 1, 2; alto, medio…) o no (amor por tu país, familia o felicidad general, los cuales son datos de un corte más cualitativo).
Luego, en segundo lugar, un almacén de datos puede encontrarse con los servidores en la propia de sede de la empresa, o bien localizados a miles de kilómetros.
En tercer lugar, si son dinámicas, pueden incluir nuevas formas de guardar y clasificar datos a lo largo del tiempo, mientras que, en las estáticas, el modelo predefinido no es alterable.
En cuarto y último lugar, nos queda definir cuando un almacén de datos está orientado a objetos o no. Por un lado, se está orientado a objetos cuando un conjunto de datos define un ente superior, el cual posee como características los datos asociados a este. Por otro lado, cuando se tratan datos que por sí mismos ya poseen una utilidad y una razón de ser, se dice que no está orientada a objetos.
Ejemplo de almacenes de datos
Para utilizar de forma satisfactoria un almacén de datos hemos dado por hecho que una de carácter no digital (bolígrafo y papel) no es eficiente si se compara con el desempeño de sus versiones adaptadas a nivel digital.
Por tanto, algunos software que se especializan en este tipo de tareas son:
- Oracle.
- Sybase (SAP).
- MySQL.
- MSO Access (Microsoft).
- IBM DB2.
Estos programas son los que, en la práctica, almacenan los datos de una empresa o institución pública, tales como Inditex en temas relacionados con el big data en ventas, número de visitas a su web, etc.; o en una institución como el Instituto Nacional de Estadística (INE), que guardará toda clase de datos a nivel nacional o regional de exportaciones, PIB o renta, entre otros.
En definitiva, como se ha podido mencionar con anterioridad, la clave de un almacén o base de datos es tratar datos para un fin específico, el cual dependerá de la entidad o empresa que lo gestione.