|
|
 |
 |
 |
 |
 |
|
 |
| Una de las premisas básicas que debe tomarse en cuenta cuando se contruye un Data Warehouse es que los datos provienen de múltiples, diversos y dispersos orígenes. Los datos se capturan y se envían a un repositorio desde donde se pueden visualizar con aplicativos analíticos como el Balanced Scorecard, Dashboards, Analytics, ABCosting o cualquier otra herramienta. |
 |
|
 |
En términos técnicos este proceso se llama Extract/Transform/Load.
El esquema general del proceso ETL es el siguiente
:• Conectarse a la base origen de los datos.
• Mapear los datos desde su estado original hacia el modelo de datos
que deseamos tener.
• Definir las transformaciones que deseamos aplicar a los datos para obtener
la información acorde al modelo que estamos necesitando.
• Exportar los datos transformados al repositorio (Data Warehouse).
La forma más común de realizar la extracción de los datos es a través de Queries definidas en SQL; el trabajo se facilita cuando se puede automatizar el proceso de construcción de las queries correspondientes.
El trabajo de transformación se realiza haciendo uso de numerosas funciones
de conversión de datos. Las funciones más comunes que realiza Sixtina ETL
en esta etapa son: integración, depuración, validación referencial, valores derivados,
de-normalización y re-normalización, agregación, auditoria de seguimiento
y conversiones de nulidad.
En cuanto a la etapa de carga, Sixtina ETL procede a “mover” los datos transformados al Data Warehouse e incluye los parámetros de actualización automáticas que se dejan programados con el timer incorporado. |
 |
|
|
|
|
|
| |
|
|
|