microsoft sql server 2008 - etl
DESCRIPTION
Son una parte de la integración de datos, pero es un elemento importante cuya función completa el resultado de todo el desarrollo de la cohesión de aplicaciones y sistemas. La palabra ETL corresponde a las siglas en inglés de: • Extraer: extract. • Transformar: transform. • Y Cargar: load.TRANSCRIPT
![Page 1: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/1.jpg)
TUTORIAL ETL
Asignatura: BASE DE DATOS AVANZADA
Autora: Fanny Pita Chapilliquen
Docente Ingeniero: Hector Zelada
![Page 2: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/2.jpg)
BI
(Business Intelligence)
Datos
Información
Conocimientos
Toma de Decisiones
Cumple con sus objetivos
Cumple con sus objetivos
estratégicos
Logra su Visión
Analizar
![Page 3: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/3.jpg)
ETL
Son una parte de la integración de datos, pero es un elemento importante cuya función completa el resultado de todo el desarrollo de la cohesión de aplicaciones y sistemas.
La palabra ETL corresponde a las siglas en inglés de:
• Extraer: extract. • Transformar: transform. • Y Cargar: load. Con ello, queremos decir que todo proceso ETL consta precisamente de estas tres fases: extracción, transformación y carga. Vamos a definir en qué consisten cada una de estas fases
![Page 4: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/4.jpg)
PROCESOS ETL DEL DATAWAREHOUSE
Teniendo como primer paso para la obtención de la información hacia el ambiente del
Data WareHouse. Una vez que la información es extraída hacia el área de tráfico de
datos, hay posibles pasos de transformación.
Ejemplo limpieza de la información, que no nos sirve, seleccionar únicamente los
campos necesarios para el Data WareHouse, combinar fuentes de datos, haciéndolas
coincidir por los valores de las llaves, creando nuevas llaves para cada registro de una
dimensión.
DATAMART
Es una versión especial de almacén de datos (Data WareHouse).
Son subconjuntos de datos con el propósito de ayudar a que un área específica.
Los datos existentes en este contexto pueden ser agrupados, explorados y
transmitidos de múltiples formas para que diversos grupos de usuarios realicen la
explotación de los mismos de la forma más conveniente según sus necesidades.
El Data Mart es un sistema orientado a la consulta.
![Page 5: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/5.jpg)
MICROSOFT SQL SERVER 2008
Primero instalamos el programa En el programa sql server 2008r2
En database se realiza un anticlick en Attach sebusca la base de datos a ser agregada
![Page 6: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/6.jpg)
El attach Database
Seleccionamos en Add
Se selecciona las unidades lo cual elegimos la unidad donde esta nuestra carpeta con la base
de datos.
![Page 7: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/7.jpg)
Verificamos la conexión al realizar clic en nuestra base de datos
![Page 8: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/8.jpg)
Procedemos a trabajar el Visual Studio
Inicio
Creando un Proyecto
![Page 9: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/9.jpg)
Elegimos el proyecto a trabajar Integration
Elegimos un nombre para el proyecto
Elegimos la unidad a guardarla Se crea una carpeta
![Page 10: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/10.jpg)
Aceptamos
Realizamos Clic en Data Source
![Page 11: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/11.jpg)
![Page 12: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/12.jpg)
Nombre del archivo. , o se elige por defecto el nombre indicado
Elegimos la base de destino
Verificamos la conexión realizando el clic en Test Conection
![Page 13: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/13.jpg)
Declaramos el nombre del origen
Ingresamos otra data para el destino
![Page 14: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/14.jpg)
Siguiente
New(nuevo)
Seleccionamos la base de datos de destino
![Page 15: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/15.jpg)
Verificamos la conection
Observamos la siguiente data con las dos bases:
![Page 16: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/16.jpg)
Le damos nombre a la base
Ubicamos en la parte inferior para la coneccion: en Conection Managerscon anticlic(1)
Conectamos las bases de origen – destino(2)
2
1
![Page 17: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/17.jpg)
Agregamos la 1ª conection de origen
Agregamos la segunda conection de destino visualizamos las conecciones
![Page 18: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/18.jpg)
Creamos las Dimensiones
Se realizaran 3 Dimensiones de la base de destino especificada en la tabla siguiente:
Tabla a relacionarse con la de destino
![Page 19: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/19.jpg)
DTL
Iniciamos con la tabla Proveedor – Dimension Proveedor por estar en ese orden
Con la herramienta – SQL Task
Insertamos en la opción arrastrando la herramienta SQL Task
![Page 20: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/20.jpg)
Conectamos con la base de destino hacia donde nos dirigimos
Para realizar la limpieza de datos La tabla de Productos no se elimina datos por lo que actualiza
![Page 21: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/21.jpg)
Las tablas siguientes tablas de destino se borraran datos
Copiamos las consultas realizadas
![Page 22: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/22.jpg)
Trabajamos con data flow task para las 3 dimensiones
Observamos las Dimensiones a tratar
![Page 23: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/23.jpg)
Realizamos dobleclic en dataflowProveedor
Ingresamos un OLB Source
![Page 24: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/24.jpg)
La base de origen
Seleccionamos table por que ambas bases se relacionan con tablas sus datos
Se origina la activación
![Page 25: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/25.jpg)
Ingresamos un data convertion lo cual homogeniza los datos ()
Doble clic mostrando este cuadro
![Page 26: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/26.jpg)
Seleccionamos lo requerido por no ser de igual tipo dato, en este caso todos
Especificamos con un nombre para ubicarlo en el mapping con mayor facilidad
![Page 27: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/27.jpg)
Ingresamos una herramienta de destino
Dobleclic en sourcedestino verificamos y ubicamos en el destino
![Page 28: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/28.jpg)
Nos ubicamos en mapping
Seleccionamos lo requerido(a relacionar)
![Page 29: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/29.jpg)
Comprobamos la conexión como alerta origina de color verde
Datos Origen
![Page 30: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/30.jpg)
Dimensión tiempo en origen no tiene fecha, año, mes luego se completaran creando su
consulta : SELECT * FROM Compra
Agrupamos con GROUP BY Fecha
![Page 31: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/31.jpg)
Consulta Mes
Consulta TRIMESTRE
![Page 32: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/32.jpg)
Consulta Año
Dobleclic ingresamos
![Page 33: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/33.jpg)
Seleccionamos Comand por lo que ingresamos las consultas:
Ingresamos la herramienta destino aquí no insertamos la herramienta data conection por
ingresar consultas
![Page 34: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/34.jpg)
Conexión Tiempo
Relacionamos con lo correspondiente
![Page 35: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/35.jpg)
Ejecutamos
Conectamos
![Page 36: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/36.jpg)
Ubicamos el Producto desde valor cero
Insertamos 2 OLE DB
Un origen
Un destino
Configuramos Origen
![Page 37: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/37.jpg)
Destino
Destino Producto
Los elementos son iguales
![Page 38: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/38.jpg)
Modificamos para que tengan los mismos caracteres sor
Soordestino
![Page 39: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/39.jpg)
Para unir a los sor con el main ubicamos derecha o izquierda
Clic en Mage Join
![Page 40: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/40.jpg)
Activamos
Ingresamos un conditional
![Page 41: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/41.jpg)
Dobleclic
![Page 42: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/42.jpg)
NULL
![Page 43: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/43.jpg)
Verificamos en las Columnas
Ubicamos a KEY
![Page 44: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/44.jpg)
Al unir origina
![Page 45: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/45.jpg)
Dobleclic
Relacionamos
![Page 46: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/46.jpg)
Ejecutamos
![Page 47: Microsoft sql server 2008 - ETL](https://reader034.vdocuments.site/reader034/viewer/2022052507/559004101a28ab522e8b4596/html5/thumbnails/47.jpg)
Conclusiones
Indicar y señalar la importancia del proceso ETL y la necesidad
de que ésta sea planificada y modelada correctamente.
Facilitar esfuerzos de definición y redefinición de actividades.
ETL es la etapa más crítica para la calidad de la información de los almacenes de datos.
Se pretende desarrollar un modelo conceptual para procesos
ETL con su propia notación gráfica, tomando en cuenta los aspectos de seguridad.
ETL es el proceso que organiza el flujo de los datos entre diferentes
sistemas en una organización y aporta los métodos y herramientas necesarias para mover datos desde múltiples fuentes como la compra.
ETL forma parte de la Inteligencia de Negocios (Business Intelligence),
también llamado “Gestión de los Datos” (Data Management).