El tutorial de SSIS proporciona conceptos básicos y avanzados de SQL Server Integration Services. Nuestro tutorial SSIS está diseñado para principiantes y profesionales.
Servicio de integración de SQL Server es una herramienta de almacenamiento de datos rápida y flexible que se utiliza para la extracción, transformación y carga de datos. Facilita la carga de datos de una base de datos a otra base de datos, como SQL Server, Oracle, archivo Excel, etc.
En este tutorial, discutiremos los siguientes temas:
- ¿Qué es SSIS?
- ¿Qué es la integración de datos?
- ¿Por qué SSIS?
- Cómo funciona SSIS
- Requisitos para el servicio de integración de SQL Server
- ¿Qué es el paquete SSIS?
- Tareas SSIS
- Ejemplo de tarea de flujo de datos
- Ejemplo de tarea de ejecución SQL
¿Qué es SSIS?
- SSIS significa Servicios de integración de SQL Server.
- Es un componente disponible en el software de base de datos Microsoft SQL Server que se utiliza para realizar una amplia gama de tareas de integración.
- Es una herramienta de almacenamiento de datos que se utiliza para la extracción de datos, cargar los datos en otra base de datos, transformaciones como limpieza, agregación, fusión de datos, etc.
- La herramienta SSIS también contiene herramientas gráficas y funciones de flujo de trabajo de asistentes de ventanas, como el envío de mensajes de correo electrónico, operaciones ftp y fuentes de datos.
- SSIS se utiliza para realizar una amplia gama de tareas de transformación e integración. En general, la herramienta SSIS se utiliza en la migración de datos.
SSIS es una herramienta utilizada principalmente para realizar dos funcionalidades:
SSIS realiza la integración de datos combinando los datos de múltiples fuentes y proporciona datos unificados a los usuarios.
El flujo de trabajo se puede utilizar para realizar varias cosas. A veces necesitamos ejecutar algunos pasos específicos o una ruta particular que se basa en el período de tiempo o el parámetro pasado al paquete o los datos consultados desde la base de datos. Se puede utilizar para automatizar el mantenimiento de bases de datos de SQL Server y proporciona la actualización de los datos analíticos multidimensionales.
¿Qué es la integración de datos?
La integración de datos es un proceso que se sigue para integrar los datos de múltiples fuentes. Los datos pueden ser datos heterogéneos o datos homogéneos. Los datos pueden ser estructurados, semiestructurados o no estructurados. En la integración de datos, los datos de diferentes fuentes de datos diferentes se integran para formar algunos datos significativos.
Se utilizan algunos métodos para lograr la integración de datos:
Ventajas de la integración de datos:
Reduce la complejidad de los datos, lo que significa que los datos se pueden entregar a cualquier sistema. La integración de datos mantiene la complejidad, las conexiones optimizadas y facilita la entrega de datos a cualquier sistema.
La integridad de los datos juega un papel importante en la integración de datos. Se trata de limpiar y validar los datos. Todo el mundo quiere datos sólidos y de alta calidad, por lo que para lograrlo se utiliza el concepto de integración de datos. La integración de datos es útil para eliminar errores, inconsistencias y duplicaciones.
La accesibilidad forma parte de la colaboración de datos. Accesibilidad significa que los datos se pueden transformar fácilmente y las personas pueden integrar fácilmente los datos en proyectos, compartir sus resultados y mantener los datos actualizados.
También le permite tomar decisiones más inteligentes. Un dato integrado se refiere al proceso de transmisión dentro de una empresa para que podamos comprender la información más fácilmente. Un dato integrado es mucho más fácil e informativo.
¿Por qué SSIS?
SSIS se utiliza por las siguientes razones:
SSIS se utiliza para combinar los datos de múltiples fuentes de datos para generar una estructura única en una vista unificada. Básicamente, es responsable de recopilar los datos, extraerlos de múltiples fuentes de datos y fusionarlos en una sola fuente de datos.
SSSIS es una plataforma que tiene la capacidad de cargar una gran cantidad de datos desde Excel a una base de datos de SQL Server.
La herramienta SSSIS proporciona una estrecha integración con otros productos de Microsoft.
La herramienta SSSIS es más barata que la mayoría de las otras herramientas. Puede contrastar con otros productos base, su manejabilidad, inteligencia de negocio, etc.
SSSIS le permite manejar el error complejo dentro de un flujo de datos. Puede iniciar y detener el flujo de datos según la gravedad del error. Incluso puedes enviar un correo electrónico al administrador cuando se produzca algún error. Cuando se resuelve un error, puede elegir la ruta entre el flujo de trabajo.
¿Cómo funciona SSIS?
Sabemos que SSIS es una plataforma para dos funciones, es decir, integración de datos y flujo de trabajo. Tanto las tareas de transformación de datos como la creación de flujos de trabajo se realizan mediante el paquete SSIS. El paquete SSIS consta de tres componentes:
Datos operacionales
Los datos operativos son una base de datos que se utiliza para integrar los datos de múltiples fuentes de datos para realizar operaciones adicionales sobre los datos. Es el lugar donde se almacenan los datos para su operación actual antes de enviarlos al almacén de datos para almacenarlos, generar informes o archivarlos.
topología de las estrellas
ETL
- ETL es el proceso más importante en la herramienta SSIS. ETL se utiliza para extraer, transformar y cargar datos en un almacén de datos.
- ETL es un proceso responsable de extraer los datos de múltiples fuentes de datos, transformarlos en datos útiles y luego almacenarlos en un almacén de datos. Los datos pueden estar en cualquier formato de archivo xml, archivo plano o cualquier archivo de base de datos.
- También garantiza que los datos almacenados en el almacén de datos sean relevantes, precisos, de alta calidad y útiles para los usuarios comerciales.
- Se puede acceder fácilmente a él para que el almacén de datos se pueda utilizar de forma eficaz y eficiente.
- También ayuda a la organización a tomar decisiones basadas en datos al recuperar datos estructurados y no estructurados de múltiples fuentes de datos.
Un ETL es un concepto de tres palabras, pero se divide en cuatro fases:
Captura: La fase de captura también se conoce como fase de extracción. En esta fase, selecciona los datos de origen o los metadatos, y los datos pueden estar en cualquier formato, como un archivo xml, un archivo plano o cualquier archivo de base de datos.
Fregar: En esta fase se verifican los datos originales. Comprueba los datos, ya sea que contengan errores o no. Comprueba los errores o la inconsistencia de los datos mediante el uso de algunas técnicas de inteligencia artificial. En definitiva, verifica si se cumple o no la calidad del producto.
Transformar: Es la tercera fase en ETL. La transformación es el proceso en el que el formato original se convierte al formato requerido que desee. La transformación es modelar o cambiar los datos según los requisitos del usuario. Los cambios pueden ser cambios en el número de columnas o filas.
Carga e índice: La cuarta fase es Carga e indexación. Carga los datos y valida el número de filas que se han procesado. Una vez completada la carga de datos, se utiliza la indexación. La indexación le ayuda a realizar un seguimiento del número de filas que se cargan en el almacén de datos. La indexación también ayuda a identificar los datos, ya sea que estén en el formato correcto o no.
Almacén de datos
El almacén de datos es un almacén de datos único, completo y consistente que se formula combinando datos de múltiples fuentes de datos.
Diferencia entre base de datos y almacén de datos
La respuesta puede ser tanto sí como no. Tanto la base de datos como el almacén de datos tienen una gran unidad de datos y una representación física similar, pero el tiempo de respuesta de consultas complejas en el almacén de datos es más rápido que el de la base de datos.
Requisitos para los servicios de integración de SQL Server
Los siguientes son los requisitos para instalar SQL Server Integration Services:
- Instalar el servidor SQL
- Instalar las herramientas de datos de SQL Server
Siga los pasos a continuación para instalar las herramientas de datos de SQL Server:
Paso 1: Clic en el enlace https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server-2017 para descargar las herramientas de datos de SQL Server.
Paso 2: Al hacer clic en el enlace de arriba, aparece la pantalla que se muestra a continuación:
En la pantalla anterior, seleccione la versión de SSDT que desea instalar.
Paso 3: Una vez que se complete la descarga, ejecute el archivo descargado. Cuando ejecuta el archivo descargado, aparece la pantalla que se muestra a continuación:
Etapa 4: Haga clic en el botón Siguiente.
Paso 5: Seleccione la instancia de Visual Studio y las herramientas que desea instalar en Visual Studio 2017.
Paso 6: Clickea en el Instalar botón.
¿Qué es el paquete SSIS?
El paquete es un bloque fundamental donde codifica en SSIS. Aquí, código no significa que estés codificando en algún lenguaje de programación; significa el desarrollo que haces. El desarrollo se realiza en el paquete SSIS. SSIS se utiliza principalmente para el proceso ETL y el proceso ETL se realiza dentro del paquete SSIS.
El paquete SSIS se compone de tres partes:
cambiar el nombre de un directorio
El paquete SSIS tendrá algunas conexiones y estas conexiones se utilizan para conectarse a varias fuentes de datos.
El paquete SSIS se compone de dos elementos, es decir, elementos de flujo de control y elementos de flujo de datos. Los elementos de flujo de control manejan los flujos de trabajo. Flujo de trabajo significa que realizamos algunas tareas en pasos, por lo que la secuencia se realiza a través del flujo de control.
Los elementos del flujo de datos realizan transformaciones.
Tareas SSIS
En el paquete SSIS, podemos agregar las tareas. Una tarea es una unidad de trabajo y tendremos diferentes tipos de tareas para realizar diferentes tipos de trabajo. Hay varios tipos de tareas, pero discutiremos las tareas más comunes utilizadas en SSIS:
Se utiliza para ejecutar declaraciones SQL en una base de datos relacional.
Se utiliza principalmente para leer datos de una o varias fuentes de datos, transformar los datos y también puede cargar los datos en uno o más destinos.
Se utiliza para procesar objetos de un cubo SSAS o modelo tabular.
Esta tarea se utiliza para llamar a los otros paquetes dentro del mismo proyecto. Incluso puedes pasar los valores de las variables al paquete llamado.
Le permite ejecutar una aplicación o scripts por lotes como SQL Server Integration Services. Se puede utilizar para abrir aplicaciones estándar como Microsoft Excel, Microsoft Word, etc. También se utiliza para descomprimir el archivo comprimido.
Se puede utilizar para realizar manipulaciones en el sistema de archivos, como mover archivos, eliminar archivos, cambiarles el nombre, cambiar el directorio, etc.
Las tareas IFTP se utilizan para realizar operaciones en archivos y carpetas. Por ejemplo, si desea enviar o recibir el archivo desde el servidor FTP al directorio local, se utiliza la tarea FTP de SSIS.
Esta tarea le permite escribir el código .Net que desea realizar.
Esta tarea se utiliza para enviar un correo electrónico. Se utiliza principalmente cuando desea notificar a los usuarios sobre el estado de la tarea, ya sea que esté en ejecución o que se haya producido algún error.
Veamos un ejemplo práctico de un servicio de integración de datos.
Ejemplo de tarea de flujo de datos
Paso 1: Primero, creamos un archivo de Excel en Microsoft Excel. Supongamos que creo la base de datos de estudiantes en Microsoft Excel y los campos en la tabla de estudiantes son id_estudiante, nombre_estudiante, calificaciones y género.
Paso 2: Abra Visual Studio (Herramientas de datos de SQL Server).
Paso 3: Haga clic en la opción Archivo y luego vaya a Nuevo->Proyecto.
Etapa 4: Cuando hace clic en el Proyecto, aparece la pantalla que se muestra a continuación:
En la pantalla anterior, haga clic en Servicios de integración que aparecen en el lado izquierdo del panel y luego haga clic en Proyecto de servicios de integración.
Paso 5: Después de hacer clic en el Proyecto de Servicios de Integración opción, aparece la pantalla que se muestra a continuación:
La pantalla anterior consta de cinco pestañas, como Flujo de control, Flujo de datos, Parámetros, Controlador de eventos y Explorador de paquetes. Ya hemos analizado el flujo de control y el flujo de datos; tanto el flujo de control como el flujo de datos existen dentro del paquete SSIS.
paso 6: Para importar los datos, primero debemos crear la base de datos en la que creamos la tabla en la base de datos de SQL Server. Como sabemos, los datos de los estudiantes están disponibles dentro del archivo de Excel y queremos importar los datos en la base de datos de SQL Server. Para lograr esto, primero debemos crear la tabla en SQL Server. Abra el estudio de administración de SQL Server.
Paso 7: Crea el alumno base de datos. Haga clic derecho en la base de datos y luego haga clic en el Nueva base de datos opción.
Paso 8: Ingrese el nombre de la base de datos en la siguiente captura de pantalla:
Le he dado StudentWarehouse como nombre de base de datos.
Paso 9: Clickea en el DE ACUERDO botón.
Paso 10: Ahora, creamos la tabla en un Almacén de estudiantes base de datos. Haga clic derecho en las Tablas y luego haga clic en Nueva tabla.
Paso 11: Ahora agregamos los campos en una tabla como Student_id, Student_name, calificaciones y sexo. Establecemos Student_id como clave principal que identifica de forma única cada fila.
La pantalla de arriba muestra que agregamos cuatro campos en una tabla. Después de agregar todos los campos en una tabla, guardamos la tabla proporcionándole algún nombre útil. Supongamos que he proporcionado el estudiante como nombre de tabla.
Paso 12: Regrese al estudio visual. El flujo de control contiene la tarea de flujo de datos; arrastre y suelte la tarea de flujo de datos en la ventana principal.
Paso 13: Cuando hacemos doble clic en la Tarea de Flujo de Datos, el control se mueve automáticamente al Flujo de Datos desde el Flujo de Control, por lo que podemos decir que el Flujo de Control es un contenedor de Flujo de Datos.
Paso 14: Ahora podemos realizar las transformaciones en Data Flow. Queremos extraer los datos del archivo de Excel que creamos anteriormente, así que arrastre y suelte la fuente de Excel de las otras fuentes que aparecen en el lado izquierdo del panel.
En la pantalla anterior observamos que aparece la cruz roja dentro de la Fuente Excel, significa que el componente está configurado con la Fuente Excel.
Paso 15: Para configurar el componente, haga clic derecho en la fuente de Excel y haga clic en la opción Editar como se muestra en la siguiente captura de pantalla:
Paso 16: Complete los detalles que se muestran en la siguiente captura de pantalla:
Paso 17: Después de ingresar todos los detalles, aparece la pantalla que se muestra a continuación:
Paso 18: Haga clic en la fuente de Excel.
La pantalla de arriba muestra dos flechas, una roja y una azul. La flecha azul define los datos reales que recibimos del archivo de Excel y la flecha roja indica los errores que tenemos. Ahora tenemos que realizar las transformaciones y antes de realizarlas, necesitamos cargar la base de datos.
Paso 19: Para cargar la base de datos, haga clic en Otros destinos y luego haga clic en Destino.
Paso 20: Después de agregar el destino, conecte la fuente al Destino.
Paso 21: En el paso anterior, notamos la cruz roja en ADO NET Destination, lo que significa que no está configurado con un componente. Haga clic derecho en el destino ADO NET y luego haga clic en la opción Editar como se muestra en la siguiente captura de pantalla:
Paso 22: Debe especificar el administrador de configuración.
Paso 23: Clickea en el Nuevo para agregar el administrador de conexiones. Cuando haces clic en el Nuevo botón, aparece la pantalla que se muestra a continuación:
Paso 24: Agregue el nombre del servidor y seleccione el nombre de la base de datos de SQL Server.
Paso 25: Haga clic en el botón Aceptar.
Paso 26: Agrega el nombre de la tabla en la que deseas cargar los datos.
Paso 27: En la siguiente pantalla, asigne el campo de la fuente de entrada al campo de la fuente de destino.
circuito sumador completo
Paso 28: Después de agregar una asignación, la fuente se conecta al Destino, como se muestra en la siguiente captura de pantalla:
Paso 29: Clickea en el Comenzar para ejecutar el proyecto de servicios de integración. Cuando ejecuta el proyecto, los datos se cargan en el destino, es decir, servidor SQL .
Ejemplo de tarea de ejecución SQL
- Siga los pasos del paso 2 al paso 5 del ejemplo anterior.
- Arrastra y suelta el Ejecutar tarea SQL que aparece en el panel más a la izquierda de la ventana principal.
En la pantalla anterior, observamos que aparece la cruz roja en la Tarea Ejecutar SQL, lo que significa que el Administrador de conexión no está configurado con el Ejecutar tarea SQL . Para configurarlo, necesitamos agregar el Administrador de conexión.
- Para agregar el Administrador de conexiones, haga clic derecho en el Administrador de conexiones y luego haga clic en Nuevo Administrador de conexiones como se muestra en la siguiente captura de pantalla:
- Selecciona el OLEDB como tipo de Administrador de conexión y luego haga clic en el Agregar botón como se muestra en la siguiente captura de pantalla:
- Después de hacer clic en el Agregar , aparece la pantalla que se muestra en la siguiente captura de pantalla:
En la pantalla anterior observamos que la conexión de datos de Almacén de estudiantes La base de datos ya está disponible como la creamos en el paso anterior. Clickea en el DE ACUERDO botón.
- Al hacer clic en el botón Aceptar, aparece la pantalla como se muestra a continuación:
En la pantalla anterior, debe ingresar detalles como el nombre de su tarea, descripción, declaración SQL (tarea SQL que debe realizar en la tabla).
- Ingresé los siguientes detalles en la captura de pantalla anterior:
En el caso anterior, proporcioné el comando de inserción en SQLStatement.
- Clickea en el DE ACUERDO botón.
- Cuando configura el componente con la tarea Ejecutar SQL, la cruz roja desaparece como se muestra en la siguiente captura de pantalla:
- Ejecute el proyecto haciendo clic en el Comenzar .
- Cuando haces clic en el Comenzar , aparece la pantalla que se muestra a continuación:
En la pantalla anterior, la marca de verificación muestra que su tarea SQL se ha completado con éxito. La instrucción de inserción que agregamos en los pasos anteriores se ejecutó y los datos se agregaron a la tabla. es decir, estudiante1.
- El resultado de esta tarea se muestra a continuación.
Requisito previo
Antes de aprender SSIS, debe tener conocimientos básicos de SQL Server.
Audiencia
Nuestro tutorial SSIS está diseñado para ayudar a principiantes y profesionales.
Problema
Le aseguramos que no encontrará ningún problema en este tutorial de SSIS. Pero si hay algún error o error, publíquelo en el formulario de contacto.