Idioma

Implementing a Lakehouse with Microsoft Fabric.

DP-601T00A
 
Fecha de publicación KeD: 28 Febrero 2024
Duración: 1 Día.
Examen: Applied Skills Assessment.
 
Descarga el Temario en versión PDF
 

Este curso está diseñado para crear sus habilidades fundamentales en la ingeniería de datos en Microsoft Fabric, centrándose en el concepto de almacén de lago. En este curso se explorarán las eficaces funcionalidades de Apache Spark para el procesamiento de datos distribuidos y las técnicas esenciales para la eficiencia en la administración de datos, el control de versiones y la confiabilidad trabajando con tablas de Delta Lake.


En este curso también se explorará la ingesta y orquestación de datos mediante canalizaciones de Dataflows Gen2 y Data Factory. En este curso se incluye una combinación de conferencias y ejercicios prácticos que le prepararán para trabajar con almacenes de lagos en Microsoft Fabric.

 

Perfil del público.

La audiencia principal de este curso son profesionales de datos que están familiarizados con el modelado, la extracción y el análisis de datos. Está diseñado para profesionales interesados en obtener conocimientos sobre la arquitectura del almacén de lagos, la plataforma Microsoft Fabric y el proceso de habilitación del análisis de un extremo a otro mediante estas tecnologías.

 

Temario.

Módulo 1: Introducción al análisis de un extremo a otro con Microsoft Fabric.

Descubra cómo Microsoft Fabric puede satisfacer las necesidades de análisis de su empresa en una plataforma. Obtenga información sobre Microsoft Fabric y cómo funciona e identifique cómo puede usarlo para sus necesidades de análisis.

Exploración del análisis de un extremo a otro con Microsoft Fabric.
Equipos de datos y Microsoft Fabric.
Habilitación y uso de Microsoft Fabric.


Módulo 2: Introducción a los almacenes de lago en Microsoft Fabric.

Los almacenes de lago combinan la flexibilidad del almacenamiento en lagos de datos con el análisis de almacenamiento de datos. Microsoft Fabric ofrece una solución de almacén de lago para un análisis exhaustivo en una sola plataforma SaaS.

Exploración del almacén de lago de Microsoft Fabric.
Trabajar con almacenes de lago de Microsoft Fabric.
Exploración y transformación de datos en un almacén de lago.
Ejercicio: Creación e ingesta de datos con un almacén de lago de Microsoft Fabric.


Módulo 3: Uso de Apache Spark en Microsoft Fabric.

Apache Spark es una de las tecnologías principales para el análisis de datos a gran escala. Microsoft Fabric proporciona compatibilidad con clústeres de Spark, lo que le permite analizar y procesar datos en un almacén de lago a escala.

Preparación para usar Apache Spark.
Ejecución de código de Spark.
Trabajo con datos en un DataFrame de Spark.
Trabajo con datos con Spark SQL.
Visualización de datos en un cuaderno de Spark.
Ejercicio: Análisis de datos con Apache Spark.


Módulo 4: Uso de tablas de Delta Lake en Microsoft Fabric.

Las tablas de un almacén de lago de Microsoft Fabric se basan en el formato de almacenamiento de Delta Lake que se usa habitualmente en Apache Spark. Mediante las funcionalidades mejoradas de las tablas delta, puede crear soluciones de análisis avanzadas.

Descripción de Delta Lake.
Creación de tablas delta.
Uso de tablas delta en Spark.
Uso de tablas delta con datos de streaming.
Ejercicio: Uso de tablas delta en Apache Spark.


Módulo 5: Ingesta de datos con flujos de datos Gen2 en Microsoft Fabric.

La ingesta de datos es fundamental en los análisis. Data Factory de Microsoft Fabric ofrece flujos de datos (Gen2) para crear visualmente la ingesta y transformación de datos de varios pasos mediante Power Query en línea.

Descripción de los flujos de datos (Gen2) en Microsoft Fabric.
Exploración de flujos de datos (Gen2) en Microsoft Fabric.
Integración de flujos de datos (Gen2) y canalizaciones en Microsoft Fabric.
Ejercicio: Creación y uso de un flujo de datos (Gen2) en Microsoft Fabric.


Módulo 6: Uso de canalizaciones de Data Factory en Microsoft Fabric.

Microsoft Fabric tiene funcionalidades de Data Factory, incluida la capacidad de crear canalizaciones que organizan tareas de ingesta y transformación de datos.

Descripción de las canalizaciones.
Uso de la actividad Copiar datos.
Uso de plantillas de canalización.
Ejecución y supervisión de canalizaciones.
Ejercicio: Ingesta de datos con una canalización.

 
Garantia Ofrecemos la garantía 100% de satisfacción
Si no te gusta el resultado de tu curso, puedes volver a tomarlo en cualquier otra fecha calendario.
 
Regresa a la página anterior
 
Cursos relacionados
 
 
Cursos Nuevo
 
   
 
Cursos bajo Requerimiento Especial
Es aquel que se puede impartir siempre y cuando cumpla con un mínimo de participantes para su confirmación de fechas depende de la disponibilidad de KeD. Contacte a su Representante de Ventas
 
     
Fundamentals
DP-900T00 Microsoft Azure Data Fundamentals
Associate
DP-100T01 Designing and Implementing a Data Science Solution on Azure
DP-203T00 Data Engineering on Microsoft Azure
DP-300T00 Administering Microsoft Azure SQL Solutions
DP-500T00 Designing and Implementing Enterprise-Scale Analytics Solutions Using Microsoft Azure and Microsoft Power BI
DP-601T00 Implementing a Lakehouse with Microsoft Fabric
Speciality
DP-080T00 Querying Data with Microsoft Transact-SQL
DP-420T00 Designing and Implementing Cloud-Native Applications Using Microsoft Azure Cosmos DB
SQL Server 2007
CL_55352 Introduction to SQL Databases
CL_55369 Provisioning Databases on SQL Server
Miscellanious
CL_55400 Microsoft Power BI Super User
Workshops
KD-05201 Dashboard in a Day
KD-05202 Advanced Visualization with Power BI
KD-05203 Advanced Data Modeling and Shaping with Power BI
KD-05204 DAX in a Day
KD-05205 Administrator in a Day
KD-05206 Paginated Reports in a Day
KD-05207 Developer in a Day
KD-05208 Modern Excel Analyst in a Day
KD-05209 Leap into Power BI
     
  Horarios Online  
  Horario Matutino:
Lunes a Viernes de 8:00 a 15:00 hrs.
 
     
  Horario Vespertino:
Lunes a Viernes de 15:00 a 21:00 hrs.
 
     
  Horario de Fin de Semana:
Sábado 8:00 a 15:00
 
 
 
Logo KeD