Módulo 1: Explorar Azure Databricks.
Azure Databricks es un servicio en la nube que proporciona una plataforma escalable para el análisis de datos mediante Apache Spark.
• Introducción a Azure Databricks.
• Identificación de cargas de trabajo de Azure Databricks.
• Comprender los conceptos clave.
• Gobernanza de datos mediante Unity Catalog y Microsoft Purview.
• Ejercicio: Exploración de Azure Databricks.
Módulo 2: Uso de Apache Spark en Azure Databricks.
Azure Databricks se basa en Apache Spark y permite a los ingenieros y analistas de datos ejecutar trabajos de Spark para transformar, analizar y visualizar datos a escala.
• Conoce Spark.
• Creación de un clúster de Spark.
• Uso de Spark en cuadernos.
• Uso de Spark para trabajar con archivos de datos.
• Visualizar datos.
• Ejercicio: Uso de Spark en Azure Databricks.
Módulo 3: Entrenamiento de un modelo de aprendizaje automático en Azure Databricks.
El aprendizaje automático implica el uso de datos para entrenar un modelo predictivo. Azure Databricks admite varios marcos de aprendizaje automático de uso común que puede usar para entrenar modelos.
• Comprender los principios del aprendizaje automático.
• Aprendizaje automático en Azure Databricks.
• Preparación de datos para el aprendizaje automático.
• Entrenamiento de un modelo de aprendizaje automático.
• Evaluación de un modelo de aprendizaje automático.
• Ejercicio: Entrenamiento de un modelo de aprendizaje automático en Azure Databricks.
Módulo 4: Uso de MLflow en Azure Databricks.
MLflow es una plataforma de código abierto para administrar el ciclo de vida del aprendizaje automático que se admite de forma nativa en Azure Databricks.
• Funcionalidades de MLflow.
• Ejecución de experimentos con MLflow.
• Registro y servicio de modelos con MLflow.
• Ejercicio: Uso de MLflow en Azure Databricks.
Módulo 5: Ajuste de hiperparámetros en Azure Databricks.
El ajuste de hiperparámetros es una parte esencial del aprendizaje automático. En Azure Databricks, puede usar la biblioteca Optune para optimizar los hiperparámetros automáticamente.
• Optimiza los hiperparámetros con Optuna.
• Revisión de ensayos.
• Optimización de hiperparámetros de escala.
• Ejercicio: Optimización de hiperparámetros para el aprendizaje automático en Azure Databricks.
Módulo 6: Uso de AutoML en Azure Databricks.
AutoML en Azure Databricks simplifica el proceso de creación de un modelo de aprendizaje automático eficaz para los datos.
• ¿Qué es AutoML?
• Uso de AutoML en la interfaz de usuario de Azure Databricks.
• Uso de código para ejecutar un experimento de AutoML.
• Ejercicio: Uso de AutoML en Azure Databricks.
Módulo 7: Entrenamiento de modelos de aprendizaje profundo en Azure Databricks.
El aprendizaje profundo utiliza redes neuronales para entrenar modelos de aprendizaje automático altamente efectivos para pronósticos complejos, visión artificial, procesamiento de lenguaje natural y otras cargas de trabajo de IA.
• Comprender los conceptos de aprendizaje profundo.
• Entrenamiento de modelos con PyTorch.
• Distribución de la formación de PyTorch con TorchDistributor.
• Ejercicio: Entrenamiento de modelos de aprendizaje profundo en Azure Databricks.
Módulo 8: Administración del aprendizaje automático en producción con Azure Databricks.
El aprendizaje automático permite la toma de decisiones y la automatización basadas en datos, pero implementar modelos en producción para obtener información en tiempo real es un desafío. Azure Databricks simplifica este proceso al proporcionar una plataforma unificada para compilar, entrenar e implementar modelos de aprendizaje automático a escala, lo que fomenta la colaboración entre científicos de datos e ingenieros.
• Automatice sus transformaciones de datos.
• Explore el desarrollo de modelos.
• Explore las estrategias de implementación de modelos.
• Explore el control de versiones de modelos y la administración del ciclo de vida.
• Ejercicio: Administración de un modelo de aprendizaje automático.
|