Conception et implémentation d’une solution de science des données sur Azure (DP-100T01-A)

Data Scientist joue un rôle central dans le développement de modèles d’apprentissage automatique. Ce rôle est responsable de la résolution du problème métier qui a initié le projet. Alors que l’ingénieur de données prépare les données à utiliser pour les modèles, le scientifique des données détermine quelles données sont nécessaires pour la formation du modèle, crée des entités de modèle à partir des données, détermine quel modèle d’apprentissage automatique utiliser, forme et évalue le modèle et participe souvent au déploiement du modèle. Souvent, le data scientist doit évaluer plusieurs modèles pour déterminer lequel fonctionne le mieux.


Public visé

Ce cours s’adresse aux scientifiques des données et à ceux qui ont des responsabilités importantes dans la formation et le déploiement de modèles d’apprentissage automatique.


Objectifs pédagogiques

  • Acquérir les connaissances nécessaires sur l’utilisation des services Azure pour développer.
  • Former et déployer des solutions Machine Learning. 

Le cours commence par une vue d’ensemble des services Azure qui prennent en charge la science des données. 

À partir de là, il se concentre sur l’utilisation du premier service de science des données d’Azure, le service Azure Machine Learning, pour automatiser le pipeline de science des données. Ce cours est axé sur Azure et n’enseigne pas à l’étudiant comment faire de la science des données. On suppose que les étudiants le savent déjà.


Prérequis

Avant de suivre ce cours, les étudiants doivent avoir :

  • Une connaissance fondamentale de Microsoft Azure
  • Expérience de l’écriture de code Python pour travailler avec des données, en utilisant des bibliothèques telles que Numpy, Pandas et Matplotlib.
  • Compréhension de la science des données; y compris la préparation des données et l’entraînement des modèles d’apprentissage automatique à l’aide de bibliothèques d’apprentissage automatique courantes telles que Scikit-Learn, PyTorch ou Tensorflow.
Afficher les détails


Programme de cours

Module 1: Faire de la science des données sur Azure

L’étudiant apprendra le processus de science des données et le rôle du scientifique des données. Ceci est ensuite appliqué pour comprendre comment les services Azure peuvent prendre en charge et augmenter le processus de science des données.

Leçons

  • Présenter le processus de science des données
  • Vue d’ensemble des options Azure Data Science
  • Présentation d’Azure Notebooks


Module 2: Faire de la science des données avec le service Azure Machine Learning

L’étudiant apprendra à utiliser le service Azure Machine Learning pour automatiser le processus de science des données de bout en bout.

Leçons

  • Présentation du service Azure Machine Learning (AML)
  • Enregistrer et déployer des modèles ML avec le service AML


Module 3: Automatiser Machine Learning avec le service Azure Machine Learning

Dans ce module, l’étudiant découvrira le pipeline Machine Learning et comment AutoML et HyperDrive du service Azure Machine Learning peuvent automatiser certaines parties laborieuses de celui-ci.

Leçons

  • Automatiser la sélection des modèles Machine Learning
  • Automatiser le réglage des hyperparamètres avec HyperDrive


Module 4: Gérer et surveiller les modèles Machine Learning avec le service Azure Machine Learning

Dans ce module, l’étudiant apprendra à gérer et à surveiller automatiquement les modèles Machine Learning dans le service Azure Machine Learning.

Leçons

  • Gérer et surveiller les modèles Machine Learning


Certification (en option) :

Prévoir l’achat d’un bon en supplément

Le passage de l’examen se fera (ultérieurement) dans un centre agréé Pearson Vue

L’examen (en anglais) s’effectuera en ligne


Modalités d’évaluation des acquis :

En cours de formation, par des études de cas ou des travaux pratiques