Google Cloud Big Data and Machine Learning Fundamentals
(GC-GCBDMLF)
Cette formation présente les produits et services Google Cloud Big Data et Machine Learning qui prennent en charge le cycle de vie des données vers l’IA. Elle explore les processus, les défis et les avantages de la création d’un pipeline de Big Data et de modèles d’apprentissage automatique avec Vertex AI sur Google Cloud.
Objectifs pédagogiques :
- Reconnaître le cycle de vie des données à l’IA sur Google Cloud et les principaux produits du Big Data et du Machine Learning.
- Concevoir des pipelines de streaming avec Dataflow et Pub/Sub.
- Analyser le Big Data à grande échelle avec BigQuery.
- Identifier différentes options pour créer des solutions de machine learning sur Google Cloud.
- Décrire un flux de travail de machine learning et les étapes clés avec Vertex AI.
- Créer un pipeline de machine learning à l’aide d’AutoML.
Public visé :
- Analystes de données, scientifiques des données et analystes commerciaux qui débutent avec Google Cloud
- Personnes responsables de la conception de pipelines et d’architectures pour le traitement des données, la création et la maintenance de modèles d’apprentissage automatique et statistiques, l’interrogation d’ensembles de données, la visualisation des résultats de requêtes et la création de rapports
- Dirigeants et décideurs informatiques évaluant l’utilisation de Google Cloud par les data scientists
Prérequis :
Compréhension de base d’un ou de plusieurs des éléments suivants :
- Langage de requête de base de données tel que SQL
- Flux de travail d’ingénierie des données, de l’extraction, de la transformation, du chargement à l’analyse, la modélisation et le déploiement
- Modèles d’apprentissage automatique tels que les modèles supervisés et non supervisés
Passage de la certification (en option) :
- Prévoir l'achat d'un voucher en supplément
Modalités d’évaluation des acquis :
- En cours de formation, par des travaux pratiques
- Et, en fin de formation, par un questionnaire d'auto-évaluation
Programme de cours :
Module 0 : Introduction au cours
Cette section accueille les apprenants dans le cours Principes fondamentaux du Big Data et de l’apprentissage automatique et donne un aperçu de la structure et des objectifs du cours.
- Reconnaître le cycle de vie des données vers l’IA sur Google Cloud
- Identifier le lien entre l’ingénierie des données et le machine learning
Module 1 : Big Data et Machine Learning sur Google Cloud
Cette section explore les principaux composants de l’infrastructure de Google Cloud. Nous présentons de nombreux produits et services de Big Data et d’apprentissage automatique qui prennent en charge le cycle de vie des données à l’IA sur Google Cloud.
- Identifier les différents aspects de l’infrastructure de Google Cloud.
- Identifiez les produits de Big Data et de machine learning sur Google Cloud.
Module 2 : Ingénierie des données pour le streaming de données
Cette section présente la solution de Google Cloud pour la gestion des données de streaming. Il examine un pipeline de bout en bout, y compris l’ingestion de données avec Pub/Sub, le traitement des données avec Dataflow et la visualisation des données avec Looker et Data Studio.
- Décrire un flux de données en streaming de bout en bout, de l’ingestion à la visualisation des données.
- Identifiez les défis actuels en matière de pipeline de données et expliquez-leur comment les résoudre à grande échelle grâce à Dataflow.
- Créez des tableaux de bord collaboratifs en temps réel avec des outils de visualisation de données.
Module 3 : Big Data avec BigQuery
Cette section présente aux apprenants BigQuery, l’entrepôt de données sans serveur entièrement géré de Google. Il explore également BigQuery ML ainsi que les processus et les raccourcis clavier utilisés pour créer des modèles de machine learning personnalisés.
- Décrivez l’essentiel de BigQuery en tant qu’entrepôt de données.
- Expliquer comment BigQuery traite, interroge et stocke les données.
- Définir les phases du projet BigQuery ML.
- Créez un modèle de machine learning personnalisé avec BigQuery ML.
Module 4 : Options de machine learning sur Google Cloud
Cette section explore quatre options différentes pour créer des modèles de machine learning sur Google Cloud. Il présente également Vertex AI, la plate-forme unifiée de Google pour la création et la gestion du cycle de vie des projets ML.
- Identifiez les différentes options pour créer des modèles de ML sur Google Cloud.
- Définissez Vertex AI et ses principales caractéristiques et avantages.
- Décrire les solutions d’IA dans les marchés horizontaux et verticaux.
Module 5 : Le flux de travail d’apprentissage automatique avec Vertex AI
Cette section se concentre sur les trois phases clés (préparation des données, entraînement du modèle et préparation du modèle) du flux de travail de machine learning dans Vertex AI. Les apprenants peuvent s’entraîner à créer un modèle d’apprentissage automatique avec AutoML.
- Décrire un flux de travail ML et les étapes clés.
- Identifiez les outils et les produits pour soutenir chaque étape.
- Créez un workflow ML de bout en bout à l’aide d’AutoML.
Module 6 : Résumé du cours
Cette section passe en revue les sujets abordés dans le cours et fournit des ressources supplémentaires pour approfondir l’apprentissage.
- Décrire le cycle de vie des données vers l’IA sur Google Cloud et identifier les principaux produits du Big Data et du Machine Learning.