Cette formation de spécialisation en ligne d'une durée de cinq semaines offre une expérience pratique pour concevoir et développer des systèmes de traitement des données sur Google Cloud. Les participants apprennent à créer des pipelines de données de bout en bout, à analyser des données et à exécuter des tâches de machine learning. Les compétences acquises incluent la conception et le développement de systèmes de traitement de données sur Google Cloud Platform, l'exploitation de données non structurées à l'aide de Spark et des API de ML sur Cloud Dataproc, le traitement de données par lot ou par flux avec Cloud Dataflow, l'obtention d'informations métier à partir de très grands ensembles de données avec Google BigQuery, et l'utilisation de TensorFlow et Cloud ML pour l'entraînement, l'évaluation et les prédictions à l'aide de modèles de machine learning.
Ce cours s'adresse aux développeurs expérimentés en charge de réaliser des opérations de transformation du big data, offrant une opportunité d'acquérir des compétences essentielles pour rester compétitif sur le marché du travail en constante évolution.
Certificate Available ✔
Get Started / More InfoCe cours de spécialisation couvre un large éventail de sujets allant de la compréhension des principaux produits de big data et de machine learning sur Google Cloud à la création de pipelines de traitement de données par flux, en passant par l'analyse de données à grande échelle avec BigQuery et l'utilisation de Dataflow pour créer des pipelines de traitement de données.
Reconnaître le cycle de vie "des données à l'IA" sur Google Cloud, ainsi que les principaux produits de big data et de machine learning. Créer des pipelines de traitement par flux avec Dataflow et Pub/Sub. Analyser le big data à grande échelle avec BigQuery. Identifier différentes options pour créer des solutions de machine learning sur Google Cloud.
Comprendre les différences entre les lacs et les entrepôts de données. Explorer chaque type de stockage et les détails techniques des solutions de lacs et d'entrepôts de données disponibles sur Google Cloud. Comprendre le rôle des ingénieurs de données et les avantages d'un pipeline de données réussi sur les opérations commerciales. Comprendre pourquoi il est important de procéder à l'ingénierie des données dans un environnement cloud.
Explorer différentes méthodes de chargement de données (EL, ELT et ETL) et déterminer quand les utiliser. Exécuter Hadoop sur Dataproc, exploiter Cloud Storage et optimiser les tâches Dataproc. Utiliser Dataflow pour créer vos pipelines de traitement de données. Gérer des pipelines de données avec Data Fusion et Cloud Composer.
Découvrir des cas d'utilisation liés à l'analyse de flux en temps réel. Utiliser le service de messagerie instantanée asynchrone de Pub/Sub pour gérer des événements de données. Écrire des pipelines de flux de données et effectuer des transformations si nécessaire. Combiner l'utilisation de Dataflow, BigQuery et Pub/Sub pour les flux et l'analyse en temps réel.
Découvrir des cas d'utilisation de l'analyse de flux en temps réel. Utiliser la messagerie asynchrone Pub/Sub pour gérer les événements de données. Écrire des pipelines de flux et exécuter des transformations. Explorer les deux facettes d'un pipeline de flux de données : la production et la consommation. Combiner l'utilisation de Dataflow, BigQuery et Pub/Sub pour les flux et l'analyse en temps réel.
This course introduces computational thinking and beginning C programming. Explore algorithms, data collection, and STEM computations, and learn to develop C programs...
Create a JavaFX GUI to display simple data using a tabbed pane with a pie chart. Learn to collect and visualize data in under 2 hours.
Learn to create a graphical calculator using Java and JavaFX in just 1.5 hours.
Unordered Data Structures is a comprehensive course covering hash tables, disjoint sets, and graphs. Gain the skills to implement and analyze these fundamental data...