Proceso de datos sucios a datos limpios es el cuarto curso del certificado de análisis computacional de datos de Google, diseñado para preparar a los estudiantes para roles introductorios de analistas de datos. A lo largo de este curso, los participantes aprenderán a controlar la integridad de los datos, descubrir técnicas de limpieza de datos utilizando hojas de cálculo y SQL, y verificar e informar los resultados de la limpieza de datos.
El curso consta de módulos que cubren temas como la importancia de la integridad de los datos, la limpieza de datos utilizando hojas de cálculo, la limpieza de datos con SQL, la verificación e informe de los resultados de la limpieza de datos, y una sección opcional sobre cómo agregar datos a un currículum. Los estudiantes adquirirán las habilidades necesarias para solicitar trabajos de nivel introductorio como analistas de datos, sin requerir experiencia previa en el campo.
Certificate Available ✔
Get Started / More InfoEl curso consta de varios módulos que cubren la importancia de la integridad de los datos, la limpieza de datos utilizando hojas de cálculo, la limpieza de datos con SQL, la verificación e informe de los resultados de la limpieza de datos, y una sección opcional sobre cómo agregar datos a un currículum.
El módulo introductorio destaca la importancia de la integridad de los datos, abordando temas como el equilibrio entre los objetivos y la integridad de datos, el tamaño de la muestra, la confiabilidad de los datos y más. Los estudiantes aprenderán a evaluar la confiabilidad de sus datos y descubrirán qué hacer en caso de datos insuficientes.
Este módulo se centra en la limpieza de datos utilizando hojas de cálculo, cubriendo temas como las herramientas y técnicas para la limpieza de datos, la optimización del proceso, la automatización del flujo de trabajo y la limpieza de datos de múltiples fuentes. Los estudiantes también explorarán dificultades comunes en la limpieza de datos y técnicas para la limpieza de datos en hojas de cálculo.
Los participantes aprenderán a utilizar SQL para limpiar los datos, comprendiendo las capacidades de SQL, las consultas SQL más utilizadas, la limpieza de cadenas de variables con SQL, y los dialectos de SQL y sus usos. Este módulo también aborda el uso de SQL como analista de datos júnior y ofrece desafíos prácticos para poner a prueba los conocimientos adquiridos.
En este módulo, los estudiantes se sumergirán en la verificación e informe de los resultados de la limpieza de datos, capturando los cambios de la limpieza, aprovechando los registros de cambios y explorando funciones avanzadas para una limpieza de datos rápida. También se brinda orientación sobre cómo documentar el proceso de limpieza de datos y crear un registro de cambios.
Este módulo opcional se enfoca en agregar datos a un currículum, proporcionando información sobre el proceso de solicitud de trabajo del analista de datos, la creación de un currículum único, la inclusión de destrezas y habilidades interpersonales, y actividades prácticas para crear y mejorar un currículum.
El desafío final del curso pone a prueba los conocimientos y habilidades adquiridas a lo largo del programa, permitiendo a los estudiantes demostrar su comprensión y aplicar lo aprendido en un entorno práctico.
Prepare for a career in data analytics with the IBM Data Analyst program. Gain essential skills in Python, Excel, and SQL to kickstart your career in as little as...
Learn to create and connect to a Google Cloud SQL MySQL instance, and perform basic SQL operations in this self-paced lab.
Fundamentals of Scalable Data Science is an essential course for mastering Apache Spark and utilizing big data tools for statistical analysis and visualization using...
Dive deep into data visualization with Tableau, from foundational concepts to advanced techniques. Master the art of transforming data into compelling visual stories....