In this advanced challenge lab, you act as a Data Engineer for the Chicago Police Department. You will manage a high-stakes data integration project, moving IUCR reference data from Cloud Storage into BigQuery using code-free Dataproc Spark templates. Beyond simple ingestion, you will use BigQuery SQL to audit data quality, identify structural discrepancies like missing zero-padding, and reconcile mismatches between transaction records and reference tables to ensure analytical accuracy.
This lab tests your ability to develop a real-world Generative AI Q&A solution using a RAG framework. You will use Firestore as a vector database and deploy a Flask app as a user interface to query a food safety knowledge base.
In this advanced challenge lab, you act as a Data Engineer for Cymbal Direct, a retail company integrating real-time movie review data into a marketing pipeline. You are responsible for building two distinct streaming architectures. First, you will implement a direct, code-free ingestion path using Pub/Sub BigQuery subscriptions. Second, you will deploy a sophisticated Dataflow pipeline that uses JavaScript User-Defined Functions (UDFs) to transform raw text into numerical data before it reaches BigQuery, all while managing high-velocity data generated by a simulated stream.
En este curso, adquirirás experiencia práctica para superar los desafíos del mundo real que se presentan cuando se crean canalizaciones de datos de transmisión. El enfoque principal es administrar datos continuos y no delimitados con los productos de Google Cloud.
En este curso, se muestra cómo usar modelos de IA/AA para tareas de IA generativa en BigQuery. A través de un caso de uso práctico relacionado con la administración de relaciones con clientes, conocerás el flujo de trabajo para solucionar un problema empresarial con modelos de Gemini. Para facilitar la comprensión, el curso también proporciona orientación paso a paso a través de soluciones de programación utilizando consultas en SQL y notebooks de Python.
En este curso, se explora Gemini en BigQuery, un conjunto de funciones potenciadas por IA que se diseñaron para asistir el flujo de trabajo de datos a IA. Estas funciones incluyen la exploración y preparación de datos, la generación de código y la solución de problemas, así como el descubrimiento y la visualización de flujos de trabajo. A través de explicaciones conceptuales, un caso de uso práctico y labs prácticos, en este curso se les enseña a los especialistas en datos a impulsar su productividad y acelerar la canalización de desarrollo.
En este curso, aprenderás sobre la ingeniería de datos en Google Cloud, los roles y las responsabilidades de los ingenieros de datos y cómo estos se corresponden con las ofertas de Google Cloud. También aprenderás sobre los métodos para enfrentar los desafíos de la ingeniería de datos.
Completa la insignia de habilidad intermedia del curso Desarrolla aplicaciones sin servidores en Cloud Run y demuestra tus capacidades para hacer lo siguiente: integrar Cloud Run en Cloud Storage para la administración de datos; diseñar sistemas asíncronos resilientes con Cloud Run y Pub/Sub; construir puertas de enlace de la API de REST potenciadas por Cloud Run, y crear e implementar servicios en Cloud Run.
Completa la insignia de habilidad intermedia Administra Kubernetes en Google Cloud para demostrar tus capacidades para administrar implementaciones con kubectl y supervisar y depurar aplicaciones en Google Kubernetes Engine (GKE), así como con las técnicas de entrega continua.
Completa la insignia de habilidad intermedia Ingeniería de agentes de IA con el Kit de desarrollo de agentes (ADK) completando este curso y demuestra tus habilidades para realizar las siguientes actividades: formular problemas de investigación de modelos de lenguaje del mundo real, crear un tokenizador simple, preparar un conjunto de datos para entrenar un modelo de lenguaje transformador y ejecutar el bucle de entrenamiento de un modelo de lenguaje pequeño.
Obtén una insignia de habilidad completando el curso Arquitectura de la nube: Diseña, implementa y administra y demuestra tus habilidades para realizar las siguientes actividades: implementar un sitio web de acceso público con servidores web de Apache, configurar una VM de Compute Engine con secuencias de comandos de inicio, configurar el RDP seguro con un host de bastión de Windows y reglas de firewall, compilar y, luego, implementar una imagen de Docker en un clúster de Kubernetes para luego actualizarlo, y crear una instancia de Cloud SQL e importarla a una base de datos de MySQL. Esta insignia de habilidad es un excelente recurso para entender los temas que aparecerán en el examen de certificación Google Cloud Certified Professional Cloud Architect.
Completa la insignia de habilidad intermedia del curso Implementa los aspectos básicos de seguridad en la nube en Google Cloud y demuestra tus habilidades para realizar las siguientes actividades: crear y asignar roles con Identity and Access Management (IAM); crear y administrar cuentas de servicio; habilitar la conectividad privada en las redes de nube privada virtual (VPC); restringir el acceso a las aplicaciones con Identity-Aware Proxy; administrar claves y datos encriptados con Cloud Key Management Service (KMS) y crear un clúster privado de Kubernetes.
Para ganar una insignia de habilidad, completa el curso Configura un entorno de desarrollo de apps en Google Cloud. Allí aprenderás a crear y conectar una infraestructura de nube centrada en el almacenamiento usando las capacidades básicas de las siguientes tecnologías: Cloud Storage, Identity and Access Management, Cloud Functions y Pub/Sub.
Agentes de IA generativa: transforma tu organización es el quinto y último curso de la ruta de aprendizaje Líder de IA generativa. En este curso, se analiza cómo las organizaciones pueden usar agentes de IA generativa personalizados para abordar desafíos empresariales específicos. Puedes obtener experiencia práctica a través de la creación de un agente de IA básico mientras exploras los componentes de estos agentes, como los modelos, los bucles de razonamiento y las herramientas.
Apps de IA generativa : transforma tu trabajo es el cuarto curso de la ruta de aprendizaje de Líder de IA generativa. En este curso, se presentan las aplicaciones de IA generativa de Google, como Gemini para Workspace y NotebookLM. Te brinda orientación sobre los conceptos como la fundamentación, la generación mejorada por recuperación, la creación de instrucciones eficaces y el desarrollo de flujos de trabajo automatizados.
IA generativa: explora el panorama es el tercer curso de la ruta de aprendizaje de Líder de IA generativa. La IA generativa está cambiando la manera en la que interactuamos y trabajamos con el mundo que nos rodea. Pero, como líder, ¿cómo puedes aprovechar su poder para generar resultados comerciales reales? En este curso, explorarás las diferentes capas del desarrollo de soluciones de IA generativa, las ofertas de Google Cloud y los factores que se deben considerar cuando se selecciona una solución.
IA generativa: descubre los conceptos fundamentales es el segundo curso de la ruta de aprendizaje de Líder de IA generativa. En este curso, descubrirás los conceptos fundamentales de la IA generativa explorando las diferencias entre esta, el AA y la IA, y comprendiendo cómo los diferentes tipos de datos permiten abordar desafíos empresariales con la IA generativa. También conocerás las estrategias de Google Cloud para abordar las limitaciones de los modelos de base y los desafíos clave para desarrollar e implementar la IA de forma responsable y segura.
IA generativa: más allá del chatbot es el primer curso de la ruta de aprendizaje de Líder de IA generativa y no tiene requisitos previos. El objetivo de este curso es profundizar los conocimientos básicos sobre chatbots para explorar el verdadero potencial de la IA generativa para tu organización. Explorarás conceptos como los modelos de base y la ingeniería de instrucciones, que son fundamentales para aprovechar el poder de la IA generativa. Este curso también te sirve como guía para las consideraciones importantes que debes tener cuando desarrollas una estrategia de IA generativa exitosa para tu organización.
Completa la insignia de habilidad introductoria Crea y administra instancias de Cloud SQL para PostgreSQL y demuestra tus habilidades para migrar, configurar y administrar instancias y bases de datos de Cloud SQL para PostgreSQL.
Completa el curso introductorio con insignia de habilidad Crea y administra instancias de Cloud Spanner y demuestra tus habilidades para realizar las siguientes actividades: crear instancias y bases de datos de Cloud Spanner e interactuar con ellas cargar bases de datos de Cloud Spanner con diversas técnicas crear copias de seguridad de bases de datos de Cloud Spanner, definir esquemas y comprender planes de consulta implementar una app web moderna conectada a una instancia de Cloud Spanner.
Completa el curso introductorio con insignia de habilidad Crea y administra instancias de AlloyDB y demuestra tus habilidades para completar las siguientes actividades: realizar operaciones y tareas básicas de AlloyDB, migrar a AlloyDB desde PostgreSQL, administrar una base de datos de AlloyDB y acelerar las consultas analíticas con el motor de columnas de AlloyDB.
Obtén la insignia de habilidad intermedia Ingeniería de datos para crear modelos predictivos con BigQuery ML y demuestra tus capacidades para crear canalizaciones de transformación de datos en BigQuery con Dataprep de Trifacta; usar Cloud Storage, Dataflow y BigQuery para crear flujos de trabajo de extracción, transformación y carga (ETL), y crear modelos de aprendizaje automático con BigQuery ML.
En esta última parte de la serie de cursos de Dataflow, presentaremos los componentes del modelo operativo de Dataflow. Examinaremos las herramientas y técnicas que permiten solucionar problemas y optimizar el rendimiento de las canalizaciones. Luego, revisaremos las prácticas recomendadas de las pruebas, la implementación y la confiabilidad en relación con las canalizaciones de Dataflow. Concluiremos con una revisión de las plantillas, que facilitan el ajuste de escala de las canalizaciones de Dataflow para organizaciones con cientos de usuarios. Estas clases asegurarán que su plataforma de datos sea estable y resiliente ante circunstancias inesperadas.
Completa el curso con insignia de habilidad introductoria Crea una malla de datos con Knowledge Catalog y demuestra tus habilidades para crear una malla de datos con Knowledge Catalog y facilitar la seguridad, la administración y el descubrimiento de datos en Google Cloud. Practicarás y pondrás a prueba tus habilidades para etiquetar recursos, asignar roles de IAM y evaluar la calidad de los datos en Knowledge Catalog.
Completa la insignia de habilidad intermedia Crea un almacén de datos con BigQuery para demostrar tus habilidades para realizar las siguientes actividades: unir datos para crear tablas nuevas, solucionar problemas de uniones, agregar datos a uniones, crear tablas particionadas por fecha, y trabajar con JSON, arrays y structs en BigQuery.
En esta segunda parte de la serie de cursos sobre Dataflow, analizaremos en profundidad el desarrollo de canalizaciones con el SDK de Beam. Comenzaremos con un repaso de los conceptos de Apache Beam. A continuación, analizaremos el procesamiento de datos de transmisión con ventanas, marcas de agua y activadores. Luego, revisaremos las opciones de fuentes y receptores en sus canalizaciones, los esquemas para expresar datos estructurados y cómo realizar transformaciones con estado mediante las API de State y de Timer. Después, revisaremos las prácticas recomendadas que ayudan a maximizar el rendimiento de las canalizaciones. Al final del curso, presentaremos SQL y Dataframes para representar su lógica empresarial en Beam y cómo desarrollar canalizaciones de forma iterativa con notebooks de Beam.
Completa la insignia de habilidad introductoria Implementa Cloud Load Balancing para Compute Engine y demuestra tus habilidades para realizar las siguientes actividades: crear y, luego, implementar máquinas virtuales en Compute Engine, y configurar balanceadores de cargas de red y de aplicaciones.
Este curso corresponde a la 1ª parte de una serie de 3 cursos llamada Procesamiento de datos sin servidores con Dataflow. Para comenzar, en el primer curso haremos un repaso de qué es Apache Beam y cómo se relaciona con Dataflow. Luego, hablaremos sobre la visión de Apache Beam y los beneficios que ofrece su framework de portabilidad. Dicho framework hace posible que un desarrollador pueda usar su lenguaje de programación favorito con su backend de ejecución preferido. Después, le mostraremos cómo Dataflow le permite separar el procesamiento y el almacenamiento y, a la vez, ahorrar dinero. También le explicaremos cómo las herramientas de identidad, acceso y administración interactúan con sus canalizaciones de Dataflow. Por último, veremos cómo implementar el modelo de seguridad adecuado en Dataflow según su caso de uso.
La incorporación del aprendizaje automático en las canalizaciones de datos aumenta la capacidad para extraer estadísticas de los datos. En este curso, veremos formas de incluir el aprendizaje automático en las canalizaciones de datos en Google Cloud. Para una personalización escasa o nula, en el curso se aborda AutoML. Para obtener más capacidades de aprendizaje automático a medida, el curso presenta Notebooks y BigQuery Machine Learning (BigQuery ML). Además, en este curso se aborda cómo llevar a producción soluciones de aprendizaje automático con Vertex AI.
This 1-week, accelerated on-demand course builds upon Google Cloud Platform Big Data and Machine Learning Fundamentals. Through a combination of video lectures, demonstrations, and hands-on labs, you'll learn to build streaming data pipelines using Google cloud Pub/Sub and Dataflow to enable real-time decision making. You will also learn how to build dashboards to render tailored output for various stakeholder audiences.
En este curso intermedio, aprenderás a diseñar, crear y optimizar canalizaciones de datos por lotes sólidas en Google Cloud. Más allá del manejo de datos fundamental, explorarás las transformaciones de datos a gran escala y la organización eficiente de flujos de trabajo, lo que es primordial para la inteligencia empresarial oportuna y los informes esenciales. Obtén experiencia práctica con Dataflow para Apache Beam y Serverless for Apache Spark (Dataproc Serverless) para la implementación, y aborda consideraciones cruciales respecto de la calidad de los datos, la supervisión y las alertas para garantizar la confiabilidad de la canalización y la excelencia operativa. Se recomienda tener conocimientos básicos sobre almacenamiento de datos, ETL/ELT, SQL, Python y conceptos de Google Cloud.
Completa la insignia de habilidad introductoria Implementa Cloud Load Balancing para Compute Engine y demuestra tus habilidades para realizar las siguientes actividades: crear y, luego, implementar máquinas virtuales en Compute Engine, y configurar balanceadores de cargas de red y de aplicaciones.
Completa la insignia de habilidad introductoria Prepara datos para las APIs de AA en Google Cloud y demuestra tus habilidades para realizar las siguientes actividades: limpiar datos con Dataprep de Trifacta, ejecutar canalizaciones de datos en Dataflow, crear clústeres y ejecutar trabajos de Apache Spark en Managed Service for Apache Spark y llamar a APIs de AA, como la API de Cloud Natural Language, la API de Google Cloud Speech-to-Text y la API de Video Intelligence.
Si bien los enfoques tradicionales de usar data lakes y almacenes de datos pueden ser eficaces, tienen deficiencias, en particular en entornos empresariales grandes. En este curso, se presenta el concepto del data lakehouse y los productos de Google Cloud que se usan para crear uno. Una arquitectura de lakehouse usa fuentes de datos de estándares abiertos y combina las mejores funciones de los data lakes y los almacenes de datos, lo que aborda muchas de sus deficiencias.
En este curso, aprenderás sobre los productos y servicios de macrodatos y aprendizaje automático de Google Cloud involucrados en el ciclo de vida de datos a IA. También explorarás los procesos, los desafíos y los beneficios de crear una canalización de macrodatos y modelos de aprendizaje automático con Vertex AI en Google Cloud.
Este curso ayuda a los participantes a crear un plan de estudio para el examen de certificación PDE (Professional Data Engineer). Los alumnos conocerán la amplitud y el alcance de los dominios que se incluyen en el examen. Además, evaluarán su nivel de preparación para el examen y crearán un plan de estudio personal.