Create a Knowledge Catalog lake with two zones and two assets

Verificar meu progresso

/ 20

Create an aspect type and add an aspect to a zone

Verificar meu progresso

/ 20

Assign a Knowledge Catalog IAM role to another user

Verificar meu progresso

/ 20

Create and upload a data quality specification file

Verificar meu progresso

/ 20

Define and run a data quality job

Verificar meu progresso

/ 20

Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.

GSP514

Laboratórios autoguiados do Google Cloud

Visão geral

Nos laboratórios com desafio, apresentamos uma situação e um conjunto de tarefas. Para concluí-las, em vez de seguir instruções detalhadas, você usará o que aprendeu nos laboratórios do curso. Um sistema automático de pontuação (mostrado nesta página) vai avaliar seu desempenho.

Nos laboratórios com desafio, não ensinamos novos conceitos do Google Cloud. O objetivo dessas tarefas é aprimorar aquilo que você já aprendeu, como a alteração de valores padrão ou a leitura e pesquisa de mensagens para corrigir seus próprios erros.

Para alcançar a pontuação de 100%, você precisa concluir todas as tarefas no tempo definido.

Este laboratório é recomendado para quem se inscreveu no curso com o selo de habilidade Como criar uma malha de dados com o Knowledge Catalog. Tudo pronto para começar o desafio?

Configuração e requisitos

Antes de clicar no botão Começar o Laboratório

Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.

Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.

Confira os requisitos para concluir o laboratório:

  • Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.
  • Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.
Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.

Cenário do desafio

Você começou a trabalhar como engenheiro de dados júnior e, até agora, vem ajudando as equipes a criar e gerenciar os recursos do Knowledge Catalog.

Você precisa ter conhecimento suficiente para realizar essas tarefas.

Seu desafio

Você precisa ajudar uma nova equipe de desenvolvimento a criar uma malha de dados usando o Knowledge Catalog. Mais especificamente, um lake do Knowledge Catalog com várias zonas e recursos. Você também precisa criar tipos de aspectos e adicioná-los a recursos do novo lake, além de avaliar a qualidade de dados. Você recebeu um pedido para concluir as seguintes tarefas:

  • Criar um lake do Knowledge Catalog com duas zonas e dois recursos.
  • Criar um tipo de aspecto de dados protegidos e adicioná-lo a uma zona.
  • Atribuir um papel do IAM do Knowledge Catalog a outro usuário.
  • Criar e fazer upload de um arquivo de especificação de qualidade de dados no Cloud Storage.
  • Definir e executar um job de qualidade de dados no Knowledge Catalog.

Você precisa seguir estes padrões:

  • Confirmar se as APIs necessárias (como Knowledge Catalog, Data Catalog e Managed Service for Spark) foram ativadas corretamente.
  • Criar todos os recursos na região, a menos que haja uma instrução diferente.

As tarefas estão descritas abaixo em detalhes. Boa sorte!

Tarefa 1: crie um lake do Knowledge Catalog com duas zonas e dois recursos

Observação: crie os recursos na região para todas as tarefas neste laboratório com desafio, a menos que receba uma instrução diferente.

O bucket do Cloud Storage e o conjunto de dados do BigQuery para a etapa 2 foram pré-criados neste laboratório.

  1. Crie um lake do Knowledge Catalog chamado Lake de vendas com duas zonas regionais:
  • Uma zona de originais chamada Zona de originais do cliente
  • Uma zona de curadoria com o nome Zona de curadoria do cliente
  1. Anexe um recurso pré-criado a cada zona:
  • Na zona de originais, anexe o bucket do Cloud Storage com o nome -customer-online-sessions como um novo recurso chamado Engajamentos do cliente.
  • Na zona bruta, anexe o conjunto de dados do BigQuery com o nome .customer_orders como um novo recurso chamado Customer Orders.

Dica para criar um lake do Knowledge Catalog:

Clique em Verificar meu progresso para conferir o objetivo. Criar um lake do Knowledge Catalog com duas zonas e dois recursos

Tarefa 2: crie um tipo de aspecto e adicioná-lo a uma zona

  1. Crie um tipo de aspecto chamado Aspecto de dados protegidos do cliente com dois campos enumerados:
  • O primeiro será chamado de Flag de dados brutos e terá dois valores: Sim e Não.
  • O segundo campo será chamado Flag de informações de contatos protegidos e terá dois valores: Sim e Não.
  1. Adicione esse aspecto à Zona de originais do cliente usando o valor Sim em ambas as flags.

Dica para criar e aplicar tipos de aspecto:

Clique em Verificar meu progresso para conferir o objetivo. Criar um tipo de aspecto e adicioná-lo a uma zona

Tarefa 3: atribua um papel do IAM do Knowledge Catalog a outro usuário

  • Usando o princípio de privilégio mínimo, atribua o papel apropriado do IAM do Knowledge Catalog ao Usuário 2 () que permita fazer upload de novos arquivos do Cloud Storage no recurso do Knowledge Catalog chamado Customer Engagements.

Dica para atribuir papéis do IAM do Knowledge Catalog:

Clique em Verificar meu progresso para conferir o objetivo. Atribuir um papel do IAM do Knowledge Catalog a outro usuário

Tarefa 4: crie e faça upload de um arquivo de especificação de qualidade de dados no Cloud Storage

O bucket do Cloud Storage para a etapa 2 foi pré-criado neste laboratório.

  1. Crie um arquivo de especificação de qualidade de dados chamado dq-customer-orders.yaml com estas especificações:
  • A regra NOT NULL aplicada (com um limite de 100%) à coluna user_id da tabela customer_orders.ordered_items
  • A regra NOT NULL aplicada (com um limite de 100%) à coluna order_id da tabela customer_orders.ordered_items
  • Tabela de destino do BigQuery para os resultados: .orders_dq_dataset.results
  1. Faça upload do arquivo no bucket do Cloud Storage denominado -dq-config.

Dica útil para criar arquivos de especificação de qualidade de dados.

Clique em Verificar meu progresso para conferir o objetivo. Criar e fazer upload de um arquivo de especificação de qualidade de dados

Tarefa 5: defina e execute um job de qualidade de dados automático no Knowledge Catalog

O conjunto de dados do BigQuery para a etapa 1 foi pré-criado neste laboratório.

  1. Defina um job de qualidade de dados usando o arquivo dq-customer-orders.yaml com estas especificações:
Propriedade Valor
Nome do job de qualidade de dados customer-orders-data-quality-job
Dados de origem .customer_orders.ordered_items
Conta de serviço de usuário Conta de serviço padrão do Compute Engine
  1. Execute o job de qualidade de dados imediatamente.
Pode levar vários minutos para esse processo ser concluído. Talvez você precise atualizar a página para verificar se ele foi executado com êxito.

Dica útil para definir e executar jobs de qualidade de dados.

Clique em Verificar meu progresso para conferir o objetivo. Definir e executar um job de qualidade de dados no Knowledge Catalog

Parabéns!

Você criou uma malha de dados usando um lake do Knowledge Catalog com várias zonas e recursos, criando um tipo de aspecto e adicionando-o a um recurso, além de avaliar a qualidade dos dados.

Selo "Como criar uma malha de dados com o Knowledge Catalog"

Conquiste seu próximo selo de habilidade

Este laboratório autoguiado faz parte do selo de habilidade Como criar uma malha de dados com o Knowledge Catalog. Ao concluir o curso, você ganha o selo acima como reconhecimento pela sua conquista. Compartilhe o selo no seu currículo e nas redes sociais e use #GoogleCloudBadge para anunciar sua conquista.

Este selo de habilidade faz parte do programa de aprendizado Data Engineer do Google Cloud. Se você já completou outros cursos com selo de habilidade nesse programa de aprendizado, confira no catálogo outras opções disponíveis.

Treinamento e certificação do Google Cloud

Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.

Manual atualizado em 10 de dezembro de 2025

Laboratório testado em 4 de setembro de 2025.

Copyright 2026 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.

Antes de começar

  1. Os laboratórios criam um projeto e recursos do Google Cloud por um período fixo
  2. Os laboratórios têm um limite de tempo e não têm o recurso de pausa. Se você encerrar o laboratório, vai precisar recomeçar do início.
  3. No canto superior esquerdo da tela, clique em Começar o laboratório

Usar a navegação anônima

  1. Copie o nome de usuário e a senha fornecidos para o laboratório
  2. Clique em Abrir console no modo anônimo

Fazer login no console

  1. Faça login usando suas credenciais do laboratório. Usar outras credenciais pode causar erros ou gerar cobranças.
  2. Aceite os termos e pule a página de recursos de recuperação
  3. Não clique em Terminar o laboratório a menos que você tenha concluído ou queira recomeçar, porque isso vai apagar seu trabalho e remover o projeto

Este conteúdo não está disponível no momento

Você vai receber uma notificação por e-mail quando ele estiver disponível

Ótimo!

Vamos entrar em contato por e-mail se ele ficar disponível

Um laboratório por vez

Confirme para encerrar todos os laboratórios atuais e iniciar este

Use a navegação anônima para executar o laboratório

A melhor maneira de executar este laboratório é usando uma janela de navegação anônima ou privada. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.

Conclua esta etapa rápida para iniciar o laboratório.