GSP514
Visão geral
Nos laboratórios com desafio, apresentamos uma situação e um conjunto de tarefas. Para concluí-las, em vez de seguir instruções detalhadas, você usará o que aprendeu nos laboratórios do curso. Um sistema automático de pontuação (mostrado nesta página) vai avaliar seu desempenho.
Nos laboratórios com desafio, não ensinamos novos conceitos do Google Cloud. O objetivo dessas tarefas é aprimorar aquilo que você já aprendeu, como a alteração de valores padrão ou a leitura e pesquisa de mensagens para corrigir seus próprios erros.
Para alcançar a pontuação de 100%, você precisa concluir todas as tarefas no tempo definido.
Este laboratório é recomendado para quem se inscreveu no curso com o selo de
habilidade
Como criar uma malha de dados com o Knowledge Catalog. Tudo pronto para começar o desafio?
Configuração e requisitos
Antes de clicar no botão Começar o Laboratório
Leia estas instruções. Os laboratórios são cronometrados e não podem ser pausados. O timer é ativado quando você clica em Iniciar laboratório e mostra por quanto tempo os recursos do Google Cloud vão ficar disponíveis.
Este laboratório prático permite que você realize as atividades em um ambiente real de nuvem, e não em uma simulação ou demonstração. Você vai receber novas credenciais temporárias para fazer login e acessar o Google Cloud durante o laboratório.
Confira os requisitos para concluir o laboratório:
- Acesso a um navegador de Internet padrão (recomendamos o Chrome).
Observação: para executar este laboratório, use o modo de navegação anônima (recomendado) ou uma janela anônima do navegador. Isso evita conflitos entre sua conta pessoal e de estudante, o que poderia causar cobranças extras na sua conta pessoal.
- Tempo para concluir o laboratório: não se esqueça que, depois de começar, não será possível pausar o laboratório.
Observação: use apenas a conta de estudante neste laboratório. Se usar outra conta do Google Cloud, você poderá receber cobranças nela.
Cenário do desafio
Você começou a trabalhar como engenheiro de dados júnior e, até agora, vem
ajudando as equipes a criar e gerenciar os recursos do Knowledge Catalog.
Você precisa ter conhecimento suficiente para realizar essas tarefas.
Seu desafio
Você precisa ajudar uma nova equipe de desenvolvimento a criar uma malha de
dados usando o Knowledge Catalog. Mais especificamente, um lake do Knowledge
Catalog com várias zonas e recursos. Você também precisa criar tipos de
aspectos e adicioná-los a recursos do novo lake, além de avaliar a qualidade
de dados. Você recebeu um pedido para concluir as seguintes tarefas:
- Criar um lake do Knowledge Catalog com duas zonas e dois recursos.
-
Criar um tipo de aspecto de dados protegidos e adicioná-lo a uma zona.
- Atribuir um papel do IAM do Knowledge Catalog a outro usuário.
-
Criar e fazer upload de um arquivo de especificação de qualidade de dados no
Cloud Storage.
- Definir e executar um job de qualidade de dados no Knowledge Catalog.
Você precisa seguir estes padrões:
-
Confirmar se as APIs necessárias (como Knowledge Catalog, Data Catalog e
Managed Service for Spark) foram ativadas corretamente.
-
Criar todos os recursos na região, a menos que haja uma instrução diferente.
As tarefas estão descritas abaixo em detalhes. Boa sorte!
Tarefa 1: crie um lake do Knowledge Catalog com duas zonas e dois recursos
Observação: crie os recursos na região
para todas as tarefas neste laboratório com desafio, a menos que receba uma
instrução diferente.
O bucket do Cloud Storage e o conjunto de dados do BigQuery para a etapa 2
foram pré-criados neste laboratório.
-
Crie um lake do Knowledge Catalog chamado
Lake de vendas com duas zonas regionais:
-
Uma zona de originais chamada Zona de originais do cliente
-
Uma zona de curadoria com o nome
Zona de curadoria do cliente
- Anexe um recurso pré-criado a cada zona:
-
Na zona de originais, anexe o bucket do Cloud Storage com o nome
-customer-online-sessions
como um novo recurso chamado Engajamentos do cliente.
-
Na zona bruta, anexe o conjunto de dados do BigQuery com o nome
.customer_orders
como um novo recurso chamado Customer Orders.
Dica para criar um lake do Knowledge Catalog:
Clique em Verificar meu progresso para conferir o objetivo.
Criar um lake do Knowledge Catalog com duas zonas e dois recursos
Tarefa 2: crie um tipo de aspecto e adicioná-lo a uma zona
-
Crie um tipo de aspecto chamado
Aspecto de dados protegidos do cliente com dois campos
enumerados:
-
O primeiro será chamado de Flag de dados brutos e terá dois
valores: Sim e Não.
-
O segundo campo será chamado
Flag de informações de contatos protegidos e terá dois
valores: Sim e Não.
-
Adicione esse aspecto à Zona de originais do cliente usando
o valor Sim em ambas as flags.
Dica para criar e aplicar tipos de aspecto:
Clique em Verificar meu progresso para conferir o objetivo.
Criar um tipo de aspecto e adicioná-lo a uma zona
Tarefa 3: atribua um papel do IAM do Knowledge Catalog a outro usuário
-
Usando o princípio de privilégio mínimo, atribua o papel apropriado do IAM
do Knowledge Catalog ao Usuário 2 () que permita fazer upload de novos arquivos do Cloud Storage no recurso do
Knowledge Catalog chamado Customer Engagements.
Dica para atribuir papéis do IAM do Knowledge Catalog:
Clique em Verificar meu progresso para conferir o objetivo.
Atribuir um papel do IAM do Knowledge Catalog a outro usuário
Tarefa 4: crie e faça upload de um arquivo de especificação de qualidade de
dados no Cloud Storage
O bucket do Cloud Storage para a etapa 2 foi pré-criado neste laboratório.
-
Crie um arquivo de especificação de qualidade de dados chamado
dq-customer-orders.yaml com estas especificações:
-
A regra NOT NULL aplicada (com um limite de 100%) à coluna
user_id da tabela
customer_orders.ordered_items
-
A regra NOT NULL aplicada (com um limite de 100%) à coluna
order_id da tabela
customer_orders.ordered_items
-
Tabela de destino do BigQuery para os resultados:
.orders_dq_dataset.results
-
Faça upload do arquivo no bucket do Cloud Storage denominado
-dq-config.
Dica útil para criar arquivos de especificação de qualidade de
dados.
Clique em Verificar meu progresso para conferir o objetivo.
Criar e fazer upload de um arquivo de especificação de qualidade de dados
Tarefa 5: defina e execute um job de qualidade de dados automático no
Knowledge Catalog
O conjunto de dados do BigQuery para a etapa 1 foi pré-criado neste
laboratório.
-
Defina um job de qualidade de dados usando o arquivo
dq-customer-orders.yaml com estas especificações:
| Propriedade |
Valor |
| Nome do job de qualidade de dados |
customer-orders-data-quality-job |
| Dados de origem |
.customer_orders.ordered_items
|
| Conta de serviço de usuário |
Conta de serviço padrão do Compute Engine
|
- Execute o job de qualidade de dados imediatamente.
Pode levar vários minutos para esse processo ser concluído. Talvez você
precise atualizar a página para verificar se ele foi executado com
êxito.
Dica útil para definir e executar jobs de qualidade de dados.
Clique em Verificar meu progresso para conferir o objetivo.
Definir e executar um job de qualidade de dados no Knowledge Catalog
Parabéns!
Você criou uma malha de dados usando um lake do Knowledge Catalog com várias
zonas e recursos, criando um tipo de aspecto e adicionando-o a um recurso,
além de avaliar a qualidade dos dados.
Conquiste seu próximo selo de habilidade
Este laboratório autoguiado faz parte do selo de habilidade
Como criar uma malha de dados com o Knowledge Catalog. Ao concluir o curso, você ganha o selo acima como reconhecimento pela sua
conquista. Compartilhe o selo no seu currículo e nas redes sociais e use
#GoogleCloudBadge para anunciar sua conquista.
Este selo de habilidade faz parte do programa de aprendizado
Data Engineer do Google
Cloud. Se você já completou outros cursos com selo de habilidade nesse
programa de aprendizado, confira no catálogo outras opções disponíveis.
Treinamento e certificação do Google Cloud
Esses treinamentos ajudam você a aproveitar as tecnologias do Google Cloud ao máximo. Nossas aulas incluem habilidades técnicas e práticas recomendadas para ajudar você a alcançar rapidamente o nível esperado e continuar sua jornada de aprendizado. Oferecemos treinamentos que vão do nível básico ao avançado, com opções de aulas virtuais, sob demanda e por meio de transmissões ao vivo para que você possa encaixá-las na correria do seu dia a dia. As certificações validam sua experiência e comprovam suas habilidades com as tecnologias do Google Cloud.
Manual atualizado em 10 de dezembro de 2025
Laboratório testado em 4 de setembro de 2025.
Copyright 2026 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de produtos e empresas podem ser marcas registradas das respectivas empresas a que estão associados.