Instruções e requisitos de configuração do laboratório
Proteja sua conta e seu progresso. Sempre use uma janela anônima do navegador e suas credenciais para realizar este laboratório.

Dados para insights: união e junção de conjuntos de dados v1.1

Laboratório 1 hora universal_currency_alt 5 créditos show_chart Introdutório
info Este laboratório pode incorporar ferramentas de IA para ajudar no seu aprendizado.
Este conteúdo ainda não foi otimizado para dispositivos móveis.
Para aproveitar a melhor experiência, acesse nosso site em um computador desktop usando o link enviado a você por e-mail.

Informações gerais

As funções JOIN enriquecem o conjunto de dados adicionando campos (horizontalmente). As funções UNION adicionam dados à tabela (verticalmente). Quando entender as relações entre as tabelas, use funções UNIONs para adicionar registros a uma tabela e funções JOINs para enriquecer os resultados com dados de várias fontes.

Este laboratório explica como criar novas tabelas de relatórios usando as funções JOIN e UNION do SQL.

Objetivos

Neste laboratório, você vai aprender a fazer o seguinte:

  • descrever a união e junção de conjuntos de dados;
  • descrever a união de tabelas;
  • descrever como trabalhar com NULLs.

Configuração e requisitos

Para cada laboratório, você recebe um novo projeto do Google Cloud e um conjunto de recursos por um determinado período e sem custos financeiros.

  1. Faça login no Qwiklabs em uma janela anônima.

  2. Confira o tempo de acesso do laboratório (por exemplo, 1:15:00) e finalize todas as atividades nesse prazo.
    Não é possível pausar o laboratório. Você pode reiniciar o desafio, mas vai precisar refazer todas as etapas.

  3. Quando tudo estiver pronto, clique em Começar o laboratório.

  4. Anote as credenciais (Nome de usuário e Senha). É com elas que você vai fazer login no Console do Google Cloud.

  5. Clique em Abrir Console do Google.

  6. Clique em Usar outra conta, depois copie e cole as credenciais deste laboratório nos locais indicados.
    Se você usar outras credenciais, vai receber mensagens de erro ou cobranças.

  7. Aceite os termos e pule a página de recursos de recuperação.

Tarefa 1: pratique a união e junção de conjuntos de dados

Abra o BigQuery no Console do Cloud

  1. No Console do Google Cloud, selecione o menu de navegação > BigQuery:

Você vai ver a caixa de mensagem Olá! Este é o BigQuery no Console do Cloud. Ela tem um link para o guia de início rápido e lista as atualizações da interface.

  1. Clique em Concluído.
  1. Elabore a consulta no EDITOR no BigQuery.

  2. Verifique se #standardSQL está definido como sua primeira linha de código.

  3. Escreva uma consulta que contará o número de declarações fiscais por ano civil para todas as declarações do Formulário 990 do IRS.

  4. Use a consulta parcialmente escrita abaixo como guia.

Dica: você vai precisar usar caracteres curinga de tabela * com _TABLE_SUFFIX.

#SQL padrão # Use o caractere curinga da função UNION e retorne o sufixo da tabela SELECT COUNT(*) as number_of_filings, AS year_filed FROM `bigquery-public-data.irs_990.irs_990` GROUP BY year_filed ORDER BY year_filed DESC
  1. Compare com a solução abaixo:
#SQL padrão # Use o caractere curinga da função UNION e retorne o sufixo da tabela SELECT COUNT(*) as number_of_filings, _TABLE_SUFFIX AS year_filed FROM `bigquery-public-data.irs_990.irs_990_*` GROUP BY year_filed ORDER BY year_filed DESC
  1. Execute a consulta e compare com os resultados abaixo.

Resultado:

resultados da consulta de caractere curinga

  1. Modifique a consulta que você acabou de escrever para incluir apenas as tabelas do IRS com o seguinte formato: irs_990_YYYY (ou seja, filtre pf, ez, ein). Comece com a consulta parcialmente concluída abaixo:
#SQL padrão # Use o caractere curinga da função UNION e retorne o sufixo da tabela SELECT COUNT(*) as number_of_filings, CONCAT(,_TABLE_SUFFIX) AS year_filed FROM `bigquery-public-data.irs_990.irs_990_*` GROUP BY year_filed ORDER BY year_filed DESC
  1. Compare com a solução abaixo:
#SQL padrão # Use o caractere curinga da função UNION e retorne o sufixo da tabela SELECT COUNT(*) as number_of_filings, CONCAT("2",_TABLE_SUFFIX) AS year_filed FROM `bigquery-public-data.irs_990.irs_990_2*` GROUP BY year_filed ORDER BY year_filed DESC
  1. Execute a consulta e verifique os resultados.

Resultados da consulta

  1. Por fim, modifique sua consulta para incluir apenas declarações fiscais de tabelas a partir de 2013. Inclua também as médias totrevenue e totfuncexpns como métricas adicionais.

Dica: considere usar _TABLE_SUFFIX em um filtro.

  1. Compare com a solução abaixo:
#SQL padrão # contagem de declarações, receitas, despesas desde 2013 SELECT CONCAT("20",_TABLE_SUFFIX) AS year_filed, COUNT(ein) AS nonprofit_count, AVG(totrevenue) AS avg_revenue, AVG(totfuncexpns) AS avg_expenses FROM `bigquery-public-data.irs_990.irs_990_20*` WHERE _TABLE_SUFFIX >= '13' GROUP BY year_filed ORDER BY year_filed DESC
  1. Execute a consulta e verifique os resultados.

Resultados da consulta

Tarefa 2: pratique juntar tabelas

Encontre os nomes das organizações de todos os EINs de 2015 com algumas receitas ou despesas. Você vai precisar unir os dados da tabela de declaração de impostos à tabela de detalhes da organização.

  1. Comece com a consulta abaixo e preencha as tabelas, a condição de junção e qualquer filtro necessário:
#SQL padrão # Encontre os nomes das organizações de todos os EINs de 2015 com algumas receitas ou despesas, com limite de 100 registros SELECT tax.ein AS tax_ein, org.ein AS org_ein, org.name, tax.totrevenue, tax.totfuncexpns FROM AS tax JOIN AS org ON tax.ein = WHERE > 0 LIMIT 100;
  1. Compare sua consulta com a solução abaixo:
#SQL padrão # Encontre os nomes das organizações de todos os EINs de 2015 com algumas receitas ou despesas, com limite de 100 registros SELECT tax.ein AS tax_ein, org.ein AS org_ein, org.name, tax.totrevenue, tax.totfuncexpns FROM `bigquery-public-data.irs_990.irs_990_2015` AS tax JOIN `bigquery-public-data.irs_990.irs_990_ein` AS org ON tax.ein = org.ein WHERE tax.totrevenue + tax.totfuncexpns > 0 LIMIT 100;
  1. Execute a consulta.

  2. Confirme se os resultados mostram 100 registros, os nomes da Organização e pelo menos algumas despesas ou receitas.

  3. Limpe o EDITOR do BigQuery.

Tarefa 3: pratique usando funções NULL

Escreva uma consulta para descobrir onde existem registros fiscais de 2015, em que nenhum nome da organização é correspondente.

  1. Preencha a consulta inicial parcialmente escrita abaixo:
#SQL padrão # Descubra onde existem registros fiscais de 2015, em que nenhum nome da organização é correspondente SELECT tax.ein AS tax_ein, org.ein AS org_ein, org.name, tax.totrevenue, tax.totfuncexpns FROM `bigquery-public-data.irs_990.irs_990_2015` tax FULL # Complete the JOIN `bigquery-public-data.irs_990.irs_990_ein` org ON WHERE IS NULL # use tax.ein ou org.ein para a verificação (um deles é o correto)
  1. Compare sua solução com esta:
#SQL padrão # Descubra onde existem registros fiscais de 2015, em que nenhum nome da organização é correspondente SELECT tax.ein AS tax_ein, org.ein AS org_ein, org.name, tax.totrevenue, tax.totfuncexpns FROM `bigquery-public-data.irs_990.irs_990_2015` tax FULL JOIN `bigquery-public-data.irs_990.irs_990_ein` org ON tax.ein = org.ein WHERE org.ein IS NULL
  1. Execute a consulta.

Pergunta: quantas declarações fiscais ocorreram em 2015, mas não têm registro correspondente na tabela "Detalhes da organização"?

Resposta: 14.123 (sua resposta pode aumentar à medida que novos números EIN são adicionados à tabela base pública)

Parabéns!

Você concluiu o laboratório de UNIÃO E JUNÇÃO de conjuntos de dados.

Revisão

  • Use caracteres curinga de união para tratar várias tabelas como um único grupo
  • Use _TABLE_SUFFIX para filtrar tabelas curinga e criar campos calculados com o nome da tabela
  • FULL JOINs (também chamados de FULL OUTER JOINs) incluem todos os registros de cada tabela unida, não importa se há correspondências na chave de junção
  • Ter chaves de junção não exclusivas pode resultar em um CROSS JOIN não intencional (mais linhas de saída do que linhas de entrada) que deve ser evitado
  • Use COUNT() e GROUP BY para determinar se um campo-chave é realmente único

Finalize o laboratório

Clique em Terminar o laboratório após a conclusão. O Google Cloud Ensina remove os recursos usados e limpa a conta por você.

Você vai poder avaliar sua experiência no laboratório. Basta selecionar o número de estrelas, digitar um comentário e clicar em Enviar.

O número de estrelas indica o seguinte:

  • 1 estrela = muito insatisfeito
  • 2 estrelas = insatisfeito
  • 3 estrelas = neutro
  • 4 estrelas = satisfeito
  • 5 estrelas = muito satisfeito

Feche a caixa de diálogo se não quiser enviar feedback.

Para enviar seu feedback, fazer sugestões ou correções, use a guia Suporte.

Copyright 2026 Google LLC. Todos os direitos reservados. Google e o logotipo do Google são marcas registradas da Google LLC. Todos os outros nomes de empresas e produtos podem ser marcas registradas das empresas a que estão associados.

Antes de começar

  1. Os laboratórios criam um projeto e recursos do Google Cloud por um período fixo
  2. Os laboratórios têm um limite de tempo e não têm o recurso de pausa. Se você encerrar o laboratório, vai precisar recomeçar do início.
  3. No canto superior esquerdo da tela, clique em Começar o laboratório

Usar a navegação anônima

  1. Copie o nome de usuário e a senha fornecidos para o laboratório
  2. Clique em Abrir console no modo anônimo

Fazer login no console

  1. Faça login usando suas credenciais do laboratório. Usar outras credenciais pode causar erros ou gerar cobranças.
  2. Aceite os termos e pule a página de recursos de recuperação
  3. Não clique em Terminar o laboratório a menos que você tenha concluído ou queira recomeçar, porque isso vai apagar seu trabalho e remover o projeto

Este conteúdo não está disponível no momento

Você vai receber uma notificação por e-mail quando ele estiver disponível

Ótimo!

Vamos entrar em contato por e-mail se ele ficar disponível

Um laboratório por vez

Confirme para encerrar todos os laboratórios atuais e iniciar este

Use a navegação anônima para executar o laboratório

A melhor maneira de executar este laboratório é usando uma janela de navegação anônima ou privada. Isso evita conflitos entre sua conta pessoal e a conta de estudante, o que poderia causar cobranças extras na sua conta pessoal.