Salcedo Andrés
メンバー加入日: 2025
ダイヤモンド リーグ
8587 ポイント
メンバー加入日: 2025
Dataflow コースシリーズの 2 回目である今回は、Beam SDK を使用したパイプラインの開発について詳しく説明します。まず、Apache Beam のコンセプトについて復習します。次に、ウィンドウ、ウォーターマーク、トリガーを使用したストリーミング データの処理について説明します。さらに、パイプラインのソースとシンクのオプション、構造化データを表現するためのスキーマ、State API と Timer API を使用してステートフル変換を行う方法について説明します。続いて、パイプラインのパフォーマンスを最大化するためのベスト プラクティスを再確認します。コースの終盤では、Beam でビジネス ロジックを表現するための SQL と DataFrame、および Beam ノートブックを使用してパイプラインを反復的に開発する方法を説明します。
このコースは、Dataflow を使用したサーバーレスのデータ処理に関する 3 コースシリーズのパート 1 です。この最初のコースでは、始めに Apache Beam とは何か、そして Dataflow とどのように関係しているかを復習します。次に、Apache Beam のビジョンと Beam Portability フレームワークの利点について説明します。Beam Portability フレームワークによって、デベロッパーが好みのプログラミング言語と実行バックエンドを使用できるビジョンが実現します。続いて、Dataflow によってどのように費用を節約しながらコンピューティングとストレージを分離できるか、そして識別ツール、アクセスツール、管理ツールがどのように Dataflow パイプラインと相互に機能するかを紹介します。最後に、Dataflow でそれぞれのユースケースに合った適切なセキュリティ モデルを実装する方法について学習します。
このコースでは、ストリーミング データ パイプラインの構築時に直面する実際の問題を解決するために、実践的な演習を行います。ポイントは、Google Cloud プロダクトを使用して、絶えず流れ続けるデータを効果的に管理することです。
この中級コースでは、Google Cloud で堅牢なバッチデータ パイプラインを設計、構築、最適化する方法を学習します。基本的なデータ処理から一歩進んで、大規模なデータ変換と効率的なワークフロー オーケストレーションを確認します。この内容は、タイムリーなビジネス インテリジェンスと重要なレポートの作成に不可欠です。 実装に Apache Beam 用の Dataflow と Apache Spark 向け Serverless(Dataproc Serverless)を使用する実践的な演習を行い、パイプラインの信頼性の確保と効果的な運用を実現するために、データの品質、モニタリング、アラートに関する重要な考慮事項に対処します。データ ウェアハウジング、ETL / ELT、SQL、Python、Google Cloud のコンセプトに関する基本的な知識があることが推奨されます。
データレイクとデータ ウェアハウスを使用する従来のアプローチは効果的ですが、特に大規模な企業環境においては欠点があります。このコースでは、データ レイクハウスのコンセプトと、データ レイクハウスの作成に使用する Google Cloud プロダクトについて説明します。レイクハウス アーキテクチャは、オープン スタンダードのデータソースを使用し、データレイクとデータ ウェアハウスの優れた機能を組み合わせて、両者の欠点の多くに対処します。
このコースでは、Google Cloud におけるデータ エンジニアリング、データ エンジニアの役割と責任、それらが Google Cloud の各サービスにどのように対応しているかについて学びます。また、データ エンジニアリングの課題に対処する方法も学習します。
「Google Cloud の ML API 用にデータを準備」コースの入門スキルバッジを獲得できるアクティビティを修了すると、 Dataprep by Trifacta を使用したデータのクリーニング、Dataflow でのデータ パイプラインの実行、Dataproc でのクラスタの作成と Apache Spark ジョブの実行、 Cloud Natural Language API、Google Cloud Speech-to-Text API、Video Intelligence API などの ML API の呼び出しに関するスキルを証明できます。
安全な Google Cloud ネットワークの構築コースを修了してスキルバッジを獲得しましょう。このコースでは、Google Cloud でアプリケーションを ビルド、スケール、保護するための複数のネットワーク関連リソースについて学習します。
Google Cloud コンピューティングの基礎コースは、クラウド コンピューティングのバックグラウンドや経験がほとんどまたはまったくない方を対象としています。クラウドの基礎、ビッグデータ、ML の中核となるコンセプトと、Google Cloud を活用できる場面や方法の概要を示します。 この一連のコースを修了すると、これらのコンセプトについて明確に理解し、実践的なスキルを実証できます。 このコースは、次の順で完了する必要があります。 1. Google Cloud コンピューティングの基礎: クラウド コンピューティングの基本 2. Google Cloud コンピューティングの基礎: Google Cloud のインフラストラクチャ 3. Google Cloud コンピューティングの基礎: Google Cloud でのネットワーキングとセキュリティ 4. Google Cloud コンピューティングの基礎: Google Cloud のデータ、ML、AI このシリーズの最後のコースでは、マネージド ビッグデータ サービス、ML とその価値、スキルバッジを獲得して Google Cloud に関するスキルセットをさらに実証する方法について説明します。
Google Cloud コンピューティングの基礎コースは、クラウド コンピューティングのバックグラウンドや経験がほとんどまたはまったくない方を対象としています。クラウドの基礎、ビッグデータ、ML の中核となるコンセプトと、Google Cloud を活用できる場面や方法の概要を示します。 この一連のコースを修了すると、これらのコンセプトについて明確に理解し、実践的なスキルを実証できます。 このコースは、次の順で完了する必要があります。 1. Google Cloud コンピューティングの基礎: クラウド コンピューティングの基本 2. Google Cloud コンピューティングの基礎: Google Cloud のインフラストラクチャGoogle Cloud コンピューティングの基礎: Google Cloud でのネットワーキングとセキュリティ 4. Google Cloud コンピューティングの基礎: Google Cloud のデータ、ML、AI この 3 番目のコースでは、クラウドの自動化、管理ツール、安全なネットワークの構築について説明します。
「Google Cloud におけるアプリ開発環境の設定」コースを完了すると、スキルバッジを獲得できます。このコースでは、 Cloud Storage、Identity and Access Management、Cloud Functions、Pub/Sub のテクノロジーの基本機能を使用して、ストレージ中心のクラウド インフラストラクチャを構築し接続する方法を学びます。
Google Cloud コンピューティングの基礎コースは、クラウド コンピューティングのバックグラウンドや経験がほとんどまたはまったくない方を対象としています。クラウドの基礎、ビッグデータ、ML の中核となるコンセプトと、Google Cloud を活用できる場面や方法の概要を示します。 この一連のコースを修了すると、これらのコンセプトについて明確に理解し、実践的なスキルを実証できます。 このコースは、次の順で完了する必要があります。 1. Google Cloud コンピューティングの基礎: クラウド コンピューティングの基本 2. Google Cloud コンピューティングの基礎: Google Cloud のインフラストラクチャ 3. Google Cloud コンピューティングの基礎: Google Cloud でのネットワーキングとセキュリティ 4. Google Cloud コンピューティングの基礎: Google Cloud のデータ、ML、AI
「Compute Engine での Cloud Load Balancing の実装」入門コースを修了してスキルバッジを獲得すると、次のスキルを実証できます: Compute Engine における仮想マシンの作成とデプロイ、 ネットワーク ロードバランサとアプリケーション ロードバランサの構成。
Google Cloud コンピューティングの基礎コースは、クラウド コンピューティングのバックグラウンドや経験がほとんどまたはまったくない方を対象としています。クラウドの基礎、ビッグデータ、ML の中核となるコンセプトと、Google Cloud を活用できる場面や方法の概要を示します。 この一連のコースを修了すると、これらのコンセプトについて明確に理解し、実践的なスキルを実証できます。 このコースは、次の順で完了する必要があります。 1. Google Cloud コンピューティングの基礎: クラウド コンピューティングの基本 2. Google Cloud コンピューティングの基礎: Google Cloud のインフラストラクチャ 3. Google Cloud コンピューティングの基礎: Google Cloud でのネットワーキングとセキュリティ 4. Google Cloud コンピューティングの基礎: Google Cloud のデータ、ML、AI この最初のコースでは、クラウド コンピューティングの概要、Google Cloud の使用方法、さまざまなコンピューティング オプションについて説明します。