AWS DEAの試験ガイドのサービスから作成した一覧です。

Amazon Kinesis

AWSサービス説明利用例
Amazon Kinesisリアルタイムでデータをストリーミングし、分析や処理を行うためのサービス。データストリーム、データファイアホース、ビデオストリームなどのコンポーネントがある。ウェブサイトのユーザー行動データやアプリケーションログをリアルタイムで収集し、分析やアラートのトリガーに利用。
Amazon Kinesis Data Firehoseストリーミングデータをリアルタイムで取り込み、Amazon S3、Redshift、Elasticsearchなどに自動的に転送するサービス。ログデータをリアルタイムでS3に保存し、その後Redshiftで分析。
Amazon Kinesis Data Streams大量のデータをリアルタイムでストリーミングし、低レイテンシで処理するためのサービス。イベントストリームの処理に最適。ウェブサイトのユーザー行動データをリアルタイムで収集し、機械学習モデルの入力データとして使用。

AWS Glue

AWSサービス説明利用例
AWS Glueデータの準備、変換、ロードを自動化するマネージド型のETL(Extract、Transform、Load)サービス。S3に保存された生データを変換し、Redshiftにロードしてデータウェアハウスとして活用。
AWS Glue Data Catalogデータのメタデータを格納し、カタログ化するためのサービス。AthenaやRedshift Spectrumなどと連携し、クエリのパフォーマンスを向上させる。データのカタログを整備し、AthenaでS3のデータを効率的にクエリするために使用。
AWS Glue Data Qualityデータ品質の検査と評価を自動化する機能。ETLプロセス中にデータの品質を確保し、異常データを検出して通知。
AWS Glue DynamicFrameスキーマが不確定なデータを柔軟に扱うことができるデータフレーム。ETL処理に最適。複雑なデータ構造を持つデータセットをETL処理する際に、DynamicFrameを使用してデータを変換。
AWS Glue Studioグラフィカルインターフェースを使用してETLジョブを簡単に作成・デプロイできるツール。複雑なETLワークフローを簡単に作成し、S3からRedshiftへのデータロードを自動化。
AWS Glue クローラデータストアをクロールし、スキーマやテーブル定義を自動的に認識し、Glue Data Catalogにメタデータを登録するサービス。新しいデータがS3にアップロードされた際に、Glueクローラを使用してデータのスキーマを自動的に検出し、データカタログに追加。
AWS Glue ジョブETLタスクを実行するためのスクリプトやパイプラインを作成し、データを変換・ロードするための実行ユニット。収集したログデータを正規化し、分析のためにRedshiftにロードするためのETLジョブを作成。
AWS Glue ジョブブックマークジョブの状態を追跡し、再実行時にどこから処理を再開するかを記録する機能。ETLジョブが失敗した場合でも、途中から再開して処理を完了させる。
AWS Glue DataBrewデータのクリーニングや正規化を視覚的に行えるツールで、データセットの準備を迅速に行える。大規模なデータセットをクリーニングし、機械学習や分析用に準備。
AWS Glue Detect PIIデータセット内の個人情報(PII)を検出し、保護するための機能。ETLプロセス中に個人情報を特定し、マスキングや暗号化を適用してデータを保護。

Amazon Redshift

AWSサービス説明利用例
Amazon Redshiftペタバイト規模のデータを効率的に分析できるフルマネージド型のデータウェアハウス。クエリの高速化やスケーラビリティが強み。大規模なデータウェアハウス環境を構築し、ビジネスデータの迅速な分析を実現。
Amazon Redshift SpectrumAmazon S3に直接クエリを実行できる機能で、Redshiftのクエリを拡張する。S3に保存されたデータに対してRedshiftを使用してクエリを実行し、データの分析範囲を拡張。
Amazon Redshift クエリエディタ v2Amazon Redshift用のウェブベースのSQLクエリエディタで、クエリの作成と実行を容易に行える。クエリの作成とデータの分析をRedshift上で迅速に行う。
Amazon Redshift データ共有Redshiftクラスター間でデータを効率的に共有できる機能。異なる部門間でリアルタイムデータを共有し、データ分析を加速。
Amazon Redshift マテリアライズドビュークエリの結果を保存し、パフォーマンスを向上させるためのキャッシュされたビュー。頻繁に実行されるクエリのパフォーマンスを向上させるために、マテリアライズドビューを使用。
Amazon Redshift 分散スタイルRedshiftテーブルのデータをどのように分散させるかを決定する設定。性能に影響を与える重要な設定要素。クエリ性能を最適化するため、テーブルの分散スタイルを適切に設定。

Amazon EMR

AWSサービス説明利用例
Amazon EMRHadoopやSparkなどのビッグデータ処理フレームワークを利用して大規模なデータセットを処理するためのサービス。スケーラブルでコスト効果が高い。S3に保存された大量の生データをEMR上でHadoopを使用してバッチ処理。
Amazon EMR クラスター分散コンピューティングを行うための仮想マシンの集合で、HadoopやSparkなどのビッグデータ処理を実行。S3に保存された大量データをEMRクラスター上で分析し、インサイトを抽出。
Amazon EMR セキュリティ設定機能EMRクラスターでセキュリティを強化するための設定オプションで、アクセス制御やデータの暗号化を設定できる。セキュリティ要求の高いデータ処理環境で、クラスターのアクセス制御とデータ暗号化を厳密に設定。
Amazon EMR ユニフォームインスタンスグループ同一タイプのインスタンスで構成されるEMRクラスターの設定方法。クラスターのパフォーマンスやコスト管理を効率化するために、ユニフォームインスタンスグループを選択。

その他

AWSサービス説明利用例
Amazon QuickSightビジネスインテリジェンス(BI)ツールで、データの可視化やダッシュボード作成を容易に行うことができる。RedshiftやS3のデータを視覚化し、ビジネスインサイトを得るためのインタラクティブなダッシュボードを構築。
Amazon AppFlowSaaSアプリケーションとAWSサービス間でデータを簡単に安全に転送できるサービス。Salesforce、SAPなどのSaaSアプリケーションからデータを定期的にAWSに転送して、S3に保存し、後で分析する。
Amazon EventBridgeサービス間のイベントを簡単に接続できるイベントバスサービス。サーバーレスアーキテクチャにおいてイベント駆動のワークフローを構築するために使用される。EC2インスタンスの状態変化に基づいて、特定のLambda関数を自動的にトリガーするシステムを構築。
Amazon AthenaS3に保存されたデータに対してSQLクエリを実行できるインタラクティブなクエリサービス。サーバーレスであり、使った分だけ課金される。大量のログファイルを直接クエリし、特定のイベントに関するインサイトを迅速に得る。
Amazon Athena データパーテーションAthenaでクエリを最適化するためにデータをパーティション分割する機能。大規模なデータセットを効率的にクエリするために、データを年や月ごとにパーティション分割。
Amazon Elastic Kubernetes Service (Amazon EKS)フルマネージド型のKubernetesサービスで、クラウドとオンプレミス環境でコンテナ化されたアプリケーションを簡単にデプロイ・管理できる。マイクロサービスアーキテクチャのアプリケーションをコンテナ化し、EKS上でスケーラブルにデプロイ。
Amazon Managed Workflows for Apache Airflow (Amazon MWAA)フルマネージド型のApache Airflowサービスで、データ処理ワークフローの作成・実行を容易に行える。データのETLプロセスを定期的に実行するためのワークフローをAirflowで構築。
Amazon S3 ファイルゲートウェイオンプレミスアプリケーションからAmazon S3に直接アクセスし、ファイルをクラウドに保存するためのゲートウェイ。オンプレミスのファイルストレージをS3に統合し、コスト削減とデータの可用性向上を図る。
ストアプロシージャデータベースにおける一連のSQLステートメントをカプセル化し、再利用可能な形で保存する仕組み。複雑なデータ操作を効率的に行うためにストアプロシージャを使用。
Amazon S3 ファイル形式Amazon S3に保存されるデータのファイル形式(例:CSV、Parquet、ORCなど)。分析目的で使用するデータのファイル形式をParquetやORCに設定し、クエリのパフォーマンスを向上。
AWS Step Functionsサーバーレスで分散アプリケーションのワークフローを視覚的に設計・実行できるサービス。複数のLambda関数を連携させて、複雑な処理フローを構築し、自動化。
AWS Storage Gatewayオンプレミスのデータをクラウドに安全に接続するためのハイブリッドクラウドストレージサービス。オンプレミスのデータをS3にバックアップし、災害対策の一環としてクラウドに保存。
Amazon Simple Queue Service (Amazon SQS)分散アプリケーション間でメッセージを非同期で送受信できる完全管理型のメッセージキューサービス。マイクロサービスアーキテクチャにおいて、サービス間の通信を非同期で行い、システムの耐障害性を向上。
AWS Database Migration Service (AWS DMS)データベースの移行を簡単に行えるサービスで、データの移行中でもソースデータベースを稼働させ続けることが可能。オンプレミスのMySQLデータベースからAmazon Auroraへの移行中、アプリケーションのダウンタイムを最小限に抑えるために使用。
Amazon DynamoDB TTLデータ項目に自動的に有効期限を設定し、その期限が過ぎると項目を削除する機能。ユーザセッションデータなど、期限が切れると不要になるデータを自動的に削除。
Amazon OpenSearch検索および分析のためのオープンソースの検索エンジン。ログデータやメトリクスデータの検索と分析を行い、リアルタイムでのモニタリングとトラブルシューティングを実現。
Amazon OpenSearch UltraWarm データノードAmazon OpenSearch Serviceでコスト効率よく大量のログデータを保存するための低コストストレージオプション。長期間保存する必要のあるログデータを低コストで保持し、必要に応じてクエリする。
Amazon SageMaker Data Wranglerデータの準備、処理、変換を行うための統合ツール。機械学習モデルのトレーニングに最適化されている。機械学習モデル用のデータを簡単に準備し、トレーニングプロセスを迅速化。
Amazon SageMaker リネージトラッキングモデルのトレーニング、デプロイ、監査プロセスを追跡できる機能。モデルのトレーニングプロセスやデプロイ履歴を追跡し、モデルの性能向上やコンプライアンスの確認に使用。
AWS Lambdaサーバーレスでコードを実行するサービス。イベントに応じて自動的にスケールし、インフラ管理を不要にする。S3にファイルがアップロードされた際に自動的にデータを処理するLambda関数をトリガー。
AWS Schema Conversion Tool (AWS SCT)異なるデータベース間のスキーマ変換を行うツール。オンプレミスからクラウドへの移行時に使用される。オンプレミスのOracleデータベースからAurora MySQLへの移行プロジェクトで、スキーマの変換を自動化。
Icebergデータレイクのテーブル形式を管理するためのオープンソースプロジェクト。スナップショットや分割、メタデータ管理などが特徴。大規模なデータセットを管理し、異なるデータソースやツール間でデータの一貫性を保つために使用。
AWS KMS暗号化キーの管理と使用を統合的に提供するサービスで、データの暗号化と復号を安全に行うことができる。S3バケット内のデータを暗号化して保護し、コンプライアンス要件を満たす。
AWS Secrets Managerアプリケーションで使用する機密情報を安全に管理し、自動的にローテーションするサービス。データベースの認証情報やAPIキーを安全に管理し、アプリケーションのセキュリティを向上。
Amazon CloudWatch Container Insightsコンテナ化されたアプリケーションのパフォーマンスや状態をモニタリングするためのサービス。EKS上で動作するコンテナのリソース使用状況やパフォーマンスを監視し、問題を早期に発見。
Amazon CloudWatch LogAWSリソースやアプリケーションから収集されたログを監視し、保存し、分析するためのサービス。アプリケーションのエラーログを監視し、異常が検出された場合にアラートを送信。
Amazon S3 オブジェクトロックS3オブジェクトを削除できないようにロックし、データの保持ポリシーを強制するための機能。法規制に従ってデータを一定期間保持し、削除や上書きを防止。
AWS Cloud TrailAWSアカウント内のAPIコールを記録し、コンプライアンスやセキュリティ監査のために使用するサービス。アカウント内で行われたすべての変更を追跡し、不正アクセスや操作の監視に利用。
AWS Cloud Trail LakeCloudTrailのログを中央に保存し、クエリや分析が可能なログアーカイブ機能。過去のAPIコールを迅速に検索し、セキュリティインシデントを特定。
AWS Lake Formationデータレイクの迅速なセットアップと管理を行うためのサービス。データのインジェスト、分類、アクセス制御を簡素化。データレイクを構築し、複数のデータソースからデータを統合して分析を実施。