Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版) - Professional-Data-Engineer日本語 Exam Practice Test
Cloud Storage バケットに重要な法的保留文書があります。これらの文書が削除または変更されないようにする必要があります。どうすればよいでしょうか。
Correct Answer: C
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
ワークフローを使用して、1 KB の JSON レスポンスを返す API を呼び出し、このレスポンスに複雑なビジネス ロジックを適用し、ロジックが完了するまで待機してから、Cloud Storage ファイルから BigQuery への読み込みを実行します。ワークフローの標準ライブラリには、複雑なロジックを実行するのに十分な機能がないため、代わりに Python の標準ライブラリを使用します。ワークフローを最適化して、シンプルさと実行速度を実現したいと考えています。どうすればよいでしょうか。
Correct Answer: A
Vote an answer
Cloud Storage から BigQuery に CSV ファイルをロードしています。ファイルには、同じ列に STRINGS と INT64 などのデータ型の不一致や、電話番号や住所などの値のフォーマットの一貫性の欠如など、既知のデータ品質の問題があります。データ品質を維持し、必要なクレンジングと変換を実行するには、データ パイプラインを作成する必要があります。どうすればよいですか。
Correct Answer: C
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
Cloud Storage バケットに存在する Apache Hive パーティション分割データの外部テーブルを作成しました。このバケットには多数のファイルが含まれています。このテーブルに対するクエリが遅いことに気付きました。これらのクエリのパフォーマンスを改善したいと考えています。どうすればよいでしょうか。
Correct Answer: C
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
会社では、カンマ区切り値 (CSV) ファイルを Google BigQuery にロードしています。データは完全に正常にインポートされましたが、インポートされたデータはソース ファイルとバイト単位で一致していません。この問題の原因として最も可能性が高いのは何でしょうか。
Correct Answer: D
Vote an answer
ユーザーにテーブルの最初の 3 列のみの読み取り権限を与えるには、どのアクセス制御方法を使用しますか?
Correct Answer: B
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
既存のオンプレミス データの一部を Google Cloud 上の BigQuery にロードすることを計画しています。ユースケースに応じて、データをストリーミングまたはバッチロードします。さらに、BigQuery にロードする前に、一部の機密データをマスクする必要があります。コストを最小限に抑えながら、プログラムでこれを行う必要があります。どうすればよいでしょうか。
Correct Answer: A
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
Cloud Spanner に、製品販売データを保存する新しいトランザクション テーブルを作成する必要があります。主キーとして何を使用するかを決定します。パフォーマンスの観点から、どの戦略を選択する必要がありますか?
Correct Answer: B
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
時系列トランザクション データをコピーするデータ パイプラインを作成し、データ サイエンス チームが BigQuery 内からクエリを実行して分析できるようにする必要があります。1 時間ごとに、数千のトランザクションが新しいステータスで更新されます。初期データセットのサイズは 1.5 PB で、1 日あたり 3 TB ずつ増加します。データは高度に構造化されており、データ サイエンス チームはこのデータに基づいて機械学習モデルを構築します。データ サイエンス チームのパフォーマンスと使いやすさを最大化したいと考えています。採用すべき 2 つの戦略はどれですか。2 つの回答を選択してください。
Correct Answer: A,E
Vote an answer
組織では IT サービスを最新化し、Google Cloud に移行しています。Cloud Storage と BigQuery に保存するデータを整理する必要があります。営業、製品設計、マーケティングの各部門間でデータを共有するために、データ メッシュ アプローチを有効にする必要があります。何をすべきでしょうか。
Correct Answer: A
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
あなたのチームは、社内の ETL の開発と保守を担当しています。入力データにエラーがあるために、データフロー ジョブの 1 つが失敗しており、パイプラインの信頼性を向上させる必要があります (失敗したデータをすべて再処理できるようにするなど)。
何をすべきでしょうか?
何をすべきでしょうか?
Correct Answer: D
Vote an answer