Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版) - Professional-Data-Engineer日本語 Exam Practice Test

Page: 1 / 37
Total 403 questions

Please signup / login to view this exam, then you will be able to view the entire exam for free.

Get Full Access Now

Question 1

Cloud Storage バケットに重要な法的保留文書があります。これらの文書が削除または変更されないようにする必要があります。どうすればよいでしょうか。

A. オブジェクトのバージョン管理機能を有効にします。別のリージョンのバケットにコピーを作成します。

B. オブジェクトのバージョン管理機能を有効にします。ライフサイクルルールを追加します。

C. 保持ポリシーを設定します。保持ポリシーをロックします。

D. 保持ポリシーを設定します。長期的なデジタル保存のために、デフォルトのストレージクラスをアーカイブに設定します。

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).

Question 2

ワークフローを使用して、1 KB の JSON レスポンスを返す API を呼び出し、このレスポンスに複雑なビジネスロジックを適用し、ロジックが完了するまで待機してから、Cloud Storage ファイルから BigQuery への読み込みを実行します。ワークフローの標準ライブラリには、複雑なロジックを実行するのに十分な機能がないため、代わりに Python の標準ライブラリを使用します。ワークフローを最適化して、シンプルさと実行速度を実現したいと考えています。どうすればよいでしょうか。

A. Python を使用して JSON ファイルにロジックを適用する Cloud Function インスタンスを呼び出します。

B. Cloud Composer 環境を作成し、Cloud Composer でロジックを実行します。

C. Dataproc クラスタを作成し、PySpark を使用して JSON ファイルにロジックを適用します。

D. ワークフローでサブワークフローを呼び出して、JSON ファイルにロジックを適用します。

Discussion 0

Correct Answer: A Vote an answer

Question 3

Cloud Storage から BigQuery に CSV ファイルをロードしています。ファイルには、同じ列に STRINGS と INT64 などのデータ型の不一致や、電話番号や住所などの値のフォーマットの一貫性の欠如など、既知のデータ品質の問題があります。データ品質を維持し、必要なクレンジングと変換を実行するには、データパイプラインを作成する必要があります。どうすればよいですか。

A. CSV ファイルを目的のスキーマを持つステージングテーブルにロードし、SQL を使用して変換を実行します。その後、結果を最終的な宛先テーブルに書き込みます。

B. 必要なスキーマを持つテーブルを作成し、CSV ファイルをテーブルに追加し、SQL を使用してその場で変換を実行します。

C. BigQuery に読み込む前に、Data Fusion を使用してデータを変換します。

D. データを BigQuery にロードする前に、Data Fusion を使用して CSV ファイルを AVRO などの自己記述型データ形式に変換します。

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).

Question 4

Cloud Storage バケットに存在する Apache Hive パーティション分割データの外部テーブルを作成しました。このバケットには多数のファイルが含まれています。このテーブルに対するクエリが遅いことに気付きました。これらのクエリのパフォーマンスを改善したいと考えています。どうすればよいでしょうか。

A. Hive パーティション分割データオブジェクトをマルチリージョン Cloud Storage バケットに移行します。

B. 共通のテーブル名プレフィックスを使用して、各 Hive パーティションに個別の外部テーブルを作成します。ワイルドカードテーブルクエリを使用して、パーティション分割されたデータを参照します。

C. 外部テーブルを BigLake テーブルにアップグレードし、テーブルのメタデータキャッシュを有効にします。

D. Hive パーティションデータオブジェクトのストレージクラスを Coldline から Standard に変更します。

Discussion 0

Correct Answer: C Vote an answer

Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).

Question 5

会社では、カンマ区切り値 (CSV) ファイルを Google BigQuery にロードしています。データは完全に正常にインポートされましたが、インポートされたデータはソースファイルとバイト単位で一致していません。この問題の原因として最も可能性が高いのは何でしょうか。

A. BigQuery にロードされた CSV データには CSV のフラグが付けられていません。

B. BigQuery にロードされた CSV データは、BigQuery のデフォルトのエンコードを使用していません。

C. CSV データは、BigQuery にロードされる前に ETL フェーズを経ていません。

D. CSV データには、インポート時にスキップされた無効な行が含まれています。

Discussion 0

Correct Answer: D Vote an answer

Question 6

ユーザーにテーブルの最初の 3 列のみの読み取り権限を与えるには、どのアクセス制御方法を使用しますか?

A. 定義済みロール

B. 承認されたビュー

C. プリミティブロール

D. テーブルの最初の 3 列のみにアクセス権を付与することはできません。

Discussion 0

Correct Answer: B Vote an answer

Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).

Question 7

既存のオンプレミスデータの一部を Google Cloud 上の BigQuery にロードすることを計画しています。ユースケースに応じて、データをストリーミングまたはバッチロードします。さらに、BigQuery にロードする前に、一部の機密データをマスクする必要があります。コストを最小限に抑えながら、プログラムでこれを行う必要があります。どうすればよいでしょうか。

A. Apache Beam SDK for Python を介して Dataflow でパイプラインを作成し、ストリーミング用のコード内で個別のオプションをカスタマイズします。
バッチ処理、Cloud DLP データシンクとして BigQuery を選択します。

B. BigQuery データ転送サービスを使用して移行をスケジュールします。BigQuery にデータが入力されたら、Cloud Data Loss Prevention {Cloud DLP} API への接続を使用して必要なデータを匿名化します。

C. オンプレミスのデータを BigQuery に複製するように Datastream を設定します。

D. Cloud Data Fusion を使用してパイプラインを設計し、Cloud DLP プラグインを使用してパイプライン内のデータを匿名化してから、データを BigQuery に移動します。

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).

Question 8

Cloud Spanner に、製品販売データを保存する新しいトランザクションテーブルを作成する必要があります。主キーとして何を使用するかを決定します。パフォーマンスの観点から、どの戦略を選択する必要がありますか?

A. 製品名と現在のエポックタイムの連結

B. ランダムなユニバーサルユニーク識別子番号 (バージョン 4 UUID)

C. 販売システムからの元の注文識別番号。単調に増加する整数です。

D. 現在のエポックタイム

Discussion 0

Correct Answer: B Vote an answer

Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).

Question 9

時系列トランザクションデータをコピーするデータパイプラインを作成し、データサイエンスチームが BigQuery 内からクエリを実行して分析できるようにする必要があります。1 時間ごとに、数千のトランザクションが新しいステータスで更新されます。初期データセットのサイズは 1.5 PB で、1 日あたり 3 TB ずつ増加します。データは高度に構造化されており、データサイエンスチームはこのデータに基づいて機械学習モデルを構築します。データサイエンスチームのパフォーマンスと使いやすさを最大化したいと考えています。採用すべき 2 つの戦略はどれですか。2 つの回答を選択してください。

A. データを可能な限り非正規化します。

B. ステータスの更新が BigQuery に更新されるのではなく追加されるデータパイプラインを開発します。

C. 可能な限りデータの構造を保持します。

D. BigQuery UPDATE を使用してデータセットのサイズをさらに縮小します。

E. トランザクションデータの毎日のスナップショットを Cloud Storage にコピーし、Avro ファイルとして保存します。BigQuery の外部データソースサポートを使用してクエリを実行します。

Discussion 0

Correct Answer: A,E Vote an answer

Question 10

組織では IT サービスを最新化し、Google Cloud に移行しています。Cloud Storage と BigQuery に保存するデータを整理する必要があります。営業、製品設計、マーケティングの各部門間でデータを共有するために、データメッシュアプローチを有効にする必要があります。何をすべきでしょうか。

A. 1 各部門のアプリケーションのデータ保存用に複数のプロジェクトを作成します。
2 各部門が Cloud Storage バケットと BigQuery データセットを作成できるようにします。
3. 各部門が共有したデータを Analytics Hub で公開します。
4 すべての部門が Analytics Hub で必要なデータを検出し、サブスクライブできるようにします。

B. 1各部門のデータを保存するためのプロジェクトを作成します。
2 各部門が Cloud Storage バケットと BigQuery データセットを作成できるようにします。
3. 各バケットとデータセットの承認された読者のユーザーグループを作成します。
4 IT チームがユーザーグループを管理し、部門の要求に応じてユーザーを追加または削除できるようにします。

C. 1組織のデータ保存用のプロジェクトを作成します。
2 各部門のファイルを保存するための 3 つのフォルダを含む中央 Cloud Storage バケットを作成します。
3. 部門名をプレフィックスとするテーブルを含む中央 BigQuery データセットを作成します。
4 部門のユーザーにストレージプロジェクトの閲覧権限を付与します。

D. 1 各部門のアプリケーションのデータ保存用に複数のプロジェクトを作成します。
2 各部門が Cloud Storage バケットと BigQuery データセットを作成できるようにします。
3 Dataplex で、各部門をデータレイクと Cloud Storage バケットにマッピングし、BigQuery データセットをゾーンにマッピングします。
4 各部門がデータレイクのデータを所有し、共有できるようにします。

Discussion 0

Correct Answer: A Vote an answer

Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).

Question 11

あなたのチームは、社内の ETL の開発と保守を担当しています。入力データにエラーがあるために、データフロージョブの 1 つが失敗しており、パイプラインの信頼性を向上させる必要があります (失敗したデータをすべて再処理できるようにするなど)。
何をすべきでしょうか?

A. データを変換し、ログからエラーのある行を抽出する DoFn に try... catch ブロックを追加します。

B. データを変換する DoFn に try... catch ブロックを追加し、sideOutput を使用して、後で PubSub に保存できる PCollection を作成します。

C. フィルタリング手順を追加して、今後これらのタイプのエラーをスキップし、ログからエラーのある行を抽出します。

D. データを変換する try... catch ブロックを DoFn に追加し、エラーのある行を DoFn から直接 PubSub に書き込みます。

Discussion 0

Correct Answer: D Vote an answer

Page: 1 / 37
Total 403 questions

Unlock all Professional-Data-Engineer日本語 features

No captcha needed
365 Days Free Updates
Set your Desired Pass Percentage
Allocate Time (Hours : Minutes)
Two Modes For Professional-Data-Engineer日本語 Practice
Customer Support

Get Full Access Now

Contact Us

If you have any question please leave me your email address, we will reply and send email to you in 12 hours.

Our Working Time: ( GMT 0:00-15:00 ) From Monday to Saturday

Support: Contact now

日本語 Deutsch 繁体中文 한국어

Useful Links

All Products
FAQ
Privacy Policy
Guarantee & Refund Policy
How to buy?
About Us

Latest Updated

C-FSM-2601 Premium File
1Z0-183 Premium File
Marketing-Cloud-Account-Engagement-Consultant Premium File
MS-102 Premium File
C_ARSUM Premium File
Education-Cloud-Consultant Premium File