Microsoft Data Engineering on Microsoft Azure (DP-203 Korean Version) - DP-203 Korean Exam Practice Test
Azure 데이터 팩터리가 있습니다.
마지막 180개 플레이에서 파이프라인 오류를 조사해야 합니다.
무엇을 사용해야 합니까?
마지막 180개 플레이에서 파이프라인 오류를 조사해야 합니다.
무엇을 사용해야 합니까?
Correct Answer: B
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
Table1이라는 테이블이 포함된 Azure Synapse Analytics 전용 SQL 풀이 있습니다.
수집되어 container1이라는 Azure Data Lake Storage Gen2 컨테이너에 로드되는 파일이 있습니다.
파일의 데이터를 table1 및 container1이라는 Azure Data Lake Storage Gen2 컨테이너에 삽입할 계획입니다.
파일의 데이터를 Table1에 삽입하고 데이터를 변환할 계획입니다. 파일의 각 데이터 행은 Table1의 제공 계층에서 하나의 행을 생성합니다.
소스 데이터 파일이 container1에 로드될 때 DateTime이 Table1에 추가 열로 저장되는지 확인해야 합니다.
솔루션: Azure Synapse Analytics 파이프라인에서 파일의 DateTime을 검색하는 메타데이터 가져오기 활동을 사용합니다.
이것이 목표를 달성합니까?
수집되어 container1이라는 Azure Data Lake Storage Gen2 컨테이너에 로드되는 파일이 있습니다.
파일의 데이터를 table1 및 container1이라는 Azure Data Lake Storage Gen2 컨테이너에 삽입할 계획입니다.
파일의 데이터를 Table1에 삽입하고 데이터를 변환할 계획입니다. 파일의 각 데이터 행은 Table1의 제공 계층에서 하나의 행을 생성합니다.
소스 데이터 파일이 container1에 로드될 때 DateTime이 Table1에 추가 열로 저장되는지 확인해야 합니다.
솔루션: Azure Synapse Analytics 파이프라인에서 파일의 DateTime을 검색하는 메타데이터 가져오기 활동을 사용합니다.
이것이 목표를 달성합니까?
Correct Answer: A
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
페타바이트 규모의 의료 영상 데이터를 저장할 애플리케이션을 설계하고 있습니다. 데이터가 처음 생성되면 첫 주 동안 데이터에 자주 액세스하게 됩니다. 한 달이 지나면 30초 이내에 데이터에 액세스할 수 있어야 하지만 파일에 자주 액세스하지 않습니다. 1년 후에는 데이터에 자주 액세스하지 않지만 5분 이내에 액세스할 수 있어야 합니다.
날짜에 대한 스토리지 전략을 선택해야 합니다.
ㅏ. 솔루션은 비용을 최소화해야 합니다.
각 기간에 어떤 스토리지 계층을 사용해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

날짜에 대한 스토리지 전략을 선택해야 합니다.
ㅏ. 솔루션은 비용을 최소화해야 합니다.
각 기간에 어떤 스토리지 계층을 사용해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

Correct Answer:

Explanation:

First week: Hot
Hot - Optimized for storing data that is accessed frequently.
After one month: Cool
Cool - Optimized for storing data that is infrequently accessed and stored for at least 30 days.
After one year: Cool
다음 표에 나와 있는 리소스가 포함된 Azure 구독이 있습니다.

임시 쿼리와 openrowset 함수를 사용하여 storage1의 파일을 읽어야 합니다. 솔루션은 각 행 집합에 단일 JSON 레코드가 포함되어 있는지 확인해야 합니다.
openrowset 함수의 format 옵션을 무엇으로 설정해야 하나요?

임시 쿼리와 openrowset 함수를 사용하여 storage1의 파일을 읽어야 합니다. 솔루션은 각 행 집합에 단일 JSON 레코드가 포함되어 있는지 확인해야 합니다.
openrowset 함수의 format 옵션을 무엇으로 설정해야 하나요?
Correct Answer: A
Vote an answer
Azure IoT Hub에서 데이터를 스트리밍하기 위한 변칙 검색 솔루션을 설계하고 있습니다. 솔루션은 다음 요구 사항을 충족해야 합니다.
출력을 Azure Synapse로 보냅니다.
시계열 데이터의 스파이크와 딥을 식별합니다.
개발 및 구성 노력을 최소화합니다.
솔루션에 어떤 것을 포함해야 합니까?
출력을 Azure Synapse로 보냅니다.
시계열 데이터의 스파이크와 딥을 식별합니다.
개발 및 구성 노력을 최소화합니다.
솔루션에 어떤 것을 포함해야 합니까?
Correct Answer: A
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
다음 표에 표시된 리소스가 포함된 Azure 구독이 있습니다.

Storage1 계정에는 Container1이라는 컨테이너가 포함되어 있습니다. Container1 컨테이너에는 다음 파일이 포함되어 있습니다.

기본 제공 서버리스 SQL 풀에서 다음 스크립트를 실행합니다.

다음 각 진술에 대해 해당 진술이 참이면 예를 선택하십시오. 그렇지 않은 경우 아니요를 선택합니다. 참고: 올바른 선택마다 1점의 가치가 있습니다.


Storage1 계정에는 Container1이라는 컨테이너가 포함되어 있습니다. Container1 컨테이너에는 다음 파일이 포함되어 있습니다.

기본 제공 서버리스 SQL 풀에서 다음 스크립트를 실행합니다.

다음 각 진술에 대해 해당 진술이 참이면 예를 선택하십시오. 그렇지 않은 경우 아니요를 선택합니다. 참고: 올바른 선택마다 1점의 가치가 있습니다.

Correct Answer:

Explanation:

참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 하나 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 시나리오에서 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
100GB의 파일이 포함된 Azure Storage 계정이 있습니다. 파일에는 텍스트와 숫자 값이 포함되어 있습니다. 행의 75%에는 평균 길이가 1.1MB인 설명 데이터가 포함되어 있습니다.
스토리지 계정에서 Azure SQL 데이터 웨어하우스로 데이터를 복사할 계획입니다.
데이터가 빠르게 복사되도록 파일을 준비해야 합니다.
해결 방법: 각 행이 1MB보다 크도록 파일을 수정합니다.
이것이 목표를 달성합니까?
이 시나리오에서 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
100GB의 파일이 포함된 Azure Storage 계정이 있습니다. 파일에는 텍스트와 숫자 값이 포함되어 있습니다. 행의 75%에는 평균 길이가 1.1MB인 설명 데이터가 포함되어 있습니다.
스토리지 계정에서 Azure SQL 데이터 웨어하우스로 데이터를 복사할 계획입니다.
데이터가 빠르게 복사되도록 파일을 준비해야 합니다.
해결 방법: 각 행이 1MB보다 크도록 파일을 수정합니다.
이것이 목표를 달성합니까?
Correct Answer: B
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
다음 전시회에 표시된 활동이 있습니다.

드롭다운 메뉴를 사용하여 그래픽에 제시된 정보를 기반으로 각 문장을 완성하는 답을 선택하십시오.


드롭다운 메뉴를 사용하여 그래픽에 제시된 정보를 기반으로 각 문장을 완성하는 답을 선택하십시오.

Correct Answer:

Explanation:

ADFdev 및 ADFprod라는 두 개의 Azure Data Factory 인스턴스가 있습니다. ADFdev는 Azure DevOps Git 리포지토리에 연결합니다.
Git 리포지토리의 기본 분기에서 ADFdev로 변경 사항을 게시합니다.
ADFdev에서 ADFprod로 아티팩트를 배포해야 합니다.
먼저 무엇을 해야 합니까?
Git 리포지토리의 기본 분기에서 ADFdev로 변경 사항을 게시합니다.
ADFdev에서 ADFprod로 아티팩트를 배포해야 합니다.
먼저 무엇을 해야 합니까?
Correct Answer: C
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
Azure Synapse Analytics 서버리스 SQL 풀에서 데이터베이스를 구축하고 있습니다.
Azure Data Lake Storage Gen2 컨테이너의 Parquet 파일에 저장된 데이터가 있습니다.
레코드는 다음 샘플과 같이 구성됩니다.
{
"id": 123,
"address_housenumber": "19c",
"address_line": "메모리 레인",
"applicant1_name": "제인",
"applicant2_name": "개발자"
}
기록에는 최대 두 명의 지원자가 포함됩니다.
주소 필드만 포함하는 테이블을 작성해야 합니다.
Transact-SQL 문을 어떻게 완성해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

Azure Data Lake Storage Gen2 컨테이너의 Parquet 파일에 저장된 데이터가 있습니다.
레코드는 다음 샘플과 같이 구성됩니다.
{
"id": 123,
"address_housenumber": "19c",
"address_line": "메모리 레인",
"applicant1_name": "제인",
"applicant2_name": "개발자"
}
기록에는 최대 두 명의 지원자가 포함됩니다.
주소 필드만 포함하는 테이블을 작성해야 합니다.
Transact-SQL 문을 어떻게 완성해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

Correct Answer:

Explanation:
Box 1: CREATE EXTERNAL TABLE
An external table points to data located in Hadoop, Azure Storage blob, or Azure Data Lake Storage. External tables are used to read data from files or write data to files in Azure Storage. With Synapse SQL, you can use external tables to read external data using dedicated SQL pool or serverless SQL pool.
Syntax:
CREATE EXTERNAL TABLE { database_name.schema_name.table_name | schema_name.table_name | table_name } ( <column_definition> [ ,...n ] ) WITH ( LOCATION = 'folder_or_filepath', DATA_SOURCE = external_data_source_name, FILE_FORMAT = external_file_format_name Box 2. OPENROWSET When using serverless SQL pool, CETAS is used to create an external table and export query results to Azure Storage Blob or Azure Data Lake Storage Gen2.
Example:
AS
SELECT decennialTime, stateName, SUM(population) AS population
FROM
OPENROWSET(BULK 'https://azureopendatastorage.blob.core.windows.net/censusdatacontainer/release
/us_population_county/year=*/*.parquet',
FORMAT='PARQUET') AS [r]
GROUP BY decennialTime, stateName
GO
Reference:
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql/develop-tables-external-tables
Azure Synapse Analytics 전용 SQL 풀을 만들 계획입니다.
큐를 실행한 사용자 및 회사의 데이터 개인 정보 보호 규정에 정의된 기밀 정보를 반환하는 쿼리를 식별하는 데 걸리는 시간을 최소화해야 합니다.
솔루션에 포함해야 하는 두 가지 구성 요소는 무엇입니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.
큐를 실행한 사용자 및 회사의 데이터 개인 정보 보호 규정에 정의된 기밀 정보를 반환하는 쿼리를 식별하는 데 걸리는 시간을 최소화해야 합니다.
솔루션에 포함해야 하는 두 가지 구성 요소는 무엇입니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.
Correct Answer: C,D
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 하나 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
계층 구조가 있는 Azure Databricks 작업 영역을 만들 계획입니다. 작업 영역에는 다음 세 가지 워크로드가 포함됩니다.
Python 및 SQL을 사용할 데이터 엔지니어를 위한 워크로드입니다.
Python, Scala 및 SOL을 사용하는 노트북을 실행할 작업에 대한 워크로드입니다.
데이터 과학자가 Scala 및 R에서 임시 분석을 수행하는 데 사용할 워크로드입니다.
회사의 엔터프라이즈 아키텍처 팀은 Databricks 환경에 대해 다음 표준을 식별합니다.
데이터 엔지니어는 클러스터를 공유해야 합니다.
작업 클러스터는 데이터 과학자와 데이터 엔지니어가 클러스터에 배포할 패키지 노트북을 제공하는 요청 프로세스를 사용하여 관리됩니다.
모든 데이터 과학자에게는 120분 동안 활동이 없으면 자동으로 종료되는 자체 클러스터가 할당되어야 합니다. 현재 세 명의 데이터 과학자가 있습니다.
워크로드에 대한 Databricks 클러스터를 만들어야 합니다.
솔루션: 각 데이터 과학자를 위한 표준 클러스터, 데이터 엔지니어를 위한 높은 동시성 클러스터 및 작업을 위한 높은 동시성 클러스터를 만듭니다.
이것이 목표를 달성합니까?
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
계층 구조가 있는 Azure Databricks 작업 영역을 만들 계획입니다. 작업 영역에는 다음 세 가지 워크로드가 포함됩니다.
Python 및 SQL을 사용할 데이터 엔지니어를 위한 워크로드입니다.
Python, Scala 및 SOL을 사용하는 노트북을 실행할 작업에 대한 워크로드입니다.
데이터 과학자가 Scala 및 R에서 임시 분석을 수행하는 데 사용할 워크로드입니다.
회사의 엔터프라이즈 아키텍처 팀은 Databricks 환경에 대해 다음 표준을 식별합니다.
데이터 엔지니어는 클러스터를 공유해야 합니다.
작업 클러스터는 데이터 과학자와 데이터 엔지니어가 클러스터에 배포할 패키지 노트북을 제공하는 요청 프로세스를 사용하여 관리됩니다.
모든 데이터 과학자에게는 120분 동안 활동이 없으면 자동으로 종료되는 자체 클러스터가 할당되어야 합니다. 현재 세 명의 데이터 과학자가 있습니다.
워크로드에 대한 Databricks 클러스터를 만들어야 합니다.
솔루션: 각 데이터 과학자를 위한 표준 클러스터, 데이터 엔지니어를 위한 높은 동시성 클러스터 및 작업을 위한 높은 동시성 클러스터를 만듭니다.
이것이 목표를 달성합니까?
Correct Answer: B
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).