Microsoft Implementing Analytics Solutions Using Microsoft Fabric (DP-600 Korean Version) - DP-600 Korean Exam Practice Test
현재 사용 중인 Fabric 워크스페이스는 기본 Spark 스타터 풀과 런타임 버전 1, 2를 사용합니다.
귀하는 호숫가 주택에서 Sales.raw.csv라는 CSV 파일을 읽고, 열을 선택한 다음, 해당 데이터를 델타 테이블로 만들어 호숫가 주택의 관리 영역에 저장할 계획입니다. Sales_raw.csv 파일에는 12개의 열이 있습니다.
다음과 같은 코드가 있습니다.

다음 각 문장에 대해, 문장이 사실이면 '예'를 선택하고, 그렇지 않으면 '아니오'를 선택하십시오. 참고: 각 정답은 1점입니다.

귀하는 호숫가 주택에서 Sales.raw.csv라는 CSV 파일을 읽고, 열을 선택한 다음, 해당 데이터를 델타 테이블로 만들어 호숫가 주택의 관리 영역에 저장할 계획입니다. Sales_raw.csv 파일에는 12개의 열이 있습니다.
다음과 같은 코드가 있습니다.

다음 각 문장에 대해, 문장이 사실이면 '예'를 선택하고, 그렇지 않으면 '아니오'를 선택하십시오. 참고: 각 정답은 1점입니다.

Correct Answer:

Explanation:

The Spark engine will read only the ' SalesOrderNumber ' , ' OrderDate ' , ' CustomerName ' , ' UnitPrice ' columns from Sales_raw.csv. - Yes Removing the partition will reduce the execution time of the query. - No Adding inferSchema= ' true ' to the options will increase the execution time of the query. - Yes The code specifies the selection of certain columns, which means only those columns will be read into the DataFrame. Partitions in Spark are a way to optimize the execution of queries by organizing the data into parts that can be processed in parallel. Removing the partition could potentially increase the execution time because Spark would no longer be able to process the data in parallel efficiently. The inferSchema option allows Spark to automatically detect the column data types, which can increase the execution time of the initial read operation because it requires Spark to read through the data to infer the schema.
Workspace1이라는 이름의 Fabric 워크스페이스가 있으며, 이 워크스페이스에는 시맨틱 모델과 Report1이라는 이름의 보고서가 있습니다. Workspace 1은 Gill이라는 이름의 Git 리포지토리에 연결되어 있습니다.
개발, 테스트, 프로덕션이라는 세 단계로 구성된 배포 파이프라인이 있습니다.
Report1을 프로덕션 단계로 게시해야 합니다.
어떻게 해야 할까요?
개발, 테스트, 프로덕션이라는 세 단계로 구성된 배포 파이프라인이 있습니다.
Report1을 프로덕션 단계로 게시해야 합니다.
어떻게 해야 할까요?
Correct Answer: C
Vote an answer
참고: 이 문제는 동일한 시나리오를 제시하는 일련의 문제 중 하나입니다. 각 문제에는 제시된 목표를 달성할 수 있는 고유한 해결책이 포함되어 있습니다. 일부 문제 세트에는 정답이 두 개 이상일 수 있으며, 정답이 없는 문제 세트도 있습니다.
이 섹션에서 질문에 답변한 후에는 해당 질문으로 돌아갈 수 없습니다. 따라서 이 질문들은 검토 화면에 나타나지 않습니다.
Model1이라는 이름의 시맨틱 모델을 포함하는 Fabric 테넌트가 있습니다.
Model1에 대해 다음 쿼리가 느리게 실행되는 것을 발견했습니다.

쿼리 실행 시간을 줄여야 합니다.
해결 방법: 다음 코드 참조:

이것이 목표를 달성합니까?
이 섹션에서 질문에 답변한 후에는 해당 질문으로 돌아갈 수 없습니다. 따라서 이 질문들은 검토 화면에 나타나지 않습니다.
Model1이라는 이름의 시맨틱 모델을 포함하는 Fabric 테넌트가 있습니다.
Model1에 대해 다음 쿼리가 느리게 실행되는 것을 발견했습니다.

쿼리 실행 시간을 줄여야 합니다.
해결 방법: 다음 코드 참조:

이것이 목표를 달성합니까?
Correct Answer: B
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
연구 부서 작업 공간을 그룹화할 수 있는 솔루션을 추천해 주셔야 합니다.
권장 사항에 무엇을 포함해야 할까요? 답변하려면 답변란에서 적절한 옵션을 선택하세요.
참고: 정답 하나당 1점입니다.

권장 사항에 무엇을 포함해야 할까요? 답변하려면 답변란에서 적절한 옵션을 선택하세요.
참고: 정답 하나당 1점입니다.

Correct Answer:

Explanation:

Comprehensive Detailed Explanation
The requirement is to logically group the Research division workspaces and support filtering in the OneLake data hub .
Why Domain ?
Microsoft Fabric allows you to assign workspace domains (e.g., Finance, HR, Research).
This provides a logical grouping of workspaces within the organization.
Domains are the only supported way to enable filtering in OneLake data hub by department .
Capacity or tenant grouping would not allow filtering by department in OneLake.
Why OneLake data hub ?
The OneLake data hub is the centralized interface to browse and discover data assets across the organization.
With workspace domains configured, users can filter directly in the OneLake data hub by domain (e.g.,
"Research").
The Fabric Admin portal and Entra admin center are used for administration, not for workspace filtering in data discovery.
Correct Selection for the Hotspot
Grouping method: Domain
Tool: OneLake data hub
References
Workspace domains in Microsoft Fabric
Discover and filter data in OneLake data hub
Grouping method = Domain
Tool = OneLake data hub
귀사에는 호숫가 별장을 소유한 Fabric 임대인이 있습니다.
다음 코드를 사용하여 Fabric 노트북에서 대용량 DataFrame을 저장하고 있습니다.

다음 각 문장에 대해, 문장이 사실이면 '예'를 선택하고, 그렇지 않으면 '아니요'를 선택하십시오.
참고: 정답 하나당 1점입니다.

다음 코드를 사용하여 Fabric 노트북에서 대용량 DataFrame을 저장하고 있습니다.

다음 각 문장에 대해, 문장이 사실이면 '예'를 선택하고, 그렇지 않으면 '아니요'를 선택하십시오.
참고: 정답 하나당 1점입니다.

Correct Answer:

Explanation:
The results will form a hierarchy of folders for each partition key. - Yes The resulting file partitions can be read in parallel across multiple nodes. - Yes The resulting file partitions will use file compression. - No Partitioning data by columns such as year, month, and day, as shown in the DataFrame write operation, organizes the output into a directory hierarchy that reflects the partitioning structure. This organization can improve the performance of read operations, as queries that filter by the partitioned columns can scan only the relevant directories. Moreover, partitioning facilitates parallelism because each partition can be processed independently across different nodes in a distributed system like Spark. However, the code snippet provided does not explicitly specify that file compression should be used, so we cannot assume that the output will be compressed without additional context.
References =
DataFrame write partitionBy
Apache Spark optimization with partitioning
Fabric 웨어하우스에 Sales.Products라는 테이블이 있습니다. Sales.Products 테이블에는 다음과 같은 열이 있습니다.

다음 열들을 반환하는 T-SQL 쿼리를 작성해야 합니다.

코드를 어떻게 완성해야 할까요? 정답을 선택하려면 답변란에서 적절한 옵션을 고르세요.


다음 열들을 반환하는 T-SQL 쿼리를 작성해야 합니다.

코드를 어떻게 완성해야 할까요? 정답을 선택하려면 답변란에서 적절한 옵션을 고르세요.

Correct Answer:

Explanation:
For the HighestSellingPrice, you should use the GREATEST function to find the highest value from the given price columns. However, T-SQL does not have a GREATEST function as found in some other SQL dialects, so you would typically use a CASE statement or an IIF statement with nested MAX functions. Since neither of those are provided in the options, you should select MAX as a placeholder to indicate the function that would be used to find the highest value if combining multiple MAX functions or a similar logic was available.
For the TradePrice, you should use the COALESCE function, which returns the first non-null value in a list.
The COALESCE function is the correct choice as it will return AgentPrice if it ' s not null; if AgentPrice is null, it will check WholesalePrice , and if that is also null, it will return ListPrice .
The complete code with the correct SQL functions would look like this:
SELECT ProductID,
MAX(ListPrice, WholesalePrice, AgentPrice) AS HighestSellingPrice, -- MAX is used as a placeholder COALESCE(AgentPrice, WholesalePrice, ListPrice) AS TradePrice FROM Sales.Products Select MAX for HighestSellingPrice and COALESCE for TradePrice in the answer area.
Workspace1이라는 이름의 Fabric 워크스페이스가 있습니다.
Workspace1에는 Model1이라는 모델을 포함하여 여러 개의 시맨틱 모델이 있습니다. Model1은 XMLA 엔드포인트를 사용하여 업데이트됩니다.
XMLA 엔드포인트의 쓰기 작업 속도를 높여야 합니다.
어떻게 해야 할까요?
Workspace1에는 Model1이라는 모델을 포함하여 여러 개의 시맨틱 모델이 있습니다. Model1은 XMLA 엔드포인트를 사용하여 업데이트됩니다.
XMLA 엔드포인트의 쓰기 작업 속도를 높여야 합니다.
어떻게 해야 할까요?
Correct Answer: B
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
DW1이라는 데이터 웨어하우스를 포함하는 Fabric 테넌트가 있습니다. DW1에는 DimCustomer라는 테이블이 있습니다. DimCustomer 테이블에는 다음 표에 표시된 필드가 포함되어 있습니다.

DimCustomer 테이블에서 중복된 이메일 주소를 찾아야 합니다. 솔루션은 최대 개수를 반환해야 합니다.
1,000건의 기록.
어떤 네 개의 T-SQL 문을 순서대로 실행해야 합니까? 정답을 맞추려면, 주어진 문 목록에서 적절한 문을 답란으로 옮기고 올바른 순서대로 배열하십시오.


DimCustomer 테이블에서 중복된 이메일 주소를 찾아야 합니다. 솔루션은 최대 개수를 반환해야 합니다.
1,000건의 기록.
어떤 네 개의 T-SQL 문을 순서대로 실행해야 합니까? 정답을 맞추려면, 주어진 문 목록에서 적절한 문을 답란으로 옮기고 올바른 순서대로 배열하십시오.

Correct Answer:

Explanation:

Step 1 - Select the required fields and count
We want to group by CustomerAltKey and count occurrences.
SELECT CustomerAltKey, COUNT ( * )
Step 2 - From the table
FROM DimCustomer
Step 3 - Grouping by email
GROUP BY CustomerAltKey
Step 4 - Filtering duplicates (only values with count > 1)
HAVING COUNT ( * ) > 1
Step 5 - Limiting the result to 1,000 rows
LIMIT 1000
(or in T-SQL, SELECT TOP(1000) ... ). Since both options are shown, we use LIMIT 1000 because Fabric Warehouse supports Synapse SQL T-SQL + ANSI SQL style.
Correct Sequence:
SELECT CustomerAltKey, COUNT(*)
FROM DimCustomer
GROUP BY CustomerAltKey
HAVING COUNT(*) > 1
LIMIT 1000
Warehouse!라는 이름의 웨어하우스를 포함하는 Fabric 테넌트가 있습니다. Warehouse!에는 schemal과 schema2라는 두 개의 스키마와 schemal.city라는 테이블이 있습니다.
schema2에 schemal.city의 복사본을 만들어야 합니다. 데이터 복사량을 최소화하는 해결책을 제시해야 합니다.
어떤 T-SQL 문을 실행해야 할까요?
schema2에 schemal.city의 복사본을 만들어야 합니다. 데이터 복사량을 최소화하는 해결책을 제시해야 합니다.
어떤 T-SQL 문을 실행해야 할까요?
Correct Answer: D
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).
귀하는 LH1이라는 이름의 호숫가 주택을 포함하는 Fabric 임대 계약을 보유하고 있습니다.
새로운 시맨틱 모델을 배포해야 합니다. 솔루션은 다음 요구 사항을 충족해야 합니다.
* 집계 함수, 계산 테이블 및 다차원 표현식(MDX) 사용자 계층 구조를 포함하는 복잡한 계산 열을 지원합니다.
* 페이지 렌더링 시간을 최소화합니다.
모델을 어떻게 구성해야 할까요? 답변하려면 답변 영역에서 적절한 옵션을 선택하세요.
참고: 정답 하나당 1점입니다.

새로운 시맨틱 모델을 배포해야 합니다. 솔루션은 다음 요구 사항을 충족해야 합니다.
* 집계 함수, 계산 테이블 및 다차원 표현식(MDX) 사용자 계층 구조를 포함하는 복잡한 계산 열을 지원합니다.
* 페이지 렌더링 시간을 최소화합니다.
모델을 어떻게 구성해야 할까요? 답변하려면 답변 영역에서 적절한 옵션을 선택하세요.
참고: 정답 하나당 1점입니다.

Correct Answer:

Explanation:

Supports complex calculated columns (with aggregate functions, calculated tables, MDX hierarchies).
Minimizes page rendering times .
Step 1 - Choosing the Mode
Direct Lake # Best for near real-time queries, avoids duplication, but has limitations (e.g., some complex calculated columns, MDX user hierarchies are not fully supported).
DirectQuery # Sends queries to the source each time. It supports complex expressions but is slow (not optimal for minimizing page rendering times).
Import # Data is loaded into VertiPaq in-memory engine, supports full DAX capabilities, calculated tables, MDX hierarchies, and provides fastest query performance .
# Correct choice: Import .
Step 2 - Choosing Query Caching
Capacity default # Relies on the workspace/capacity setting.
Off # Disables caching, which could slow down report rendering.
On # Ensures queries are cached for faster page rendering times.
# Correct choice: On .
Mode: Import
Query Caching: On
References:
Semantic model storage modes in Fabric
Query caching in Power BI / Fabric
Stage.Customers라는 테이블이 있는 데이터 웨어하우스가 있습니다. Stage.Customers 테이블에는 고객 관계 관리(CRM) 시스템에서 가져온 모든 고객 레코드 업데이트가 저장됩니다. 고객별로 여러 번의 업데이트가 있을 수 있습니다. 각 고객 ID에 대해 고객 ID, 이름, 우편번호, 그리고 가장 최근 행의 최종 업데이트 시간을 반환하는 T-SQL 쿼리를 작성해야 합니다.
코드를 어떻게 완성해야 할까요? 정답을 선택하려면 답란에서 적절한 옵션을 고르세요. 참고: 각 정답은 1점입니다.

코드를 어떻게 완성해야 할까요? 정답을 선택하려면 답란에서 적절한 옵션을 고르세요. 참고: 각 정답은 1점입니다.

Correct Answer:

Explanation:

In the ROW_NUMBER() function, choose OVER (PARTITION BY CustomerID ORDER BY LastUpdated DESC) .
In the WHERE clause, choose WHERE X = 1 .
To select the most recent row for each customer ID, you use the ROW_NUMBER() window function partitioned by CustomerID and ordered by LastUpdated in descending order. This will assign a row number of 1 to the most recent update for each customer. By selecting rows where the row number ( X ) is 1, you get the latest update per customer.
References =
Use the OVER clause to aggregate data per partition
Use window functions
Azure SQL 데이터베이스(DB1)와 Fabric 작업 영역(Workspace1)이 있습니다.
Workspace1에는 LH1이라는 이름의 호숫가 주택과 Dataflow1이라는 이름의 Dataflow Gen2가 포함되어 있습니다.
Dataflow1에는 DB1에서 데이터를 로드하고, 데이터에 변환을 적용한 다음 데이터를 필터링하는 Query1이라는 쿼리가 포함되어 있습니다.
쿼리1이 변환을 적용하기 전에 모든 데이터를 로드한다는 것을 알게 됩니다.
Query1이 쿼리 폴딩을 사용하도록 해야 합니다.
어떻게 해야 할까요?
Workspace1에는 LH1이라는 이름의 호숫가 주택과 Dataflow1이라는 이름의 Dataflow Gen2가 포함되어 있습니다.
Dataflow1에는 DB1에서 데이터를 로드하고, 데이터에 변환을 적용한 다음 데이터를 필터링하는 Query1이라는 쿼리가 포함되어 있습니다.
쿼리1이 변환을 적용하기 전에 모든 데이터를 로드한다는 것을 알게 됩니다.
Query1이 쿼리 폴딩을 사용하도록 해야 합니다.
어떻게 해야 할까요?
Correct Answer: A
Vote an answer
Workspace-!라는 이름의 Fabric 워크스페이스가 있고, Repol이라는 이름의 GitHub 리포지토리가 있습니다. Workspace-!를 Repol의 메인 브랜치에 연결하려면 어떤 정보를 제공해야 할까요?
Correct Answer: C
Vote an answer
다음과 같은 T-SQI 문이 있습니다.




Correct Answer:

Explanation:

The statement uses SUM(CASE WHEN RefundStatus = ' Refunded ' THEN SalesAmount ELSE 0 END) AS TotalRevenue, which calculates TotalRevenue by summing SalesAmount only when RefundStatus is ' Refunded ' , and 0 otherwise. This means Region values are returned regardless of RefundStatus, but the TotalRevenue reflects refunded items.
The WHERE (TransactionDate) - YEAR(GETDATE()) condition is incomplete and lacks proper comparison (e.g., no equality or range check), so it does not filter for the current year.
The TotalRevenue calculation does not aggregate all SalesAmount values with RefundStatus of ' Refunded ' ; it sums SalesAmount only for refunded items within the grouped data, with 0 for non-refunded items.
연구 부서의 데이터 분석 요구 사항을 충족하는 패브릭 용량 SKU 유형을 추천해야 합니다. 어떤 유형을 추천하시겠습니까?
Correct Answer: A
Vote an answer
Explanation: Only visible for Fast2test members. You can sign-up / login (it's free).