最新的Databricks Certified Professional Data Engineer Exam (Databricks-Certified-Professional-Data-Engineer Korean Version) - Databricks-Certified-Professional-Data-Engineer Korean免費考試真題

問題1
데이터 엔지니어 팀이 데이터 품질 검사에 대한 반복적인 요구 사항을 포함하는 테이블을 DLT 파이프라인에 추가하고 있습니다.
팀원 중 한 명이 이 파이프라인에 정의된 모든 테이블에서 이러한 데이터 품질 규칙을 재사용할 것을 제안했습니다.
그들이 이를 해낼 수 있도록 하는 접근 방식은 무엇일까요?

正確答案: C
說明:(僅 PDFExamDumps 成員可見)
問題2
Spark Structured Streaming에서 사용하는 일반적인 프로그래밍 모델의 특징을 설명하는 문장은 무엇입니까?

正確答案: B
說明:(僅 PDFExamDumps 成員可見)
問題3
다음 중 Delta Lake Auto Compaction을 설명하는 문장은 무엇입니까?

正確答案: A
說明:(僅 PDFExamDumps 成員可見)
問題4
프로덕션 클러스터는 3개의 실행기 노드를 가지며 드라이버와 실행기에 동일한 가상 머신 유형을 사용합니다.
이 클러스터의 Ganglia 메트릭을 평가할 때, 드라이버에서 실행되는 코드로 인해 발생하는 병목 현상을 나타내는 지표는 무엇일까요?

正確答案: C
說明:(僅 PDFExamDumps 成員可見)
問題5
아래의 각 구성은 클러스터당 총 400GB의 RAM, 총 160개의 코어, 그리고 VM당 하나의 Executor만 갖는다는 점에서 동일합니다.
하나 이상의 광범위한 변환이 포함된 작업이 주어졌을 때, 다음 클러스터 구성 중 어떤 구성이 최대 성능을 가져올까요?

正確答案: B
說明:(僅 PDFExamDumps 成員可見)
問題6
데이터 엔지니어가 스트리밍 주문 데이터를 처리하기 위해 Lakeflow Spark 선언적 파이프라인을 설계하고 있습니다. 이 파이프라인은 Auto Loader를 사용하여 데이터를 수집하며, customer_id가 null이 아니고 amount가 0보다 큰지 확인하여 데이터 품질을 보장해야 합니다. 유효하지 않은 레코드는 삭제해야 합니다. Python을 사용하여 이 요구 사항을 구현하는 Lakeflow Spark 선언적 파이프라인 구성은 무엇일까요?

正確答案: B
說明:(僅 PDFExamDumps 成員可見)
問題7
비즈니스 인텔리전스 팀은 소매 관련 기사에 대한 다양한 요약 지표를 추적하도록 구성된 대시보드를 보유하고 있습니다.
여기에는 전날 총 매출액과 다양한 기간별 총액 및 평균이 포함됩니다. 이 대시보드를 채우는 데 필요한 필드는 다음과 같은 스키마를 따릅니다.

수요 예측을 위해 레이크하우스는 모든 품목별 판매 내역이 포함된 검증된 테이블을 보유하고 있으며, 이 테이블은 거의 실시간으로 점진적으로 업데이트됩니다. products_per_order라는 이름의 이 테이블에는 다음과 같은 필드가 포함되어 있습니다.

장기 판매 추세 보고는 변동성이 적기 때문에 새로운 대시보드를 사용하는 분석가는 하루에 한 번만 데이터를 새로 고치면 됩니다. 또한, 일반적인 업무 시간 동안 많은 사용자가 대시보드를 대화형으로 조회하므로 결과가 빠르게 표시되고 각 데이터 생성에 필요한 총 컴퓨팅 리소스가 줄어듭니다.
어떤 솔루션이 최종 사용자의 기대를 충족시키면서 동시에 발생 가능한 비용을 통제하고 제한할 수 있을까요?

正確答案: B
問題8
Databricks Python 노트북을 텍스트 편집기에서 볼 때 첫 번째 내용은 무엇입니까?

正確答案: D
說明:(僅 PDFExamDumps 成員可見)
問題9
두 명의 데이터 엔지니어가 서로 다른 브랜치에서 동일한 Databricks 노트북을 작업하고 있습니다. 두 엔지니어 모두 동일한 코드 섹션을 수정했습니다. 한 엔지니어가 Databricks Git 폴더 UI를 사용하여 다른 엔지니어의 브랜치를 자신의 브랜치로 병합하려고 하면 해당 노트북 파일에서 병합 충돌이 발생합니다. UI는 충돌을 강조 표시하고 해결 옵션을 제시합니다.
데이터 엔지니어는 Databricks Git 폴더를 사용하여 이 병합 충돌을 어떻게 해결해야 할까요?

正確答案: B
說明:(僅 PDFExamDumps 成員可見)
問題10
PySpark에서 ETL 코드에 DataFrame 변환을 사용하는 모듈식 및 테스트 가능한 방법을 보여주는 접근 방식은 무엇입니까?

正確答案: C
說明:(僅 PDFExamDumps 成員可見)
問題11
다음 중 델타 호수와 레이크하우스에 대한 설명으로 옳은 것은 무엇입니까?

正確答案: D
說明:(僅 PDFExamDumps 成員可見)

專業認證

PDFExamDumps模擬測試題具有最高的專業技術含量,只供具有相關專業知識的專家和學者學習和研究之用。

品質保證

該測試已取得試題持有者和第三方的授權,我們深信IT業的專業人員和經理人有能力保證被授權産品的質量。

輕松通過

如果妳使用PDFExamDumps題庫,您參加考試我們保證96%以上的通過率,壹次不過,退還購買費用!

免費試用

PDFExamDumps提供每種産品免費測試。在您決定購買之前,請試用DEMO,檢測可能存在的問題及試題質量和適用性。