본문 바로가기
Cloud/Azure

DP900 연습문제

by 에르모사 쩐뉴 2025. 11. 11.

 

어떤 Azure 데이터 서비스를 사용하면 이미지, PDF 파일, 정적 JSON 파일을 저장할 수 있나요?

답변을 하나만 선택하세요.

Apache Gremlin용 Azure Cosmos DB This answer is incorrect.
Azure Blob 스토리지 This answer is correct.
Azure SQL 데이터베이스
Azure 테이블 저장소

 

Blob 저장소는 파일 저장에 가장 적합한 옵션입니다. 테이블 저장소는 파일에 적합하지 않습니다. Apache Gremlin용 Azure Cosmos DB는 노드와 엣지가 있는 조직도와 같은 계층적 데이터를 저장하는 데 사용됩니다. Azure SQL Database는 CRUD(생성, 읽기, 업데이트 및 삭제) 작업에 가장 적합한 옵션이며 저장 공간을 가장 적게 사용하지만, 본 솔루션에는 데이터베이스 관리 시스템(DBMS)이 필요하지 않습니다.

 

 

비디오 카메라에서 네이티브 바이너리 형식으로 전송해야 하는 데이터 유형은 무엇입니까?

답변을 하나만 선택하세요.

반구조화된
구조화된
비구조화된 This answer is correct.

비정형 데이터에는 문서, 이미지, 오디오 데이터, 비디오 데이터, 바이너리 파일 등의 데이터가 포함됩니다.

 

 

 

다음 요구 사항에 따라 데이터를 저장해야 하는 애플리케이션을 설계합니다.

  • 다양한 데이터 소스의 과거 데이터를 저장합니다.
  • 예약된 일정에 따라 데이터를 로드합니다.
  • 비정규화된 별 또는 눈송이 스키마를 사용합니다.

어떤 유형의 데이터베이스를 사용해야 합니까?

답변을 하나만 선택하세요.

Azure 테이블 저장소
그래프 데이터베이스
OLAP 데이터베이스 This answer is correct.
OLTP 데이터베이스

OLAP 데이터베이스는 과거 데이터가 포함된 스노우플레이크 스키마에 사용됩니다. 테이블 저장소는 이러한 유형의 데이터에 적합하지 않습니다. 그래프 데이터베이스는 노드와 엣지가 있는 조직도와 같은 계층적 데이터를 저장하는 데 사용됩니다. OLTP 데이터베이스는 생성, 읽기, 업데이트 및 삭제(CRUD) 작업에 사용되며, 저장 공간을 가장 적게 사용하며, 스노우플레이크 스키마의 과거 데이터를 저장하는 데 적합하지 않습니다.

 

 

어떤 서비스를 사용하면 그래프 데이터베이스로 데이터를 저장할 수 있나요?

답변을 하나만 선택하세요.

애저 코스모스 DB This answer is correct.
Azure SQL 데이터베이스

 

Azure SQL 관리형 인스턴스
Azure Synapse 분석
This answer is incorrect.

Azure Cosmos DB에서는 데이터를 그래프 데이터베이스로 저장할 수 있습니다. Azure Synapse Analytics, SQL Managed Instance, Azure SQL Database에서는 그래프 데이터베이스로 저장할 수 없습니다.

 

 

어떤 두 가지 파일 유형이 데이터를 열 형식으로 저장합니까? 각 정답은 완전한 해답을 제시합니다.

해당되는 답변을 모두 선택하세요.

아브로
CSV This answer is incorrect.
쪽매 세공 This answer is correct.
오크 This answer is correct.
 

ORC와 Parquet은 열 기반 데이터 형식입니다. Avro는 행 기반이며, CSV는 구분 기호로 구분된 데이터에 사용됩니다.

 

 

 

 

어떤 유형의 데이터 워크로드가 업데이트에 최적화되어 있으며 엔터티 간 관계에 의존하여 데이터를 상관관계로 연결합니까?

답변을 하나만 선택하세요.


analytical This answer is incorrect.
graph
time series
transactionalThis answer is correct.

트랜잭션 워크로드는 생성, 읽기, 업데이트, 삭제(CRUD) 작업에 최적화되어 있습니다. 분석 데이터베이스는 대량의 집계된 데이터를 저장하도록 고도로 비정규화되어 있으며 읽기 작업에 최적화되어 있습니다. 시계열 워크로드는 대량의 집계된 데이터를 저장하지 않습니다. 그래프 워크로드는 계층적 데이터를 저장합니다.

 

 

트랜잭션 시스템에서 사용되는 두 가지 애플리케이션은 무엇입니까? 각 정답은 완전한 해결책을 제시합니다.

해당되는 답변을 모두 선택하세요.

사업부(LOB) 애플리케이션 This answer is correct.
라이브 애플리케이션 This answer is correct.
비즈니스 지표를 제시하는 보고서 This answer is incorrect.
OLAP 측정값을 제시하는 보고서

라이브 애플리케이션은 트랜잭션 데이터 처리 시스템에서 사용됩니다. LOB 애플리케이션은 비즈니스 데이터를 처리하는 라이브 애플리케이션의 한 유형입니다.

 

 

Apache Hadoop을 사용하여 대량의 데이터를 처리하려면 무엇을 사용해야 합니까?

답변을 하나만 선택하세요.

Azure 데이터 팩토리
Azure 데이터브릭스
Azure HDInsight
This answer is correct.
Azure Synapse 분석
This answer is incorrect.

HDInsight는 Hadoop을 사용하여 대량의 데이터를 처리하는 데 사용됩니다. Databricks는 여러 클라우드 공급업체에서 지원하는 대량의 데이터를 처리하는 데 사용됩니다. Data Factory는 ETL 파이프라인을 실행하는 데 사용됩니다. Azure Synapse Analytics는 Apache Spark 기반으로 구축된 Azure 네이티브 서비스입니다.

 

 

Apache Spark 기반으로 구축되었으며 다른 클라우드 제공업체와 호환되는 서비스는 무엇입니까?

답변을 하나만 선택하세요.

 

Azure 데이터 팩토리
Azure 데이터브릭스 This answer is correct.
Azure HDInsight
Azure Synapse 분석 This answer is incorrect.

Databricks는 여러 클라우드 제공업체에서 지원하는 대용량 데이터 처리에 사용됩니다. Data Factory는 ETL 파이프라인을 실행하는 데 사용됩니다. Azure Synapse Analytics는 Apache Spark 기반으로 구축된 Azure 네이티브 서비스입니다. HDInsight는 Apache Hadoop을 사용하여 대용량 데이터를 처리하는 데 사용됩니다.


분석 데이터 저장소 탐색

 

분석 데이터 저장소에는 두 가지 일반적인 유형이 있습니다.

데이터웨어하우스

데이터 웨어하우스  트랜잭션 워크로드보다는 데이터 분석에 최적화된 스키마에 데이터가 저장되는 관계형 데이터베이스입니다. 일반적으로 트랜잭션 저장소의 데이터는 숫자 값이 중앙 팩트 테이블에 저장되는 스키마로 변환되며, 이 팩트 테이블은 데이터를 집계할 수 있는 엔터티를 나타내는 하나 이상의 차원 테이블과 관련됩니다. 예를 들어, 팩트 테이블에는 판매 주문 데이터가 포함될 수 있으며, 이 데이터는 고객, 제품, 매장 및 시간 차원별로 집계될 수 있습니다(예를 들어, 각 매장의 제품별 월별 총 판매 수익을 쉽게 찾을 수 있음). 이러한 종류의 팩트 및 차원 테이블 스키마를 스타 스키마 라고 하지만, 차원 계층 구조를 나타내기 위해 차원 테이블과 관련된 추가 테이블을 추가하여 스노우플레이크 스키마 로 확장되는 경우가 많습니다(예: 제품은 제품 범주와 관련될 수 있음). 테이블의 구조화된 스키마로 구성할 수 있는 트랜잭션 데이터가 있고 SQL을 사용하여 쿼리하려는 경우 데이터 웨어하우스가 좋은 선택입니다.

데이터 레이크

데이터 레이크는 일반적으로 고성능 데이터 액세스를 위해 분산 파일 시스템에 구축된 파일 저장소입니다. Spark나 Hadoop과 같은 기술은 저장된 파일에 대한 쿼리를 처리하고 보고 및 분석을 위해 데이터를 반환하는 데 자주 사용됩니다. 이러한 시스템은 종종 스키마 온 리드(schema-on-read) 방식을 적용하여 분석을 위해 데이터를 읽는 시점에 반정형 데이터 파일에 테이블 형식 스키마를 정의하며, 저장 시 제약 조건을 적용하지 않습니다. 데이터 레이크는 데이터가 저장소에 기록될 때 스키마를 적용할 필요 없이, 분석하려는 정형, 반정형, 심지어 비정형 데이터가 혼합된 환경을 지원하는 데 매우 유용합니다.

하이브리드 접근 방식

데이터 레이크하우스 에서 데이터 레이크와 데이터 웨어하우스의 기능을 결합하는 하이브리드 방식을 사용할 수 있습니다 . 원시 데이터는 데이터 레이크에 파일로 저장되고, Microsoft Fabric SQL 분석 엔드포인트는 이를 테이블 형태로 노출하여 SQL을 사용하여 쿼리할 수 있습니다. Microsoft Fabric으로 레이크하우스를 생성하면 SQL 분석 엔드포인트가 자동으로 생성됩니다. 데이터 레이크하우스는 Spark 기반 시스템에서 비교적 새로운 방식이며, 관계형 저장소 기능을 Spark에 추가하는 Delta Lake 와 같은 기술을 통해 활성화됩니다 . 이를 통해 스키마 및 트랜잭션 일관성을 강화하는 테이블을 정의하고, 일괄 로드 및 스트리밍 데이터 원본을 지원하고, 쿼리를 위한 SQL API를 제공할 수 있습니다.

분석 저장소를 위한 Azure 서비스

Azure에는 다음을 포함하여 대규모 분석 저장소를 구현하는 데 사용할 수 있는 여러 서비스가 있습니다.

Microsoft Fabric 은 대규모 데이터 분석을 위한 통합 엔드 투 엔드 솔루션입니다. 다양한 기술과 기능을 결합하여 확장 가능한 고성능 SQL Server 기반 관계형 데이터 웨어하우스의 데이터 무결성 및 안정성과 데이터 레이크 및 오픈 소스 Apache Spark의 유연성을 결합할 수 있습니다. 또한 Microsoft Fabric Real-Time Intelligence를 통한 로그 및 원격 분석에 대한 기본 지원과 데이터 수집 및 변환을 위한 기본 제공 데이터 파이프라인을 포함합니다. 각 Microsoft Fabric 제품 환경에는 자체 홈(예: Data Factory Home)이 있습니다. 각 Fabric 홈에는 사용자가 생성하고 액세스하는 모든 작업 영역에서 사용 권한이 있는 항목이 표시됩니다. Microsoft Fabric은 단일 통합 분석 솔루션을 구축하려는 경우 훌륭한 선택입니다.

Azure Databricks는 인기 있는 Databricks 플랫폼을 Azure에서 구현한 솔루션입니다. Databricks는 Apache Spark 기반의 포괄적인 데이터 분석 솔루션으로, 네이티브 SQL 기능과 데이터 분석 및 데이터 과학을 위한 워크로드 최적화된 Spark 클러스터를 제공합니다. Databricks는 대화형 사용자 인터페이스를 제공하여 시스템을 관리하고 대화형 노트북에서 데이터를 탐색할 수 있습니다. 여러 클라우드 플랫폼에서 널리 사용되므로, 기존 플랫폼 전문 지식을 활용하거나 멀티클라우드 환경에서 운영하거나 클라우드 이식 가능 솔루션을 지원해야 하는 경우 Azure Databricks를 분석 저장소로 사용하는 것을 고려해 볼 수 있습니다.


 

이벤트에 대한 응답으로 데이터를 처리하는 파이프라인을 생성할 수 있는 두 가지 서비스는 무엇인가요? 정답은 각각 완전한 해결책을 제시합니다.

해당되는 답변을 모두 선택하세요.

Azure 데이터 팩토리 This answer is correct.
Azure 데이터브릭스
Azure HDInsight This answer is incorrect.
Azure Synapse 분석 This answer is correct.

Azure Synapse Analytics와 Data Factory 모두 이벤트에 대한 응답으로 파이프라인을 생성할 수 있도록 지원합니다. Databricks와 HDInsight는 데이터 처리 작업을 실행합니다.

 

Azure Data Factory를 사용하여 Microsoft Excel 파일의 데이터를 Parquet 파일로 복사하는 통합 프로세스를 위해 먼저 무엇을 만들어야 합니까?

답변을 하나만 선택하세요.

 

데이터 세트
연결된 서비스This answer is correct.
파이프라인 This answer is incorrect.
활동
 

먼저 연결된 서비스를 생성해야 합니다. 파이프라인은 기존 연결된 서비스를 사용하여 데이터를 로드하고 처리합니다. 데이터셋은 입력 및 출력이며, 액티비티는 데이터 흐름으로 정의할 수 있습니다.

 

 

스트림 처리의 소스로 사용할 수 있는 두 가지 서비스는 무엇인가요? 각 정답은 완전한 해결책을 제시합니다.

해당되는 답변을 모두 선택하세요.

Azure 데이터브릭스Azure 이벤트 허브
This answer is correct.
Azure IoT 허브
This answer is correct.
Azure SQL 데이터베이스
This answer is incorrect.

Azure IoT Hub와 Azure Event Hub는 스트림 처리 소스로 사용할 수 있습니다. Azure Databricks는 대량의 데이터 처리에 사용되고, Azure SQL Database는 관계형 데이터를 저장하는 데 사용됩니다.

 

 

Kafka 큐에서 데이터를 지속적으로 검색하고, 데이터를 처리하고, Azure Data Lake에 데이터를 쓰는 데 사용할 수 있는 서비스는 무엇입니까?

답변을 하나만 선택하세요.

애저 코스모스 DBAzure 데이터 팩토리Azure 스트림 분석
This answer is correct.
Azure Synapse 분석
This answer is incorrect.

Stream Analytics는 Kafka에서 Data Lake로의 스트림 처리를 처리할 수 있습니다. Azure Synapse Analytics는 스트리밍 데이터를 처리하지 않습니다. Azure Cosmos DB는 데이터 스트리밍을 처리하지 않습니다. Data Factory는 스트림을 처리하지 않습니다.