본문 바로가기
[AWS]/AWS SAA EXAMTOPICS

[AWS][SAA][EXAMTOPICS] Question 69 (확인)

by METAVERSE STORY 2022. 9. 16.
반응형

Amazon Redshift is being used by a business to do analytics and produce customer reports. The corporation just obtained an extra 50 terabytes of demographic data on its customers. The data is saved in Amazon S3 in.csv files. The organization need a system that efficiently merges data and visualizes the findings.

What recommendations should a solutions architect make to satisfy these requirements?

  • A. Use Amazon Redshift Spectrum to query the data in Amazon S3 directly and join that data with the existing data in Amazon Redshift. Use Amazon QuickSight to build the visualizations.
  • B. Use Amazon Athena to query the data in Amazon S3. Use Amazon QuickSight to join the data from Athena with the existing data in Amazon Redshift and to build the visualizations.
  • C. Increase the size of the Amazon Redshift cluster, and load the data from Amazon S3. Use Amazon EMR Notebooks to query the data and build the visualizations in Amazon Redshift.
  • D. Export the data from the Amazon Redshift cluster into Apache Parquet files in Amazon S3. Use Amazon Elasticsearch Service (Amazon ES) to query the data. Use Kibana to visualize the results.

 

한글번역

Amazon Redshift는 비즈니스에서 분석을 수행하고 고객 보고서를 생성하는 데 사용됩니다. 이 회사는 고객에 대한 추가 50테라바이트의 인구 통계 데이터를 얻었습니다. 데이터는 Amazon S3 in.csv 파일에 저장됩니다. 조직에는 데이터를 효율적으로 병합하고 결과를 시각화하는 시스템이 필요합니다.

솔루션 설계자는 이러한 요구 사항을 충족하기 위해 어떤 권장 사항을 제시해야 합니까?

  • A. Amazon Redshift Spectrum을 사용하여 Amazon S3의 데이터를 직접 쿼리하고 해당 데이터를 Amazon Redshift의 기존 데이터와 결합합니다. Amazon QuickSight를 사용하여 시각화를 구축하십시오.
  • B. Amazon Athena를 사용하여 Amazon S3의 데이터를 쿼리합니다. Amazon QuickSight를 사용하여 Athena의 데이터를 Amazon Redshift의 기존 데이터와 결합하고 시각화를 구축하십시오.
  • C. Amazon Redshift 클러스터의 크기를 늘리고 Amazon S3에서 데이터를 로드합니다. Amazon EMR 노트북을 사용하여 Amazon Redshift에서 데이터를 쿼리하고 시각화를 구축하십시오.
  • D. Amazon Redshift 클러스터의 데이터를 Amazon S3의 Apache Parquet 파일로 내보냅니다. Amazon Elasticsearch Service(Amazon ES)를 사용하여 데이터를 쿼리합니다. Kibana를 사용하여 결과를 시각화하십시오.

 

 

 

정답

  • A. Use Amazon Redshift Spectrum to query the data in Amazon S3 directly and join that data with the existing data in Amazon Redshift. Use Amazon QuickSight to build the visualizations.

 

해설

Amazon Redshift란 무엇입니까?

Amazon Redshift 클러스터 관리 안내서입니다. Amazon Redshift는 클라우드에서 완벽하게 관리되는 페타바이트급 데이터 웨어하우스 서비스입니다. 작게는 수백 기가바이트부터 시작하여 페타바이트 이상까지 데이터를 확장할 수 있습니다. 이를 통해 데이터를 사용하여 비즈니스 및 고객에 대한 새로운 인사이트를 발굴하는 것도 가능합니다.

데이터 웨어하우스를 생성할 때는 먼저 Amazon Redshift 클러스터라는 노드 집합을 시작하는 것이 첫 번째 단계입니다. 클러스터 프로비저닝을 마치면 데이터 집합을 업로드하여 데이터 분석 쿼리를 실행할 수 있습니다. Amazon Redshift는 데이터 집합의 크기와 상관없이 오늘날 사용되는 것과 동일한 SQL 기반 도구 및 비즈니스 인텔리전스 애플리케이션을 사용하여 쿼리 성능을 가속화합니다.

Amazon Redshift Spectrum을 사용하여 데이터를 Amazon Redshift 테이블에 로드하지 않고도 Amazon S3 파일에서 데이터를 쿼리합니다. Amazon Redshift는 Amazon Redshift 클러스터와 Amazon S3 데이터 레이크 모두에 저장된 초대형 데이터 집합의 빠른 온라인 분석 처리(OLAP)를 위해 설계된 SQL 기능을 제공합니다.

Amazon Redshift Spectrum을 사용하면 데이터를 Amazon Redshift 테이블에 로드하지 않고도 Amazon S3의 파일에서 정형 및 비정형 데이터를 효율적으로 쿼리하고 가져올 수 있습니다. Redshift Spectrum 쿼리는 대량 병렬 처리를 채택해 큰 데이터 집합에 대해 매우 빠르게 실행됩니다. 대부분의 처리가 Redshift Spectrum 계층에서 이루어지며, 데이터가 대부분 Amazon S3에 그대로 남습니다. 또한 다수의 클러스터가 Amazon S3의 동일한 데이터 집합에 대해 동시에 쿼리를 실행할 수 있기 때문에 각 클러스터의 데이터를 일일이 복사할 필요가 없습니다.

Amazon Redshift Spectrum을 사용하여 데이터를 Amazon Redshift 테이블에 로드하지 않고도 Amazon S3 파일에서 데이터를 쿼리할 수 있습니다. Parquet, ORC, RCFile, TextFile, SequenceFile, RegexSerde, OpenCSV 및 AVRO를 비롯한 다양한 형식의 데이터를 쿼리할 수 있습니다. Amazon S3에서 파일 구조를 정의하려면 외부 스키마와 테이블을 생성합니다. 그런 다음 AWS Glue 또는 자체 Apache Hive 메타스토어와 같은 외부 데이터 카탈로그를 사용합니다. 데이터 카탈로그의 변경 사항은 Amazon Redshift 클러스터에서 즉시 사용할 수 있습니다.

데이터가 AWS Glue Data Catalog에 등록되고 AWS Lake Formation에서 사용할 수 있으면 Redshift Spectrum으로 데이터를 쿼리할 수 있습니다.

 

참조 문서:

https://docs.aws.amazon.com/ko_kr/redshift/latest/gsg/concepts-diagrams.html

 

Amazon Redshift 개념 및 데이터 처리 흐름 - Amazon Redshift

이 페이지에 작업이 필요하다는 점을 알려 주셔서 감사합니다. 실망시켜 드려 죄송합니다. 잠깐 시간을 내어 설명서를 향상시킬 수 있는 방법에 대해 말씀해 주십시오.

docs.aws.amazon.com

https://docs.aws.amazon.com/ko_kr/redshift/latest/dg/c-using-spectrum.html

 

Amazon Redshift Spectrum을 사용하여 외부 데이터 쿼리 - Amazon Redshift

이 페이지에 작업이 필요하다는 점을 알려 주셔서 감사합니다. 실망시켜 드려 죄송합니다. 잠깐 시간을 내어 설명서를 향상시킬 수 있는 방법에 대해 말씀해 주십시오.

docs.aws.amazon.com

https://docs.aws.amazon.com/ko_kr/redshift/latest/gsg/data-lake.html

 

데이터 레이크 쿼리 시작하기 - Amazon Redshift

데이터 레이크 쿼리 시작하기 Amazon Redshift Spectrum을 사용하여 데이터를 Amazon Redshift 테이블에 로드하지 않고도 Amazon S3 파일에서 데이터를 쿼리할 수 있습니다. Parquet, ORC, RCFile, TextFile, SequenceFile,

docs.aws.amazon.com

 

20220916

Amazon Redshift는 비즈니스에서 분석을 수행하고 고객 보고서를 생성하는 데 사용됩니다. 이 회사는 고객에 대한 추가 50테라바이트의 인구 통계 데이터를 얻었습니다. 데이터는 Amazon S3 에 csv확장자로 저장됩니다. 조직에는 데이터를 효율적으로 병합하고 결과를 시각화하는 시스템이 필요합니다.

솔루션 설계자는 이러한 요구 사항을 충족하기 위해 어떤 권장 사항을 제시해야 합니까?

S3에 csv 확장자로 데이터가 저장된다.

적합한 솔루션은 선택지 A "Amazon Redshift Spectrum을 사용하여 Amazon S3의 데이터를 직접 쿼리하고 해당 데이터를 Amazon Redshift의 기존 데이터와 결합합니다. Amazon QuickSight를 사용하여 시각화를 구축하십시오."

우선 Redshift가 무엇인지 알아보도록 하자.

Amazon Redshift란 무엇입니까?

Amazon Redshift 클러스터 관리 안내서입니다. Amazon Redshift는 클라우드에서 완벽하게 관리되는 페타바이트급 데이터 웨어하우스 서비스입니다. 작게는 수백 기가바이트부터 시작하여 페타바이트 이상까지 데이터를 확장할 수 있습니다. 이를 통해 데이터를 사용하여 비즈니스 및 고객에 대한 새로운 인사이트를 발굴하는 것도 가능합니다.

데이터 웨어하우스를 생성할 때는 먼저 Amazon Redshift 클러스터라는 노드 집합을 시작하는 것이 첫 번째 단계입니다. 클러스터 프로비저닝을 마치면 데이터 집합을 업로드하여 데이터 분석 쿼리를 실행할 수 있습니다. Amazon Redshift는 데이터 집합의 크기와 상관없이 오늘날 사용되는 것과 동일한 SQL 기반 도구 및 비즈니스 인텔리전스 애플리케이션을 사용하여 쿼리 성능을 가속화합니다.

Amazon Redshift Spectrum을 사용하여 데이터를 Amazon Redshift 테이블에 로드하지 않고도 Amazon S3 파일에서 데이터를 쿼리합니다. Amazon Redshift는 Amazon Redshift 클러스터와 Amazon S3 데이터 레이크 모두에 저장된 초대형 데이터 집합의 빠른 온라인 분석 처리(OLAP)를 위해 설계된 SQL 기능을 제공합니다.

Amazon Redshift Spectrum을 사용하면 데이터를 Amazon Redshift 테이블에 로드하지 않고도 Amazon S3의 파일에서 정형 및 비정형 데이터를 효율적으로 쿼리하고 가져올 수 있습니다. Redshift Spectrum 쿼리는 대량 병렬 처리를 채택해 큰 데이터 집합에 대해 매우 빠르게 실행됩니다. 대부분의 처리가 Redshift Spectrum 계층에서 이루어지며, 데이터가 대부분 Amazon S3에 그대로 남습니다. 또한 다수의 클러스터가 Amazon S3의 동일한 데이터 집합에 대해 동시에 쿼리를 실행할 수 있기 때문에 각 클러스터의 데이터를 일일이 복사할 필요가 없습니다.

Amazon Redshift Spectrum을 사용하여 데이터를 Amazon Redshift 테이블에 로드하지 않고도 Amazon S3 파일에서 데이터를 쿼리할 수 있습니다. Parquet, ORC, RCFile, TextFile, SequenceFile, RegexSerde, OpenCSV 및 AVRO를 비롯한 다양한 형식의 데이터를 쿼리할 수 있습니다. Amazon S3에서 파일 구조를 정의하려면 외부 스키마와 테이블을 생성합니다. 그런 다음 AWS Glue 또는 자체 Apache Hive 메타스토어와 같은 외부 데이터 카탈로그를 사용합니다. 데이터 카탈로그의 변경 사항은 Amazon Redshift 클러스터에서 즉시 사용할 수 있습니다.

데이터가 AWS Glue Data Catalog에 등록되고 AWS Lake Formation에서 사용할 수 있으면 Redshift Spectrum으로 데이터를 쿼리할 수 있습니다.

반응형

댓글