본문 바로가기
[AWS]/AWS SAA EXAMTOPICS

[AWS][SAA][EXAMTOPICS] Question 70 (확인)

by METAVERSE STORY 2022. 9. 16.
반응형

Each month, a business keeps 200 GB of data on Amazon S3. At the conclusion of each month, the corporation must analyze this data to calculate the number of things sold in each sales area during the preceding month.

Which analytics approach is the MOST cost-effective option for the business?

  • A. Create an Amazon Elasticsearch Service (Amazon ES) cluster. Query the data in Amazon ES. Visualize the data by using Kibana.
  • B. Create a table in the AWS Glue Data Catalog. Query the data in Amazon S3 by using Amazon Athena. Visualize the data in Amazon QuickSight.
  • C. Create an Amazon EMR cluster. Query the data by using Amazon EMR, and store the results in Amazon S3. Visualize the data in Amazon QuickSight.
  • D. Create an Amazon Redshift cluster. Query the data in Amazon Redshift, and upload the results to Amazon S3. Visualize the data in Amazon QuickSight.

 

한글번역

매달 기업은 Amazon S3에 200GB의 데이터를 보관합니다. 매월 말에 회사는 이 데이터를 분석하여 전월 동안 각 판매 영역에서 판매된 물건 수를 계산해야 합니다.

비즈니스에 가장 비용 효율적인 옵션은 어떤 분석 접근 방식입니까?

  • A. Amazon Elasticsearch Service(Amazon ES) 클러스터를 생성합니다. Amazon ES에서 데이터를 쿼리합니다. Kibana를 사용하여 데이터를 시각화합니다.
  • B. AWS Glue 데이터 카탈로그에 테이블을 생성합니다. Amazon Athena를 사용하여 Amazon S3의 데이터를 쿼리합니다. Amazon QuickSight에서 데이터를 시각화합니다.
  • C. Amazon EMR 클러스터를 생성합니다. Amazon EMR을 사용하여 데이터를 쿼리하고 결과를 Amazon S3에 저장합니다. Amazon QuickSight에서 데이터를 시각화합니다.
  • D. Amazon Redshift 클러스터를 생성합니다. Amazon Redshift에서 데이터를 쿼리하고 결과를 Amazon S3에 업로드합니다. Amazon QuickSight에서 데이터를 시각화합니다.

 

 

 

정답

  • B. Create a table in the AWS Glue Data Catalog. Query the data in Amazon S3 by using Amazon Athena. Visualize the data in Amazon QuickSight.

 

해설

AWS Glue는 분석, 기계 학습 및 애플리케이션 개발을 위해 데이터를 쉽게 탐색, 준비, 그리고 조합할 수 있도록 지원하는 서버리스 데이터 통합 서비스입니다. AWS Glue에서는 데이터 통합에 필요한 모든 기능을 제공하므로, 몇 개월이 아니라 몇 분 안에 데이터 분석을 시작하고 해당 내용을 활용할 수 있습니다.

데이터 통합은 분석, 기계 학습 및 애플리케이션 개발을 위해 데이터를 준비하고 결합하는 프로세스입니다. 이 작업은 다양한 소스에서 데이터 검색 및 추출, 데이터 강화, 정리, 정규화 및 결합, 데이터베이스, 데이터 웨어하우스 및 데이터 호수에 데이터 로드 및 구성 등의 여러 작업을 포함합니다. 이러한 작업은 종종 각자 다른 제품을 사용하는 다른 유형의 사용자가 취급합니다.

AWS Glue는 데이터 통합을 쉽게 준비할 수 있도록 시각적 인터페이스와 코드 기반 인터페이스를 모두 제공합니다. 사용자는 AWS Glue 데이터 카탈로그를 사용하여 데이터를 쉽게 찾고 액세스할 수 있습니다. 데이터 엔지니어와 ETL (추출, 변형 및 로드) 개발자는 AWS Glue Studio에서 몇 번의 클릭으로 ETL 워크플로를 시각적으로 생성, 실행 및 모니터링할 수 있습니다. 데이터 분석가와 데이터 사이언티스트는 AWS Glue DataBrew를 사용하여 코드를 작성하지 않고도 데이터를 시각적으로 정리하고 정규화할 수 있습니다. AWS Glue Elastic Views를 통해 애플리케이션 개발자는 익숙한 Structured Query Language (SQL)를 사용하여 다른 데이터 저장소 간의 데이터를 조합 및 복제할 수 있습니다.

 

통합 카탈로그를 생성하여 다양한 데이터 저장소에서 데이터를 찾으십시오.

AWS Glue 데이터 카탈로그를 사용하면 데이터를 이동하지 않고도 여러 AWS 데이터 세트 전체에서 신속하게 데이터를 검색할 수 있습니다. 일단 데이터가 카탈로그에 저장되면 Amazon Athena, Amazon EMR 및 Amazon Redshift Spectrum에서 즉시 검색 및 쿼리에 데이터를 사용할 수 있습니다.

 

AWS Glue, Amazon Athena 및 Amazon QuickSight를 사용하여 다양한 공급자의 데이터 조화, 쿼리 및 시각화

가치와 통찰력을 이끌어내기 위해 함께 분석해야 하는 다양한 형식의 다양한 데이터 소스에 직면한 적이 있습니까? 데이터 소스나 원본 형식에 관계없이 모든 데이터를 하나의 표준 데이터 세트로 쿼리, 분석, 처리 및 시각화할 수 있어야 합니다.

이 게시물에서는 AWS Glue 를 사용하여 Amazon S3 에서 세 가지 다른 데이터 세트 및 형식 으로 쿼리 최적화된 정식 데이터 세트를 생성하는 방법을 안내합니다. 그런 다음 Amazon Athena  Amazon QuickSight 를 사용하여 해당 데이터에 대해 빠르고 쉽게 쿼리합니다.

 

 

참조 문서

https://aws.amazon.com/ko/glue/?whats-new-cards.sort-by=item.additionalFields.postDateTime&whats-new-cards.sort-order=desc 

 

AWS Glue | 서버리스 데이터 통합 서비스 | Amazon Web Services

AWS Glue는 새 데이터가 도착하면 ETL 작업을 실행할 수 있습니다. 예를 들어 AWS Lambda 함수를 통해 ETL 작업을 트리거하여 Amazon S3에 새로운 데이터가 저장되는 대로 ETL 작업이 실행되도록 할 수 있습

aws.amazon.com

 

https://aws.amazon.com/ko/blogs/big-data/harmonize-query-and-visualize-data-from-various-providers-using-aws-glue-amazon-athena-and-amazon-quicksight/

 

Harmonize, Query, and Visualize Data from Various Providers using AWS Glue, Amazon Athena, and Amazon QuickSight | Amazon Web Se

Have you ever been faced with many different data sources in different formats that need to be analyzed together to drive value and insights?  You need to be able to query, analyze, process, and visualize all your data as one canonical dataset, regardless

aws.amazon.com

 

20220916

매달 기업은 Amazon S3에 200GB의 데이터를 보관합니다. 매월 말에 회사는 이 데이터를 분석하여 전월 동안 각 판매 영역에서 판매된 물건 수를 계산해야 합니다.

비즈니스에 가장 비용 효율적인 옵션은 어떤 분석 접근 방식입니까?

적합한 솔루션은 선택지 B "AWS Glue 데이터 카탈로그에 테이블을 생성합니다. Amazon Athena를 사용하여 Amazon S3의 데이터를 쿼리합니다. Amazon QuickSight에서 데이터를 시각화합니다." 

AWS Glue가 무엇인지를 먼저 살펴 보도록 하자.

AWS Glue는 분석, 기계 학습 및 애플리케이션 개발을 위해 데이터를 쉽게 탐색, 준비, 그리고 조합할 수 있도록 지원하는 서버리스 데이터 통합 서비스이다. AWS Glue에서는 데이터 통합에 필요한 모든 기능을 제공하므로, 몇 개월이 아니라 몇 분 안에 데이터 분석을 시작하고 해당 내용을 활욜할 수 있다.

AWS Glue, Amazon Athena 및 Amazon QuickSight를 사용하여 다양한 공급자의 데이터 조화, 쿼리 및 시각화

가치와 통찰력을 이끌어내기 위해 함께 분석해야 하는 다양한 형식의 다양한 데이터 소스에 직면한 적이 있습니까? 데이터 소스나 원본 형식에 관계없이 모든 데이터를 하나의 표준 데이터 세트로 쿼리, 분석, 처리 및 시각화할 수 있어야 합니다.

이 게시물에서는 AWS Glue 를 사용하여 Amazon S3 에서 세 가지 다른 데이터 세트 및 형식 으로 쿼리 최적화된 정식 데이터 세트를 생성하는 방법을 안내합니다. 그런 다음 Amazon Athena  Amazon QuickSight 를 사용하여 해당 데이터에 대해 빠르고 쉽게 쿼리합니다.

 

 

반응형

댓글