본문 바로가기
[AWS]/AWS SAA EXAMTOPICS

[AWS][SAA][EXAMTOPICS] Question 249

by METAVERSE STORY 2022. 7. 5.
반응형

A business is presenting their application to the internet using an Application Load Balancer (ALB). The organization identifies out-of-the-ordinary traffic access patterns across the application. A solutions architect must increase visibility into the infrastructure in order to assist the business in comprehending these anomalies.

What is the MOST OPTIMAL option that satisfies these requirements?

  • A. Create a table in Amazon Athena for AWS CloudTrail logs. Create a query for the relevant information.
  • B. Enable ALB access logging to Amazon S3. Create a table in Amazon Athena, and query the logs.
  • C. Enable ALB access logging to Amazon S3. Open each file in a text editor, and search each line for the relevant information.
  • D. Use Amazon EMR on a dedicated Amazon EC2 instance to directly query the ALB to acquire traffic access log information.

 

한글 번역

기업은 ALB(Application Load Balancer)를 사용하여 인터넷에 애플리케이션을 제공하고 있습니다. 조직은 애플리케이션 전체에서 비정상적인 트래픽 액세스 패턴을 식별합니다. 솔루션 설계자는 비즈니스가 이러한 이상 현상을 이해하도록 지원하기 위해 인프라에 대한 가시성을 높여야 합니다.

이러한 요구 사항을 충족하는 가장 최적의 옵션은 무엇입니까?

  • A. Amazon Athena에서 AWS CloudTrail 로그용 테이블을 생성합니다. 관련 정보에 대한 쿼리를 생성합니다.
  • B. Amazon S3에 대한 ALB 액세스 로깅을 활성화합니다. Amazon Athena에서 테이블을 생성하고 로그를 쿼리합니다.
  • C. Amazon S3에 대한 ALB 액세스 로깅을 활성화합니다. 텍스트 편집기에서 각 파일을 열고 각 행에서 관련 정보를 검색하십시오.
  • D. 전용 Amazon EC2 인스턴스에서 Amazon EMR을 사용하여 ALB에 직접 쿼리하여 트래픽 액세스 로그 정보를 얻습니다.

 

 

 

정답

B. Enable ALB access logging to Amazon S3. Create a table in Amazon Athena, and query the logs

 

해설

비정상적인 트래픽 액세스 패턴을 분석하기 위해서는 S3에 ALB에 대한 액세스 로깅을 활성화를 시킨다. 그리고 Athena는 S3에 저장된 데이터를 간편하게 분석할 수 있는 대화식 쿼리 서비스이다. 서버리스 서비스이므로 관리하거나 설정할 인픅라가 없으며 데이터 분석을 즉시 시행할 수 있다.

Q: Amazon Athena란 무엇입니까?
Amazon Athena는 표준 SQL을 사용해 Amazon S3에 저장된 데이터를 간편하게 분석할 수 있는 대화식 쿼리 서비스입니다. Athena는 서버리스 서비스이므로 설정하거나 관리할 인프라가 없으며 데이터 분석을 즉시 시작할 수 있습니다. Athena로 데이터를 로드할 필요 없이 S3에 저장된 데이터를 직접 사용하면 됩니다. 시작하려면 Athena Management Console에 로그인하여 스키마를 정의한 후 쿼리를 시작하십시오. Amazon Athena는 표준 SQL을 완벽 지원하는 Presto를 사용하며, CSV, JSON, ORC, Apache Parquet, Avro 등 다양한 표준 데이터 형식과 호환됩니다. Amazon Athena는 대화형 분석에 적합하고 Amazon QuickSight와 통합되므로 시각화가 간편할 뿐 아니라 대규모 조인, 윈도 함수 및 배열 등 복잡한 분석을 처리할 수도 있습니다.

 

Athena를 사용하여 Amazon S3 서버 액세스 로그를 분석하려면 어떻게 해야 합니까?

최종 업데이트 날짜: 2021년 12월 17일

Amazon Athena에서 Amazon Simple Storage Service(Amazon S3) 서버 액세스를 쿼리하는 방법은 무엇입니까?

해결 방법

Amazon S3에서는 서버 액세스 로그를 S3 버킷에 객체로 저장합니다. Athena를 사용하여 서버 액세스 로그를 빠르게 분석하고 쿼리할 수 있습니다.

1.    아직 활성화하지 않은 경우 S3 버킷에 대한 서버 액세스 로깅을 활성화합니다. Target bucket(대상 버킷) Target prefix(대상 접두사)의 값을 기록해 둡니다. Athena 쿼리에서 Amazon S3 위치를 지정하려면 이 두 개의 값이 모두 필요합니다.

2.    Amazon Athena 콘솔을 엽니다.

3.    쿼리 편집기에서 DDL 문을 실행하여 다음 데이터베이스를 생성합니다.
       참고: S3 버킷과 동일한 AWS 리전에 데이터베이스를 생성하는 것이 가장 좋습니다.

create database s3_access_logs_db

4.    데이터베이스에 테이블 스키마를 생성합니다. 다음 예에서 STRING  BIGINT 데이터 형식 값은 액세스 로그 속성입니다. Athena에서 이 속성을 쿼리할 수 있습니다. [위치]에 1단계의 S3 버킷 및 접두사 경로를 입력합니다. 접두사 끝에 슬래시(/)를 포함해야 합니다(예: s3://doc-example-bucket/prefix/). 접두사를 사용하지 않는 경우 버킷 이름 끝에 슬래시(/)를 포함해야 합니다(예 s3://doc-example-bucket/).

CREATE EXTERNAL TABLE `s3_access_logs_db.mybucket_logs`(
  `bucketowner` STRING,
  `bucket_name` STRING,
  `requestdatetime` STRING,
  `remoteip` STRING,
  `requester` STRING,
  `requestid` STRING,
  `operation` STRING,
  `key` STRING,
  `request_uri` STRING,
  `httpstatus` STRING,
  `errorcode` STRING,
  `bytessent` BIGINT,
  `objectsize` BIGINT,
  `totaltime` STRING,
  `turnaroundtime` STRING,
  `referrer` STRING,
  `useragent` STRING,
  `versionid` STRING,
  `hostid` STRING,
  `sigv` STRING,
  `ciphersuite` STRING,
  `authtype` STRING,
  `endpoint` STRING,
  `tlsversion` STRING)
ROW FORMAT SERDE
  'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
  'input.regex'='([^ ]*) ([^ ]*) \\[(.*?)\\] ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) (\"[^\"]*\"|-) (-|[0-9]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) (\"[^\"]*\"|-) ([^ ]*)(?: ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*))?.*$')
STORED AS INPUTFORMAT
  'org.apache.hadoop.mapred.TextInputFormat'
OUTPUTFORMAT
  'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat'
LOCATION
  's3://awsexamplebucket1-logs/prefix/'

5.    왼쪽 창의 [테이블]에서 테이블 이름 옆에 있는 메뉴 버튼의 [테이블 미리 보기]를 선택합니다. [결과(Results)] 창에 서버 액세스 로그의 데이터(예: bucketowner, bucket  requestdatetime)가 보이면 Athena 테이블을 성공적으로 생성한 것입니다. 이제 Amazon S3 서버 액세스 로그를 쿼리할 수 있습니다.

쿼리의 예

삭제된 객체에 대한 요청을 찾으려면 다음 쿼리를 사용합니다.

SELECT * FROM s3_access_logs_db.mybucket_logs WHERE
key = 'images/picture.jpg' AND operation like '%DELETE%';

403 Access Denied 오류를 발생시킨 요청에 대해 Amazon S3 요청 ID를 표시하려면 다음 쿼리를 사용합니다.

SELECT requestdatetime, requester, operation, requestid, hostid FROM s3_access_logs_db.mybucket_logs
WHERE httpstatus = '403';

특정 기간(키 및 오류 코드 포함)의 HTTP 5xx 오류에 대한 Amazon S3 요청 ID를 찾으려면 다음 쿼리를 실행합니다.

SELECT requestdatetime, key, httpstatus, errorcode, requestid, hostid FROM s3_access_logs_db.mybucket_logs
WHERE httpstatus like '5%' AND
parse_datetime(requestdatetime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-09-18:07:00:00','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-09-18:08:00:00','yyyy-MM-dd:HH:mm:ss');

객체를 삭제한 사람과 시간(타임스탬프, IP 주소 및 AWS Identity and Access Management(IAM) 역할)을 표시하려면 다음 쿼리를 사용합니다.

SELECT requestdatetime, remoteip, requester, key FROM s3_access_logs_db.mybucket_logs WHERE
key = 'images/picture.jpg' AND operation like '%DELETE%';

IAM 역할이 실행한 모든 운영을 표시하려면 다음 쿼리를 사용합니다.

SELECT * FROM s3_access_logs_db.mybucket_logs WHERE
requester='arn:aws:iam::123456789123:user/user_name';

특정 기간에 객체에 수행한 모든 운영을 표시하려면 다음 쿼리를 사용합니다.

SELECT SUM(bytessent) as uploadtotal,
SUM(objectsize) as downloadtotal,
SUM(bytessent + objectsize) AS total FROM s3_access_logs_db.mybucket_logs
WHERE remoteIP='1.2.3.4' AND 
parse_datetime(requestdatetime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-07-01','yyyy-MM-dd')
AND parse_datetime('2021-08-01','yyyy-MM-dd');

특정 기간 동안 IP 주소를 통해 전송한 데이터의 양을 표시하려면 다음 쿼리를 사용합니다.

SELECT SUM(bytessent) as uploadtotal,
SUM(objectsize) as downloadtotal,
SUM(bytessent + objectsize) AS total FROM s3_access_logs_db.mybucket_logs
WHERE remoteIP='1.2.3.4' AND 
parse_datetime(requestdatetime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-07-01','yyyy-MM-dd')
AND parse_datetime('2021-08-01','yyyy-MM-dd');

특정 기간에 수명 주기 규칙에 따라 수행한 모든 만료 운영을 표시하려면 다음 쿼리를 사용합니다.

SELECT *
FROM s3_access_logs_db.mybucket_logs
WHERE operation = 'S3.EXPIRE.OBJECT' AND
parse_datetime(requestdatetime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-09-18:00:00:00','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-09-19:00:00:00','yyyy-MM-dd:HH:mm:ss');

특정 기간에 만료된 객체 수를 계산하려면 다음 쿼리를 사용합니다.

SELECT count(*) as ExpireCount
FROM s3_access_logs_db.mybucket_logs
WHERE operation = 'S3.EXPIRE.OBJECT' AND
parse_datetime(requestdatetime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-09-18:00:00:00','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-09-19:00:00:00','yyyy-MM-dd:HH:mm:ss');

특정 기간에 수명 주기 규칙에 따라 수행한 모든 전환 운영을 표시하려면 다음 쿼리를 사용합니다.

SELECT * FROM s3_access_logs_db.mybucket_logs
WHERE operation like 'S3.TRANSITION%' AND
parse_datetime(requestdatetime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-09-18:00:00:00','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-09-19:00:00:00','yyyy-MM-dd:HH:mm:ss');

서명 버전별로 그룹화된 모든 요청자를 표시하려면 다음 쿼리를 사용합니다.

SELECT requester, Sigv, Count(Sigv) as SigCount
FROM s3_access_logs_db.mybucket_logs
GROUP BY requester, Sigv;

특정 기간에 요청한 모든 익명 요청자를 표시하려면 다음 쿼리를 사용합니다.

SELECT Bucket, Requester, RemoteIP, Key, HTTPStatus, ErrorCode, RequestDateTime
FROM s3_access_logs_db.mybucket_logs
WHERE Requester IS NULL AND
parse_datetime(RequestDateTime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-07-01:00:42:42','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-07-02:00:42:42','yyyy-MM-dd:HH:mm:ss')

특정 기간에 PUT 객체 요청을 보낸 모든 요청자를 표시하려면 다음 쿼리를 사용합니다.

SELECT Bucket, Requester, RemoteIP, Key, HTTPStatus, ErrorCode, RequestDateTime
FROM s3_access_logs_db
WHERE Operation='REST.PUT.OBJECT' AND
parse_datetime(RequestDateTime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-07-01:00:42:42','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-07-02:00:42:42','yyyy-MM-dd:HH:mm:ss')

특정 기간에 GET 객체 요청을 보낸 모든 요청자를 표시하려면 다음 쿼리를 사용합니다.

SELECT Bucket, Requester, RemoteIP, Key, HTTPStatus, ErrorCode, RequestDateTime
FROM s3_access_logs_db
WHERE Operation='REST.GET.OBJECT' AND
parse_datetime(RequestDateTime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-07-01:00:42:42','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-07-02:00:42:42','yyyy-MM-dd:HH:mm:ss')

특정 기간에 요청한 모든 익명 요청자를 표시하려면 다음 쿼리를 사용합니다.

SELECT Bucket, Requester, RemoteIP, Key, HTTPStatus, ErrorCode, RequestDateTime
FROM s3_access_logs_db.mybucket_logs
WHERE Requester IS NULL AND
parse_datetime(RequestDateTime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-07-01:00:42:42','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-07-02:00:42:42','yyyy-MM-dd:HH:mm:ss')

모든 요청자를 표시하려면 (특정 기간의 가장 높은 처리 시간을 기준으로 정렬됨) 다음 쿼리를 사용합니다.

SELECT * FROM s3_access_logs_db.mybucket_logs
NOT turnaroundtime='-' AND
parse_datetime(requestdatetime,'dd/MMM/yyyy:HH:mm:ss Z')
BETWEEN parse_datetime('2021-09-18:00:00:00','yyyy-MM-dd:HH:mm:ss')
AND
parse_datetime('2021-09-19:00:00:00','yyyy-MM-dd:HH:mm:ss')
ORDER BY CAST(turnaroundtime AS INT) DESC;

서버 액세스 로그 버킷의 수명 주기 정책을 생성하는 것이 가장 좋습니다. 주기적으로 로그 파일을 제거하도록 수명 주기 정책을 구성하십시오. 그러면 Athena에서 쿼리마다 분석하는 데이터의 양이 줄어듭니다.

 

참조 문서

https://aws.amazon.com/ko/athena/faqs/?nc=sn&loc=6 

 

Amazon Athena FAQ - 서버리스 대화식 쿼리 서비스 - Amazon Web Services

 

aws.amazon.com

https://aws.amazon.com/ko/premiumsupport/knowledge-center/analyze-logs-athena/

 

Athena를 사용하여 Amazon S3 서버 액세스 로그 분석하기

4.    데이터베이스에 테이블 스키마를 생성합니다. 다음 예에서 STRING 및 BIGINT 데이터 형식 값은 액세스 로그 속성입니다. Athena에서 이 속성을 쿼리할 수 있습니다. [위치]에 1단계의 S3 버킷 및

aws.amazon.com

 

반응형

댓글