본문 바로가기
SRE/Methods

[SRE] USE / RED Method

by dev_ss 2024. 3. 30.

시스템을 구축하고 운영하는 데 있어 성능과 장애를 모니터링하는 것은 중요한 부분이지만 어떠한 기준을 가지고 성능을 측정하고 수치화할 수 있는지에 대하여는 다른 이야기이다.

 

그러한 부분에서 모니터링의 성능 측정에 대한 다양한 방법론이 제기되었다.

 

해당 글에서는 이 중 대표적으로 많이 이용되는 USE 방법론과 RED 방법론에 대하여 알아볼 것이다.

 

 


1. USE Method

 

USE 방법론은 Brendan Gregg가 고안한 방법론으로, 시스템에 중점을 둔 체크리스트를 구성하여 리소스의 병목 현상이나 오류를 신속하게 식별하여 서버를 분석하는 방법이다.

 

 

https://www.brendangregg.com/usemethod.html

 

The USE Method

The USE Method Boeing 707 Emergency Checklist(1969) The Utilization Saturation and Errors (USE) Method is a methodology for analyzing the performance of any system. It directs the construction of a checklist, which for server analysis can be used for quick

www.brendangregg.com

 

 

다음은 USE Method에서 이용되는 일반적인 리소스의 목록이다.

 

  • CPU
  • Memory
  • Network interfaces
  • Storage devices(I/O, capacity)
  • Controllers(storage, network cards)
  • Interconnects: CPUs, memory, I/O

 

 

USE란 아래 3가지 메트릭을 의미하고, 각 리소스에 대한 메트릭을 측정한다.

 

1. Utilization(활용도) : 리소스가 작업을 바쁘게 처리하는데 걸린 평균 시간(백분율)

 - ex) CPU가 90%의 활용도로 실행 중

 

2. Saturation(포화도) : 리소스가 부하로 인하여 처리할 수 없는 작업의 양

 - ex) CPU의 평균 대기열의 길이는 4(대기열)

 

3. Errors(에러) : 오류가 발생한 이벤트의 수

 - ex) 네트워크 인터페이스에서 50번의 지연 충돌이 발생

 

 

 

Brendan Gregg는 USE 방법론이 5%의 적은 노력으로 약 80%의 서버 문제를 해결이 가능하다고 언급하며, 서버가 아닌 다른 시스템에서 적용도 가능함과 동시에, 다른 방법론과 결합하여 다양한 문제를 해결할 수 있을 것이라 얘기했다.

 

 

 


2. RED Method

 

Grafana Labs의 Tom Wilkie는 기존의 USE 방법론에 여러 의문이 생겼다.

 

USE 방법론의 중심적인 메트릭이 실제 운영 중인 서비스의 성능이 아닌, 서버와 같은 기계부품들의 성능이라는 것이었다.

 

그에 따라, Tom Wilkie는 최근 많은 기업에서 도입한 마이크로 서비스 아키텍처에 적합한 철학을 고수하여, RED 방법론을 고안하였다.

 

https://grafana.com/blog/2018/08/02/the-red-method-how-to-instrument-your-services/

 

The RED Method: How to Instrument Your Services | Grafana Labs

Anjana Fernando   ·   12 Jul 2018   ·   6 min read Learn how to create a beautiful and elegant dashboard in Grafana for Ballerina metrics without any...

grafana.com

 

 

RED란 아래 3가지를 의미하고, 각 마이크로 서비스가 수신하는 요청에 대한 성능을 측정한다.

 

 

1. Rate(처리율) : 초당 처리하는 요청의 수

 

 

2. Errors(에러) : 요청에 대한 실패의 수

 

 

3. Duration(처리시간) : 요청의 처리에 걸리는 시간

 

 

USE 방법론과 다르게 특정 서비스에 가해지는 요청이 중심이 되어 성능을 측정한다.

이는, 고객 중심의 사용자 경험을 증진시키기 위함에 있어 중요한 지표가 될 수 있다고 Tom Wilkie는 얘기했다.

 

 


3. 결론

 

위 방법론에 대하여 정리를 하자면, 어떤 방법론이 옳고 틀린 것이 아닌, 여러 방법론을 조합하여 현재와 미래에 발생할 문제들을 해결해야 하는 것이 가장 중요한 포인트다.

 

 

각 방법론은 지향하고자 하는 관점이 다르다.

 

USE 방법론기계(서버 등)적 관점의 성능에 집중하고 있고,

RED 방법론서비스 단위의 성능에 집중하고 있다.

 

 

이 두 가지는 얼핏 다르게 보일 수 있으나, 사용자의 만족도를 높이기 위한 공통적인 목표를 가지고 있기 때문에, 상호 보완적으로 사용하는 것을 모범 사례로 많이 찾아볼 수 있다.

 

 

 

 

 

 

반응형

'SRE > Methods' 카테고리의 다른 글

[SRE] Four Golden Signals  (0) 2024.04.23