본문 바로가기

Home > 열린마당 > 공개SW 소식

공개SW 소식

'eBPF부터 오픈소스까지' 2022년 '관찰가능성' 주요 트렌드 5가지

support1 게시글 작성 시각 2022-02-07 14:16:38 게시글 조회수 3737

2022.2.7

ⓒDotan Horovits | InfoWorld

 

관찰가능성(observability)의 중요성이 점점 더 커지고 있다. 메트릭스(metrics), 로그(log), 트레이스(trace)를 이용해 기업 환경 내 문제를 탐지, 진단, 구분하는 데 필수적이기 때문이다. 그런데 변화의 속도가 빠른 IT 분야 특성상 관찰가능성 역시 그 개념과 구현 방법 측면에서 빠르게 진화하고 있다.

과거에 관찰가능성은 본질적으로 데이터 애널리틱스 문제였다. 관찰가능성이란 IT 시스템의 외부 출력이라는 공식적인 정의가 있기는 하지만, 실제로는 다소 폭넓은 “사람이 시스템에 관해 질문하고 대답할 수 있는 능력”으로 보는 것이 더 정확하다. 후자의 정의는 관찰가능성을 (나중에 끼워 넣는 것이 아니라) 시스템 설계에 일부로 포함시켜야 할 당위성을 부여하고, 관찰가능성을 실현하려면 엔지니어와 시스템 관리자가 애널리틱스 사고방식을 적용해야 할 필요성을 강조한다는 점에서 더 적확하기도 하다.
올해는 많은 기업이 텔레메트리 데이터 사용의 심화 및 다변화에 나서는 한편 툴링을 통합해 관찰가능성 수준을 높이려 할 것으로 보인다. eBPF, 오픈텔레메트리(OpenTelemetry)같은 기술 덕분에 진입 장벽이 낮아지고, 성숙해진 데이터 애널리틱스를 활용해 IT팀과 데브옵스팀이 더 빠르고 효과적으로 문제를 파악해 대응할 수 있게 될 것이다.
 

분산 트레이싱 도입 확대

 

그동안 많은 IT 및 비즈니스 리더가 분산 트레이싱의 잠재력이 얼마나 큰지 깨닫지 못했고, 결과적으로 관찰가능성 최적화를 추진할 큰 기회를 놓쳤다. 그러나 올해는 분산 트레이싱 채택이 늘어날 가능성이 크다. 워크로드를 클라우드 네이티브 아키텍처와 마이크로서비스 아키텍처로 옮기는 기업이 늘어남에 따라 분산 트레이싱은 오류 발생 지점과 성능 부진 원인을 정확히 찾아내는 보편적인 수단으로 자리 잡을 것이다.
최근 실시한 ‘데브옵스 펄스(DevOps Pulse) 설문조사’ 결과를 보면, 기업 내 트레이싱 사용이 전년 대비 38% 늘어났다. 아직 트레이싱을 사용하지 않는다는 응답자 중 64%가 향후 2년 이내에 트레이싱을 시행할 계획이라고 답했다.
분산 트레이싱을 시행하면 개발자 경험, 비즈니스, 핀옵스(FinOps) 등 다양한 분야에서 IT 모니터링 이외에 수많은 프로세스에서 완전히 새로운 관찰가능성을 확보할 수 있다. 분산 트레이싱은 요청 실행 시 맥락 전파 기법을 갖춘 애플리케이션에 의존한다. 맥락 전파 기법은 자원 귀속 추적이나 제품 라인 별 또는 고객 계정 별 용량 계획 정보와 같은 다른 많은 프로세스에 쉽게 사용할 수 있다.
분산 트레이싱은 데이터 개인정보보호 준수에도 매우 유용하다. 유럽연합 일반 개인정보보호규정(GDPR), 캘리포니아 소비자개인정보보호법(CCPA) 등의 준수 규정을 감안할 때 데이터 개인정보보호는 기업 활동에 필수적이다. 하지만 현실에서는 저수준 스토리지 때문에 사용자 맥락을 인지하지 못할 때가 많다. 이때 분산 트레이싱을 사용하면 사용자 ID를 다운스트림 계층에서 데이터 스토리지 계층으로 전파해 주기 때문에 기업이 데이터 개인정보보호 정책을 실행하는 데 도움이 된다.
 

관찰가능성 ‘3대 요소’를 초월하려는 움직임

 

관찰가능성 논의의 시작과 끝은 소위 관찰가능성의 '3대 요소'로 불리는 메트릭스, 로그, 트레이스다. 메트릭스는 문제 탐지를 돕고 데브옵스 또는 SRE(사이트 신뢰성 엔지니어)가 무슨 일이 일어났는지 파악할 수 있도록 한다. 로그는 '무슨 일' 다음에 '왜'를 알려줌으로써 문제 진단을 돕는다. 마지막으로, 트레이스를 이용하면 분산 요청과 정교한 마이크로서비스 그래프 내부에 문제가 발생한 지점을 표시해 엔지니어가 문제를 정확히 찾아내 구분할 수 있다.
이 3대 요소는 앞으로도 대단히 중요하겠지만, 이 패러다임에 갇히지 말고 기업의 필요에 맞는 텔레메트리 데이터를 선택하는 것이 더 중요하다. 올해는 이벤트와 연속 프로파일링을 비롯한 다양한 관찰가능성 신호를 적극 수용하는 기업이 늘어날 것으로 보인다.
또한, '3대 요소'는 물론 다른 텔레메트리 신호도 그저 미가공 데이터일 뿐임을 명심하는 것도 중요하다. 관찰가능성은 데이터 애널리틱스 문제에 더 가깝다. 따라서, 핵심은 그 미가공 데이터에서 인사이트를 추출하는 것이며 이는 어떤 면에서 BI 애널리스트의 작업과 비슷하다.
관찰가능성 열혈 지지자인 폴라 시그널즈(Polar Signals) 창립자 프레데릭 브랜츠크는 오늘날 기업 간 관찰 격차에 대해 "많은 기업이 수치화가 잘 돼 있고 분산 트레이싱과 구조화된 로깅을 갖춘 애플리케이션이 있는 것으로 착각한다. 그러나 일반적인 스타트업을 보면 모니터링조차 하지 않고 있는 것이 현실이다. 뭔가 잘못됐다고 고객이 지적하면 그제서야 조사에 나선다"라고 말했다.
 

eBPF의 기세 확장

 

eBPF(Extended Berkeley Packet Filter)는 커널 소스 코드를 바꾸거나 추가 모듈을 추가할 필요 없이 프로그램을 운영체제의 커널 공간에서 실행하는 기술이다. 현재, 관찰가능성은 주로 수동으로 실행한다. 텔레메트리 데이터를 생성하려면 적정 지점에 코드를 추가해야 하므로 심각한 장벽이 되는 경우가 많고, 어떤 기업은 아예 시도조차 할 수 없다. 자동 에이전트가 존재하기는 하지만 특정 프로그래밍 언어와 프레임워크에 맞춰지는 경향이 있다.
반면, eBPF를 활용하면 바로 OS 커널 수준부터 전체 소프트웨어 스택에 걸쳐 노코드 관찰가능성을 구현할 수 있다. 쿠버네티스(Kubernetes) 환경 내에 관찰가능성이 수월해지고 네트워킹 및 보안 부분에도 장점이 생긴다.
eBPF는 다양한 종류의 트래픽에 걸쳐 작동하므로 통합 관찰가능성이라는 기업의 목표를 달성하는 데 큰 도움이 된다. 예를 들어, 데브옵스 엔지니어는 전체 트레이스 요청, 데이터베이스 질의, HTTP 요청, gRPC 스트림 수집은 물론 CPU 사용량이나 전송 바이트 수와 같은 자원 활용 지표(메트릭스) 수집에도 eBPF를 활용할 수 있다. 따라서 해당 기업은 관련 통계를 산출하고 데이터의 개요를 파악해 다양한 기능의 자원 소모 현황을 이해할 수 있다. 또한, eBPF는 암호화된 트래픽을 처리할 수 있다.
넷플릭스에서 최근 게시한 블로그를 보면, eBPF를 활용해 네트워크 인사이트를 얻는 방식을 알 수 있다. 넷플릭스에 따르면 eBPF는 어느 인스턴스에서든 CPU와 메모리 소비가 1퍼센트 미만일 정도로 사용 효율성이 매우 높다.
 

고립된 툴의 통일

 

관찰가능성이 성숙해지면 기업은 점점 더 총체적인 관찰가능성 플랫폼을 모색하게 된다. 이러한 통합 솔루션을 과거에 사용했던 고립된 툴보다 선호하는 것이다. 독립형 관찰가능성 툴에 비해 더 총체적인 이들 플랫폼을 활용하는 개발자, 데브옵스, SRE는 다양한 텔레메트리 신호 종류와 소스 전체에 걸쳐 질의, 시각화, 상호 연결을 더욱 효과적으로 해결할 수 있다.

(후략)

 

[원문 기사 :https://www.itworld.co.kr/news/223914]

 

본 내용은 한국아이디지() (https://www.idg.co.kr/)의 저작권 동의에 의해 공유되고 있습니다.

Copyright 2020 International Data Group. 무단전재 및 재배포 금지.

 
맨 위로
맨 위로