[부하 테스트 - 배포환경] CPU 사용률 70% 테스트, 부하 분산을 위한 서버 확장의 필요성

jiyoon0000 2025. 2. 18. 11:13

테스트 개요

:이중 서버 환경에서 CPU 부하율 및 TPS 처리 검증

:서버 및 인프라 환경

항목	사양
로드밸런서 유형	Application Load Balancer(ALB)
로드밸런싱 방식	AWS ALB(라운드 로빈, HTTP/HTTPS 트래픽 분산)
ALB 타겟 그룹	EC2 인스턴스 2대(Spring Boot 기반 REST API)
DBMS	MySQL
서버 개수	2대(분산 부하 적용)
테스트 도구	Apache JMeter
테스트 방식	TPS 기반 부하 테스트

테스트 결과

*Test 1 : 100-10-1000

*Test 2 : 70 - 7 - 700

*Test 3 : 80 - 8 -800

TPS(초당 트랜잭션 수)
- TPS 는 테스트 설정 값에 따라 변화하지만, 대체로 180~200 TPS 수준에서 안정적으로 유지
- 요청 수가 다르더라도 동일한 비율의 데이터를 투입하면 그래프의 증가 패턴이 유사하다는 것을 볼 수 있음
CPU 사용률
- 부하 테스트를 진행하며 서버 2대의 CPU 사용률을 측정한 결과, 부하 초기에는 CPU 사용률이 급격히 증가하지만 이후 안정적인 범위로 유지
- CPU 사용률이 높아질수록 TPS도 증가하지만, 일정 수준 이상에서는 TPS 증가폭이 완화됨
TPS 안정화 구간
- 부하 테스트 초반에는 TPS가 급격히 상승하는 초기 부하 적응(워밍업) 구간이 존재
- 일정 시점 이후에는 TPS 변동이 줄어들며 180 ~ 200 TPS 범위 내에서 안정적인 상태 유지
- TPS 안정화까지 걸리는 시간은 약 30~60초 정도로, 이 후에는 일정 트랜잭션 처리 속도를 유지
- 서버 2대 운영 시, TPS가 안정화 된 후에도 CPU 사용률이 적절히 유지되며 트래픽을 감당 가능

결과 분석

Test 1 : 100 - 10- 1000
- 초기 CPU 100%까지 상승, 이후 안정화되었지만 데이터 처리가 완료되어 CPU 사용률이 점진적으로 하락
- TPS는 180 ~ 240 으로 유지되며, ALB를 통한 부하 분산이 정상적으로 작동하여 서버 2대가 동일한 수준으로 부하를 처리함
Test 2 : 70 - 7 - 700
- CPU 사용률이 서버당 50% ~ 60% 정도로 안정적인 상태 유지
- TPS는 약 150 ~ 210 으로 유지되며, 부하가 상대적으로 적은 환경에서도 일정 TPS 유지 가능
- 이중 서버 환경에서 가장 안정적인 부하 수준. (Warm Up)
Test 3 : 80 - 8 - 800
- CPU 사용률이 서버당 60% ~ 70% 정도로 유지되며, TPS는 160 ~ 230으로 유지
- 적절한 부하 분산을 유지하면서 TPS를 높일 수 있는 최적 설정 (Basic)

서버 1대 기준 예상 운영 가능 범위
- 현재 이중 서버 환경에서 평균 TPS 180 ~ 200 유지됨
- 단일 서버로 환산하면 평균 TPS 는 약 90 ~ 100 수준
- CPU 70% 유지 기준으로 서버 1대당 최대 100 ~ 120 TPS 까지 안정적으로 처리 가능
예상한 값을 넣어 테스트

예상 서버 확장 필요 조건
- 현재 설정에서 서버 2대 기준으로 200 TPS를 안정적으로 유지 가능
- 만약 TPS가 300 이상으로 증가할 경우, 서버 3대 이상 필요
- 500 TPS 이상에서는 Auto Sacling 환경이 필수적

결론 및 전략