Batch: ✏️ 매일 정기 푸시 알림 배치 성능 개선 #137

psychology50 · 2024-07-24T12:55:03Z

작업 이유

모든 연구 내용은 블로그에 정리해두었습니다.

Batch 성능 평가 후, RepositoryItemReader의 Performance가 매우 느리다고 판단하여, 성능 개선

작업 사항

1️⃣ 성능 측정 지표

Common Case에 해당하던 Reader의 Perfomance을 94.59% 개선 (데이터 100,000개 기준)
데이터 천만 개 기준, 수행 시간 12min 소요

2️⃣ QueryDsl no offset 방식의 커스텀 ItemReader

이동욱님 포스트 읽어보시는 게 훨씬 도움이 됩니다.

위 코드는 Reader로 조회한 응답의 결과가 QEntity여야 한다는 전제가 필요함.
우리 서비스에선 값을 Dto에 매핑하여 결과를 가져와야 하므로, 생성자를 추가하여 해결

리뷰어가 중점적으로 확인해야 하는 부분

내용이 많이 어렵긴 하지만, 대부분 Batch 애플리케이션 내 작업이기 때문에 상세한 설명은 불필요하다고 생각해서 간략하게 PR을 적었습니다.
만약 궁금한 내용이 있다면 PR 커멘트나 디코로 말씀해주세요.

발견한 이슈

지금 당장 고려해야 할 만큼 중요한 이슈는 아니지만, 데이터 1억 개를 삽입하여 테스트 했을 시
초기 firstKey와 lastKey를 조회하는 쿼리가 심각한 성능 저하를 유발할 뿐만 아니라, 실행 시간이 너무 길어서 timeout이 나기도 함.

이는 QuerydslNoOffsetOptions 클래스 내부에서, Reader를 위한 쿼리를 기반으로 min, max를 사용해 key를 구하려 하기 때문이라 생각. (join을 한 후, user.id로 min, max를 하기 때문에 index를 사용하지 못해 fullscan이 되어버림)
따라서 firstKey, lastKey를 직접 할당하거나, key를 결정하기 위한 쿼리를 따로 제공할 수 있는 메서드를 추가하여 개선할 여지가 있음.

...batch/src/main/java/kr/co/pennyway/batch/common/reader/QuerydslNoOffsetPagingItemReader.java

pennyway-batch/src/main/java/kr/co/pennyway/batch/common/reader/QuerydslPagingItemReader.java

pennyway-batch/src/main/java/kr/co/pennyway/batch/common/reader/expression/Expression.java

pennyway-batch/src/main/java/kr/co/pennyway/batch/common/reader/expression/OrderExpression.java

pennyway-batch/src/main/java/kr/co/pennyway/batch/common/reader/expression/WhereExpression.java

...y-batch/src/main/java/kr/co/pennyway/batch/common/reader/expression/WhereNumberFunction.java

...y-batch/src/main/java/kr/co/pennyway/batch/common/reader/expression/WhereStringFunction.java

.../src/main/java/kr/co/pennyway/batch/common/reader/options/QuerydslNoOffsetNumberOptions.java

...-batch/src/main/java/kr/co/pennyway/batch/common/reader/options/QuerydslNoOffsetOptions.java

.../src/main/java/kr/co/pennyway/batch/common/reader/options/QuerydslNoOffsetStringOptions.java

pennyway-batch/src/main/java/kr/co/pennyway/batch/job/DailySpendingNotifyConfig.java

pennyway-batch/src/main/java/kr/co/pennyway/batch/reader/ActiveDeviceTokenReader.java

pennyway-batch/src/main/java/kr/co/pennyway/batch/writer/NotificationWriter.java

pennyway-batch/src/main/resources/application.yml

...ain/src/main/java/kr/co/pennyway/domain/domains/device/repository/DeviceTokenRepository.java

.../kr/co/pennyway/domain/domains/notification/repository/NotificationCustomRepositoryImpl.java

pennyway-domain/src/main/resources/application-domain.yml

pennyway-domain/src/test/java/kr/co/pennyway/domain/common/redisson/CouponDecreaseLockTest.java

psychology50 added 21 commits July 24, 2024 20:16

chore: application-domain.yml jdbc url query parameter 수정

29b5d26

style: step config 파일 삭제 -> job config에 통합

f0b3807

style: dto 패키지 경로 common 하위로 수정

63210fb

fix: notificaion batch insert ; 제거 && batch size 1000으로 수정

e498490

feat: where 함수형 인터페이스 정의

49d776d

feat: where expression 정의

8242af2

feat: order expression 상수 정의

1c2a624

feat: expression 상수 정의

cf75df2

feat: querydsl_no_offset_options 추상 클래스 정의

a590040

feat: no offset의 타입이 number인 경우를 위한 구현체 정의

6c9d1f8

rename: 정적 팩토리 메서드 주석에 주의 사항 추가

b57c76f

feat: no offset의 타입이 string인 경우를 위한 구현체 정의

12039aa

feat: querydsl_paging_item_reader 추가

3122d49

feat: querydsl_no_offset_paging_item_reader 정의

645c33b

fix: repository_item_reader -> querydsl_no_offset_paging_item_reader 변경

6d7d27e

fix: @job_scope 및 @step_scope 추가 && step reader 수정

ac30c60

fix: device_token_custom_repository 제거

93f122d

test: device_token_cutome_repository 테스트 제거

63b2685

style: device_token_owner 경로 domain -> batch로 수정

eddc6c8

test: redisson 테스트 ignore 처리

8cfa401

chore: batch application db connection pool 2개로 수정

5ac00d7

psychology50 added the refactoring 리팩토링 작업 label Jul 24, 2024

psychology50 requested review from jinlee1703 and asn6878 July 24, 2024 12:55

psychology50 self-assigned this Jul 24, 2024