MySQL InnoDB에서 데이터 1건 변경 시에도 테이블 잠금 현상이 발생할 수 있다!!

Overview

MySQL 트랜잭션 Isolation Level로 인한 장애 사전 예방 법” 포스팅에서 관련 주제를 다룬 적이 있습니다. InnoDB에서 Create Table .. As Select .. 과 같이 사용하는 경우 테이블 잠금이 발생할 수 있는 상황과 회피할 수 있는 팁이었죠.

테이블 Full-Scan 구문이 실행 시 발생할 수 있는 문제에 관한 것입니다. 하지만 때로는 변경 대상이 1 건이라도 쿼리 타입에 따라 테이블 잠금 같은 현항이 발생할 수도 있습니다.

이번 포스팅에서는 이에 관해 정리해보도록 하겠습니다. ^^

Symptoms

다음과 같이 “NOT IN” 과 같이 부정적인 의미의 조건 구문을 사용 시 테이블 잠금 현상이 발생할 수 있습니다. NOT IN 결과 값이 1건일지로도요..

update test set col1 = 0
where col1 not in (0, 1);

이 경우 Read Committed 로 트랜잭션 Isolation Level을 설정해도 인덱스 칼럼 유무에 따라 테이블 잠금 현상이 발생하기도 하죠. 물론 Repeatable Read보다는 경우의 수가 크지는 않습니다.

현재 트랜잭션 Isolation Level은 다음과 같이 확인 할 수 있습니다.

mysql> show variables like 'tx_isolation';
+---------------+-----------------+
| Variable_name | Value           |
+---------------+-----------------+
| tx_isolation  | REPEATABLE-READ |
+---------------+-----------------+
1 row in set (0.00 sec)

Prepare Test

1) 테스트 환경 구성

## 테이블 생성
create table test(
  i int unsigned not null auto_increment,
  j int unsigned not null,
  k int unsigned not null,
  l int unsigned not null,
  primary key(i)
) engine = innodb;

## 타겟 칼럼과 관계 없는 인덱스 생성
alter table test add key(l);

타겟 칼럼에 인덱스를 추가하는 경우 다음과 같이 수행합니다.

## 타겟 칼럼에 인덱스 생성
alter table test add key(j);

2) 데이터 생성

빠른 데이터 생성을 위해 아래와 같이 Insert Into .. Select.. 구문을 사용합니다.

## 데이터 1 건 생성
insert into test (j, k, l)
values
(
    crc32(rand()) mod 2,
    crc32(rand()) mod 2,
    crc32(rand()) mod 2
);

## 하단 쿼리 17건 실행
insert into test (j, k, l)
select
    crc32(rand()) mod 2,
    crc32(rand()) mod 2,
    crc32(rand()) mod 2
from test;

3) 타겟 데이터 설정

타겟 데이터와 무관한 데이터를 구분하기 위해 i 값을 10000 이상인 데이터에 한에서 랜덤하게 업데이트 수행합니다.

## 타겟 칼럼1
update test set j = 99
where i > 10000
order by rand()
limit 1000;

## 비 타겟 칼럼1 - 인덱스 없음
update test set k = 99
where i > 10000
order by rand()
limit 1000;

## 비 타겟 칼럼2 - 인덱스 있음
update test set l = 99
where i > 10000
order by rand()
limit 1000;

Test Scenario

테스트는 Transaction Isolation Level(Repeatable Read, Read Committed), 인덱스 칼럼 여부, 데이터 칼럼 접근 방식(PK, Index, Full-Scan) 그리고 쿼리 타입(“in”, “not in”)을 구분하여 각각 테스트하였습니다.

원활한 테스트를 위해 모든 세션에 자동 커밋 DISABLE 설정합니다.

SET SESSION AUTOCOMMIT = 0;

Transaction Isolation 레벨은 테스트 상황에 맞게 다음과 같이 설정합니다.

## REPEATABLE READ 인 경우 테스트 환경
SET SESSION TRANSACTION ISOLATION LEVEL REPEATABLE READ;

## READ COMMITTED 인 경우 테스트 환경
SET SESSION TRANSACTION ISOLATION LEVEL READ COMMITTED;

세션1

변경 대상 데이터는 i 값이 10,000보다 큰 행입니다. 하단 결과 테이블에 있는 쿼리를 질의문으로 수행한 상태에서 세션2 쿼리를 실행합니다.

세션2

i 값이 10,000 이하인 데이터 타겟 데이터과 관계없는 데이터를 업데이트 수행합니다.

update test set j = 1 where i = 1;

Test Result

테스트 결과를 캡쳐해서 알아보기는 힘들지만, 다양한 케이스를 테스트하여 정리합니다. ^^

1) “NOT IN” 테스트

  • Repeatable Read : Not In  사용 시 모든 경우 Lock 발생
  • Read Committed : 인덱스(PK 포함)를 사용하여 접근 시 Lock 발생

not in result

2) “IN” 테스트

  • Repeatable Read : 풀스캔 시 Lock 발생, 인덱스(PK포함) 접근 시 Lock 발생 안함
  • Read Committed : 풀스캔, 인덱스 스캔 모두 Lock 발생 안함

in test result

Solutions

1) Transaction Isolation Level 변경 & IN 구문 사용

Transaction Isolation Level을 Read Committed로 변경하고, IN 구문을 사용하도록 합니다. Not In 사용이 반드시 필요하다면 Limit 구문을 통해 한번에 많은 데이터 변경 작업이 일어나지 않도록 유도합니다.

2) Select 후 결과 값으로 데이터 접근

NOT IN 구문이 필요하다면, Select 구문으로 따로 구분하고 그 결과 값으로 데이터를 다시 업데이트합니다.  MySQL의 Repeatable Read에서는 스냅샷 형태로 Select 데이터 일관성을 보장하며, 데이터 업데이트와 무관한 Select 결과 값에는 다른 세션에서 데이터 변경 작업이 가능합니다.

Statement stmt = con.createStatement();
ResultSet rs = stmt.executeQuery(
                   "select i from test where j not in (0, 1)"
               );
int i = 0;
String inStr = "";
while(rs.next()){
    inStr += ((i++) > 0 ? "," : "") + rs.getInt(1);
}
rs.close();
stmt.executeUpdate(
    "update i set j = 0 where i in (" + inStr + ")"
);

Conclusion

복잡한 위의 결과를 간단하게 정리하면 다음과 같습니다.

  1. 트랜잭션 Isolation Level이 Read Committed더라도 NOT IN 과 같은 부정적인 조건 질의 시 인덱스 칼럼으로 데이터에 접근하는 상황에서는 Lock이 발생합니다.
  2. 트랜잭션 Isolation Level이 Read Committed인 상태에서 IN 구문과 같은 긍정적인 조건 질의 시에는 연관없는 데이터에는 Lock을 걸지 않습니다.
  3. 트랜잭션 Isolation Level이 Repeatable Read인 경우 NOT IN 사용 시 무조건 테이블 Lock 현상이 발생합니다.
  4. 트랜잭션 Isolation Level이 Repeatable Read인 상태에서 IN 구문을 사용하는 경우에는  인덱스 칼럼으로 접근 시에는 Lock 현상이 발생하지 않습니다.

가장 안정적으로 Lock을 피하기 위해서는 트랜잭션 Isolation Level을 Read Committed로 설정하고, 긍적적인 조건만 주는 경우입니다.

물론 인덱스가 있는 상황이라면, 부정적인 조건 사용 시에도 데이터 접근이 빠르므로, 변경 대상 데이터가 많거나 트랜잭션이 오래 유지되지 않는 한 큰 문제는 없습니다. ^^

단, Read Committed로 변경 시 Binary Log 포멧이 자동으로 ROW 형태로 변경되기 때문에, Binary Log 파일이 급격하게 늘어날 수 있는 경우가 발생할 수 있으니, 내부 검토가 반드시 필요합니다.

사용할수록 나날이 새로운 사실이 발견되는 MySQL이네요.

감사합니다.

서비스 로직 흐름을 변경하여 DB 튜닝을 해보자!

Overview

오래전 메가존(현 혜택존) 서비스를 담당하던 시기, 포인트 관련된 부분에서 심각한 성능 저하 및 유효성 취약 문제가 발생하였습니다. 장비 고도화를 통해 관련 문제를 해결하기에 앞서, 서비스 로직 및 테이블 재구성을 통한 최적화 작업을 통해 문제를 해결하였습니다.

이에 관해 간단하게 소개하도록 하겠습니다.

Problems

다음과 같이 크게 두 가지 문제가 있었습니다.

  1. 성능 이슈
    1. 로그 테이블은 거대한 한 개의 테이블로 구성
    2. 데이터 누적에 따라 성능이 급격하게 저하
  2. 유효성 이슈
    1. 자바 어플리케이션에서만 유효성 체크 – 비 정상적인 사용 존재
    2. 포인트가 현금처럼 사용될 수 있으므로 반드시 필요함

Solutions

1) 파티셔닝을 통한 성능 최적화

오라클 엔터프라이즈 버전에서는 테이블 파티셔닝을 제공하지만, 아쉽게도 오라클 스탠다드에서는 관련 기능이 없습니다. 즉, 어플리케이션 레벨에서 적당히 데이터 분산을 유도하는 방법 밖에는 없습니다. 데이터를 분산하는 방법으로는 여러가지가 존재하겠지만, 저는 월별로 테이블을 분산 저장하는 방식을 사용하였습니다.

매월 하단과 같은 스키마의 테이블을 MCHIP”YYYYMM” 형식으로 생성을 합니다.

물론 해당 월 다음 달로 생성을 해야겠죠?

 Name            Type
 --------------- ------------
 SEQ             NUMBER
 USER_NO         VARCHAR2(12)
 POINT           NUMBER
 ISSUE_DATE      DATE

그리고 인덱스 필요 시 데이터 테이블스페이스와는 “물리적으로 분리”된 전용의 테이블스페이스에 생성하여 DISK I/O 비효율도 최소화 유도하였습니다.

데이터 조회는 기본적으로 월별로만 가능하며, 최근 3개월 동안만 조회할 수 있도록 하였고, 필요 시 과거 테이블을 DROP하는 방식으로 변경하였습니다. 만약 최근 3개월 데이터가 필요할 시에는 “UNION ALL” 구문으로 데이터를 가져왔습니다.

다음은 쿼리를 월별로 생성하여 데이터를 저장하는 간단한 자바 프로그램입니다. 저는 SpringFramework 환경에서 구현했었는데, 그것보다는 알아보기 쉬운 단순 자바 프로그램으로 보여드리는 것이 좋을 것 같습니다. (설마 아래 있는 것을 그대로 쓰시는 것은 아니겠죠? ㅎㅎ)

import java.text.DateFormat;
import java.text.SimpleDateFormat;
import java.util.Date;
public class Test {
    public static void main(String[] args) {
        DateFormat df = new SimpleDateFormat("yyyyMM");
        Date date = new Date();

        // 현재 기준 년월 
        String yyyymm = df.format(date).toString();

        // 쿼리 생성
        String sql = "INSERT INTO MCHIP"+yyyymm+" \n" +
                "(SEQ, USER_NO, POINT, ISSUE_DATE) \n" +
                "VALUES \n" +
                "(SEQ_MCHIP.NEXTVAL, ?, ?, SYSDATE)";

        System.out.println(sql);
    }
}

위와 같이 쿼리를 생성하고, 원하는 테이블에 선별적으로 데이터를 넣습니다. 조회 시에도 위와 같은 방식으로 쿼리를 생성합니다. 만약 한달 이상의 데이터가 필요하다면 UNION ALL로 쿼리를 붙여서 데이터를 조회하면 되겠죠. ^^

2) 트리거를 사용한 유효성 체크

포인트 내역을 저장하는 테이블이 있었다면, 포인트 현황을 조회하기 위한 전용 테이블 또한 존재했습니다. 포인트 현황에 저장된 점수가 사용자가 현재 소지하고 있는 포인트이며, 이를 차감하여 서비스에서 사용하는 방식으로 사용하고 있었습니다.

개인 당 한 건의 데이터만 있기 때문에, 사용자 데이터를 조회하는 것에는 큰 무리가 없었지만, 유효성을 자바 어플리케이션에서만 체크했었기 때문에 여기저기 헛점이 많은 상태였습니다. 물론 내구성이 뛰어나게 개발되었다면 큰 문제는 없었겠지만, 협력사가 시간에 쫓겨서 급하게 개발한 산출물인지라.. 아무래도.. ^^;;

자바 소스 전체를 뒤져서 모든 유효성을 체크하는 것은 거의 무리에 가까웠고, 그래서 제가 채택한 방식은 트리거였습니다. 트리거를 사용하여 사용자 포인트 유효성 여부를 DB레벨에서 체크해서 어플리케이션과 분리하자는 의도였죠.

MCHIP201209 테이블에 포인트가 내역이 들어가는 동시에 유효성 체크 후 정상적이면 포인트 현황 테이블에 반영하는 트리거입니다.

CREATE OR REPLACE TRIGGER TRG01_MCHIP201209
BEFORE INSERT
ON MCHIP201209
REFERENCING NEW AS NEW OLD AS OLD
FOR EACH ROW
DECLARE
  POINT NUMBER;
BEGIN
  /*** 현재 사용자 포인트 조회 ***/
  SELECT POINT INTO POINT FROM MCHIP_INFO
  WHERE USER_NO = :NEW.USER_NO;
  … 중략…

  /*** 포인트 유효성 체크  ***/
  IF POINT - :NEW.POINT < 0 THEN
    RAISE_APPLICATION_ERROR(-20001,'Not enough point!!');
  END IF;

  /*** 포인트 현황 업데이트 ***/
  UPDATE MCHIP_INFO SET POINT = POINT + POINT_NEW
  WHERE USER_NO = :NEW.USER_NO;
END;
/

Conclusion

오래전에 성능을 최적화한 내용을 정리하였습니다.

당시 서버에 과부하로 인하여 서버 고도화 및 장비 도입을 위한 투자를 검토 중이었으나, 서비스 로직 재구성 이후 서버가 안정적이었기 때문에 기존 장비로 서비스를 진행하였습니다. 게다가 현재 기존 장비 사용률이 CPU 기준 80~90%였던 상황이 10~20%로 유지되는 쾌거를 거두었죠.

데이터 처리량을 최소로 유도하는 것이 성능 최적화의 첫걸음이라는 것을 느낀 경험이었습니다.

좋은 포스팅으로 다시 찾아뵐께요^^;

KTH에서 5년간의 생활을 마무리하며..

5년동안 재미있게 다녔던 KTH와 이별합니다. 시간이란 참으로 전광석화 순식간에 지나가네요. 입사한 당시가 엊그제 같은데..

대학 마지막 한 학기, 취업 자리를 알아볼 때, 취업 공고에서 가장 눈에 들어왔던 것은 “보라매”라는 지리적인 명칭이었습니다. 강남역에서 병특을 할 때나 역삼역에서 알바를 할 당시 모두 사람에게 치이는 생활 자체에 너무 치가 떨렸기 때문이죠.

면접 태그
2007년 면접 당시 이름표

일단 거리에서 매혹당한 후에 KTH가 도대체 무슨 일을 하는 회사였는지 찾아봤습니다.

당시 금전적인 가치보다는 제가 얻을 수 있는 경험의 가치를 최우선으로 생각을 해왔었기 때문에, 제가 반드시 거쳐가야할 회사라는 것을 예감했습니다. 포털/컨텐츠/IPTV/게임 등등 온갖 다양한 경험들을 얻을 수 있는 최고의 환경이라고 판단했기 때문이죠.

회사에 입사해 저를 포함해 인성 시험을 봤었다면 회사에 들어오지 못했을만한 세상 최고로 특이한 소중한 입사 동기들을 만났습니다. 그리고 아래와 같은 홍보 동영상도 함께 제작을 했었죠. ^^; 현직에 계신 분들 불쾌하신 내용이 있다면 죄송^^;;

[tube]8pplUghEeK8[/tube]

주연&조연 : KTH 29기 공채
(성동찬, 남현우, 문재희, 양태종, 곽형석, 김원묵, 한진욱, 이진아, 황순재, 최여정)
영상편집 : 황순재
장소협찬 : 성동찬
특별출현 : 성동찬 부친, 성동현
음원협찬 : KTH

그리고 졸업 후 각 팀에 배치.. 처음 팀 이름은 “기술개발팀!!”

사실 나름 오랫동안 웹관련 업무를 해왔다고 생각해왔었기에, 웹이 아닌 다른 경험을 해보고 싶어서 기술개발팀에 1지망으로 지원을 했었습니다. 기술을 개발하는 차도남 스타일의 팀이름이었기에..^^ 그치만 여기서 2년이 넘게 웹프로그래밍을 본격적으로 경험하였습니다. 이런게 진정 피싱이죠!! ㅋ 흐흐~

당시 힘든 일도 하고, 삽질도 많이 했었지만, 후회는 없습니다. 덕분에 DBA로 자연스럽게 업무 전향을 했고 여러 시스템에 대한 경험을 착실하게 쌓았기 때문이죠. 하지만 이제야 밝히지만.. 지금은 실장님이 되신 당시 기술개발팀장님!!(성함은 절~대 밝힐 수 없음!! ㅋ) 너무 힘들었어요!! 뼈를 너무 많이 깎았었나봐요. 그때는..ㅋ

물론 간간이 H에서 소중한 동기들과 여행도 다니기도 했고, 매번 아침마다 30분씩 모여서 잡담을 하다가 경고를 먹기도 했습니다. 근태가 안좋다고..ㅋㅋ

동기들과의 희귀한 컨셉의 그때 그사진
동기들과의 희귀한 컨셉의 그때 그사진

게으르고 힘들게 살아가는 것을 기피하는 제 천성때문인지.. 모든 것을 자동화 혹은 반자동화하면서 하나하나 제 업무를 줄여갔습니다. (아! 물론 사업팀에는 비밀이었죠!) 그리고 남는 시간에 타 서비스 DB튜닝도 참여하면서 역량도 키우고 단순 노가다성 일을 최소화할 수 있게 이것저것 툴을 만들다보니, 어느새 2년이 후딱 지났습니다.

웹을 하면서 가진 가장 값진 경험은 DB로 본격 전향했다는 것과 서버 캐시를 이곳 저곳 재미있게 적용해봤다는 점입니다. (아! 물론 남들이 모르는 사고도 여기저기 쳤지만, 경험이 부족한 하수들만이 누릴 수 있는 식겁한 경험들이죠!)

결혼식 식권
결혼식 식권

아!! 그 사이 저는 평생의 반려자와 귀여운 제 분신 아가 효주를 만났었네요. 사실 지금 제 블로그 주소 gywn.net은 딸 이름 효주.net에서 비롯되었습니다. ^^; 딸바보가 되었다능.. 부끄 -_-;;

[tube]zmWE1n5FoVo[/tube]

DBA로 전향하고 DBA파트가 생기고, 본격적으로 회사에서 오라클 라이선스 관련 프로젝트와 성능 튜닝 프로젝트.. 그리고 MySQL.. 그렇게 DB하는 개발자에서 개발 하는 DBA로의 본격 삶은 이렇게 시작되었네요. ^^

오라클 라이선스 축소 프로젝트 이후 남은 몇 개 서버를 DBA 전용 테스트 서버로 용도 변경한 후에 수많은 테스트를 수행하였습니다. 그리고 테스트한 결과를 과감히(?) 사내 통계 수집 서버에 적용을 해보았죠. 함께 진행하던 친구.. 당시 많이 힘들었답니다. 많이도 벌려놔서..ㅋ 미안 신호야~! 그치만 재밌었잖어!

IT인프라실 워크샵
IT인프라실 워크샵

아마존 RDS도 경험을 해보고, 성능이 취약한 DB도 긴급 튜닝도 해주고.. 사내 표준을 세워 전체적으로 적용을 “강행”하기도 하고.. 그냥 하고 싶은 것, 재미있는 것 모든 것을 가리지 않고 시도했습니다. 일을 꽤 많이 벌여놔서 몸이 열개라도 모자를 지경이었지만, 이 시간.. 전 많이 배웠습니다.

그리고.. 제 인생의 또 다른 터닝 포인트가 되었던 사건.. 2011년 H3 발표.. 워낙 말재주도 없고 대중 앞에서 긴장을 하는 저로서는 위염이 날 정도로 많은 긴장 속에서 프리젠테이션을 준비하였습니다. 어찌나 PT 속에 “재미 요소”를 강조하시던지.. 천성이 재미없어서 죄송했습니다. ㅋㅋ

[tube]aVP0QOWEaFk[/tube]

H3를 무사히 마치고 나서야, 드디어 조금은 남들이 볼만한 PT를 사람답게 만들 수 있는 역량이 생겼습니다. 물론.. 아직도 너~무 부족한 것은 사실입니다. ㅜㅜ 2012년은 이제 한 사람으로서 조금은 성장한 가장 커다란 기회였다고 생각합니다.

이것 말고도.. 장황하게 얘기할만한 수많은 이야기.. 추억.. 그치만 일단은 여기까지!!

한모씨와의 단란했던 한때
한모씨와의 단란했던 한때

지금보다 더욱 재미있는 놀이(?)를 찾아 정든 터를 떠납니다. 대졸 신입사원으로 들어와 5년 간의 긴 여정을 마무리하고 저 이제 KTH 떠나요. 보잘 것 없는 능력을 가진 제게 감사할 정도로 좋은 기회를 주셨던 모든 분들, 함께 즐겁게 일했던 동료, 내 부사수 “임창선” <== 말 안하고 가면 삐질듯!! 여기에 창선처럼 이름을 안써줬다고 삐지실 분은 제게 트윗(@gywndi)로 날려주시면 이름에 밑줄과 굵은 글자로 강조하여 적어드리도록 하겠습니다!!

참고로 아래 사진은 꼭 넣어달라는 임창선 군의 완곡한 부탁으로 넣은 사진입니다.ㅋ

콜린, 창선과 함께
콜린, 창선과 함께

이렇게 떠나지만, 지금은 마지막이 아닌 새로운 시작이라고 생각해요. 새로운 재미를 찾아서, 뭉클한 배움을 위하여, 더 큰 가능성을 찾아서 다시 출발선 상에 제 발을 올립니다. 두렵지만 두렵지 않습니다. 이제 시작인걸요~! 제 인생은!! ^^

그동안 감사했습니다. 모든 분들.. 그리고 안녕 KTH(김태희!? 우웅 =_=;;ㅋ)