본문 바로가기

데이터베이스8

스프링부트 With Mysql - easyRandom을 통한 bulk Insert 및 Index 적용 이 글은 개인적인 생각을 작성한 것이다. 들어가기 데이터베이스에 대해 공부하다 보면 마주치는 것 중 인덱스라는 것을 들어보았을 것이다. 필자 또한 인덱스라는 개념을 책 및 인터넷을 통해 많이 접하았다. 쿼리 최적화에 대해 공부하면서 인덱스 또한 공부도 하였다. 하지만 인덱스를 통해 충분한 성능을 보기 위해서는 충분한 데이터가 있어야 한다고 들었다. 그래서 데이터가 많지 않으니까 다음에 적용하자~! 라는 핑계로 계속 인덱스를 직접 적용해 보는 것을 미뤘었다. 그러던 중 최근에 EasyRandom을 통한 랜덤한 객체를 수백만 건을 생성해 주는 방법을 접하게 되었다. 지금까지 진행하던 테스트에서는 일일이 값을 집어넣어서 객체를 생성하고 테스트를 진행하였다. EasyRandom은 이런 나에게 매우 매혹적으로 보.. 2023. 8. 3.
DB 오라클 - 자주 사용하는 힌트절 이번 글에서는 간단히 자주 사용되는 오라클 힌트 절에 대해서 작성해 볼 것이다. '개발자를 위한 인덱스 생성과 SQL 작성 노하우(이병국)'을 참고하여 작성하였다. DB에서 옵티마이저는 최적의 실행계획을 결정한다. 하지만 그렇다고 해서 옵티마이저가 만능이라는 것은 아니다. 옵티마이저도 잘못된 SQL이나 부정확한 통계정보로 인하여 실수도 할 수 있다. 이럴 때는 힌트 절을 통해 잘못된 실행계획을 바로 잡을 수 있다. 즉, 힌트 절은 옵티마이저의 실수를 만회할 수 있는 용도로 사용할 수 있는 것이다. 옵티마이저에 대한 내용은 https://khdscor.tistory.com/m/52 를 참고하길 바란다. 데이터베이스 옵티마이저에 대한 간단 설명 데이터베이스를 사용하다 보면 여러 가지 인덱스를 만들어 놓는 경.. 2022. 4. 30.
DB - 성능 개선을 위한 테이블 분할 데이터베이스의 성능을 개선하기 위한 방법 중 하나가 테이블 분할이다. 테이블 분할은 어려움이 따르는데 그 이유는 기존에 설계된 테이블 구조를 변경해야 하고 이미 개발된 프로그램을 변경해야 하기 때문이다. 보통 테이블을 변경하는 원인은 DB 설계시 정규화를 소홀했거나 용량 산정을 잘못했기 때문이다. DB는 설계가 매우 중요하기 때문에 초반에 설계를 잘못한다면 성능상의 문제가 생기기 마련이다. 그렇기에 잘못된 설계 및 정규화로 인한 성능 저하를 해결하기 위해 테이블 분할을 하는 것이다. 테이블 분할은 크게 수직분할과 수평분할로 나눈다. 수직분할은 컬럼을 기준으로 테이블을 분리하는 것을 의미하고 수평분할은 로우를 기준으로 테이블을 분리하는 것을 의미한다. 테이블의 컬럼 수가 많을수록 I/O에 대한 부하가 걸리.. 2022. 4. 26.
오라클 DB - 자주 접하는 에러 메시지 이 글에서는 간단하게 오라클에서 간단하게 발생하는 에러 메시지들을 살펴볼 것이다. '개발자를 위한 인덱스 생성과 SQL(이병국)'을 참고하였다. 1. ORA-00001: 유일성 제약조건에 위배됩니다 오라클 에러메시지 중에서 개발자가 가장 자주 접하는 문제이다. 테이블에 PK가 있거나 UNIQUE UNDEX가 있을 때, 중복해서 INSERT를 사용하면 발생하는 에러이다. 2. ORA-00942: 테이블 또는 뷰가 존재하지 않습니다 오타로 인해 발생할 수 있는 에러이고 실제로 테이블이 생성됐는지도 확인이 필요하다. 개발계와 운영계를 따로 관리하는 환경이라면, 실제 해당 테이블에 대한 생성 유무를 착각할 수도 있기 때문이다. 또한 권한이 없어서 발생하는 경우도 있다. 이런 경우 DBA에게 권한을 요청하거나 아.. 2022. 4. 25.
데이터베이스 옵티마이저에 대한 간단 설명 데이터베이스를 사용하다 보면 여러 가지 인덱스를 만들어 놓는 경우가 많다. 어느 테이블에서 무엇인가 조회를 하는 방법은 그 테이블에 사용되는 다양한 인덱스 중 어느 인덱스를 사용할지, 조인을 했다면 어느 테이블부터 조회할지 등 실행 방법에는 다양한 경우가 있을 수 있다. 이러한 방법 중에 최적의 방법을 실행하는 것이 가장 효율적일 것이다. 여기서 어떤 실행에 대해서 최적의 루트를 계산해 실행하는 것이 '옵티마이저'이다. 옵티마이저에는 크게 CBO(Cost Based Optimizer) 즉, 비용 기반 옵티마이저와 RBO(Rule Based Optimizer) 즉, 규칙 기반 옵티마이저로 두가지로 나뉠 수 있다. RBO는 규칙 기반 옵티마이저로서 미리 정해진 우선 순위 규칙에 따라 접근 경로를 결정한다. .. 2022. 4. 18.
DB - 결합인덱스 및 컬럼 순서 결정 방법 데이터 베이스를 다루면서 성능 향상을 위해 인덱스의 사용과 개념은 전 페이지에서 설명하였다. 특정 컬럼을 기준으로 정렬해 놓은 목차 같은 것이라고 할 수 있고 분류 대상과 분류 정보를 분리했을 때 분류 정보가 인덱스라고 할 수도 있다. 여기서 확인할 것은 특정 컬럼이 하나가 아닐 수 있다는 것이다. 이것은 여러 개의 인덱스를 만든다는 말이 아니라 하나의 인덱스에 여러 컬럼이 기준이 될 수 있다는 것이다. 이것이 바로 결합 인덱스이다. 이 글에서는 결합인덱스에 대해 간단히 설명하고 컬럼 선정 방법에 대해서도 설명할 것이다. 참고로 '개발자를 위한 인덱스 생성과 SQL 작성 노하우(이병국)'을 참고하여 작성하였다. 결합 인덱스는 하나의 인덱스에서 기준 컬럼이 하나가 아닌 인덱스이다. 결합 인덱스 1= 컬럼1.. 2022. 4. 10.
인덱스의 유형과 특징(2. 함수기반 인덱스) 저번 글에서는 인덱스란 무엇인지와 종류, 그리고 B-tree인덱스에 대해서 간단하게 살펴보았다. 이 글에서는 이어서 함수 기반 인덱스에 대해서 살펴보겠다. 함수기반 인덱스는 말 그대로 함수를 기반으로 하는 인덱스이다. 인덱스 값을 단순히 컬럼이 아니라 컬럼을 이용한 연산으로 정한다는 것이다. 아래는 간단한 예시이다. CREATE INDEX prod_idx1 (cnt * price); 위와 같은 인덱스를 생성했을 때 아래와 같은 조건문으로 검색을 한다면 이미 인덱스가 만들어져 있으므로 더 빠른 성능을 보여줄 것이다. SELECT * FROM prod WHERE cnt * price = 2000; 함수 기반형 인덱스는 위에서의 경우 인덱스 키로 cnt * price의 값이 정해져 있고 각 값에 해당하는 RO.. 2022. 4. 2.
인덱스의 유형과 특징(1. B-Tree index) 인덱스는 우리가 테이블에서 특정한 칼럼을 기준으로 정렬을 미리 시켜놓은 목차 같은 개념이다. 그렇기에 인덱스를 지정한 컬럼을 대상으로 검색을 할 때에는 인덱스를 통해서 더 적은 비용으로 데이터를 찾을 수 있기에 성능 향상에 있어서는 인덱스는 필수적이다. 그렇다면 인덱스는 어떤 종류들이 있을까? B-Tree 인덱스, 리버스 키 인덱스, 비트맵 인덱스, 함수기반 인덱스가 있지만 이 글에서는 B-Tree 인덱스에 대해서만 설명을 하겠다. 클러스터 인덱스에 대해서는 https://khdscor.tistory.com/46 를 참고하길 바란다. 데이터 저장구조와 특징(클러스터링 팩터) 스프링 프로젝트를 하면서 최적화에 대한 문제를 여러 번 직면했다. api 횟수를 줄이는 문제, DB와의 통신 횟수를 줄이는 방식, .. 2022. 4. 1.