본문 바로가기

JAVA HTML JAVASCRIPT/DB

[오라클] 데이터 중복제거 방법 (distinct, group by, 성능)

728x90
반응형

오라클(ORACLE)에서 데이터 조회 시 데이터 중복을 제거하기 위해서는 대표적으로 2가지 방법이 있다. distinct 키워드를 사용하여 중복을 제거하는 방법과, group by 절을 사용하여 데이터 중복을 제거하는 방법이다.

 

두가지 방법 모두 장단점이 존재한다. 

 

distinct 키워드를 사용하여 데이터 중복을 제거할때는 select절에 distinct 키워드만 명시하면 되므로 쿼리문이 복잡하지 않고 간결하다. 그러나 distinct를 사용시 temp tablespace에 임시로 저장하고 작업하는 방식이라 시스템에 부하를 줄 수 있다.

 

group by절을 이용하여 데이터 중복을 제거할때는 select절의 컬럼을 group by절에도 동일하게 명시를 해야하는 부담감이 있지만 distinct에 비하여 조금 빠른감이 있다.

 

Oracle 10g R2 부터는 group by 사용 시 정렬(sort)이 기본으로 되지 않으므로 속도도 더 빨라 졌다.

 

데이터가 적고 간단한 쿼리문은 distinct를 사용하고 데이터가 많고 시스템에 부하를 줄 수 있는 쿼리문은 group by절을 이용하는 것도 좋은 방법인듯 하다. 일반적인 데이터 조회는 어느 방법을 사용하든 조회 속도는 비슷하다.

 

물품코드와 물품명이 중복되어 조회

 

distinct 를 사용하여 중복제거

 

group by 를 사용하여 중복제거

728x90
반응형

'JAVA HTML JAVASCRIPT > DB' 카테고리의 다른 글

LEFT / RIGHT / OUTER / INNER JOIN  (0) 2020.07.30
GROUP BY / ORDER BY / HAVING  (0) 2020.07.30
PostgreSQL 설치 DB생성  (0) 2020.02.05
PostgreSQL 설치 및 확인  (0) 2020.02.05
DBeaver 설치 및 연동  (0) 2020.02.05