DB 2

조회 성능을 위한 DB Index(feat.MySQL)

들어가며대부분의 웹 어플리케이션을 구축하는 데 있어 DB 입출력 작업은 필수적이다. 그러므로 서버 성능의 관점에서, 클라이언트의 요청에 신속하게 대응하기 위해서는 DB 성능을 함께 고려해야 한다. DB 성능에 있어 인덱스는 늘 빠지지 않고 등장하는 주제이다. 관련하여 여러 개념들을 들어왔는데, 한 번 정리해보고자 한다. 널리 활용되는 RDBMS인 MySQL을 기준으로 작성했다. Index의 정의와 필요성Index란 DB의 Table에 대한 동작 속도를 높여주는 자료구조이다. 책을 읽을 때 활용하는 목차와 같다. 목차를 참고하여, 원하는 정보를 더욱 빠르게 얻을 수 있다. 웹 어플리케이션 동작 시에는 DB Table에 대한 조회가 빈번하게 일어나고, 대부분 필터링을 적용한다. 이 때 DB에서는 조건에 맞는..

DB/설계 2025.08.24

[Impala] Hadoop 빅데이터를 SQL 문으로 다루기(Impala 개념 및 구조)

Impala?Apache Impala는 Apache Hadoop 데이터를 SQL문을 활용하여 쿼리할 수 있도록 돕는 오픈소스이다. Apache Hive와 동일한 메타데이터, 데이터 저장소, SQL 문법(Hive SQL)을 제공한다. JDBC 드라이버로 제공되며, 그 밖에도 Impala sh, ODBC, Web UI인 Hue로도 제공된다. 실시간 쿼리에 최적화되어 있으며, 배치 작업이 필요하면 Map Reduce 방식을 지원하는 Hive를 사용하면 된다. Impala를 활용한 쿼리 처리 흐름 Impala는 다음과 같은 구성 요소로 이루어져 있다.클라이언트: Hue, ODBC, JDBC 클라이언트, impala-shell. 쿼리를 보내거나 연결/관리 작업을 수행하는 데 사용한다.Hive Metastore: ..

DB/빅데이터 2025.04.27