Milvus 로드맵

차세대 멀티모달 데이터베이스와 데이터 레이크를 향하여

Milvus 제품 로드맵

Milvus 로드맵에 오신 것을 환영합니다!

정형 데이터에서 비정형 데이터, 실시간 검색에서 오프라인 분석, 단일 클러스터 성능에서 글로벌 데이터 레이크 아키텍처에 이르는 차세대 멀티모달 데이터베이스라는 새로운 시대로 Milvus를 안내하고 있습니다.

이 로드맵은 Milvus v2.6(진행 중), Milvus v3.0(2026년 말 출시 목표), Milvus v3.1(장기 개발)의 핵심 목표와 Vector Lake(데이터 레이크/Loon)의 진화 계획을 개괄적으로 설명합니다.

🧩 Milvus v2.6(진행 중)

타임라인 2025년 중반 - 2025년 말

Focus: 데이터 모델 업그레이드, 스트리밍 아키텍처 리팩토링, 핫/콜드 계층화 기능 구축, Vector Lake 프로토타입(v0.1) 출시.

🎯 주요 하이라이트

🔹 데이터 모델 업그레이드

  • 다중 벡터 임베딩 구조를 지원하기 위해 통합된 Tensor / StructList 데이터 유형을 도입하여 ColBERT, CoLQwen, 비디오멀티모달 벡터와의 호환을 가능하게 합니다.

  • 포인트, 지역, 공간 인덱싱( 라이브러리 공간 기반)을 포함한 지리 데이터 지원을 추가하여 LBS 및 GIS의 사용 사례를 확장합니다.

  • 타임존 데이터 유형으로 타임스탬프 지원.

🔹 StreamNode 아키텍처 리팩터링

  • 스트리밍 수집 파이프라인을 재작성하여 증분 쓰기와 실시간 계산을 최적화합니다.

  • 동시성 성능과 안정성을 대폭 개선하여 통합 실시간 및 오프라인 처리를 위한 기반을 마련합니다.

  • 새로운 메시지 큐 엔진을 도입합니다: 딱따구리.

🔹 핫/콜드 티어링 및 스토리지 아키텍처(StorageV2)

  • 이중 스토리지 형식을 지원합니다: ParquetVortex를 지원하여 동시성 및 메모리 효율성을 향상시킵니다.

  • 자동 핫/콜드 데이터 분리 및 지능형 스케줄링으로 계층형 스토리지를 구현합니다.

🔹 Vector Lake 프로토타입(v0.1)

  • FFI를 통해 Spark/DuckDB/DataFusion과 통합하여 오프라인 스키마 진화 및 KNN 쿼리를 가능하게 합니다.

  • 멀티모달 데이터 시각화 및 Spark ETL 데모를 제공하여 데이터 레이크 아키텍처의 기초를 확립합니다.

🌠 Milvus v3.0(2026년 초 출시 목표)

타임라인: 2025년 말~2026년 초

Focus: 검색 환경, 스키마 유연성, 비정형 데이터 지원에 대한 포괄적인 개선과 함께 Vector Lake(v0.2) 출시.

🎯 주요 특징

🔹 검색 환경 개편

  • 위치 또는 부정 예시가 있는 검색을 지원하는 MLT(More Like This) 유사도 검색을 도입합니다.

  • 강조 표시부스팅과 같은 시맨틱 검색 기능을 추가합니다.

  • 사용자 정의 사전동의어 테이블을 지원하여 분석기 계층에서 어휘 및 의미론적 규칙 정의를 가능하게 합니다.

  • 쿼리에 대한 집계 기능을 도입합니다.

🔹 멀티 테넌시 및 리소스 관리

  • 멀티 테넌트 삭제, 통계, 핫/콜드 계층화를 사용하세요.

  • 리소스 격리 및 스케줄링 전략을 개선하여 단일 클러스터에서 수백만 개의 테이블을 지원하세요.

스키마 및 기본 키 개선 사항

  • 데이터 일관성과 고유성을 보장하기 위해 글로벌 기본 키 중복 제거(글로벌 PK 중복 제거)를 구현합니다.

  • 유연한 스키마 관리 (열 추가/삭제, 백업 채우기)를 지원합니다.

  • 벡터 필드에 NULL 값 허용.

🔹 확장된 비정형 데이터 유형(BLOB/텍스트)

  • 파일, 이미지, 동영상 등 바이너리 데이터에 대한 기본 저장 및 참조를 제공하는 BLOB 타입을 도입합니다.

  • 향상된 전체 텍스트 및 콘텐츠 기반 검색 기능을 제공하는 TEXT 타입을 소개합니다.

🔹 엔터프라이즈급 기능

  • 스냅샷 기반 백업 및 복구 지원.

  • 엔드투엔드 추적감사 로깅을 제공합니다.

  • 멀티 클러스터 배포에서 액티브-스탠바이 고가용성(HA)을 구현하세요.

🔹 Vector Lake(v0.2)

  • 텍스트/블롭 스토리지다중 버전 스냅샷 관리를 지원합니다.

  • 오프라인 인덱싱, 클러스터링, 중복 제거, 차원 축소 작업을 위해 Spark를 통합합니다.

  • ChatPDF 콜드 쿼리 및 오프라인 벤치마크 데모 제공.

🪐 Milvus v3.1(장기 비전)

타임라인: 2026년 중반

Focus: 사용자 정의 기능(UDF), 분산 컴퓨팅 통합, 스칼라 쿼리 최적화, 동적 샤딩, 벡터 레이크(v1.0)의 공식 출시.

🎯 주요 하이라이트

🔹 UDF 및 분산 컴퓨팅 에코시스템

  • 개발자가 검색 및 계산 워크플로우에 맞춤형 로직을 삽입할 수 있도록 사용자 정의 함수(UDF)를 지원합니다.

  • 분산 UDF 실행 및 멀티모달 데이터 처리를 위한 Ray Dataset/Daft와의 긴밀한 통합.

🔹 스칼라 쿼리 및 로컬 포맷 진화

  • 스칼라 필드에 대한 필터링 및 집계 성능을 최적화하세요.

  • 표현식 평가 및 인덱스 가속 실행을 향상하세요.

  • 로컬 파일 형식에 대한 인플레이스 업데이트를 지원합니다.

🔹 고급 검색 기능

  • 다음 기능을 추가합니다: 순위별, 순서별, 패싯퍼지 일치 쿼리.

  • 다음을 지원하여 텍스트 검색을 향상하세요:

    • match_phrase_prefix

    • Completion Suggester

    • Term Suggester

    • Phrase Suggester

🔹 동적 샤딩 및 확장성

  • 원활한 확장을 위해 자동 샤드 분할로드 밸런싱을 활성화합니다.

  • 글로벌 인덱스 구축을 개선하고 분산된 검색 성능을 보장합니다.

🔹 Vector Lake V1.0

  • 분산 UDF 및 컨텍스트 엔지니어링 사용 사례를 지원하기 위해 Ray/Daft/PyTorch와의 긴밀한 통합.

  • RAG(검색 증강 생성) 데모 제공 및 Iceberg 테이블에서 가져오기.

🤝 Milvus의 미래 공동 구축

Milvus는 전 세계 개발자 커뮤니티가 주도하는 오픈 소스 프로젝트입니다.

차세대 멀티모달 데이터베이스를 만드는 데 도움을 주실 모든 커뮤니티 구성원을 진심으로 초대합니다:

  • 피드백을 공유하세요: 새로운 기능 또는 최적화 아이디어 제안

  • 🐛 문제 보고: GitHub 이슈를 통해 버그 신고하기

  • 🔧 코드 기여: PR 제출 및 핵심 기능 구축 지원

    • 풀 리퀘스트: 풀리퀘스트: 코드베이스에 직접 기여하세요. 버그 수정, 기능 추가, 문서 개선 등 어떤 것이든 여러분의 기여를 환영합니다.

    • 개발 가이드: 코드 기여에 대한 가이드라인은 기여자 가이드를 참조하세요.

  • 소문내기: 모범 사례와 성공 사례를 공유하세요.

👉 깃허브: milvus-io/milvus