🚀 완전 관리형 Milvus인 Zilliz Cloud를 무료로 체험해보세요—10배 더 빠른 성능을 경험하세요! 지금 체험하기>>

milvus-logo
LFAI
  • Home
  • Blog
  • 놀라운 이정표: Milvus, 깃허브에서 별 20,000개 돌파

놀라운 이정표: Milvus, 깃허브에서 별 20,000개 돌파

  • News
June 29, 2023
Yujian Tang

색종이를 터뜨리며 축하해 주세요!

Milvus가 깃허브에서 별 20,000개를 돌파하는 놀라운 이정표를 달성했습니다! 저희의 충성스러운 팬과 커뮤니티 회원의 지원과 피드백이 없었다면 달성할 수 없었을 것입니다. 정말 감사합니다.

이 기쁨을 함께 나누기 위해 다음과 같이 광범위한 Milvus 커뮤니티의 중요한 주제 목록을 정리했습니다:

  • Milvus를 활용하는 6가지 주목할 만한 프로젝트
  • 다른 오픈소스 프로젝트와의 5가지 통합
  • Milvus의 잘 알려진 5가지 사용 사례
  • 곧 출시될 5가지 우수한 기능

Milvus를 활용하는 6개의 LLM 프로젝트

PaperGPT

PaperGPT는 LLM과 벡터 데이터베이스로 구동되는 생의학 논문 검색 도구입니다. 이 도구는 효율적인 검색을 위해 PubMed 데이터베이스와 센텐스 트랜스포머, 질리즈 클라우드와 같은 기술을 활용합니다.

NoticeAI

NoticeAI는 기업의 고객 지원 프로세스 자동화를 지원합니다. Milvus와 LangChain을 활용하여 고객 지원 질문을 추적하고, 지식창고를 업데이트하며, 사람의 개입 여부를 결정합니다.

Search.anything.io

Search Anything은 더 나은 검색 환경을 제공하기 위해 LLM과 Milvus를 활용합니다. 사용자의 텍스트 설명을 받아 웹에서 해당 이미지를 찾습니다.

IkuStudies

IkuStudies는 사용자가 28개 언어로 동음이의어를 검색할 수 있는 프로젝트입니다. Milvus를 벡터 저장소로 사용하여 단어 간의 유사성을 찾습니다.

AssistLink AI는 시애틀에 본사를 둔 스타트업으로, 정부 지원 시스템을 위한 변수를 저장하는 데 Milvus와 LLaMa 650억을 사용합니다.

OSS 채팅

OSS Chat을 사용하면 오픈 소스 소프트웨어와 채팅할 수 있습니다. Milvus를 사용해 오픈소스 프로젝트에 대한 도메인 지식을 주입하고, GPTCache를 사용해 자주 묻는 질문을 캐시하여 LLM 비용을 절감합니다.

Milvus와 통합된 5가지 AI 프로젝트

LlamaIndex

LlamaIndex는 LLM 애플리케이션을 위한 데이터 프레임워크로, 외부 데이터 소스를 LLM과 연결할 수 있는 데이터 커넥터를 제공합니다. 라마인덱스를 사용하면 개인 데이터나 도메인 관련 지식을 LLM 애플리케이션에 직접 주입할 수 있습니다.

LangChain/LangChainJS

LangChain은 신속한 관리, 체인, 데이터 증강 생성, 메모리 등의 기능을 제공하여 LLM 애플리케이션 개발을 가속화하도록 설계된 라이브러리입니다.

ChatGPT 검색 플러그인

OpenAI의 ChatGPT 검색 플러그인은 자연어 쿼리를 사용하여 개인 또는 조직 문서의 시맨틱 검색 및 검색을 가능하게 하며, 개발자는 플러그인을 배포하고 ChatGPT에 등록할 수 있습니다.

Haystack

Haystack은 질문 답변, 시맨틱 문서 검색, 복잡한 의사 결정 구축과 같은 작업을 위한 LLM, 트랜스포머 모델, 벡터 검색 및 기타 기술로 구동되는 NLP 애플리케이션을 구축하기 위한 엔드투엔드 NLP 프레임워크입니다.

GPTCache

LLM API 호출은 비용이 많이 들고 속도가 느릴 수 있습니다. GPTCache는 LLM 쿼리를 위한 시맨틱 캐시를 제공함으로써 이 두 가지 문제를 모두 해결할 수 있습니다.

Milvus의 잘 알려진 5가지 사용 사례

LLM 증강

LLM 또는 LLM 애플리케이션에는 도메인별 데이터 부족, 오래된 데이터, 높은 비용이라는 세 가지 주요 문제가 있습니다. Milvus는 외부 데이터를 삽입하고 빈번한 쿼리를 위한 캐시 역할을 함으로써 이 세 가지 문제를 모두 해결할 수 있습니다.

이상 징후 탐지

비정상 데이터는 주어진 세트에서 나머지 데이터와 크게 다릅니다. Milvus와 같은 벡터 데이터베이스는 유사도 검색을 수행하는 데 유용하므로 이러한 비정상 데이터를 쉽게 식별할 수 있습니다.

추천 시스템

추천 시스템은 사람들이 이미 즐겨 찾는 것과 유사한 항목을 추천합니다. 밀버스는 유사도 검색을 수행함으로써 이 프로세스를 가속화하는 대표적인 예입니다.

텍스트를 검색하여 비슷한 의미를 가진 것을 찾고자 할 때 키워드 검색은 적합하지 않습니다. 바로 이때 시맨틱 검색이 필요하며 Milvus가 도움을 줄 수 있습니다. Milvus를 사용하면 단어 자체뿐만 아니라 텍스트 뒤에 숨겨진 의도를 비교할 수 있습니다.

자동 데이터 라벨링

라벨링된 데이터가 있고 더 많은 마킹이 필요하신가요? Milvus에 벡터 표현을 저장하면 새 데이터에서 가장 유사한 데이터 포인트를 자동으로 감지하고 적절한 라벨을 적용할 수 있습니다.

곧 출시될 5가지 멋진 기능

NVIDIA GPU 지원

GPU 지원은 Milvus 2.3에서 제공될 예정이며, 이미 최신 베타 릴리스에서 사용 가능합니다!

표현식으로 삭제

Milvus에서는 이미 부울 표현식을 통해 스칼라/메타데이터 필터링을 수행할 수 있습니다. 표현식으로 삭제 기능도 곧 출시될 예정입니다.

변경 데이터 캡처(CDC)

CDC는 Milvus 인스턴스의 변경 사항을 실시간으로 캡처하고 추적하는 기술입니다.

일부 업계에서는 엡실론 검색이라고도 하는 범위 검색을 사용하면 쿼리 벡터에서 일정 거리 내에 있는 모든 벡터를 찾을 수 있습니다.

빠른 스캔

4비트 양자화 및 FastScan은 최근 FAISS에 추가되었으며 Milvus에도 추가될 예정입니다.

Milvus가 더 높은 곳에 도달하기를 기대합니다!

지속적인 지원과 피드백, 기여를 해주신 사용자, 커뮤니티 회원, 에코시스템 파트너, 별 관측가 여러분께 진심으로 감사드립니다. 앞으로 더 높은 곳에 도달할 Milvus를 기대해 주세요!

Like the article? Spread the word

계속 읽기