Представляем Milvus Lite: Начните создавать приложение GenAI за считанные секунды
Мы рады представить Milvus Lite, легковесную векторную базу данных, которая запускается локально в вашем приложении на Python. Основанная на популярной векторной базе данных Milvus с открытым исходным кодом, Milvus Lite повторно использует основные компоненты для индексации векторов и разбора запросов, удаляя при этом элементы, предназначенные для высокой масштабируемости в распределенных системах. Благодаря этому компактное и эффективное решение идеально подходит для сред с ограниченными вычислительными ресурсами, таких как ноутбуки, Jupyter Notebooks, а также мобильные или граничные устройства.
Milvus Lite интегрируется с различными стеками разработки ИИ, такими как LangChain и LlamaIndex, позволяя использовать его в качестве векторного хранилища в конвейерах Retrieval Augmented Generation (RAG) без необходимости настройки сервера. Просто запустите pip install pymilvus
(версия 2.4.3 или выше), чтобы включить его в ваше AI-приложение в качестве библиотеки Python.
Milvus Lite разделяет API Milvus, гарантируя, что ваш клиентский код будет работать как для небольших локальных развертываний, так и для серверов Milvus, развернутых на Docker или Kubernetes с миллиардами векторов.
Почему мы создали Milvus Lite
Многим приложениям искусственного интеллекта требуется векторный поиск неструктурированных данных, включая текст, изображения, голоса и видео, для таких приложений, как чат-боты и торговые ассистенты. Векторные базы данных предназначены для хранения и поиска векторных вкраплений и являются важной частью стека разработки ИИ, особенно для генеративного ИИ, такого как Retrieval Augmented Generation (RAG).
Несмотря на наличие множества решений для поиска векторов, не хватало простого в запуске варианта, который также работал бы для крупномасштабных производственных развертываний. Как создатели Milvus, мы разработали Milvus Lite, чтобы помочь разработчикам ИИ быстрее создавать приложения, обеспечивая при этом согласованную работу в различных вариантах развертывания, включая Milvus на Kubernetes, Docker и управляемые облачные сервисы.
Milvus Lite является важным дополнением к нашему набору предложений в экосистеме Milvus. Он предоставляет разработчикам универсальный инструмент, поддерживающий все этапы разработки. От прототипирования до производственных сред, от вычислений на границе до крупномасштабных развертываний - Milvus теперь единственная векторная база данных, которая охватывает сценарии использования любого размера и на всех этапах разработки.
Принцип работы Milvus Lite
Milvus Lite поддерживает все основные операции, доступные в Milvus, такие как создание коллекций, вставка, поиск и удаление векторов. Вскоре он будет поддерживать расширенные возможности, такие как гибридный поиск. Milvus Lite загружает данные в память для эффективного поиска и сохраняет их в виде файла SQLite.
Milvus Lite включен в Python SDK Milvus и может быть развернут с помощью простого pip install pymilvus
. Следующий фрагмент кода демонстрирует, как настроить векторную базу данных с помощью Milvus Lite, указав имя локального файла и создав новую коллекцию. Для тех, кто знаком с Milvus API, единственное отличие заключается в том, что uri
ссылается на локальное имя файла, а не на конечную точку сети, например, "milvus_demo.db"
вместо "http://localhost:19530"
для сервера Milvus. Все остальное остается неизменным. Milvus Lite также поддерживает хранение необработанного текста и других меток в качестве метаданных, используя динамическую или явно определенную схему, как показано ниже.
from pymilvus import MilvusClient
client = MilvusClient("milvus_demo.db")
# This collection can take input with mandatory fields named "id", "vector" and
# any other fields as "dynamic schema". You can also define the schema explicitly.
client.create_collection(
collection_name="demo_collection",
dimension=384 # Dimension for vectors.
)
Для масштабируемости ИИ-приложение, разработанное с помощью Milvus Lite, может легко перейти к использованию Milvus, развернутого в Docker или Kubernetes, просто указав uri
в качестве конечной точки сервера.
Интеграция со стеком разработки ИИ
Помимо того, что Milvus Lite упрощает работу с векторным поиском, Milvus также интегрируется со многими фреймворками и поставщиками стека разработки ИИ, включая LangChain, LlamaIndex, Haystack, Voyage AI, Ragas, Jina AI, DSPy, BentoML, WhyHow, Relari AI, Airbyte, HuggingFace и MemGPT. Благодаря обширному инструментарию и сервисам эти интеграции упрощают разработку приложений ИИ с возможностью векторного поиска.
И это только начало - в скором времени появится еще много интересных интеграций! Следите за новостями!
Другие ресурсы и примеры
Изучите документацию Milvus quickstart, чтобы найти подробные руководства и примеры кода по использованию Milvus Lite для создания приложений ИИ, таких как Retrieval-Augmented Generation(RAG) и поиск изображений.
Milvus Lite - это проект с открытым исходным кодом, и мы приветствуем ваш вклад. Ознакомьтесь с нашим руководством по внесению вклада, чтобы начать работу. Вы также можете сообщить об ошибках или запросить возможности, создав проблему в репозитории Milvus Lite на GitHub.
- Почему мы создали Milvus Lite
- Принцип работы Milvus Lite
- Интеграция со стеком разработки ИИ
- Другие ресурсы и примеры
On This Page
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word