7 лет, 2 крупных перестройки, 40K+ звезд GitHub: Восхождение Milvus как ведущей базы данных векторов с открытым исходным кодом
В июне 2025 года Milvus достиг 35 000 звезд на GitHub. Прошло всего несколько месяцев, и мы уже перешагнули отметку в 40 000, что свидетельствуетне только о динамике развития, но и о глобальном сообществе, которое продолжает продвигать будущее векторного и мультимодального поиска.
Мы глубоко благодарны. Всем, кто ставил звездочки, форки, создавал проблемы, спорил об API, делился эталонами или создавал что-то невероятное с помощью Milvus: спасибо, благодаря вам этот проект развивается так быстро, как он развивается. Каждая звездочка - это не просто нажатая кнопка, это отражение того, кто выбрал Milvus для своей работы, того, кто верит в то, что мы создаем, того, кто разделяет наше видение открытой, доступной, высокопроизводительной инфраструктуры ИИ.
Поэтому, празднуя, мы также смотрим в будущее - на функции, о которых вы просите, на архитектуры, которые сейчас требует ИИ, и на мир, в котором мультимодальное, семантическое понимание будет использоваться по умолчанию в каждом приложении.
Путешествие: От нуля до 40 000+ звезд
Когда мы начали создавать Milvus в 2017 году, термина " векторная база данных" еще не существовало. Мы были всего лишь небольшой командой инженеров, убежденных в том, что приложениям ИИ вскоре понадобится новый тип инфраструктуры данных - созданный не для строк и столбцов, а для высокоразмерных, неструктурированных, мультимодальных данных. Традиционные базы данных не были созданы для такого мира, и мы знали, что кто-то должен заново представить себе, как может выглядеть хранение и поиск данных.
Первые дни были далеко не самыми приятными. Создание инфраструктуры корпоративного уровня - это медленная, упорная работа, недели которой уходят на профилирование путей кода, переписывание компонентов и сомнения в выборе дизайна в два часа ночи. Но мы придерживались простой миссии: сделать векторный поиск доступным, масштабируемым и надежным для каждого разработчика, создающего приложения для искусственного интеллекта. Эта миссия помогла нам совершить первые прорывы и преодолеть неизбежные неудачи.
И на этом пути несколько поворотных моментов изменили все:
2019: Мы выложили в открытый доступ версию Milvus 0.10. Это означало обнажить все наши неровности - хаки, TODO, части, которыми мы еще не гордились. Но сообщество поддержало нас. Разработчики выявляли проблемы, которые мы никогда бы не нашли, предлагали функции, которые мы даже не представляли, и оспаривали предположения, которые в итоге сделали Milvus сильнее.
2020-2021: Мы присоединились к фонду LF AI & Data Foundation, выпустили Milvus 1.0, стали выпускниками LF AI & Data и победили в конкурсе векторного поиска BigANN с миллиардными масштабами - раннее доказательство того, что наша архитектура может справиться с реальными масштабами.
2022 год: корпоративным пользователям требовалось масштабирование на основе Kubernetes, эластичность и реальное разделение хранения и вычислений. Нам предстояло принять непростое решение: исправить старую систему или переделать все заново. Мы выбрали более сложный путь. Milvus 2.0 был переосмыслен с нуля, в нем была представлена полностью развязанная облачная нативная архитектура, которая превратила Milvus в платформу производственного уровня для критически важных рабочих нагрузок ИИ.
2024-2025: Zilliz (команда, стоящая за Milvus) была названа лидером по версии Forrester, перешагнула отметку в 30 000 звезд и сейчас находится за пределами 40 000. Он стал основой для мультимодального поиска, систем RAG, агентских рабочих процессов и поиска в миллиардных масштабах в различных отраслях - образовании, финансах, творчестве, научных исследованиях и других.
Эта веха была достигнута не благодаря шумихе, а благодаря тому, что разработчики выбрали Milvus для реальных производственных нагрузок и подталкивали нас к совершенствованию на каждом шагу.
2025: Два крупных релиза, значительный прирост производительности
2025 год стал годом, когда Milvus вышел в новую лигу. Хотя векторный поиск отлично справляется с семантическим пониманием, реальность в производстве проста: разработчикам по-прежнему требуется точное соответствие ключевым словам для идентификаторов продуктов, серийных номеров, точных фраз, юридических терминов и многого другого. Без встроенного полнотекстового поиска команды были вынуждены поддерживать кластеры Elasticsearch/OpenSearch или собирать собственные решения, что удваивало операционные расходы и фрагментацию.
Milvus 2.5 изменил ситуацию. В ней появился действительно собственный гибридный поиск, объединяющий полнотекстовый поиск и векторный поиск в одном движке. Впервые разработчики могли выполнять лексические запросы, семантические запросы и фильтры метаданных вместе, не используя дополнительные системы и конвейеры синхронизации. Мы также улучшили фильтрацию метаданных, разбор выражений и эффективность выполнения, чтобы гибридные запросы были естественными и быстрыми в условиях реальной производственной нагрузки.
Milvus 2.6 развил эту тенденцию, нацелившись на две проблемы, которые мы чаще всего слышим от пользователей, работающих в масштабе: стоимость и производительность. В этом выпуске были реализованы глубокие архитектурные улучшения - более предсказуемые пути запросов, более быстрое индексирование, значительно меньшее использование памяти и более эффективное хранение данных. Многие команды сообщили о немедленном увеличении производительности, не изменив ни одной строчки кода приложения.
Вот лишь несколько основных преимуществ Milvus 2.6:
Многоуровневое хранилище, позволяющее командам более разумно балансировать между стоимостью и производительностью, сокращая расходы на хранение данных на 50 %.
Огромная экономия памяти благодаря 1-битному квантованию RaBitQ - сокращение использования памяти до 72 % при сохранении скорости запросов.
Переработанный полнотекстовый движок со значительно более быстрой реализацией BM25 - до 4× быстрее Elasticsearch в наших бенчмарках.
Новый индекс Path Index для метаданных, структурированных в формате JSON, позволяет ускорить фильтрацию сложных документов до 100×.
AiSAQ: сжатие миллиардного масштаба с уменьшением объема хранения на 3200× и сильным отзывом.
Семантический + геопространственный поиск с R-Tree: Объединение информации о местонахождении предметов и их значении для получения более релевантных результатов.
CAGRA+ Vamana: Сокращение затрат на развертывание благодаря гибридному режиму CAGRA, который строится на GPU, а запросы выполняются на CPU.
Рабочий процесс"данные внутрь, данные наружу", который упрощает встраивание и извлечение данных, особенно для мультимодальных конвейеров.
Поддержка до 100 тыс. коллекций в одном кластере - важный шаг на пути к истинной многопользовательскости в масштабе.
Для более глубокого изучения Milvus 2.6 ознакомьтесь с полным описанием релиза.
За пределами Milvus: инструменты с открытым исходным кодом для разработчиков ИИ
В 2025 году мы не просто улучшили Milvus - мы создали инструменты, которые укрепляют всю экосистему разработчиков ИИ. Нашей целью было не гнаться за трендами, а предоставить разработчикам такие открытые, мощные и прозрачные инструменты, о существовании которых мы всегда мечтали.
DeepSearcher: Исследования без облачной блокировки
Deep Researcher от OpenAI доказал, на что способны агенты глубокого мышления. Но он закрыт, дорог и заблокирован за облачными API. DeepSearcher - это наш ответ. Это локальный движок глубоких исследований с открытым исходным кодом, предназначенный для тех, кто хочет проводить структурированные исследования, не жертвуя при этом контролем и конфиденциальностью.
DeepSearcher работает полностью на вашей машине, собирая информацию из разных источников, синтезируя ее и предоставляя цитаты, шаги по аргументации и возможность отслеживания - функции, необходимые для реальных исследований, а не просто резюме на поверхностном уровне. Никаких "черных ящиков". Никакой привязки к поставщику. Только прозрачный, воспроизводимый анализ, которому могут доверять разработчики и исследователи.
Клод Контекст: Помощники кодирования, которые действительно понимают ваш код
Большинство инструментов для кодирования с помощью ИИ по-прежнему ведут себя как причудливые конвейеры grep - быстрые, поверхностные, сжигающие токены и не обращающие внимания на реальную структуру проекта. Claude Context меняет эту ситуацию. Созданный как плагин для MCP, он наконец-то дает помощникам по кодингу то, чего им так не хватало: настоящее семантическое понимание вашей кодовой базы.
Claude Context строит векторный семантический индекс по всему проекту, позволяя агентам находить нужные модули, отслеживать взаимосвязи между файлами, понимать замысел на уровне архитектуры и отвечать на вопросы, руководствуясь релевантностью, а не догадками. Это позволяет сократить трату маркеров, повысить точность и, что самое важное, дать помощникам по кодингу возможность вести себя так, будто они действительно понимают ваше программное обеспечение, а не притворяются.
Оба инструмента имеют полностью открытый исходный код. Потому что инфраструктура ИИ должна принадлежать всем, и потому что будущее ИИ не должно быть заперто за проприетарными стенами.
Доверяют 10 000+ команд в производстве
Сегодня более 10 000 корпоративных команд используют Milvus в производстве - от быстрорастущих стартапов до самых известных технологических компаний и компаний из списка Fortune 500. Команды в NVIDIA, Salesforce, eBay, Airbnb, IBM, AT&T, LINE, Shopee, Roblox, Bosch и внутри Microsoft используют Milvus для питания систем искусственного интеллекта, которые работают каждую минуту каждого дня. Их рабочие нагрузки охватывают поиск, рекомендации, агентские конвейеры, мультимодальный поиск и другие приложения, которые доводят векторную инфраструктуру до предела.
Но важнее всего не то, кто использует Milvus, а то , что они с его помощью создают. Во всех отраслях промышленности Milvus стоит за системами, которые определяют методы работы, инновации и конкуренцию:
ИИ-пилоты и корпоративные ассистенты, которые улучшают поддержку клиентов, рабочие процессы продаж и принятие внутренних решений благодаря мгновенному доступу к миллиардам встроенных данных.
Семантический и визуальный поиск в электронной коммерции, СМИ и рекламе, повышающий конверсию, улучшающий поиск и ускоряющий создание креативных продуктов.
Платформы для юридической, финансовой и научной аналитики, где точность, проверяемость и соответствие нормативным требованиям приводят к реальным операционным выгодам.
Системы обнаружения мошенничества и рисков в финтех и банковской сфере, которые зависят от быстрого семантического сопоставления для предотвращения потерь в режиме реального времени.
Крупномасштабные RAG и агентские системы, обеспечивающие командам глубоко контекстуальное поведение ИИ, ориентированное на конкретную область.
Корпоративные слои знаний, объединяющие текст, код, изображения и метаданные в единую семантическую ткань.
И это не лабораторные эталоны - это одни из самых требовательных в мире производственных развертываний. Milvus регулярно выполняет их:
Поиск информации в течение менее 50 мс по миллиардам векторов
Управление миллиардами документов и событий в одной системе
Рабочие процессы на 5-10× быстрее, чем в альтернативных решениях.
Многопользовательские архитектуры, поддерживающие сотни тысяч коллекций.
Команды выбирают Milvus по простой причине: он обеспечивает скорость, надежность, экономическую эффективность и возможность масштабирования до миллиардов без разрушения архитектуры каждые несколько месяцев. Доверие, которое оказывают нам команды, - это причина, по которой мы продолжаем укреплять Milvus для предстоящего десятилетия ИИ.
Когда вам нужен Milvus без операционной службы: Zilliz Cloud
Milvus - бесплатная, мощная и проверенная в боях система. Но это также распределенная система, а хорошая работа распределенных систем - это настоящая инженерная работа. Настройка индексов, управление памятью, стабильность кластера, масштабирование, наблюдаемость... Эти задачи требуют времени и опыта, которых у многих команд просто нет. Разработчикам нужна была мощь Milvus, но без операционной нагрузки, которая неизбежно возникает при управлении им в масштабе.
Эта реальность привела нас к простому выводу: если Milvus собирается стать основной инфраструктурой для приложений искусственного интеллекта, нам нужно сделать его простым в управлении. Именно поэтому мы создали Zilliz Cloud, полностью управляемый сервис Milvus, созданный и поддерживаемый той же командой, которая стоит за проектом с открытым исходным кодом.
Zilliz Cloud предоставляет разработчикам Milvus, который они уже знают и которому доверяют, но без необходимости создавать кластеры, устранять проблемы с производительностью, планировать обновления или беспокоиться о настройке хранилищ и вычислений. А благодаря оптимизациям, которые невозможно реализовать в самоуправляемых средах, он стал еще быстрее и надежнее. Cardinal, наш самооптимизирующийся векторный движок коммерческого уровня, обеспечивает производительность в 10 раз выше, чем у Milvus с открытым исходным кодом.
Что отличает Zilliz Cloud
- Самооптимизирующаяся производительность: AutoIndex автоматически настраивает HNSW, IVF и DiskANN, обеспечивая 96 %+ отзыв при нулевой ручной настройке.
Эластичность и экономичность: Ценообразование с оплатой по факту использования, бессерверное автомасштабирование и интеллектуальное управление ресурсами часто снижают затраты на 50 % и более по сравнению с самоуправляемыми развертываниями.
Надежность корпоративного уровня: SLA на 99,95 %, резервирование с несколькимиAZ, соответствие стандартам SOC 2 Type II, ISO 27001 и GDPR. Полная поддержка RBAC, BYOC, журналов аудита и шифрования.
Развертывание без привязки к облаку: Работайте на AWS, Azure, GCP, Alibaba Cloud или Tencent Cloud - никакой привязки к поставщику, стабильная производительность везде.
Запросы на естественном языке: Встроенная поддержка MCP-сервера позволяет запрашивать данные в разговорной форме, а не вручную составлять вызовы API.
Легкая миграция: Переход с Milvus, Pinecone, Qdrant, Weaviate, Elasticsearch или PostgreSQL с помощью встроенных инструментов миграции - не требуется переписывать схему или простаивать.
100% совместимость с Milvus с открытым исходным кодом. Никаких проприетарных форков. Никакой привязки. Просто Milvus, который стал проще.
Milvus всегда будет оставаться открытым исходным кодом и бесплатным для использования. Но его надежная работа в масштабах предприятия требует значительного опыта и ресурсов. Zilliz Cloud - наш ответ на этот вопрос. Развернутое в 29 регионах и пяти основных облаках, Zilliz Cloud обеспечивает производительность, безопасность и экономическую эффективность корпоративного уровня, сохраняя при этом полную совместимость с уже известным вам Milvus.
Начать бесплатную пробную версию →
Что дальше: Milvus Lake
Как команда, представившая векторную базу данных, мы в первых рядах наблюдаем за тем, как меняются корпоративные данные. То, что когда-то умещалось в терабайтах структурированных таблиц, быстро превращается в петабайты, а вскоре и в триллионы мультимодальных объектов. Текст, изображения, аудио, видео, потоки временных рядов, журналы мультисенсорных измерений... все это теперь определяет наборы данных, на которые опираются современные системы искусственного интеллекта.
Векторные базы данных специально созданы для неструктурированных и мультимодальных данных, но они не всегда являются наиболее экономичным или архитектурно обоснованным выбором - особенно когда подавляющее большинство данных холодные. Обучающие корпорации для больших моделей, журналы восприятия автономных автомобилей и наборы данных для робототехники обычно не требуют миллисекундных задержек или высокого параллелизма. Прогон такого объема данных через векторную базу данных в реальном времени становится дорогим, тяжелым в эксплуатации и чрезмерно сложным для конвейеров, не требующих такого уровня производительности.
Эта реальность привела нас к следующей крупной инициативе: Milvus Lake -семантическое мультимодальное озеро, ориентированное на индексы и предназначенное для данных масштаба ИИ. Milvus Lake объединяет семантические сигналы всех модальностей - векторы, метаданные, метки, описания, созданные LLM, и структурированные поля - и организует их в семантические таблицы, привязанные к реальным бизнес-сущностям. Данные, которые раньше жили в виде сырых, разрозненных файлов в объектных хранилищах, хранилищах озер и конвейерах моделей, становятся единым семантическим слоем, доступным для запросов. Массивные мультимодальные корпорации превращаются в управляемые, извлекаемые, многократно используемые активы с последовательным смыслом в масштабах предприятия.
Milvus Lake построен на чистой архитектуре " манифест + данные + индекс", которая рассматривает индексирование как основополагающее, а не последующее действие. Это открывает возможности рабочего процесса "сначала получить, потом обработать", оптимизированного для работы с холодными данными триллионного масштаба, обеспечивая предсказуемую задержку, значительное снижение затрат на хранение и гораздо большую операционную стабильность. Многоуровневый подход к хранению данных - NVMe/SSD для "горячих" путей и объектные хранилища для глубоких архивов - в сочетании с эффективным сжатием и индексами с "ленивой" нагрузкой сохраняет семантическую точность, а накладные расходы на инфраструктуру остаются под строгим контролем.
Milvus Lake также легко встраивается в современную экосистему данных, интегрируясь с Paimon, Iceberg, Hudi, Spark, Ray и другими движками и форматами больших данных. Команды могут выполнять пакетную обработку, конвейеры в режиме, близком к реальному времени, семантический поиск, разработку функций и подготовку обучающих данных в одном месте, не перестраивая существующие рабочие процессы. Независимо от того, создаете ли вы корпоративные модели, управляете библиотеками симуляторов автономного вождения, обучаете агентов робототехники или используете крупномасштабные поисковые системы, Milvus Lake обеспечивает расширяемое и экономически эффективное семантическое озеро для эпохи ИИ.
Milvus Lake находится в стадии активной разработки. Заинтересованы в раннем доступе или хотите узнать больше?
Создано сообществом, для сообщества
Особенность Milvus заключается не только в технологии, но и в людях, которые за ней стоят. Наша база разработчиков охватывает весь мир, объединяя специалистов в области высокопроизводительных вычислений, распределенных систем и инфраструктуры ИИ. Инженеры и исследователи из ARM, NVIDIA, AMD, Intel, Meta, IBM, Salesforce, Alibaba, Microsoft и многих других компаний внесли свой опыт и знания в создание Milvus, чтобы он стал тем, чем является сегодня.
Каждый запрос на исправление ошибок, каждое сообщение об ошибке, каждый вопрос, заданный на наших форумах, каждый созданный учебник - все это делает Milvus лучше для всех.
Эта веха принадлежит всем вам:
Нашим соавторам: Спасибо за ваш код, ваши идеи и ваше время. Вы делаете Milvus лучше каждый день.
Нашим пользователям: Спасибо, что доверяете Milvus свои производственные рабочие нагрузки и делитесь своим опытом, как положительным, так и отрицательным. Ваши отзывы определяют нашу дорожную карту.
Сторонникам нашего сообщества: Спасибо, что отвечаете на вопросы, пишете руководства, создаете контент и помогаете новичкам начать работу. Благодаря вам наше сообщество становится гостеприимным и инклюзивным.
Нашим партнерам и интеграторам: Спасибо, что работаете с нами и делаете Milvus первоклассным гражданином в экосистеме разработки ИИ.
Команде Zilliz: Спасибо за вашу непоколебимую приверженность проекту с открытым исходным кодом и успеху наших пользователей.
Milvus вырос благодаря тому, что тысячи людей решили построить что-то вместе - открыто, щедро и с верой в то, что основополагающая инфраструктура ИИ должна быть доступна каждому.
Присоединяйтесь к нам в этом путешествии
Создаете ли вы свое первое приложение для векторного поиска или масштабируете его до миллиардов векторов, мы будем рады, если вы станете частью сообщества Milvus.
Начните:
⭐ Присоединяйтесь к нам на GitHub: github.com/milvus-io/milvus
☁️ Попробуйте Zilliz Cloud бесплатно: zilliz.com/cloud
💬 Присоединяйтесь к нашему Discord, чтобы общаться с разработчиками по всему миру
📚 Изучите нашу документацию: Документация Milvus
💬 Запишитесь на 20-минутную индивидуальную сессию, чтобы получить знания, рекомендации и ответы на свои вопросы.
Впереди захватывающий путь. По мере того как искусственный интеллект перестраивает отрасли и открывает новые возможности, векторные базы данных будут занимать центральное место в этих преобразованиях. Вместе мы создаем семантическую основу, на которую опираются современные приложения ИИ, и мы только начинаем.
За следующие 40 000 звезд и за то, чтобы вместе строить будущее инфраструктуры ИИ. 🎉
Try Managed Milvus for Free
Zilliz Cloud is hassle-free, powered by Milvus and 10x faster.
Get StartedLike the article? Spread the word



