Lindorm обновил Vector Retrieval Service и побил рекорды в бенчмарке VectorDBBench

Новость

Редактор новостной ленты

5/11/2026, 9:49:32 AM

Lindorm обновил Vector Retrieval Service и побил рекорды в бенчмарке VectorDBBench

Обновлённый Vector Retrieval Service в облачной СУБД Lindorm занял лидирующие позиции в VectorDBBench, показав рекордную пропускную способность при низкой задержке и сохранив высокую точность поиска на наборах Cohere‑1M и Cohere‑10M.

Lindorm обновил свой Vector Retrieval Service и в бенчмарке VectorDBBench продемонстрировал рекордную пропускную способность при ультранизкой задержке, что важно для промышленных приложений с большими объёмами векторных данных. На наборе Cohere‑10M одиночная нода с конфигурацией 32 ядра показала пиковую пропускную способность 24 346 QPS при P99‑латентности 2,5 мс; для обоих использованных наборов (1M и 10M) система сохранила recall выше 99%, то есть высокая скорость не снизила точность поиска.

На масштабе Cohere‑1M Lindorm превысил 56 000 QPS при задержке около 2 мс, тогда как у ряда популярных open‑source решений типичные значения QPS находятся порядка ~3 000. В отчёте приводятся сравнения с облачными сервисами: Zilliz Cloud показал 3 957 QPS на 10M, а предыдущий рекорд SOTA составлял примерно 18 000 QPS-результаты Lindorm заметно выше этих показателей. Ключ к достижениям — гибридная стратегия поиска и оптимизация планов выполнения: система использует CBO/RBO‑оптимизатор и адаптивную гибридную индексную архитектуру, которые автоматически выбирают более эффективный план в зависимости от коэффициента фильтрации. Для всех ветвей выполнения бенчмарка заявлен recall выше 90%, что свидетельствует о сохранении полноты выборки при комбинированных запросах со скалярными фильтрами.

Тесты показали разные маршруты исполнения в зависимости от жёсткости фильтров. При небольшой доле фильтрации включается «vector‑first» режим с кросс‑пайплайновой обработкой скалярных условий, что даёт QPS >50 000. При жёстких фильтрах автоматически активируется «scalar‑driven» режим с использованием Bitmap и инвертированных индексов, где система достигает QPS >260 000 — по автору, такой подход предотвращает «коллапс» производительности, характерный для традиционных схем при тяжёлых скалярных фильтрах. Для воспроизводимости результатов использовались стандартные аппаратные спецификации и открытые инструменты; все измерения проводились в режиме без Query Cache. Испытания выполнялись в реальной облачной среде с экземпляром Lindorm конфигурации 32C128G (32 ядра, 128 ГБ памяти), а векторный движок использовал версию 3.10.16 или новее; нагрузочные тесты запускались через VectorDBBench.

Источники

Alibaba Cloud Blog · 5/11/2026

Ответы (0)

Пока нет ответов в этой теме.