Lindorm bate récords de QPS y baja latencia en VectorDBBench para búsquedas vectoriales

News

5/11/2026, 9:59:12 AM

Lindorm bate récords de QPS y baja latencia en VectorDBBench para búsquedas vectoriales

Lindorm actualizó su Vector Retrieval Service y obtuvo resultados destacados en VectorDBBench: en Cohere — 10M alcanzó 24,346 QPS con P99 de 2.5 ms y recall >99%; en Cohere — 1M superó 56,000 QPS con latencia cercana a 2 ms.

Lindorm ha desplegado una actualización de su Vector Retrieval Service y ha registrado picos de rendimiento en las pruebas estándar VectorDBBench, un resultado significativo para aplicaciones de IA que exigen alta concurrencia y latencias ultrabajas. En pruebas con los conjuntos Cohere — 10M y Cohere — 1M, la base de datos mostró tanto tasas de consulta por segundo (QPS) muy elevadas como latencias P99 de milisegundos, lo que sugiere capacidad para entornos de producción exigentes. Esto afecta directamente a equipos que integran modelos LLM en búsqueda, recomendación o publicidad al reducir la latencia percibida y la carga de infraestructura.

Las mediciones se compararon con otros servicios listados en VectorDBBench. En la prueba Cohere — 10M, Zilliz Cloud registró 3,957 QPS, en tanto que el récord previo indicado era de 18,000 QPS. En escalas más reducidas, productos de código abierto como Milvus y OpenSearch aparecen alrededor de los 3,000 QPS según los mismos conjuntos de pruebas y datos presentados.

La metodología empleada utiliza el conjunto estándar de Cohere y la herramienta VectorDBBench operando en modo sin Query Cache; las pruebas se realizaron sobre hardware de especificación 32 cores y 128 GB (32C128G). El motor evaluado corresponde a Lindorm versión 3.10.16 o posterior, y el informe precisa que se aplicaron prácticas y hardware estándar de la industria para garantizar la reproducibilidad de los resultados.

Técnicamente, Lindorm incorpora un optimizador híbrido CBO/RBO y una arquitectura de índice híbrido adaptable que enruta planes de ejecución según el rango de filtrado. Con ratios de filtrado bajos activa una navegación vector‑primero con filtrado escalar en paralelo (cross‑pipeline), manteniendo QPS superiores a 50,000; con ratios de filtrado altos cambia a un modo escalar‑dirigido usando Bitmap/inverted index y reporta QPS por encima de 260,000 y recall por encima del 90% en todas las ramas evaluadas.

La combinación de alto rendimiento y precisión descrita en el informe sugiere que Lindorm puede sostener cargas de producción que requieren tanto búsqueda vectorial pura como escenarios híbridos con filtros complejos. Para operadores de sistemas de recomendación, búsqueda empresarial o publicidad basada en embeddings, estos resultados implican potenciales ahorros en infraestructura y mejoras en la experiencia del usuario al reducir tiempos de respuesta sin sacrificar la calidad de recuperación.

Fuentes

Alibaba Cloud Blog · 5/11/2026

Respuestas (0)

Aún no hay respuestas en este tema.

Atrás