
El 14 de mayo de 2026 se anunciaron dos nuevos modelos de la familia Granite para incrustaciones multilingües: granite — embedding-311m-multilingual-r2 y granite — embedding-97m-multilingual-r2. Ambos están basados en ModernBERT, se publican con licencia Apache 2.0 y se diseñaron para despliegues empresariales e integración directa en pilas de recuperación y generación con IA. Esto reduce la tradicional dicotomía entre cobertura lingüística y tamaño del modelo, facilitando implementaciones multilingües en entornos productivos.
Los modelos difieren en arquitectura y salida: la variante completa tiene 311 millones de parámetros y produce vectores de 768 dimensiones, además de añadir soporte para Matryoshka embeddings; la versión compacta cuenta con 97 millones de parámetros y vectores de 384 dimensiones. Ambos cubren más de 200 idiomas, fueron afinados en 52 lenguas, admiten recuperación de código en nueve lenguajes y manejan contextos de hasta 32,768 tokens, una ampliación significativa frente a la generación anterior de Granite.
En pruebas públicas de MTEB Multilingual Retrieval, el modelo de 97M obtuvo una puntuación de 60.3, un resultado que el anuncio presenta como superior a cualquier embedder multilingüe abierto por debajo de 100M de parámetros. La variante de 311M registró 65.2 en la misma métrica y figura como el segundo mejor entre los modelos abiertos por debajo de 500M parámetros. Según el comunicado, ambas versiones multiplican por 64 el contexto con respecto a la versión R1 del conjunto Granite, lo que explica la mejora en tareas de recuperación sobre colecciones extensas.
Para integración y despliegue, los modelos se ofrecen como sustitutos “drop-in” en marcos y almacenes habituales sin cambios de API: LangChain, LlamaIndex, Haystack y Milvus. La combinación de licencia Apache 2.0, compatibilidad lista para producción y las capacidades de contexto y multidominio posicionan a estos modelos como opciones prácticas para equipos que necesitan retrieval — augmented generation, búsqueda cross — lingual y recuperación de código en escenarios internacionales.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.