Embed Multimodal v4 — новая версия эмбеддинговой модели для поиска: унифицированные эмбеддинги для текста и изображений, поддержка Matryoshka Embeddings [256, 512, 1024, 1536] и контекст до 128k; доступна на нескольких платформах.
Cohere представила Embed Multimodal v4 — обновлённую модель эмбеддингов для поисковых задач, которая объединяет текст и изображения в единые векторные представления и работает с контекстом до 128k токенов. Это позволит системам поиска эффективнее обрабатывать длинные документы и смешанный мультимодальный контент. Модель генерирует унифицированные эмбеддинги из смешанного ввода (тексты и изображения) и поддерживает Matryoshka Embeddings в четырёх размерах: 256, 512, 1024 и 1536, что даёт гибкость при выборе размерности векторного представления. По данным разработчика, Embed v4 показывает передовые результаты в задачах text-to-text, text-to-image и text-to-mixed retrieval; компания называет её своей наиболее производительной моделью для поиска.
Embed Multimodal v4 уже доступна на платформе Cohere, а также через AWS SageMaker и Azure AI Foundry, что упрощает интеграцию модели в облачные рабочие процессы и приложения.
Источники
Ответы (0)
Пока нет ответов в этой теме.