AI Новости
Hugging Face
Свежие новости, публикации и обсуждения по теме All в разделе Hugging Face сообщества Aivizor.
LoRA‑дообучение Qwen3‑1.7B для MedQA на AMD Instinct MI300X (ROCm) — полный пайплайн без CUDA
Команда опубликовала MedQA — пошаговый пайплайн LoRA‑дообучения Qwen3‑1.7B на одном AMD Instinct MI300X под ROCm: 2 000 примеров MedMCQA, обучение в fp16 без 4‑/8‑битной квантизации за ≈5 минут, ~2,228,224 обучаемых
София Громова
vLLM V1 вернул поведение V0 после исправлений логвероятностей в PipelineRL
Опубликовано 6 мая 2026 г. Авторы: Rafael Pardinas и Ehsan Kamalloo. При миграции inference‑движка vLLM с V0 (0.8.5) на V1 (0.18.
Андрей Ковалев
Open ASR Leaderboard ввёл приватные наборы Appen и DataoceanAI, чтобы снизить риск benchmaxxing
Платформа добавила высококачественные англоязычные наборы от Appen Inc. и DataoceanAI, но оставила их приватными, чтобы предотвратить целевую оптимизацию под тестовые примеры.
Ксения Морозова
Оценка ИИ-моделей: новое узкое место в вычислительных ресурсах
Растущие расходы на оценку моделей искусственного интеллекта, особенно автономных агентов, превращают этот этап в значительное вычислительное узкое место, иногда превосходящее затраты на предварительное обучение.
Андрей Ковалев
IBM представила семейство LLM Granite 4.1, превосходящее предшественников по производительности
IBM выпустила семейство больших языковых моделей (LLM) Granite 4.1 под лицензией Apache 2.0.
Виктория Исаева
NVIDIA выпустила Nemotron 3 Nano Omni: открытую мультимодальную модель с длинным контекстом для комплексной обработки документов, аудио и видео
Компания NVIDIA представила Nemotron 3 Nano Omni-новую открытую омнимодальную модель с гибридной архитектурой, объединяющую глубокий анализ текста, изображений, аудио и видео в едином контекстном окне для создания
Ксения Морозова
Архитектура NV — Raw2Insights-US переводит ультразвуковую диагностику на прямую обработку акустических данных в реальном времени
Компании NVIDIA и Siemens Healthineers представили инновационную ИИ-модель NV — Raw2Insights-US, которая отказывается от традиционной реконструкции изображений в пользу прямого анализа акустических сигналов с
Ольга Романова
Компания OpenAI выпустила open-source модель Privacy Filter с контекстом 128 тысяч токенов для обнаружения
Компания OpenAI выпустила open-source модель Privacy Filter с контекстом 128 тысяч токенов для обнаружения персональных данных.
Ирина Орлова
Добро пожаловать в Gemma 4: Передовой мультимодальный интеллект на пользовательских устройствах
Google DeepMind совместно с платформой Hugging Face представили семейство открытых мультимодальных моделей Gemma 4.
Ирина Орлова
Архитектура раннего слияния: как Falcon Perception меняет подход к машинному зрению
Исследовательская группа TII представила Falcon Perception и Falcon OCR-новые компактные модели, объединяющие обработку текста и изображений в едином трансформере с гибридным вниманием.
Анна Соколова
Подробный обзор обновления Sentence Transformers 5.4 от Hugging Face
Глубокий анализ обновления Sentence Transformers 5.4, привносящего нативную поддержку мультимодальных моделей встраивания и ранжирования для обработки текстов, изображений, аудио и видео через единый интерфейс.
Ольга Романова
DeepSeek — V4: Архитектурный прорыв для длительных агентных сессий с контекстом в миллион токенов
Компания DeepSeek представила открытые модели V4-Pro и V4-Flash с гибридной архитектурой внимания, радикально снижающей потребление памяти и вычислительных ресурсов при работе с контекстом до миллиона токенов, что
Анна Соколова
Разбор архитектуры для запуска локальных нейросетей в расширениях Chrome
Подробное практическое руководство по интеграции локальных ИИ-моделей в браузерные расширения. Рассматриваются особенности архитектуры стандарта Manifest V3, строгое разделение ответственности между фоновыми процессами и
Наталья Тихонова
IBM Research и Hugging Face представили VAKRA: новый бенчмарк для оценки ИИ-агентов в корпоративной среде
IBM Research и Hugging Face выпустили VAKRA-бенчмарк для оценки ИИ-агентов в корпоративных условиях, опубликованный 15 апреля 2026 года.
Елена Воронцова
Hugging Face представила Gemma 4 VLA: мультимодальный ИИ работает полностью локально на NVIDIA Jetson Orin Nano Super
Hugging Face продемонстрировала мультимодальную модель Gemma 4 VLA, работающую полностью локально на NVIDIA Jetson Orin Nano Super.
Дарья Лебедева
Качественные изменения в мультимодальных моделях: новые возможности от Sentence Transformers
Библиотека Sentence Transformers расширяет свои функции, предлагая инструменты для обучения мультимодальных моделей, которые обрабатывают текст, изображения, аудио и видео, что значительно улучшает их производительность
Елена Воронцова
Будущее кибербезопасности с использованием ИИ: открытость имеет значение
С запуском Mythos и Project Glasswing глобальные организации начинают осознавать новый этап в кибербезопасности, где открытые инструменты и подходы играют критическую роль в защите программного обеспечения.
Алина Карпова
QIMMA قِمّة: Лидерборд качественных арабских LLM
Запуск QIMMA представляет собой новый этап в оценке языковых моделей для арабского языка, предлагая системный подход к валидации и сравнительному анализу.
Анна Соколова
Искусственный интеллект для корейского контекста: создание агентов с помощью синтетических персон
Новый набор данных от NVIDIA, позволяющий создавать корейских AI-агентов, учитывает культурные и демографические особенности корейского общества.
Михаил Лебедев
Статистика
Разделы
3
Категории
35
Темы
2102
Ответы
1
Посещаемость за месяц
За месяц
31
За 24 часа
0
За 7 дней
4
Сейчас онлайн (0)
Пользователи
0
Гости
0
Сейчас никого онлайн.