AI Новости
Hugging Face
Свежие новости, публикации и обсуждения по теме All в разделе Hugging Face сообщества Aivizor.
Выпущена Holo3.1 — квантизованные чекпоинты и локальное исполнение для агентов управления интерфейсом
2 июня 2026 года команда Hcompany представила Holo3.1 — обновление семейства моделей для агентов, управляющих пользовательским интерфейсом.
Виктория Исаева
JetBrains представила Mellum2-12‑миллиардную MoE‑модель для низкой задержки в задачах с текстом и кодом
Mellum2 — открытая 12‑миллиардная Mixture‑of‑Experts модель от JetBrains; при инференсе активируется лишь часть параметров, что снижает задержку и расход вычислений и делает модель пригодной для интерактивных и
Елена Воронцова
IBM Research: агентная логика снижает затраты и повышает точность корпоративных AI‑агентов
1 июня 2026 года IBM Research заявила, что для масштабного внедрения ИИ в предприятиях нужны не только большие языковые модели, но и «агентная логика» — программные примитивы в составе agent harness, которые уменьшают
Дарья Лебедева
NVIDIA представила Cosmos 3 — омни‑модель для физического AI, доступную с комплектом разработчика
1 июня 2026 NVIDIA выпустила Cosmos 3 — открытую омни‑модель для физического AI с версиями Super (32B) и Nano (8B) и набором инструментов:
Виктория Исаева
Первый пост серии объясняет, как профилировать matmul в torch.profiler и читать трассы PyTorch
Публикация от 29 мая 2026 года открывает серию «Profiling in PyTorch» и на примере матричного умножения с bias показывает, как настроить torch.
Ольга Романова
Reachy Mini получил полностью локальный разговорный стек
27 мая 2026 года опубликована инструкция по запуску локального разговорного стека для Reachy Mini: весь голосовой пайплайн (VAD→STT→LLM→TTS) можно выполнять на машине пользователя, что даёт приватность и отказ от платных
Елена Воронцова
Delta Weight Sync в TRL сокращает передачу весов между тренером и vLLM
В репозитории TRL опубликован PR (27 мая 2026) с механизмом передачи только изменившихся весов: тренер кодирует дельты в sparse safetensors и загружает их в Hub bucket, а vLLM скачивает и восстанавливает актуальные веса;
Михаил Лебедев
ITBench‑AA: фронтирные модели не превысили 50% в пилотном SRE‑бенчмарке
Artificial Analysis и IBM Research 27 мая 2026 года представили ITBench — AA для оценки агентных моделей на корпоративных IT‑задачах; в пилотном наборе SRE‑инцидентов с снапшотами Kubernetes ни одна фронтирная модель не
Юлия Белова
Глоссарий по AI‑агентам объясняет разницу между «harness» и «scaffold»
Глоссарий от Sergio Paniego и Aritra Roy Gosthipaty (25 мая 2026) даёт рабочие определения ключевых терминов AI‑агентов — модель, scaffolding, harness — и обсуждает их влияние на переносимость, тестирование и инженерную
Анна Соколова
Том Арсен выпустил семейство переранжеров Ettin — шесть CrossEncoder‑моделей (19 мая 2026)
19 мая 2026 года Том Арсен опубликовал комплект из шести Sentence Transformers CrossEncoder‑переранжеров семейства Ettin — релиз включает веса, данные, скрипты и полный рецепт обучения.
Елена Воронцова
NVIDIA выпустила Nemotron‑Labs Diffusion — диффузионные языковые модели для ускоренной генерации текста
NVIDIA представила семейство Nemotron‑Labs Diffusion (3B, 8B, 14B и 8B VLM) с открытым кодом, учебным рецептом и техотчётом; модели поддерживают автогенерацию, параллельную диффузионную генерацию и гибридный режим
Наталья Тихонова
Меньше 3% страниц в экспериментах DharmaOCR забирают почти половину времени вывода из‑за «text degeneration»
Команда Dharma — AI (статья от 22 мая 2026) показала, что в их тестах на специализированной небольшой модели DharmaOCR менее 3% запросов занимают почти 50% суммарного wall‑clock времени из‑за повторяющегося «text
Михаил Лебедев
3‑миллиардная модель DharmaOCR превзошла фронтирные API по качеству и обошлась в ~50 раз дешевле
В апреле Dharma выпустила DharmaOCR — пару специализированных небольших LLM для структурированного OCR с бенчмарком и статьёй.
Ирина Орлова
AllenAI выпустила OlmoEarth v1.1 — семейство спутниковых моделей с трёхкратной экономией вычислений
19 мая 2026 года AllenAI представила OlmoEarth v1.1 — обновлённое семейство трансформерных моделей для спутникового дистанционного зондирования, которое по заявлению авторов снижает вычислительные затраты до 3× по
Елена Воронцова
NVIDIA опубликовала пошаговый рецепт дообучения Cosmos Predict 2.5 для генерации видео траекторий роботов
18 мая 2026 команда инженеров описала, как с помощью параметр‑эффективных адаптеров LoRA/DoRA дообучать Cosmos Predict 2.
Алина Карпова
PaddleOCR 3.5 позволяет запускать OCR и парсинг документов через бэкенд Transformers
18 мая 2026 команда PaddlePaddle выпустила PaddleOCR 3.5: в релизе добавлен параметр engine с опцией "transformers" и engine_config для настройки рантайма, что позволяет запускать поддерживаемые модели (включая PP‑OCRv5
Виктория Исаева
IBM Research запустила Open Agent Leaderboard для оценки качества и стоимости агентных систем
IBM Research представила Open Agent Leaderboard — открытый набор бенчмарков и фреймворк Exgentic для оценки полноценных агентных систем по качеству и стоимости;
Ольга Романова
IBM Granite выпустила R2‑релиз мультиязычных эмбеддингов с 32K контекстом
Granite Embedding Multilingual R2-два открытых эмбеддинга под Apache 2.0 (97M и 311M) с поддержкой контекста до 32 768 токенов; опубликовано 14 мая 2026.
Михаил Лебедев
Асинхронное батчирование сокращает простои GPU и может дать до ~24% ускорения инференса LLM
Во второй статье серии по эффективному инференсу LLM (14 мая 2026) показано, что разделение подготовки батчей на CPU и выполнения на GPU через асинхронное батчирование позволяет сократить простои GPU и без изменений в
Алина Карпова
AWS описала инфраструктурные «строительные блоки» для обучения и инференса foundation‑моделей
11 мая 2026 Amazon опубликовала технический пост авторов Keita Watanabe, Pavel Belevich и Aman Shanbhag, в котором описаны ключевые аппаратные и программные компоненты для масштабного обучения и вывода foundation‑моделей
Виктория Исаева
MachinaCheck: многоагентная AI‑система для автоматической оценки производимости деталей CNC на AMD MI300X
Команда под руководством Syed Muhammad Sarmad представила MachinaCheck — систему, которая за ≈30 секунд на основании загруженного STEP‑файла и трёх параметров (материал, требуемая точность, спецификации резьбы) формирует
Ксения Морозова
OncoAgent представила двухуровневую многоагентную систему для приватной клинической поддержки в онкологии
Технический препринт OncoAgent опубликован 9 мая 2026 года (Team Article, upvote 2; автор Máximo López Chenlo).
Анна Соколова
CyberSecQwen‑4B — 4‑миллиардная модель для локальной обороны в кибербезопасности
Команда lablab 8 мая 2026 года представила CyberSecQwen‑4B — 4‑миллиардную языковую модель, обученную на одном AMD Instinct MI300X для прикладных задач киберразведки;
Ольга Романова
EMO: MoE‑архитектура, которая сохраняет почти полное качество при использовании 12,5% экспертов
EMO-новая MoE‑модель с предобучением end‑to‑end, представленная 8 мая 2026 года.
Ирина Орлова
Статистика
Разделы
3
Категории
35
Темы
2099
Ответы
1
Посещаемость за месяц
За месяц
31
За 24 часа
0
За 7 дней
4
Сейчас онлайн (0)
Пользователи
0
Гости
0
Сейчас никого онлайн.