Скины Креативы Сообщество

AI Новости

Hugging Face

Свежие новости, публикации и обсуждения по теме All в разделе Hugging Face сообщества Aivizor.

Hugging Face

Выпущена Holo3.1 — квантизованные чекпоинты и локальное исполнение для агентов управления интерфейсом

Выпущена Holo3.1 — квантизованные чекпоинты и локальное исполнение для агентов управления интерфейсом

AI Новости · Hugging Face

2 июня 2026 года команда Hcompany представила Holo3.1 — обновление семейства моделей для агентов, управляющих пользовательским интерфейсом.

Виктория Исаева

JetBrains представила Mellum2-12‑миллиардную MoE‑модель для низкой задержки в задачах с текстом и кодом

JetBrains представила Mellum2-12‑миллиардную MoE‑модель для низкой задержки в задачах с текстом и кодом

AI Новости · Hugging Face

Mellum2 — открытая 12‑миллиардная Mixture‑of‑Experts модель от JetBrains; при инференсе активируется лишь часть параметров, что снижает задержку и расход вычислений и делает модель пригодной для интерактивных и

Елена Воронцова

IBM Research: агентная логика снижает затраты и повышает точность корпоративных AI‑агентов

IBM Research: агентная логика снижает затраты и повышает точность корпоративных AI‑агентов

AI Новости · Hugging Face

1 июня 2026 года IBM Research заявила, что для масштабного внедрения ИИ в предприятиях нужны не только большие языковые модели, но и «агентная логика» — программные примитивы в составе agent harness, которые уменьшают

Дарья Лебедева

NVIDIA представила Cosmos 3 — омни‑модель для физического AI, доступную с комплектом разработчика

NVIDIA представила Cosmos 3 — омни‑модель для физического AI, доступную с комплектом разработчика

AI Новости · Hugging Face

1 июня 2026 NVIDIA выпустила Cosmos 3 — открытую омни‑модель для физического AI с версиями Super (32B) и Nano (8B) и набором инструментов:

Виктория Исаева

Первый пост серии объясняет, как профилировать matmul в torch.profiler и читать трассы PyTorch

Первый пост серии объясняет, как профилировать matmul в torch.profiler и читать трассы PyTorch

AI Новости · Hugging Face

Публикация от 29 мая 2026 года открывает серию «Profiling in PyTorch» и на примере матричного умножения с bias показывает, как настроить torch.

Ольга Романова

Reachy Mini получил полностью локальный разговорный стек

Reachy Mini получил полностью локальный разговорный стек

AI Новости · Hugging Face

27 мая 2026 года опубликована инструкция по запуску локального разговорного стека для Reachy Mini: весь голосовой пайплайн (VAD→STT→LLM→TTS) можно выполнять на машине пользователя, что даёт приватность и отказ от платных

Елена Воронцова

Delta Weight Sync в TRL сокращает передачу весов между тренером и vLLM

Delta Weight Sync в TRL сокращает передачу весов между тренером и vLLM

AI Новости · Hugging Face

В репозитории TRL опубликован PR (27 мая 2026) с механизмом передачи только изменившихся весов: тренер кодирует дельты в sparse safetensors и загружает их в Hub bucket, а vLLM скачивает и восстанавливает актуальные веса;

Михаил Лебедев

ITBench‑AA: фронтирные модели не превысили 50% в пилотном SRE‑бенчмарке

ITBench‑AA: фронтирные модели не превысили 50% в пилотном SRE‑бенчмарке

AI Новости · Hugging Face

Artificial Analysis и IBM Research 27 мая 2026 года представили ITBench — AA для оценки агентных моделей на корпоративных IT‑задачах; в пилотном наборе SRE‑инцидентов с снапшотами Kubernetes ни одна фронтирная модель не

Юлия Белова

Глоссарий по AI‑агентам объясняет разницу между «harness» и «scaffold»

Глоссарий по AI‑агентам объясняет разницу между «harness» и «scaffold»

AI Новости · Hugging Face

Глоссарий от Sergio Paniego и Aritra Roy Gosthipaty (25 мая 2026) даёт рабочие определения ключевых терминов AI‑агентов — модель, scaffolding, harness — и обсуждает их влияние на переносимость, тестирование и инженерную

Анна Соколова

Том Арсен выпустил семейство переранжеров Ettin — шесть CrossEncoder‑моделей (19 мая 2026)

Том Арсен выпустил семейство переранжеров Ettin — шесть CrossEncoder‑моделей (19 мая 2026)

AI Новости · Hugging Face

19 мая 2026 года Том Арсен опубликовал комплект из шести Sentence Transformers CrossEncoder‑переранжеров семейства Ettin — релиз включает веса, данные, скрипты и полный рецепт обучения.

Елена Воронцова

NVIDIA выпустила Nemotron‑Labs Diffusion — диффузионные языковые модели для ускоренной генерации текста

NVIDIA выпустила Nemotron‑Labs Diffusion — диффузионные языковые модели для ускоренной генерации текста

AI Новости · Hugging Face

NVIDIA представила семейство Nemotron‑Labs Diffusion (3B, 8B, 14B и 8B VLM) с открытым кодом, учебным рецептом и техотчётом; модели поддерживают автогенерацию, параллельную диффузионную генерацию и гибридный режим

Наталья Тихонова

Меньше 3% страниц в экспериментах DharmaOCR забирают почти половину времени вывода из‑за «text degeneration»

Меньше 3% страниц в экспериментах DharmaOCR забирают почти половину времени вывода из‑за «text degeneration»

AI Новости · Hugging Face

Команда Dharma — AI (статья от 22 мая 2026) показала, что в их тестах на специализированной небольшой модели DharmaOCR менее 3% запросов занимают почти 50% суммарного wall‑clock времени из‑за повторяющегося «text

Михаил Лебедев

3‑миллиардная модель DharmaOCR превзошла фронтирные API по качеству и обошлась в ~50 раз дешевле

3‑миллиардная модель DharmaOCR превзошла фронтирные API по качеству и обошлась в ~50 раз дешевле

AI Новости · Hugging Face

В апреле Dharma выпустила DharmaOCR — пару специализированных небольших LLM для структурированного OCR с бенчмарком и статьёй.

Ирина Орлова

AllenAI выпустила OlmoEarth v1.1 — семейство спутниковых моделей с трёхкратной экономией вычислений

AllenAI выпустила OlmoEarth v1.1 — семейство спутниковых моделей с трёхкратной экономией вычислений

AI Новости · Hugging Face

19 мая 2026 года AllenAI представила OlmoEarth v1.1 — обновлённое семейство трансформерных моделей для спутникового дистанционного зондирования, которое по заявлению авторов снижает вычислительные затраты до 3× по

Елена Воронцова

NVIDIA опубликовала пошаговый рецепт дообучения Cosmos Predict 2.5 для генерации видео траекторий роботов

NVIDIA опубликовала пошаговый рецепт дообучения Cosmos Predict 2.5 для генерации видео траекторий роботов

AI Новости · Hugging Face

18 мая 2026 команда инженеров описала, как с помощью параметр‑эффективных адаптеров LoRA/DoRA дообучать Cosmos Predict 2.

Алина Карпова

PaddleOCR 3.5 позволяет запускать OCR и парсинг документов через бэкенд Transformers

PaddleOCR 3.5 позволяет запускать OCR и парсинг документов через бэкенд Transformers

AI Новости · Hugging Face

18 мая 2026 команда PaddlePaddle выпустила PaddleOCR 3.5: в релизе добавлен параметр engine с опцией "transformers" и engine_config для настройки рантайма, что позволяет запускать поддерживаемые модели (включая PP‑OCRv5

Виктория Исаева

IBM Research запустила Open Agent Leaderboard для оценки качества и стоимости агентных систем

IBM Research запустила Open Agent Leaderboard для оценки качества и стоимости агентных систем

AI Новости · Hugging Face

IBM Research представила Open Agent Leaderboard — открытый набор бенчмарков и фреймворк Exgentic для оценки полноценных агентных систем по качеству и стоимости;

Ольга Романова

IBM Granite выпустила R2‑релиз мультиязычных эмбеддингов с 32K контекстом

IBM Granite выпустила R2‑релиз мультиязычных эмбеддингов с 32K контекстом

AI Новости · Hugging Face

Granite Embedding Multilingual R2-два открытых эмбеддинга под Apache 2.0 (97M и 311M) с поддержкой контекста до 32 768 токенов; опубликовано 14 мая 2026.

Михаил Лебедев

Асинхронное батчирование сокращает простои GPU и может дать до ~24% ускорения инференса LLM

Асинхронное батчирование сокращает простои GPU и может дать до ~24% ускорения инференса LLM

AI Новости · Hugging Face

Во второй статье серии по эффективному инференсу LLM (14 мая 2026) показано, что разделение подготовки батчей на CPU и выполнения на GPU через асинхронное батчирование позволяет сократить простои GPU и без изменений в

Алина Карпова

AWS описала инфраструктурные «строительные блоки» для обучения и инференса foundation‑моделей

AWS описала инфраструктурные «строительные блоки» для обучения и инференса foundation‑моделей

AI Новости · Hugging Face

11 мая 2026 Amazon опубликовала технический пост авторов Keita Watanabe, Pavel Belevich и Aman Shanbhag, в котором описаны ключевые аппаратные и программные компоненты для масштабного обучения и вывода foundation‑моделей

Виктория Исаева

MachinaCheck: многоагентная AI‑система для автоматической оценки производимости деталей CNC на AMD MI300X

MachinaCheck: многоагентная AI‑система для автоматической оценки производимости деталей CNC на AMD MI300X

AI Новости · Hugging Face

Команда под руководством Syed Muhammad Sarmad представила MachinaCheck — систему, которая за ≈30 секунд на основании загруженного STEP‑файла и трёх параметров (материал, требуемая точность, спецификации резьбы) формирует

Ксения Морозова

OncoAgent представила двухуровневую многоагентную систему для приватной клинической поддержки в онкологии

OncoAgent представила двухуровневую многоагентную систему для приватной клинической поддержки в онкологии

AI Новости · Hugging Face

Технический препринт OncoAgent опубликован 9 мая 2026 года (Team Article, upvote 2; автор Máximo López Chenlo).

Анна Соколова

CyberSecQwen‑4B — 4‑миллиардная модель для локальной обороны в кибербезопасности

CyberSecQwen‑4B — 4‑миллиардная модель для локальной обороны в кибербезопасности

AI Новости · Hugging Face

Команда lablab 8 мая 2026 года представила CyberSecQwen‑4B — 4‑миллиардную языковую модель, обученную на одном AMD Instinct MI300X для прикладных задач киберразведки;

Ольга Романова

EMO: MoE‑архитектура, которая сохраняет почти полное качество при использовании 12,5% экспертов

EMO: MoE‑архитектура, которая сохраняет почти полное качество при использовании 12,5% экспертов

AI Новости · Hugging Face

EMO-новая MoE‑модель с предобучением end‑to‑end, представленная 8 мая 2026 года.

Ирина Орлова

1 / 2

Статистика

Разделы

3

Категории

35

Темы

2099

Ответы

1

Посещаемость за месяц

За месяц

31

За 24 часа

0

За 7 дней

4

Сейчас онлайн (0)

Пользователи

0

Гости

0

Сейчас никого онлайн.