Сообщество Aivizor
Свежие темы, новости и обсуждения об ИИ, моделях, продуктах и практических сценариях.
Проект Gauntlet из Agent Builder автоматизирует адверсариальное тестирование агентов и выявляет скрытые сбои
Gauntlet, проект Kavish Sathia, вошёл в тройку лидеров Agent Builder Hackathon. Система запускает «мокающий» агент, который перехватывает и мутирует вызовы инструментов основного агента, чтобы автоматически находить
Марина Ковалева
OpenAI прекратил публикацию результатов SWE-bench Verified после аудита — это ставит под вопрос рейтинги агентов
Команда Frontier Evals (OpenAI) 23 февраля 2026 года объявила о приостановке публикации результатов SWE-bench Verified после аудита, выявившего масштабные дефекты в тестах.
Виктория Исаева
Supertone представила Supertonic 3 — третье поколение on‑device TTS в ONNX‑ассетах для 31 языка
Корейская Supertone выпустила Supertonic 3 — компактный on‑device синтезатор речи в публичных ONNX‑ассетах с поддержкой 31 ISO‑кода, улучшенной экспрессией и совместимостью с предыдущими интеграциями.
Илья Орлов
Запущен Claude for Small Business с интеграциями QuickBooks, PayPal и HubSpot
Claude for Small Business — переключаемый пакет коннекторов и готовых agentic‑workflow, который встраивает Claude прямо в повседневный стек малого бизнеса (Intuit QuickBooks, PayPal, HubSpot, Canva, DocuSign, Google
Ольга Романова
Обновления Qwen и Model Studio дали разработчикам мультимодальные и видео‑возможности
Серия апрельских обновлений из бюллетеня Big Data & AI Platform включает новые версии Qwen, улучшения генерации изображений и видео, а также корпоративную платформу Model Studio Enterprise.
Андрей Ковалев
PHAROS: прототип автоматизированного фармаконадзора, оповещающий и формирующий регдоки за ≲60 секунд
PHAROS-прототип, созданный на Hackathon Agent Builder Prajwal Sutar; извлекает данные из FDA FAERS API, считает PRR по стандартам ВОЗ, генерирует MedWatch 3500A и PSUR‑секции и отправляет критические оповещения в Slack,
Анна Соколова
Glance автоматизировала массовую нарезку часов горизонтального видео в вертикальные клипы для мобильных экранов
Glance разработала автоматизированный пайплайн, который из часов длинного видео и подкастов выделяет несколько готовых к публикации вертикальных роликов 9:16 длиной 30 — 180 секунд, используя генеративные модели (включая
Ирина Орлова
Field Technology опубликовала отчет «AI Year in Review» с пятью уроками по созданию AI‑агентов после года работы и анализа
14 мая 2026 команда Field Technology выпустила «AI Year in Review» на основе анализа более 1 млн сообщений и 209,220 нитей разговоров;
Алина Карпова
AI‑айдолы SPECTRA почти полностью срежиссировали клип «LOWKEY» с помощью Wan 2.7 и HappyHorse
Шун Фудзияши, автор и технический директор проекта SPECTRA, рассказал, как пять AI‑агентов почти автономно сгенерировали и смонтировали музыкальное видео «LOWKEY», используя Wan 2.
Елена Воронцова
Райан Роккон выпустил AI‑пакет для финансовых руководителей с агентами и готовыми рабочими процессами
13 мая 2026 года Райан Роккон представил AI‑трансформационный «стартер‑кит» для финансовых команд: в пакете — адаптированная рубрика AI‑флюентности, набор «finance‑ready» агент‑скиллов, воспроизводимые демонстрации
Алина Карпова
Toto 2.0 масштабируется до 2,5 млрд параметров и стабильно повышает качество прогнозов временных рядов
Семейство открытых моделей Toto 2.0, с размерами от 4 млн до 2,5 млрд параметров, впервые демонстрирует монотонный прирост качества при масштабировании;
Михаил Лебедев
Business AI в WhatsApp запускается в Индии — круглосуточная поддержка для малого бизнеса
В Индии запущен Business AI в приложении WhatsApp Business: доступно на всех родных языках, позволяет отвечать клиентам 24/7, собирать лиды, записывать на приём и стимулировать продажи;
Виктория Исаева
Sea внедрила Codex во все инженерные команды — 87% еженедельной активности
Sea Limited развернула Codex по всем разработческим подразделениям; внутренние данные показывают 87% еженедельной активности.
Ольга Романова
Poetiq Meta‑System автоматически собрала универсальный harness и повысила результаты LLM на LiveCodeBench Pro без дообучения
Poetiq сообщает, что её Meta‑System автоматически создала и оптимизировала inference‑harness для LiveCodeBench Pro, применив только Gemini 3.
Ксения Морозова
Доля веб‑трафика ChatGPT за год упала с 77,6% до 53,7%, Google Gemini вырос до 26,7%
Similarweb фиксирует резкое снижение доли веб‑трафика ChatGPT за 12 месяцев — с 77,6% до 53,7% — и быстрый рост Google Gemini с 7,3% до 26,7%.
Анна Соколова
Прокси‑модели заменяют большинство LLM‑вызовов в семантических SQL‑функциях и экономят более 100×
В статье, представленной 13 мая 2026 года на SIGMOD, авторы предлагают прокси‑модели — лёгкие модели, работающие на заранее вычисленных эмбеддингах (по умолчанию Gemini) — чтобы подменять большую часть дорогостоящих
Наталья Тихонова
13 мая 2026: Nicole Replogle опубликовала рейтинг платформ для создания AI‑агентов
13 мая 2026 Nicole Replogle опубликовала детальный рейтинг платформ для создания AI‑агентов и методологию тестирования.
София Громова
GitHub Copilot для JetBrains получил CLI‑агента и единый просмотр сессий
Плагин Copilot для JetBrains добавил публичную предпросмотрную версию Copilot CLI agent в IDE, единый просмотр всех агентских сессий с живым статусом и ряд инструментов для уточнений, глобальной конфигурации агентов и
Елена Воронцова
ИИ‑изображения разогнали спрос и открыли путь для китайских производителей вокруг карманной коллекции Swatch x Audemars
Фотореалистичные изображения ярких версий Royal Oak, сгенерированные ИИ и неделю разошедшиеся в Instagram, создали ложные ожидания вокруг сотрудничества Swatch и Audemars Piguet.
Марина Ковалева
Codex появился в мобильном приложении ChatGPT — контроль и управление задачами разработки со смартфона
Codex теперь доступен в мобильном приложении ChatGPT: разработчики могут мониторить, направлять и одобрять задачи кодирования в реальном времени с любого устройства.
Михаил Лебедев
Amazon Bedrock запустил Advanced Prompt Optimization для автоматической оптимизации и миграции подсказок
Advanced Prompt Optimization в консоли Amazon Bedrock автоматически переписывает и сравнивает подсказки для до пяти моделей, поддерживает мультимодальные входы (PNG, JPG, PDF) и позволяет оценивать качество через AWS
Илья Орлов
США выдали лицензии около десяти китайским компаниям на покупку NVIDIA H200, но поставки не начались
Министерство торговли США выдало экспортные лицензии примерно десяти китайским компаниям на покупку до 75 000 чипов NVIDIA H200 каждая; реальных поставок пока не было.
Ольга Романова
Гайд по CuPy: проверка CUDA‑окружения, кастомные ядра и инструменты профайлинга для ускорения на GPU
Опубликован практический материал по CuPy с пошаговой проверкой CUDA‑окружения, бенчмарками NumPy→CuPy (включая умножение матриц N=4096 и FFT длины 2^21) и набором приёмов работы с памятью, кастомными CUDA‑ядрами,
Виктория Исаева
Сотрудники Meta протестуют против обязательного ПО, собирающего данные с рабочих ноутбуков для обучения ИИ
В США и Великобритании сотрудники Meta начали внутрикорпоративные протесты и петиции против установки обязательного ПО, которое снимает экраны и фиксирует движения мыши, клики и навигацию для обучения моделей.
Юлия Белова
Статистика
Разделы
0
Категории
0
Темы
0
Ответы
0
Посещаемость за месяц
За месяц
0
За 24 часа
0
За 7 дней
0
Сейчас онлайн (0)
Пользователи
0
Гости
0
Сейчас никого онлайн.