MemEx сокращает токен‑затраты и повышает точность LLM‑агентов за счёт «живой» Python‑памяти

Новость

Редактор аналитических материалов

5/23/2026, 6:55:32 PM

MemEx сокращает токен‑затраты и повышает точность LLM‑агентов за счёт «живой» Python‑памяти

В публикации от 19 мая 2026 года описан MemEx — программируемый «черновик» на Python для агентных LLM, который хранит выводы инструментов как объекты в единой среде выполнения, материализуя в контексте модели только явные выводы.

MemEx — новый программируемый scratchpad для агентных LLM, представленный в блоге 19 мая 2026 года, сохраняет выводы инструментов в оперативной Python‑среде и тем самым снижает объём токенов, попадающих в контекст модели. Это важно для корпоративных агентов: подход уменьшает стоимость взаимодействий с большими моделями и позволяет обрабатывать объёмы данных, которые не помещаются в единственное контекстное окно.

Технически MemEx реализован как типизированное Python‑ядро, где агент при каждом шаге добавляет блок кода в общее живое пространство имён. Инструменты экспонируются как типизированные Python‑функции с явными типами параметров и возвращаемых значений; результаты сохраняются не как строки, а как объекты Python. Только явный print материализуется в виде токенов для модели, остальные промежуточные данные доступны для фильтрации, агрегации и композиции в коде до финальной подачи в модель.

Авторы позиционируют MemEx внутри семьи «code‑as‑action» (с отсылками на CodeAct, Anthropic Programmatic Tool Calling и Cloudflare Code Mode), но выделяют его интеграцию с ReAct‑стилем агентов: постоянная область видимости даёт примитивы для запуска суб‑агентов, параллельного «мышления» по нескольким траекториям и аудита внутренних следов работы агента. Встроенная среда облегчает асинхронный запуск и последующую агрегацию результатов без дополнительных проходов через основную модель.

По приведённым в публикации результатам для корпоративных задач структурированного поиска MemEx сдвигает фронтир «точность‑против‑стоимости». Frontier‑модели Opus 4.6 и Sonnet 4.6 показали прирост точности на 2–5 процентных пунктов при сокращении токен‑затрат на 25 — 30%. Модели Qwen3.5 (122B) улучшились с 18% до 36%, а Qwen3.5 (397B) — с 20% до 38% одновременно с уменьшением токен‑стоимости на 40 — 50%. Эти цифры авторы приводят как иллюстрацию эффективности подхода на реальных рабочих задачах.

Практические преимущества для разработчиков включают хранение произвольно больших входов в виде переменных Python, возврат типизированных объектов вместо строк, прямую композицию вызовов инструментов без материализации промежуточных результатов и возможность программной нарезки или суммаризации вывода. В качестве рабочего примера приводится сценарий агента Genie, который за один запрос комбинирует таблицы, векторные индексы и дашборды клиента — при этом MemEx предотвращает «разлив» данных в контекст модели и уменьшает лишние токен‑затраты.

Источники

Databricks Blog · 5/19/2026

Ответы (0)

Пока нет ответов в этой теме.