Mira Murati presenta modelos que usan cámara y micrófono para colaboración humano–IA

News

5/15/2026, 10:26:20 AM

Mira Murati presenta modelos que usan cámara y micrófono para colaboración humano–IA

Mira Murati, fundadora de Thinking Machines Lab y exdirectora técnica de OpenAI (salió en 2024), mostró demostraciones de una nueva familia de “interaction models” que procesan audio y video de forma continua para colaborar con personas;

Mira Murati, fundadora de Thinking Machines Lab y exdirectora técnica de OpenAI (salió en 2024), ha expuesto una apuesta por sistemas de inteligencia artificial que colaboran directamente con las personas en lugar de sustituirlas. En declaraciones del equipo, Murati sostiene que la vía preferible es mantener a los usuarios integrados en la interacción con la IA; si se cumple, el enfoque podría cambiar cómo se diseñan asistentes que operan en contextos humanos dinámicos.

Thinking Machines presentó en video una nueva familia de modelos que denomina “interaction models”: sistemas entrenados para comunicarse con una persona mediante cámara y micrófono y para interpretar la comunicación humana de forma continua — incluyendo pausas, interrupciones y cambios de tono-en vez de limitarse a transcribir voz y remitirla a un modelo de lenguaje convencional. Las demostraciones mostraron respuestas contextuales en tiempo real, aunque los modelos exhibidos no han sido liberados públicamente.

Además de estas demos, la empresa comercializa hoy Tinker, un producto lanzado en octubre de 2025 que permite refinar modelos de frontera con datos personalizados. Tinker está disponible como API para investigadores e ingenieros y se usa para ajustar modelos de código abierto, según la compañía; es hasta ahora el único producto que Thinking Machines ha puesto en el mercado. La compañía, cofundada por varios ingenieros prominentes, ha recaudado miles de millones para desarrollar su visión de una IA colaborativa. Esa financiación sostiene tanto el trabajo en los interaction models como el soporte a herramientas como Tinker, pero no garantiza que las capacidades mostradas en entornos controlados se reproduzcan igual en despliegues a gran escala.

El enfoque de Murati contrasta con la dirección de otros grandes actores del sector: empresas que desarrollan modelos de gran escala — incluyendo OpenAI, Anthropic y Google — avanzan hacia sistemas capaces de ejecutar tareas complejas a partir de indicaciones textuales y con poca supervisión humana durante la ejecución. Laboratorios como Humans& y varios economistas también han abogado por diseños que prioricen la colaboración y el empoderamiento humano.

Alexander Kirillov, miembro fundador y especialista en sistemas multimodales del equipo, resumió la propuesta señalando que “el modelo percibe constantemente lo que haces y está ahí para responder, dar información, buscar datos o usar otras herramientas”. Pese a esa descripción, las limitaciones son claras: los interaction models no están disponibles públicamente, y el despliegue real, la accesibilidad para desarrolladores y el desempeño fuera de demostraciones controladas siguen sin verificarse de forma independiente.

Fuentes

WIRED AI · 5/15/2026

Respuestas (0)

Aún no hay respuestas en este tema.

Atrás