Noticias De IA
Hugging Face
Temas, noticias y debates recientes sobre All en Hugging Face dentro de la Comunidad Aivizor.
IBM Research: la 'Agent Logic' mejora agentes de IA en cargas mainframe complejas
El 1 de junio de 2026 IBM Research publicó un análisis técnico que describe diseños y pruebas de agentes que incorporan «agent logic» —primitivas de software que guían modelos de lenguaje— y muestra beneficios concretos
Mateo Arriaga
NVIDIA lanza Cosmos 3, omni‑modelo abierto para IA física y control de acciones
Cosmos 3 reúne generación de entornos, razonamiento físico y producción de acciones en un único omni‑modelo Mixture‑of‑Transformers; se publicó el 1 de junio de 2026 en versiones Nano (dos componentes de 8B) y Super (dos
Inés Montoya
El 29 de mayo de 2026 se publicó la primera entrega de una serie didáctica sobre profiling en PyTorch que introduce
El 29 de mayo de 2026 se publicó la primera entrega de una serie didáctica sobre profiling en PyTorch que introduce torch.profiler mediante un ejemplo mínimo (matmul + bias).
Álvaro Rivas
TRL implementa sincronización de pesos por delta y reduce el tráfico por paso a 20–35 MB en Qwen3-0.6B
El 27 de mayo de 2026 TRL incorporó una ruta que codifica y publica solo los elementos de peso que cambian como un safetensors sparse en un Hub bucket; en pruebas con Qwen3-0.6B el volumen transferido por paso se redujo de 1.
Mihail Lebedev
Reachy Mini puede ejecutar su pila conversacional completamente en local
El 27 de mayo de 2026 los autores Amir Mahla y Andres Marafioti publicaron una guía para ejecutar todo el stack conversacional de Reachy Mini en la máquina del usuario, evitando que el audio salga a servidores externos mediante la librería speech — to-speech y
Elena Vorontsova
Glosario técnico define 'harness' y 'scaffold' para desarrolladores de agentes de IA
Un glosario publicado el 25 de mayo de 2026 por Sergio Paniego y Aritra Roy Gosthipaty clarifica las diferencias prácticas entre modelo, scaffold y harness para reducir ambigüedades en diseño, despliegue y evaluación de
Elena Castellanos
NVIDIA lanza Nemotron‑Labs Diffusion: modelos DLM (3B, 8B, 14B) y un VLM 8B para reducir latencia
El 23 de mayo de 2026 NVIDIA presentó Nemotron‑Labs Diffusion, una familia de modelos que combina generación por difusión y autoregresión (3B, 8B, 14B y un VLM 8B), acompañada de código, receta de entrenamiento y un
Diego Santillán
Modelo especializado de 3.000 millones de parámetros supera APIs frontier en tarea empresarial de OCR con coste 50 veces
Un equipo de Dharma midió que un modelo especializado de 3.000 millones de parámetros venció a las APIs frontier en una tarea empresarial concreta de OCR estructurado, con un coste operativo aproximadamente 50 veces
Inés Montoya
Degeneración de texto en DharmaOCR: menos del 3% de páginas consumen casi la mitad del tiempo de inferencia
Al especializar un modelo pequeño para OCR en PDFs (DharmaOCR), los autores detectaron que una minoría de páginas degeneradas — que entran en bucles repetitivos y no emiten token EOS-puede acaparar casi el 50% del tiempo
Nicolás Vélez
Lanzan Open Agent Leaderboard para evaluar sistemas completos de agentes de IA
Publicado el 18 de mayo de 2026. Autor: Elron Bandel (IBM Research). Upvote 1. ¿Qué tan buenos son los agentes de IA de propósito general? Se ha construido un marco de evaluación abierto para averiguarlo.
Álvaro Rivas
NVIDIA detalló un flujo de fine‑tuning paramétricamente eficiente de Cosmos Predict 2.
NVIDIA detalló un flujo de fine‑tuning paramétricamente eficiente de Cosmos Predict 2.
Inés Montoya
AllenAI presenta OlmoEarth v1.1: hasta 3× menos coste de cómputo sin perder precisión en teledetección
AllenAI publicó OlmoEarth v1.1 el 19 de mayo de 2026 (autor: Kyle Wiggers). La versión reduce hasta 3× el coste de cómputo respecto a v1 manteniendo rendimiento en una mezcla de benchmarks de investigación y tareas con
Mateo Arriaga
Granite Embedding Multilingual R2: dos modelos multilingües Apache 2.0 con contexto de 32K y rendimiento líder en <100M
El 14 de mayo de 2026 se presentaron dos modelos de incrustaciones multilingües — granite — embedding — 311m-multilingual-r2 y granite — embedding-97m-multilingual-r2— bajo licencia Apache 2.
Inés Montoya
Amazon detalla los bloques de infraestructura de AWS para entrenar e inferir modelos foundation
El 11 de mayo de 2026 Keita Watanabe, Pavel Belevich y Aman Shanbhag publicaron un artículo técnico que propone un marco para entrenar e inferir modelos foundation en AWS, dirigido a ingenieros e investigadores de ML que
Diego Santillán
MachinaCheck usa IA multiagente en AMD MI300X para verificar manufacturabilidad CNC en 30 segundos
En el AMD Developer Hackathon de mayo de 2026, el equipo de Syed Muhammad Sarmad presentó MachinaCheck, un sistema multiagente que evalúa la manufacturabilidad de piezas CNC desde archivos STEP en unos 30 segundos,
Diego Santillán
EMO: MoE preentrenado mantiene el rendimiento activando solo el 12,5% de expertos
El 8 de mayo de 2026 AllenAI presentó EMO, un mixture‑of‑experts (MoE) preentrenado end-to-end de 14B parámetros (1B activos) entrenado con 1 trillón de tokens;
Lucía Valcárcel
CyberSecQwen‑4B entrenado en una sola MI300X demuestra eficacia para inteligencia de amenazas y ejecución local
El 8 de mayo de 2026 se publicó CyberSecQwen‑4B: un modelo de 4.000 millones de parámetros entrenado en una única AMD Instinct MI300X (192 GB HBM3) en el AMD Developer Cloud y liberado bajo licencia Apache 2.0.
Elena Castellanos
OncoAgent publica preprint con métricas técnicas de sistema de soporte clínico oncológico y preservación de la privacidad
El 9 de mayo de 2026 el OncoAgent Research Group divulgó un preprint que documenta diseño, datos de entrenamiento y métricas operativas de OncoAgent, un sistema de soporte de decisiones para oncología que prioriza
Mateo Arriaga
MedQA afina Qwen3-1.7B en AMD Instinct MI300X usando ROCm sin dependencias CUDA
El equipo lablab (autor Harikrishna, HK2184) publicó MedQA el 8 de mayo de 2026: un pipeline completo que fine‑tunea Qwen3-1.
Lucía Valcárcel
vLLM V1 iguala a V0 tras corregir cuatro diferencias críticas que afectaban al entrenamiento RL
Durante la migración de vLLM V0 a V1, el equipo de ServiceNow detectó desajustes en los logprobs usados por PipelineRL que alteraron métricas como clip rate, KL, entropía y reward;
Álvaro Rivas
Open ASR Leaderboard añade conjuntos privados de Appen y DataoceanAI para frenar el 'benchmaxxing
Publicado el 6 de mayo de 2026: el Open ASR Leaderboard incorporó conjuntos de prueba privados aportados por Appen Inc. Y DataoceanAI con el objetivo de reducir el benchmaxxing y la contaminación de test sets.
Kseniya Morozova
DeepInfra se integra a Hugging Face Hub como Proveedor de Inferencia, expandiendo el acceso a la IA Serverless
DeepInfra se ha incorporado como un nuevo Proveedor de Inferencia en Hugging Face Hub, brindando a los desarrolladores acceso serverless a más de 100 modelos de IA a precios competitivos.
Nicolás Vélez
La Evaluación de Modelos de IA se Convierte en el Nuevo Cuello de Botella Computacional
Los crecientes costos asociados a la evaluación de modelos de inteligencia artificial, especialmente los agentes, están alcanzando niveles que superan las fases de entrenamiento, generando un nuevo cuello de botella computacional y
Lucía Valcárcel
IBM Desvela la Familia Granite 4.1 de LLMs, Priorizando la Calidad de Datos y la Eficiencia en el Diseño Abierto
IBM ha lanzado su serie de modelos de lenguaje grandes (LLM) Granite 4.1, destacando un enfoque innovador en la calidad de los datos y una arquitectura eficiente.
Álvaro Rivas
Estadísticas
Secciones
2
Categorías
24
Temas
1178
Respuestas
0
Visitas del mes
Este mes
12
24 horas
0
7 días
0
En línea ahora (0)
Miembros
0
Invitados
0
No hay usuarios en línea ahora.