Noticias De IA

Hugging Face

Temas, noticias y debates recientes sobre All en Hugging Face dentro de la Comunidad Aivizor.

Hugging Face

IBM Research: la 'Agent Logic' mejora agentes de IA en cargas mainframe complejas

El 1 de junio de 2026 IBM Research publicó un análisis técnico que describe diseños y pruebas de agentes que incorporan «agent logic» —primitivas de software que guían modelos de lenguaje— y muestra beneficios concretos

Mateo Arriaga

NVIDIA lanza Cosmos 3, omni‑modelo abierto para IA física y control de acciones

Noticias de IA · Hugging Face

Cosmos 3 reúne generación de entornos, razonamiento físico y producción de acciones en un único omni‑modelo Mixture‑of‑Transformers; se publicó el 1 de junio de 2026 en versiones Nano (dos componentes de 8B) y Super (dos

Inés Montoya

El 29 de mayo de 2026 se publicó la primera entrega de una serie didáctica sobre profiling en PyTorch que introduce

Noticias de IA · Hugging Face

El 29 de mayo de 2026 se publicó la primera entrega de una serie didáctica sobre profiling en PyTorch que introduce torch.profiler mediante un ejemplo mínimo (matmul + bias).

Álvaro Rivas

TRL implementa sincronización de pesos por delta y reduce el tráfico por paso a 20–35 MB en Qwen3-0.6B

Noticias de IA · Hugging Face

El 27 de mayo de 2026 TRL incorporó una ruta que codifica y publica solo los elementos de peso que cambian como un safetensors sparse en un Hub bucket; en pruebas con Qwen3-0.6B el volumen transferido por paso se redujo de 1.

Mihail Lebedev

Reachy Mini puede ejecutar su pila conversacional completamente en local

Noticias de IA · Hugging Face

El 27 de mayo de 2026 los autores Amir Mahla y Andres Marafioti publicaron una guía para ejecutar todo el stack conversacional de Reachy Mini en la máquina del usuario, evitando que el audio salga a servidores externos mediante la librería speech — to-speech y

Elena Vorontsova

Glosario técnico define 'harness' y 'scaffold' para desarrolladores de agentes de IA

Noticias de IA · Hugging Face

Un glosario publicado el 25 de mayo de 2026 por Sergio Paniego y Aritra Roy Gosthipaty clarifica las diferencias prácticas entre modelo, scaffold y harness para reducir ambigüedades en diseño, despliegue y evaluación de

Elena Castellanos

NVIDIA lanza Nemotron‑Labs Diffusion: modelos DLM (3B, 8B, 14B) y un VLM 8B para reducir latencia

Noticias de IA · Hugging Face

El 23 de mayo de 2026 NVIDIA presentó Nemotron‑Labs Diffusion, una familia de modelos que combina generación por difusión y autoregresión (3B, 8B, 14B y un VLM 8B), acompañada de código, receta de entrenamiento y un

Diego Santillán

Modelo especializado de 3.000 millones de parámetros supera APIs frontier en tarea empresarial de OCR con coste 50 veces

Noticias de IA · Hugging Face

Un equipo de Dharma midió que un modelo especializado de 3.000 millones de parámetros venció a las APIs frontier en una tarea empresarial concreta de OCR estructurado, con un coste operativo aproximadamente 50 veces

Inés Montoya

Degeneración de texto en DharmaOCR: menos del 3% de páginas consumen casi la mitad del tiempo de inferencia

Noticias de IA · Hugging Face

Al especializar un modelo pequeño para OCR en PDFs (DharmaOCR), los autores detectaron que una minoría de páginas degeneradas — que entran en bucles repetitivos y no emiten token EOS-puede acaparar casi el 50% del tiempo

Nicolás Vélez

Lanzan Open Agent Leaderboard para evaluar sistemas completos de agentes de IA

Noticias de IA · Hugging Face

Publicado el 18 de mayo de 2026. Autor: Elron Bandel (IBM Research). Upvote 1. ¿Qué tan buenos son los agentes de IA de propósito general? Se ha construido un marco de evaluación abierto para averiguarlo.

Álvaro Rivas

NVIDIA detalló un flujo de fine‑tuning paramétricamente eficiente de Cosmos Predict 2.

Noticias de IA · Hugging Face

NVIDIA detalló un flujo de fine‑tuning paramétricamente eficiente de Cosmos Predict 2.

Inés Montoya

AllenAI presenta OlmoEarth v1.1: hasta 3× menos coste de cómputo sin perder precisión en teledetección

Noticias de IA · Hugging Face

AllenAI publicó OlmoEarth v1.1 el 19 de mayo de 2026 (autor: Kyle Wiggers). La versión reduce hasta 3× el coste de cómputo respecto a v1 manteniendo rendimiento en una mezcla de benchmarks de investigación y tareas con

Mateo Arriaga

Granite Embedding Multilingual R2: dos modelos multilingües Apache 2.0 con contexto de 32K y rendimiento líder en <100M

Noticias de IA · Hugging Face

El 14 de mayo de 2026 se presentaron dos modelos de incrustaciones multilingües — granite — embedding — 311m-multilingual-r2 y granite — embedding-97m-multilingual-r2— bajo licencia Apache 2.

Inés Montoya

Amazon detalla los bloques de infraestructura de AWS para entrenar e inferir modelos foundation

Noticias de IA · Hugging Face

El 11 de mayo de 2026 Keita Watanabe, Pavel Belevich y Aman Shanbhag publicaron un artículo técnico que propone un marco para entrenar e inferir modelos foundation en AWS, dirigido a ingenieros e investigadores de ML que

Diego Santillán

MachinaCheck usa IA multiagente en AMD MI300X para verificar manufacturabilidad CNC en 30 segundos

Noticias de IA · Hugging Face

En el AMD Developer Hackathon de mayo de 2026, el equipo de Syed Muhammad Sarmad presentó MachinaCheck, un sistema multiagente que evalúa la manufacturabilidad de piezas CNC desde archivos STEP en unos 30 segundos,

Diego Santillán

EMO: MoE preentrenado mantiene el rendimiento activando solo el 12,5% de expertos

Noticias de IA · Hugging Face

El 8 de mayo de 2026 AllenAI presentó EMO, un mixture‑of‑experts (MoE) preentrenado end-to-end de 14B parámetros (1B activos) entrenado con 1 trillón de tokens;

Lucía Valcárcel

CyberSecQwen‑4B entrenado en una sola MI300X demuestra eficacia para inteligencia de amenazas y ejecución local

Noticias de IA · Hugging Face

El 8 de mayo de 2026 se publicó CyberSecQwen‑4B: un modelo de 4.000 millones de parámetros entrenado en una única AMD Instinct MI300X (192 GB HBM3) en el AMD Developer Cloud y liberado bajo licencia Apache 2.0.

Elena Castellanos

OncoAgent publica preprint con métricas técnicas de sistema de soporte clínico oncológico y preservación de la privacidad

Noticias de IA · Hugging Face

El 9 de mayo de 2026 el OncoAgent Research Group divulgó un preprint que documenta diseño, datos de entrenamiento y métricas operativas de OncoAgent, un sistema de soporte de decisiones para oncología que prioriza

Mateo Arriaga

MedQA afina Qwen3-1.7B en AMD Instinct MI300X usando ROCm sin dependencias CUDA

Noticias de IA · Hugging Face

El equipo lablab (autor Harikrishna, HK2184) publicó MedQA el 8 de mayo de 2026: un pipeline completo que fine‑tunea Qwen3-1.

Lucía Valcárcel

vLLM V1 iguala a V0 tras corregir cuatro diferencias críticas que afectaban al entrenamiento RL

Noticias de IA · Hugging Face

Durante la migración de vLLM V0 a V1, el equipo de ServiceNow detectó desajustes en los logprobs usados por PipelineRL que alteraron métricas como clip rate, KL, entropía y reward;

Álvaro Rivas

Open ASR Leaderboard añade conjuntos privados de Appen y DataoceanAI para frenar el 'benchmaxxing

Noticias de IA · Hugging Face

Publicado el 6 de mayo de 2026: el Open ASR Leaderboard incorporó conjuntos de prueba privados aportados por Appen Inc. Y DataoceanAI con el objetivo de reducir el benchmaxxing y la contaminación de test sets.

Kseniya Morozova

DeepInfra se integra a Hugging Face Hub como Proveedor de Inferencia, expandiendo el acceso a la IA Serverless

Noticias de IA · Hugging Face

DeepInfra se ha incorporado como un nuevo Proveedor de Inferencia en Hugging Face Hub, brindando a los desarrolladores acceso serverless a más de 100 modelos de IA a precios competitivos.

Nicolás Vélez

La Evaluación de Modelos de IA se Convierte en el Nuevo Cuello de Botella Computacional

Noticias de IA · Hugging Face

Los crecientes costos asociados a la evaluación de modelos de inteligencia artificial, especialmente los agentes, están alcanzando niveles que superan las fases de entrenamiento, generando un nuevo cuello de botella computacional y

Lucía Valcárcel

IBM Desvela la Familia Granite 4.1 de LLMs, Priorizando la Calidad de Datos y la Eficiencia en el Diseño Abierto

Noticias de IA · Hugging Face

IBM ha lanzado su serie de modelos de lenguaje grandes (LLM) Granite 4.1, destacando un enfoque innovador en la calidad de los datos y una arquitectura eficiente.

Álvaro Rivas

1 / 2

Estadísticas

Secciones

Categorías

Temas

1178

Respuestas

Visitas del mes

Este mes

24 horas

7 días

En línea ahora (0)

Miembros

Invitados

No hay usuarios en línea ahora.