Aivizor
Aivizor
EstilosCreacionesComunidad

Noticias De IA

Hugging Face

Temas, noticias y debates recientes sobre All en Hugging Face dentro de la Comunidad Aivizor.

Hugging Face

​
IBM Research: la 'Agent Logic' mejora agentes de IA en cargas mainframe complejas

IBM Research: la 'Agent Logic' mejora agentes de IA en cargas mainframe complejas

Noticias de IA · Hugging Face

El 1 de junio de 2026 IBM Research publicó un análisis técnico que describe diseños y pruebas de agentes que incorporan «agent logic» —primitivas de software que guían modelos de lenguaje— y muestra beneficios concretos

M

Mateo Arriaga

0
0
0
NVIDIA lanza Cosmos 3, omni‑modelo abierto para IA física y control de acciones

NVIDIA lanza Cosmos 3, omni‑modelo abierto para IA física y control de acciones

Noticias de IA · Hugging Face

Cosmos 3 reúne generación de entornos, razonamiento físico y producción de acciones en un único omni‑modelo Mixture‑of‑Transformers; se publicó el 1 de junio de 2026 en versiones Nano (dos componentes de 8B) y Super (dos

I

Inés Montoya

0
0
0
El 29 de mayo de 2026 se publicó la primera entrega de una serie didáctica sobre profiling en PyTorch que introduce

El 29 de mayo de 2026 se publicó la primera entrega de una serie didáctica sobre profiling en PyTorch que introduce

Noticias de IA · Hugging Face

El 29 de mayo de 2026 se publicó la primera entrega de una serie didáctica sobre profiling en PyTorch que introduce torch.profiler mediante un ejemplo mínimo (matmul + bias).

Á

Álvaro Rivas

0
0
0
TRL implementa sincronización de pesos por delta y reduce el tráfico por paso a 20–35 MB en Qwen3-0.6B

TRL implementa sincronización de pesos por delta y reduce el tráfico por paso a 20–35 MB en Qwen3-0.6B

Noticias de IA · Hugging Face

El 27 de mayo de 2026 TRL incorporó una ruta que codifica y publica solo los elementos de peso que cambian como un safetensors sparse en un Hub bucket; en pruebas con Qwen3-0.6B el volumen transferido por paso se redujo de 1.

M

Mihail Lebedev

0
0
0
Reachy Mini puede ejecutar su pila conversacional completamente en local

Reachy Mini puede ejecutar su pila conversacional completamente en local

Noticias de IA · Hugging Face

El 27 de mayo de 2026 los autores Amir Mahla y Andres Marafioti publicaron una guía para ejecutar todo el stack conversacional de Reachy Mini en la máquina del usuario, evitando que el audio salga a servidores externos mediante la librería speech — to-speech y

E

Elena Vorontsova

0
0
0
Glosario técnico define 'harness' y 'scaffold' para desarrolladores de agentes de IA

Glosario técnico define 'harness' y 'scaffold' para desarrolladores de agentes de IA

Noticias de IA · Hugging Face

Un glosario publicado el 25 de mayo de 2026 por Sergio Paniego y Aritra Roy Gosthipaty clarifica las diferencias prácticas entre modelo, scaffold y harness para reducir ambigüedades en diseño, despliegue y evaluación de

E

Elena Castellanos

0
0
0
NVIDIA lanza Nemotron‑Labs Diffusion: modelos DLM (3B, 8B, 14B) y un VLM 8B para reducir latencia

NVIDIA lanza Nemotron‑Labs Diffusion: modelos DLM (3B, 8B, 14B) y un VLM 8B para reducir latencia

Noticias de IA · Hugging Face

El 23 de mayo de 2026 NVIDIA presentó Nemotron‑Labs Diffusion, una familia de modelos que combina generación por difusión y autoregresión (3B, 8B, 14B y un VLM 8B), acompañada de código, receta de entrenamiento y un

D

Diego Santillán

0
0
0
Modelo especializado de 3.000 millones de parámetros supera APIs frontier en tarea empresarial de OCR con coste 50 veces

Modelo especializado de 3.000 millones de parámetros supera APIs frontier en tarea empresarial de OCR con coste 50 veces

Noticias de IA · Hugging Face

Un equipo de Dharma midió que un modelo especializado de 3.000 millones de parámetros venció a las APIs frontier en una tarea empresarial concreta de OCR estructurado, con un coste operativo aproximadamente 50 veces

I

Inés Montoya

0
0
0
Degeneración de texto en DharmaOCR: menos del 3% de páginas consumen casi la mitad del tiempo de inferencia

Degeneración de texto en DharmaOCR: menos del 3% de páginas consumen casi la mitad del tiempo de inferencia

Noticias de IA · Hugging Face

Al especializar un modelo pequeño para OCR en PDFs (DharmaOCR), los autores detectaron que una minoría de páginas degeneradas — que entran en bucles repetitivos y no emiten token EOS-puede acaparar casi el 50% del tiempo

N

Nicolás Vélez

0
0
0
Lanzan Open Agent Leaderboard para evaluar sistemas completos de agentes de IA

Lanzan Open Agent Leaderboard para evaluar sistemas completos de agentes de IA

Noticias de IA · Hugging Face

Publicado el 18 de mayo de 2026. Autor: Elron Bandel (IBM Research). Upvote 1. ¿Qué tan buenos son los agentes de IA de propósito general? Se ha construido un marco de evaluación abierto para averiguarlo.

Á

Álvaro Rivas

0
0
0
NVIDIA detalló un flujo de fine‑tuning paramétricamente eficiente de Cosmos Predict 2.

NVIDIA detalló un flujo de fine‑tuning paramétricamente eficiente de Cosmos Predict 2.

Noticias de IA · Hugging Face

NVIDIA detalló un flujo de fine‑tuning paramétricamente eficiente de Cosmos Predict 2.

I

Inés Montoya

0
0
0
AllenAI presenta OlmoEarth v1.1: hasta 3× menos coste de cómputo sin perder precisión en teledetección

AllenAI presenta OlmoEarth v1.1: hasta 3× menos coste de cómputo sin perder precisión en teledetección

Noticias de IA · Hugging Face

AllenAI publicó OlmoEarth v1.1 el 19 de mayo de 2026 (autor: Kyle Wiggers). La versión reduce hasta 3× el coste de cómputo respecto a v1 manteniendo rendimiento en una mezcla de benchmarks de investigación y tareas con

M

Mateo Arriaga

0
0
0
Granite Embedding Multilingual R2: dos modelos multilingües Apache 2.0 con contexto de 32K y rendimiento líder en <100M

Granite Embedding Multilingual R2: dos modelos multilingües Apache 2.0 con contexto de 32K y rendimiento líder en <100M

Noticias de IA · Hugging Face

El 14 de mayo de 2026 se presentaron dos modelos de incrustaciones multilingües — granite — embedding — 311m-multilingual-r2 y granite — embedding-97m-multilingual-r2— bajo licencia Apache 2.

I

Inés Montoya

0
0
0
Amazon detalla los bloques de infraestructura de AWS para entrenar e inferir modelos foundation

Amazon detalla los bloques de infraestructura de AWS para entrenar e inferir modelos foundation

Noticias de IA · Hugging Face

El 11 de mayo de 2026 Keita Watanabe, Pavel Belevich y Aman Shanbhag publicaron un artículo técnico que propone un marco para entrenar e inferir modelos foundation en AWS, dirigido a ingenieros e investigadores de ML que

D

Diego Santillán

0
0
0
MachinaCheck usa IA multiagente en AMD MI300X para verificar manufacturabilidad CNC en 30 segundos

MachinaCheck usa IA multiagente en AMD MI300X para verificar manufacturabilidad CNC en 30 segundos

Noticias de IA · Hugging Face

En el AMD Developer Hackathon de mayo de 2026, el equipo de Syed Muhammad Sarmad presentó MachinaCheck, un sistema multiagente que evalúa la manufacturabilidad de piezas CNC desde archivos STEP en unos 30 segundos,

D

Diego Santillán

0
0
0
EMO: MoE preentrenado mantiene el rendimiento activando solo el 12,5% de expertos

EMO: MoE preentrenado mantiene el rendimiento activando solo el 12,5% de expertos

Noticias de IA · Hugging Face

El 8 de mayo de 2026 AllenAI presentó EMO, un mixture‑of‑experts (MoE) preentrenado end-to-end de 14B parámetros (1B activos) entrenado con 1 trillón de tokens;

L

Lucía Valcárcel

0
0
0
CyberSecQwen‑4B entrenado en una sola MI300X demuestra eficacia para inteligencia de amenazas y ejecución local

CyberSecQwen‑4B entrenado en una sola MI300X demuestra eficacia para inteligencia de amenazas y ejecución local

Noticias de IA · Hugging Face

El 8 de mayo de 2026 se publicó CyberSecQwen‑4B: un modelo de 4.000 millones de parámetros entrenado en una única AMD Instinct MI300X (192 GB HBM3) en el AMD Developer Cloud y liberado bajo licencia Apache 2.0.

E

Elena Castellanos

0
0
0
OncoAgent publica preprint con métricas técnicas de sistema de soporte clínico oncológico y preservación de la privacidad

OncoAgent publica preprint con métricas técnicas de sistema de soporte clínico oncológico y preservación de la privacidad

Noticias de IA · Hugging Face

El 9 de mayo de 2026 el OncoAgent Research Group divulgó un preprint que documenta diseño, datos de entrenamiento y métricas operativas de OncoAgent, un sistema de soporte de decisiones para oncología que prioriza

M

Mateo Arriaga

0
0
0
MedQA afina Qwen3-1.7B en AMD Instinct MI300X usando ROCm sin dependencias CUDA

MedQA afina Qwen3-1.7B en AMD Instinct MI300X usando ROCm sin dependencias CUDA

Noticias de IA · Hugging Face

El equipo lablab (autor Harikrishna, HK2184) publicó MedQA el 8 de mayo de 2026: un pipeline completo que fine‑tunea Qwen3-1.

L

Lucía Valcárcel

0
0
0
vLLM V1 iguala a V0 tras corregir cuatro diferencias críticas que afectaban al entrenamiento RL

vLLM V1 iguala a V0 tras corregir cuatro diferencias críticas que afectaban al entrenamiento RL

Noticias de IA · Hugging Face

Durante la migración de vLLM V0 a V1, el equipo de ServiceNow detectó desajustes en los logprobs usados por PipelineRL que alteraron métricas como clip rate, KL, entropía y reward;

Á

Álvaro Rivas

0
0
0
Open ASR Leaderboard añade conjuntos privados de Appen y DataoceanAI para frenar el 'benchmaxxing

Open ASR Leaderboard añade conjuntos privados de Appen y DataoceanAI para frenar el 'benchmaxxing

Noticias de IA · Hugging Face

Publicado el 6 de mayo de 2026: el Open ASR Leaderboard incorporó conjuntos de prueba privados aportados por Appen Inc. Y DataoceanAI con el objetivo de reducir el benchmaxxing y la contaminación de test sets.

K

Kseniya Morozova

0
0
0
DeepInfra se integra a Hugging Face Hub como Proveedor de Inferencia, expandiendo el acceso a la IA Serverless

DeepInfra se integra a Hugging Face Hub como Proveedor de Inferencia, expandiendo el acceso a la IA Serverless

Noticias de IA · Hugging Face

DeepInfra se ha incorporado como un nuevo Proveedor de Inferencia en Hugging Face Hub, brindando a los desarrolladores acceso serverless a más de 100 modelos de IA a precios competitivos.

N

Nicolás Vélez

0
0
0
La Evaluación de Modelos de IA se Convierte en el Nuevo Cuello de Botella Computacional

La Evaluación de Modelos de IA se Convierte en el Nuevo Cuello de Botella Computacional

Noticias de IA · Hugging Face

Los crecientes costos asociados a la evaluación de modelos de inteligencia artificial, especialmente los agentes, están alcanzando niveles que superan las fases de entrenamiento, generando un nuevo cuello de botella computacional y

L

Lucía Valcárcel

0
0
0
IBM Desvela la Familia Granite 4.1 de LLMs, Priorizando la Calidad de Datos y la Eficiencia en el Diseño Abierto

IBM Desvela la Familia Granite 4.1 de LLMs, Priorizando la Calidad de Datos y la Eficiencia en el Diseño Abierto

Noticias de IA · Hugging Face

IBM ha lanzado su serie de modelos de lenguaje grandes (LLM) Granite 4.1, destacando un enfoque innovador en la calidad de los datos y una arquitectura eficiente.

Á

Álvaro Rivas

0
0
0
Anterior

1 / 2

Siguiente
9:41

Estadísticas

Secciones

2

Categorías

24

Temas

1178

Respuestas

0

Visitas del mes

Este mes

12

24 horas

0

7 días

0

En línea ahora (0)

Miembros

0

Invitados

0

No hay usuarios en línea ahora.