
En un avance significativo para la comunidad de inteligencia artificial, DeepInfra ha sido añadido oficialmente como un Proveedor de Inferencia compatible en el Hugging Face Hub. Esta integración amplía drásticamente las capacidades de inferencia serverless disponibles para los desarrolladores, permitiéndoles utilizar una amplia gama de modelos de IA directamente desde las páginas de modelos de Hugging Face. La incorporación de DeepInfra enriquece el ecosistema de Hugging Face, mejorando la oferta de servicios de inferencia y facilitando la adopción de tecnologías de IA avanzadas.
DeepInfra se distingue por ser una plataforma de inferencia de IA serverless que ofrece una de las tarifas más competitivas por token en la industria. Con un catálogo que supera los 100 modelos, facilita a los desarrolladores la integración de una vasta gama de capacidades de inteligencia artificial en sus aplicaciones con una configuración mínima. La plataforma soporta un amplio espectro de tipos de modelos, abarcando desde grandes modelos de lenguaje (LLMs) hasta modelos de texto a imagen, texto a vídeo y embeddings, lo que la convierte en una solución versátil para diversas necesidades de desarrollo de IA. Esta capacidad de integrar modelos complejos con facilidad y eficiencia de costos representa una ventaja considerable para la innovación en proyectos de cualquier escala.
Como parte de esta integración inicial, DeepInfra ha lanzado soporte específico para tareas de conversación y generación de texto dentro de Hugging Face. Esto habilita el acceso a populares LLMs de código abierto y peso ligero como DeepSeek V4, Kimi — K2.6 y GLM-5.1, entre muchos otros, permitiendo a los desarrolladores construir y experimentar con soluciones de IA conversacional de manera inmediata. La disponibilidad de estos modelos a través de una plataforma serverless reduce significativamente las barreras de entrada para la implementación.
La integración de DeepInfra se ha realizado de forma fluida en los SDKs cliente de Hugging Face, tanto para JavaScript como para Python, asegurando que los desarrolladores puedan utilizar la plataforma con sus proveedores preferidos de manera sencilla. Los usuarios pueden gestionar sus preferencias y claves de API directamente desde la configuración de su cuenta en la interfaz de usuario de Hugging Face, lo que les permite ordenar los proveedores por preferencia.
En cuanto a la facturación, los desarrolladores tienen la opción de ser facturados directamente por el proveedor de inferencia si utilizan una clave API personalizada, como una clave de DeepInfra, en cuyo caso la cuenta de DeepInfra sería la que refleje los cargos. Por otro lado, al autenticarse a través de Hugging Face Hub para solicitudes enrutadas, los usuarios solo pagarán las tarifas estándar de la API del proveedor. Hugging Face aclara que no aplica ningún margen adicional, simplemente transfiere los costos del proveedor directamente a la cuenta del usuario, garantizando transparencia. Además, los usuarios con planes PRO de Hugging Face reciben un crédito mensual de 2 dólares para inferencia, que puede utilizarse en cualquiera de los proveedores.
La accesibilidad de DeepInfra se extiende a través de los SDKs de Hugging Face, como `huggingface_hub` para Python (versión 1.11.2 o superior) y `@huggingface/inference` para JavaScript, facilitando la implementación de modelos en diversos entornos de desarrollo. Un ejemplo de uso muestra cómo, autenticándose con un token de Hugging Face, las solicitudes pueden ser enrutadas automáticamente a DeepInfra para modelos específicos, como DeepSeek V4 Pro, permitiendo una interacción directa y programática con los modelos. Más allá de las implementaciones directas, los Proveedores de Inferencia de Hugging Face están integrados en la mayoría de los Agent Harnesses, incluyendo Pi, OpenCode, Hermes Agents y OpenClaw.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.