OpenAI lanza Privacy Filter, un modelo de pesos abiertos para detectar PII con contexto de 128K

News

4/27/2026, 5:18:05 PM

OpenAI lanza Privacy Filter, un modelo de pesos abiertos para detectar PII con contexto de 128K

OpenAI presentó Privacy Filter el 22 de abril de 2026, y el 27 de abril Hugging Face publicó ejemplos prácticos para integrarlo en aplicaciones web. La pieza central es un modelo de pesos abiertos, disponible bajo Apache 2.0, orientado a detectar y redactar información de identificación personal antes de que llegue a sistemas externos o flujos de IA.

El modelo combina una arquitectura de 1.500 millones de parámetros con unos 50 millones de parámetros activos durante la inferencia. Su ventana de contexto de 128.000 tokens permite analizar documentos largos en una sola pasada, lo que reduce la necesidad de dividir y recomponer texto cuando se buscan spans sensibles.

Privacy Filter está diseñado para detectar ocho categorías de PII: persona privada, dirección privada, email privado, teléfono privado, URL privada, fecha privada, número de cuenta y secretos generales. Hugging Face también destaca el uso de decodificación BIOES para mantener límites de spans más limpios en secuencias largas.

Por qué importa: para equipos que construyen productos con datos de usuarios, la utilidad práctica no está solo en encontrar PII, sino en automatizar una capa previa de redacción antes de compartir documentos, pegar texto en herramientas públicas o enviar contenido a otros sistemas de IA.

Para mostrar distintos escenarios de uso, los desarrolladores de Hugging Face prepararon tres demostraciones: Document Privacy Explorer para analizar documentos, Image Anonymizer para censurar información visible en imágenes y SmartRedact Paste para compartir texto ya redactado mediante enlaces públicos.

Limitaciones: el modelo puede reducir exposición accidental de datos sensibles, pero no sustituye auditorías de seguridad, controles de cumplimiento ni validación con datos reales de cada dominio. Los equipos deberían probar precisión, falsos positivos y comportamiento con idiomas o formatos específicos antes de usarlo en producción.

Fuentes

OpenAI · 4/22/2026
Hugging Face Blog · 4/27/2026

Respuestas (0)

Aún no hay respuestas en este tema.

Atrás