Despliegues de IA empresariales paralizados tras revelar modelos datos "olvidados" en repositorios internos

News

5/29/2026, 7:59:23 AM

Despliegues de IA empresariales paralizados tras revelar modelos datos "olvidados" en repositorios internos

En una sesión celebrada durante el evento de Veeam en Nueva York, responsables de implantaciones de inteligencia artificial en organizaciones empresariales relataron por qué suspendieron despliegues planificados: modelos generativos y agentes comenzaron a recuperar y mostrar archivos que habían permanecido “ocultos” en repositorios internos, lo que provocó alertas inmediatas de los equipos legales y de cumplimiento y la necesidad de revisar con urgencia el acceso y los riesgos asociados.

Steve MacIntyre, vicepresidente sénior de Fidelity Investments, explicó que la activación de unas pocas licencias de Copilot en una organización con cerca de 400.000 empleados bastó para que, en apenas dos días, el área legal detectara que búsquedas impulsadas por IA devolvían presentaciones PowerPoint y archivos PDF que contenían décadas de notas de investigación almacenadas en SharePoint. Ese hallazgo fue el detonante para detener la ampliación del despliegue y evaluar la exposición interna a información sensible.

Wim Geurden, chief architect de tecnología empresarial en EY, describió un problema estructural distinto pero ligado al mismo riesgo: la empresa funciona como una red de firmas afiliadas y, en sus palabras, “EY Global doesn't own any of the data. Every member firm owns its data.” Esa arquitectura federada dejó múltiples petabytes dispersos en sitios de SharePoint sin propietarios claros ni políticas de gestión del ciclo de vida, de modo que cuando se activaron capacidades de búsqueda empresarial emergió un verdadero “Wild West” de información accesible y mal catalogada.

Los panelistas coincidieron en que lo observado no fue tanto una filtración provocada por la IA como la consecuencia de su capacidad para indexar y sintetizar volúmenes masivos de información no estructurada. En ese rol, los modelos actúan como motores de búsqueda extremadamente potentes que localizan con rapidez archivos olvidados y los convierten en insumos útiles para respuestas automáticas y prompts, multiplicando la visibilidad de contenidos que hasta entonces estaban enterrados en repositorios.

Las repercusiones prácticas fueron inmediatas: la paralización temporal de iniciativas diseñadas para aumentar la productividad de empleados, revisiones legales urgentes y la necesidad de replantear estructuras de gobernanza y acceso. En al menos un caso, los directivos dejaron explícitamente en pausa el despliegue hasta clarificar qué conjuntos de información podían quedar expuestos dentro de la organización y qué controles eran imprescindibles para mitigar riesgos legales y regulatorios.

Como respuesta operativa, las empresas implementaron medidas diversas para acotar el problema antes de continuar con la expansión. En EY cerraron el acceso general y limitaron Copilot a usuarios licenciados mientras verificaban la propiedad de los datos; ese proceso implicó identificar repositorios, cotejar propietarios y etiquetar conjuntos de información para que las políticas de tratamiento y retención pudieran aplicarse de forma diferencial según el contenido.

El etiquetado y la clasificación se emplearon como herramientas centrales: marcar archivos con etiquetas como “confidencial” o “financial services” permitió aplicar reglas distintas de acceso y conservación, así como activar flujos de revisión manual cuando la IA sugería información potencialmente sensible. Complementariamente, controlar la emisión de licencias y segmentar usuarios redujo la superficie de exposición mientras se completaban las auditorías de datos.

El interés de estos casos radica en una lección operativa clara: el riesgo no reside en habilitar capacidades de IA en sí mismas, sino en hacerlo sin un inventario y gobernanza previos de los almacenes de datos — SharePoint, NAS y repositorios de PDFs o presentaciones—. La mitigación más efectiva en las experiencias relatadas fue simple y pragmática: controlar licencias, limitar accesos y aplicar etiquetado y políticas de ciclo de vida antes de reanudar despliegues a gran escala.

Más allá de las medidas inmediatas, el ejemplo apunta a una conclusión relevante para organizaciones que adoptan grandes modelos de lenguaje y agentes: los datos históricos y no estructurados pueden convertirse en un recurso valioso para la IA-una suerte de “oro” para alimentar modelos—, pero esa misma capacidad exige controles, asignación clara de responsables y procesos de gestión del ciclo de vida si se quiere evitar revelaciones involuntarias y los consiguientes riesgos legales y reputacionales al escalar soluciones.

Fuentes

ZDNET AI · 5/28/2026

Respuestas (0)

Aún no hay respuestas en este tema.

Atrás