
Las organizaciones modernas se enfrentan al reto de gestionar y extraer valor de vastos volúmenes de datos. Tradicionalmente, este proceso exige un profundo conocimiento técnico en herramientas como SQL, modelado de datos e inteligencia de negocios, lo que a menudo genera lentitud en la toma de decisiones y cuellos de botella operativos en sectores clave como el comercio minorista, los servicios financieros, la salud y la manufactura.
Para superar estas barreras, AWS ha desarrollado una arquitectura que integra un asistente de IA conversacional de Amazon Quick. Esta solución revoluciona el análisis de datos, transformándolo en una capacidad de autoservicio. Los usuarios de negocio ahora pueden consultar conjuntos de datos complejos, combinar información estructurada y no estructurada e interactuar con los datos a través de interfaces intuitivas basadas en lenguaje natural, acelerando la obtención de insights valiosos y la mejora del rendimiento empresarial.
La demostración de esta funcionalidad se centra en una casa de datos construida sobre los conjuntos de datos de referencia TPC-H. La arquitectura se apoya en Amazon Simple Storage Service (Amazon S3) para el almacenamiento de datos, Amazon SageMaker y AWS Glue para la gestión de la casa de datos, y Amazon Athena para consultas SQL sin servidor. Esta última herramienta permite consultar datos en múltiples formatos, incluyendo S3 Table, Iceberg y Parquet, y se complementa con las capacidades de Amazon Quick para la creación de paneles interactivos y agentes de IA conversacional.
Esta solución democratiza el acceso a los datos de la casa de datos para los usuarios de negocio, al tiempo que mantiene los rigurosos estándares de seguridad, gobernanza y escalabilidad que demandan las operaciones empresariales modernas. Esto se logra mediante bases de conocimiento integradas que aprovechan los 'espacios' de Amazon Quick. La ingesta de datos comienza con la fuente TPC-H, que contiene datos de referencia en formato de base de datos relacional, alojados en un bucket público de Amazon S3. Posteriormente, Amazon Athena ejecuta consultas SQL sin servidor para preparar estos datos antes de cargarlos en S3, creando el catálogo correspondiente en AWS Glue.
Para garantizar la versatilidad y el rendimiento, los datos se almacenan en tres formatos optimizados. En primer lugar, Amazon S3 utiliza formato CSV a través de tablas externas. En segundo lugar, Amazon S3 emplea el formato de tabla Apache Iceberg, conocido por su compatibilidad con ACID, la capacidad de 'viajes en el tiempo' y la evolución de esquemas. Finalmente, Amazon S3 Tables ofrece soporte nativo para la gestión de tablas compatibles con Iceberg directamente en S3. El Catálogo de AWS Glue indexa estos tres formatos, creando una capa de metadatos unificada que permite la consulta fluida a través de los distintos tipos de datos.
La capa de consulta de la casa de datos utiliza Amazon Athena para ejecutar consultas SQL sobre estos formatos, ofreciendo así una interfaz de consulta unificada. Los datos estructurados de TPC-H se integran en Amazon Quick, que a su vez se conecta con Quick Sight. En Quick Sight, se crean conjuntos de datos mediante conexiones a Athena, se definen dominios de datos en 'Topics' para aportar contexto empresarial, y se desarrollan 'Dashboards Using Q' con visualizaciones interactivas y la capacidad de realizar consultas en lenguaje natural. Paralelamente, un rastreador web para las especificaciones TPC-H ingiere datos no estructurados, como documentación técnica, y los incorpora a bases de conocimiento.
Estas bases de conocimiento, alimentando los 'espacios' de Amazon Quick, dotan a los agentes de chat de Amazon Quick de conciencia contextual y conocimiento del dominio, permitiendo interacciones de alta calidad en lenguaje natural. Los usuarios interactúan con el sistema a través de dos interfaces principales. Por un lado, los paneles interactivos ('Dashboards Using Q') facilitan el análisis visual y la inteligencia de negocios de autoservicio. Por otro lado, el agente de chat conversacional permite la exploración de datos mediante consultas en lenguaje natural. La implementación de esta solución requiere una cuenta de AWS, Amazon Quick y los permisos necesarios para interactuar con los servicios involucrados.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.