Aivizor
Aivizor
EstilosCreacionesComunidad
Atrás
  1. Comunidad
  2. /
  3. Other AI

Datadog lanza Database Investigator para acelerar diagnóstico y remediación de problemas de rendimiento en bases de datos

News
A
Anna Sokolova

5/9/2026, 12:00:57 AM

Datadog lanza Database Investigator para acelerar diagnóstico y remediación de problemas de rendimiento en bases de datos

Datadog presentó Database Investigator, una función integrada en Datadog Database Monitoring diseñada para automatizar el diagnóstico y la remediación de problemas de rendimiento en bases de datos. Emplea un enfoque basado en agentes para reunir contexto tanto de la base de datos como de la aplicación y ofrecer pasos de corrección concretos que los equipos pueden ejecutar y validar. La herramienta combina conocimiento operativo y lecciones extraídas de incidentes reales con más de 15 comprobaciones de salud automatizadas. Ofrece gráficos en vivo y enlaces directos a las consultas, los servicios y las instancias relevantes, de modo que los ingenieros puedan moverse rápidamente desde la detección del síntoma hasta la evidencia concreta que respalda un diagnóstico.

Una de las funciones destacadas es la interacción en lenguaje natural: los ingenieros pueden preguntar qué falló, por qué ocurrió y cómo arreglarlo, y luego afinar la investigación con contexto adicional o preguntas de seguimiento. Esa capacidad facilita que equipos sin experiencia profunda en bases de datos puedan iterar sobre hipótesis y confirmar cambios sin perder tiempo en traducciones manuales entre herramientas. En el plano técnico, Database Investigator analiza de forma independiente métricas de carga de trabajo, muestras de consultas, planes de ejecución y registros, y correlaciona trazas distribuidas con métricas y planes a nivel de nodo en una única vista. Al unificar esos planos de observabilidad, la plataforma permite identificar rápidamente si un síntoma proviene de la consulta, de la configuración del motor o de la infraestructura subyacente.

Datadog ilustra el flujo con un ejemplo de diagnóstico: la herramienta detectó un pico en la latencia p95 que pasó de 15 ms a 447 ms. Al inspeccionar la actividad por consulta, identificó que una operación había leído 770 MB en bloques compartidos y que el cache hit ratio se había desplomado del 99.5% al 71.8%. Con esos datos, Database Investigator clasificó el problema como una regresión a nivel de consulta, y no como saturación de la instancia.

A partir de planes de ejecución muestreados, la investigación remoto mostró que un index scan había cambiado a sequential scan y que el predicado WHERE no estaba cubierto por índice. La remediación propuesta consistió en añadir un índice compuesto que cubriera el predicado; tras esa intervención las lecturas lógicas volvieron a sus niveles de baseline y la latencia se redujo a 16 ms, con los planes de ejecución restaurados a su forma esperada.

La herramienta también puede identificar agotamiento del pool de conexiones mediante el análisis de las interacciones de bajo nivel entre la aplicación y el estado de las conexiones. Desglosa el estado de conexiones, duraciones de transacción y eventos de espera, lo que permite reconocer patrones de agotamiento aún cuando la CPU de la base de datos permanece baja-por ejemplo, errores “too many clients” apareciendo con la CPU por debajo del 20%— y orientar la remediación hacia la gestión del pool en lugar de recursos de cómputo.

Además de señalar la causa raíz y proponer pasos de remediación, Database Investigator facilita la verificación posterior: permite volver a consultar métricas y ejecutar comprobaciones en vivo para confirmar que las correcciones han reducido latencias y han restaurado los planes de ejecución esperados. Ese ciclo de diagnóstico — remediación–validación está pensado para acortar el tiempo medio de reparación (MTTR) y evitar regresiones no detectadas. El valor operativo se concentra en la correlación automatizada entre APM, métricas y planes de ejecución, lo que busca reducir escaladas a especialistas en bases de datos y habilitar a equipos de plataforma, DBAs y desarrolladores a solucionar problemas sin necesidad de una experiencia excesiva en motores concretos. De este modo, las organizaciones pueden acelerar la resolución de incidentes y priorizar intervenciones basadas en evidencia cuantificable.

La nota pública que describe la función detalla capacidades, flujos de trabajo y ejemplos de diagnóstico, pero no especifica información sobre precios, fechas de disponibilidad generales ni el listado completo de motores o versiones de bases de datos soportadas. Esos detalles no aparecen en la entrada y, por tanto, quedan pendientes de confirmación para quienes evalúen la adopción.

Fuentes

  1. Datadog AI · 5/8/2026
0
0
0

Respuestas (0)

Aún no hay respuestas en este tema.

9:41