
AlphaProof Nexus, el sistema de Google DeepMind, resolvió de forma autónoma nueve de 353 problemas abiertos de Erdős y 44 de 492 conjeturas de la OEIS, además de cerrar una cuestión sobre funciones de Hilbert y mejorar un límite en optimización convexa;
AlphaProof Nexus, el marco de demostración automática de Google DeepMind, ha producido demostraciones verificables para varios problemas matemáticos abiertos por décadas, gastando solo unos cientos de dólares en los intentos reportados. Hilbert pendiente 15 años y la mejora de un límite en optimización convexa.
En lo técnico, AlphaProof Nexus emplea el modelo Gemini 3.1 Pro para generar pasos de prueba escritos en el lenguaje formal Lean; cada paso lo verifica el compilador de Lean y los mensajes de error se retroalimentan a los agentes del sistema. Los agentes de valoración usan Gemini 3.0 Flash para evaluar candidatos, y la intervención humana se limita, según el equipo, a la revisión final de las pruebas verificadas por Lean.
El enfoque difiere de las aproximaciones basadas solo en lenguaje natural: traducir las pruebas a Lean y aplicar verificación simbólica automática ancla las demostraciones en una verificación formal que corrige errores lógicos que un LLM podría pasar por alto. DeepMind admite, no obstante, que la mayoría de los problemas intentados quedaron fuera del alcance del sistema y que la tasa de éxito reportada es del 2.5%, lo que subraya la necesidad de supervisión humana y la función complementaria del sistema frente a los matemáticos.
La combinación de generación por LLM y verificación formal permite obtener demostraciones mecanizables y reproducibles a coste relativamente bajo, lo que abre vías para experimentos sistemáticos en investigación matemática. Esto puede acelerar trabajos exploratorios y ofrecer herramientas para verificar con rapidez conjeturas concretas, aunque AlphaProof Nexus, tal como está, complementa la labor humana en lugar de sustituirla.
Fuentes
Respuestas (0)
Aún no hay respuestas en este tema.