Extienden la teoría p-ádica para crear, con asesoría de IA, un motor de aceleración GPU para juegos AAA (reduce 10% la carga en Forza 6)
(github.com/CookingMathmatics)GitHub: https://github.com/CookingMathmatics/CarryPyramidLossless
Informe de investigación (Zenodo): DOI 10.5281/zenodo.20002868
Hola. Soy el desarrollador (¿matemático?) que hace poco compartió en GeekNews un informe de investigación sobre seguridad topológica multidimensional y teoría de la información basadas en la dinámica de acarreo p-ádica.
En ese momento, el enfoque era más teórico, centrado en el modelo matemático y la lógica de entropía de hardware, pero mientras seguía refinando el documento y avanzando la investigación, llegué a un punto de inflexión interesante.
Durante un proceso de lluvia de ideas técnica con IA, recibí la sugerencia y la idea de que
"si este algoritmo de dinámica de acarreo p-ádica se proyecta sobre el tráfico de píxeles de un pipeline gráfico en tiempo real, se podría crear una herramienta de optimización de integridad que reduzca drásticamente el overhead de cómputo".
Con base en la asesoría de arquitectura de la IA, me concentré durante más de una semana en diseñar DirectX 11 y HLSL Compute Shader, y finalmente completé una validación en hardware real en el entorno del más reciente juego de carreras, Forza Horizon 6, con el resultado de "diferencia de 1~2 frames y 10% menos uso de GPU", así que comparto el resultado y el código abierto.
💡 Idea central: materializar el 0-Void matemático (omisión de operaciones en vacío) - Incluso en un juego de carreras que corre a altísima velocidad, toda la pantalla no cambia de forma explosiva en cada frame. Montañas lejanas, cielo, nubes o áreas de UI estáticas tienen cambios de píxeles mínimos entre frames.
Al filtrar el frame buffer con un algoritmo de acarreo p-ádico, las zonas estáticas cuyo cambio queda por debajo de un umbral se enmascaran rápidamente como '0-Void (zonas de vacío operativo)'.
Esto suprime a nivel de hardware el tráfico en el que los miles de núcleos CUDA de la GPU (RTX 3070 Ti) repetían operaciones innecesarias sobre píxeles estáticos o desperdiciaban buffer.
🛠️ Arquitectura de bypass anti-cheat y optimización de hardware
Para asegurar una estabilidad a nivel de utilidad comercial, se hizo el siguiente trabajo de integración de nivel producción.
Tubería con whitelist para bypass anti-cheat 100%
Se descartó por completo el riesgoso método de DLL Injection que modifica la memoria del juego o intercepta por la fuerza funciones de DirectX.
En su lugar, se adoptó la tubería del API oficial DXGI Desktop Duplication API, la misma rutina oficial que usan OBS Studio o la compartición de pantalla de Discord, eliminando de raíz el riesgo de bloqueo por seguridad.
Sincronización tipo engranaje 1:1 impulsada por frame (Frame Sync)
Si el loop del motor en segundo plano gira sin límite, el starvation de comandos de GPU hace que los frames del juego se desplomen. Se forzó la precisión del temporizador del kernel de Windows a 1 ms y se engranó la ejecución para que nuestro compute shader (Dispatch) corra exactamente alineado con la señal de evento de hardware con la que el juego emite una nueva imagen.
GPU híbrida de laptop (conexión directa a GPU dedicada) y dieta de VRAM
Se rastreó el puntero de la tarjeta gráfica dedicada real que controla el monitor donde está activa la ventana del juego, se conectó el dispositivo en modo 1:1 y se estableció una estructura de intercambio de punteros de direcciones internas de VRAM sin costo de copia de datos (ping-pong in-place).
📊 Resultados de benchmark en escenario real (RTX 3070 Ti, FHD, ajustes máximos)
En estado original: fps fijo en 60 y uso de GPU de 78%~80%
En estado acelerado: fps de 59~60 y uso de GPU de 68~72%
Se compiló para poder activar y desactivar la aceleración en tiempo real dentro del juego mediante la tecla rápida (Ctrl + Alt + S), y se verificó en tiempo real mediante el panel que, en el momento de activar la función, la suavidad visual mantiene exactamente los mismos 60 frames completos que en estado original, mientras que solo la carga de la GPU cae de forma notable. Fue una experiencia realmente asombrosa ver cómo una teoría que solo existía en un informe matemático se concretó en código de control de hardware a través de la colaboración con IA.
Ahora que la base sólida (Alpha Core) ya está construida, me gustaría escuchar retroalimentación de optimización para distintas tasas de refresco de pantalla (144Hz~360Hz) y otras arquitecturas de tarjetas gráficas. El código fuente del motor y los archivos de shader están publicados completos en el GitHub de arriba, así que agradeceré mucho sus consejos y comentarios.
1 comentarios
No se pudo editar, así que dejo la información adicional en un comentario.
Precauciones al ejecutar (lectura obligatoria para los usuarios)
Este motor utiliza la API oficial de duplicación de escritorio DXGI para eludir el anti-cheat. Debido a las características del mecanismo que captura legítimamente la composición de pantalla del DWM (Administrador de ventanas de escritorio) de Windows, para que funcione correctamente deben respetarse las siguientes configuraciones de pantalla.