- Se propone que una sola operación binaria EML de la forma exp(x) − ln(y) puede generar todas las funciones elementales y constantes
- Solo con esta operación y la constante 1 es posible expresar operaciones aritméticas, funciones trascendentales (sin, cos, log, √, etc.) y constantes complejas (e, π, i)
- Todas las expresiones EML se componen como árboles binarios con la misma estructura de nodos, lo que permite aplicarlas a regresión simbólica y aprendizaje basado en gradientes
- EML funciona como el equivalente matemático del compuerta NAND, desempeñando el papel de operador universal único en matemáticas continuas
- Este hallazgo muestra que todas las funciones elementales pueden reducirse a una sola regla generativa, y abre nuevas posibilidades para la búsqueda de fórmulas y la IA simbólica
Definición del operador binario único EML
- Se presenta que una sola operación binaria de la forma eml(x, y) = exp(x) − ln(y) puede generar todas las funciones elementales
- Solo con esta operación y la constante 1 se pueden expresar operaciones aritméticas (+, −, ×, /, potenciación), funciones trascendentales (sin, cos, log, √, etc.) y constantes (e, π, i)
- Como ejemplo, e^x = eml(x, 1) y ln x = eml(1, eml(eml(1, x), 1))
- El operador EML (Exp–Minus–Log) realiza cálculos en el dominio de los números complejos (C)
- La constante 1 cumple la función de neutralizar el término logarítmico mediante ln(1)=0
- A través del cálculo de ln(−1) se pueden generar constantes complejas como i y π
- Este operador se propone como la operación básica única de las matemáticas continuas correspondiente a la compuerta NAND de la lógica digital
- Así como NAND construye toda la lógica booleana, EML construye todas las funciones elementales
El concepto de una calculadora basada en un único operador
- Se propone el concepto de una “calculadora de dos botones”
- Con solo una operación binaria (EML) y una constante (1), se pueden realizar todas las funciones de una calculadora científica
- Incluso sin operadores adicionales, es posible calcular todas las funciones elementales reales y complejas
- Ya no es posible reducir más la cantidad de operadores
- Como mínimo se necesita una operación binaria y un símbolo terminal (constante)
Características estructurales de la representación EML
- Todas las expresiones EML tienen una estructura de árbol binario compuesta por nodos idénticos
- Forma gramatical: S → 1 | eml(S, S)
- Esto puede interpretarse como un lenguaje libre de contexto isomorfo a las estructuras de Catalan y a los árboles binarios completos
- Esta estructura uniforme permite aplicar optimización basada en gradientes (como Adam) en regresión simbólica (symbolic regression)
- Usando el árbol EML como un circuito entrenable, es posible recuperar con exactitud funciones elementales en forma cerrada con profundidades de árbol poco profundas (máximo 4)
- Si la ley generativa es una función elemental, los pesos aprendidos pueden converger a la forma exacta de la fórmula
Proceso de descubrimiento e implicaciones matemáticas
- El operador EML fue descubierto mediante búsqueda exhaustiva sistemática (exhaustive search)
- Los resultados de la búsqueda confirmaron que EML constituye una base operativa completa para una calculadora científica
- Se utilizó el enfoque de “calculadora rota” (broken calculator), que reduce gradualmente la cantidad de operadores
- Se pasó de 4 → 3 → 2 → 1 operadores manteniendo la funcionalidad completa
- EML tiene una simplicidad inesperada y es una operación binaria definida por funciones elementales
- La existencia de EML muestra que las funciones elementales pertenecen a una jerarquía generativa mucho más simple
- Amplía la idea de que diversas funciones pueden reducirse a combinaciones de exp y ln
- Como todas las expresiones matemáticas pueden representarse mediante un único componente repetible,
- se vuelve posible una representación circuital de fórmulas matemáticas análoga a la construcción basada en transistores de los circuitos electrónicos
- Esta representación uniforme en forma de circuito abre nuevas posibilidades para la búsqueda, evaluación y aprendizaje de fórmulas
Conceptos relacionados y contexto histórico
- La universalidad de un único elemento básico ha sido una idea importante en matemáticas, ingeniería y biología
- Ejemplos: compuertas NAND/NOR, función de activación ReLU, combinadores K,S, OISC(SUBLEQ) y el autómata celular Rule 110
- Los elementos tipo Sheffer son poco frecuentes, y su descubrimiento requiere tiempo, cómputo y suerte
- EML se presenta como un ejemplo de este tipo de operador continuo de Sheffer
- Se basa en relaciones de reducción ya conocidas, como la expresabilidad mutua entre logaritmos y exponenciales (x×y = e^{ln x + ln y}, x+y = ln(e^x × e^y)) y la fórmula de Euler (e^{iφ} = cos φ + i sin φ)
Conjunto de funciones elementales y expansión futura
- El estudio toma como punto de partida un conjunto de funciones elementales al nivel de una calculadora científica
- Constantes: π, e, i, −1, 1, 2, x, y
- Funciones unarias: exp, ln, inv(1/x), minus(−x), √, sqr(x²), σ(1/(1+e^−x)), sin, cos, tan, arcsin, arccos, arctan, sinh, cosh, tanh, etc.
- Operaciones binarias: +, −, ×, /, log, pow(x^y), avg((x+y)/2), hypot(√(x²+y²))
- Se demuestra que todo este conjunto puede reemplazarse por completo con el operador único EML y la constante 1
- En la exploración inicial también se encontraron operadores similares con propiedades aún más potentes
- Por ejemplo, una variante ternaria que no requiere constantes
- EML se presenta como un punto de partida que muestra la posibilidad de que exista un operador generativo único en matemáticas continuas
- A futuro, podría tener aplicaciones en descubrimiento automático de fórmulas, IA simbólica y optimización de representaciones matemáticas
2 comentarios
Expresado como fórmula, sería $eml(x, y) = e^x - ln(x)$, entonces.
Pero parece que realmente brillará cuando aparezca un procesador capaz de calcular $e^x$ o $ln(x)$ de una sola vez.
Comentarios en Hacker News
Este enfoque no es especial ni la forma con menor costo computacional
Por ejemplo, si se define f(x, y) = 1/(x - y), eso también se vuelve un operador universal
Si tomamos x#y = 1/(x - y), entonces x#0 = 1/x nos da el recíproco, y (x#y)#0 = x - y permite expresar la resta
Es un problema bastante común que con solo recíproco y resta se puedan construir las cuatro operaciones básicas
Hay una demostración breve relacionada en esta nota
Me da gusto ver una idea con forma de FRACTRAN en la página principal
Me recuerda a la forma de codificar una pila de 1 bit como número binario.
Hacer push de 0 duplica el número, hacer push de 1 lo duplica y luego suma 1. Pop equivale a dividir entre 2
Yo uso un lenguaje concatenativo llamado Rejoice basado en una idea parecida. Los datos se representan como multisets compuestos por multiplicación
Wiki de Rejoice
Este es un muy buen benchmark para probar el rendimiento de los LLM
Opus (paid) falló diciendo que “2” era recursivo, pero como ChatGPT ya lo había hecho, sí lo logró
ChatGPT (free) lo logró a la primera, Grok hizo una estimación de profundidad, Gemini lo logró, Deepseek no pudo cargar el PDF, Kimi se detuvo a mitad, y GLM estuvo bastante bien
Visualicé 36 funciones EML distintas de dos niveles con una sola variable
Las primeras 18 tienen salida real, y las demás incluyen valores complejos en el proceso intermedio
Enlace a la imagen
Las tablas de funciones de libros viejos de matemáticas podrían reinterpretarse como una simple búsqueda por hash
La frase “todo cálculo es posible solo con EML y el número 1” me recordó al combinador Iota
Se parece a la idea de lograr Turing completitud con un sistema formal mínimo
El enlace actual del paper es la v1 y no trae figuras. Habría que cambiarlo por la v2
Todavía lo estoy leyendo, pero si esto es cierto, podría ser un gran descubrimiento en años
Si en lugar de splines o polinomios se pudiera ajustar datos o funciones de onda con árboles EML,
entonces también se podrían aprender funciones multivariables con gradient descent y convertirlas en árboles de aproximación EML
Incluso podría entrenarse para satisfacer las condiciones de derivada de la ecuación de Schrödinger
Se ve demasiado bueno para ser verdad, pero cosas así sí han pasado
Para expresar una sola multiplicación se necesita un árbol de profundidad 8 y más de 41 hojas
Hay un trade-off entre la elegancia del conjunto mínimo de operaciones y la longitud de la representación
Yo he trabajado en un enfoque que combina teoría de operads y Category Theory con redes neuronales espectrales y symbolic regression
Los polinomios son rápidos de calcular en relación con su capacidad expresiva
Lo que describes se parece a la symbolic regression tradicional. Ya es un campo bastante maduro
Aun así, es un hallazgo muy interesante
Creo que la derivación de -x está mal
Si ves la traza de ejecución de la máquina de pila, eml(z, eml(x,1)) = e^z - x,
y para que eso sea -x tendría que cumplirse e^z = 0. Pero no existe tal número complejo z
De hecho, al desarrollar z aparece un problema como ln(0). Con x^-1 pasa algo parecido
Si asumes ln(0)=∞ y x/∞=0, entonces funciona de forma “más o menos plausible”
Siguiendo el orden del cálculo, se avanza como ln(1)=0 → e-ln(0)=+∞ → e-ln(+∞)=-∞
Se me ocurren varias ideas interesantes
Por diversión, ayer hice el proyecto emlvm
La parte de que “se puede recuperar una función en forma cerrada con árboles EML de profundidad 4 o menos” me pareció realmente genial
Siempre me había preguntado si algo así sería posible