Generan todas las funciones elementales a partir de una sola operación binaria

(arxiv.org)

7 puntos por GN⁺ 16 일 전 | 2 comentarios | Compartir por WhatsApp

Se propone que una sola operación binaria EML de la forma exp(x) − ln(y) puede generar todas las funciones elementales y constantes
Solo con esta operación y la constante 1 es posible expresar operaciones aritméticas, funciones trascendentales (sin, cos, log, √, etc.) y constantes complejas (e, π, i)
Todas las expresiones EML se componen como árboles binarios con la misma estructura de nodos, lo que permite aplicarlas a regresión simbólica y aprendizaje basado en gradientes
EML funciona como el equivalente matemático del compuerta NAND, desempeñando el papel de operador universal único en matemáticas continuas
Este hallazgo muestra que todas las funciones elementales pueden reducirse a una sola regla generativa, y abre nuevas posibilidades para la búsqueda de fórmulas y la IA simbólica

Definición del operador binario único EML

Se presenta que una sola operación binaria de la forma eml(x, y) = exp(x) − ln(y) puede generar todas las funciones elementales
- Solo con esta operación y la constante 1 se pueden expresar operaciones aritméticas (+, −, ×, /, potenciación), funciones trascendentales (sin, cos, log, √, etc.) y constantes (e, π, i)
- Como ejemplo, e^x = eml(x, 1) y ln x = eml(1, eml(eml(1, x), 1))
El operador EML (Exp–Minus–Log) realiza cálculos en el dominio de los números complejos (C)
- La constante 1 cumple la función de neutralizar el término logarítmico mediante ln(1)=0
- A través del cálculo de ln(−1) se pueden generar constantes complejas como i y π
Este operador se propone como la operación básica única de las matemáticas continuas correspondiente a la compuerta NAND de la lógica digital
- Así como NAND construye toda la lógica booleana, EML construye todas las funciones elementales

El concepto de una calculadora basada en un único operador

Se propone el concepto de una “calculadora de dos botones”
- Con solo una operación binaria (EML) y una constante (1), se pueden realizar todas las funciones de una calculadora científica
- Incluso sin operadores adicionales, es posible calcular todas las funciones elementales reales y complejas
Ya no es posible reducir más la cantidad de operadores
- Como mínimo se necesita una operación binaria y un símbolo terminal (constante)

Características estructurales de la representación EML

Todas las expresiones EML tienen una estructura de árbol binario compuesta por nodos idénticos
- Forma gramatical: S → 1 | eml(S, S)
- Esto puede interpretarse como un lenguaje libre de contexto isomorfo a las estructuras de Catalan y a los árboles binarios completos
Esta estructura uniforme permite aplicar optimización basada en gradientes (como Adam) en regresión simbólica (symbolic regression)
- Usando el árbol EML como un circuito entrenable, es posible recuperar con exactitud funciones elementales en forma cerrada con profundidades de árbol poco profundas (máximo 4)
- Si la ley generativa es una función elemental, los pesos aprendidos pueden converger a la forma exacta de la fórmula

Proceso de descubrimiento e implicaciones matemáticas

El operador EML fue descubierto mediante búsqueda exhaustiva sistemática (exhaustive search)
- Los resultados de la búsqueda confirmaron que EML constituye una base operativa completa para una calculadora científica
Se utilizó el enfoque de “calculadora rota” (broken calculator), que reduce gradualmente la cantidad de operadores
- Se pasó de 4 → 3 → 2 → 1 operadores manteniendo la funcionalidad completa
EML tiene una simplicidad inesperada y es una operación binaria definida por funciones elementales
La existencia de EML muestra que las funciones elementales pertenecen a una jerarquía generativa mucho más simple
- Amplía la idea de que diversas funciones pueden reducirse a combinaciones de exp y ln
Como todas las expresiones matemáticas pueden representarse mediante un único componente repetible,
- se vuelve posible una representación circuital de fórmulas matemáticas análoga a la construcción basada en transistores de los circuitos electrónicos
Esta representación uniforme en forma de circuito abre nuevas posibilidades para la búsqueda, evaluación y aprendizaje de fórmulas

Conceptos relacionados y contexto histórico

La universalidad de un único elemento básico ha sido una idea importante en matemáticas, ingeniería y biología
- Ejemplos: compuertas NAND/NOR, función de activación ReLU, combinadores K,S, OISC(SUBLEQ) y el autómata celular Rule 110
Los elementos tipo Sheffer son poco frecuentes, y su descubrimiento requiere tiempo, cómputo y suerte
- EML se presenta como un ejemplo de este tipo de operador continuo de Sheffer
Se basa en relaciones de reducción ya conocidas, como la expresabilidad mutua entre logaritmos y exponenciales (x×y = e^{ln x + ln y}, x+y = ln(e^x × e^y)) y la fórmula de Euler (e^{iφ} = cos φ + i sin φ)

Conjunto de funciones elementales y expansión futura

El estudio toma como punto de partida un conjunto de funciones elementales al nivel de una calculadora científica
- Constantes: π, e, i, −1, 1, 2, x, y
- Funciones unarias: exp, ln, inv(1/x), minus(−x), √, sqr(x²), σ(1/(1+e^−x)), sin, cos, tan, arcsin, arccos, arctan, sinh, cosh, tanh, etc.
- Operaciones binarias: +, −, ×, /, log, pow(x^y), avg((x+y)/2), hypot(√(x²+y²))
Se demuestra que todo este conjunto puede reemplazarse por completo con el operador único EML y la constante 1
En la exploración inicial también se encontraron operadores similares con propiedades aún más potentes
- Por ejemplo, una variante ternaria que no requiere constantes
EML se presenta como un punto de partida que muestra la posibilidad de que exista un operador generativo único en matemáticas continuas
- A futuro, podría tener aplicaciones en descubrimiento automático de fórmulas, IA simbólica y optimización de representaciones matemáticas

2 comentarios

carnoxen 14 일 전

Expresado como fórmula, sería $eml(x, y) = e^x - ln(x)$, entonces.

Pero parece que realmente brillará cuando aparezca un procesador capaz de calcular $e^x$ o $ln(x)$ de una sola vez.

GN⁺ 16 일 전

Comentarios en Hacker News

Este enfoque no es especial ni la forma con menor costo computacional
Por ejemplo, si se define f(x, y) = 1/(x - y), eso también se vuelve un operador universal
Si tomamos x#y = 1/(x - y), entonces x#0 = 1/x nos da el recíproco, y (x#y)#0 = x - y permite expresar la resta
Es un problema bastante común que con solo recíproco y resta se puedan construir las cuatro operaciones básicas
Hay una demostración breve relacionada en esta nota
- Lo interesante es que este enfoque incluye incluso las constantes e, π, i. También abarca suma, multiplicación, exponenciales, logaritmos y otras funciones trascendentales
- La forma f(x, y) que mencionas necesita límites (limit) para expresar ciertos conceptos, pero el enfoque EML está estructurado como un árbol de cómputo que representa el modelo del sistema
- Buen hallazgo. Cita un artículo de 1935 (artículo en PNAS), y la discusión relacionada también continúa en MathOverflow
- Entonces me pregunto si con esta representación única también se pueden derivar las funciones trigonométricas
- Pero con este método parece difícil manejar constantes estándar o expresiones en forma cerrada como e, π, exp, log
Me da gusto ver una idea con forma de FRACTRAN en la página principal
Me recuerda a la forma de codificar una pila de 1 bit como número binario.
Hacer push de 0 duplica el número, hacer push de 1 lo duplica y luego suma 1. Pop equivale a dividir entre 2
Yo uso un lenguaje concatenativo llamado Rejoice basado en una idea parecida. Los datos se representan como multisets compuestos por multiplicación
Wiki de Rejoice
- ¿No necesitas rastrear el tamaño de la pila para saber si hay ceros al inicio?
- Siento que esta explicación solo está reformulando el principio básico de los números binarios
Este es un muy buen benchmark para probar el rendimiento de los LLM
```
paper: https://arxiv.org/pdf/2603.21852
Express "2x + y" as an EML composition
```
Opus (paid) falló diciendo que “2” era recursivo, pero como ChatGPT ya lo había hecho, sí lo logró
ChatGPT (free) lo logró a la primera, Grok hizo una estimación de profundidad, Gemini lo logró, Deepseek no pudo cargar el PDF, Kimi se detuvo a mitad, y GLM estuvo bastante bien
- Hoy aprendí que si provocas (taunt) a un LLM, trabaja mejor. Parece que sí tiene espíritu competitivo
- Le pegué solo el resumen a DeepSeek y aun así dio resultado. Quitarle puntos por no conocer el PDF es injusto
- Si te gustan estos experimentos, te recomiendo contribuir a Terminal Bench Science
- Probé cambiando el prompt así:
```
eml(x,y)=exp(x)−ln(y)
Express sin(x)/x using EML and constant 1
```
- El modo instant de meta.ai también lo logró a la primera
```
2x + y = \operatorname{eml}\Big(1,\; \operatorname{eml}\big(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(1,\; \operatorname{eml}(\operatorname{eml}(L_2 + L_x, 1), 1) \cdot \operatorname{eml}(y,1)),1)\big),1\big)\Big)
```
  Gemini confundió EML con “elementary mathematical layers”
Visualicé 36 funciones EML distintas de dos niveles con una sola variable
Las primeras 18 tienen salida real, y las demás incluyen valores complejos en el proceso intermedio
Enlace a la imagen
- Sería interesante clasificar todas las funciones de árbol binario de profundidad fija, y codificar los árboles como números binarios
  Las tablas de funciones de libros viejos de matemáticas podrían reinterpretarse como una simple búsqueda por hash
La frase “todo cálculo es posible solo con EML y el número 1” me recordó al combinador Iota
Se parece a la idea de lograr Turing completitud con un sistema formal mínimo
El enlace actual del paper es la v1 y no trae figuras. Habría que cambiarlo por la v2
Todavía lo estoy leyendo, pero si esto es cierto, podría ser un gran descubrimiento en años
Si en lugar de splines o polinomios se pudiera ajustar datos o funciones de onda con árboles EML,
entonces también se podrían aprender funciones multivariables con gradient descent y convertirlas en árboles de aproximación EML
Incluso podría entrenarse para satisfacer las condiciones de derivada de la ecuación de Schrödinger
Se ve demasiado bueno para ser verdad, pero cosas así sí han pasado
- Por mi experiencia investigando esta área durante un año, EML es potente, pero el problema es la explosión de expresiones
  Para expresar una sola multiplicación se necesita un árbol de profundidad 8 y más de 41 hojas
  Hay un trade-off entre la elegancia del conjunto mínimo de operaciones y la longitud de la representación
  Yo he trabajado en un enfoque que combina teoría de operads y Category Theory con redes neuronales espectrales y symbolic regression
- Es la misma razón por la que no implementamos toda la lógica booleana solo con NAND. Es por eficiencia computacional
  Los polinomios son rápidos de calcular en relación con su capacidad expresiva
- El paper es interesante y elegante, pero no es una alternativa competitiva para regresión u optimización
  Lo que describes se parece a la symbolic regression tradicional. Ya es un campo bastante maduro
- Lo basado en EML está padre, pero incluso funciones simples (por ejemplo, +) son difíciles de expresar
  Aun así, es un hallazgo muy interesante
- Es un truco genial, pero llamarlo un descubrimiento importante parece exagerado
Creo que la derivación de -x está mal
Si ves la traza de ejecución de la máquina de pila, eml(z, eml(x,1)) = e^z - x,
y para que eso sea -x tendría que cumplirse e^z = 0. Pero no existe tal número complejo z
De hecho, al desarrollar z aparece un problema como ln(0). Con x^-1 pasa algo parecido
Si asumes ln(0)=∞ y x/∞=0, entonces funciona de forma “más o menos plausible”
- El autor menciona la notación RPN, pero las fórmulas solo están en imágenes, lo cual es incómodo
  Siguiendo el orden del cálculo, se avanza como ln(1)=0 → e-ln(0)=+∞ → e-ln(+∞)=-∞
- El paper sí reconoce este problema. Juzgué demasiado rápido
Se me ocurren varias ideas interesantes
1. Si agregas valor absoluto como sqrt(x*x), también se pueden derivar min, max y signum
2. Si f(x) y f⁻¹(x) son funciones biyectivas expresables con eml(), entonces usando eml(f(x), f(y)) y f⁻¹(1) se podría construir otra base universal
3. En vez del logaritmo natural, usar una base del tipo 2^x - log₂(y) podría ser computacionalmente más eficiente. Me recuerda a Elias omega coding
4. Si hubiera un algoritmo para calcular derivadas de árboles eml(), se podría demostrar con claridad qué funciones no pueden tener antiderivada simbólica
5. La extensión al dominio complejo también podría conectarse con la lógica difusa de valores de verdad complejos. Tal vez se podría unificar la lógica de Łukasiewicz y la lógica multiplicativa
Por diversión, ayer hice el proyecto emlvm
La parte de que “se puede recuperar una función en forma cerrada con árboles EML de profundidad 4 o menos” me pareció realmente genial
Siempre me había preguntado si algo así sería posible