Ocho empleados de Google inventan la IA moderna: la historia interna
- El artículo científico titulado "Attention Is All You Need", escrito en la primavera de 2017, tenía 8 autores.
- Todos eran investigadores de Google, y Noam Shazeer, el contribuyente con más experiencia, se sorprendió al ver que su nombre aparecía primero.
- Los autores decidieron "destruir" la práctica de clasificar las contribuciones por rango, pusieron un asterisco junto a todos los nombres y añadieron una nota al pie que decía: "el orden de aparición es aleatorio".
El inicio de una transformación
- Este artículo hizo avanzar una tecnología llamada redes neuronales dentro del campo de la IA, transformándola en poderosos sistemas digitales que se sienten como si fueran producto de una inteligencia alienígena.
- Esta arquitectura se usa como ingrediente secreto en productos de inteligencia artificial como ChatGPT, Dall-E y Midjourney.
- A casi 7 años de su publicación, el artículo ha alcanzado un estatus legendario.
La arquitectura de la transformación: Transformer
- La historia de Transformer comienza con el cuarto autor, llamado Jakob Uszkoreit.
- Uszkoreit ideó un nuevo enfoque basado en su idea de self-attention.
- Esta red puede traducir palabras consultando qué partes de una oración debe tomar como referencia, lo que ayuda al sistema a generar buenas traducciones.
Colaboración e innovación
- Uszkoreit pensaba que un modelo de self-attention podía ser más rápido y más eficaz que las redes neuronales recurrentes.
- Esta idea evolucionó a través de la colaboración con otros investigadores, como Illia Polosukhin y Ashish Vaswani.
- Ellos redactaron un documento de diseño titulado "Transformers: Iterative Self-Attention and Processing for Various Tasks".
Publicación e impacto del artículo
- El equipo de investigación realizó traducción de idiomas usando el modelo Transformer y midió su rendimiento con el benchmark BLEU.
- Su nuevo modelo superó a los competidores, y una versión más grande, Big, obtuvo una puntuación BLEU que rompió el récord anterior.
- El artículo se envió justo antes de la fecha límite, y Google presentó rápidamente una patente provisional sobre este trabajo.
La reacción de Google y los cambios
- Dentro de Google, este trabajo se veía simplemente como otro proyecto interesante de IA, y la compañía empezó a integrar Transformer en sus productos desde 2018.
- Sin embargo, este cambio parecía tímido en comparación con el salto radical de OpenAI y la audaz integración de sistemas basados en Transformer en la línea de productos de Microsoft.
Los autores que dejaron Google
- Todos los autores dejaron Google y ahora trabajan de distintas maneras sobre sistemas basados en lo que ellos mismos crearon.
- Muchas de estas personas dejaron Google para irse a nuevas startups de IA.
La opinión de GN⁺
- Este artículo ofrece una visión interesante sobre el avance de la tecnología de IA al explicar en detalle el nacimiento y la evolución del modelo Transformer, que desempeñó un papel importante en este campo.
- El modelo Transformer es hoy una tecnología central del procesamiento de lenguaje en inteligencia artificial y una invención clave que sirve de base para IA conversacionales como ChatGPT.
- El artículo muestra cómo el entorno de investigación innovador dentro de Google hizo posible un gran avance tecnológico.
- Sin embargo, el hecho de que Google adoptara un enfoque algo conservador para explotar comercialmente esta tecnología ofrece una lección importante sobre la velocidad y la estrategia de innovación de las empresas.
- Las empresas o desarrolladores que adopten esta tecnología deben considerar la complejidad y los requisitos de recursos del modelo Transformer, aunque los beneficios que pueden obtener son muy grandes.
1 comentarios
Opiniones de Hacker News
Debate sobre el modelo de atención:
Recuerdo de la época dorada de Google:
Conversación sobre la historia de la IA:
Comparación entre Google y OpenAI:
Mención de la colaboración entre empleados de Google:
Crítica a la estrategia de IA de Google:
Documentos sobre la historia de la IA dentro de Google:
Atención a la diversidad de los autores:
Apoyo a los departamentos de I+D: