8 puntos por GN⁺ 2024-07-17 | Aún no hay comentarios. | Compartir por WhatsApp

Estamos en la tercera edad dorada de la IA. En las dos edades doradas anteriores (las décadas de 1950-1960 y la de 1980), hubo decepción debido a las limitaciones de la tecnología. Sin embargo, la tecnología actual de IA está superando las expectativas. En particular, Transformer, introducido en 2017, comenzó como un modelo de traducción automática, pero hoy está influyendo en casi todos los campos. Se considera conocimiento esencial para el ingeniero moderno. El primer objetivo de este documento es ofrecer a los ingenieros la ruta más corta para entender Transformer.

Lo que ofrece este documento

  • Guía concisa: Proporciona suficiente información para aprender Transformer.
  • Ejemplos de código Python prácticos: Ofrece ejemplos de código Python que el lector puede ejecutar directamente para facilitar la comprensión.
  • Materiales de referencia para profundizar: Presenta varias opciones de documentación para que el lector pueda acceder más fácilmente.

Índice

  • Parte 1: Redes neuronales: Introduce los conceptos básicos de las redes neuronales.
  • Parte 2: Redes neuronales recurrentes (RNNs): Explora las RNN, incluidas LSTM y GRU.
  • Parte 3: Procesamiento de lenguaje natural (NLP) y mecanismos de atención: Proporciona los principios básicos de NLP, incluida la traducción automática y los mecanismos de atención.
  • Parte 4: Transformer: Explica el modelo Transformer.
  • Apéndice: Conocimientos básicos: Ofrece el conocimiento mínimo de Python y matemáticas necesario para entender Transformer.

FAQ

  • ¿Quién puede usar libremente este documento?
    • Los docentes o estudiantes que pertenezcan a instituciones educativas pueden usar libremente este documento y sus imágenes. Este documento y sus imágenes pueden usarse en conferencias y clases no comerciales, siempre que se indique el enlace de este sitio y el copyright. En caso contrario, favor de ponerse en contacto.
  • ¿Puede usarse en contenido comercial?
    • Reparto de ingresos: Se puede usar este contenido después de celebrar un acuerdo de reparto de ingresos. Según este acuerdo, debe compartirse el 20% de las ventas generadas por el uso de este contenido.
    • Compra total: En casos muy raros, se consideran solicitudes para adquirir los derechos completos del contenido. El costo de la compra total es de €10,000,000.
  • ¿Por qué el autor no renuncia al copyright de este documento ni usa una licencia Creative Commons?
    • Si tiene preguntas sobre si hay algún problema con mantener el copyright, póngase en contacto. Al enviar un correo electrónico, debe proporcionar al menos dos direcciones de redes sociales (por ejemplo, LinkedIn, Twitter). Desde el incidente de la puerta trasera de XZ, no se aceptan contactos anónimos.

Excepción

Las instituciones educativas pueden usar libremente este documento.

Resumen de GN⁺

  • Este documento es una guía concisa que proporciona los conocimientos básicos necesarios para entender el modelo Transformer.
  • Se caracteriza por ayudar al lector a aprender por su cuenta mediante ejemplos prácticos de código Python y diversos materiales de referencia.
  • El modelo Transformer es el núcleo de la tecnología moderna de IA, y entenderlo es muy importante para los ingenieros.
  • Este documento puede ser utilizado libremente por instituciones educativas, mientras que para uso comercial se requiere autorización del titular de los derechos.
  • Es un recurso útil para quienes desean explorar otras tecnologías o proyectos relacionados con Transformer.

Aún no hay comentarios.

Aún no hay comentarios.