34 puntos por xguru 2023-06-01 | 2 comentarios | Compartir por WhatsApp
  • Contenido presentado por Andrej Karpathy en Build 2023
  • Consta de 2 partes
    • Cómo entrenar un asistente (Chat)GPT
    • Cómo aplicar este asistente en tu propia aplicación
  • Explica ampliamente temas como Tokenization, Pretraining, Supervised Finetuning y Reinforcement Learning from Human Feedback,
    y también presenta estrategias de prompting, diversas herramientas del ecosistema y futuras expansiones

2 comentarios

 
kuroneko 2023-06-01

Al resumirlo, queda así.

  • Los modelos de lenguaje grandes como GPT se entrenan mediante una etapa de preentrenamiento sobre grandes volúmenes de datos de texto y un ajuste fino para tareas específicas.
  • El preentrenamiento implica predecir la siguiente palabra en una secuencia para aprender representaciones generales del lenguaje. El ajuste fino adapta el modelo a una tarea específica.
  • El prompting también puede usarse para aplicar un modelo de lenguaje a una tarea sin ajuste fino, proporcionando un prompt para que el modelo genere una respuesta.
  • El ajuste fino supervisado entrena un modelo asistente usando datos etiquetados con prompts y respuestas ideales.
  • El rendimiento puede mejorarse aún más realizando aprendizaje por refuerzo con retroalimentación humana para entrenar al modelo asistente a generar respuestas que los humanos valoren bien.
  • Las técnicas de ingeniería de prompts que muestran paso a paso el proceso de trabajo del modelo o proporcionan ejemplos pueden mejorar el rendimiento de los modelos de lenguaje.
  • Los modelos de lenguaje carecen del monólogo interno y la capacidad de razonamiento que tienen los humanos, por lo que el prompting debe compensar eso.
  • Dar a los modelos de lenguaje acceso a herramientas externas, calculadoras y bases de conocimiento puede mejorar su rendimiento.
  • Ajustar finamente algunas partes del modelo de lenguaje para tareas específicas puede aumentar el rendimiento, pero es más complejo.
  • Siguen existiendo varias limitaciones de los modelos de lenguaje, como sesgos, errores de razonamiento y vulnerabilidad a ataques.
 
xguru 2023-06-01

https://www.youtube.com/watch?v=bZQun8Y4L2A
El mismo video también está en YouTube, pero en el sitio de Microsoft ofrece subtítulos en coreano traducidos con IA, así que lo comparto por ese lado.