Estado de GPT [video de 42 min]

xguru · 2023-06-01T10:32:01+09:00

Contenido presentado por Andrej Karpathy en Build 2023 Consta de 2 partes Cómo entrenar un asistente (Chat)GPT Cómo aplicar este asistente en tu propia aplicación Explica ampliamente temas como Tokenization, Pretraining, Supervised Finetuning y Reinforcement Learning from Human Feedback, y también presenta estrategias de prompting, diversas herramientas del ecosistema y futuras expansiones

(build.microsoft.com)

34 puntos por xguru 2023-06-01 | 2 comentarios | Compartir por WhatsApp

Contenido presentado por Andrej Karpathy en Build 2023
Consta de 2 partes
- Cómo entrenar un asistente (Chat)GPT
- Cómo aplicar este asistente en tu propia aplicación
Explica ampliamente temas como Tokenization, Pretraining, Supervised Finetuning y Reinforcement Learning from Human Feedback,
y también presenta estrategias de prompting, diversas herramientas del ecosistema y futuras expansiones

2 comentarios

kuroneko 2023-06-01

Al resumirlo, queda así.

Los modelos de lenguaje grandes como GPT se entrenan mediante una etapa de preentrenamiento sobre grandes volúmenes de datos de texto y un ajuste fino para tareas específicas.
El preentrenamiento implica predecir la siguiente palabra en una secuencia para aprender representaciones generales del lenguaje. El ajuste fino adapta el modelo a una tarea específica.
El prompting también puede usarse para aplicar un modelo de lenguaje a una tarea sin ajuste fino, proporcionando un prompt para que el modelo genere una respuesta.
El ajuste fino supervisado entrena un modelo asistente usando datos etiquetados con prompts y respuestas ideales.
El rendimiento puede mejorarse aún más realizando aprendizaje por refuerzo con retroalimentación humana para entrenar al modelo asistente a generar respuestas que los humanos valoren bien.
Las técnicas de ingeniería de prompts que muestran paso a paso el proceso de trabajo del modelo o proporcionan ejemplos pueden mejorar el rendimiento de los modelos de lenguaje.
Los modelos de lenguaje carecen del monólogo interno y la capacidad de razonamiento que tienen los humanos, por lo que el prompting debe compensar eso.
Dar a los modelos de lenguaje acceso a herramientas externas, calculadoras y bases de conocimiento puede mejorar su rendimiento.
Ajustar finamente algunas partes del modelo de lenguaje para tareas específicas puede aumentar el rendimiento, pero es más complejo.
Siguen existiendo varias limitaciones de los modelos de lenguaje, como sesgos, errores de razonamiento y vulnerabilidad a ataques.

xguru 2023-06-01

https://www.youtube.com/watch?v=bZQun8Y4L2A
El mismo video también está en YouTube, pero en el sitio de Microsoft ofrece subtítulos en coreano traducidos con IA, así que lo comparto por ese lado.

Estado de GPT [video de 42 min]

Lecturas relacionadas

2 comentarios