Ingeniería de representación en Mistral-7B, viaje ácido
-
¿Qué son los vectores de control?
- Un vector de control es un vector (una lista de vectores por cada capa) que se aplica a las activaciones del modelo durante la inferencia para controlar el comportamiento del modelo sin un prompt adicional.
- Con el mismo prompt y modelo, produce resultados diferentes según se aplique o no el vector de control y según su escala.
-
No es difícil crear un vector de control
- Se construye un conjunto de datos de pares de prompts contrastivos usando PCA, se ejecuta el modelo para recopilar los estados ocultos de cada capa y luego se obtienen los vectores de control de cada capa mediante PCA de un solo componente.
- Este proceso requiere solo unas pocas líneas de código y alrededor de un minuto.
-
Qué se puede hacer con los vectores de control
- Con un vector de control puedes poner al modelo de IA en estado de "viaje ácido" o en estados como "pereza", "esfuerzo" o "creatividad", entre otros.
- Cada vector de control puede entrenarse en unos minutos y se puede probar directamente mediante un cuaderno de experimentos en GitHub.
-
Vectores de control vs ingeniería de prompts
- Los vectores de control y la ingeniería de prompts son enfoques diferentes, aunque tienen cierta superposición.
- Un vector de control puede generar resultados que también podrían replicarse con ingeniería de prompts, pero es más fácil ajustar su intensidad.
Opinión de GN⁺
- Importancia de los vectores de control: Los vectores de control son una herramienta poderosa para ajustar de forma fina el comportamiento de modelos de IA, y abren nuevas posibilidades que van más allá de los límites de la ingeniería de prompts.
- Eficiencia y accesibilidad: Con los vectores de control, los usuarios pueden ajustar el comportamiento del modelo sin construir prompts complejos, lo que puede mejorar significativamente la usabilidad de la IA.
- Aplicaciones creativas: Experimentar con vectores de control para llevar a la IA a un estado de "viaje ácido" habilita una nueva dimensión de exploración experimental en la investigación de IA.
1 comentarios
Opiniones de Hacker News
vector de controlpersonalizado para ajustar la salida de ChatGPT más cerca de las preferencias personales. Eso puede llevar a entretenimiento de IA personalizado, y en ese mercado podrían aparecer efectos de red fuertes tanto individuales como globales. Esto sugeriría que en el futuro una sola megaempresa podría terminar acaparando todo.vector de control de felicidad.