- Artículo publicado en el blog por Jan Leike, líder del equipo de alignment de OpenAI, traducido con DeepL
- Alignment es "alinear un sistema de IA con un ser humano"
- Hay dos categorías de alineación: según "las preferencias individuales (todos quieren una IA alineada con ellos mismos)" y según "las preferencias colectivas (¿para qué usos debería poder utilizarse la IA y cuál debería ser su funcionamiento predeterminado?)"
- Este artículo trata sobre la segunda categoría
Propuesta: democracia deliberativa simulada
- La idea central es usar modelos de lenguaje grandes para entrenarlos a imitar la "democracia deliberativa"
- La democracia deliberativa es un proceso de toma de decisiones o formulación de políticas en el que una pequeña muestra de la población seleccionada al azar (un "mini público") delibera explícitamente
- Cómo construir una democracia deliberativa simulada
- Recolectar un conjunto de datos de preguntas sobre valores
- Registros de deliberación humana
- Aprendizaje por imitación condicionado por contexto
- Simulación. Preguntas sobre nuevos valores
1 comentarios
Les recomiendo leer también la publicación de Seungjun Choi, "Explicación adicional sobre el contexto de este artículo". (También hay un enlace en la primera parte del documento)
https://facebook.com/seungjoon.choi/posts/…