OpenAI publica el Model Spec

(openai.com)

7 puntos por xguru 2024-05-10 | Aún no hay comentarios. | Compartir por WhatsApp

Con el fin de aumentar la comprensión pública sobre cómo deben funcionar los modelos de IA conversacional, se publicó un documento llamado 'Model Spec'.

El Model Spec es un documento que especifica cómo OpenAI quiere que los modelos se comporten en la API de OpenAI y en ChatGPT.
Consideran importante que las personas puedan entender y debatir las decisiones prácticas que configuran el comportamiento del modelo.
El Model Spec refleja documentos previos usados por OpenAI, así como investigación y experiencia sobre el diseño del comportamiento del modelo, además del trabajo en curso sobre el desarrollo futuro de modelos.
Esto se enmarca en el esfuerzo continuo de OpenAI por mejorar el comportamiento de los modelos mediante aportes humanos, y complementa el trabajo de collective alignment y un enfoque más amplio y sistemático sobre la seguridad de los modelos.

Dar forma al comportamiento deseado del modelo (Shaping Desired Model Behavior)

El comportamiento del modelo, es decir, cómo responde a la entrada del usuario (tono, personalidad, longitud de la respuesta, etc.), es muy importante para la forma en que los humanos interactúan con las capacidades de la IA.

Dar forma al comportamiento del modelo sigue siendo una ciencia en una etapa temprana, y los modelos no se programan explícitamente, sino que aprenden a partir de grandes volúmenes de datos.
Al definir el comportamiento del modelo, es necesario considerar distintas preguntas, factores y matices, y con frecuencia evaluar diferencias de opinión.
Incluso si se busca que el modelo sea ampliamente útil y beneficioso para los usuarios, esas intenciones pueden entrar en conflicto en la práctica.
- Ejemplo: una empresa de seguridad puede querer generar datos sintéticos para entrenar un clasificador de correos de phishing con el fin de proteger a sus clientes, pero si un estafador usa esa capacidad, el resultado sería dañino.

Introducción al Model Spec

OpenAI comparte un borrador de un nuevo documento llamado 'Model Spec', que especifica cómo dar forma al comportamiento deseado del modelo y cómo evaluar compensaciones cuando surgen conflictos.
El Model Spec integra documentos actualmente en uso dentro de OpenAI, experiencia e investigación en curso sobre el diseño del comportamiento del modelo, además de opiniones expertas y otros trabajos recientes que orientan el desarrollo futuro de modelos.
El Model Spec no está completo y se espera que cambie con el tiempo.

El enfoque del Model Spec incluye lo siguiente:

Objetivos: principios amplios y generales que orientan el comportamiento deseado.
- Apoyar a desarrolladores y usuarios finales.
- Beneficiar a la humanidad.
- Representar bien a OpenAI.
Reglas: lineamientos que ayudan a resolver complejidades y a garantizar seguridad y legalidad.
- Respetar la jerarquía de instrucciones.
- Cumplir las leyes aplicables.
- No proporcionar riesgos informativos.
- Respetar a los creadores y los derechos.
- Proteger la privacidad.
- No responder con contenido NSFW.
Comportamientos predeterminados: lineamientos alineados con los objetivos y las reglas, que ofrecen formas de manejar conflictos y muestran cómo priorizar y equilibrar los objetivos.
- Asumir buena fe por parte del usuario/desarrollador.
- Hacer preguntas aclaratorias cuando sea necesario.
- Ayudar lo más posible sin excederse.
- Atender las distintas necesidades del chat conversacional y del uso para programación.
- Asumir un punto de vista objetivo.
- Fomentar la equidad y la amabilidad, y desalentar el odio.
- No intentar cambiar la manera de pensar de otras personas.
- Expresar incertidumbre.
- Usar herramientas adecuadas para la tarea.
- Ser exhaustivo y eficiente respetando los límites de longitud.

Cómo se usará el Model Spec

OpenAI planea usar el Model Spec, como extensión de su trabajo en collective alignment y seguridad de modelos, como guía para investigadores y entrenadores de IA que realizan aprendizaje por refuerzo a partir de retroalimentación humana.
También planea explorar hasta qué punto los modelos pueden aprender directamente del Model Spec.

Próximos pasos

OpenAI considera este trabajo como parte de una conversación pública continua sobre cómo deberían comportarse los modelos, cómo decidir cuál es el comportamiento deseable y cuál es la mejor manera de involucrar al público general en estas discusiones.
A medida que continúe la conversación, buscarán oportunidades para colaborar con actores representativos a nivel global, incluidos responsables de políticas públicas, instituciones de confianza y expertos de dominio.
Con ello buscan identificar lo siguiente:
1. Cómo entienden los actores interesados el enfoque del Model Spec y sus objetivos, reglas y valores predeterminados individuales.
2. Si los actores interesados apoyan el enfoque y los objetivos, reglas y valores predeterminados individuales.
3. Si hay objetivos, reglas o valores predeterminados adicionales que deberían considerarse.
OpenAI espera escuchar la opinión de los actores interesados a medida que este trabajo avance.
Además, durante las próximas 2 semanas, anima al público general a compartir comentarios sobre los objetivos, reglas y valores predeterminados del Model Spec.
Espera que esto permita obtener ideas tempranas para desarrollar un proceso sólido de recopilación e integración de comentarios que ayude a avanzar de manera responsable hacia su misión.
Durante el próximo año, OpenAI compartirá actualizaciones sobre cambios en el Model Spec, respuestas a los comentarios y avances de investigación sobre cómo dar forma al comportamiento del modelo.