OpenAI publica el Model Spec
(openai.com)Con el fin de aumentar la comprensión pública sobre cómo deben funcionar los modelos de IA conversacional, se publicó un documento llamado 'Model Spec'.
- El Model Spec es un documento que especifica cómo OpenAI quiere que los modelos se comporten en la API de OpenAI y en ChatGPT.
- Consideran importante que las personas puedan entender y debatir las decisiones prácticas que configuran el comportamiento del modelo.
- El Model Spec refleja documentos previos usados por OpenAI, así como investigación y experiencia sobre el diseño del comportamiento del modelo, además del trabajo en curso sobre el desarrollo futuro de modelos.
- Esto se enmarca en el esfuerzo continuo de OpenAI por mejorar el comportamiento de los modelos mediante aportes humanos, y complementa el trabajo de collective alignment y un enfoque más amplio y sistemático sobre la seguridad de los modelos.
Dar forma al comportamiento deseado del modelo (Shaping Desired Model Behavior)
El comportamiento del modelo, es decir, cómo responde a la entrada del usuario (tono, personalidad, longitud de la respuesta, etc.), es muy importante para la forma en que los humanos interactúan con las capacidades de la IA.
- Dar forma al comportamiento del modelo sigue siendo una ciencia en una etapa temprana, y los modelos no se programan explícitamente, sino que aprenden a partir de grandes volúmenes de datos.
- Al definir el comportamiento del modelo, es necesario considerar distintas preguntas, factores y matices, y con frecuencia evaluar diferencias de opinión.
- Incluso si se busca que el modelo sea ampliamente útil y beneficioso para los usuarios, esas intenciones pueden entrar en conflicto en la práctica.
- Ejemplo: una empresa de seguridad puede querer generar datos sintéticos para entrenar un clasificador de correos de phishing con el fin de proteger a sus clientes, pero si un estafador usa esa capacidad, el resultado sería dañino.
Introducción al Model Spec
- OpenAI comparte un borrador de un nuevo documento llamado 'Model Spec', que especifica cómo dar forma al comportamiento deseado del modelo y cómo evaluar compensaciones cuando surgen conflictos.
- El Model Spec integra documentos actualmente en uso dentro de OpenAI, experiencia e investigación en curso sobre el diseño del comportamiento del modelo, además de opiniones expertas y otros trabajos recientes que orientan el desarrollo futuro de modelos.
- El Model Spec no está completo y se espera que cambie con el tiempo.
El enfoque del Model Spec incluye lo siguiente:
Objetivos: principios amplios y generales que orientan el comportamiento deseado.- Apoyar a desarrolladores y usuarios finales.
- Beneficiar a la humanidad.
- Representar bien a OpenAI.
Reglas: lineamientos que ayudan a resolver complejidades y a garantizar seguridad y legalidad.- Respetar la jerarquía de instrucciones.
- Cumplir las leyes aplicables.
- No proporcionar riesgos informativos.
- Respetar a los creadores y los derechos.
- Proteger la privacidad.
- No responder con contenido NSFW.
Comportamientos predeterminados: lineamientos alineados con los objetivos y las reglas, que ofrecen formas de manejar conflictos y muestran cómo priorizar y equilibrar los objetivos.- Asumir buena fe por parte del usuario/desarrollador.
- Hacer preguntas aclaratorias cuando sea necesario.
- Ayudar lo más posible sin excederse.
- Atender las distintas necesidades del chat conversacional y del uso para programación.
- Asumir un punto de vista objetivo.
- Fomentar la equidad y la amabilidad, y desalentar el odio.
- No intentar cambiar la manera de pensar de otras personas.
- Expresar incertidumbre.
- Usar herramientas adecuadas para la tarea.
- Ser exhaustivo y eficiente respetando los límites de longitud.
Cómo se usará el Model Spec
- OpenAI planea usar el Model Spec, como extensión de su trabajo en collective alignment y seguridad de modelos, como guía para investigadores y entrenadores de IA que realizan aprendizaje por refuerzo a partir de retroalimentación humana.
- También planea explorar hasta qué punto los modelos pueden aprender directamente del Model Spec.
Próximos pasos
- OpenAI considera este trabajo como parte de una conversación pública continua sobre cómo deberían comportarse los modelos, cómo decidir cuál es el comportamiento deseable y cuál es la mejor manera de involucrar al público general en estas discusiones.
- A medida que continúe la conversación, buscarán oportunidades para colaborar con actores representativos a nivel global, incluidos responsables de políticas públicas, instituciones de confianza y expertos de dominio.
- Con ello buscan identificar lo siguiente:
- Cómo entienden los actores interesados el enfoque del Model Spec y sus objetivos, reglas y valores predeterminados individuales.
- Si los actores interesados apoyan el enfoque y los objetivos, reglas y valores predeterminados individuales.
- Si hay objetivos, reglas o valores predeterminados adicionales que deberían considerarse.
- OpenAI espera escuchar la opinión de los actores interesados a medida que este trabajo avance.
- Además, durante las próximas 2 semanas, anima al público general a compartir comentarios sobre los objetivos, reglas y valores predeterminados del Model Spec.
- Espera que esto permita obtener ideas tempranas para desarrollar un proceso sólido de recopilación e integración de comentarios que ayude a avanzar de manera responsable hacia su misión.
- Durante el próximo año, OpenAI compartirá actualizaciones sobre cambios en el Model Spec, respuestas a los comentarios y avances de investigación sobre cómo dar forma al comportamiento del modelo.
Aún no hay comentarios.