7 puntos por xguru 2024-05-10 | Aún no hay comentarios. | Compartir por WhatsApp

Con el fin de aumentar la comprensión pública sobre cómo deben funcionar los modelos de IA conversacional, se publicó un documento llamado 'Model Spec'.

  • El Model Spec es un documento que especifica cómo OpenAI quiere que los modelos se comporten en la API de OpenAI y en ChatGPT.
  • Consideran importante que las personas puedan entender y debatir las decisiones prácticas que configuran el comportamiento del modelo.
  • El Model Spec refleja documentos previos usados por OpenAI, así como investigación y experiencia sobre el diseño del comportamiento del modelo, además del trabajo en curso sobre el desarrollo futuro de modelos.
  • Esto se enmarca en el esfuerzo continuo de OpenAI por mejorar el comportamiento de los modelos mediante aportes humanos, y complementa el trabajo de collective alignment y un enfoque más amplio y sistemático sobre la seguridad de los modelos.

Dar forma al comportamiento deseado del modelo (Shaping Desired Model Behavior)

El comportamiento del modelo, es decir, cómo responde a la entrada del usuario (tono, personalidad, longitud de la respuesta, etc.), es muy importante para la forma en que los humanos interactúan con las capacidades de la IA.

  • Dar forma al comportamiento del modelo sigue siendo una ciencia en una etapa temprana, y los modelos no se programan explícitamente, sino que aprenden a partir de grandes volúmenes de datos.
  • Al definir el comportamiento del modelo, es necesario considerar distintas preguntas, factores y matices, y con frecuencia evaluar diferencias de opinión.
  • Incluso si se busca que el modelo sea ampliamente útil y beneficioso para los usuarios, esas intenciones pueden entrar en conflicto en la práctica.
    • Ejemplo: una empresa de seguridad puede querer generar datos sintéticos para entrenar un clasificador de correos de phishing con el fin de proteger a sus clientes, pero si un estafador usa esa capacidad, el resultado sería dañino.

Introducción al Model Spec

  • OpenAI comparte un borrador de un nuevo documento llamado 'Model Spec', que especifica cómo dar forma al comportamiento deseado del modelo y cómo evaluar compensaciones cuando surgen conflictos.
  • El Model Spec integra documentos actualmente en uso dentro de OpenAI, experiencia e investigación en curso sobre el diseño del comportamiento del modelo, además de opiniones expertas y otros trabajos recientes que orientan el desarrollo futuro de modelos.
  • El Model Spec no está completo y se espera que cambie con el tiempo.

El enfoque del Model Spec incluye lo siguiente:

  1. Objetivos: principios amplios y generales que orientan el comportamiento deseado.
    • Apoyar a desarrolladores y usuarios finales.
    • Beneficiar a la humanidad.
    • Representar bien a OpenAI.
  2. Reglas: lineamientos que ayudan a resolver complejidades y a garantizar seguridad y legalidad.
    • Respetar la jerarquía de instrucciones.
    • Cumplir las leyes aplicables.
    • No proporcionar riesgos informativos.
    • Respetar a los creadores y los derechos.
    • Proteger la privacidad.
    • No responder con contenido NSFW.
  3. Comportamientos predeterminados: lineamientos alineados con los objetivos y las reglas, que ofrecen formas de manejar conflictos y muestran cómo priorizar y equilibrar los objetivos.
    • Asumir buena fe por parte del usuario/desarrollador.
    • Hacer preguntas aclaratorias cuando sea necesario.
    • Ayudar lo más posible sin excederse.
    • Atender las distintas necesidades del chat conversacional y del uso para programación.
    • Asumir un punto de vista objetivo.
    • Fomentar la equidad y la amabilidad, y desalentar el odio.
    • No intentar cambiar la manera de pensar de otras personas.
    • Expresar incertidumbre.
    • Usar herramientas adecuadas para la tarea.
    • Ser exhaustivo y eficiente respetando los límites de longitud.

Cómo se usará el Model Spec

  • OpenAI planea usar el Model Spec, como extensión de su trabajo en collective alignment y seguridad de modelos, como guía para investigadores y entrenadores de IA que realizan aprendizaje por refuerzo a partir de retroalimentación humana.
  • También planea explorar hasta qué punto los modelos pueden aprender directamente del Model Spec.

Próximos pasos

  • OpenAI considera este trabajo como parte de una conversación pública continua sobre cómo deberían comportarse los modelos, cómo decidir cuál es el comportamiento deseable y cuál es la mejor manera de involucrar al público general en estas discusiones.
  • A medida que continúe la conversación, buscarán oportunidades para colaborar con actores representativos a nivel global, incluidos responsables de políticas públicas, instituciones de confianza y expertos de dominio.
  • Con ello buscan identificar lo siguiente:
    1. Cómo entienden los actores interesados el enfoque del Model Spec y sus objetivos, reglas y valores predeterminados individuales.
    2. Si los actores interesados apoyan el enfoque y los objetivos, reglas y valores predeterminados individuales.
    3. Si hay objetivos, reglas o valores predeterminados adicionales que deberían considerarse.
  • OpenAI espera escuchar la opinión de los actores interesados a medida que este trabajo avance.
  • Además, durante las próximas 2 semanas, anima al público general a compartir comentarios sobre los objetivos, reglas y valores predeterminados del Model Spec.
  • Espera que esto permita obtener ideas tempranas para desarrollar un proceso sólido de recopilación e integración de comentarios que ayude a avanzar de manera responsable hacia su misión.
  • Durante el próximo año, OpenAI compartirá actualizaciones sobre cambios en el Model Spec, respuestas a los comentarios y avances de investigación sobre cómo dar forma al comportamiento del modelo.

Aún no hay comentarios.

Aún no hay comentarios.