Lanzamiento de Claude 3.5 Sonnet: rendimiento superior a GPT4o

(anthropic.com)

15 puntos por brainer 2024-06-21 | 1 comentarios | Compartir por WhatsApp

Anthropic lanzó hoy Claude 3.5 Sonnet. Es la primera versión de la próxima familia de modelos Claude 3.5 y presume un rendimiento superior al de Claude 3 Opus y los modelos de la competencia. Claude 3.5 Sonnet se ofrece con la misma velocidad y costo que Claude 3 Sonnet, el modelo de gama media.

Forma de disponibilidad

Claude 3.5 Sonnet puede usarse gratis en Claude.ai y en la app de Claude para iOS, y los suscriptores de los planes Claude Pro y Team pueden acceder con límites de solicitudes más altos. También puede usarse a través de la API de Anthropic, Amazon Bedrock y Vertex AI de Google Cloud. El costo es de $3 por millón de tokens de entrada y $15 por millón de tokens de salida, y ofrece una ventana de contexto de 200K tokens.

Mejoras de rendimiento

Claude 3.5 Sonnet estableció un nuevo estándar en razonamiento de nivel posgrado (GPQA), conocimiento de nivel licenciatura (MMLU) y capacidad de programación (HumanEval). También mejoró mucho su capacidad para entender el humor y las instrucciones complejas, y puede redactar contenido de alta calidad con un tono natural y empático.

Resultados de evaluaciones internas

En una evaluación interna de programación, Claude 3.5 Sonnet resolvió el 64% de los problemas, superando el 38% de Claude 3 Opus. Esta evaluación puso a prueba la capacidad de corregir errores o agregar funciones en bases de código de código abierto a partir de descripciones en lenguaje natural. Claude 3.5 Sonnet maneja con facilidad la traducción de código, por lo que es especialmente eficaz para actualizar aplicaciones heredadas y migrar bases de código.

Capacidades visuales

Claude 3.5 Sonnet supera a Claude 3 Opus en los benchmarks visuales estándar y muestra un rendimiento sobresaliente en tareas que requieren razonamiento visual. Su capacidad para transcribir con precisión texto de imágenes incompletas es muy útil en los sectores de retail, logística y servicios financieros.

Introducción de la función Artifacts

Artifacts, incorporado hoy en Claude.ai, ofrece un espacio de trabajo dinámico donde los usuarios pueden editar en tiempo real contenido generado como fragmentos de código, documentos de texto y diseños de sitios web, e integrarlo en proyectos y flujos de trabajo.

Seguridad y privacidad

Claude 3.5 Sonnet pasó por pruebas rigurosas en el nivel ASL-2 y completó evaluaciones de seguridad previas al despliegue en colaboración con el UK AISI. Los datos de los usuarios no se usan para entrenamiento sin permiso explícito.

Planes a futuro

Para completar la familia de modelos Claude 3.5, planean lanzar Claude 3.5 Haiku y Claude 3.5 Opus más adelante este año. También están desarrollando nuevas funciones y modalidades para apoyar la integración con aplicaciones empresariales, y explorando una función de "Memory" que recuerde las preferencias del usuario y el historial de interacción.

Siempre estamos trabajando para mejorar Claude y reflejar los comentarios de los usuarios para ofrecer una mejor experiencia. Puedes enviar comentarios sobre Claude 3.5 Sonnet directamente dentro del producto para que se reflejen en la hoja de ruta de desarrollo.

1 comentarios

wedding 2024-06-21

Lo probé y la velocidad es increíblemente rápida.
También está bueno que, como gpt4o, se pueda usar gratis una cierta cantidad de veces.