- Modelo de embeddings de texto
jina-embeddings-v2 compatible con una longitud de 8192 tokens
- Compite con
text-embedding-ada-002 de OpenAI y muestra mejor rendimiento en benchmarks de clasificación, reordenamiento, búsqueda y resumen
- Fue reconstruido desde cero y, con un contexto de 8k, puede usarse en diversos campos: análisis de documentos legales, investigación médica, análisis literario, predicción financiera y AI conversacional
- Se pueden descargar 2 modelos en HuggingFace
- Base Model (0.27G): diseñado para tareas exigentes que requieren alta precisión, como investigación académica o análisis de negocios
- Small Model (0.07G): creado para aplicaciones ligeras, como apps móviles o dispositivos con recursos de cómputo limitados
1 comentarios
Opiniones de Hacker News
text-embedding-ada-002(768 frente a 1536), lo que puede ahorrar espacio en la base de datos y acelerar las consultas.llm-embed-jinafue lanzado para la herramienta LLM, lo que permite acceder al nuevo modelo de Jina.