13 puntos por xguru 2023-04-24 | Aún no hay comentarios. | Compartir por WhatsApp
  • Almacena en caché las respuestas del LLM para reducir los costos de LLM de la organización y acelerar la velocidad de respuesta
  • Mejora la tasa de aciertos de caché mediante una estrategia de caché semántica que encuentra consultas similares o relacionadas
    • Convierte las consultas en embeddings mediante algoritmos de embedding y realiza búsquedas relacionadas sobre esos embeddings a través de un vector store
  • Adaptador de LLM: compatible con OpenAI ChatGPT y LangChain (también se planea soporte para Bard/Anthropic/LLaMA, etc.)
  • Adaptador multimodal: OpenAI Image Create, OpenAI Audio Transribe, HuggingFace Stable Diffusion
  • Generador de embeddings: OpenAI, ONNX, HuggingFace, Cohere, fastText, SentenceTransformers
  • Almacenamiento de caché: SQLite, PostgreSQL, MySQL, SQLServer,..
  • Vector Store: Mulvus, Zilliz Cloud, FAISS, Hnswlib
  • Administrador de caché: LRU, FIFO

Aún no hay comentarios.

Aún no hay comentarios.