Compatibilidad con OpenAI
- Ollama ahora es compatible con la API de chat completions de OpenAI, lo que permite usar Ollama localmente con más herramientas y aplicaciones.
- La configuración comienza descargando Ollama e importando modelos como Llama 2 o Mistral.
Uso
cURL
- Usa el formato de OpenAI para llamar al endpoint de API compatible de Ollama y cambia el nombre del host a
http://localhost:11434.
Biblioteca de Python de OpenAI
- Se puede acceder al endpoint de API de Ollama usando la biblioteca de Python de OpenAI, incluyendo una API key que es requerida pero no se usa.
Biblioteca de JavaScript de OpenAI
- Se puede acceder al endpoint de API de Ollama usando la biblioteca de JavaScript de OpenAI, incluyendo una API key que es requerida pero no se usa.
Ejemplos
Vercel AI SDK
- Vercel AI SDK es una biblioteca de código abierto que ayuda a construir aplicaciones interactivas con streaming.
- Se usa
create-next-app para clonar el repositorio de ejemplo.
Autogen
- Autogen es un popular framework de código abierto creado por Microsoft para construir aplicaciones multiagente.
- En este ejemplo se usa el modelo Code Llama, y se instala Autogen y se crea un script de Python para usar Ollama.
Viene más
- Este es un soporte inicial y experimental para la API de OpenAI.
- Entre las mejoras futuras que se están considerando están la API de embeddings, function calling, soporte de visión y logprobs.
- Para más información, consulta la documentación de compatibilidad con OpenAI.
Opinión de GN⁺
- Compatibilidad con la API de OpenAI: Al volverse compatible con la API de OpenAI, Ollama permite a los desarrolladores integrar y aprovechar modelos de IA más fácilmente en entornos locales. Este es un cambio importante que mejora la accesibilidad del desarrollo de aplicaciones basadas en IA.
- Soporte para varios lenguajes de programación: El soporte a través de las bibliotecas de Python y JavaScript muestra su utilidad en distintos entornos de desarrollo. Esto significa que los desarrolladores pueden integrar funciones de IA fácilmente en el lenguaje que prefieran.
- Integración con frameworks de código abierto: Los ejemplos de integración con frameworks de código abierto como Vercel AI SDK y Autogen muestran el alcance potencial de Ollama y su capacidad para impulsar innovación basada en la comunidad.
1 comentarios
Opinión de Hacker News
En los últimos meses, la facilidad de uso de los LLM alojados localmente ha mejorado de forma sorprendente.
llamafilede Mozilla-Ocho.Hay personas que personalmente están inconformes con que la compatibilidad con la API de OpenAI se esté convirtiendo en el estándar de la comunidad.
Se está desarrollando una versión mejorada de Copilot que permite que los usuarios lleven su propio LLM.
Ollama funciona mejor que otras herramientas y simplemente funciona.
El script de instalación de Ollama en Linux funciona con el estilo estándar actual.
sudo.La compatibilidad con OpenAI es un poco engañosa.
La capa de compatibilidad también puede construirse en bibliotecas.
llm()que funciona con varios backends de LLM.Se está trabajando en un proyecto para cambiar fácilmente entre open source (por ejemplo, HF, VLLM) y modelos comerciales (OpenAI, Google, Anthropic, Together).
Se plantea la duda de cuál es el caso de uso de Ollama y por qué no usar directamente llama.cpp.
Se pregunta si Ollama simplemente invoca directamente llama.cpp como un servidor HTTP dockerizado, y qué diferencias hay aparte de la API de OpenAI agregada recientemente.