- Creé una app de exploración profesional impulsada por IA y, a medida que creció de forma explosiva, el costo de GPT-4 empezó a superar los $100 por día
- El método que usé para reducir los costos de IA hasta en un 99% manteniendo la calidad y reduciendo la latencia
- Generar resultados con el modelo más potente (GPT-4) y luego usar esos resultados para hacer fine-tuning de un modelo más pequeño
- Guardar las solicitudes/respuestas de IA de forma que se puedan exportar fácilmente. Usé Helicone AI. Con solo reemplazar la API de OpenAI, las solicitudes de IA se guardan en una tabla
- Una vez que se hayan almacenado entre unas 100 y 500 parejas de solicitud/respuesta, exportarlas y depurar los datos para dejarlos con buena calidad
- Usar ese dataset para hacer fine-tuning de Mixtral 8x7B con un servicio de hosting como Together/Anyscale
- Reemplazar GPT-4 por el modelo recién ajustado
4 comentarios
Entonces, ¿eso significa que violaron tanto los términos de GPT-4 como la licencia de Mixtral...? @_@
Eso parece. Como esto no se hace tan evidente, da la impresión de que a muchos les pasa lo mismo.
Había cosas que se venían usando medio de boca en boca o que se publicaban para investigación,
pero que salgan a promocionarlo así de frente, diciendo: ¡nosotros lo usamos!, sí se siente un poco... curioso.
¿No les dirán nada por eso...?
Opiniones de Hacker News