DeepEval - pruebas unitarias para LLM

xguru · 2023-08-19T10:03:01+09:00

La filosofía básica es "Pytest for LLM" Para pasar a producción, ofrece una forma al estilo Python de ejecutar evaluaciones offline sobre pipelines de LLM Permite escribir pruebas para aplicaciones de LLM (como RAG) igual que si estuvieras escribiendo pruebas unitarias en Python A través de assert_llm_output, evalúa respuestas con métricas como entailment / exact / bertscore También permite configurar métricas personalizadas y modificar las métricas existentes

(github.com/mr-gpt)

4 puntos por xguru 2023-08-19 | Aún no hay comentarios. | Compartir por WhatsApp

La filosofía básica es "Pytest for LLM"
Para pasar a producción, ofrece una forma al estilo Python de ejecutar evaluaciones offline sobre pipelines de LLM
Permite escribir pruebas para aplicaciones de LLM (como RAG) igual que si estuvieras escribiendo pruebas unitarias en Python
A través de assert_llm_output, evalúa respuestas con métricas como entailment / exact / bertscore
También permite configurar métricas personalizadas y modificar las métricas existentes

DeepEval - pruebas unitarias para LLM

Lecturas relacionadas

Aún no hay comentarios.