gpt-4o
claude-3-5-sonnet
gpt-3.5-turbo
llama-3-8b
from athina.evals import LlmEvaluator LlmEvaluator(model="gpt-4", grading_criteria=grading_criteria).run(response)