abhinav-pola

Follow

abhinav-pola

Follow

Achievements

Achievements

Popular repositories Loading

BenchmarkAggregator BenchmarkAggregator Public

Forked from mrconter1/BenchmarkAggregator

Comprehensive LLM evaluation framework: GPQA Diamond to Chatbot Arena. Tests all major models equally, easily extensible.

Python