Running on CPU Upgrade 14k Open LLM Leaderboard 🏆 14k Track, rank and evaluate open LLMs and chatbots
Paused Agents 28 MT Bench PL 📊 28 Przeglądaj i porównuj odpowiedzi modeli językowych w języku polskim
Running 39 Polish Information Retrieval Benchmark (PIRB) 📈 39 View evaluation results on an interactive leaderboard
Running on CPU Upgrade Agents 77 Open PL LLM Leaderboard 🏆 77 Explore LLM benchmark leaderboard with searchable filters