Paused Agents 28 MT Bench PL 📊 28 Przeglądaj i porównuj odpowiedzi modeli językowych w języku polskim
Running 39 Polish Information Retrieval Benchmark (PIRB) 📈 39 View evaluation results on an interactive leaderboard