XieLipeng0830

XieLipeng0830

Achievements

OpenJudge OpenJudge Public

Forked from agentscope-ai/OpenJudge

OpenJudge: A Unified Framework for Holistic Evaluation and Quality Rewards

Python
mt-bench-101 mt-bench-101 Public

Forked from mtbench101/mt-bench-101

[ACL 2024] MT-Bench-101: A Fine-Grained Benchmark for Evaluating Large Language Models in Multi-Turn Dialogues