返回
基础模型评估
C-Eval官网:多学科多层次中文大语言模型权威评估套件
C-Eval是由上海交通大学、清华大学与爱丁堡大学研究团队于2023年5月联合推出的中文大语言模型专属评估套件,包含13948道标准化多项选择题,覆盖52个学科领域、划分四个难度等级。
AI模型评测
上海交通大学
基础模型评估
清华大学
爱丁堡大学