AGI-Eval:高校联合打造的大模型通用能力评测社区与生态平台

AGI-Eval是由上海交通大学、同济大学、华东师范大学、DataWhale等高校及机构联合打造的大模型通用能力评测社区,以“评测助力,让AI成为人类更好的伙伴”为核心使命,致力于构建公正、可信、科学、全面的大模型评测生态。平台专为评估基础

AI模型评测DataWhale上海交通大学华东师范大学同济大学大模型评测社区
C-Eval官网:多学科多层次中文大语言模型权威评估套件

C-Eval是由上海交通大学、清华大学与爱丁堡大学研究团队于2023年5月联合推出的中文大语言模型专属评估套件,包含13948道标准化多项选择题,覆盖52个学科领域、划分四个难度等级。

AI模型评测上海交通大学基础模型评估清华大学爱丁堡大学