FlagEval:智源研究院打造的大模型全维度科学评测体系与开放平台

平台多维度拆解大模型认知能力,覆盖对话、问答、情感分析等多元应用场景;配套超22个专业数据集、8万道评测题目,同时支持文本、图像、视频等多模态模型评测,兼容PyTorch、MindSpore等多AI框架及NVIDIA、昇腾等多硬件架构。

AI模型评测FlagEval大模型评测平台智源研究院