MMBench:一款由高校等联合研发多模态基准测试工具

MMBench是一款多模态基准测试工具,由上海人工智能实验室、南洋理工大学、香港中文大学、新加坡国立大学及浙江大学联合研发。该基准构建了一套从感知到认知的逐级细分评估流程,覆盖20项细粒度能力维度,数据集包含约3000道单项选择题,均源自互联网及权威基准数据集。

AI模型评测上海人工智能实验室南洋理工大学多模态AI模型大模型评测体系新加坡国立大学浙江大学香港中文大学
Paper2Video:新加坡国立大学一键将学术论文转化为专业演示视频

Paper2Video是新加坡国立大学Show Lab研发的学术论文视频化工具依托创新的PaperTalker多智能体框架,实现从学术论文到完整演示视频的全自动生成。

多智能体框架学术论文新加坡国立大学
SAIL-VL2:抖音 × 新加坡国立大学联合开源的视觉语言模型

SAIL-VL2是抖音团队与新加坡国立大学联合研发的开源视觉语言基础模型,模型由SAIL-ViT视觉编码器、视觉-语言适配器与大语言模型三大核心模块构成,创新性采用渐进式训练框架,从视觉预训练、多模态融合,到最终的SFT-RL混合范式优化,实现性能阶梯式跃升。

AI视觉语言模型抖音AI新加坡国立大学
PhotoDoodle:AI图像编辑新突破,一键将照片转化为艺术作品

PhotoDoodle通过其创新的“位置编码克隆”技术和两阶段训练策略,为图像编辑领域带来了新的突破。它不仅能够高效地学习和复制艺术风格,还能在保持背景一致性的前提下,精准地添加装饰元素,为创意表达开辟了全新的可能性。

AI图像编辑器AI艺术创作字节跳动框架新加坡国立大学
DynamicCity:上海人工实验室联合多家大学共同开发的一种面向4D场景的生成框架

DynamicCity是一款专注于生成具有语义信息的动态 LiDAR 场景,能够处理大规模空间(80×80×6.4 m³)和长序列(最多 128 帧)的数据。该框架通过在潜空间显式建模场景的空间布局与动态变化,并借助扩散模型直接生成高质量的动态场景。

4D框架上海人工智能实验室南洋理工大学卡耐基梅隆大学新加坡国立大学