Doubao-1.5-pro:一款由豆包团队开发的高性能稀疏 MoE大语言模型

Doubao-1.5-pro模型使用 MoE 架构,并通过训练-推理一体化设计,探索模型性能和推理性能之间的极致平衡。Doubao-1.5-pro 仅用较小激活参数,即可超过一流超大稠密预训练模型的性能,并在多个评测基准上取得优异成绩。

AI大语言模型字节跳动框架豆包AI
人大高瓴AI联合蚂蚁推出LLaDA,打破大语言模型“逆诅咒”

LLaDA是由中国人民大学高瓴人工智能研究院与蚂蚁集团联合推出的一种新型扩散语言模型。该模型通过正向掩码和反向预测机制,突破了传统自回归语言模型的限制,显著提升了语言生成和理解能力。

AI大语言模型人民大学蚂蚁集团
Qihoo-T2X:一款由360CVGroup开发的高效扩散变换器模型

一款由360 AI 研究院和中山大学联合开发的高效扩散变换器模型,旨在实现从文本到任意任务的高效转换。该模型采用了创新的代理令牌技术,通过稀疏的代表token注意力机制来优化视觉信息的处理,从而提高计算效率和生成效果。

360AIAI大语言模型
好伴AI

一款基于全科医学通用大语言模型,能24小时在线解答健康问题,提供类似三甲医院专家的建议。 用户可以通过拍照上传化验单或体检报告,好伴AI会快速解读指标,分析潜在健康问题,结合用户历史数据提供个性化建议。

AI医疗AI大语言模型
Long-VITA:是由腾讯优图等实验室提出的一种大型多模态模型

Long-VITA是由腾讯优图实验室、南京大学和厦门大学一起提出的一种大型多模态模型,能够在长上下文视觉语言理解任务中提供卓越的性能和广泛的应用潜力。

AI大语言模型南京大学厦门大学腾讯优图
通古大模型:一款具备强大的古籍理解和处理能力的古籍大语言模型

通古大模型是由华南理工大学深度学习与视觉计算实验室(SCUT-DLVCLab)开发的一款专注于古籍理解和处理的大语言模型。

AI大语言模型华南理工大学
Matrix-Zero – 推出的世界模型

Matrix-Zero是昆仑万维公司推出的一款创新性人工智能世界模型,旨在探索3D场景生成与可交互视频生成的前沿技术。

3D模型AI大语言模型昆仑万维
DeepSeek

一款由DeepSeek AI公司开发的多功能人工智能工具,其功能特点和应用场景涵盖了多个领域,包括自然语言处理、深度学习、数据分析、图像识别、代码生成等。

AI人工智能AI大语言模型