Qwen3-Omni:阿里通义团队推出业界首个原生端到端全模态AI模型

Qwen3-Omni支持119种语言文本交互、19种语音理解语言及10种语音生成语言,轻松覆盖全球主流语种,满足跨地域业务需求。响应速度更实现突破性优化,纯模型端到端音频对话延迟低至211ms,视频对话延迟低至507ms,搭配长达30分钟的长音频理解能力,为实时交互场景提供流畅体验。

Qwen3基础架构端到端大模型阿里通义
Qwen3-TTS-Flash:开源语音合成模型,49种音色+10种语言+9种方言

Qwen3-TTS-Flash在语音自然度上实现跨越式升级。通过智能语速韵律调节技术,合成语音能够精准还原真人表达的情绪起伏与语言节奏——无论是娓娓道来的知识讲解,还是情绪饱满的剧情配音,都能传递出细腻的“人味”,彻底告别机械感。

Qwen3基础架构文本转语音模型阿里通义
Qwen3Guard:通义千问首款安全护栏模型,筑牢AI安全防护模型

Qwen3Guard的项目地址
项目官网:

Qwen3基础架构安全防护模型阿里通义
Qwen3-Max:阿里万亿参数大模型,刷新通用AI能力新高度

最新推出的Qwen3-Max Thinking是阿里的推理版AI模型,基于万亿参数的MoE架构,专门用在复杂问题的推理和思考。Qwen3-Max Thinking在数学竞赛、代码挑战等任务中表现优异,部分成绩超越国际主流模型如Claude Opus 4。

AI大语言模型Qwen3基础架构阿里通义
Qwen3-LiveTranslate:阿里通义多语言实时音视频同传模型

Qwen3-LiveTranslate是阿里通义团队研发的大语言模型驱动型多语言实时音视频同传系统,支持18种主流语言及多地方言的精准翻译,创新性融合视觉增强技术,通过捕捉口型、动作等多模态信息,大幅提升复杂场景下的翻译准确性。

Qwen3基础架构同传大模型阿里通义音视频大模型
Qwen3-VL-Reranker:阿里通义跨模态重排序模型,精准提升检索结果质量

Qwen3-VL-Reranker是阿里通义基于 Qwen3-VL 架构打造的跨模态理解模型,专为多模态信息检索场景设计。模型可接收任意模态组合的查询与文档对(如图文查询匹配图文文档),通过单塔架构与交叉注意力机制深度解析语义关联,输出精准

Qwen3-VLQwen3基础架构阿里通义
Qwen3-VL-Embedding:阿里通义多模态检索模型,专为处理文本、图像、可视化文档和视频等多种模态输入而设计

Qwen3-VL-Embedding是阿里通义推出的多模态信息检索模型,专为文本、图像、可视化文档(图表 / 代码 / UI 组件等)、视频等多模态输入场景设计。

Qwen3-VLQwen3基础架构检索模型阿里通义