混元图像3.0图生图模型是腾讯推出的先进图像生成与编辑大模型,基于80B参数混合专家(MoE)架构打造,具备深度理解输入图像与文本编辑指令的能力,可快速生成高质量、真实感强且情绪表现力丰富的图像内容。
HunyuanOCR是腾讯混元团队推出的开源端到端OCR视觉语言模型,其功能覆盖文本检测与识别、复杂文档解析、开放字段信息抽取、视频字幕抽取等经典OCR任务,同时支持端到端拍照翻译与文档问答,为多场景文本处理提供一站式解决方案。
HunyuanVideo 1.5是腾讯混元团队推出的开源轻量级视频生成模型,模型支持文生视频、图生视频双模式生成5-10秒高清内容,具备强大的指令理解能力,可精准复刻写实、动画等多元视觉风格。
混元世界模型1.5(HunyuanWorld-Mirror)是腾讯推出的开源3D世界生成模型,支持多视图图像、视频等多模态输入,可同步输出点云、深度图、相机参数、表面法线、3D高斯点等多样化3D几何预测结果。
PromptEnhancer是腾讯混元团队重磅开源的文本到图像(T2I)提示重写框架,核心聚焦于解决T2I模型对复杂指令理解不足、生成内容与用户意图偏差的行业痛点。
Tencent-HY-MT1.5是腾讯混元开源的翻译模型,包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,支持33种国际语言互译及5种民汉/方言翻译,覆盖多种小语种。