混元图像3.0图生图模型:腾讯推出的先进图像生成与编辑大模型

混元图像3.0图生图模型是腾讯推出的先进图像生成与编辑大模型,基于80B参数混合专家(MoE)架构打造,具备深度理解输入图像与文本编辑指令的能力,可快速生成高质量、真实感强且情绪表现力丰富的图像内容。

AI图像生成大模型图像编辑模型混元大模型腾讯框架
HunyuanOCR:腾讯混元推出的开源轻量级端到端OCR视觉语言模型

HunyuanOCR是腾讯混元团队推出的开源端到端OCR视觉语言模型,其功能覆盖文本检测与识别、复杂文档解析、开放字段信息抽取、视频字幕抽取等经典OCR任务,同时支持端到端拍照翻译与文档问答,为多场景文本处理提供一站式解决方案。

OCR视觉语言模型混元大模型端到端大模型腾讯开源
HunyuanVideo 1.5:腾讯混元团队推出的开源轻量级视频生成模型

HunyuanVideo 1.5是腾讯混元团队推出的开源轻量级视频生成模型,模型支持文生视频、图生视频双模式生成5-10秒高清内容,具备强大的指令理解能力,可精准复刻写实、动画等多元视觉风格。

AI图生视频AI文生视频混元大模型腾讯开源视频生成模型轻量级语言模型
混元世界模型 1.5:腾讯开源秒级推理3D世界生成引擎

混元世界模型1.5(HunyuanWorld-Mirror)是腾讯推出的开源3D世界生成模型,支持多视图图像、视频等多模态输入,可同步输出点云、深度图、相机参数、表面法线、3D高斯点等多样化3D几何预测结果。

3D世界生成模型混元大模型腾讯开源
PromptEnhancer:腾讯混元开源提示重写框架,解锁T2I模型精准生成新潜能

PromptEnhancer是腾讯混元团队重磅开源的文本到图像(T2I)提示重写框架,核心聚焦于解决T2I模型对复杂指令理解不足、生成内容与用户意图偏差的行业痛点。

提示词生成器混元大模型腾讯开源
Tencent-HY-MT1.5:腾讯混元开源的翻译模型,支持33种国际语言互译及5种民汉/方言翻译

Tencent-HY-MT1.5是腾讯混元开源的翻译模型,包含两个版本Tencent-HY-MT1.5-1.8B 和 Tencent-HY-MT1.5-7B,支持33种国际语言互译及5种民汉/方言翻译,覆盖多种小语种。

混元大模型翻译大模型腾讯AI
腾讯混元生图官网入口,一款提供AI图像生成工具

腾讯混元生图是一款提供AI图像生成与处理能力功能,可以结合输入的文本或图像智能创作图像内容,具有更精美的绘图品质、更强大的中文理解能力、更多样的风格选择与更广泛的应用场景。

AI写真工具AI图像生成器AI美照AI表情动图混元大模型腾讯AI
腾讯混元3D大模型:一个业界首个美术级3D生成大模型

腾讯混元3D大模型是腾讯自研的3D生成模型,属于其混元大模型体系中的重要组成部分。Hunyuan3D-PolyGen主要解决了3D资产生成中布线质量和复杂物体建模的难题,显著提升了美术师的建模效率,可应用于UGC游戏资产生成。

3D模型混元大模型腾讯AI