OpenJudge:一款面向AI应用全生命周期的开源评测框架

OpenJudge提供从基础性能评测到定制化场景评测的完整解决方案,支持多业务场景覆盖与灵活集成,助力AI应用持续优化升级。

AI自动化工具AI评测框架通义开源阿里云AI
UniVG:百度团队研发的AI视频生成系统,支持文本、图像组合输入

UniVG是百度团队研发的多条件驱动统一AI视频生成系统,核心突破在于支持文本、图像的任意组合输入,可灵活适配不同自由度的视频生成需求,有效解决传统视频生成模型仅能处理单一任务、单一输入的局限性。

AI开源项目百度AI视频生成模型
EchoMimic:蚂蚁集团支付宝研发的高精度肖像动画生成工具

EchoMimic可将静态人像转化为表情丰富、动作流畅的动态视频。相较于SadTalker、MuseTalk等同类型工具,EchoMimic在动画自然度与细节可控性上实现显著突破,适用于虚拟主播、视频编辑、数字人交互等多元场景。

AI开源项目AI肖像动画动画生成工具支付宝AI蚂蚁集团
LivePortrait:快手科技与复旦大学联合开发的开源AI肖像动画技术框架

LivePortrait核心能力是将静态人像照片转化为具备逼真面部表情与动作的动态视频,同时支持通过视频或摄像头驱动的动作迁移,为数字内容创作提供高效、可控的人像动画解决方案。

AI开源项目AI肖像动画图片换视频复旦大学快手开源
DUIX:硅基智能开源的2D真人级AIGC实时渲染数字人交互平台

DUIX是硅基智能开源的2D真人级AIGC实时渲染数字人交互平台,旨在为开发者提供低成本、高灵活性的数字人Agent开发能力。开发者可基于该平台快速接入多模态能力,实现数字人实时交互,并一键部署至多终端,赋能各行业智能化交互场景。

AI开源项目AI数字人智能交互平台硅基智能
Wiseflow:一款开源免费、轻量化敏捷的信息挖掘工具

Wiseflow是一款开源免费、轻量化敏捷的信息挖掘工具,支持从网站、微信公众号、社交平台等多类信息源中,按用户预设关注点精准提炼核心讯息,自动完成标签归类并同步至数据库。

AI信息处理AI开源项目
AutoStudio官网:一款支持多轮对话式交互的图像序列生成工具

AutoStudio是一款支持轮对话式交互的图像序列生成工具,核心能力是在用户持续添加、修改指令的过程中,始终保持生成图像的主题、风格与元素一致性,可直接产出情节连贯、分镜完整的漫画与故事板内容。

AI开源项目图像生成器
ClotheDreamer:由上海大学、腾讯优图实验室等联合研发的3D虚拟试穿技术系统

ClotheDreamer通过自然语言与3D建模的高效衔接,显著降低了3D服装设计的技术门槛,为时装设计师、3D艺术家、虚拟服饰开发者提供了直观、高效的创作工具,在时尚设计、元宇宙服饰、虚拟试穿等领域具备广阔的应用前景。

AI开源项目AI虚拟试穿可穿戴3D服装腾讯优图
MimicMotion:腾讯与上交大联合研发的可控式高质量视频生成框架

MimicMotion是由腾讯与上海交通大学联合研发的可控式高质量视频生成框架,支持生成任意时长、动作精准可控的视频内容,可高效产出细节丰富、逼真度高的人类动作视频,同时实现对动作、姿态、视频风格的精细化调控。

AI开源项目上海交通大学图文转视频腾讯AI
FreeAskInternet:免费、私有化、本地化运行的搜索聚合与AI问答工具

FreeAskInternet工具通过集成SearXNG多引擎搜索器,聚合全网信息后,交由ChatGPT 3.5、Qwen、Kimi、智谱AI(GLM)等模型进行内容整合与回答生成,全流程本地闭环运行,兼顾信息获取效率与数据安全。

AI开源项目AI搜索助手AI问答工具
D4RT:谷歌DeepMind推出的动态4D重建与追踪模型

D4RT是谷歌DeepMind推出的动态4D重建模型,该模型推理速度较现有技术提升18~300倍,可精准还原动态场景并预测物体运动轨迹,为具身智能、自动驾驶、增强现实等领域提供核心技术支撑,是AI从二维视觉识别迈向四维时空洞察的关键突破。

4D追踪模型4D重建Google DeepMind谷歌开源
FlowAct-R1:字节跳动推出的实时交互数字人视频生成框架

FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架,该框架凭借分块扩散强制策略、多模态大语言模型等核心技术,实现1.5秒首帧低延迟与25fps稳定实时响应,可精细调控数字人面部表情和肢体动作。

字节跳动框架数字人视频视频生成框架
Fimo:无需复杂代码开发即可快速打造高性能动态网站的AI构建器

Fimo是一款集成内置CMS的AI驱动型动感多页面网站构建器,核心价值在于为用户提供高效便捷的网站搭建解决方案,无需复杂代码开发即可快速打造高性能动态网站。

AI构建器AI网站建设
InteractPitch官网:一款聚焦商业融资场景的互动式演示文稿工具

InteractPitch是一款聚焦商业融资场景的互动式演示文稿工具,其核心优势在于将静态演示文稿转化为交互式体验,并能实时跟踪投资者参与度、提问内容及意向信号,帮助创业者在路演时更具针对性。

演示文稿工具
Qwen3-TTS:阿里通义Qwen开源的系列语音生成模型

Qwen3-TTS是Qwen开源的系列语音生成模型,该模型基于自研的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器,搭配Dual-Track双轨建模技术,实现高效语音压缩与极速生成;支持10种主流语言及多种方言,具备智能文本语义理解能力,可自适应调控语音的语气、节奏与情感。

AI音色定制GitHub仓库语音生成模型阿里通义