Fun-CosyVoice3.5是阿里通义实验室语音团队全新推出的新一代语音生成模型,模型首创FreeStyle口语化指令控制,无需专业参数,只需用自然语言描述即可精准调节语气、语速、语调、情绪;同时支持13种语言,发音准确率与生成延迟全面优化,是面向实时交互、内容创作、多语言出海的工业化级语音方案。
FireRed-OCR是小红书团队开源的轻量级文档结构解析视觉语言模型,基于Qwen3-VL-2B-Instruct架构,采用三阶段渐进式训练。FireRed-OCR专为解决文档结构幻觉设计,可精准提取表格、公式、标题层级,并输出标准Markdown,兼顾高精度与轻量化部署。
Fun-AudioGen-VD是阿里通义实验室语音团队自研的新一代语音生成大模型,专注于专业声音设计与场景化音频生成。模型支持自然语言FreeStyle自由指令生成,可一次性输出包含指定音色、情感、环境、空间、设备质感的完整音频。
音述AI平台独创GETI风格定义法则,支持AI智能润色、作品交流、二次创作与价值变现,并针对中文语言习惯与文化深度优化,原生支持国风、C-pop等本土音乐风格,让技术真正服务于人文表达。
Renamer AI是一款基于AI + OCR技术的自动化文件重命名工具,可智能读取文档、图片等文件内容,自动生成语义化、可搜索、高可读性的规范文件名,彻底告别手动整理。
PoseCut内置30+专业级AI工具,覆盖像素级文生图、电影级视频生成、智能抠图、换装、风格迁移等全场景能力,所有输出均按专业影视、广告、设计标准制作,确保高质量视觉效果。
Guideless是一款专注于操作流程视频指南生成的智能工具,工具操作简便、AI全流程赋能,定位为企业及团队提供高效的产品演示、用户引导解决方案,助力提升客户体验与支持效率,推测提供免费试用与付费套餐双重模式。
AdsTurbo是由Sora 2提供技术支持的AI视频广告生成工具,专为电商、增长团队与绩效营销人员打造,解决传统广告制作繁琐、低效、成本高的痛点,实现极速产出、高点击率、高ROAS的视频广告。
QuiverAI是一款专业AI设计工具,专为设计师打造,用于生成、编辑、动画化可编辑SVG矢量资源。它以更高效率、更强创意表达、更精细的控制能力,赋能品牌、产品、营销全流程设计工作流,让设计师与开发者都能快速产出高质量、可商用的矢量图形。
Wallnora是一款AI驱动的个性化墙画创作工具,以简单、高效、高质感的方式,让用户快速把创意变成可打印、可预览的专业级墙面装饰画。平台支持多种艺术风格、实景预览与商用授权,满足家庭装饰、艺术创作、电商卖货等多种需求。
DreamID-Omni是由清华大学与字节跳动联合研发的统一、可控、以人为中心的音视频生成框架。它打破传统AI视频工具任务割裂的局限,在单一模型内同时实现参考生成、视频编辑、音频驱动动画三大核心能力,多项指标超越主流商业闭源模型,实现了端到端统一架构的重大突破。
LocoOperator-4B是LocoreMind开源的4B参数代码探索专用智能体,基于Qwen3-4B-Instruct经知识蒸馏自Qwen3-Coder-Next训练而成。定位为Claude Code等编程助手的本地化子智能体,专注处理代码库搜索、文件读取、目录遍历等探索类任务,实现零API成本运行。
CodeArts Doer是华为推出的一站式AI智能研发平台,覆盖软件开发全生命周期,通过6大智能Agent实现需求、开发、测试、部署全流程自动化协作,大幅压缩研发周期、降低沟通成本与返工风险。平台深度融合华为多年工程化研发经验与海量研发数据,为开发者与团队提供“更快、更准、更稳”的智能化研发提效方案。