FunAudio-ASR:阿里达摩院出品,企业级语音识别痛点的端到端大模型

FunAudio-ASR是阿里巴巴达摩院研发的端到端语音识别大模型,聚焦企业落地场景中的核心痛点,通过创新的Context增强模块,从根源上优化了语音识别领域的“幻觉”“串语种”等行业难题。

端到端大模型语音识别模型阿里达摩院
DDColor:达摩院双解码器图像上色算法,让黑白画面自然焕彩

阿里巴巴达摩院团队研发的DDColor,作为魔搭大模型生态下的新一代图像上色算法,凭借创新的双解码器技术,实现了图像上色领域的变革性突破。无论是历史黑白照片、动漫场景还是游戏风景,都能输出色彩自然、细节逼真的彩色图像,尤其在多物体、复杂上下文场景中表现突出。

AI配色工具阿里达摩院魔搭模型
魔搭社区ModelScope:阿里达摩院推出的一个AI模型开源社区

魔搭社区(ModelScope)是由阿里达摩院推出的一个AI模型开源社区,提供了丰富的模型资源,包括自然语言处理、视觉、语音、多模态等多个方向的预训练模型,并且这些模型都是全面开源且开放的。

AI模型开源社区阿里达摩院魔搭社区
阿里翻译:达摩院赋能的多模态AI翻译解决方案

阿里翻译已通过市场验证,为全球用户提供稳定可靠的翻译服务,成为促进跨文化交流的重要桥梁。若需了解更多详情或体验服务,可访问官方AI翻译网站,根据自身需求选择个性化翻译方案。

AI翻译工具阿里达摩院
通义万相2.2:开源Wan2.2-T2V-A14B、Wan2.2-I2V-A14B和Wan2.2-IT2V-5B三款模型

通义万相2.2是一个功能强大且用户友好的AI视频生成平台,特别适合需要快速生成高质量视频内容的用户。它通过引入混合专家架构、电影级美学、复杂运动生成和高效高清混合TI2V等创新技术,显著提升了视频生成的质量和效率。

AI开源项目AI视频生成模型github项目阿里云AI阿里达摩院
推荐一款由阿里达摩院开发的AI开源模型平台——ModelScope魔塔社区

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

AI开源模型ModelScope阿里达摩院魔塔社区