半文鱼桌面是一款个性化浏览器起始页插件,旨在为用户提供一个美观、高效且功能丰富的浏览器新标签页。它集成了多种实用工具和办公神器,支持高度自定义,能够满足用户在工作和生活中的多样化需求。
实验结果显示,TIGER在EchoSet数据集上的表现优于其他模型,尤其是在EchoSet-500数据集上,性能提升了约5%。此外,TIGER在电影音频分离任务中也展现了强大的泛化能力,进一步证明了其在复杂声学环境中的适用性。
Long-VITA是由腾讯优图实验室、南京大学和厦门大学一起提出的一种大型多模态模型,能够在长上下文视觉语言理解任务中提供卓越的性能和广泛的应用潜力。
WiseDiag作为一款医疗大模型,通过其强大的记忆系统、专家AI分身矩阵和复杂医学报告解读能力,为医疗行业带来了革命性的变化。它不仅提升了医疗诊断的效率和准确性,还为患者提供了更加个性化和精准的医疗服务。
阿里云飞天实验室的GENERator是一个功能强大且灵活的生成器模型,依托于阿里云飞天平台的强大计算能力和丰富的资源支持,能够生成高质量的新数据,并广泛应用于多种场景。
AnyCharV是一个高效、灵活且易于使用的视频生成框架,特别适合需要快速进行视频编辑的用户。其无需训练的特点和对现有工具的支持使其成为视频编辑领域的有力工具。
Trae 是字节跳动于 2025 年 1 月 19 日正式发布的面向专业开发者的 AI 编程工具。能根据用户需求快速生成高质量的代码片段,在调试时可准确地定位代码中的错误并提供解决方案。
一键转换为Word、LaTeX、HTML、Markdown等格式,支持多语言PDF翻译与双语对照。轻松实现文档结构化,立即体验高效智能的文档处理工作流!
华为小艺助手App在HarmonyOS NEXT系统中正式接入了DeepSeek-R1模型的Beta版。这一更新标志着华为在智能问询领域的进一步提升,特别是在编程、数学及逻辑推理等复杂问题中的应用能力。
BAG(Body-Aligned 3D Wearable Asset Generation)是一种由腾讯和香港中文大学联合提出的可穿戴3D资产生成方法,旨在自动生成与人体对齐的3D可穿戴资产,如服装和配饰。
DeepSeek官方整理了50+插件及多领域应用场景方案,涵盖日常对话、AI编程、大模型开发、RAG知识库等,具体可参考GitHub仓库。
CineMaster是一款由快手科技联合大连理工大学和香港中文大学共同推出的具备3D感知能力的文本到视频生成框架,类似于视频版的ControlNet。
GAS(Gaussian Splatting)是一款专注于从单目视频或图像中快速重建和实时渲染高质量的3D人体模型。该技术结合了先进的生成模型和高效的渲染技术,能够在短时间内生成具有逼真外观和细节的3D人体模型。