OpenNN适合对计算效率有较高要求的工业、科研和商业项目。其在商业智能、医疗健康、工程优化等多个场景中已得到实际验证,是一个值得关注的开源深度学习平台。
灵光是蚂蚁集团2025年11月18日正式发布的全模态通用AI助手,被内部定为AGI战略级C端产品,承接“AIFirst”转型目标,主打“让复杂变简单”。
Loopy是由字节跳动和浙江大学的研究团队共同开发的端到端音频驱动的肖像视频生成模型。它通过音频信号生成动态的肖像视频,能够实现音频与视觉内容的同步。
OmniHuman是字节跳动推出的端到端多模态数字人视频生成框架,上传1张静态照片+音频即可实时合成高自然度说话唱歌视频,支持全身、半身、卡通任意比例输入,口型误差<0.1秒,可一键下载,面向虚拟主播、短视频、影视动画、在线教育、游戏NPC等场景开放体验。
DL4J通过完整的JVM‑native深度学习栈、强大的分布式训练能力以及对主流大数据平台的深度集成,为企业级AI项目提供了高性能、可扩展且易于部署的解决方案。
ChatGPT-Next-Web是一款开源的跨平台AI聊天应用,支持多种先进的语言模型(如GPT-3、GPT-4和Gemini Pro),并允许用户通过简单的配置快速搭建属于自己的AI助手。
VideoCaptioner(卡卡字幕助手)是一款基于大语言模型(LLM)的智能视频字幕处理工具,它支持语音识别、字幕断句、优化、翻译及视频合成的全流程处理,无需高性能 GPU 即可运行,操作简单高效。
最新的KaLM-Embedding-Gemma3-12B-2511是系列的一个重要版本,基于更大的参数规模(12B 参数),进一步优化了模型性能,适用于需要更高精度的复杂任务。
MoMask一款由阿尔伯塔大学研究团队开发的创新性3D人体动作生成工具,根据文本描述生成逼真的3D人体动作,无需昂贵的动作捕捉设备或专业动画师。
ZOER.AI平台内置托管数据库、用户认证、支付集成及第三方API集成功能,无需复杂配置,大幅降低应用开发门槛,覆盖前端开发者、产品经理、设计师及非技术背景创业者等人群
豆包能够回答各种问题并进行自然语言处理,支持网页、客户端、APP和插件等多种形式的交互。此外,豆包还提供语音交互功能,用户可以通过语音与豆包进行对话,并选择不同的音色。
AI课代表是一款专门为B站打造的AI助手。视频总结,字幕搜索,和内容提问功能,让学习变得轻松又高效。这款插件适用于需要高效学习和整理B站视频内容的用户。
Ollama桌面版是Ollama推出的本地模型AI对话工具,访问Ollama官网 https://ollama.com/download/ ,根据系统类型(如 Windows)下载对应的安装包。
PicDoc是一款能够将文本内容快速转换为流程图、思维导图、信息图、组织架构图、时间轴等。视觉元素图像,帮助用户将复杂的信息以直观易懂的视觉形式呈现。