Qwen3-TTS:阿里通义Qwen开源的系列语音生成模型

Qwen3-TTS是Qwen开源的系列语音生成模型,该模型基于自研的Qwen3-TTS-Tokenizer-12Hz多码本语音编码器,搭配Dual-Track双轨建模技术,实现高效语音压缩与极速生成;支持10种主流语言及多种方言,具备智能文本语义理解能力,可自适应调控语音的语气、节奏与情感。

AI音色定制GitHub仓库语音生成模型阿里通义
Lobe官网:微软开发的免费机器学习工具(附GitHub仓库地址)

Lobe是由微软开发的免费机器学习工具,旨在让任何人都能轻松训练机器学习模型,无需编程经验。该工具专注于简化机器学习流程,让非技术用户也能创建强大的AI模型。

AI训练模型GitHub仓库微软开源模型机器学习模型
AutoGPT官网:一款GPT-4的实验性开源智能代理框架

AutoGPT是一款实验性开源应用程序,凭借对GPT-4语言模型能力的深度挖掘,在GitHub斩获超10万星标。该程序以GPT-4为核心驱动,通过串联大语言模型的思维链,赋予AI Agent自主完成任意预设目标的能力,助力用户快速创建、部署和管理可自动化执行复杂工作流的智能代理。

AI训练模型GitHub仓库GPT-4免费开源项目智能代理框架
Being-H0.5:卢宗青团队研发的跨形态硬件适配通用机器人模型

Being-H0.5是卢宗青团队研发的通用机器人模型,该模型构建大规模跨形态操控数据集UniHand-2.0,设计统一动作空间,让模型习得通用操控语义,实现多类机器人的策略共享。

GitHub仓库卢宗青团队机器人模型
json-render官网:Vercel开源的AI生成UI可控化解决方案

json-render是Vercel推出的开源工具,其核心机制涵盖Catalog定义、流式渲染、反向生成源码三大能力,支持实时反馈与高效开发流程,推动前端开发模式从编写页面代码,转向构建组件库与规则体系,是AI与前端开发融合的突破性创新。

AI生成JSONAI生成UIGitHub仓库Vercel开源
QwenLong-L1.5:阿里通义实验室推出的长文本推理大语言模型

QwenLong-L1.5是阿里通义实验室推出的长文本推理专用大语言模型,基于Qwen3-30B-A3B架构打造。通过系统化后训练方案,结合高质量数据合成管线、稳定强化学习方法与突破物理窗口限制的记忆管理框架。

GitHub仓库长文本推理模型阿里通义
Prompt Manager:一款专为提升AI工作流效率打造的提示词管理工具

Prompt Manager是一款专为提升AI工作流效率打造的提示词全生命周期管理工具,支持个人提示词的创建、编辑、分类与版本管理,通过智能分类与全局搜索功能实现提示词的快速检索。

AI提示词GitHub仓库提示词管理
InfinityStar:字节跳动推出的高效开源视频生成模型

InfinityStar是字节跳动推出的高效视频生成模型,该模型支持文本到图像、文本到视频、图像到视频及长时间交互视频合成等多类任务,且所有代码与模型均已开源。

GitHub仓库字节跳动框架视频生成模型
Youtu-Embedding:腾讯优图开源企业级通用文本表示模型

Youtu-Embedding是腾讯优图实验室重磅推出的开源企业级通用文本表示模型,依托大规模语料预训练与创新协同-判别式微调框架,构建起强大的语义理解能力,可一站式胜任文本检索、意图理解、相似度判断等六大核心任务。

GitHub仓库企业级AI腾讯优图腾讯开源
DiaMoE-TTS:清华 × 巨人网络联合开源的多方言TTS框架

DiaMoE-TTS是清华大学与巨人网络联合研发的多方言语音合成框架,框架创新性采用国际音标统一输入体系,融合方言感知的混合专家(MoE)架构与低资源适配策略,实现低成本、低门槛的多方言语音合成。

GitHub仓库多方言TTS框架巨人网络清华大学
Qwen3-VL Cookbooks:阿里出品的Qwen3-VL多模态模型实战指南集

Qwen3-VL Cookbooks是阿里巴巴为Qwen3-VL多模态大模型量身打造的官方实战指南集合,指南覆盖物体识别、文档解析、视频理解、3D定位等十余类核心能力,每一份Cookbook均配套详细代码示例、分步操作教程与场景化最佳实践。

GitHub仓库Qwen3-VL阿里云AI
MineContext:字节跳动开源主动式上下文感知的AI工具

MineContext是字节跳动推出的开源主动式上下文感知AI工具,创新性提出“数字生活方块挖掘”理念,帮助用户高效管理分散的知识与信息资产。

AI工具GitHub仓库上下文处理字节开源
Get Jobs:开源简历投递自动化工具,多平台高效求职利器

Get Jobs是一款开源自动化简历投递工具,专为求职者打造高效求职解决方案。工具支持Boss直聘、猎聘、拉勾、51job、智联招聘等主流招聘平台。

AI简历GitHub仓库
VoxCPM:0.5B轻量语音生成模型,重塑高保真实时语音合成体验

VoxCPM支持零样本声音克隆,仅需一段参考音频,即可精准复刻说话者的音色、口音、情感语调等细微特征,生成高度逼真的个性化语音。其推理效率同样表现卓越,在NVIDIA RTX 4090 GPU上实时因子(RTF)低至0.17,完美满足实时交互场景需求。

GitHub仓库清华大学语音生成模型面壁智能
LucaVirus:阿里云重磅发布 核酸-蛋白质统一语言模型

LucaVirus是阿里云LucaGroup潜心研发的全球首款专为病毒领域打造的核酸-蛋白质统一语言模型,依托254亿个核苷酸与氨基酸标记的海量数据完成训练,数据覆盖几乎所有已知病毒种类。

AI医学助手GitHub仓库病毒基础大模型阿里开源