最新推出的Qwen3-Max Thinking是阿里的推理版AI模型,基于万亿参数的MoE架构,专门用在复杂问题的推理和思考。Qwen3-Max Thinking在数学竞赛、代码挑战等任务中表现优异,部分成绩超越国际主流模型如Claude Opus 4。
Grok是由埃隆·马斯克旗下人工智能初创公司xAI推出的对话机器人,以“一点智能”与“叛逆气质”为核心标签,区别于传统类GPT大模型,凭借独特的功能特性与人格化风格,打造差异化交互体验。
DLCM(动态大概念模型)是字节跳动 Seed 团队推出的新型大语言模型架构,核心突破在于将模型推理单位从传统的 token(词)层级,升级至concept(概念)层级。
LLaMA是一组基础语言模型集合,参数规模从7亿到650亿不等,涵盖了不同的版本如7B、13B、33B、65B等。这些模型在数万亿个token上进行训练,展示了使用公开数据集也能达到先进水平的能力。
VideoCaptioner(卡卡字幕助手)是一款基于大语言模型(LLM)的智能视频字幕处理工具,它支持语音识别、字幕断句、优化、翻译及视频合成的全流程处理,无需高性能 GPU 即可运行,操作简单高效。
Refly是一个功能强大且用户友好的AI工作流平台,特别适合需要高效完成多步骤任务的用户。它通过提供智能代理、媒体模块、灵活的工作流和开源社区支持,帮助用户提升工作效率和创造力。
蓝耘MCP广场是一个专注于大语言模型(LLM)与外部工具、数据源交互的核心枢纽平台。它基于模型上下文协议(MCP),为开发者提供了一个标准化的交互环境,支持多种工具和服务的集成。
SpatialLM是由群核科技开源的一款专为三维空间理解设计的大型语言模型,生成物理正确的3D场景布局,并输出结构化的场景理解结果。它在具身智能训练、机器人导航、建筑设计、教育研究、智能家居等多个领域展现出强大的应用潜力,为三维空间理解带来了新的突破。
序列猴子是由出门问问开发的超大规模语言模型,具备强大的多模态生成能力,支持文本、图像、语音等多种模态的输入和输出。它能够处理长文本序列,支持多轮对话,提供高质量的语言生成和图像创作功能。
TokenSwift 是一个创新的AI框架,专为加速超长文本生成任务而设计。它通过多Token并行生成、动态KV缓存更新和上下文惩罚策略,显著提升了生成效率,实现90分钟内生成10万Token,相比传统方法提速3倍以上。
LLM4AD 是一个基于大语言模型(LLM)的开源平台,专注于自动驾驶和算法设计的创新。通过模块化设计和统一接口,LLM4AD 提供了灵活的开发框架,支持从优化任务到机器学习、科学发现和工程设计的广泛应用。