Phi-4-reasoning-vision-15B模型使用入口,微软推出的150亿参数开源多模态推理模型

Phi-4-reasoning-vision-15B模型核心优势集中在GUI界面理解、数学科学推理、文档图表分析三大领域,推理速度较同类大模型快10倍以上,同时在AI2D、ChartQA、MathVista等权威基准测试中表现亮眼,展现出“小参数量、高性能、低延迟”的核心竞争力。

多模态推理AI微软开源模型
Seedance 3.0 AI视频生成器,无需专业技能即可实现高质量创作

Seedance 3.0 AI是一款免费AI视频生成器,核心定位是帮助用户轻松创建4K电影级视频,无需专业技能即可实现高质量创作。它搭载多镜头叙事、原生音频同步、角色一致性等实用功能,广泛适配内容创作者、电影制作人、营销团队等群体,完美匹配各类视频创作需求。

4k视频AI视频生成Seedance
Kling 4.0视频模型使用入口,Kling AI Models推出的下一代AI视频模型

Kling 4.0是由Kling AI Models推出的下一代AI视频模型,凭借先进的AI技术,用户只需输入简单文本提示,即可快速生成专业电影级视频与4K高清图像。它核心为内容创作者、电影制作人、营销专业人士提供强大的视频创作支撑,大幅加速创意工作流程,降低专业视频制作的门槛与成本。

4k视频AI视频模型AI视频生成Kling AI
Sprite AI官网使用入口,专业AI游戏精灵生成工具

Sprite AI核心优势的是无需用户具备任何绘画技能,只需输入文本描述,即可快速生成高质量像素艺术精灵;产品提供多种灵活订阅计划,价格从每月5美元起,涵盖游戏新手、独立开发者、专业团队等不同人群的需求,且支持随时取消订阅,兼顾实用性与灵活性。

AI游戏开发AI生成工具
Nano Banana 2 Pro官网使用入口,在线的AI图像生成与编辑工具

Nano Banana 2可帮助用户快速将创意想法转化为高质量图像。它核心聚焦电商、社交创意等领域,提供高效的图像创作解决方案,凭借闪电级生成速度、原生4K高清输出、完美文本渲染等核心优势,兼顾专业性与易用性。

AI图像生成工具AI编辑工具Nano Banana
Aidirs官网使用入口,专注AI工具的发现与分享平台

平台定位清晰,既是用户快速找到优质AI工具的“导航仪”,也是AI创作者展示创新成果、触达目标受众的“展示台”,价格暂未明确提及,核心聚焦于解决AI工具筛选难、创作者曝光难的核心痛点。

AI创作助手AI工具
Room Design AI房间设计工具,上传房间照片就能生成逼真渲染效果

产品核心定位是满足人们对家居设计的个性化需求,打破专业设计的门槛,让普通人也能轻松实现房间改造设想,同时为室内设计师、房地产从业者提供高效辅助,助力快速打造令人惊艳的空间。目前产品完全免费,每天提供5次免费生成机会,兼顾实用性与便捷性。

AI房间设计AI设计工具
SparkReceipt官网使用入口,AI驱动的收据扫描与费用跟踪工具

SparkReceipt是一款由人工智能驱动的专业收据扫描与费用跟踪工具,核心面向自由职业者、小企业及财务管理人员,专注解决收据管理繁琐、费用统计低效的痛点。它通过AI技术实现收据快速精准扫描与信息提取,支持多语言适配,可免费使用,精准满足

AI收据扫描AI费用跟踪
FormHug AI表单构建器,无需编码、无需设计基础,即可快速创建表单

FormHug是一款由人工智能驱动的全能表单构建器,无需编码、无需设计基础,即可快速创建适配多场景的表单,广泛应用于活动注册、市场调查、测验评估、预约预订等各类需求。

AI智能表单AI表单工具
MagicAgent模型使用入口,荣耀 × 复旦大学AI智能体基础模型

在Worfbench、BFCL-v3等权威智能体基准测试中,效果超越GPT-5.2、Kimi-K2等千亿级模型,是业界首个具备全场景泛化规划能力的轻量化智能体模型,目前已落地荣耀Magic系列手机。

复旦大学智能体AI模型智能基础模型荣耀AI模型
GPT‑5.3 Instant模型使用入口,OpenAI推出专为优化日常聊天体验设计的轻量级对话模型

GPT‑5.3 Instant是OpenAI推出的新一代轻量级对话模型,专为更自然、可靠、流畅的日常聊天体验设计。模型大幅改善“说教、啰嗦”等机械表达,回答更直接简洁;联网搜索整合能力显著增强,可结合知识图谱提供深度分析,而非简单罗列链接。

GPT大模型OpenAI轻量级对话模型
Gemini 3.1 Flash-Lite模型使用入口,谷歌轻量级旗舰模型,每秒363 token的输出速度

Gemini 3.1 Flash-Lite是Google推出的轻量级旗舰大模型,主打极致速度与超高性价比。模型支持可调思考深度,适合高频翻译、内容审核、实时UI生成等场景,目前已通过Google AI Studio和Vertex AI开放预览。

谷歌开源轻量级AI模型
MiniMax Music 2.5+模型使用入口,MiniMax全新升级AI纯音乐生成模型

MiniMax Music 2.5+是MiniMax全新升级的AI音乐生成模型,专注高品质纯音乐创作。模型支持古典管弦、电子、氛围、自然声景等多元风格,可一键产出冥想、助眠、游戏、影视、广告等全场景配乐。

AI音乐生成模型MiniMax模型音乐智能生成
Fun-CosyVoice3.5语音生成模型,支持13种语言,可精准调节语气、语速、语调、情绪

Fun-CosyVoice3.5是阿里通义实验室语音团队全新推出的新一代语音生成模型,模型首创FreeStyle口语化指令控制,无需专业参数,只需用自然语言描述即可精准调节语气、语速、语调、情绪;同时支持13种语言,发音准确率与生成延迟全面优化,是面向实时交互、内容创作、多语言出海的工业化级语音方案。

语音生成模型通义实验室阿里通义
FireRed-OCR小红书开源模型,轻量级文档结构解析VLM

FireRed-OCR是小红书团队开源的轻量级文档结构解析视觉语言模型,基于Qwen3-VL-2B-Instruct架构,采用三阶段渐进式训练。FireRed-OCR专为解决文档结构幻觉设计,可精准提取表格、公式、标题层级,并输出标准Markdown,兼顾高精度与轻量化部署。

AI视觉语言模型小红书开源