Open-o3 Video是北京大学与字节跳动联合研发的开源视频推理模型,核心突破在于通过整合关键时间戳、边界框等显式时空证据,实现对视频内容的精准推理。
SAIL-Embedding是由字节跳动抖音SAIL团队与香港中文大学MMLab联合研发的全模态嵌入基础模型,该模型支持文本、视觉、音频等任意模态输入,可生成统一且高信息量的特征表示,赋能多模态检索、分类、推荐等核心任务。
豆包大模型1.6 Lite是字节跳动推出的轻量级企业级人工智能模型,相较于旗舰版豆包1.6,它在保持核心能力的基础上实现了更精简的体积、更快的推理速度和更高的性价比。
Boximator 是字节跳动推出的创新视频编辑工具,主打视频主体运动轨迹精细化控制。用户只需圈选目标物体,绘制运动路径与终点位置,即可让物体严格按照设定轨迹移动。
VisActor是一套集渲染、语法、分析、图表、GIS、智能组件于一体的全链路可视化解决方案。在覆盖常规数据可视化需求的基础上,以叙事可视化为创新着力点,以智能可视化为长远目标。
AI JSON是字节跳动推出的一款智能文本转JSON工具,支持DeepSeek等兼容OpenAI标准的API接口,能通过AI模型快速将任意文本转化为合规的结构化JSON数据。
UI-TARS Desktop是字节跳动开源的桌面自动化工具,基于视觉语言模型打造,支持通过自然语言指令控制电脑完成打开文件、浏览网页、操作软件等各类任务。
用户只需长按录音按钮,即可将语音实时转为文字,还能一键添加照片、截图、链接等素材,彻底告别传统记录后的繁琐整理;更能将语音笔记智能转化为结构化文档、报告或演示文稿,上传数据后自动生成可视化图表与核心见解,助力办公效率跨越式提升。
Doubao-Seed-Code是火山引擎发布的豆包编程模型,作为国内首个“视觉理解+长上下文+低成本”三位一体的代码大模型,它重新定义了AI辅助编程的效率与边界。