UI-TARS Desktop是字节跳动开源的桌面自动化工具,基于视觉语言模型打造,支持通过自然语言指令控制电脑完成打开文件、浏览网页、操作软件等各类任务。
MAI-UI是通义实验室推出的全尺寸GUI智能体基座模型,核心具备用户交互、工具调用、端云协同三大核心能力。依托自主进化数据管线与大规模在线强化学习技术,模型实现2B到235B-A22B的全尺寸覆盖,适配多元场景。