Step-GUI - 阶跃星辰开源的AI Agent系列模型
端云协同:Step-GUI采用端云协同方案,既利用云端强大计算能力处理复杂任务,又通过端侧模型Step-GUI Edge在本地运行,保护用户隐私,实现隐私边界可知可控。
广泛的应用场景:Step-GUI目前已能在淘宝、微博、抖音、小红书、闲鱼等超过200个APP场景中执行任务,极大地拓展了GUI Agent的能力边界,满足了用户在多种场景下的需求。
快速部署:支持个人开发者和硬件厂商快速在终端打造Agent助手,最快10分钟即可部署上线,大大降低了开发和部署的门槛和时间成本。
开源的端侧模型:Step-GUI Edge作为业内首个支持手机部署的开源端侧模型,可在手机等终端设备上运行,将数据保留在本地,进一步保障了用户的隐私和数据安全。
强大的端云协同能力:结合云端的强大计算力和终端设备的隐私保护优势,实现高效处理复杂任务的同时保障用户数据安全。
广泛的应用场景覆盖:支持在淘宝、微博、抖音等200多个主流APP中执行任务,拓展了GUI Agent的能力边界,满足多样化需求。
快速部署与开发:提供便捷的部署方案,个人开发者和硬件厂商可在10分钟内快速搭建Agent助手,降低开发门槛。
开源且支持手机部署:Step-GUI Edge作为开源的端侧模型,支持手机等终端设备部署,保护用户隐私,推动技术的广泛应用。
首个面向GUI Agent的MCP协议:规范和优化GUI Agent的运行和交互,提升整体性能和稳定性,引领行业标准。
项目官网:https://opengelab.github.io/
Github仓库:https://github.com/stepfun-ai/gelab-zero
HuggingFace模型库:https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview
arXiv技术论文:https://arxiv.org/pdf/2512.15431
个人开发者:可以快速用Step-GUI在终端设备上部署Agent助手,开发个性化应用,提升开发效率。
硬件厂商:借助Step-GUI的端云协同能力,为智能设备增加强大的视觉理解和任务执行功能,提升产品竞争力。
企业用户:在需要处理复杂任务和保护数据隐私的业务场景中,用Step-GUI实现高效自动化操作,优化工作流程。
APP开发者:通过集成Step-GUI,为应用增加智能交互功能,提升用户体验,拓展应用功能边界。
Step-GUI是阶跃星辰公司开源的AI Agent系列模型,包括云端模型Step-GUI、首个面向GUI Agent的MCP协议,以及业内首个支持手机部署的开源端侧模型Step-GUI Edge。专注于通过视觉理解技术实现对手机、电脑等设备的图形界面自动化操作。支持在淘宝、微博等200多个App中执行任务,个人开发者可在10分钟内完成部署。其特色在于端云协同设计,兼顾隐私保护与高效计算,目前已开放API供免费使用,并配套技术文档和开发竞赛活动。