为解决临床与基因组数据整合中的可扩展性、异质性管理和可重复性分析等挑战,哈佛医学院团队开发了开源平台PIC-SURE。该 ...
最近,因为豆包手机助手的发布,关于 GUI Agent(图形用户界面智能体) 的讨论很热烈。 GUI Agent 不是新概念,它要做的事说白了就是:让 AI 直接「看屏幕、点按钮、拖进度条」,像人一样操作电脑、手机,甚至车机界面。 11 月 29 日,阶跃星辰开源了 4B 的 GUI ...
2025年12月7日,国盛证券(002670)发布了一篇计算机行业的研究报告,报告指出,手机Agent的两种范式-API与GUI。 手机Agent,移动交互范式的跃迁。自触控屏幕开启移动互联网黄金时代以来,App被设计为一个个独立的孤岛,用户通过点击图标进入特定的应用环境 ...
手机Agent,移动交互范式的跃迁。自触控屏幕开启移动互联网黄金时代以来,App 被设计为一个个独立的孤岛,用户通过点击图标进入特定的应用环境,依靠视觉和手动点击来完成任务。随着应用数量的增长和功能的堆叠,用户在不同App 间切换、寻找功能入口 ...
手机Agent,移动交互范式的跃迁。自触控屏幕开启移动互联网黄金时代以来,App被设计为一个个独立的孤岛,用户通过点击图标进入特定的应用环境,依靠视觉和手动点击来完成任务。随着应用数量的增长和功能的堆叠,用户在不同App间切换、寻找功能入口 ...
OpenVINO™ 是一个用于优化和部署 AI 推理的开源工具包。 提升深度学习在计算机视觉、自动语音识别、自然语言处理和其他常见任务中的性能 使用流行框架(如TensorFlow,PyTorch等)训练的模型 减少资源需求,并在从边缘到云的一系列英特尔®平台上高效部署 目前 ...
[导读]在C语言开发领域,工具链的选择直接影响开发效率与代码质量。随着开源生态的成熟,开发者不再局限于商业软件,而是转向功能强大且灵活的开源工具。本文将聚焦两类核心工具——集成开发环境(IDE)与调试器,结合技术特性、应用场景与社区支持 ...
近日,微软的研究团队对 API 代理和 GUI 代理进行了对比研究,发现这两种代理各有特点,可以根据不同需求进行合理选择。API 代理通过可编程接口与软件进行交互,而 GUI 代理则模拟人类的操作方式,通过点击按钮和导航菜单来完成任务。例如,若要安排一个 ...
本论文第一作者为微软 DKI 团队的 Chaoyun Zhang,其为 Windows 平台首个智能体系统 ——UFO 的核心开发者,该项目已在 GitHub 上开源并获得约 7,000 Stars,在社区中引发广泛关注。同时,他也是一篇超过 90 页的 GUI Agent 综述文章的主要撰写者,系统梳理了该领域的关键 ...
微软对其开源的AgentUFO进行了重磅升级,发布了UFO²版本并新增了操作系统功能。并且很快会上线画中画模式,支持在沙盒虚拟桌面中自动化运行。 与上一版本相比,UFO²最大亮点之一就是与自家的Windows系统实现了深度集成,可以直接调用原生API、COM等接口,这 ...
由多模态大语言模型(LLM)驱动的 Computer-Using agent(CUA),为通过自然语言实现复杂桌面工作流程自动化提供了一个前景广阔的方向。 然而,当前大多数 CUA 仍处于概念验证阶段,受限于对操作系统集成程度低、依赖屏幕截图的交互方式不稳定,以及执行过程易 ...