• 正文
  • 相关推荐
申请入驻 产业图谱

实测快手首个电脑Agent:我拿它做了会议室预约神器,再也不用蹲点抢了

05/10 10:44
324
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

作者 |  陈骏达 编辑 |  李水青

智东西5月8日报道,4月30日,快手推出了一款名为KroWork的桌面端通用AI智能体。这一智能体可以执行写PPT等办公任务,或是低代码工具一样生成桌面应用,甚至还能直接操作本地文件、浏览器和系统环境。我们第一时间对KroWork进行了体验。KroWork强项是写应用、帮用户部署、让用户来管理应用。使用过程中,用户只需要用自然语言描述需求,KroWork就会自主拆解任务、调用技能、编写代码、执行代码,并最终交付完整的结果,比如一个部署好的本地应用、一份可编辑的PPT。比如,我们就让KroWork打造了一个能接入Outlook的自动抢会议室应用,输入基本信息后它就能定时定点自动预定会议室,再也不用每天卡点抢了。整个过程中,复杂的代码与环境配置被完全隐藏,非技术用户也能把自己的日常工作流,打造成一个可直接运行、反复使用的软件。

从产品形态上看,KroWork与Anthropic的Claude Cowork理念有些相似,它们都面向非程序员群体,以知识工作者作为目标用户,让智能体与用户长期协作并执行各种重复性任务。当然,现阶段的KroWork还远谈不上成熟。实测中,它对本地设备的操作有时并不顺畅,在复杂任务中也会出现结果不稳定、信息过时等问题。

目前,所有用户都可以在KroWork官网下载并使用这一产品。国内版支持Qwen、Kimi、DeepSeek的最新模型,国际版支持OpenAI和Anthropic旗舰模型。以下是我们的完整体验过程:

01.手搓番茄钟、系统资源监视器普通人也能“做软件”

进入KroWork首页后,可以看到这一产品与大部分AI工具的交互方式类似,用户输入自然语言,智能体负责完成任务。海外版提供三个模型选项,但均为匿名,三档模型能力递进,我们在实测过程中使用的是中档模型。

KroWork首页上不少模板都属于小工具类型的,我们也快速跑了几个试试。比如,这段提示词要求KroWork打造一个纯窗口运行的番茄钟。拿到任务后,KroWork首先加载了一个类似Skill的组件,显示为“桌面窗口,Soft/Friendly”风格,这可能是KroWork内置的关于特定风格软件打造的指南。

之后,KroWork进行了项目开发,并按照我们的要求直接打开了这一应用。KroWork的初版番茄钟完成度其实不高,有多个元素无法正常运行,也缺少了基本的关闭和最小化按钮。我让KroWork进行了分析。得益于其本地化的特性,它可以直接读取窗口的日志,查看问题具体出在哪里,最终成功定位问题并进行了修复

完成任务后,KroWork会将项目直接打包好保存在KroWork中,也可以根据用户的要求添加桌面入口。这一番茄钟的功能运转正常,并提供了自定义任务名称、时长和专注时间统计等功能,满足了我的使用需求。

在另一个类似的任务中,KroWork为我打造了一个系统资源监视器,实时监控CPU、内存、磁盘、网络等信息。这一工具的完成度也不错,数据准确,设计富有科技感,大小也适中,悬浮在桌面时不会让人感觉突兀,还是较为实用的。

总体来看,虽然KroWork依靠大量代码来完成任务,但这些代码对用户而言几乎是不可见的,某种程度上降低了非技术用户的使用门槛。用户只需简单说出需求,就能直接获得一个完整的应用,给人一种成就感。相比之下,许多AI编程工具的界面仍然以代码为核心,让非技术用户望而却步

02.从信息监测到PPT生成直接接管我的工作流

除了做做小工具之外,KroWork也可以执行更为复杂的办公任务。在我的日常工作中,监控DeepSeek等头部开源玩家的更新是一项重复性的任务,执行时也较为繁琐,需要打开多个页面进行信息梳理和汇总。在向KroWork描述这个任务的大概内容后,它选择用脚本的模式进行任务处理。在这种复杂任务明确用户意图再执行是提升效果的一种方法,KroWork就是这么做的。它向我主动询问,扫描相关代码库时具体需要检查什么内容,并提供几个选项,我只要从中选择一个并确认即可。

根据我后续提供的更多信息和要求,KroWork最终打造出了正常运转的监测脚本。手动触发一次之后,它扫描了DeepSeek的30多个代码库,并从中得出了有价值的几个更新,汇总了具体的更新内容,并附上链接方便查验。

隔了两天之后我又查看了它的监控日志,这次日志的格式出现了变化,反倒没有第一次那样清晰。这可能意味着它的脚本中还没有做好格式的相关规定,生成时带有一定随机性,还需要进一步优化。不过,这一监测脚本在抓取数据、分析变化的核心功能上基本稳定,是一个不错的提效工具。

做PPT也是办公场景的常见任务。我要求KroWork对中国AI编程市场进行一次调研,并将结果打造为PPT。这类任务会触发KroWork的深度研究、报告生成、数据分析等技能,它首先设置了研究计划,并将我的任务拆解成多个子问题,并进行深度研究。

由于深度搜索中找不到相关数据,KroWork选择使用备选方案进行搜索。我所使用的是海外版KroWork,搜索引擎是duckduckgo。

搜索后KroWork也没能找到足够信息,它最终只找到了2024年的相关数据,其他内容只能预测。最终,它生成了一份5页的PPT报告,从内容上看略显滞后,分析的产品中没有包含像Trae这样的新产品,数据也较为老旧。它的PPT制作效果还算合格,图表显示正常,内容也都是完全可编辑的。

从这次任务的最终结果来看,KroWork的表现略低于预期。不过,它在任务执行流程的规划上较为合理,能够灵活调用浏览器、深度搜索等工具,基本能力值得肯定。如果用于信息更充分、数据更易获取的行业调研,或许能交付更充实的结果。

03.可直接操作本地设备浏览器使用能力仍有提升空间

KroWork也可对本地设备进行操作,在此前的实测中,当电脑里缺失特定组件、环境时,KroWork可以直接“动手”进行安装。不过,这种操作本身具有一定风险。在执行过程中,KroWork提供了三个模式,分别是默认、自动和完全放行。默认模式下,危险或超出范围的操作都需要人工审批;自动模式下,AI会代替用户进行这一审批;完全放行时,KroWork除了破坏性操作之外,都会直接执行。

开启完全放行模式后,我让KroWork进行了一个有一定风险的操作:整理一下我的“下载”文件夹。它首先扫描了这一文件夹,并分析其中存在的问题,比如多类型文件混杂、文件重复等,并规划了一个新的目录格式,撰写好脚本和整体执行规划。不过,在正式执行前,KroWork还是先进行了询问。

我批准之后,KroWork迅速执行了脚本,一眨眼的功夫就整理好了。它将我的下载文件夹整理成了9个子文件夹,按照文件类型分类,一目了然。

除了操作本地文件,KroWork也可以直接通过插件使用本地的浏览器,用户无需安装,只要告诉KroWork想使用这个功能,它就会把插件安好。

为考察KroWork的浏览器使用能力,我们要求它打开Hugging Face网页并统计热门模型的信息。拿到任务后,KroWork加载了相关技能,自主打开了Hugging Face,并读取页面的内容。

KroWork可以对浏览器进行点击、滑动等简单操作,不过每一步的速度都有点慢。比如,它打开下方这一网页就思考了大概60秒。通过使用浏览器,KroWork了解了模型列表的结构,然后使用JavaScript提取模型数据,然后打造后端服务来定期爬取数据并追踪变化。然而,执行到这部后KroWork反复报错,最终也未能完成任务。

04.结语:AI智能体抢着“替用户干活”

近半年里,越来越多厂商开始布局“电脑智能体”、“手机智能体”等产品。国内MiniMax、智谱,国外Anthropic、OpenAI等头部大模型厂商,都在加速推进相关产品与能力落地。

随着大模型基础能力逐渐趋同,单纯的聊天与内容生成已经越来越难建立明显差异。相比之下,能够真正调用浏览器、文件系统、本地软件,并直接替用户执行任务的智能体,正在成为行业新的竞争焦点。对于用户而言,“直接帮我完成工作”,显然比“告诉我该怎么做”更具价值和吸引力。

相关推荐