声明:本文来自于微信公众号 AI新榜,作者:卷毛,授权站长之家转载发布。
AI智能体(Agent)已经进入新的阶段了。
之前很多面向C端市场的AI智能体,比如ChatGPT的GPTs、百度的文心智能体、字节的扣子、Kimi+等,都以智能助手定位为主,像是不同角色的AI聊天机器人,虽然有一定实用性,但离贾维斯那种智能程度的个性化助手还很远。
智能体页面,左豆包,右Kimi+
我们希望AI是好用的工具,但又不仅仅是工具,它可以作为一个深度了解我们的合作伙伴,在生活、工作、娱乐等广泛的场景中自主灵活地提供帮助。
根据Sam Altman的AGI层级框架理论,当前的AI系统已经从第一级“聊天机器人”发展到第二级“推理器”,能够进行更复杂的分析和解决问题,比如o1模型就更擅长推理,可以执行高难度的Python任务。而第三级的AI智能体将标志着AI在自主性和决策能力方面的重大飞跃。
这样的AI智能体已经初见雏形了。10月23日,升级版Claude3.5Sonnet推出新功能Computer Use,让AI可以像人一样使用计算机,比如查看屏幕、点击按钮和输入文本。
Computer Use自动填表
很快,国内AI也迎头赶上。10月24日,智谱发布AutoGLM模型,网页版插件AutoGLM-Web可以模拟用户访问网页、自动完成高级检索、总结与内容生成等。
AutoGLM-Web在小红书上搜索热度最高的北京旅行攻略,并总结
相对应的,手机端AutoGLM的Phone Use能力,意味着只需要简单的文字/语音指令,AI就可以像人一样操作手机,目前可适配微信、淘宝、美团、小红书、大众点评、12306、携程和高德地图等8款应用。
AutoGLM Web现已通过“智谱清言”插件对外发布,手机端AutoGLM还在内测中,同样可以在智谱清言申请体验,暂时仅支持安卓系统。
智谱清言AutoGLM内测申请入口
说到这,安卓手机的优势已然体现