AI 浏览器赛道竞争的火热。Google 的核心产品接二连三的遭到挑战,从搜索到浏览器。AI 正在重新定义用户的信息获取以及交互方式,重新塑造互联网入口的产品。OpenAI 几乎在所有流量入口都有积极的部署,Sora 类似抖音,ChatGPT Search 类似 Google,ChatGPT Atlas 类似 Chrome。
我把 Comet 设置为我的默认浏览器很久了,最近也是用上了 ChatGPT Atlas
✨ Features
- ChatGPT 聊天侧边栏,包含网页信息,浏览记录
- AI 操作浏览器
- 框中页面上的文字,在悬浮菜单栏中调用 ChatGPT,更新文字
- 默认 ChatGPT 搜索,支持搜索文字,图片,视频等
- 更细致的权限控制。 ChatGPT 是否拥有权限使用你在各个网站的登录信息
那和 Comet 相比功能差在哪里呢?
- 更细节的权限控制
- 悬浮栏调用 ChatGPT
- 对于 ChatGPT 产品更多的集成,例如 Agens, Canvas,图片生成等功能
- AI 点击页面元素的展现更加自然
- 自动选择模式
🫡 体验
AI 产品不能只看功能,更关键的是实际体验。以搜索功能为例,我觉得 ChatGPT 的结果更精炼,阅读负担更小。在搜索公司网站时,它会根据用户的职业兴趣呈现合适的公司,避免重名误判。而 Perplexity 在信息搜索上的精准度更高,比如查询公司招聘信息时,它能准确提供该公司的域名;相比之下,ChatGPT 有时会匹配到错误的公司。
对于网页操作,我觉得 Comet 的精准度更高和完成度更高。比如我让两个浏览器都给一个 TG 联系人发消息,Comet会在发送消息之前让我确认一下,点一下确认按钮他就会发送消息。Atlas 则直接在把消息填入聊天框之后就停了下来,等待下一步的指示。
除此之外 Comet 更加注重安全。AI 做一些重要操作时,它会提示用户进行确认。 整个操作的透明度也更好。展示了 AI 整个的思考过程。
Comet 可以自动识别用户需要进行网页操作还是只是单纯的搜索问题。Atlas 目前还需要人手工选择模式。
Atlas 的页面操作大部分都倾向于放在前台,Comet 会在后台做这些任务,不打扰用户忙其他事情。但是保证透明度。用户可以随时查看打断。
🎬 场景
讲完这些功能和体验上的区别,到底什么任务是适合让 AI 帮我们去完成的呢?
对于操作步骤比较繁琐,使用频率比较高的流程非常适合使用 AI 进行用户。如今很多产品做的越来越复杂和臃肿,完成一件事情可能要点5-7下,这种就适合把它保存为一个 Prompt 然后进行重复使用。举几个例子
- 自动填写表单
我有一个收集有意思产品的表单,类似收藏夹。每次看到有意思的我就会填写表单,并提交。提交后,预先设置的 n8n 流程会分析这个产品,获取关键信息,记录在 Notion 上。我把这个功能做成了一个 Skil。给出产品链接,AI 会自动帮我提交。省去了我人工寻找表单网址,复制黏贴,提交的功夫。
- 更新 Notion 数据库
我有一些项目在 Notion 上追踪,更新项目进展我让 AI 帮我去做。人工做的话这通常意味着,打开 Notion,找到数据库,寻找到需要修改的那一行,更新对应的值。
- 合并日历数据
我朋友用 AI 来把他多个日历合并
最后,
虽然厂商都在宣传 AI 操作浏览器的功能,但是用户大部分时候都想不到用它。 还有很多使用场景值得探索。
信息来源:TG频道@NewlearnerChannel
