> 技术文档 > Cerebellum:浏览器 AI 助手,基于 Claude 3.5 Sonnet 和 Selenium WebDriver 执行网页自动化任务_selenium cerebellum

Cerebellum:浏览器 AI 助手,基于 Claude 3.5 Sonnet 和 Selenium WebDriver 执行网页自动化任务_selenium cerebellum

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. Cerebellum 是基于 Claude 3.5 Sonnet 和 Selenium WebDriver 构建的浏览器 AI 助手。
  2. 支持网页自动化任务,如数据抓取和网站自动化测试。
  3. 将网页浏览简化为有向图导航,用 LLM 分析页面内容和交互元素,智能规划行动路径。

正文(附运行示例)

Cerebellum 是什么

在这里插入图片描述

Cerebellum 是基于 Claude 3.5 Sonnet 和 Selenium WebDriver 构建的浏览器 AI 智能助手,能够理解任务意图并执行网页自动化任务,如数据抓取和网站自动化测试。Cerebellum 将网页浏览简化为有向图导航,用大型语言模型(LLM)分析页面内容和交互元素,智能规划行动路径,并根据网页状态和历史操作动态调整策略。Cerebellum 支持多种浏览器,能够精确模拟用户行为,适用于复杂的自动化场景。

Cerebellum 的主要功能

  • 图形导航:将网页浏览简化为有向图导航,每个网页被视为一个节点,用户操作(如点击或输入)作为节点间的边。
  • 节点发现:基于 LLM(大型语言模型)分析页面内容,发现、识别新的网页节点。
  • 行动决策:基于当前网页状态和历史用户操作,智能决策下一步行动。
  • 多浏览器支持:兼容 Chrome、Firefox、Safari 和 Edge 等多种浏览器。
  • 用户行为模拟:精确模拟用户行为,如点击、输入等,适用于复杂的自动化场景。
  • 动态策略调整:接受运行时指令,根据实时反馈动态调整浏览策略和操作。
  • 表单填写:用用户提供的 JSON 数据自动填写网页表单。

Cerebellum 的技术原理

创意设计