网关架构
OpenClaw 的核心是一个运行在本地的消息路由网关,将外部聊天频道、AI 模型和本地工具连接在一起。
四层架构
OpenClaw 采用清晰的四层架构设计:
┌─────────────────────────────────────────────┐
│ 技能(Skill)层 │
│ AI 的「手和脚」— 浏览器、文件系统、 │
│ API 调用、自动化脚本、数据库查询 │
├─────────────────────────────────────────────┤
│ 智能体(Agent)层 │
│ AI 的「大脑」— 认知决策核心 │
│ 支持 Claude / GPT-4 / Gemini / DeepSeek 等 │
│ 多模型接入,自动故障切换 │
├─────────────────────────────────────────────┤
│ 网关(Gateway)层 │
│ AI 的「躯干」— 中枢神经系统 │
│ 会话管理、并发控制、权限界定、事件分发 │
├─────────────────────────────────────────────┤
│ 消息渠道(Channel)层 │
│ AI 的「耳朵和嘴巴」 │
│ WhatsApp / Telegram / 飞书 / 微信 / Discord │
└─────────────────────────────────────────────┘第 1 层:消息渠道层
底层为消息渠道层,你可以通过 WhatsApp、Telegram、钉钉、飞书以及企业微信等日常沟通软件,以对话的方式向 AI 下达指令。
第 2 层:网关层
中间层为网关层,是整个系统的中枢神经。网关是一个传递消息的中转站,必须保持运行,路才通。它负责处理会话管理、多任务并发控制、用户权限界定以及事件分发。
网关就像桥梁
网关是人和各种软件服务器之间的桥梁。没有网关,消息就到不了 AI,AI 的回复也传不回来。
第 3 层:智能体层
向上为智能体(Agent)层,这是 AI 的「大脑」,负责认知决策。OpenClaw 不绑定任何单一模型供应商,支持接入 Claude、GPT-4、Gemini、DeepSeek、Kimi 等多个主流大模型。
该层负责:
- 接收来自网关层的用户意图
- 拆解为多步骤子任务
- 进行逻辑推理与策略规划
- 首选模型故障时自动降级切换,保证 7×24 小时可用
第 4 层:技能层
最顶层为技能(Skill)层,这是 OpenClaw 区别于传统聊天机器人的核心突破。技能层赋予了 AI 虚拟的「手和脚」,让它能突破对话框的限制:
- 操作浏览器进行信息检索
- 访问本地文件系统处理文档
- 调用第三方 API 传输数据
- 执行自动化脚本和数据库查询
从「回答者」到「执行者」
传统 AI 就像诸葛亮写个锦囊交给你,你再自己去前线执行。OpenClaw 则是诸葛亮直接拔剑替你干活。
消息处理流程
- 接收消息:频道适配器接收来自聊天平台的消息
- 路由分配:路由引擎根据规则将消息分配给对应的 Agent
- 上下文构建:从会话记忆中加载历史对话和相关记忆
- 模型推理:调用 AI 模型生成回复,必要时调用工具技能
- 发送回复:将 AI 回复通过频道适配器发回聊天平台
多智能体路由
可以为不同频道或不同用户配置不同的 Agent,实现:
- 不同频道使用不同的 AI 模型
- 不同用户对应不同的系统提示词
- 特定话题触发专用 Agent
Web 控制台
网关启动后,Web 控制台(默认 http://127.0.0.1:18789/)提供:
- 实时查看所有频道的对话
- 修改配置(无需重启)
- 查看系统日志
- 管理 Agent 和技能