# PicoBot PicoBot 是一个用 Rust 编写的个人 AI 助手运行时。它在本地启动 Gateway,接入 CLI TUI、飞书/Lark 等聊天渠道,把会话、消息、记忆和定时任务持久化到 SQLite,并为 Agent 提供文件、Shell、HTTP、Web、MCP、Skill、记忆、浏览器和子 Agent 等工具能力。 它更像一个可扩展的“个人助手操作系统”:渠道负责收发消息,SessionManager 负责会话和上下文,AgentLoop 负责模型与工具循环,Storage 负责可靠落盘。 ![PicoBot runtime architecture](docs/assets/runtime-architecture.svg) ## 适合做什么 - 在终端里和本地 AI 助手持续对话。 - 将同一套 Agent 能力接入飞书/Lark。 - 让 Agent 使用本地文件、Shell、搜索、HTTP、浏览器、MCP 工具完成任务。 - 把长期偏好、事实和历史摘要存成可检索记忆。 - 用 Cron 定时执行任务,并把结果发回目标渠道。 - 通过 Skills 为 Agent 注入项目知识和专用操作指南。 ## 快速开始 ### 1. 准备环境 需要: - Rust toolchain,项目使用 edition 2024。 - 一个可用的 LLM Provider API Key。 ### 2. 构建项目 ```bash cargo build ``` ### 3. 准备配置 PicoBot 按以下顺序加载配置: 1. `~/.picobot/config.json` 2. 当前目录 `./config.json` Gateway 首次启动时会把模板释放到 `~/.picobot/config.example.json`。模板源文件在 [resources/templates/config.example.json](resources/templates/config.example.json)。 最小配置示例: ```json { "providers": { "openai": { "type": "openai", "base_url": "https://api.openai.com/v1", "api_key": "", "extra_headers": {} } }, "models": { "gpt-4o": { "model_id": "gpt-4o", "temperature": 0.7, "max_tokens": 4096, "input_type": ["text", "image"] } }, "agents": { "default": { "provider": "openai", "model": "gpt-4o", "max_tool_iterations": 99, "token_limit": 128000 } }, "workspace_dir": "~/.picobot/workspace" } ``` `.env` 会由 PicoBot 自己解析。配置里的 `` 这类占位符会在 `.env` 和系统环境变量加载后替换。 ### 4. 启动 Gateway ```bash cargo run -- gateway ``` 默认监听 `127.0.0.1:19876`。Gateway 启动后会把进程工作目录切到 `workspace_dir`,默认 SQLite 数据库也会写到该 workspace 下的 `picobot.db`。 ### 5. 启动 CLI 客户端 另开一个终端: ```bash cargo run -- chat ``` CLI 默认连接 `ws://127.0.0.1:19876/ws`。如需指定地址,可使用 `--gateway-url`。 ## 运行时数据流 用户消息进入 PicoBot 后,会被转换为统一的 inbound message,经由 MessageBus 交给 SessionManager。SessionManager 选择当前 dialog、组装上下文、调用 AgentLoop;AgentLoop 调用模型和工具,最终响应通过 outbound bus 回到原渠道。 ![Message flow](docs/assets/message-flow.svg) 核心边界: | 模块 | 职责 | |------|------| | `channels` | 接入外部渠道,只做收发,不直接处理会话或 LLM | | `bus` | 异步消息队列,承载 inbound、outbound、control 三类消息 | | `session` | 管理会话生命周期、dialog 操作、上下文、记忆召回、压缩和持久化 | | `agent` | 执行无状态 LLM/tool 循环,处理模型响应和工具调用 | | `providers` | OpenAI 兼容接口和 Anthropic Messages API 客户端 | | `tools` | Agent 可调用工具集合 | | `storage` | SQLite schema、CRUD、消息和任务持久化 | | `scheduler` | 轮询 Cron 任务并把任务 prompt 送入目标会话 | | `skills` | 加载 Skill,并把 Skill 指南注入系统提示 | | `mcp` | 连接 MCP Server,将远端工具包装成普通 Tool | ## 核心能力 ### 渠道 | 渠道 | 说明 | |------|------| | `cli_chat` | Ratatui 终端客户端,通过 WebSocket 连接 Gateway | | `feishu` | 飞书/Lark 消息、反应、文件上传下载和媒体引用 | ### 会话 Session ID 使用三段式: ```text :: ``` 同一个 `channel:chat_id` 下可以有多个 dialog。当前支持的 dialog 操作包括创建、列表、切换、重命名、归档、删除、清空历史、压缩、导出、查看信息和停止任务。 常用 slash commands: | 命令 | 说明 | |------|------| | `/new` | 创建新 dialog | | `/sessions` | 列出最近 dialog | | `/switch ` | 切换 dialog | | `/rename ` | 重命名当前 dialog | | `/delete` | 删除当前 dialog 并创建新 dialog | | `/compact` | 手动压缩上下文 | | `/info` | 查看当前 dialog 信息 | | `/dump` | 导出当前 dialog 为 Markdown | | `/mcp` | 查看 MCP 服务器和工具状态 | | `/stop` | 停止当前任务并清空队列 | | `/?`, `/help` | 查看帮助 | ### 记忆 PicoBot 有两类记忆: | 类型 | 用途 | 生命周期 | |------|------|----------| | Knowledge | 偏好、事实、项目规则、长期可复用信息 | 长期保留,手动删除 | | Timeline | 长对话压缩后的历史摘要 | 默认保留 90 天 | 每轮处理用户消息时,MemoryManager 会按用户输入召回最多 `memory.recall_limit` 条 Knowledge,并注入系统提示。上下文压缩产生的摘要会保存为 Timeline,后续可通过 `timeline_recall` 工具检索。 ### 工具 基础工具集: | 工具 | 说明 | |------|------| | `calculator` | 数学表达式和统计计算 | | `file_read` / `file_write` / `file_edit` | 文件读写和编辑 | | `file_search` / `content_search` | 文件名和内容搜索 | | `bash` | 在 workspace 中执行 Shell 命令 | | `http_request` / `web_fetch` | HTTP 请求和网页文本抽取 | | `get_skill` | 列出或读取本地 Skill | | `memory_store` / `memory_recall` / `timeline_recall` / `memory_forget` | 长期记忆操作 | | `delegate` | 启动 inline、background 或 parallel 子 Agent | | `send_message` | 向指定渠道发送消息 | | `chat_manager` | 查看渠道、会话和历史消息 | | `cron_add/list/remove/enable/disable/update` | 管理定时任务 | | `browser` | 可选 WebDriver 浏览器自动化 | | MCP tools | 从配置的 MCP Server 动态发现并注册 | ### Skills Skill 是包含 `SKILL.md` 的目录。加载优先级从高到低: 1. `{workspace}/skills` 2. `~/.picobot/skills` 3. `~/.agents/skills` 同名 Skill 会按高优先级覆盖低优先级。内置 Skill 位于 [resources/skills](resources/skills),首次运行时会安装到 `~/.picobot/skills`。 ## 配置速查 顶层配置字段: | 字段 | 说明 | |------|------| | `providers` | LLM Provider 配置 | | `models` | 模型参数与输入能力 | | `agents` | Agent 使用哪个 provider/model | | `gateway` | HTTP/WebSocket、数据库、调度器、后台任务限制 | | `client` | CLI 客户端默认 Gateway URL | | `channels` | 渠道配置,目前主要是飞书/Lark | | `memory` | 记忆召回、归并和 Timeline 保留策略 | | `mcp` | MCP Server 配置 | | `browser` | 可选浏览器自动化配置 | | `workspace_dir` | 文件工具、Shell、数据库和 workspace skills 的工作目录 | 重要默认值: | 配置 | 默认值 | |------|--------| | `gateway.host` | `127.0.0.1` | | `gateway.port` | `19876` | | `gateway.max_concurrent_background_tasks` | `10` | | `gateway.scheduler.enabled` | `true` | | `client.gateway_url` | `ws://127.0.0.1:19876/ws` | | `memory.recall_limit` | `5` | | `memory.timeline_retention_days` | `90` | | `mcp.tool_timeout_secs` | `180` | | `browser.enabled` | `false` | 更完整的配置字段说明见 [resources/skills/about-picobot/references/config.md](resources/skills/about-picobot/references/config.md)。 ## WebSocket API Gateway 暴露: | Method | Path | 说明 | |--------|------|------| | `GET` | `/health` | 健康检查和版本信息 | | `GET` | `/ws` | WebSocket 聊天协议 | Inbound 消息类型: | Type | 主要字段 | |------|----------| | `user_input` | `content`,可选 `channel`、`chat_id`、`sender_id` | | `clear_history` | 可选 `chat_id`、`session_id` | | `create_session` | 可选 `title` | | `list_sessions` | `include_archived` | | `load_session` | `session_id` | | `rename_session` | 可选 `session_id`,`title` | | `archive_session` | 可选 `session_id` | | `delete_session` | 可选 `session_id` | | `get_slash_commands` | 无 | | `ping` | 无 | Outbound 消息类型包括 `assistant_response`、`error`、`session_established`、`session_created`、`session_list`、`session_loaded`、`session_renamed`、`session_archived`、`session_deleted`、`history_cleared`、`slash_commands_list`、`pong`、`command_executed` 和 `system_notification`。 ## 测试 ```bash # 单元测试 cargo test --lib # 集成测试需要 tests/test.env 中有真实 API key cp tests/test.env.example tests/test.env cargo test --test test_integration -- --ignored cargo test --test test_tool_calling -- --ignored cargo test --test test_request_format -- --ignored ``` 集成测试默认 `#[ignore]`,因为它们会真实调用模型 API。 ## 项目结构 ```text src/ agent/ LLM loop、上下文压缩、系统提示、媒体处理、子 Agent bus/ inbound、outbound、control 消息队列 channels/ CLI chat 和飞书/Lark 集成 client/ Ratatui 终端 UI config/ 配置加载、环境变量替换、路径展开 gateway/ Axum HTTP/WebSocket server 和 GatewayState 装配 mcp/ MCP 客户端连接和工具包装 memory/ 记忆管理和记忆类型 observability/ Agent/tool telemetry observer providers/ OpenAI 兼容和 Anthropic provider scheduler/ 定时任务运行时 session/ 会话生命周期、dialog 命令、持久化集成 skills/ Skill 加载和内置 Skill 安装 storage/ SQLite schema 和 CRUD tools/ Agent 工具实现 resources/ skills/ 构建时嵌入的内置 Skills templates/ 首次运行释放的配置和用户模板 tests/ 单元测试和 ignored 集成测试 docs/ 分析报告、文档插图和补充资料 ``` ## 关键依赖 | Crate | 用途 | |-------|------| | `axum`, `tokio`, `tokio-tungstenite` | Gateway 和 WebSocket runtime | | `sqlx` | SQLite 持久化 | | `reqwest` | LLM 和 HTTP 客户端 | | `ratatui`, `crossterm`, `termimad` | 终端 UI | | `rmcp` | MCP 客户端 | | `fantoccini` | 可选浏览器自动化 | | `cron`, `chrono-tz` | 定时任务 | | `jieba-rs` | 中文记忆检索分词 | | `zstd`, `tar` | 内置 Skill 打包和释放 | ## 进一步阅读 - [架构机制](resources/skills/about-picobot/references/architecture.md) - [配置说明](resources/skills/about-picobot/references/config.md) - [命令说明](resources/skills/about-picobot/references/commands.md) - [工具说明](resources/skills/about-picobot/references/tools.md) - [数据库结构](resources/skills/about-picobot/references/db-schema.md) - [代码质量分析](docs/CODE_QUALITY_ANALYSIS.md)