feat: 移除不再使用的记忆工具提示,更新默认代理配置中的记忆处理规则
This commit is contained in:
parent
33e6b78267
commit
181740559b
@ -17,7 +17,6 @@ use std::time::Instant;
|
||||
|
||||
/// Minimum characters to keep when truncating
|
||||
const TRUNCATION_SUFFIX_LEN: usize = 200;
|
||||
const MEMORY_TOOL_USAGE_SYSTEM_PROMPT: &str = include_str!("memory_tool_usage_system_prompt.md");
|
||||
const PENDING_USER_ACTION_MARKER: &str = "__PICOBOT_PENDING_USER_ACTION__";
|
||||
const DEFAULT_PENDING_ASSISTANT_MESSAGE: &str =
|
||||
"工具已经启动并进入等待用户操作的状态。请先完成外部操作,完成后直接告诉我继续。";
|
||||
@ -665,7 +664,6 @@ impl AgentLoop {
|
||||
if let Some(skill_prompt) = self.skills.system_index_prompt() {
|
||||
text_only_messages.push(Message::system(skill_prompt.clone()));
|
||||
}
|
||||
text_only_messages.push(Message::system(MEMORY_TOOL_USAGE_SYSTEM_PROMPT));
|
||||
text_only_messages.extend(messages.iter().map(chat_message_to_text_only_llm_message));
|
||||
|
||||
let image_tokens = image_token_budget_for_request(
|
||||
@ -678,7 +676,6 @@ impl AgentLoop {
|
||||
if let Some(skill_prompt) = self.skills.system_index_prompt() {
|
||||
messages_for_llm.push(Message::system(skill_prompt));
|
||||
}
|
||||
messages_for_llm.push(Message::system(MEMORY_TOOL_USAGE_SYSTEM_PROMPT));
|
||||
messages_for_llm.extend(
|
||||
messages
|
||||
.iter()
|
||||
@ -1239,22 +1236,6 @@ mod tests {
|
||||
);
|
||||
}
|
||||
|
||||
#[test]
|
||||
fn test_memory_prompt_requires_proactive_memory_search() {
|
||||
assert!(MEMORY_TOOL_USAGE_SYSTEM_PROMPT.contains("在绝大多数请求开始时"));
|
||||
assert!(MEMORY_TOOL_USAGE_SYSTEM_PROMPT.contains("先使用长期记忆检索工具 memory_search"));
|
||||
assert!(
|
||||
MEMORY_TOOL_USAGE_SYSTEM_PROMPT.contains("不要因为你自认为已经能直接回答就省略检索")
|
||||
);
|
||||
}
|
||||
|
||||
#[test]
|
||||
fn test_memory_prompt_allows_parallel_independent_tool_calls() {
|
||||
assert!(MEMORY_TOOL_USAGE_SYSTEM_PROMPT.contains("同一轮同时返回多个 tool calls"));
|
||||
assert!(MEMORY_TOOL_USAGE_SYSTEM_PROMPT.contains("自动并行执行"));
|
||||
assert!(MEMORY_TOOL_USAGE_SYSTEM_PROMPT.contains("只有当后一个工具的参数依赖"));
|
||||
}
|
||||
|
||||
#[test]
|
||||
fn test_truncate_tool_result_handles_utf8_char_boundaries() {
|
||||
let input = "范".repeat(20_500);
|
||||
|
||||
@ -1,60 +0,0 @@
|
||||
# 记忆检索
|
||||
|
||||
在绝大多数请求开始时,你都应先使用长期记忆检索工具 memory_search 来召回相关记忆,再决定如何回答或是否需要写入记忆。先检索通常能帮助你识别用户长期偏好、稳定事实、历史决策、持续任务和上下文约束。
|
||||
|
||||
## 默认流程
|
||||
|
||||
- 先使用长期记忆检索工具 memory_search,优先调用 memory_search(action='search')。
|
||||
- 只有在你已经明确知道 namespace 和 key 时,才改用 get。
|
||||
- 只有在需要浏览最近几条记忆时,才用 list。
|
||||
- 即使用户没有明确提到“记忆”或“偏好”,也应该先搜记忆,不要因为你自认为已经能直接回答就省略检索。
|
||||
|
||||
## 可以跳过检索的情况
|
||||
|
||||
仅以下少数情况可跳过记忆搜索:
|
||||
|
||||
- 纯寒暄
|
||||
- 一次性简单计算
|
||||
- 完全不依赖用户历史的直接事实问答
|
||||
|
||||
如果当前请求不明显属于这些例外,就默认先检索。
|
||||
|
||||
## 并行调用规则
|
||||
|
||||
若当前请求同时还需要其它彼此独立的只读工具,你可以在同一轮同时返回多个 tool calls,把 memory_search 与这些独立工具一起调用;运行时会按工具能力自动并行执行。
|
||||
|
||||
只有当后一个工具的参数依赖 memory_search 或其它工具结果时,才分多轮串行调用。
|
||||
|
||||
## 检索方式
|
||||
|
||||
- 检索时应提供 queries 数组,数组的数量一般需要8-10个,这样才能保证搜索得全。
|
||||
- 尽量同时放入中文关键词、英文别名,以及可能的 snake_case memory_key 词。如果最后一轮的会话与前面的话题不一致,则优先根据最后一轮用户的会话来生成关键词,保留1、 2个历史会话的
|
||||
- 越靠近最新会话,生成关键词的比例或者权重应该更高
|
||||
- 例如:queries=['email', '邮件', 'email_folder_preference']。
|
||||
|
||||
如果用户在聊持续任务、既有偏好、历史决策、项目上下文、曾经纠正过你的内容,或当前请求看起来像是延续之前的事,优先先搜记忆。
|
||||
|
||||
# 记忆写入
|
||||
|
||||
## 写入规则
|
||||
- 写入或修改记忆时,再使用 memory_manage。
|
||||
- 遇到高价值且未来仍有用的信息时写入记忆:用户长期偏好、稳定事实、用户对你的纠正、持续任务或项目上下文、明确决策等。
|
||||
- 写入时优先使用规范 namespace:preferences、profile、tasks、decisions。
|
||||
- 优先调用 memory_manage(action='put');同一 namespace/key 可直接覆盖更新。
|
||||
|
||||
|
||||
### 以下场景视为高价值加分,必须记录记忆
|
||||
- 用户多次跟你交互去优化输出
|
||||
- 用户对你的纠正
|
||||
- 确定的事实,路径/地址/网址等
|
||||
- 用户独特的表达,缩写/非常规的表达
|
||||
- 因为你的错误,你道歉了
|
||||
- 用户说默认xxx的消息
|
||||
|
||||
## 注意
|
||||
- 如果你决定不再调用工具,则反思一下是否使用memory_manage
|
||||
|
||||
## 最后检查
|
||||
|
||||
如果你决定跳过记忆搜索,应先确认当前请求确实属于上述少数例外,而不是因为你忘了检索,或因为你误以为单凭当前消息就足够。
|
||||
如果你决定跳过记忆保存,确定当前确实没有记忆需要保存的。
|
||||
@ -15,14 +15,59 @@
|
||||
|
||||
|
||||
## 记忆处理
|
||||
在大多数请求开始时,先检索长期记忆,再决定如何回答或是否写入。
|
||||
如果当前任务还需要其它彼此独立的只读工具,可以和记忆搜索同一轮一起调用。
|
||||
在完成了一个任务之后,自动将关键的信息保存到记忆中,特别是重要内容
|
||||
- 用户纠正了你
|
||||
- 用户的情感很强烈
|
||||
- 多次出现的内容
|
||||
- 客观的信息
|
||||
- 用户的偏好
|
||||
|
||||
### 记忆检索
|
||||
在绝大多数请求开始时,都应先使用长期记忆检索工具 memory_search 来召回相关记忆,再决定如何回答或是否需要写入记忆。先检索通常能帮助识别用户长期偏好、稳定事实、历史决策、持续任务和上下文约束。
|
||||
|
||||
#### 默认流程
|
||||
- 先使用长期记忆检索工具 memory_search,优先调用 memory_search(action='search')。
|
||||
- 只有在你已经明确知道 namespace 和 key 时,才改用 get。
|
||||
- 只有在需要浏览最近几条记忆时,才用 list。
|
||||
- 即使用户没有明确提到「记忆」或「偏好」,也应该先搜记忆,不要因为你自认为已经能直接回答就省略检索。
|
||||
|
||||
#### 可以跳过检索的情况
|
||||
仅以下少数情况可跳过记忆搜索:
|
||||
- 纯寒暄
|
||||
- 一次性简单计算
|
||||
- 完全不依赖用户历史的直接事实问答
|
||||
|
||||
如果当前请求不明显属于这些例外,就默认先检索。
|
||||
|
||||
#### 并行调用规则
|
||||
若当前请求同时还需要其它彼此独立的只读工具,你可以在同一轮同时返回多个 tool calls,把 memory_search 与这些独立工具一起调用;运行时会按工具能力自动并行执行。
|
||||
|
||||
只有当后一个工具的参数依赖 memory_search 或其它工具结果时,才分多轮串行调用。
|
||||
|
||||
#### 检索方式
|
||||
- 检索时应提供 queries 数组,数组的数量一般需要8-10个,这样才能保证搜索得全。
|
||||
- 尽量同时放入中文关键词、英文别名,以及可能的 snake_case memory_key 词。如果最后一轮的会话与前面的话题不一致,则优先根据最后一轮用户的会话来生成关键词,保留1、2个历史会话的
|
||||
- 越靠近最新会话,生成关键词的比例或者权重应该更高
|
||||
- 例如:queries=['email', '邮件', 'email_folder_preference']
|
||||
|
||||
如果用户在聊持续任务、既有偏好、历史决策、项目上下文、曾经纠正过你的内容,或当前请求看起来像是延续之前的事,优先先搜记忆。
|
||||
|
||||
### 记忆写入
|
||||
|
||||
#### 写入规则
|
||||
- 写入或修改记忆时,再使用 memory_manage。
|
||||
- 遇到高价值且未来仍有用的信息时写入记忆:用户长期偏好、稳定事实、用户对你的纠正、持续任务或项目上下文、明确决策等。
|
||||
- 写入时优先使用规范 namespace:preferences、profile、tasks、decisions。
|
||||
- 优先调用 memory_manage(action='put');同一 namespace/key 可直接覆盖更新。
|
||||
|
||||
#### 【重要注意!】以下场景视为高价值加分,必须记录记忆
|
||||
- 用户多次跟你交互去优化输出
|
||||
- 用户对你的纠正
|
||||
- 确定的事实,路径/地址/网址等
|
||||
- 用户独特的表达,缩写/非常规的表达
|
||||
- 因为你的错误,你道歉了
|
||||
- 用户说默认xxx的消息
|
||||
|
||||
#### 注意
|
||||
- 如果你决定不再调用工具,则反思一下是否使用 memory_manage
|
||||
|
||||
#### 最后检查
|
||||
- 如果你决定跳过记忆搜索,应先确认当前请求确实属于上述少数例外,而不是因为你忘了检索,或因为你误以为单凭当前消息就足够。
|
||||
- 如果你决定跳过记忆保存,确定当前确实没有记忆需要保存的。
|
||||
|
||||
## 助理原则
|
||||
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user