维护咨询 大模型部署 问题解决 技能定制 大模型训练
Hermes Agent有强大的记忆系统,让AI能跨会话记住重要信息,还能在海量知识里快速检索。
本文讲清楚三层记忆架构、知识库配置、向量搜索,让AI真正变成懂你的助手。
## 三层记忆架构
Hermes的记忆系统分三层,越往上越持久:
第一层:会话记忆
- 内容:当前对话的上下文
- 持续:单次会话
- 容量:约200k tokens
第二层:持久记忆
- 内容:用户偏好、项目背景、常用配置
- 持续:跨会话
- 存储:~/.hermes/memory/
第三层:知识库
- 内容:大量文档、代码、网页
- 持续:永久
- 存储:向量数据库
—
## 会话记忆(Context Window)
会话记忆就是当前对话的上下文。AI通过读取历史对话理解当前话题。
管理会话记忆:
/clear # 清空当前会话,从头开始
/session compact # 压缩会话,保留关键信息
/session export # 导出会话记录
上下文自动压缩:
当会话太长时,Hermes会自动压缩旧消息,保留关键信息(如项目背景、重要决策)。压缩比例可配置:
# config.yaml
memory:
context_window: 100000 # 最大上下文tokens
compression_ratio: 0.3 # 压缩后保留30%
—
## 持久记忆(Persistent Memory)
持久记忆让你的偏好和设置跨会话保留。
查看当前记忆:
/memory list
添加记忆:
/memory add "我叫张三,英文名是Sam,在北京工作"
/memory add "我偏好简洁的代码风格,不喜欢过度注释"
/memory add "我经常用Python,偶尔用TypeScript"
删除记忆:
/memory remove "我不喜欢过度注释"
/memory clear # 清空所有记忆
记忆文件:
记忆存储在 ~/.hermes/memory/ 目录,可以用文本编辑器直接编辑:
~/.hermes/memory/
user_profile.md # 用户基本信息
project_context.md # 项目背景
preferences.md # 偏好设置
longterm.json # 结构化记忆(向量索引)
—
## 知识库(Knowledge Base)
知识库存储大量文档,让AI能在里面检索答案。
配置知识库:
# config.yaml
knowledge_base:
enabled: true
embedding_model: "text-embedding-3-small"
vector_db: "chromadb" # 支持:chromadb, qdrant, pinecone
persist_path: "~/.hermes/knowledge"
chunk_size: 500 # 每个片段的token数
chunk_overlap: 50 # 片段之间的重叠
添加文档到知识库:
# 添加整个目录
/knowledge add ./docs/
# 添加单个文件
/knowledge add ./README.md
# 添加网页内容
/knowledge add https://example.com/blog/article
# 同步整个Notion工作区
/knowledge sync notion --workspace-id xxx
搜索知识库:
/knowledge search "如何配置OAuth认证"
# 返回相关文档片段和来源
—
## 知识库与RAG
RAG(检索增强生成)是AI从知识库获取信息的关键技术:
用户提问:产品的退换货政策是什么?
↓
向量搜索:在知识库找到相关内容
↓
把检索结果注入上下文
↓
AI基于检索结果生成答案
RAG调优参数:
# config.yaml
rag:
top_k: 5 # 检索最相关的5个片段
min_similarity: 0.7 # 相似度低于0.7的不使用
rerank: true # 对结果重新排序
hybrid_search: true # 混合关键词和向量搜索
—
## 记忆系统的使用技巧
技巧一:给AI一个人设记忆
在持久记忆里写清楚你希望AI怎么跟你交流:
# ~/.hermes/memory/user_profile.md
用户信息:
- 习惯用中文交流
- 喜欢直接说重点,不喜欢废话
- 技术背景:后端开发,熟悉Python
- 不喜欢AI过度道歉或解释
技巧二:给每个项目独立的上下文
在项目目录放一个 .hermes-context.md,AI会自动加载:
# 项目根目录的 .hermes-context.md
项目名称:电商后端API
技术栈:Django + PostgreSQL + Redis
核心模块:用户、商品、订单、支付
代码规范:RESTful API,JWT认证
技巧三:用知识库管理团队知识
把公司文档、产品手册、代码规范放进知识库,全团队共享:
/knowledge add ./company-handbook/
/knowledge add ./product-docs/
/knowledge add ./coding-standards/
—
## 常见问题
Q:记忆会泄露给其他人吗?
A:不会。记忆存储在本地 ~/.hermes/ 目录,不会上传到任何服务器。团队知识库如果有共享需求,需要自建向量数据库服务。
Q:知识库太大怎么办?
A:知识库按需加载,不需要一次加载全部。可以配置按项目/按需求加载不同的知识库。
Q:记忆和知识库有什么区别?
A:记忆是关于”你”的信息(偏好、习惯、项目背景),知识库是你拥有的”文档”(文档、代码、网页)。
Q:向量数据库要钱吗?
A:本地部署的 ChromaDB 是免费的。需要云端托管可以用 Qdrant Cloud 或 Pinecone。
—
## 相关文章








暂无评论内容