v2.0: 不是错题本。是会学习的系统。 每次对话自动标注 → 关窗口自动收割 → 开窗口秒级同步 → 每天深度根因分析。 四层进化架构,AI 真的越用越聪明。
v2.0: Not an error notebook. A learning system. Every chat auto-annotated → harvested on window close → synced on window open → deep root-cause analysis daily. Four-layer evolution architecture. The AI actually gets smarter.
v2.0 vs v1.0
| v1.0 | v2.0 | |
|---|---|---|
| 触发方式 | 每周日跑一次 scanner | 四层: Stop hook + SessionStart hook + 每天 cron + 手动收尾 |
| 知识真空 | 关窗口后等 7 天才扫描 | SessionStart hook: 开新窗口秒级补收割 |
| 分析深度 | 数错误出现次数 | 根因分析: 找 WHY,提炼一个原则防止所有同类错误 |
| 审批卡片 | "(TBD — refine during approval)" | 带具体规则文本,可直接使用 |
| 规则存储 | 只写 CLAUDE.md | 双路径: CLAUDE.md + Agent Memory (50+ 规则 .md 文件) |
| 周报 | "6 patterns found" | "本周最重要的发现: GFW 网络干扰是 4 个错误的共同根因..." |
四层进化架构 / Four-Layer Evolution
L1: 即时标注 → 每次决策/错误立即输出 [DECISION:] [ERROR:] (CLAUDE.md Priority 0)
L2: Hook 收割 → Stop hook (关窗口) + SessionStart hook (开窗口) 双保险
L3: 深度分析 → 每天 14:07 cron 全量根因分析 + 规则维护 + 周报
L4: 手动收尾 → "收尾" 触发 neat-freak 审计
实时闭环 / The Real-Time Loop:
Session 进行 → AI 自动标注 (L1)
↓
关窗口 → Stop hook 收割 → vault + Agent Memory (L2, <2s)
↓
开新窗口 → SessionStart hook 补收割漏网之鱼 → Agent Memory 更新 (L2, <2s)
↓
AI 初始化 → 加载 CLAUDE.md + 最新 Agent Memory → 已更聪明
↓
每天 14:07 → 全量深度扫描 → 根因分析 → 规则合并 → 周报 (L3)
快速安装 / Quick Install
git clone https://github.com/YOUR_USERNAME/obsidian-knowledge-brain.git
cd obsidian-knowledge-brain/scripts
pip install -r requirements.txt # PyYAML + requests (LLM mode optional)
python setup.py
脚本问三个问题,自动建好一切。
然后必须做两件事:
- 把
patches/CLAUDE.md.patch的内容加到你的CLAUDE.md(这是 L1 — AI 的"感官系统") - 在
~/.claude/settings.json配好 Stop + SessionStart hook(这是 L2 — 自动收割)
{
"hooks": {
"Stop": [{"matcher": "", "hooks": [{"type": "command", "command": "python path/to/scripts/session_harvester.py --mode stop"}]}],
"SessionStart": [{"matcher": "", "hooks": [{"type": "command", "command": "python path/to/scripts/session_harvester.py --mode start"}]}]
}
}
最后配定时任务:
/cron 7 14 * * * durable=true "cd path/to/scripts && python runner.py --full"
深度分析系统 / Deep Analysis System
不是计数器,是学习者
v1.0: 扫描 → "R-package_package_not_found 出现 4 次" → 卡片 "(TBD)"
v2.0: 扫描 → 发现 4 个不同错误 (package_not_found, install_fail, bioc_version_mismatch, dependency_conflict) → 根因分析: 它们都源于 R library 在 D:/R/library 不是默认路径 → 一条原则 → 检查已有规则已覆盖 → reinforce (不重复创建) → 周报: "[CONFIRMED] R 包管理规则已验证有效"
三层分析 / Three-Tier Analysis
Tier 1: 启发式知识库 (ROOT_CAUSE_KB) — 离线工作,覆盖已知根因
Tier 2: LLM 深度分析 — 发现新模式 (可选,需要 API key)
Tier 3: 人工审查 — 标记未知模式供人审核
实际效果 / What You'll See
周报第一���就是最重要的发现
## 这周学到了什么 / What We Learned
[CONFIRMED] GFW network interference — 5 existing rules validated:
RULE-GIT-001 (6 errors, 3 projects), RULE-WIN-002, RULE-R-002...
审批卡片带具体规则,不是 "(TBD)"
# Proposed Rule: RULE-API-001
## Root Cause
cBioPortal API has non-standard parameter requirements
## Principle
Always use projection=DETAILED, entrezGeneId=<int> for methylation,
always client-side filter geneList results
## Rule Text
1. All cBioPortal requests MUST include projection=DETAILED
2. Methylation endpoints use entrezGeneId=<int> NOT geneList=<str>
3. geneList filter MAY be silently ignored — always client-side filter
4. PanCan Atlas methylation is often empty — fall back to legacy TCGA
为什么不用... / Why Not Just Use...
| 方案 | 问题 |
|---|---|
| 纯 CLAUDE.md | 单文件膨胀、无自动发现跨项目模式、无时间线/主题索引 |
| 数据库 | 需要 schema 维护、AI 不能直接读写、Obsidian 打不开 |
| Notion/Confluence | API 限流、需联网、知识锁在 SaaS、不跨 AI 工具 |
| 纯 Agent Memory | 只对当前 AI 有效。换工具不认。Markdown vault 任何工具都能读 |
| v1.0 (纯周扫描) | 知识真空 7 天、分析只数数不找根因、卡片写 "(TBD)" |
目录结构 / What's Inside
obsidian-knowledge-brain/
├── SKILL.md ← AI 技能定义 (v2.0)
├── README.md ← 本文件 / This file (v2.0)
│
├── scripts/ ← 11 个 Python 脚本
│ ├── setup.py ← 一键初始化
│ ├── session_harvester.py ← Hook 收割器 (v2.0 新增)
│ ├── runner.py ← 管道编排 (5 步)
│ ├── backup.py ← JSONL 备份 + Nutstore
│ ├── analyzer.py ← 根因分析 (v2.0 重写)
│ ├── maintainer.py ← 智能卡片 + 合并检测 (v2.0 重写)
│ ├── reporter.py ← 周报 + 学习叙事 (v2.0 重写)
│ ├── compiler.py ← CLAUDE.md + Agent Memory (v2.0)
│ ├── config.py / config.example.yaml
│ └── requirements.txt ← PyYAML + requests
│
├── references/ ← 深入文档 (v2.0)
│ ├── architecture.md ← 8 个设计决策 + Anti-Patterns
│ └── workflow.md ← 四层工作流 + Hook 配置 + 管道
│
├── templates/vault/ ← Vault 模板
└── patches/CLAUDE.md.patch ← Priority 0 标注规则 (v2.0)
常见问题 / FAQ
Q: 离网能用吗?/ Works offline? A: 完全离网工作。启发式根因分析不需要网络。LLM 深度分析是可选的增强。
Q: 必须装 Obsidian? A: 不必须。Vault 是纯 Markdown 文件夹,任何编辑器都能看。Obsidian 提供更好的可视化。
Q: 漏扫了怎么办? A: runner.py 启动时自动检测上次扫描时间。超过 7 天自动切换全量模式补跑。
Q: 会改坏文件吗?
A: 所有写操作是原子写入 (.tmp → os.replace)。崩溃不损坏原文件。有 --dry-run 预览模式。
许可证 / License
MIT — 随便用、改、分发。
Comments