121 lines
5.6 KiB
Plaintext
121 lines
5.6 KiB
Plaintext
---
|
||
title: "为什么写这份白皮书"
|
||
description: "对 Anthropic 官方 CLI 的逆向工程分析——不是官方文档"
|
||
---
|
||
|
||
## 这份白皮书是什么
|
||
|
||
这是对 Anthropic 官方发布的 **Claude Code CLI** 的**逆向工程分析**。
|
||
|
||
源码经过反编译处理(TypeScript 单文件 bundle 逆向),保留了核心功能模块,但包含大量 `unknown`/`never`/`{}` 类型错误——这些不影响 Bun 运行时执行,但意味着我们的分析基于运行时行为 + 残留源码结构,而非原始源码。
|
||
|
||
**这不是:**
|
||
- 官方文档或使用教程
|
||
- API 参考手册
|
||
- Claude Code 的功能推销
|
||
|
||
**这是:**
|
||
- 一个生产级 agentic system 的架构解构
|
||
- 每个设计决策背后的"为什么"
|
||
- 可复用的工程模式:agentic loop、工具抽象、上下文工程、安全纵深防御
|
||
|
||
## 逆向过程中最精妙的设计决策
|
||
|
||
### 1. Agentic Loop 的自愈能力
|
||
|
||
`src/query.ts` 实现的核心循环不是简单的"发请求→收响应"。它是一个**自愈的状态机**:
|
||
|
||
- API 返回错误(限流、token 超限)→ 自动重试/降级
|
||
- 工具执行超时 → 后台化 + 通知机制
|
||
- 对话过长触发 compaction → 压缩历史后无缝继续
|
||
- 用户中断 → 生成 `UserInterruptionMessage` 让 AI 理解发生了什么
|
||
|
||
这不是"if-else 堆叠",而是让 AI 自己根据上下文决定下一步——即使发生了意外。
|
||
|
||
### 2. 上下文工程的分层策略
|
||
|
||
AI 没有真正的"记忆",Claude Code 通过精心分层营造了这个幻觉:
|
||
|
||
| 层 | 机制 | 持久性 |
|
||
|----|------|--------|
|
||
| **System Prompt** | 项目结构、git 状态、CLAUDE.md | 每轮重建 |
|
||
| **对话历史** | 完整的 User/Assistant/Tool 消息 | 会话内 |
|
||
| **Compaction** | 自动压缩过长对话为摘要 | 压缩后替代原始消息 |
|
||
| **Memory 文件** | 跨会话持久化的笔记 | 永久(用户可控) |
|
||
| **File History** | 文件修改时间戳快照 | 会话内 |
|
||
|
||
`src/context.ts` 组装 System Prompt 时的策略是:**不变内容在前、变化内容在后**——这利用了 API 的缓存机制,前缀不变时可以复用缓存 token。
|
||
|
||
### 3. 工具系统的权限双轨制
|
||
|
||
`src/tools/BashTool/shouldUseSandbox.ts` 展示了一个精巧的双重安全模型:
|
||
|
||
- **应用层**:权限规则决定"能不能执行"(白名单/黑名单/用户确认)
|
||
- **OS 层**:沙箱决定"执行时能做什么"(文件系统/网络/进程隔离)
|
||
|
||
两层的信任假设不同:应用层信任用户配置,OS 层不信任任何东西。即使 AI 绕过了应用层权限(理论上不可能,但纵深防御),OS 层沙箱仍然限制实际危害。
|
||
|
||
### 4. Feature Flag 的全局开关
|
||
|
||
`src/entrypoints/cli.tsx` 中一行代码决定了整个系统的行为:
|
||
|
||
```typescript
|
||
const feature = (_name: string) => false;
|
||
```
|
||
|
||
所有 `feature('FLAG_NAME')` 调用返回 `false`——这意味着 Anthropic 内部的实验功能(COORDINATOR_MODE、KAIROS、PROACTIVE 等)全部禁用。在官方构建中,这些 flag 通过 Bun 的 `bun:bundle` 在编译时注入,不同用户群体看到不同功能。
|
||
|
||
这是一个**渐进式发布架构**:同一个代码库,通过 feature flag 控制功能可见性,而不需要维护多个分支。
|
||
|
||
### 5. Compaction 的分档策略
|
||
|
||
`src/services/compact/` 实现了三种压缩策略:
|
||
|
||
- **Micro-compact**:单次工具输出过长时,截断结果
|
||
- **Auto-compact**:对话 token 接近上限时,自动压缩历史
|
||
- **Reactive-compact**:API 返回 token 超限错误时,紧急压缩后重试
|
||
|
||
这不是简单的"砍掉旧消息"——而是用 AI 自身来总结之前的对话,保留语义信息。压缩后插入一条 `TombstoneMessage` 标记边界。
|
||
|
||
## 阅读路线图
|
||
|
||
推荐的阅读顺序,每章解决一个核心问题:
|
||
|
||
```
|
||
什么是 Claude Code (你在读的) ← 建立直觉
|
||
│
|
||
├── 架构全景 ← 五层架构 + 数据流
|
||
│
|
||
├── 安全体系 ← 信任与控制
|
||
│ ├── 权限模型 ← 应用层安全
|
||
│ ├── 沙箱机制 ← OS 层安全
|
||
│ └── Plan Mode ← 用户主导模式
|
||
│
|
||
├── 对话引擎 ← AI 如何思考
|
||
│ ├── Agentic Loop ← 核心循环
|
||
│ ├── 流式响应 ← 实时通信
|
||
│ └── 多轮对话 ← 上下文管理
|
||
│
|
||
├── 上下文工程 ← 记忆与预算
|
||
│ ├── System Prompt ← 上下文组装
|
||
│ ├── Token 预算 ← 预算管理
|
||
│ └── 项目记忆 ← 跨会话持久化
|
||
│
|
||
├── 工具系统 ← AI 的双手
|
||
│ ├── 工具概览 ← 统一接口
|
||
│ ├── Shell 执行 ← Bash 工具
|
||
│ └── 搜索与导航 ← Glob/Grep
|
||
│
|
||
└── Agent 与扩展 ← 能力扩展
|
||
├── 子 Agent ← 并行任务
|
||
├── 自定义 Agent ← 用户定义
|
||
└── MCP 协议 ← 外部工具接入
|
||
```
|
||
|
||
## 适合谁读
|
||
|
||
- **AI Agent 开发者**:想理解生产级 agentic system 的架构模式
|
||
- **安全工程师**:对 AI 操作真实环境时的信任模型感兴趣
|
||
- **工具构建者**:正在构建类似的 coding assistant 或 CLI 工具
|
||
- **好奇心驱动的开发者**:想知道"AI 编程助手到底怎么工作的"
|