Self Improve Agent 是一个面向面试展示的开源项目,用来集中体现 AI Agent 工程能力。
它重点覆盖 AI Agent 岗位最常见、也最核心的几个能力方向:
- Agent 运行时
- 工具调用与执行
- 仓库级检索与上下文拼装
- 反思记忆与 Bad Case 沉淀
- 评测闭环
- Multi-Agent 协作
很多开源 Agent 项目更偏“产品形态完整”,看起来很丰富,但在面试里反而不容易把工程深度讲清楚。
这个项目故意选择一个更聚焦、也更容易防守的方向:
一个面向代码任务的自改进 Agent,它能够检索仓库上下文、执行工具、在失败后反思、沉淀经验,并在下一次任务中复用这些经验。
这样做的好处是,你能更清楚地展示:
- runtime 设计
- 上下文工程
- 失败恢复与反思机制
- 评测与效果验证
- self-improve 逻辑
- multi-agent 协作拆分
当前 0.1.0 版本包含:
- 一个最小可运行的 Agent Runtime
- 一个
planner / executor / critic形式的多 Agent 流程 - 一个带 critic 反馈注入的二次尝试闭环
- 本地反思记忆
- 一个基于关键词的仓库检索器
- 一个可回放、可落盘的评测骨架
- 一个可控的
replace_text编辑工具 - 一套运行时 trace 记录
- 一个并发更稳的 memory 原子写入实现
- 面向路线图、架构、开发过程和面试的配套文档
self_improve_agent/
docs/
ARCHITECTURE.md
DEVELOPMENT_LOG.md
EXECUTION_PLAN.md
INTERVIEW_PREP.md
ROADMAP.md
examples/
sample_tasks.json
src/
self_improve_agent/
agents/
core/
evaluation/
memory/
providers/
rag/
tools/
cli.py
docs/TUTORIAL.mddocs/ROADMAP.mddocs/ARCHITECTURE.mddocs/CASE_STUDIES.mddocs/DEVELOPMENT_LOG.mddocs/INTERVIEW_PREP.mdsrc/self_improve_agent/core/runtime.py
cd self_improve_agent
uv pip install -e .
uv run self-improve-agent demo --workspace .演示带重试能力的运行:
uv run self-improve-agent demo --workspace . --max-attempts 2 --output .self_improve_agent/demo_result.json演示安全编辑能力:
uv run self-improve-agent demo --workspace . --prompt "replace PlannerAgent with PlanningAgent in examples/replace_demo.txt"运行评测并保存结果:
uv run self-improve-agent eval --workspace . --task-file examples/sample_tasks.json --output .self_improve_agent/eval_results.json这个项目不是为了做一个完整的 Claude Code 克隆,也不是为了做一个功能大而全的个人 Agent OS。
它的目标很明确:回答面试官最关心的几个问题。
- 你怎么设计一个 Agent Loop
- 你怎么做 Tool Calling 和执行链路
- 你怎么加 Memory 和 RAG
- 你怎么做效果评估
- 你怎么让 Agent 逐步改进
- 你怎么拆 Multi-Agent