Skip to content

Fulin-Guo/agent

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Self Improve Agent

Self Improve Agent 是一个面向面试展示的开源项目,用来集中体现 AI Agent 工程能力。

它重点覆盖 AI Agent 岗位最常见、也最核心的几个能力方向:

  • Agent 运行时
  • 工具调用与执行
  • 仓库级检索与上下文拼装
  • 反思记忆与 Bad Case 沉淀
  • 评测闭环
  • Multi-Agent 协作

为什么做这个项目

很多开源 Agent 项目更偏“产品形态完整”,看起来很丰富,但在面试里反而不容易把工程深度讲清楚。

这个项目故意选择一个更聚焦、也更容易防守的方向:

一个面向代码任务的自改进 Agent,它能够检索仓库上下文、执行工具、在失败后反思、沉淀经验,并在下一次任务中复用这些经验。

这样做的好处是,你能更清楚地展示:

  • runtime 设计
  • 上下文工程
  • 失败恢复与反思机制
  • 评测与效果验证
  • self-improve 逻辑
  • multi-agent 协作拆分

当前范围

当前 0.1.0 版本包含:

  • 一个最小可运行的 Agent Runtime
  • 一个 planner / executor / critic 形式的多 Agent 流程
  • 一个带 critic 反馈注入的二次尝试闭环
  • 本地反思记忆
  • 一个基于关键词的仓库检索器
  • 一个可回放、可落盘的评测骨架
  • 一个可控的 replace_text 编辑工具
  • 一套运行时 trace 记录
  • 一个并发更稳的 memory 原子写入实现
  • 面向路线图、架构、开发过程和面试的配套文档

项目结构

self_improve_agent/
  docs/
    ARCHITECTURE.md
    DEVELOPMENT_LOG.md
    EXECUTION_PLAN.md
    INTERVIEW_PREP.md
    ROADMAP.md
  examples/
    sample_tasks.json
  src/
    self_improve_agent/
      agents/
      core/
      evaluation/
      memory/
      providers/
      rag/
      tools/
      cli.py

阅读顺序

  1. docs/TUTORIAL.md
  2. docs/ROADMAP.md
  3. docs/ARCHITECTURE.md
  4. docs/CASE_STUDIES.md
  5. docs/DEVELOPMENT_LOG.md
  6. docs/INTERVIEW_PREP.md
  7. src/self_improve_agent/core/runtime.py

快速开始

cd self_improve_agent
uv pip install -e .
uv run self-improve-agent demo --workspace .

演示带重试能力的运行:

uv run self-improve-agent demo --workspace . --max-attempts 2 --output .self_improve_agent/demo_result.json

演示安全编辑能力:

uv run self-improve-agent demo --workspace . --prompt "replace PlannerAgent with PlanningAgent in examples/replace_demo.txt"

运行评测并保存结果:

uv run self-improve-agent eval --workspace . --task-file examples/sample_tasks.json --output .self_improve_agent/eval_results.json

面试定位

这个项目不是为了做一个完整的 Claude Code 克隆,也不是为了做一个功能大而全的个人 Agent OS。

它的目标很明确:回答面试官最关心的几个问题。

  • 你怎么设计一个 Agent Loop
  • 你怎么做 Tool Calling 和执行链路
  • 你怎么加 Memory 和 RAG
  • 你怎么做效果评估
  • 你怎么让 Agent 逐步改进
  • 你怎么拆 Multi-Agent

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages