My Current AI Dev Workflow | Peter Steinberger

Went fully back to Ghostty, VS Code on the side, and Claude Code as my main driver. Here's what actually works after months of experimentation.

steipete.me

Peter Steinberger 在本文中分享了他截至 2025 年 8 月的最优 AI 开发工作流。其核心理念是“少即是多”(Less is More),强调通过极简的工具链实现最高生产力。他目前的工作流已从完全依赖 VS Code 转向以 Ghostty 终端 + Claude Code (CLI) 为核心的模式。

在硬件方面,他推崇戴尔 UltraSharp U4025QW 40 英寸显示器,其超宽分辨率允许同时显示 4 个 Claude 实例和浏览器,无需频繁切换窗口。在软件工具上,他放弃了不稳定的 VS Code 内置终端,转而使用 Ghostty。虽然他仍保留 VS Code 用于代码查看,并使用 Cursor 或 GPT-5 进行代码审查,但主要的编码和重构工作由 Claude Code 承担。

Peter 强调了“上下文管理”的重要性。他通过在状态栏显示会话 ID、使用 CLAUDE.md 记录环境配置、以及坚持在同一上下文中编写测试来优化 AI 的表现。他认为,虽然 AI 代理(Agents)非常强大,但人类的实时引导(Steering)至关重要,以防止 AI 偏离方向。此外,他倾向于使用具有强大 CLI 支持的服务(如 Vercel、psql、gh),因为这能让 AI 代理更高效地执行任务。尽管 Claude 的费率限制可能带来挑战,但他认为目前没有更好的替代方案,这种工作流极大地提升了他的开发效率。


主题 1:核心工具链与硬件环境的演进

Peter Steinberger 的开发环境经历了一个从复杂到极简、从 IDE 核心到终端核心的演进过程。他最初曾尝试全身心投入 VS Code,但最终发现 VS Code 的内置终端在处理大量文本粘贴时容易冻结且不够稳定。因此,他回归了 Ghostty 终端,将其作为主要的操作阵地。Ghostty 的高性能和稳定性使其成为运行 AI 命令行工具(如 Claude Code)的理想选择。

在显示硬件上,他选择了 Dell UltraSharp U4025QW。这款 40 英寸的 5K 级超宽显示器(3840x1620 分辨率)为多任务并行提供了物理基础。Peter 的典型布局是在屏幕上同时排列 4 个 Claude 实例窗口和 Chrome 浏览器,这种“全景式”的视野让他无需在不同应用间频繁切换,极大地减少了认知负荷。

在 AI 模型的选择上,Peter 形成了一套互补的体系:

  1. Claude Code (CLI):作为主力开发工具,负责具体的代码编写、重构和清理。虽然 Claude 有时会把代码弄乱,但它在重构和技术债清理方面的能力同样出色。
  2. GPT-5:主要用于高层级的规划审查。对于大型任务,Peter 会先写好计划文件,让 GPT-5 进行评审,利用其逻辑严密性来把关。
  3. VS Code / Cursor:VS Code 现在更多扮演“代码查看器”的角色,而 Cursor 或 GPT-5 则偶尔用于代码审查。
  4. Gemini:尽管 Gemini 有其优势,但 Peter 认为其编辑工具过于混乱,因此使用频率正在降低。

此外,Peter 放弃了复杂的 Git 工作流(如 worktree),直接在 main 分支上操作。他认为只要谨慎选择工作区域,避免不同任务间的交叉污染,直接在主分支工作能显著提高速度。这种“极简主义”不仅体现在软件上,也体现在他处理代码的方式上。

主题 2:规划、上下文管理与 AI 引导策略

在 AI 辅助开发中,上下文(Context)是最宝贵的资源。Peter 总结了一套精细的上下文管理方法。首先,他在终端状态栏中显示当前的主题和 Session ID。这样做的好处是,当需要切换账号或重启会话时,可以快速找回之前的状态。

对于任务处理,他区分了“小任务”和“大任务”:

  • 小任务:直接通过简短的提示词(Prompts)让 AI 执行。
  • 大任务:进入“规划模式”(Plan mode)。他会先在文件中写下详细计划,让 GPT-5 评审并迭代,然后再交给 Claude 执行。

Peter 发现,AI 代理在处理他那些“语无伦次”的头脑风暴想法时表现惊人。他通常会根据任务的“波及范围”(Blast Radius)来决定运行多少个 AI 代理:

  • 重构或简单任务:运行 1-2 个代理。
  • 清理、测试或 UI 工作:4 个代理通常是“甜点位”(Sweet Spot)。

他特别强调了**人类引导(Steering)**的必要性。他不支持将任务完全交给后台运行的自主代理,因为 AI 很容易在执行过程中产生偏移(Drifting)。通过实时观察 AI 的思考过程和输出,开发者可以及时介入并纠正方向。这种“人机协作”的模式比纯粹的自动化更可靠。

为了进一步提升效率,Peter 建立了一套自定义基础设施,包括管理页面和 CLI 工具。这些工具不仅方便他自己使用,也让 AI 代理能够更轻松地调用。他在 CLAUDE.md 文件中记录关键的 CLI 指令(如日志查看、数据库连接示例),确保 AI 代理在闭环操作时能快速加载环境变量并正确执行任务,从而避免了繁琐的手动配置。

主题 3:测试策略与“少即是多”的哲学

在测试方面,Peter 拥有一套务实的策略。他认为自动生成的测试通常质量一般,但如果要求 AI 在编写代码的同一个上下文中编写测试,效果会好得多。这是因为 AI 此时对代码的逻辑和潜在边界情况了解最深。他强调“不要浪费上下文”,在代码完成的瞬间立即要求 AI 编写针对性的测试,是捕捉 Bug 的最高效时机。

Peter 对工具的选择遵循严格的“减法”。他甚至移除了最后一个 MCP(Model Context Protocol) 插件。原因在于,他发现当 Claude 可以直接通过读取代码来获取信息时,它有时会自作主张地启动 Playwright 等重型工具,这不仅速度慢,还会污染上下文。

他推崇那些具有优秀 CLI 支持的服务,例如:

  • Vercel(部署与托管)
  • psql(数据库操作)
  • gh(GitHub 操作)
  • Axiom(日志管理)

通过在 CLAUDE.md 中简单注明“Logs: axiom or vercel cli”,AI 代理就能自主处理日志查询。这种基于 CLI 的集成比复杂的图形化插件更高效、更透明。

在与其他工具的对比中,Peter 指出 Codex 无法进行有效的搜索(通常直接 Google 最佳实践比依赖模型内置知识更好),而 Cursor/GPT-5 在处理任务时往往不透明,不分享思考过程,导致开发者难以引导。GPT-5 虽然强大,但过于“字面意思”,需要非常精确的提示词,不如 Claude 作为一个开发代理那样灵活。

最后,Peter 总结道,尽管 AI 模型的费率限制和成本在增加,但这种高效的工作流所带来的产出远超其投入。通过构建自定义工具、优化上下文管理以及坚持人类引导,他实现了一种前所未有的开发节奏。


问答

问:为什么作者放弃 VS Code 终端而选择 Ghostty? 答:因为 VS Code 终端在处理大量文本粘贴时不够稳定,经常出现冻结现象。Ghostty 性能更强、更稳定,适合高强度的 AI CLI 操作。

问:在管理大型开发任务时,作者的推荐流程是什么? 答:先进入“规划模式”,将想法写成文件,由 GPT-5 进行评审和迭代,确认无误后再由 Claude Code 执行具体编码。

问:为什么作者强调要在“同一个上下文”中写测试? 答:因为此时 AI 对当前代码逻辑的理解最深刻,编写的测试最能切中要害,且不会因为切换上下文而丢失关键细节。

问:作者如何看待“后台自主运行”的 AI 代理? 答:作者持保留态度。他认为 AI 代理容易产生偏移(Drifting),需要人类开发者通过实时观察和引导(Steering)来确保其不偏离目标。

问:如何让 AI 代理更高效地使用外部服务(如数据库、日志)? 答:选择提供强大 CLI 工具的服务,并在 CLAUDE.md 等配置文件中提供简单的使用示例和环境变量加载方法,让 AI 能在命令行中闭环完成任务。