
My AI Workflow for Understanding Any Codebase | Peter Steinberger
A quick tip on how I use repo2txt and Google AI Studio to understand new codebases. Gemini's 1M token context window is perfect for asking questions about code.
steipete.me
本文详细介绍了开发者 Peter Steinberger 如何利用大语言模型(尤其是 Google Gemini)的超长上下文特性,构建一套高效的代码库理解与开发工作流。核心思路是将复杂的 GitHub 仓库转化为结构化的 Markdown 文本,并利用 Gemini 的海量上下文窗口进行深度分析。
工作流分为几个关键阶段:首先,通过 repo2txt 工具将代码库转换为文本,剔除无关的二进制文件和测试代码,以保持上下文的纯净。其次,利用 Google AI Studio 强大的处理能力,对代码进行架构分析和逻辑溯源。在开发新项目时,作者提出了一套“从创意到软件设计文档(SDD)”的严谨流程,其中最亮眼的是“双上下文技术(Two-Context Technique)”:一个窗口负责编写和维护规格说明,另一个窗口负责扮演“挑刺者”角色,通过 3-5 轮的对抗性迭代,使设计文档达到无懈可击的程度。
在实现阶段,作者推荐将完善后的 SDD 作为 spec.md 存入仓库,并调用 Claude Code 等代理工具进行自动化构建。这种方法将 AI 的角色从简单的辅助编码提升到了系统级的设计与执行。此外,作者还分享了应对 AI “上下文失忆”的策略(如分块生成和手动维护主文档),并探讨了“代码即规格”的理念,即通过旧代码直接生成新架构的设计文档。该工作流不仅提升了理解现有代码的效率,也极大地缩短了从想法到产品的落地周期。
