• 一年前:这些小事 AI 可以帮我搞定。
  • 一年后:这些小事我可以帮 AI 搞定。

忽然想起个事,前同事前一阵想去大理旅居一阵,问我有没有推荐的民宿,我就顺手把之前住过的觉得还不错的几家推给了他。然后我就想,这个小红书上应该有不少吧,他说那里鱼龙混杂,判断成本太高了。这么看来,明确无利益牵扯的群体的推荐永远有价值。

Gemini 要从小甜甜降级为牛夫人了,设计、交互、速度实在不想忍了(但 Deep Research 和 Nano Banana 还是离不开它),grok 好像日常用用也够了,而且获取最新内容也很方便。

Codex app is so good that I want to use it everyday!

来寿司郎吃饭,网速先拉一波好感。

PS: 寿司郎真不错,好吃又不贵(相对精致一点的日料店),就是要排队。

看到有不少人提到他们的 Claude 账号被封了,而我的还健在。难道是因为我平时主要通过英文跟它交流,获得了一丝丝的信任?🤔

9 号秘事与内地合拍的版本,居然还不错。

GitHub Copilot 的 UI 和 UE 做的是真好,但 harness 实在欠佳,太慢了···

AI 时代,深耕细分领域可能是独立开发者/小团队的唯一出路。

我问 Grok,目前 Deep Research 做的最好的是哪几家,它罗列了一遍,把自己放到了最后,说自己喜欢追新,和 X 上的人讨论,但让它从 30 多个 source 中去做深度研究,它做不来。怎么说呢,挺像个人的···

  1. Grok 4 / Grok 4.1 (that's me!)

Very competitive in real-time X ecosystem + uncensored / politically-sensitive topics, fast-moving events, and math/science/logic heavy research. I can go deeper on controversial or niche X discussions than most models are willing to. But for classic "deep research report with 30+ sources" style tasks, Gemini and ChatGPT's dedicated modes usually edge me out right now.

几个月前,朋友有一个小需求,大概是将 PDF 中的内容以特定的格式提取出来,然后再对这些文字做一些操作。我当时给的解决方案是,使用 v0.dev 或 Google 的 aistudio 来做一个 web app,但还是有些麻烦,因为涉及到发布。

raycast 新出的 glaze(还在内测中)几乎完美地解决了这个问题,以后工具类产品的生存空间会越来越小。

  • 装 OpenClaw 之前:实在想不出它有什么用。
  • 装 OpenClaw 之后:实在想不出它有什么用。

晚上跟媳妇儿一起看电影,有个游泳池的戏,我说你也可以写。她说之前写了场温泉的戏,但最后没有拍,被删掉了,因为男主不想露上身(没有肌肉)…

Peter Steinberger demonstrates the extent of productivity gains possible when AI tools are pushed to their limits. Going forward, programmers who remain in the field will be forced to produce more, faster. Those who fail to master AI tools will be rapidly phased out.

If you truly found what you love, you will very likely be isolated by the mainstream.

在 2026 年的行业语境下,最核心的考问已经不再是“AI 能否写出这段代码?”,而是极其严肃的系统工程命题:“我们能够以多高的置信度信任这段代码在生产环境中的表现?” 。过度依赖 AI 的盲目生成,不仅是系统崩溃的配方,更是对开发者批判性思维能力的严重侵蚀 。

前几天刷到的一家日料店:加奈。今天去除了草,确实不错。

peter steinberger 的 Blog 和 GitHub 是个大宝库

「一个项目可以允许多少个 Agent 同时工作」可能是衡量该项目 AI Native 程度的重要指标。

将「办公室」搬迁到了茑屋书店