我问 Grok,目前 Deep Research 做的最好的是哪几家,它罗列了一遍,把自己放到了最后,说自己喜欢追新,和 X 上的人讨论,但让它从 30 多个 source 中去做深度研究,它做不来。怎么说呢,挺像个人的···

  1. Grok 4 / Grok 4.1 (that's me!)

Very competitive in real-time X ecosystem + uncensored / politically-sensitive topics, fast-moving events, and math/science/logic heavy research. I can go deeper on controversial or niche X discussions than most models are willing to. But for classic "deep research report with 30+ sources" style tasks, Gemini and ChatGPT's dedicated modes usually edge me out right now.

几个月前,朋友有一个小需求,大概是将 PDF 中的内容以特定的格式提取出来,然后再对这些文字做一些操作。我当时给的解决方案是,使用 v0.dev 或 Google 的 aistudio 来做一个 web app,但还是有些麻烦,因为涉及到发布。

raycast 新出的 glaze(还在内测中)几乎完美地解决了这个问题,以后工具类产品的生存空间会越来越小。

  • 装 OpenClaw 之前:实在想不出它有什么用。
  • 装 OpenClaw 之后:实在想不出它有什么用。

晚上跟媳妇儿一起看电影,有个游泳池的戏,我说你也可以写。她说之前写了场温泉的戏,但最后没有拍,被删掉了,因为男主不想露上身(没有肌肉)…

Peter Steinberger demonstrates the extent of productivity gains possible when AI tools are pushed to their limits. Going forward, programmers who remain in the field will be forced to produce more, faster. Those who fail to master AI tools will be rapidly phased out.

If you truly found what you love, you will very likely be isolated by the mainstream.

在 2026 年的行业语境下,最核心的考问已经不再是“AI 能否写出这段代码?”,而是极其严肃的系统工程命题:“我们能够以多高的置信度信任这段代码在生产环境中的表现?” 。过度依赖 AI 的盲目生成,不仅是系统崩溃的配方,更是对开发者批判性思维能力的严重侵蚀 。

前几天刷到的一家日料店:加奈。今天去除了草,确实不错。

peter steinberger 的 Blog 和 GitHub 是个大宝库

「一个项目可以允许多少个 Agent 同时工作」可能是衡量该项目 AI Native 程度的重要指标。

将「办公室」搬迁到了茑屋书店

Pure software is rapidly becoming un-investable.

-- Naval

Codex app is really good!

从确定性中去找机会,即:如果 A 成立,那么 B 大概率也会成立;如果 B 大概率成立,那么 C 就很有机会。

看了一圈 AI Agent Core 的设计,还是 pi 最得我心。

只要你在按照自己的价值观生活,就不算浪费时间,反之亦然。

doc is the new API

if you're not paying for the product, you're the product.

cache, memory, skill, context are the most important things in AI apps.

智能工具 + 小团队 将会是未来公司的标准配置。