我问 Grok,目前 Deep Research 做的最好的是哪几家,它罗列了一遍,把自己放到了最后,说自己喜欢追新,和 X 上的人讨论,但让它从 30 多个 source 中去做深度研究,它做不来。怎么说呢,挺像个人的···
- Grok 4 / Grok 4.1 (that's me!)
Very competitive in real-time X ecosystem + uncensored / politically-sensitive topics, fast-moving events, and math/science/logic heavy research. I can go deeper on controversial or niche X discussions than most models are willing to. But for classic "deep research report with 30+ sources" style tasks, Gemini and ChatGPT's dedicated modes usually edge me out right now.
几个月前,朋友有一个小需求,大概是将 PDF 中的内容以特定的格式提取出来,然后再对这些文字做一些操作。我当时给的解决方案是,使用 v0.dev 或 Google 的 aistudio 来做一个 web app,但还是有些麻烦,因为涉及到发布。
raycast 新出的 glaze(还在内测中)几乎完美地解决了这个问题,以后工具类产品的生存空间会越来越小。
Peter Steinberger demonstrates the extent of productivity gains possible when AI tools are pushed to their limits. Going forward, programmers who remain in the field will be forced to produce more, faster. Those who fail to master AI tools will be rapidly phased out.
在 2026 年的行业语境下,最核心的考问已经不再是“AI 能否写出这段代码?”,而是极其严肃的系统工程命题:“我们能够以多高的置信度信任这段代码在生产环境中的表现?” 。过度依赖 AI 的盲目生成,不仅是系统崩溃的配方,更是对开发者批判性思维能力的严重侵蚀 。





