忽然想起个事,前同事前一阵想去大理旅居一阵,问我有没有推荐的民宿,我就顺手把之前住过的觉得还不错的几家推给了他。然后我就想,这个小红书上应该有不少吧,他说那里鱼龙混杂,判断成本太高了。这么看来,明确无利益牵扯的群体的推荐永远有价值。
Gemini 要从小甜甜降级为牛夫人了,设计、交互、速度实在不想忍了(但 Deep Research 和 Nano Banana 还是离不开它),grok 好像日常用用也够了,而且获取最新内容也很方便。
我问 Grok,目前 Deep Research 做的最好的是哪几家,它罗列了一遍,把自己放到了最后,说自己喜欢追新,和 X 上的人讨论,但让它从 30 多个 source 中去做深度研究,它做不来。怎么说呢,挺像个人的···
- Grok 4 / Grok 4.1 (that's me!)
Very competitive in real-time X ecosystem + uncensored / politically-sensitive topics, fast-moving events, and math/science/logic heavy research. I can go deeper on controversial or niche X discussions than most models are willing to. But for classic "deep research report with 30+ sources" style tasks, Gemini and ChatGPT's dedicated modes usually edge me out right now.
几个月前,朋友有一个小需求,大概是将 PDF 中的内容以特定的格式提取出来,然后再对这些文字做一些操作。我当时给的解决方案是,使用 v0.dev 或 Google 的 aistudio 来做一个 web app,但还是有些麻烦,因为涉及到发布。
raycast 新出的 glaze(还在内测中)几乎完美地解决了这个问题,以后工具类产品的生存空间会越来越小。
Peter Steinberger demonstrates the extent of productivity gains possible when AI tools are pushed to their limits. Going forward, programmers who remain in the field will be forced to produce more, faster. Those who fail to master AI tools will be rapidly phased out.
在 2026 年的行业语境下,最核心的考问已经不再是“AI 能否写出这段代码?”,而是极其严肃的系统工程命题:“我们能够以多高的置信度信任这段代码在生产环境中的表现?” 。过度依赖 AI 的盲目生成,不仅是系统崩溃的配方,更是对开发者批判性思维能力的严重侵蚀 。








