Limboy
How we built our multi-agent research system

On the the engineering challenges and lessons learned from building Claude's Research system

Anthropic 分享了他们构建多智能体研究系统的经验,该系统利用多个协同工作的 AI 智能体来更有效地探索复杂主题。该系统的核心是一个“编排者-工作者”(Orchestrator-Worker)架构,由一个“领导者”(Lead Researcher)智能体负责规划和分解任务,并将子任务分配给多个并行的“子智能体”(Subagents)。这种方法的主要优势在于能够并行处理信息,有效管理大型上下文窗口,从而处理超出单个模型能力范围的复杂、广泛的查询。

更细致的拆解可以参见:https://g.co/gemini/share/c26b508c052e

Contextual Retrieval in AI Systems

Explore how Anthropic enhances AI systems through advanced contextual retrieval methods. Learn about our approach to improving information access and relevance in large language models.

这篇文章描述了通过 Contextual Retrieval 来提升检索增强生成(RAG)系统检索信息的能力。传统的 RAG 系统在处理文档时,会将其拆分为小文本块,这个过程中常常会丢失关键的上下文信息,导致检索失败。情境检索通过在每个文本块前添加由大型语言模型(如 Claude)生成的、概括其在文档中上下文的简短说明,来解决这个问题。

拆解后的内容可以见:https://gemini.google.com/share/d53247d80b86

Eleven Music is Here | ElevenLabs

Studio-grade music generated with natural language prompts in any style and for countless uses

Holy moly, this is good!

了不起的挑战

《了不起的挑战》引进自韩国MBC电视台真人秀《无限挑战》,由韩国MBC电视台、灿星制作和央视创造三方联合研发制作。在原先节目以综艺形态为主的基础上,进行真人秀模式的全新研发。节目将深入到国内多个行业,...

这个综艺有点超出了我对综艺的认知,硬核又好笑。

One thing.

Minimalistic focus app for macOS that you'll actually use

这个确实挺接近我理想的 Focus App,不需要强制设置干活多久,休息多久,同时还可以记录 session 的一些 note

Google Pixel 10 | Soon

8.20.25 Ask more of your phone. Learn more and sign up for #MadeByGoogle updates: http://goo.gle/454fjPU ___ Follow us on social: Google Pixel Instagram: https://www.instagram.com/googlepixel Google Pixel TikTok: https://www.tiktok.com/@googlepixel Google Pixel Threads: https://www.threads.net/@googlepixel Made by Google Instagram: https://www.instagram.com/madebygoogle Made by Google X: https://twitter.com/madebygoogle Made by Google Facebook: https://www.facebook.com/madebygoogle Team Pixel Instagram: https://www.instagram.com/teampixel

Well played, Google, well played.

在小红书上发现了一个可爱的记录孩子画画的妈妈

GitHub - nanobrowser/nanobrowser: Open-Source Chrome extension for AI-powered web automation. Run multi-agent workflows using your own LLM API key. Alternative to OpenAI Operator.

Open-Source Chrome extension for AI-powered web automation. Run multi-agent workflows using your own LLM API key. Alternative to OpenAI Operator. - nanobrowser/nanobrowser

一个通过 Chat 来操控浏览器的插件,特定场景下还挺方便的。

It must be worth it even if it doesn't work

The way to work without regrets is to pursue projects that'll have been worth your time even if they don't pan out. Projects that'll tickle your curiosity, flex your competency, and teach you something new regardless of where they ultimately end up. Projects that leave you better off, as a person, despite not being a commercial or crit...

选择那些即使最终未能成功,也能让你觉得投入的时间是值得的项目。这样的项目应该能够激发你的好奇心,锻炼你的能力,并让你学到新东西,无论其商业或评论结果如何。即使它们没有取得预期的成功,你作为一个人也会变得更好,从而避免了浪费时间的遗憾。

Screen Sizes

A complete guide for Apple displays

这个工具太棒了,跟苹果设备相关的尺寸几乎都包含了,从设备,到 icon,甚至连 widget 的 size 也有,还很贴心地敷上了每个设备的发售日期。

GitHub - funstory-ai/BabelDOC: Yet Another Document Translator

Yet Another Document Translator. Contribute to funstory-ai/BabelDOC development by creating an account on GitHub.

原来沉浸式翻译的 BabelDoc 是开源的,太棒了。看了下实现思路,也是通过 PyMuPDF 来提取页面元素,再结合 nougat 和一些 post rendering 来做文档解析和视觉结构识别。

ここは絶対ハズせない!!大阪が誇る極みうどん職人が夢中になってこだわり抜いた衝撃の一杯丨Best Udon in Osaka

【き田たけうどん】キダタケ ~ちく玉天ぶっかけ~〈800円〉 ~鶏かやくご飯~〈200円〉 地図 https://goo.gl/maps/sLLHth5ZknGhPdsXA 住所 大阪府大阪市浪速区難波中2-4-17 うどん3玉にご飯無料!!常識破りのとっておき特盛うどん店に密着丨Udon Noodles in Osaka https://youtu.be/rJCbTGVWq_E 精密機械の高速丼手さばき!!嵐のような注文ラッシュを華麗に回す手練のうどんそば職人| Japanese Noodles Udon & Soba https://youtu.be/O1b58gprGgM かつ丼!!肉そば!!17歳で料理人生を決意した生粋の蕎麦うどん職人に密着丨SOBA Noodles in Osaka https://youtu.be/GttXasb2EOw うどんそば 関西 Udonsoba https://www.youtube.com/channel/UCsyzqlcYZJUdAV2D9DXjp6g #うどん #Udon #우동

好羡慕视频中两位老人的状态,非常好的诠释了 ikigai 文化。

GitHub Spark in public preview for Copilot Pro+ subscribers - GitHub Changelog

Stuck between idea and implementation? Spending weeks on mock ups or docs that never ship? GitHub Spark takes you from idea to deployed app in minutes. Build and ship full-stack…

Github 也推出了通过自然语言构建 Web App 的服务: Spark,Google 也差不多在同一时间放出了 Opal(目前还是 Beta,仅对 US 开放),仿佛是受到了 Lovable 的刺激,这个市场一下子就被激活了。我之前 v0 用的比较多,用来迭代一些小的 idea 很方便。

这类需求其实蛮多的,我生活中就有朋友经常会有一些有行业特性的小需求,没有专门的 App 可以解决,自己手动去解决这些需求又很费时间,这类基于自然语言的 Web App Builder 正好可以代劳。

Cloudflare Tunnel · Cloudflare Zero Trust docs

Cloudflare Tunnel provides you with a secure way to connect your resources to Cloudflare without a publicly routable IP address. With Tunnel, you do not send traffic to an external IP — instead, a lightweight daemon in your infrastructure (cloudflared) creates outbound-only connections to Cloudflare's global network. Cloudflare Tunnel can connect HTTP web servers, SSH servers, remote desktops, and other protocols safely to Cloudflare. This way, your origins can serve traffic through Cloudflare without being vulnerable to attacks that bypass Cloudflare.

才了解到 Cloudflare 提供了 Tunnel 服务,买一台 Mac Mini 放家里,就是一台实打实的服务器了。

大致的原理是:它会在你的服务器和 Cloudflare 全球网络之间建立一条私密、加密的地下通道。所有访问你的服务的请求都会先到达 Cloudflare,然后通过这条安全的通道转发到你的本地服务器。你要做的就是在自己的服务器上运行 cloudflared 这个命令。

Jack Dorsey 的 Weekend Project:一个离线的基于蓝牙的聊天室。安装包只有 2 MB!

大致体验了下,产品很简洁,适合聚集在特定场所的陌生人聊天,比如飞机上、演唱会等。

有了 Coding Agent 后,一些想法实现起来会方便很多。

Build your own React

We are going to rewrite React from scratch. Step by step. Following the architecture from the real React code but without all the…

太喜欢这个交互模式了,其本质上是一种「渐进式叙事」结合「交互式浏览」的阅读体验。右边的内容是主线,左边的代码是辅线,用于对主线中提到的知识点、概念做进一步补充。

再做一下延展,这个模式用来看小说也未尝不可,右侧是小说内容,左侧可以是对应的画或相关的知识点、人物关系等等。

PS:这个展示模式在移动端居然也可以有不错的适配(将左右结构变为上下结构)。

Convex | The reactive database for app developers

Convex is the open-source reactive database for web and mobile app developers. Everything you need to build your full-stack project.

这个类 Firebase 的服务看着挺不错的,别的先不说,网页看着就很舒服。向 Gemini 大致了解下,还是挺值得信赖的:


值得信賴的跡象:

  • 雄厚的資金和知名投資者: Convex 獲得了包括 Andreessen Horowitz (a16z) 和 Netlify 在內的頂級創投公司的投資。這不僅代表了資本市場對其技術和商業模式的認可,也意味著公司有更充足的資源進行長期發展、維護和安全投入,降低了突然倒閉或服務中斷的風險。
  • 開源透明: 其後端是開源的,這意味著任何人都可以審查其程式碼。這種透明度有助於社群發現並報告潛在的安全漏洞,增加了平台的可靠性。
  • 活躍的開發者社群: 有數千名開發者和一些公司正在使用其平台。在 Hacker News 和 Twitter 等開發者社群中,可以看到許多關於其開發體驗的正面評價。一個活躍且正向的社群通常是服務健康發展的良好指標。
  • 經驗豐富的團隊: 公司的創辦團隊擁有相關的技術背景和創業經驗。

安全可靠性的具體措施:

  • 重要的合規認證: 這是評估安全性的最有力證據。Convex 官方網站明確指出其服務符合以下標準:
    • SOC 2 Type II Compliant: 這是衡量軟體服務安全性的黃金標準之一,代表其系統和組織控制經過了獨立第三方的嚴格審計,涵蓋安全性、可用性、處理完整性、保密性和隱私性。
    • HIPAA Compliant: 這意味著他們符合美國《健康保險流通與責任法案》的嚴格要求,可以處理敏感的健康資訊。
    • GDPR Verified: 符合歐盟的《通用資料保護規範》,保障用戶的隱私權。
  • 架構設計: 平台在設計上就考慮了數據的一致性和可靠性,例如預設的交易功能可以避免並發操作時的數據錯誤。
  • 提供自託管選項 (Self-Hosting): 對於有最高安全要求或特定合規需求的用戶,Convex 提供了自託管的選項。這意味著您可以將整個後端部署在您自己的基礎設施上,從而完全掌控您的數據,不受第三方服務的限制。
GitHub - tiagorangel1/cap: Cap is a lightweight, modern open-source CAPTCHA alternative using SHA-256 proof-of-work

Cap is a lightweight, modern open-source CAPTCHA alternative using SHA-256 proof-of-work - tiagorangel1/cap

这个项目采用了一种现代且轻量级的 CAPTCHA(验证码)实现方式,它不依赖于传统的图像识别或复杂的谜题,而是使用“工作量证明”(Proof-of-Work, PoW)机制,特别是 SHA-256 哈希算法。

核心思想:它不要求用户去识别扭曲的文字或点击图片中的特定物体。而是让用户的设备(浏览器)在后台完成一个小的计算任务,以证明访问者是真实的人类用户,而不是一个自动化程序(机器人)。这个计算任务对普通用户的设备来说非常轻松,通常在几秒钟内就能完成,但对于想要进行大规模攻击的机器人来说,累计的计算成本会变得非常高昂,从而达到阻止其滥用行为的目的。

我的建议是:对于有类似需求的场景,可以先用它来顶一下(毕竟体验友好、部署简单),等被攻击时,再切换到更复杂的验证码解决方案。

Meet Dia – the AI Browser Where You Can Chat with Your Tabs

Dia is the AI browser from The Browser Company. Chat with your tabs, write in your own voice, learn and plan faster, shop, and more — all with privacy that you control.

Dia Browser 的页面设计得太棒了,用 4 个 Dia is for xxx,结合视频演示,告诉你为什么你应该使用 Dia。

Vibe code is legacy code

Updates and articles from the Val Town team

完全同意文章作者的观点:将 Vibe Coding 比作给孩子一张信用卡,初期会带来极大的满足感,但最终会面临无法偿还的“债务”——即无法理解和维护的代码。编程的本质是“理论构建”,而非简单地生成代码行。在 AI 时代,开发者仍需保持对代码的理解和控制,像对待一个“过度热情但爱胡说八道的初级实习生”一样对待AI。

Vibe Coding 适合构建一次性工具和原型,对于需要持续维护(尤其是有较高复杂度)的项目,一定要谨慎 Vibe。

GitHub - Finb/Bark: Bark is an iOS App which allows you to push custom notifications to your iPhone

Bark is an iOS App which allows you to push custom notifications to your iPhone - Finb/Bark

之前一直用 Telegram 来做自定义推送,这个工具看起来更简单、直观,可定制程度也更高。下次再有自定义推送的需求时用一下试试。

How Long Contexts Fail

Taking care of your context is the key to building successful agents. Just because there’s a 1 million token context window doesn’t mean you should fill it.

本文探讨了为什么更长的上下文(Context)并不总能带来更好的 AI 模型响应,反而可能以四种令人惊讶的方式导致代理和应用程序失败:上下文中毒(Context Poisoning)、上下文干扰(Context Distraction)、上下文混淆(Context Confusion)和上下文冲突(Context Clash)。当模型在上下文中遇到错误信息、因过长的历史记录而分心、被无关信息误导或处理相互矛盾的数据时,其性能就会下降。因此,仅仅扩大上下文窗口并不能解决所有问题,反而会为复杂的代理工作流程带来新的挑战。

Flexoki

An inky color scheme for prose and code.

这个配色看着真舒服。

PS:作者是 obsidian 的 CEO。

Linear Docs

This guide is intended to give you an overview of Linear's features, discover their flexibility, and provide tips for how to use Linear to improve the speed, value, and joy of your work.

linear 的文档看着真舒服。

AI代理的上下文工程:构建Manus的经验教训

这篇文章分享了Manus通过我们自己的"SGD"所达到的局部最优解。如果你正在构建自己的AI代理,我们希望这些原则能帮助你更快地收敛。

本文是 Manus 团队关于构建 AI 代理(Agent)的经验总结,核心观点是“上下文工程(Context Engineering)”比模型微调更适合快速迭代的产品。文章详细阐述了在构建 Manus 过程中学到的几大关键原则,包括:围绕 KV 缓存进行设计以优化延迟和成本、通过掩蔽(Masking)而非移除来管理工具、将文件系统作为无限的外部上下文、通过复述任务来操控模型注意力、保留错误以帮助模型学习,以及避免少样本示例带来的思维固化。这些实践经验旨在帮助其他开发者更高效地构建稳定、可扩展的 AI 代理。

「上下文工程」会是构建 AI Agent 过程中绕不过去又极具挑战的一环,挺适合想要投身于 AI 领域的程序员。

Prompt Engineering Guide | Prompt Engineering Guide

A Comprehensive Overview of Prompt Engineering

非常全面的提示工程指南,从基础入门到高级技巧,应有尽有,有空可以翻一翻。

Figma (@figma)

Dev Mode: → Interactive Inspection (Dev Mode) → Annotations (MCP server) → Local Images (MCP server) → Design system rules (MCP server)

Figma 开放了 MCP 后,想象空间一下打开了,从设计到落地,变得更加丝滑。

这个 Rich Text Editor 看着挺不错,界面干净,功能强大,基于 ProseMirror,也有在持续更新,不过看 Star 数量,好像用的人还不太多。另一个更常用的是 Tiptap

Jay Dwivedi (@JayDwivedi_)

Here’s our secret to creating stunning gradients 🌆

Figma's Layer blur is underrated.

Olivia Moore (@omooretweets)

Sick of everyone else having a selfie with Jensen? Introducing Jensen Buddy AI 🪄 Upload a photo and get a realistic-looking pic of yourself and Jensen, leather jacket and all Link to try 👇 (powered by @fal and @bfl_ml)

这个想法蛮好玩的,上传自己的照片就能生成跟名人的合照,这个 case 里是 Jenson。