Limboy

Can You Hear The Music - Ludwig Goransson

海盗电台 The Boat That Rocked

1966年,大西洋北海上漂浮着的一艘船,是深受不列颠听众喜爱的摇滚电台的大本营。因吸毒而退学的 Carl(汤姆·斯图里奇 Tom Sturridge 饰)被母亲 Charlotte(艾玛·汤普森 Em...

这世界那么多人 - 莫文蔚

然后怎样 - 陈奕迅

摔跤吧!爸爸 Dangal

马哈维亚(阿米尔·汗 Aamir Khan 饰)曾经是一名前途无量的摔跤运动员,在放弃了职业生涯后,他最大的遗憾就是没有能够替国家赢得金牌。马哈维亚将这份希望寄托在了尚未出生的儿子身上,哪知道妻子接连...

走马 - 陈粒

迷藏 - 刘昊霖

爱你就像爱生命 - 房东的猫

日落大道 - 梁博

因为疲于回应「最近在做什么」,Sivers 做了这个 Now 页面,里面罗列了目前他在做的事(比如最近他在学 Python)。有了这个页面就可以回应「最近在做什么」这个问题了,同时也可以很礼貌地拒绝一些请求(不是针对个人,而是最近确实在忙这些事,抽不出时间)。我觉得这个想法很好,也做了一个类似的页面,不过叫 Doing,同时提供了历史记录,方便回顾。这个页面还有一个很好的用处:提醒你好好想想最近在做什么。我觉得你也应该有一个这样的页面。

Paul Stamatiou

A blog about technology, design and startups from a designer who codes.

在逛 Hacker News 时无意中发现的一个博客,点进来后,就立刻被吸引了。他目前是 Rewind 的首席设计师,同时也喜欢 Coding,这个博客就是它自己设计和编码的(基于 Jekyll),看着很舒服。从 2005 年开始写博客,到现在已经有 1200 多篇文章。摄影页面效果非常棒,沉浸感很强,比如在阿姆斯特丹的摄影集。还有一个专门的页面罗列了他在使用的工具,软件、硬件都有,咖啡壶、刀具、杯子、椅子等等,非常齐全。写起长文来也毫不含糊,比如这篇。没事翻翻他的文章或看看相册,应该会有所收获。

Tearing down the Rewind app

This ML-powered app records your entire screen, yet “doesn’t tax system resources.” How did they do it?

Rewind 是最近比较火的一款 AI 应用,它在 Mac 本地运行,可以记录屏幕上的文字和语音信息,可以通过搜索关键字来找到这些信息(只要这些文字曾经出现在 App 中,无论是网页还是聊天),可以看下这个 demo

它很好的解决了「好像在什么地方看到过,但记不起来了」这个场景。听着挺 Magic 的,这篇文章就对这项技术进行了逆向分析。它的主要工作流程是每隔 2 秒,对最 Top 的 window 截屏,利用 OCR 工具提取文字信息,存储到 SQLite,然后再将这些图片合并为一个 H.264 的视频文件(减少体积)。主要用到了以下工具:

  • Use accessibility APIs to identify the frontmost window.
  • Store the timestamps to a SQLite database in the user’s Library folder.
  • Use ScreenCaptureKit to hide disallowed windows, including private browser windows and a user-defined exclusion list.
  • OCR the screenshot on-device using Apple’s Vision framework, the same pipeline that powers Live Text.
  • Compress the screenshot sequence to an H.264 video with FFmpeg.

还会结合 OpenAI 的 Whisper 工具来将语音转为文字。这些工具单独拿出来,其实都没有太「高级」,但能想到这个 idea,并且将它们合理地运用并「组装」成一款优秀的产品,则更为不易。这可能也是 AI 时代,我们应该具备的品质:更创新,更综合。

Good Morning Afternoon - Dreamroot

Interstellar - Imperial Orchestra