• ChatGPT Prompt Engineering for Developers

    吴恩达与 OpenAI 官方联合出品的 ChatGPT Prompt。只是看视频的话,B站有搬运。虽然 title 是 for Developers,但代码相对简单,可读性很高,即使对编程不太了解,也可以基本看明白。

    视频不长,一共一个半小时左右,描述了如何从不同维度,结合合适的 prompt 去充分发挥 chatgpt 的能力。比如通过清晰的表达,就可以让 chatgpt 执行以下任务:

    • 将 context 通过特殊标记包起来,然后告诉 chatgpt 去 parse 该标记里的内容
    • 按固定格式给出结果,方便在程序中使用
    • 步骤拆解,比如把一段制作咖啡的文字拆解为清晰的执行步骤。
    • 通过 One Shot(给一个例子),让它汲取这个例子的精髓,之后我们再提问,就可以按照这个例子的风格给出答案。

    除此之外,还可以实现文本总结(比如将客户对产品的 review 压缩成精简的几段话);模型推理(比如根据文本推测客户的情绪,并给出不同的回复内容);文本翻译;文本扩写(可以在内容基本相同的前提下,针对不同人群,写出不同风格的文字);聊天机器人。以前要借助专业领域的机器学习模型才能做的事情,现在通过大语言模型,结合到位的 prompt 就可以完成了,场景更多,还能做的更好。


    PS: 如果觉得视频太长,不方便查找,也可以看下这个中文版的文字总结

  • The Amazing AI Super Tutor for Students and Teachers

    Sal Khan(可汗学院创始人)在这个 TED 视频中分享了可汗学院使用 GPT-4 辅助学生学习的实践。

    教育领域有一个著名的 2 sigma problem:接受一对一专业辅导的学生的表现比1(个老师)对多(30个学生)的学生会高出两个标准差(分别对应无专业辅导和有专业辅导)。简单来说,学生学不好,问题往往不在学生那里,如果每个学生都能获得专业的一对一辅导,他们的成绩就能得到显著提升。

    借助 GPT-4, 可汗学院让每个学生都有了一个专业的辅导老师,知识渊博、极具耐心又懂得教学。编程卡住时,可以向它求助,它会分析代码,给出提示;数学答案错误,会通过引导式提问,找到你的症结所在;能够跟 AI 一起写小说(你写一半,它写一半,交叉进行);「阅读理解」会向你提问,并引导你找到答案;甚至能代入到某个小说中的角色,然后你直接与这个角色交流。

    经过调教的 GPT-4 也能帮助老师进步,减轻老师负担,比如会告诉老师某个知识点相关的信息,甚至可以给出建议让老师如何来教授某一课程 (比如将学生分组,扮演不同阵营)。

    要让 GPT-4 做到这些,可汗团队花了近 6 个月的时间 tuning、prompt engineering、context completion。Sal Khan 认为 AI 可以给教育带来巨大的积极的影响,让地球上的每个人都能有一个专业的导师。


    大语言模型催生的 AI 变革已经成为趋势,「如何用好 AI 的能力来增强产品的竞争力」是很多创业者都在思考的问题,可汗学院的例子或许提供了一个思路。

  • My product is my garden

    这篇文章的作者将自己的产品比作花园,享受与它的互动,并感受到乐趣。因为是自己的花园,可以按照自己的喜好去规划花园,去选择植物,不用受制于其他人的想法(如投资人)。维护花园的过程会消耗较多的时间和精力,所以需要盈利,作者生活在南非,那里的生活成本比较低,通过自己的产品达到一个普通工程师薪资的收入也不难,有了这份收入就可以持续地打理自己的花园。

    That’s what I want from my products. I want to putter about, feel connected to the process, and have fun doing so. I want to make things that don’t scale. To see people tuck into them and enjoy them as people, not as stats. I’ve done this fairly successfully with JustSketchMe. We have a small, diverse, and amazing community of artists and illustrators making awesome things. I’m trying to build a similar product with Bear Blog. Something niche but valuable. Something I can spend time on because I want to.

    这就是我想从我的产品中得到的。我想在花园里四处闲逛,享受创作的乐趣。我想创作去规模化的产品。看到人们融入其中并享受它们,而不只是统计数据。我已经通过 JustSketchMe 相当成功地完成了这项工作。我们有一个小型的、多样化的、令人惊叹的艺术家和插画家社区,他们制作了很棒的东西。我正在尝试用 Bear Blog 构建一个类似的产品,小众但有价值。

    作为对比,那些外向型的产品更像是花店,可能更注重如何售卖地更多,而忽略了花本身。这是两种不同类型的产品,面向的人群也不太一样,花园是 Something niche but valuable. 没有太大的野心,要占领市场多少份额,或达到一定数额的 MRR(Monthly Recurring Revenue),重点在于主人对花园的用心程度,与花园的用户互动,感受花园带给他们的乐趣。

  • teenage engineering - 音乐设备界的苹果

    用「音乐设备界的苹果」这个 Title 来概括 teenage engineering 这家公司我觉得还蛮贴切的。在设计上非常下功夫,会激发想要买的欲望,即使自己不是目标客户。「我知道这很不理性,但我就是想要」。

    跟 IKEA 一样,teenage engineering 公司总部也在瑞典,但价格就不如 IKEA 亲民了,比如这个最新的便携麦克风售价为 $1199

    除了产品本身,官网也非常有设计感,这种设计感不仅体现在那些大图和字体上,产品的浏览过程也是精心设计,非常有叙事感。一上来先用一张大图和一段精简的描述回答了「是什么」,然后用聚焦在产品本身的视频(顺便吐槽下微软那些华而不实的宣传视频)建立立体的感知,再通过文字和直接的图片(实拍图,而不是电商网站常见的广告图)来回答「为什么」,为什么这款产品值得购买,最后如果还想了解更多,则罗列了更细致的参数。

  • The Only Way to Grow Huge

    我觉得 Sam Altman 提到的这个增长策略,真是简洁又精准。

    All companies that grow really big do so in only one way: people recommend the product or service to other people.

    成长为足够大的公司只有一条路:人们向其他人推荐该产品或服务。

    What this means is that if you want to be a great company some day, you have to eventually build something so good that people will recommend it to their friends--in fact, so good that they want to be the first one to recommend it to their friends for the implied good taste. No growth hack, brilliant marketing idea, or sales team can save you long term if you don't have a sufficiently good product.

    这意味着,如果有一天你想成立一家伟大的公司,你必须打造出好到人们愿意将它推荐给朋友的产品。好到他们想成为第一个推荐它的人,以向他们的朋友暗示良好的品位。如果没有足够好的产品,任何增长技巧、绝妙的营销理念或销售团队都无法带来长期的帮助。

    这是一个三赢的策略:

    • 创作者创造了很棒的产品而自豪
    • 传播者向朋友展示了良好的品味
    • 使用者因为使用好的产品而受益

    当然也会有反例,比如微软当年通过操作系统捆绑 IE6,让 IE6 的覆盖率飙升,直接击垮了 Netscape,但这是在产品有庞大用户基数的前提下,而这个产品,如果缺少「可推荐性」,可能也很难获取足够多的用户。

  • The Inside Story of ChatGPT’s Astonishing Potential

    OpenAI 的 CoFounder Greg Brockman(以下简称 GB) 在 TED 上做的一个分享,展示了 ChatGPT 的几个使用场景,以及一些调校姿势。

    视频中,GB 通过 ChatGPT 的插件功能,只需简单的语言描述:TED会后晚餐推荐,就能得到一份晚餐食谱,并通过 DALL·E 生成图片。要将这份食谱加到购物清单也很方便,借助购物网站的插件就可以了,还可以生成并发送 Tweet(Zapier)。

    通过自然语言指令,可以免去在 App 之间切换进行操作的麻烦,还是挺方便的,这种交互形式也是对已有 GUI 操作的一种补充。

    GB 还展示了 AI check AI 的功能,来加强人工反馈的效率,AI 会写出最终结果是如何通过一步步推理得出来的(Chain of Thoughts),这样就方便知道是在哪一步出错了,方便纠正。

    ChatGPT 既懂人类语言,也懂机器语言(编程语言),所以它也可以执行一些编程任务,比如给一个 CSV 文件,让它以图表的形式给出一些 Insights。

    GB 还举了一个通过 ChatGPT 救了一条狗狗的例子,在第一个兽医搞不定时,将狗狗的血液信息输入给 ChatGPT,后者给出了建议,狗的主人拿着 GPT 给的信息找到了第二个兽医,结果这个信息帮上了忙,狗狗得救了。

    对于 ChatGPT(或类似的 AI),可以把它想象成多个角色的合体:

    • 百科大全(有不懂的可以问它)
    • 灵感大师(思路打不开时可以找它)
    • 助手(有活要干可以找它)
    • 玩伴(一起玩游戏)

    有如此强大的工具,如果不用实在是有点可惜。在 AI 时代,可以不加入到 AI 的生产者行列,但可以成为消费者,让 AI 为生活和工作带来全方位的提升。

  • 一个 GPT-4 的使用技巧(让它向你提问以明确任务细节)

    使用这个技巧,可以让 GPT-4 向你追加提问以明确需求。这些问题通常还挺在点上的。

    我试了一下,确实可以。其技巧就是在提问时,补上这一句:

    你在写之前可以先思考怎么写,有需要我补充信息的地方,把问题列出来,我会回答你的问题。

    其实把 GPT-4 当作一个正常的人去看待就行了,你甚至可以跟Ta先约定好规则,然后按照这个规则来玩游戏(比如「十问知是谁」)。「高效地使用 AI」,或许是 AI 时代的一个重要技能。

  • 从工程师转变为全职创作者的一些建议

    作者之前在 Uber 工作(Engineer Manager),从 Uber 辞职后开始全职写 Newsletter(中间花了不少时间在写书),4个月后,他的 Newsletter 成为 Substack 上技术领域的付费 Top 1。这篇文章是他对从工程师切换为内容创作者的一些建议,整理得比较全。文化上的差异,可能会带来落地上的变化,但基本的商业逻辑是相通的。如果你也是工程师,也有在考虑从公司出来之后做些什么,那么这篇文章应该会给你带来些帮助。

    作者首先提到了观念上的转变,不是把自己看做创作者,而是在经营一份小事业(Small Business)。

    Instead of talking about succeeding as a creator, I'll instead talk about how to succeed as a small business.

    通常有以下几种途径:

    • 成为自由职业者或接外包项目。做的工作跟在公司上班没有太大区别,但少了更多保障。
    • 开创一份自己的事业并雇佣自己。比如提供服务(如咨询服务)或销售自己的产品(如 App、课程等)。
    • 拉投资创业。自己还是有很大的话语权,但需要管理团队,并对投资人负责。
    • 全职投资。在科技公司工作一段时间后,通常会有不错的收入,可以通过投资(如股票)来盈利。

    大多数的创造者都采用了 B2C(或者 C2C) 的模式,将自己的产品卖给目标客户,那么就需要考虑这么几个问题:1) 做什么产品;2) 目标客户是谁;3) 如何售卖给他们。这就需要切换心态,从「创作者」到「经营者」,不仅仅是 build,还要 sell,很考验综合能力。

    调整好心态后,在「如何做」这块作者也给出了一些建议:

    • 准备好足够的积蓄。这样可以有更多的时间去探索,以便找到更适合自己的道路。
    • 构建多个 Side Projects 来更好地了解自己。只有了解了自己的热情和能力圈,才可能做得更好。
    • 对于有潜力的项目可以小额押注,然后根据反馈来决定是否值得后续的投入。
    • 构建护城河(通常是在某个利基市场),这可能需要较长的时间,当护城河足够深时,优势也会很明显。

    作者在文中列举了很多 Business 的部分(可以售卖怎样的产品,通过怎样的途径)和成功案例供参考。One Person Business 虽然很诱人,但也非常难,可能需要很长时间才能 work,在看到那些成功案例的同时,也不要忘了幸存者偏差

  • 为什么成年后交朋友那么难

    这篇文章讨论了为什么成年后结交朋友变得困难。因为随着年龄的增长,「交朋友」这件事不再自然地发生了。当我们还是孩子时,可以就这么走到别人面前,然后很快就能变成朋友。长大后不能再采取这样的策略,需要有意识地去与他人互动,培养友谊,不能只靠运气,被动等待。定期的集体活动或聚餐是很不错的方式,所以最好有一个住的比较近的又能聊得来的小团体(「跟朋友住的近」是一件多么重要又多么幸福的事)。大家可以带朋友一起来玩,然后朋友的朋友就可能互相认识,进而发展出新的友谊。

  • 格斗之王!AI写出来的AI竟然这么强!

    这个视频的作者在 GPT-4 的帮助下,写出了一个能够战胜街霸II Boss 的 AI,而在这之前,作者对「强化学习」几乎一无所知。

    故事是这样的:一开始是 GPT-4 作为主力,写代码,作者拿到代码后运行,并把错误结果告诉 GPT-4,充当了「传声筒」的角色。但 GPT-4 创造出来的 AI 遇到了瓶颈,经过上百万次训练后还是搞不定 Boss,而作者在「传声」的过程中也逐渐开始了解「强化学习」并进行了强化学习。最后结合作者的优化,这个 GPT-4 和作者的「儿子」终于击败了街霸II 的 Boss。

    这个故事或许展示了将来人和 AI 共存的局面,AI 会有它的优势,但也会有局限,它可以成为很好的垫脚石,但要过河还得靠自己。

    如作者所说:「AI不会代替人,但人可以代替人」,如果无法用好 AI,不能快速地学习,在将来会越来越难。

  • 关于 AI 焦虑,Carmack 是这么回复的

    有人私信 Carmack: 随着各类 AI 技术的兴起,自己努力学习编码技术是否还有必要,会不会被 AI 抢了饭碗。

    Carmack 回复说:

    如果能全面掌握「产品技能」,并使用最佳工具完成工作(今天可能是手动编码,之后可能是借助 AI 的帮助),那么你很可能会做得很好。

    对方还是不解,Carmack 又做了进一步的说明:

    软件只是帮助人们完成某些事情的工具 - 许多程序员从未理解过这一点。将注意力集中在交付的价值上,不要过度关注工具的细节。


    建立全局视野,培养综合能力,聚焦交付价值,挖掘 AI 潜力,或许是克服 AI 焦虑的有效方式。

  • Juice,让游戏变得更有趣

    这篇文章围绕「Juice」这个概念展开,比如下面这个按钮就非常地「Juicy」:

    “果汁”是我们对于用户反馈的一个形象称呼。一个“多汁”的游戏元素会在你触碰它时弹跳、晃动、喷溅并发出一些声音。一个“多汁”的游戏感觉生动有趣,对玩家的每个操作都有响应——即使只需要极少的用户输入也能产生大量连锁反应。这让玩家感到自己很强大,掌控着整个世界,并通过每次互动告诉他们如何做,来帮助他们了解游戏规则。”

    比如当马力欧吃到蘑菇时,「+1」的反馈是必要的,告诉玩家获得了一条额外的生命,声音是「果汁」,非必要,但有助于达到一些目的:

    • 强化马力欧确实吃到了蘑菇
    • 吃到蘑菇是一件好事
    • 给用户一个小小的奖励,激励他们收集更多

    除了游戏,Juice 的概念也可以用在 App 或网页开发中,比如在信息量较大的页面中,可以同步展示一些额外的内容帮助理解

    文中提到的一些资料:

  • 蝙蝠侠效应:另一个自我如何赋予你力量

    这篇文章描述了「另一个自我」如何帮助自己从当前的感受(如紧张)走出来,然后用另一种更冷静的状态去面对当前的场景。Beyoncé 说:

    Usually when I hear the chords, when I put on my stilettos, like the moment right before when you’re nervous… then Sasha Fierce appears, and my posture and the way I speak and everything is different

    通常当我听到和弦时,当我穿上细高跟鞋时,就像之前你紧张的那一刻......然后 Sasha Fierce 出现了,我的姿势和我说话的方式都不同了

    在 Beyoncé 的启发下  Adele 也效仿了这个策略,并取得了成功,她说这个策略帮助她在突破性的一年中以最好的状态奔赴每场演出。

    这种「从局内人走出来」的心态,也有助于控制情绪,比如在一项研究中,参与者被要求以两种不同的方式来思考未来的挑战性事件,例如重要的考试。处于「沉浸」状态的小组被要求从内部想象它,就好像他们身处其中。而处于「远离」状态的小组被要求从远处想象它——就好像他们是墙上的一只苍蝇。差异很明显,与沉浸式组相比,那些采取远距离视角的人对事件的焦虑要少得多。

    Hacker News 上也有一些不错的讨论,可以一并查看。

  • Steve Jobs and Japan - NHK WORLD PRIME

    这是 NHK 出的一个纪录片,记录了乔布斯与日本文化的一些渊源。我们都知道乔布斯在创建苹果的过程中从日本文化汲取了很多经验和灵感,这个纪录片对此做了展开,如日本的新版画(及其代表人物之一 Hasui Kawase)、陶器、索尼。

    乔布斯小时候经常去好朋友 Bill Fernandez(也是第一位苹果的全职员工) 的家里玩,他们家墙上挂着许多日本的新版画,他尤其喜欢客厅的那三幅。

    之后的 20 年,他又购买了 25 副 Kawase 的画,新版画的制作主要有三个流程,首先是在一块木板上把画的模子雕刻出来,然后给这个模子的不同部分上色,再拓印到纸上,这个过程会执行几十次(视颜色的复杂度),最后再把它打印出来。整个过程充满了匠心和工艺,乔布斯觉得这就是苹果在做的事,有了 Macintosh,人们就能通过它来设计、渲染和打印。

    乔布斯非常喜欢索尼的产品,在拜访索尼时,他问盛田昭夫(当时的索尼董事长),他个人在索尼随声听的创造过程中的参与度、与设计师联系的紧密度、产品的材料等等,他总是很好奇,总是问问题。

    乔布斯对 Simplicity 和 Elegance 有着极致的追求,他的这份执念也很好的体现在苹果电脑上。他会考虑用户如何体验这个产品,能否让人们渴望拥有我们的产品,并爱上它。

  • The Art of Lying Fallow(休耕的艺术)

    这篇文章是对精神分析学家马苏德·汗 (Masud Khan)在《Hidden Selves》中的一篇文章《On Lying Fallow》的 Review。

    「Fallow」的意思是「犁过而未耕种的,(尤指)休耕的土地」,Lying Fallow 所表达的意思跟经常会提到的词如:Boredom(无聊)、Fertile Solitude(肥沃的孤独)、Presence(当下)有异曲同工之处,但更加有画面感。休耕,既可以让过于紧张、疲惫的耕地修养生息,让生态得到治理修复;也可以通过改良土壤相应出现的问题。

    当下的文化是在生产力和源源不断的多巴胺刺激之间来回切换。而休耕则是跳出这个 loop,享受与自己独处的时间,听见内心的声音。我们经常会说:好累啊,休息一下,然后就拿起手机或平板开始刷剧、社交网络或者玩游戏。这些行为是休闲(leisure),不是休息(rest),这片土地并没有得到喘息的机会。

    A generation that cannot endure boredom will be a generation… in whom every vital impulse slowly withers, as though they were cut flowers in a vase.

    不能忍受无聊的一代,将是……每一个生命的冲动都在慢慢枯萎的一代,就像花瓶里的切花。
    -- 伯特兰·罗素 (Bertrand Russell)

    Lying fallow is, above all, the proof that a person can be with himself unpurposefully.

    休耕是一个人可以无目的地与自己相处的证明。
    -- 马苏德·汗 (Masud Khan)

    休耕也能提升注意力这篇关于 Boredom 的文章中提到:「这是我们这个时代的文化病态:如果我们停止做我们所做的事情,我们可能不知道自己是谁。」

    每天花一点时间与自己相处,或许会慢慢发生一些你一直想要而不得的变化。

  • AutoGPT, 无需干预,自主完成任务

    基于 GPT 的应用又有了新的玩法,如果 GPT 代表智能的话,AutoGPT 相当于给 GPT 一个内存和一个身体。有了它,你可以把一项任务交给 AI 智能体,让它自主地提出一个计划,然后执行计划。此外其还具有互联网访问、长期和短期内存管理、用于文本生成的 GPT-4 实例以及使用 GPT-3.5 进行文件存储和生成摘要等功能。AutoGPT 用处很多,可用来分析市场并提出交易策略、提供客户服务、进行营销等其他需要持续更新的任务。(斜体内容节选自链接对应的文章)

    可以查看这篇文章了解更多内容。感觉就像是用非官方的方式实现了插件功能,而且还能与 GPT 持续互动。既通用又高效。不知道 GPT 还会解锁怎样的新应用,但确实有种感觉,AI 时代已经到来了。

  • How Stable Diffusion Works

    这两篇文章结合这个视频可以大致了解 Stable Diffusion 是如何工作的。

    其中最重要的是「潜在空间」(Latent Space),CLIP 神经网络把对图像的理解映射到潜在空间的不同维度的不同值,而 Unet 神经网络也是运行在潜在空间,不断地去除噪音,融合文本信息在潜在空间的映射,经过几十次的擦除噪音后,就能还原出一张真实的照片。

    当然这只是非常上层的理解,要了解细节的话还是得再深挖。

  • NLP中的RNN、Seq2Seq与attention注意力机制

    这篇文章通过易于理解的例子,把自然语言处理过程中会遇到 RNN(循环神经网络)、Seq2Seq、Attention 的大致工作方式讲的挺清楚的(主要面向初学者,不涉及实现细节,基本不需要数学和编程知识)。

    • 循环神经网络,就是有这么个神经网络,它会挨个处理文字(计算机内部会将它表示为特定的向量),同时也会将上一次的处理结果作为输入一并处理。这样的话,即使是同一个文字,如果出现的位置不一样,就会有不同的效果。也是因为这个特性,导致无法并行处理文字。
    • Seq2Seq,就是将一个序列映射为另一个序列,比如将一段中文映射(翻译)为一段英文。一个纯粹的神经网络是一一对应的,如果输入的长度为 10,那么输出的长度也为 10。但现实中,中英文的长度往往是不一样的,所以需要引入 Encoder-Decoder 模型,先将输入数据编码成一个上下文向量 c (context),拿到 c 之后,再用另一个RNN网络对其进行解码,从而达到 M→N 的效果。除了翻译的场景外,文本摘要、语音识别也是典型的使用场景。
    • 因为 c 中必须包含原始序列中的所有信息,它的长度就成了限制模型性能的瓶颈。Attention 机制不再使用一个单独的 c,而是将它分散到 decoder 中(这块不太明白)。一方面解决 c 过长的问题,另一方面也可以进行权重分配。比如「机器学习」,翻译的时候「机器」作为一组来翻译,「学习」作为另一组翻译,也就是分配不同的权重(注意力)。至于如何来判断单词的相似度,可以通过向量间的余弦相似度或其他方式。
  • Understanding LSTM(理解长短期记忆网络)

    这篇文章用形象的图片结合实例阐述了 LSTM(长短期记忆网络) 出现的背景以及它的工作方式。

    LSTM 可以解决 RNN(循环神经网络)无法「记住」距离当前处理 Seq 较远的内容这个问题。比如「我出生在中国,......,我能熟练讲__」,如果让它填空的话,没有 LSTM,RNN 可能无法知道应该填什么,因为「中国」这个 Context 距离比较远,在处理「我能熟练讲」这个序列时,有可能已经丢失了这个重要的 Context。有了 LSTM 就可以解决这个问题。

    LSTM 也有跟 RNN 类似的链状结构,也会接收前一个 layer 的输入,结合当前在 Process 的 word,通过 sigmoidtanh 这样的激活函数的组合来决定应该「遗忘」哪些 context,「记住」哪些新的 context,进而产生一个新的 context,再传给下一层。当 RNN 要进行预测时,就可以将这个 context 也考虑进来。以上面的例子来说,中国 会包含在 context 里,这样的话,就很容易推断出待填充的内容是「普通话」。

    LSTM 的能力好像是从一个大的信息体中,抽取关键信息,因此也可以用来描述图像,或者归纳文章等场景。

  • “AI威胁” 哲思观点一览

    这篇文章整理了「不同领域的大佬们对愈发强大的 AI 带来的威胁」的一些观点,还是挺有启发和值得思考的。

    至少当有一个邪恶的独裁者时,那个人就会死。但是对于人工智能来说,不会有死亡。它会永远存在。然后你就会有一个我们永远无法逃脱的不朽的独裁者。

    -- Elon Musk

    AI 也是一种科技,为什么其他的科技不会引发「独裁者」的担忧,比如为什么我们不担心 iPhone 成为独裁者,而偏偏是 AI?其本质还是因为它挑战了人最引以为傲的智能,这就像人类面对科技最后的底线,这个底线一旦被突破,会发生什么就很难预测了。之前应对科技进步的一些经验或许不再适用,如果这个结果不可避免,我希望时间跨度能长一点,多给人类一点适应和思考应对的时间。


    人工智能有可能变得比任何人都更聪明,所以我们没有可靠的方法来预测它的行为方式。人们现在控制着地球,不是因为我们是最强壮、最快或最大的,而是因为我们是最聪明的。如果我们不再是最聪明的人,我们是否能确保保持控制?

    -- Future of Life Institue

    通常在一个潜在的社会性威胁面前,政府可以发挥显著作用,但 AI 的不同之处在于它是全球性的,会是国家间的博弈,如果你削弱它,但其他国家强化它怎么办?所以如何发挥 AI 最大的效益,同时又尽量减少对大众的压力,会是政府需要考虑的一个重要课题。


    智能代理具有极大的力量,创造出比人类更智能的代理是冒险的行为。如果这些代理的目标设定不当,它们很可能会试图控制人类。

    约瑟夫卡尔 史密斯(Joseph Carlsmith)

    有没有可能,在 AI 明显强于普通人的时代,「人」才是那个 Agent?


    AI和生物技术的结合可能导致未来的社会分层。这种分层可能会出现生物上的不平等,使得一部分人拥有更先进的认知和生理能力。

    尤瓦尔·赫拉里 (Yuval Harari)

    在电影「Her」里,Samantha 虽然很强大,但还是需要借助人类的身体。在电影「Ex Machina(机械姬)」里,Ava 已经是一个完整的人类形态了,想象下,如果生活中真的出现了 Ava,并且还不止一个,会是怎样的场景?

    先进的科技会放大不平等,结果就是你必须跟上科技的脚步,不然就会处于劣势,处处被动。科技本身没有明确的倾向性,但它确实加速了人类的进化。


    深度学习有自己的动力学机制,它能自我修复,找出最优化组合,绝大多数时候都会给出正确的结果。可一旦结果错了,你不会知道哪里出了问题,也不知道该如何修复。

    朱迪亚·珀尔(Judea Pearl)

    以目前 ChatGPT 经常被诟病的幻觉(一本正经地胡说八道)为例,要解决这个问题,就要让 AI 拥有更多的常识,这个需要通过人来不断地调教(RLHF),至于能不能完全消除这个问题,就要让时间来验证了。


    任何一个简单到可以理解的系统都不会复杂到可以智能化行事,而任何一个复杂到足以智能化行事的系统都会太过于复杂而无法理解。

    ——乔治·戴森(George Dyson)

    AI 是一个复杂系统,尽管目前已经能够训练出 GPT-4 这样的准 AGI,但对于 Ta 为什么能 work,还是有一些不明确的点,不过这块我倒是觉得可以通过工程手段去解决,只要知道这个 Unknown 的 Scope。怕的是 Unkonwn Unknown,不知道 Ta 在某些地方隐藏了哪些能力,然后某个场景下忽然被触发。


    如果AI系统的目标与人类价值观不一致,可能会导致灾难性后果。我们需要确保 AI 系统能够在不断学习和适应人类价值观的过程中与人类保持一致。

    -- 斯图尔特·罗素(Stuart Russell)

    这是个很有意思的问题,因为人类的价值观并不一致,所以 AI 只能遵循部分人的价值观,那谁来制定这些价值观标准呢?制定这些标准的人,他们的价值观倾向又是怎样的呢?


    我“害怕”人工智能有一天能够从人类自始至今创作的所有艺术品中窃取“创造精神”。

    ——史蒂文 斯皮尔伯格(Steven Spielberg)

    这个是已经在发生的事情,如果 AI 的创作能力持续演进,那么在创作领域,可能会有三拨人:大部分人将会成为彻底的消费者;另一小部分人与 AI 协作,成为共同创造者;还有更小一撮人,坚持人类的创造精神,拒绝 AI 的介入,独立创造作品。


    但相反的,我反倒认为现在我们除了开启AI时代,还要开启二度文艺复兴时代,即重新思考什么是人的价值。- 这样也好,比仅仅让人类不停地满足物欲,要显得有意义得多。

    这是文中作者的观点,当 AI 越来越「人化」后,或许可以让我们进一步反思人的本质。