Link: https://www.eugenewei.com/blog/2020/9/18/seeing-like-an-algorithm
概述
文章探讨了TikTok算法成功的真正原因,认为其核心优势并非算法本身有多么神奇,而是其独特的产品设计如何帮助算法“看清”用户和视频的详细信息。作者借鉴了詹姆斯·C·斯科特《像国家一样观察》中关于国家为管理而简化复杂现实的概念,将其对比于TikTok的应用设计如何使算法能够高效准确地进行匹配。
传统应用设计侧重于减少用户操作摩擦,例如无限滚动的信息流。然而,这种设计牺牲了算法获取清晰用户反馈信号的能力。TikTok则采用了全屏、垂直、分页式的视频展示方式,迫使用户对每一个视频做出明确或隐含的反应(如快速划过、重复观看、点赞、分享、使用音乐等)。这些行为为算法提供了极其丰富和干净的训练数据。
文章指出,机器学习算法的有效性很大程度上取决于训练数据的质量和数量。TikTok通过其设计,成功地将自身变成了一个高效的数据生成机器,形成了一个连接创作者、视频、观众和算法的强大“飞轮”。这个飞轮,而非单一的算法代码,构成了TikTok真正的竞争壁垒。作者将这种设计理念称为“算法友好型设计”,并认为它可能成为机器学习时代其他应用和服务获得优势的新模式。文章最后预告了下一篇将探讨创意网络的飞轮效应。
内容精简
本文深入分析了TikTok成功的关键,挑战了其算法具有某种神秘魔力的普遍看法。作者认为,TikTok的真正优势在于其应用设计如何巧妙地服务于其核心的“为你推荐”(For You Page, FYP)算法,使其能够高效地“看清”用户和视频,从而实现精准匹配。
文章首先回顾了詹姆斯·C·斯科特在《像国家一样观察》一书中的核心思想:国家为了征税、征兵等目的,倾向于采用“高现代主义”方法,通过简化和抽象来使复杂的现实(如土地、人口)变得“可读”(legible),但这往往会忽略现实的复杂性,导致意想不到的后果和失败。作者将这一概念引申,指出许多现代社交网络巨头也试图通过简化抽象来“看清”用户,以便驱动参与度、防止流失和投放广告,但这同样带来了诸多问题。
然而,作者关注的重点是TikTok如何通过应用设计帮助算法“看清”所需的细节,以完成其匹配工作。这与斯科特描述的国家简化现实导致失败不同,TikTok的设计旨在让算法能够看到更丰富、更详细的信息。这是一种新的模式,作者称之为“算法友好型设计”。
机器学习领域的进展,很大程度上得益于训练数据量的爆炸式增长。例如,GPT-3的惊人表现并非源于算法的根本性突破,而是因为它在海量文本数据上进行了训练。对于TikTok的短视频推荐算法而言,问题在于缺乏现成的、包含各种模因、舞蹈、宠物、挑战等内容的庞大训练数据集。
TikTok的巧妙之处在于,它通过自身的设计,成为了生成这种独特训练数据的源泉。其应用设计形成了一个闭环反馈系统,激励并促成了视频的创作和观看,而这些活动恰恰为算法提供了宝贵的训练数据。
传统的UI设计理念强调减少用户操作摩擦,追求优雅、直观的用户体验。苹果公司是这一理念的典范。这种用户中心的设计模式在过去取得了巨大成功,尤其是在消费科技领域,帮助公司快速获取用户并形成网络效应。
然而,在机器学习日益重要的时代,应用设计需要考虑如何最好地帮助算法“看清”。为了更好地服务用户,有时需要首先服务于算法的需求。TikTok正是“算法友好型设计”的典范,其设计优化了向算法输入有用信号的过程。
TikTok的应用一打开就直接进入“为你推荐”页面,全屏、垂直地展示一个视频。这种设计迫使用户对当前这一个视频做出反应。用户从视频开始播放的那一刻起的所有行为,都成为其对该视频情感态度的信号:
- 快速划过: 明确的负面信号,表示不感兴趣。
- 重复观看: 强烈的正面信号,表示喜欢。
- 分享视频: 强烈的正面信号。
- 点击音乐图标观看更多使用该音乐的视频: 表示对该音乐或相关模因感兴趣。
- 访问创作者主页、观看其其他视频、关注: 表示对创作者本人感兴趣。
除了用户行为,TikTok的算法还能获取关于视频本身的丰富信息。视频在上传后可能经过人工标注(舞蹈、宠物、喜剧等),视觉AI也会进行分析。算法还了解用户的历史观看偏好、人口统计学信息、设备类型等。通过结合视频属性、用户属性和用户在视频上的行为,算法能够高效地判断用户对特定视频的偏好。
将TikTok的FYP算法所“看清”的内容与大多数其他社交网络的推荐算法进行对比,差异显而易见。Facebook、Twitter、Instagram等平台的默认界面是无限垂直滚动的feed,屏幕上同时显示多个内容。在这种设计下,算法难以判断用户是否停留在某个内容上,即使停下,如果用户不点击“赞”等明确的正面反馈按钮,算法也很难判断其真实情感。信号不够清晰。
无限滚动feed虽然减少了用户浏览的摩擦,提供了流畅的消费体验,但却牺牲了算法获取清晰信号的能力。相比之下,TikTok的分页式设计(一次只显示一个视频)虽然增加了用户切换内容的摩擦,但却为算法提供了更干净、更明确的信号,包括隐含的负面信号(快速划过)。这种设计权衡最终有助于长期维护feed的质量。
大多数社交网络只有正面反馈机制(如点赞),缺乏明确的负面反馈(如点踩),这使得算法难以识别用户不感兴趣或引起轻微不适的内容,导致内容漂移和用户流失。TikTok虽然没有明确的点踩按钮,但通过快速划过等行为,能够有效地捕捉用户的负面信号。
短视频的格式也非常适合这种算法驱动的推荐模式。视频时长短,用户尝试成本低,可以在短时间内观看大量视频并提供反馈。
TikTok并非唯一采用这种一次一个项目、类似“试听”界面的应用。Tinder的左右滑动设计也是一个先例,它为用户提供了清晰的二元选择反馈,甚至“左滑/右滑”已成为表达好恶的流行语。
在软件行业,单纯的功能或UI设计很容易被复制。但TikTok的“飞轮”——连接创作者、视频、观众和算法的强大正反馈循环——构成了难以复制的竞争优势。当一个产品率先实现产品与市场的契合,并建立起这种飞轮效应,它就能在竞争中遥遥领先。
作者认为,将TikTok的成功完全归因于一个神秘的算法是错误的。真正的“魔力”在于TikTok的每一个设计元素和流程如何协同工作,共同生成高质量的训练数据集,使算法能够不断优化。理解并维护这个飞轮的运转,才是其核心价值所在。
许多现有产品(如Yelp、Amazon、Netflix)的算法推荐似乎达到了某种瓶颈,作者认为,或许更“算法友好型”的设计能够帮助它们实现新的飞跃。
总而言之,本文强调了TikTok应用设计在赋能其算法方面的关键作用,提出“算法友好型设计”的概念,并将其视为机器学习时代构建竞争优势的一种新思路。
关键点
以下是文章的关键点及其相关信息:
- 核心论点: TikTok成功的关键在于其应用设计如何帮助算法“看清”用户和视频,而非算法本身具有神秘魔力。
- “算法友好型设计”概念:
- 定义:一种应用设计理念,旨在优化向机器学习算法提供有用信号的过程。
- 目的:为了更好地服务用户,有时需要首先服务于算法的训练需求。
- 与传统设计的对比:传统设计侧重于减少用户操作摩擦;算法友好型设计侧重于获取清晰的算法训练数据。
- 借鉴与对比《像国家一样观察》:
- 斯科特的观点:国家为管理(如征税)而通过“高现代主义”简化复杂现实,使其“可读”,但这往往导致失败。
- 文章的观点:TikTok的设计使算法能够“看清”用户和视频的详细信息,以实现高效匹配,这与国家简化现实导致失败不同。
- 机器学习算法的有效性:
- 很大程度上取决于训练数据的质量和数量(而非仅算法本身)。
- 示例:GPT-3的突破得益于海量训练数据。
- TikTok如何生成训练数据:
- TikTok成为了自身算法训练数据的来源。
- 通过其设计,形成了一个激励和促成视频创作与观看的闭环反馈系统。
- TikTok的算法友好型设计特点:
- 全屏、垂直、分页式视频展示: 一次只显示一个视频。
- 强制用户对单个视频做出反应: 用户行为直接反映对当前视频的态度。
- 获取清晰的用户反馈信号:
- 正面信号: 重复观看、点赞、分享、点击音乐图标、访问创作者主页、观看其其他视频、关注。
- 负面信号: 快速划过(隐含的负面信号)。
- 获取视频属性信息: 人工标注、视觉AI分析、相机滤镜/效果的使用。
- 结合用户属性信息: 历史观看偏好、人口统计学信息、设备类型、地理位置、相似用户。
- 与传统社交媒体feed的对比:
- 无限垂直滚动feed(Facebook, Twitter, Instagram): 同时显示多个内容。
- 信号不清晰: 难以判断用户是否停留在某个内容上;缺乏明确的负面反馈机制;难以捕捉用户隐含的不感兴趣信号。
- 设计权衡: 传统feed优先减少浏览摩擦,牺牲了算法获取清晰信号的能力;TikTok优先获取清晰信号,可能增加少量切换摩擦,但提升长期feed质量。
- 与其他应用的类比:
- Tinder: 采用一次一个项目、类似“试听”的界面,优化了二元选择反馈(左滑/右滑)。
- TikTok的真正竞争优势(护城河):
- 不是单一的算法代码。
- 是连接创作者、视频、观众和算法的整个“飞轮”系统。
- 这个系统生成高质量数据,驱动算法优化,形成正反馈循环,难以被竞争对手复制。
- 算法友好型设计的普适性:
- 可能适用于其他需要算法推荐的领域(如音乐推荐),但不一定适用于所有领域(如电影推荐)。
- 可能帮助其他平台(如Yelp, Amazon, Netflix)提升推荐质量。
- 未来探讨: 下一篇将讨论创意的网络效应。
问答
以下是帮助理解文章的关键问答:
-
Q: 文章的核心观点是什么? A: TikTok成功的关键在于其应用设计如何帮助算法高效获取用户和视频的详细反馈数据,形成强大的数据飞轮,而非仅仅依赖一个神秘的算法。
-
Q: “算法友好型设计”是什么意思? A: 这是一种应用设计理念,旨在优化产品界面和流程,以便为机器学习算法提供高质量、清晰的训练数据,最终目的是为了更好地服务用户。
-
Q: TikTok的设计如何帮助其算法“看清”? A: TikTok采用全屏、垂直、分页式(一次一个)的视频展示方式,迫使用户对每个视频做出反应。用户的观看时长、是否划过、点赞、分享、使用音乐等行为都成为算法获取的清晰信号,包括隐含的负面信号(如快速划过)。
-
Q: TikTok的设计与Facebook、Twitter等平台的无限滚动feed有何不同?这种不同为何重要? A: TikTok一次只显示一个视频,而无限滚动feed同时显示多个。这种不同使得TikTok能获取关于用户对单个视频的明确反馈信号,而无限滚动feed难以判断用户对屏幕上多个内容的具体态度,信号不够清晰,尤其难以捕捉负面反馈。清晰的信号对算法训练至关重要。
-
Q: 文章认为TikTok真正的竞争优势(护城河)是什么? A: 真正的优势是连接创作者、视频、观众和算法的整个“飞轮”系统。这个系统通过算法友好型设计生成高质量数据,驱动算法优化,形成正反馈循环,难以被竞争对手复制。
-
Q: 文章如何借鉴《像国家一样观察》这本书的概念? A: 文章对比了斯科特书中描述的国家为管理而简化复杂现实导致失败的情况,指出TikTok的设计并非简化,而是使算法能够“看清”更多细节,从而实现高效匹配。