Limboy

Seeing Like an Algorithm

Link: https://www.eugenewei.com/blog/2020/9/18/seeing-like-an-algorithm

概述

文章探讨了TikTok算法成功的真正原因,认为其核心优势并非算法本身有多么神奇,而是其独特的产品设计如何帮助算法“看清”用户和视频的详细信息。作者借鉴了詹姆斯·C·斯科特《像国家一样观察》中关于国家为管理而简化复杂现实的概念,将其对比于TikTok的应用设计如何使算法能够高效准确地进行匹配。

传统应用设计侧重于减少用户操作摩擦,例如无限滚动的信息流。然而,这种设计牺牲了算法获取清晰用户反馈信号的能力。TikTok则采用了全屏、垂直、分页式的视频展示方式,迫使用户对每一个视频做出明确或隐含的反应(如快速划过、重复观看、点赞、分享、使用音乐等)。这些行为为算法提供了极其丰富和干净的训练数据。

文章指出,机器学习算法的有效性很大程度上取决于训练数据的质量和数量。TikTok通过其设计,成功地将自身变成了一个高效的数据生成机器,形成了一个连接创作者、视频、观众和算法的强大“飞轮”。这个飞轮,而非单一的算法代码,构成了TikTok真正的竞争壁垒。作者将这种设计理念称为“算法友好型设计”,并认为它可能成为机器学习时代其他应用和服务获得优势的新模式。文章最后预告了下一篇将探讨创意网络的飞轮效应。

内容精简

本文深入分析了TikTok成功的关键,挑战了其算法具有某种神秘魔力的普遍看法。作者认为,TikTok的真正优势在于其应用设计如何巧妙地服务于其核心的“为你推荐”(For You Page, FYP)算法,使其能够高效地“看清”用户和视频,从而实现精准匹配。

文章首先回顾了詹姆斯·C·斯科特在《像国家一样观察》一书中的核心思想:国家为了征税、征兵等目的,倾向于采用“高现代主义”方法,通过简化和抽象来使复杂的现实(如土地、人口)变得“可读”(legible),但这往往会忽略现实的复杂性,导致意想不到的后果和失败。作者将这一概念引申,指出许多现代社交网络巨头也试图通过简化抽象来“看清”用户,以便驱动参与度、防止流失和投放广告,但这同样带来了诸多问题。

然而,作者关注的重点是TikTok如何通过应用设计帮助算法“看清”所需的细节,以完成其匹配工作。这与斯科特描述的国家简化现实导致失败不同,TikTok的设计旨在让算法能够看到更丰富、更详细的信息。这是一种新的模式,作者称之为“算法友好型设计”。

机器学习领域的进展,很大程度上得益于训练数据量的爆炸式增长。例如,GPT-3的惊人表现并非源于算法的根本性突破,而是因为它在海量文本数据上进行了训练。对于TikTok的短视频推荐算法而言,问题在于缺乏现成的、包含各种模因、舞蹈、宠物、挑战等内容的庞大训练数据集。

TikTok的巧妙之处在于,它通过自身的设计,成为了生成这种独特训练数据的源泉。其应用设计形成了一个闭环反馈系统,激励并促成了视频的创作和观看,而这些活动恰恰为算法提供了宝贵的训练数据。

传统的UI设计理念强调减少用户操作摩擦,追求优雅、直观的用户体验。苹果公司是这一理念的典范。这种用户中心的设计模式在过去取得了巨大成功,尤其是在消费科技领域,帮助公司快速获取用户并形成网络效应。

然而,在机器学习日益重要的时代,应用设计需要考虑如何最好地帮助算法“看清”。为了更好地服务用户,有时需要首先服务于算法的需求。TikTok正是“算法友好型设计”的典范,其设计优化了向算法输入有用信号的过程。

TikTok的应用一打开就直接进入“为你推荐”页面,全屏、垂直地展示一个视频。这种设计迫使用户对当前这一个视频做出反应。用户从视频开始播放的那一刻起的所有行为,都成为其对该视频情感态度的信号:

除了用户行为,TikTok的算法还能获取关于视频本身的丰富信息。视频在上传后可能经过人工标注(舞蹈、宠物、喜剧等),视觉AI也会进行分析。算法还了解用户的历史观看偏好、人口统计学信息、设备类型等。通过结合视频属性、用户属性和用户在视频上的行为,算法能够高效地判断用户对特定视频的偏好。

将TikTok的FYP算法所“看清”的内容与大多数其他社交网络的推荐算法进行对比,差异显而易见。Facebook、Twitter、Instagram等平台的默认界面是无限垂直滚动的feed,屏幕上同时显示多个内容。在这种设计下,算法难以判断用户是否停留在某个内容上,即使停下,如果用户不点击“赞”等明确的正面反馈按钮,算法也很难判断其真实情感。信号不够清晰。

无限滚动feed虽然减少了用户浏览的摩擦,提供了流畅的消费体验,但却牺牲了算法获取清晰信号的能力。相比之下,TikTok的分页式设计(一次只显示一个视频)虽然增加了用户切换内容的摩擦,但却为算法提供了更干净、更明确的信号,包括隐含的负面信号(快速划过)。这种设计权衡最终有助于长期维护feed的质量。

大多数社交网络只有正面反馈机制(如点赞),缺乏明确的负面反馈(如点踩),这使得算法难以识别用户不感兴趣或引起轻微不适的内容,导致内容漂移和用户流失。TikTok虽然没有明确的点踩按钮,但通过快速划过等行为,能够有效地捕捉用户的负面信号。

短视频的格式也非常适合这种算法驱动的推荐模式。视频时长短,用户尝试成本低,可以在短时间内观看大量视频并提供反馈。

TikTok并非唯一采用这种一次一个项目、类似“试听”界面的应用。Tinder的左右滑动设计也是一个先例,它为用户提供了清晰的二元选择反馈,甚至“左滑/右滑”已成为表达好恶的流行语。

在软件行业,单纯的功能或UI设计很容易被复制。但TikTok的“飞轮”——连接创作者、视频、观众和算法的强大正反馈循环——构成了难以复制的竞争优势。当一个产品率先实现产品与市场的契合,并建立起这种飞轮效应,它就能在竞争中遥遥领先。

作者认为,将TikTok的成功完全归因于一个神秘的算法是错误的。真正的“魔力”在于TikTok的每一个设计元素和流程如何协同工作,共同生成高质量的训练数据集,使算法能够不断优化。理解并维护这个飞轮的运转,才是其核心价值所在。

许多现有产品(如Yelp、Amazon、Netflix)的算法推荐似乎达到了某种瓶颈,作者认为,或许更“算法友好型”的设计能够帮助它们实现新的飞跃。

总而言之,本文强调了TikTok应用设计在赋能其算法方面的关键作用,提出“算法友好型设计”的概念,并将其视为机器学习时代构建竞争优势的一种新思路。

关键点

以下是文章的关键点及其相关信息:

问答

以下是帮助理解文章的关键问答: