Link: https://www.eugenewei.com/blog/2020/9/18/seeing-like-an-algorithm
在我之前关于TikTok的文章中,我讨论了为什么它的“为你推荐页面”(For You Page,简称FYP)算法是让TikTok运转起来的连接组织。它是主板上的总线,连接并闭合了所有的反馈循环。
但是,在急不可耐地想要理解为什么公司可能想要收购TikTok(如果字节跳动被迫剥离这款热门短视频应用的话)的过程中,围绕其算法的炒作带上了一点神秘色彩,这正是当前西方分析中国科技界时常有的特点。我一直推迟发布这篇文章,因为似乎每天都有关于TikTok在美国可能被禁的新进展。与其写任何会立刻过时的引言,我不如在这里留个旁注:截至本文发布时,甲骨文似乎将接管TikTok的云计算交易,同时与沃尔玛和一些风投公司一起持有TikTok全球公司(TikTok Global)的部分股权。但如果下周我们发现更多离奇的细节,我一点也不会感到惊讶。这种交易我本以为只会在《继承之战》(Succession)里发生,但即使在那部讽刺剧中,这也会显得夸张。2020年的编剧室真是无敌了。
在这篇文章中,我想详细讨论TikTok的设计是如何帮助其算法发挥如此出色作用的。上次我讨论了为什么FYP算法是TikTok飞轮效应的核心,但如果算法无效,整个反馈循环就会崩溃。理解算法如何实现其准确性至关重要,即使你对TikTok或短视频领域不感兴趣,因为越来越多的行业公司将面临一个竞争对手,其优势核心在于机器学习算法。
我想讨论的是,TikTok的设计如何帮助其算法“看清”一切。
詹姆斯·C·斯科特的《像国家一样观看》是那种能让你变成硅谷人士(使用?滥用?“可读性”这个词)的书。我第一次听说这本书是在读了文卡特什·拉奥(Venkatesh Rao)对其主要主题的总结之后,那篇文章至今仍是这本书很好的“太长不看版”入门指南,如果你不打算读原书的话(斯科特·亚历山大对这本书的评论也很好,尽管它足够长,几乎可以写一个自己的“太长不看版”了)。不过,我还是建议你读一读。
斯科特这本书的副标题是“某些改善人类状况的计划为何失败”。斯科特特别剖析了一种在多个领域反复出现的失败模式:国家等管理机构转向斯科特所称的“高度现代主义”,试图提高其试图控制的事物的“可读性”,无论是为了征税、征兵还是其他许多目标。在这样做的过程中,他们将一种虚假的秩序感强加于一个比他们想象的更复杂的现实。如果能听到斯科特对现代中国(在中共统治下,拥有现代监控技术)的看法,以及他是否认为随着时间的推移,中国会证明或推翻他的论点,那将非常有趣。
这本书提高了人们对日常生活中各种意想不到后果的认识。当我们过于自大时,都需要更健康的谦逊剂量。世界比我们认为的更丰富、更复杂。
举个例子,斯科特讨论的很多内容都与我们现代社交网络巨头的一些傲慢有关。这些主导应用的设计是为了提高其用户群的“可读性”,以便(除其他目的外)推动用户参与、防止流失,并最终投放定向广告。这反过来又让它们的母公司陷入了它们现在不断努力解决的一系列问题。
但这将是另一篇文章、另一天的话题。斯科特专注于国家如何使用简化的抽象来从整体层面“看清”其公民,而我想讨论的是TikTok的应用设计如何让其算法“看到”它所需的所有细节,以便高效准确地完成其匹配工作。如果说《像国家一样观看》是关于一种常见的失败模式,那么这篇文章则是关于一种新的模式,如何在应用和服务设计中最大程度地利用机器学习算法。我知道围绕TikTok的争议在于用户数据可能被中共获取,或者被“那个国家看到”,这带有讽刺意味。或者说,这场新冷战的症结之一是中国防火墙,它决定了中国公民“看到”什么。而大多数美国科技公司都置身其外,向内窥视。
近年来,机器学习领域的一个认识(至少对我这个门外汉来说)是,仅仅通过将训练数据的体量增加几个数量级,就能取得多大的进展。也就是说,即使算法本身与几年前没有太大区别,仅仅通过在更大的数据集上进行训练,人工智能研究人员就取得了像GPT-3这样的突破(这让科技界的Twitter用户暂时达到了集体狂喜)。
当人们说TikTok的算法是其成功的关键时,许多人想象的是某个神奇的代码块是公司的秘密武器。当代后现代主义俄罗斯作家维克多·佩列文曾说,所有现代电影的主角都是一个装满钱的公文包。从《死吻》中装有放射性物质(我想是吧?)的公文包,到《低俗小说》中装有同样发光的不知名物体(马塞勒斯·华莱士的灵魂?)的公文包,从《公式》中的创世方程式,到大卫·马梅特《西班牙囚徒》中的秘密金融流程,我们长期以来在电影中痴迷于神奇的麦高芬(McGuffin,指推动剧情发展的神秘物品)。最近几周,关于TikTok算法的讨论将其提升到了类似的高度,就像印第安纳·琼斯电影中的那些神秘考古文物一样,比如约柜、圣杯或林伽(Shivling)。
但该领域的大多数专家都怀疑TikTok在机器学习推荐算法方面取得了迄今为止未知的进展。事实上,他们中的大多数人会说,TikTok很可能是在其他人使用的相同标准方法基础上构建的。
但请记住,机器学习算法的有效性不仅仅是算法本身的功能,而是算法在某个数据集上训练后的功能。GPT-3可能并不新颖,但在海量数据和大量参数上训练后,其输出结果常常令人惊叹。
同样,TikTok的FYP算法,在其数据集上训练后,在将视频与会觉得有趣的用户匹配方面,以及同样重要的是,在抑制视频向不会觉得有趣的用户分发方面,都极其准确高效。
对于某些领域,比如文本,大量优质训练数据唾手可得。例如,要训练像GPT-3这样的人工智能模型,你可以利用互联网、书籍等现有的大量文本语料库。如果你想训练视觉人工智能,你可以利用网上和各种数据库中的海量照片供应。训练仍然昂贵,但至少丰富的训练数据触手可及。
但对于TikTok(或抖音,它的中国版),它需要一个擅长向观众推荐短视频的算法,却没有这样大规模的公开可用训练数据集。你在哪里能找到关于梗、孩子跳舞和对口型、可爱的宠物、推广品牌的网红、跑障碍赛的士兵、模仿品牌的孩子等等的短视频?即使你有这样的视频,你在哪里能找到关于普通大众对这类视频感受的可比数据?除了Musical.ly的数据集(主要由美国青少年女孩互相模仿对口型组成)之外,这样的数据并不存在。
在一种独特的鸡生蛋蛋生鸡问题中,TikTok算法需要训练的视频类型本身,如果没有应用内的相机工具、滤镜、授权音乐片段等,就不容易创建。
那么,这就是TikTok设计的魔力所在:它是一个封闭的反馈循环,激发并促成了其算法可以训练的视频的创作和观看。
为了使其算法变得如此有效,TikTok成为了自身的训练数据来源。
要理解TikTok如何创造出如此强大的学习飞轮,我们需要深入探讨其设计。
在过去二十年里,我所接触到的科技界UI设计的主流思想流派,一直围绕着消除用户完成任务的摩擦,并在过程中让他们感到愉悦。目标一直是优雅的设计,从各个意义上来说:直观、巧妙、甚至时尚。
也许没有哪家公司比苹果更能体现这种设计理念了。在最佳状态下,苹果制造的硬件和软件令人愉悦地优雅——“它就是好用”——同时也以一种让用户感觉有品位的方式性感。苹果声名狼藉的控制风格——手机和笔记本电脑不可更换电池,当前关于其App Store规则的争议——将公司完全置于斯科特在《像国家一样观看》中提到的“高度现代主义”阵营。在苹果发布会上展示新MacBook Pro机身是如何从一整块铝块中雕刻出来的视频(除了乔纳森·艾维轻柔地说着“铝”对苹果粉丝来说就像ASMR一样)有什么理由吗?也许是因为看到工业激光从一块实心铝块中雕刻出一体成型机身非常性感?然后,当你坐在咖啡馆里用这台笔记本电脑快速写邮件时,潜意识中那段视频的残留记忆会给你带来最轻微的多巴胺刺激?
这种以用户为中心的设计模式之所以长期占据主导地位,尤其是在消费科技领域,是有原因的。首先,它有效。苹果的市值,上次查看时,超过2万亿美元。还记得假肖恩·帕克说十亿美元很酷吗?那才仅仅十年前,十亿美元已经不再是S级了。财富的元规则变化很快。此外,我们生活在一个巨大的网络效应时代,科技巨头应用本·汤普森的聚合理论并获得庞大的用户基础后,可以在其参与的市场中发挥难以置信的杠杆作用。做到这一点最好的方法之一就是设计出比竞争对手更能满足用户需求的产品和服务。
这种设计理念长期以来如此占据主导地位,以至于我几乎忘记了过去那种粗糙的软件设计。不要与野兽派设计混淆,后者本身可以非常美观,就像其建筑领域的表亲一样。
但是,如果最好地服务用户在很大程度上取决于训练一个机器学习算法呢?如果那个机器学习算法需要一个海量训练数据集呢?在一个机器学习日益崛起的时代,这正日益成为一个关键的设计目标。
越来越多地,在考虑如何设计一个应用时,你必须考虑如何最好地帮助算法“看清”。为了最好地服务用户,首先要服务算法。
TikTok让我着迷,因为它是一个现代应用的例子,其设计(无论是偶然还是有意)都经过优化,以便向其算法提供尽可能多的有用信号。它是算法友好型设计的典范。我曾想称之为算法中心设计,但觉得这有点过头了。最终,帮助算法看清的设计仍然是为了向用户提供最佳体验。这可能仍然被视为用户中心设计的一种变体,但对于那些开发具有大量机器学习算法组件产品的团队来说,明确承认这一点可能很有用。毕竟,当产品经理、设计师和工程师开会设计一个应用时,算法并未到场。但它的训练需求必须得到体现。
詹姆斯·斯科特谈到“像国家一样观看”,谈到城市设计等领域的巨大变革,这些变革使得土地地块及其各自所有者等信息对税务人员来说是“可读的”。TikTok的设计使其视频、用户和用户偏好对“为你推荐页面”算法来说是“可读的”。应用设计履行了其主要职责之一:“像算法一样观看”。
让我们仔细看看。TikTok打开后直接进入“为你推荐页面”,并立即播放视频。它看起来是这样的。
这个视频是截至目前史上最受欢迎的TikTok视频。到我发布这篇文章时,它的3410万个赞很可能已经过时了。你可以阅读这个TikTok视频是如何诞生的故事,它仍然感觉像是一个包裹在谜团中、塞满悖论的文化难题,而你乐于看到这一切。我把这个视频给我侄女看,我们循环播放了几十遍,然后我们开始喊着“M to the B, M to the B”,笑得前仰后合,这是疫情期间我唯一一次真正感受到除了绝望之外的任何情绪。
整个屏幕只显示一个视频。只有一个。它全屏显示,竖屏方向。这不是一个滚动信息流。实际上,它是分页的。视频几乎立即自动播放(接下来的几个视频也在后台加载,以便轮到它们时也能快速播放)。
这种设计立刻向用户提出了一个问题:你对这个短视频,而且仅仅是这个短视频,感觉如何?
从视频开始播放的那一刻起,你所做的每一件事都是关于你对该视频情感的信号。你在视频还没播完就向上滑动到下一个视频了吗?这是一个隐含的(尽管几乎是明确的)不感兴趣信号。
你看了不止一遍,让它循环播放了几次吗?看来视频的某些地方吸引了你。你通过内置分享面板分享了视频吗?这是积极情感的另一个强烈指标。如果你点击右下角旋转的唱片图标并观看更多使用相同配乐的视频,这是关于你品味的额外信号。通常音乐提示与一个梗同义,现在TikTok有了另一个推荐视频的维度。你点击进入视频创作者的个人主页了吗?你看了他们的其他视频吗?然后你关注他们了吗?除了喜欢视频,也许你特别欣赏他们。
但让我们回到更早的时候,在你观看视频之前,了解TikTok算法如何“看到”视频本身。在FYP算法将视频发送到你的手机之前,TikTok运营团队的某个人类已经观看了视频并添加了许多相关的标签或标记。
视频是关于跳舞的吗?对口型?电子游戏?小猫?花栗鼠?是喜剧吗?主体是男性还是女性?大概什么年龄?是群组视频吗?背景在哪里?使用了什么滤镜或视觉效果?如果涉及食物,是什么类型的?等等。所有这些标签都成为算法现在可以看到的特征。
视觉AI也对视频进行了一次处理,并在力所能及的范围内,贡献它所看到的信息。TikTok的一些相机滤镜设计用于跟踪人脸、手或手势,因此视觉AI通常在更早的创作时就被调用。
算法还可以看到TikTok已经了解你的信息。你过去喜欢什么类型的视频?关于你的哪些人口统计学或心理学信息是已知的?你在哪里观看视频?你使用什么类型的设备?等等。除此之外,还有哪些用户与你相似?
让我们回到你在手机上观看那个TikTok视频的那一刻。FYP算法现在可以关闭所有反馈循环。它记录你对视频采取的每一个行动,并可以猜测你,带着你所有的品味,对这个视频,带着它所有的属性,感觉如何。
这些单独的步骤听起来都不像高深莫测的学问,特别是对于今天从事任何算法社交信息流工作的人来说。在我之前的文章中,我提到TikTok并没有强大的社交图谱。这款应用之所以如此有效,原因之一在于它不试图假装自己不是什么。也就是说,人们已经有无数其他社交图谱和与认识的人分享的方式。TikTok没有强迫人们在应用内这样做,而是让下载视频或通过外部渠道分享变得极其简单。然而,TikTok保留的是你选择分享该视频的信号。这些数据只为他们的算法提供数据。由于视频带有水印,他们也从分享中获得了很好的免费宣传。事实上,TikTok已经发布了一篇博客文章,基本描述了他们的FYP算法如何工作,我怀疑科技界的人会觉得这个描述有什么不明显的。
但对比TikTok的FYP算法看到的信息与大多数其他社交网络信息流上可比推荐算法看到的信息。
当今最大的社交网络的默认用户界面是无限垂直滚动信息流(我本可以轻松使用Facebook的截图作为例子)。这些应用不是一次向你呈现一个故事,而是同时在屏幕上显示多个项目。当你向上滚动并划过许多故事时,算法无法“看到”你的眼睛停留在哪个故事上。即使能看到,如果用户没有按下任何反馈按钮,比如点赞按钮,他们对那个故事的情感是积极还是消极?用户情感信号不清晰。
如果你认同UI应该消除摩擦的理念,那么无限滚动信息流是理想的。它提供了对消费速度的无拘无束的控制感。用拇指滑动信息流产生的模拟物理效果,看着它像《价格猜猜看》节目中展示环节的大转盘的鼓轮一样向上滚动,其旋转速度与你初始手势的速度精确对应,看着那个软件轮子像遇到恒定物理摩擦一样逐渐减速,这是触摸屏时代最令人愉悦的用户交互之一。你可以瞬间划过六七条推文或Facebook信息流项目。太爽了!
分页设计,即一次只能看到一个故事,每次滑动手指只能前进一个项目,将是字面意义和象征意义上的拖累。
另一方面,如果推文定位更精准,你也许不会介意一次只读一条推文,而如果Twitter更了解你真正感兴趣的推文类型,它们也许会定位更精准。而如果Twitter对你真正感兴趣的内容了解更多,也许是因为你必须对每条推文给出明确和隐含的积极或消极信号。
即使是用户确实参与的故事,判断情感也是一个挑战。大多数应用只有积极反馈机制,最典型的是某种形式的点赞按钮。由于Facebook、Instagram和Twitter等应用是围绕社交图谱构建的,它们选择不提供点踩按钮的原因显而易见。
但是,正如斯蒂芬·金在《写作这回事》中所写:“如果你期望成为一名成功的作家,无礼应该是你最不该担心的事情之一(倒数第二)。最不该担心的是礼貌社会及其期望。如果你打算尽可能真实地写作,你作为礼貌社会一员的日子就屈指可数了。”
通过依赖长滚动信息流和主要依赖明确的积极反馈机制,Facebook、Twitter和Instagram等社交网络为了降低用户扫描的摩擦而做出了权衡,以牺牲对消极信号更准确的解读为代价。你在由同一位创始CEO长期领导的公司中看到了这种权衡的另一种变体。这个人倾向于身边都是追随他们领导、与他们合作愉快的C级高管。被唯唯诺诺的人包围的危险在于没有人能挑战你思维中的盲点。总是值得问问,谁有足够的力量真正改变贝佐斯、库克、扎克伯格、马斯克这样的人的想法。通常答案是没有人,所以他们的盲点成为公司的盲点。
围绕兴趣图谱构建的网络,比如Reddit,确实倾向于纳入点踩机制,因为它们防止用户流失的首要指令是向用户提供最有趣的内容。这意味着剔除无趣内容与呈现吸引人的内容同样重要。
TikTok没有明确的点踩按钮,但通过一次只向你呈现一个视频,它们可以根据你是否快速跳过那个视频(快速向上滑动在视频还没播完就像在Tinder上向左滑动一样)以及你没有采取哪些积极行动来推断你对任何单个视频的不感兴趣。最好的TikTok创作者对叙事节奏有直观的感知,知道在不失去观众的情况下,高潮或结果可以拖延多久,如何设置一个能让用户保持参与的铺垫。使用已经被采纳成为一个梗的音乐提示很有帮助,因为低音下潜或音乐高潮预示着视频的笑点何时出现;观众知道离高潮还有多久。此外,观众可能仅仅为了听到音乐的结束而留下来。
如果你点击进入Facebook上某人的文字帖子,但没有评论或点赞,Facebook如何判断你对那个帖子的情感?也许你曾想在评论中激烈反对,但那个人是同事或朋友的朋友,你决定还是算了。这种消极情感很难捕捉;算法无法“看到”你的感受。大多数社交网络都有明确的举报功能,用于举报冒犯性或辱骂性内容,但这些功能被隐藏得很深,大多数用户不会使用它们。等到有人使用这样的功能时,你通常已经在很早之前犯下了严重的错误,挽回大部分已造成的损害为时已晚。
无聊或引起轻微不悦的内容才是慢性杀手。在我之前的文章中,我提到源自社交图谱的内容可能会偏离用户的真实兴趣,因为你自己的兴趣和你认识的人的兴趣之间存在不匹配。从按时间顺序排列的信息流切换到算法信息流通常是对抗这种偏离的默认防御性举措。
但是,如果算法没有“看到”用户日益失去兴趣的信号,如果只有积极互动是可见的,一定程度的偏离是不可避免的。你可能会看到用户正在慢慢失去兴趣,点赞的项目减少,不再经常打开你的应用,但究竟是哪些故事让他们流失可能不清楚。等到他们开始表现出这些流失迹象时,往往为时已晚,无法止血。
算法友好型设计不一定对用户不友好。它只是采取了一种不同的方法来最好地服务用户的利益。分页可能会给用户带来一定程度的摩擦,但这样做,它可以为算法提供更清晰的信号,从长远来看保障信息流的质量。
最小化摩擦只是实现出色用户体验的一种手段。任何设计的目的不是最小化摩擦,而是帮助用户实现某个目标。减少摩擦通常与该目标一致,但并非总是如此。你可能会说,引用推文减少了手动复制他人推文的摩擦,但减少组织一群人围攻某人的摩擦可能不是你想要鼓励的核心机制,如果你的目标是文明的公共讨论的话。某些形式的摩擦是有益的。
你会听到许多Twitter资深用户建议其他人尽早并经常使用静音和屏蔽功能。有些用户甚至大量使用软屏蔽来偷偷移除粉丝。用户自豪地发布他们静音的词语截图,以此表示他们对某个热门话题的不满(或他们对该话题的智力优越感)。非体育迷发推文说“体育球赛”,其他人发推文说“我来凑个热闹,X是什么?”,其中X是大家都在讨论的事情。甚至有人做到取消关注所有人,然后重新开始关注。在某个时候,很可能是因为A/B测试效果好,Twitter开始向用户展示他们关注的人点赞过的推文,即使是用户自己没有关注的人的推文。这确实偶尔会向我展示感兴趣的推文,但它也绝对数量上增加了我不感兴趣的推文数量,我不得不划过它们。我在这一点上像个复读机:没有两个人的兴趣完全相同。这个功能的推出让我认真考虑取消关注所有人,然后重新开始,但我也担心伤害别人的感情,因为我很心软。如果Twitter的结构不同,这就不会是个问题。
我有时会考虑自己采用其中一些或全部策略,但对于Twitter来说,这些策略的必要性本身就是服务的失败。如果算法更了解你感兴趣的内容,它应该代表你处理静音话题或屏蔽用户,无需你自己动手。正如我上次所写,你必须在Twitter上关注别人才能获得有趣内容,这对于一个本可以成为强大兴趣图谱的服务来说,可以说是一个设计缺陷。
TikTok不仅从用户那里捕捉到非常清晰的情感信号,而且在每次会话中收集到海量信号。TikTok上的视频非常短,即使在短暂的会话中,TikTok也能收集到大量关于你品味的反馈。
这个过程也相对无痛。最坏的情况是,有几个视频可能会让你觉得无聊,但划掉它们是相对无痛的操作,而且由于算法密切关注你的反馈,你甚至会享受划掉视频的过程,因为你知道应用会记录你的不满并据此行动。短视频恰好是一个非常适合这种机器学习驱动推荐的类别。我绝不是说它适用于所有类型的类别。音乐效果很好。时长短,所以采样成本低,重复消费价值高。音乐相似性往往可以通过数学方法检测到。我的Spotify电台推荐很靠谱。另一方面,算法电影推荐对我来说从未真正感到神奇。电影很长,采样成本非常高。语料库很小,每年只有大约500部电影上映,大多数人只看少数几部。整个话题值得单独写一篇博文。
顺便说一句,TikTok并不是唯一一个界面针对匹配任务进行优化、一次只向你展示一个实体以便更清楚地了解你的感受的应用。在TikTok之前,我们有一个整个类别,其中一次一个项目的“试镜式”UI占据主导地位。
“右滑”和“左滑”之所以成为表示赞同和反对的通用俚语简称,是有原因的。Tinder创造了一种在触摸屏UI上进行二元投票的设计原语。
在这个软件时代,真正的竞争优势,或者说护城河,正变得越来越虚幻。大多数软件功能或UI设计可以被现有公司或竞争对手一夜之间轻松复制。你所做的只是为他们测试了设计的影响。在我一次去中国的旅行中,我和一群中国企业家共进晚餐,我提到了Instagram抄袭Snapchat Stories的喧嚣。中国一家顶级公司的首席产品官笑着说:“在中国,如果你的竞争对手在两周内没有复制你的一个成功功能,那他们肯定是不称职的。”从很多方面来说,中国科技界才是硅谷自认为的那种真正的达尔文式创意市场。这对硅谷的相对产出来说不是个好兆头,因为创意传播和变异的速度在中国发生得更快。硅谷常被认为已取代波士顿128公路成为技术创新的地理中心,部分原因在于硅谷更开放的劳动力市场使得创意可以在公司之间自由流动。中国借鉴了这一策略并将其推得更远。在中国科技界的竞争环境中生存,就像试图爬出《蝙蝠侠:黑暗骑士崛起》中的那个深坑一样。令人恐惧。
但是,如果你能创造一个像TikTok这样的飞轮,竞争对手如Reels或Triller就很难赶上。Triller可能会花钱请一些TikTok的网红过来制作视频,Reels可能会利用现有的Instagram流量,但让TikTok运转起来的是通过FYP算法连接创作者、视频和观众的整个正向反馈循环。
在科技行业,这个行业比其他任何行业都更能体现布莱恩·阿瑟的《经济中的报酬递增与路径依赖》,第一个实现产品与市场契合的竞争对手可以遥遥领先。如果越来越多的市场感觉像是赢家通吃,或者赢家们通吃,那是因为在一个日益互联的世界里,它们确实如此。
字节跳动常被描述为一家算法公司,而TikTok在过去几周被描述为由这种算法黑魔法驱动。许多人甚至说,如果不包含算法,TikTok就不值得购买。
在我看来,这是一个错误。是的,重新训练FYP推荐算法可能需要很长时间,以至于一些用户会流失。我无意轻视这项任务。但真正的魔力在于TikTok设计和流程的每个元素如何相互连接,创造出一个数据集,算法利用这个数据集将自身训练到最佳性能。那个循环中的任何一个步骤都不超出众多美国竞购者的能力范围。所需要的只是理解飞轮如何运作,并致力于保持其中的每个元素和流程正常运转。
在我周围,我遇到了许多似乎在算法推荐质量上遇到了瓶颈的产品或服务:Yelp、OpenTable、亚马逊、谷歌、Netflix等等。别误会,其中一些处于一个不错的状态。但我忍不住觉得其中一些还有另一个飞跃可以实现,而也许更算法友好型设计可能是一种解决方案。
回顾一下,在我关于TikTok系列文章的第一部分中,我讨论了算法如何充当匹配机制,使TikTok成为一个可扩展的娱乐网络。相比之下,社交网络必须使用社交图谱来近似兴趣图谱,随之而来的是各种问题。在这篇关于TikTok的第二篇文章中,我重点讨论了其设计如何帮助其机器学习FYP算法“看到”它需要看到的信息,以便如此有效地完成其工作。算法友好型设计理念可能成为其他垂直领域的公司如何在机器学习时代获得优势的模型。
但我发现TikTok如此引人入胜且异常的案例研究还有一个最终原因。这与软件和算法关系不大,而更多地与我这个文化决定论者永远不会厌倦研究的东西有关:创造力的网络效应。这将是我关于TikTok系列文章的第三部分也是最后一部分的主题。