张一鸣不装了,抖音首次公开推荐算法
张一鸣想明白了,与其让大众怀疑,惹火烧身,不如自己坦白。
你有没有试过一刷抖音就一整天,咧着个嘴,根本停不下来?有趣的视频一刷一个赞,不感兴趣的内容直接点了个不感兴趣就往上滑……
不知道从什么时候起,抖音就填满了我们整个空余时间,它的推送机制也被很多人好奇,网友们对它的推荐算法热烈讨论、褒贬不一,其中很大一点在于“信息茧房”。
所谓“信息茧房”,用人话来说,就是一个人看的内容太单一了,都只看自己喜欢的内容,导致对一个事物只知其一不知其二。
比如,你喜欢甜豆腐脑,并且十分排斥咸豆腐脑,那么你就只会看夸甜豆腐脑和骂咸豆腐脑的视频,算法也不会再给你推送夸咸豆腐脑的视频,你慢慢就会认为甜豆腐脑被更多人喜欢。由此,形成了一个关于豆腐脑的“信息茧房”。
对此,抖音上线了安全与信任中心网站,并于4月15日举办了“安全与信任中心开放日”活动,公开抖音算法,实现算法透明。

(图源:抖音安全与信任中心)
一、抖音的推荐算法究竟是啥
根据抖音在“安全与信任中心”网站发布的《从零开始了解推荐系统》开看,抖音的推荐算法有两种,传统算法和优化后的算法。
传统算法是基于大数据的相似样本分析。比方说,用户 A 观看了内容 X、Y、Z,用户 B 观看了内容 X、Z、W,那么X 和 Z 之间就有较高的相似度。
通过计算内容之间的相似度,找到和你兴趣相似的用户,把他们感兴趣的内容也推荐给你。这就是“协同过滤”。
而优化后的算法吃了人工智能,也就是AI的发展红利。它依靠人工智能的分支之一——机器学习,通过数据和算法使人工智能能够模仿人类的学习方式,并逐渐提高准确性。
这样一来,算法无需理解“内容类型”或“开心愤怒情绪”等现实语义,而是通过运算,就能实现对用户“看完”“点赞”“收藏”某个内容的行为预测。
换句话说,以前的抖音推送主要依赖视频内容和标签。但现在,抖音可以通过你平时的点赞和收藏模拟出一个“你”,通过预测“你”的行为来推送内容给真实的你。
至于“信息茧房”问题,抖音在《算法和用户都想打破“信息茧房”》一文里还表示,实践发现,只推荐单一内容会使用户很快厌倦,导致用户体验与活跃度下降。
因此,抖音自己也想打破“信息茧房”,实质上就是平衡推荐的精准性和多样性。
主要方法有两个:一是通过兴趣多样性覆盖和帮助用户探索更多新兴趣,实现多样化推荐;
二是推荐内容建立多目标反馈,核心在于同时设置和优化多种不同的目标的计算方式,以构建更全面平衡的推荐策略吗,以此满足用户、平台或创作者的多样化需求。
总结一下,就是让你喜欢的视频类型更多,同时让创作者产出的更多种类、更优质的内容吸引你。


(图源:微博)
二、算法也有“不靠谱”的时候
不过,别高兴太早,由于技术等原因的限制,目前抖音的推荐算法还未到达“读心术”的境界,有时反倒像个反应慢半拍又过度热情的推销员,让你既爱又恨,只能默默吐槽。
你有没有经历过,当你咬牙决定减肥,算法却像失忆了一样,在夜深人静的时候,推送炸鸡点心轰炸你的味蕾、刺激你的食欲,让你在想吃和不能吃之间来回拉扯。
当你终于准备刷会手机就睡觉了,算法又跑出来给你推送优质的长视频,可谓是不知不觉被吸引,眼睛一睁又两点。
这体现出了推荐算法的滞后性。推荐算法跟不上需求的变化,导致我们只能一边对迟到的推送内容表示无奈,一边又被优质推送内容深深吸引。

(图源:微博)
“我刚在淘宝下单枕头,一打开抖音整个页面全是枕头,谁懂啊!”
你或许也经历过这样的事情,不知道为什么,不感兴趣的内容会一直被推荐,而感兴趣的内容即使专门搜索也不会被推荐,让人感觉十分霸道。
好似一旦推荐算法确定了你对某个事物的兴趣,它的推送就会如洪水泛滥一般,无处不在。
这也是抖音算法仍然不完善的体现之一,对“你”的模拟还不够充分,因此没能准确抓住我们的兴趣,反而是让不感兴趣的内容充斥用户页面,让用户体验大打折扣。

(图源:微博)
除此以外,有时抖音的推送太精准了反而会让人吃惊,然后疑惑“它是怎么知道的”,然后自然而然地担心“我是不是被窃听了啊”。
比如刚和朋友语音说想养猫,转头抖音就推送猫粮广告;办公室吐槽咖啡难喝,下午刷到三条"自制拿铁教程"……
这样的巧合在网上经常能看见,这也是人们对抖音争论不休的原因之一。
这次算法公开,抖音也明确回应了这个问题。在《App会“窃听”用户谈话吗》一文中,明确说app并不会窃听,原因有三:
第一,经济成本高昂。
一个每日活跃用户量达到1亿的App,保持常年“窃听”的成本将达到数千亿元,而在用户日常对话中,真正具有广告价值的有效信息比例极低。这就使得窃听的性价比极低。
第二,技术上也不存在窃听的可能。
技术上看,一旦手机被“偷听”,手机耗能会异常增加,出现掉电过快、发热发烫、CPU和内存占用高等现象,并且在没有开启权限的情况下,如果App进行“偷听”,超过1分钟会被操作系统切断,难以维持长期偷听状态。
第三,法律法规有明确的规定。
按照相关法律要求,App需经用户明确授权同意后才有权限访问手机麦克风。因此,正规的手机系统在收集声音数据方面有严格限制。
那么,这种“被窃听”的感觉从何而来呢?抖音在文中列出了两个原因。
一方面,是跨平台营销,也被称为 “程序化广告”,具体是指广告主根据用户在其应用中的偏好,在用户当前使用的 App 上进行的广告展示。
比如,如果A电商平台是B社交平台的广告主,那么当用户在A电商平台搜索了一款猫粮,再打开了B社交平台,就会发现B平台也在推荐猫粮。
这并不是B平台对用户做了监控,而是B平台通过程序化广告利用A平台的数据定向给用户展示了广告,实现跨平台的广告营销。
另一方面原因就是“幸存者偏差”,人们会将反常的巧合放大从而误认为这是必然发生的事情。
三、算法公开的影响
抖音把算法透明的做法无疑会带来一系列影响。
首先,算法透明有助于解决抖音一直以来被质疑算法的问题;
其次,有助于增强公对平台算法的理解,适应大数据时代;
最后,有利于增强公众对众平台的信任,既满足用户的安全感,又增进了抖音用户粘性。
然而,也要认清,目前推荐算法仍不完善,还有巨大的改善空间。我们可以期待,随着抖音推荐算法的进步,我们的日常使用体验会发生怎样的改变。
另外,对于优化后的推荐算法是否真的能破除“信息茧房”,也有人对此保持怀疑态度。毕竟即便有多样化推荐,我们仍会天然地被自己喜欢的东西吸引,而排斥不感兴趣的事物。

(图源:微博)
综合来看,抖音算法透明互联网发展有十分积极的意义,也能推动信息社会对人的关注的发展,但想要真正破除“信息茧房”仍需各方付出巨大努力。
2、电商号平台仅提供信息存储服务,如发现文章、图片等侵权行为,侵权责任由作者本人承担。
3、如对本稿件有异议或投诉,请联系:info@dsb.cn
