为了不被“算法推荐”带入信息茧房,在过去的两周里,我进行了一场“驯服”算法的实验。
如果算法能帮你迅速觅得真爱,你会心动吗?换种说法,如果你所有的相爱与分离都交给精密计算来定夺,你还会愿意吗?
在《黑镜》第四季里,《绞死DJ》讨论了一种算法——一款“终极”相亲软件。在这个由软件模拟出的世界里,每一个人都被写成“虚拟代码”,放入系统里进行“恋爱模拟”,见面地点、约会形式、相处时长均由系统指定。系统会记录下所有的恋爱数据,最终通过这些数据为每个人匹配“终极伴侣”——匹配度高达99.8%。
这个出现在反乌托邦英剧里的剧本设定,离我们的日常生活并不是很遥远。交友软件“探探”其实就在使用算法,你的每一次滑动屏幕都在进行算法训练,让它为你寻找匹配的对象。
如今,算法对你决策的影响远不止约会,它几乎涉及每一种日常行为:虾米音乐为你推荐歌单、淘宝为你定制的128元连衣裙、今日头条猜你喜欢的新闻、滴滴决定你的车费定价等等,均依靠算法来完成。
不信,你试试每天上淘宝搜大裤衩。接下来很长一段时间,你可能需要向算法解释自己,不断搜索、收藏别的物品来稀释“大裤衩”的浓度。
算法何以判断你喜欢“大裤衩”
认为你迷恋“大裤衩”的算法,其实是最常见的“推荐算法”,也是我们普通用户能看到的“大数据”的粗略影子。
而主打“推荐算法”的app都会告诉你,算法其实比你自己还要懂你,它能拥抱那个隐秘的你。听起来是不是很可怕,“推荐算法”的自信到底从何而来?这需要提一下它的基本原理,核心是基于你的历史信息找到与你的关联,对你“将”喜欢什么进行预测。也就是说,你提供的信息越多,它的预测就会越精准。
今日头条算法框架师曹欢欢博士曾公开分享,推荐原理主要考虑了四个方面的因素:内容上会通过文本分析提取不同内容类型的特征;用户特征则包括基本信息、各种兴趣标签,以及用户行为(比如你没有点击推荐给你的文章)等;环境特征是基于用户在不同场景中信息偏好不同。结合这三个维度,推荐模型会给出一个预估,即预测在某一场景下推荐某内容给你是否合适。
因此,推荐算法实质上是一个拟合用户对内容满意度的函数。这个函数需要输入上述三个维度的变量,而这三个变量都基于对用户信息的反馈,目的为了让用户感到愉悦。此外,还有第四个因素——协同特征,它通过用户行为分析出不同用户间的相似性,依靠“兴趣探索”和“泛化”来实现多元化推荐,但其根本点还是基于“相似”,内在逻辑是迎合着用户需求。
“推荐算法”的迎合,让我们只能听见让自己感到愉悦的声音,把相异的观点排除在外。埃利·帕雷瑟(Eli Pariser)在《过滤泡沫》中表达了担忧:“这些个性化算法,让只有和人们的意识形态一致的信息才会被呈现,人们的视野越来越窄,可以接触到多元化信息的机会也越来越少。”
相较“过滤气泡”,麻省理工学院的学者伊桑·扎克曼(Ethan Zuckerman)更担心由此带来“回音室“效应,“推荐算法”为每个人建立一间专有的“回音室”,所有人不断强化自己的固有认知并误以为就是真理,认为这会增加社会的两极分化,有孕育极端主义的风险。但对多数人来说,我们更担心“隐私”问题。
为了规避“隐私”泄漏的风险,也许可以进行一些实验,比如反向“驯养”算法。
你该如何反向驯养算法
德国社会学家马克斯·韦伯在探讨新教与资本主义精神的联系时,谈到了价值理性和工具理性的问题。工具理性强调行动,只为寻求功利的动机,借由理性达成预期目标,行动者追求效益最大化,忽视精神价值。个性化推荐算法系统,它充分体现了这种工具理性。
作为一个误认为自己具有“批判性”的文科生,我决定反向“驯养”算法,于是向很多朋友打听取经。一圈问下来,只有我的老板托马斯反向“驯养”过今日头条,以及我的朋友J尝试过互联网随机生活。
J是一个程序员,他习惯生活在一种随机中,比如听音乐,他从不注册音乐软件,坚持使用游客模式随机挑选音乐。再比如,他用朋友们的淘宝账号购物。说实话,我很难理解J的算法柔术,这听起来实在太费精力了。
相较之下,“驯养”今日头条这类app似乎更适合我。我购买了一张新的电话卡,试图制造一种拥有新身份的假象,然后抱着巨大的科学实验热情下载并注册了今日头条。我为自己打造了一个人设——热衷财经新闻的“高端”用户,正儿八经的关注了一堆财经类头条号,每天根据今日头条的算法推荐原理贩卖新人设。
在过去两周里,我回到家的第一件事,就是打开今日头条,怀着一种老母亲养蛙的心情“驯养”算法。最开始和使用搜索引擎一样,我会不断向它灌输我立的新人设,比如搜索“XX财经”、“5G”,以及关注商业大佬。接下来,每天花时间去阅读,耐着性子读各种分析长文,面带微笑地去点赞、评论、转发,让算法更深入的了解我的人设和人设喜欢的东西,由此衍生出庞大的推荐库。
基于对今日头条算法原理的分析,以及有意识的行为方式,我确实“驯养”了今日头条的App,让它看起来越来越像我的人设。伴随“算法”越来越像人设的喜悦而来的,还有这种战斗带来的疲惫感。这让我重新思考和“算法”的关系,以及该和它保持怎样的距离。
答案很简单,“算法”是工具,我们可以借助工具提高效率,但不能一味依赖。至于规避“过滤气泡”,你可能需要掌握一些小方法,比如最简单的降低算法推荐的使用、有意识“驯养”、可隐身的搜索引擎,以及借助 Terra Incognita推荐系统和可以自己控制过滤的社交媒体聚合器Gobo。除此之外,还有另外一种方法,提升算法运作过程的透明化,监测并控制“过滤气泡”的产生,比如使用Ghostery ——一款监测在线活动的工具。
其实,趋同性是一种古老的人类本能,算法通过工业效率强化了它。改变同质化信息流构建的“过滤气泡”,我们自己能做的也有很多。