Mozilla怒喷当前推荐系统技术:算法“陈旧弱智”,效果非常糟糕!

编译 | 核子可乐、Tina

Mozilla 喷当前视频平台引领者所使用的推荐系统技术:使用的算法“陈旧弱智”,效果非常“糟糕”,堪称“恐怖秀”。

根据 Mozilla 本周三发布的调查研究结果表明,大部分饱受用户们吐槽的 YouTube 视频推荐内容都出自该网站陈旧的 AI 算法之手。

该调查研究从去年 9 月开始启动,总共涉及到 37380 名 YouTube 观众。根据 Mozilla 的报告,这是同类研究中规模最大的一次,而且显示出来的结果只是“冰山的一角”,其中每项发现都值得进一步跟踪并做出深刻剖析。

Mozilla 敦促 YouTub 对内容审核与推荐模型予以透明化公开,并建议给用户提供退出个性化推荐的选项。但 YouTube 每季度从广告中获得的收入高达 60 亿美元,实现提供退出“个性化推荐“选项不太可能。

1这套推荐系统已经用了十几年,但还存在哪些问题?

对比成立于 2015 年的快手,2016 年上线的抖音, 创建于 2005 年的 YouTube 算是推荐系统技术的早期引路人。

YouTube 成立没多久,网站上的视频数量就迅猛增长,成为全球最大的视频网站。截止 2008 年,整个 YouTube 视频量已突破四千五百万,每分钟上传视频量 7 小时。截止 2014 年,每分钟上传视频量超过 100 小时。2019 年,月度活跃用户达 19 亿。如此庞大的视频量,使得用户难以搜索到其感兴趣的视频。YouTube 的成功最终得益于推荐系统,同时它也是实时大规模推荐系统技术的探路者。

虽然多年来一直被用户吐槽视频推荐效果,但 YouTube 在该研究方向上却处于业界前沿。几篇已经发表的论文显示,2008 年 YouTube 研究并使用了基于用户 - 视频图的随机遍历算法;2010 年,算法升级为基于物品的协同过滤算法;2013 年将推荐问题转换成多分类问题,并解决从神经网络最后的众多输出节点中找出最大概率的输出节点。此举也为 2016 年将推荐核心算法升级为深度学习算法打下了基础。这几篇论文《Video Suggestion and Discovery for YouTube》、《The YouTube Video Recommendation System》、《Label Partitioning For Sublinear Ranking》、《Deep Neural Networks for YouTube Recommendations》和《Recommending what video to watch next: A multitask ranking system》都是推荐系统的典范之作。

从去年开始,来自 190 个国家的总计 37380 名 YouTube 观众自愿参加了这项由 Mozilla 牵头开展的众包研究;在 2020 年 7 月至 2021 年 5 月期间,Mozzila 共收到 3362 份关于不感兴趣视频的提交报告。

根据本周三发布的调查结果,“YouTube 推荐算法自身只是问题的缩影,由此可以想见商业算法正在给民众的生活蒙上一层不透明、不确定的阴影。”

“YouTube 的算法每天向用户提供约 7 亿小时的视频观看时长,但公众对其底层运作方式可谓知之甚少。我们甚至找不到任何官方支持的研究方法。”

作为火狐浏览器的开发商,Mozilla 公司开发出一款名为 RegretsReporter 的浏览器扩展供 YouTube 用户们下载。在安装之后,该扩展程序会记录网民在 YouTube 上的观看活动、记录所观看视频的详细信息,并允许用户轻松标记出自己觉得根本不感兴趣的内容。通过将数据汇集起来并加以分析,Mozilla 希望深入研究 YouTube 推荐引擎的行为模式与实际效果。

这项研究的结果有几项亮点:

  • 志愿参与调查的用户们也有多种不同的抗拒理由,有些视频与政治阴谋论有关、有些是与 COVID-19 疫苗相关的虚假信息、也有一些是对热门大片《玩具总动员》的拙劣模仿。
  • Mozilla 研究人员发现,在志愿参与调查的用户们提交的全部不感兴趣视频中,有 71% 来自 YouTube 平台的 whiz-bang AI 推荐算法。
  • 他们估计,在被举报的视频中,甚至有 12.2% 的内容有违 YouTube 自己提出的视频管理方针及政策——换句话说,这些视频压根不应该出现在 YouTube 网站上,但推荐算法居然还将其广泛传阅。
  • 研究还发现,推荐的视频被志愿者举报的可能性比他们自己搜索到的视频高 40%。
  • 在 Mozilla 志愿者对视频进行负面反馈后,只有 43.6% 的推荐与志愿者之前观看的视频完全无关。
  • YouTube 推荐算法在非英语国家的表现似乎更差。其中巴西、德国与法国的推荐质量最差,美国和英国则分别排名第八位与第十六位。

2必须承认的是,当前软件并不够完美

多年来,YouTube 的视频推荐算法一直被指责通过向公众投放经过放大的仇恨言论、政治极端主义、虚假垃圾信息,助长了社会弊病,以此谋取数十亿人的眼球,从而增加广告收入。

虽然 YouTube 的母公司谷歌偶尔会对围绕算法爆发出来的反对意见做出回应:宣布一些政策调整,以及限制或清除奇怪的仇恨账户,但不确定 YouTube 什么时候会重启这些诱导用户点击不健康视频的规则。根据 Mozilla 的研究,YouTube 的人工智能仍然表现得如此糟糕,这也表明谷歌在用肤浅的改革主张模糊这方面的批评。

谷歌公司一位发言人在声明中表示,“我们这套推荐系统的目标,是帮助观众快速找到自己喜爱的内容。这套系统光是在主页上的单日推荐量就超过 2 亿条视频。”

“我们使用超过 800 亿条信息为推荐系统提供指引,包括观众对感兴趣内容的调查回复。我们一直致力于改善 YouTube 平台的观看体验;单在过去一年,我们就推出了 30 多项不同调整,希望减少有害内容的推荐比例。伴随这项举措,用户以推荐方式接触到极端视频内容的几率已经远低于 1%。”

据报道,YouTube 最终删除了近 200 个志愿者在这次调查中反馈过的视频。这些视频在被删除之前总共有 1.6 亿次观看。

YouTube 多年来一直在努力改善推荐系统,并不断调整以提高效果表现。但必须承认,这款自动化软件仍然不够完美——特别是还在将有违内容管理政策的视频推荐给用户。Mozilla 认为,造成这种结果的核心原因,在于 YouTube 一直对所使用的自家的推荐算法底层逻辑三缄其口。

报告指出,“我们认为,此次研究揭露出的总是还只是冰山一角;其中每项发现都值得进一步跟踪并做出深刻剖析。”

“我们还意识到,如果不加以干预并对 YouTube 算法开展更严格的审查,那么相关问题将继续失控蔓延,最终给整个互联网社区产生愈发恶劣的影响。尽管 YouTube 方面宣称已经在一部分问题上取得了进展,但研究人员几乎无法验证这些说法,也极难对 YouTube 推荐算法进行真正有意义的研究。”

Mozilla 公司认为,YouTube 应该发布关于其推荐系统工作原理的数据,并对内容审核与推荐模型予以透明化公开。只有这样,研究人员才能真正以独立方式对这款 AI 软件开展审计。

参考链接:

https://www.theregister.com/2021/07/08/youtubes_mozilla_algorithm/

今日荐文

点击下方图片即可阅读

才两年技术就已过时?微软 100 亿美元的云合同没了

 活动推荐

要做“全球物联网数据处理的第一品牌”,TDengine 成立 4 年,开源 2 年,融资到 B 轮,如今已经在 GitHub 上收获 15500+ Stars,3900+Forks,6800+Issues,成为最流行的的时序数据处理引擎之一。

TDengine 怎么一步步走到今天的?在技术和行业场景上有哪些最佳实践?

7 月 12 日,TDengine 将举行开源两周年纪念日直播活动,邀请业内大咖共话大数据和开源,并公布重磅社区回馈计划——灯塔计划。开源共创,彼此照亮,7 月 12 日线上直播等你来!扫描下图二维码预约直播,不见不散!