本文选自网易云音乐推荐算法负责人-肖强前辈在全球人工智能峰会上的分享,主要介绍了三方面:关于网易云音乐,AI算法在音乐推荐中的应用和AI场景下的音乐思考。这里拿来分享给大家,并加上自己的理解,希望对大家有所帮助。
——文章概要
首先说明我是网易云音乐的深度用户,目前级别LV9,每天都会去听日推。喜欢网易云音乐的原因不仅是友好的用户交互设计,而且还是因为在网易云音乐中能看到一个个陌生的故事。虽不知这些故事是真是假,但总会找到一些共鸣,在这里像是一个心灵的寄托一样。我相信大多数人和我一样,喜欢在敲代码的时候戴上耳机,来一个燥一点的音乐,所有的事情与我无关,我只想专心写代码,哈哈,开篇小小的题外话,下面进入正题。
本文将从三个方面介绍AI算法在网易云音乐推荐中的应用:
- 关于网易云音乐
- AI算法在音乐推荐中的应用
- 音乐场景下的AI思考
关于网易云音乐
关于网易云音乐的介绍就不用多说了,相信大家都知道这个产品。但是这个产品里边也有很多其他的业务,如下这些。当然推荐也会在各个业务线进行应用,最大化的提高用户体验。
AI算法在音乐推荐中的应用
除了上图中介绍的三个场景以外,推荐在云音乐还有其他很多的应用,比如推荐的MV/视频,推荐的电台,推荐的Look直播等。
几乎所有的推荐系统或者业务系统的分析和底层数据支持都离不开用户的行为日志,在对基础的日志进行ETL处理之后,进行数仓的存储,画像模型,特征工程等均基于这个日志来进行构建。
在此之上这是推荐系统的召回模块,然后进行粗排,精排和展示。这是所有推荐系统的通用架构,然后各个公司,各个部门会在此基础上进行适合各自业务的开发和精细化应用,以适应具体的需求,继而最大化的发挥推荐系统的价值。
不同的业务场景下,推荐的侧重点和实现方法是不一样的。音乐推荐,视频推荐,商品推荐,新闻推荐等,这些各自有各自的特点,音乐本身的复杂性,就要要求系统能够更好的理解音乐,网易云音乐则主要从NLP和视频,图像层面去理解音乐。
传统的CF算法应用的是余弦相似度或者Jaccard距离进行计算,云音乐这里则对其相似度计算方法进行了优化,其计算公式如上图所示,与传统相比,效果提升显著。PS:CF即协同过滤,虽然传统,但是在推荐中扮演的角色至关重要。
接下来主要介绍下云音乐中的排序模型,其经历了线性模型,树模型,FTRL,深度学习模型,深度时序模型。PS:不过在这里小编要提醒的,做排序模型要一步一个脚印,一步一步来,我们不可能在建设推荐系统之时,直接上深度学习,因为只有经历过每个阶段的排序模型,我们才能更好的去理解业务,去提升业务。
音乐场景下的AI思考
当某种算法在推荐中发挥的价值很难再进行提升时,我们需要进行的是业务的深层次的思考和对更加有效或者先进的算法进行探索。