新闻推荐现有工作的调研
新闻推荐的特点
- 具有较强的时效性,相比于其它推荐任务,不能使用基于ID的MF方法,可用的用户交互数据较少
- 新闻文章往往简洁、准确。便于使用NLP模型进行处理
- 新闻中包含很多实体,往往成为文章的keyword;不同于之前的基于item的推荐,往往一个item只对应一个实体
新闻推荐的基本思路
对新闻进行分类,具体类别用向量来表示;对于用户的兴趣点采用相同向量空间来表示;最后将两者点乘得到数值表示用户对目标新闻的感兴趣的概率——即分别对news和user学得一个相同向量空间向量表示(不同向量空间则不能使用点乘,可用全连接网络)
相关论文
我们对新闻推荐的方法主要采取了两种分类方法,即是否使用知识图谱,是否使用时间序列。本文所包含的论文汇总如下:
题目 | 时间 | 会议 | 包含时间序列 | 包含知识图谱 |
---|---|---|---|---|
TEKGR | 2020 | CIKM | 是 | |
KRED | 2020 | RecSys | 是 | |
LSTUR | 2019 | ACL | 是 | |
NPA | 2019 | KDD | ||
DKN | 2018 | WWW | 是 | 是 |
DRN | 2018 | WWW |
NPA:
LSTUR:
目前新闻推荐的缺点
将用户未点击均视为负样例,容易陷入信息茧房
利用知识图谱对news进行embedding时,有时候title中的entity并不能表示表示新闻的类别以及全部内容
知识图谱对entity进行embedding时,向外发散到其他实体时,目前两种主要做法是:
- 无差别发散;
- 加入权重进行发散,即GAT;
但是没有对知识图谱进行裁剪,噪音还是很大的