新闻推荐现有工作的调研

新闻推荐的特点

  1. 具有较强的时效性,相比于其它推荐任务,不能使用基于ID的MF方法,可用的用户交互数据较少
  2. 新闻文章往往简洁、准确。便于使用NLP模型进行处理
  3. 新闻中包含很多实体,往往成为文章的keyword;不同于之前的基于item的推荐,往往一个item只对应一个实体

新闻推荐的基本思路

对新闻进行分类,具体类别用向量来表示;对于用户的兴趣点采用相同向量空间来表示;最后将两者点乘得到数值表示用户对目标新闻的感兴趣的概率——即分别对news和user学得一个相同向量空间向量表示(不同向量空间则不能使用点乘,可用全连接网络)

相关论文

我们对新闻推荐的方法主要采取了两种分类方法,即是否使用知识图谱,是否使用时间序列。本文所包含的论文汇总如下:

题目 时间 会议 包含时间序列 包含知识图谱
TEKGR 2020 CIKM
KRED 2020 RecSys
LSTUR 2019 ACL
NPA 2019 KDD
DKN 2018 WWW
DRN 2018 WWW

NPA:

LSTUR:

目前新闻推荐的缺点

  1. 将用户未点击均视为负样例,容易陷入信息茧房

  2. 利用知识图谱对news进行embedding时,有时候title中的entity并不能表示表示新闻的类别以及全部内容

  3. 知识图谱对entity进行embedding时,向外发散到其他实体时,目前两种主要做法是:

    1. 无差别发散;
    2. 加入权重进行发散,即GAT;

    但是没有对知识图谱进行裁剪,噪音还是很大的

作者

Xdren

发布于

2020-12-05

更新于

2021-03-01

许可协议

评论