推荐系统实践-利用社交网络进行推荐

前言

  • 本文为《推荐系统实践—项亮》第六章的学习笔记

1. 思维导图

  • 本章为《推荐系统实践—项亮》第六章的学习笔记

2. 社交网络数据简介

  • 社交网络数据的来源:

    • 电子邮件
    • 用户注册信息:比如公司、学校等
    • 用户的位置数据:IP地址或者GPS数据
    • 论坛和讨论组
    • 即时聊天工具
    • 社交网站
  • 社交网络数据主要有三种:

    • 双向确认的社交网络数据:在以Facebook和人人网为代表的社交网络中,用户A和B之间形成好友关系需要通过双方的确认。因此,这种社交网络一般可以通过无向图表示。
    • 单向关注的社交网络数据:在以Twitter和新浪微博为代表的社交网络中,用户A可以关注用户B而不需要得到用户B的允许,因此这种社交网络中的用户关系是单向的,可以通过有向图表示。
    • 基于社区的社交网络数据: 还有一种社交网络数据,用户之间并没有明确的关系,但是这种数据包含了用户属于不同社区的数据。比如豆瓣小组,属于同一个小组可能代表了用户兴趣的相似性。或者在论文数据集中,同一篇文章的不同作者也存在着一定的社交关系。或者是在同一家公司工作的人,或是同一个学校毕业的人等。
  • 社交网络数据中的长尾分布

3. 基于社交网络的推荐

  • 社会化推荐之所以受到很多网站的重视,是源于如下的优点:
    • 好友推荐可以增加推荐的信任度
    • 社交网络可以解决冷启动问题
  • 当然,社会化推荐有时候也有一定的缺点,主要是不一定提高推荐算法的离线精度,因为社交网络中好友关系不是基于共同兴趣产生的,所以用户好友的兴趣往往和用户的兴趣不一致。

3.1 基于邻域的社会化推荐算法

3.2 基于图的社会化推荐算法

-------------The End-------------
谢谢大锅请我喝杯阔乐~