精华内容
下载资源
问答
  • 协同课堂教学满意度影响因素实证研究——C语言程序设计协同课堂例.pdf
  • 交通运输行业企业主体协同创新平台.pptx
  • 协同协同进化算法研究
  • 基于协同学原理,集对分析中的联系度替代协同度,构建淮南市经济发展与生态环境系统协同评价模型,对淮南市2008—2017年经济发展与生态环境系统发展的协同情况进行分析。结果表明:2016年以前,淮南市经济发展系统有序...
  • 为了摸清目前高校科技协同创新机制运行现状及其存在的问题,湖北高校样例依托,从高校科技协同创新依托平台、筛选机制、转移机制、政策支持机制及利益整合机制五方面切入,对其进行了实证剖析。结果发现,尽管目前...
  • 协同过滤

    2017-05-22 23:11:41
    协同过滤 PPT
  • 基于MRF的大规模协同作业调度协同协同进化
  • 基于复杂协同度模型我国公立医院与医疗保险协同关系研究:2009-2018年截面数据例.pdf
  • 减排和适应是全球应对气候变化的两大任务。发展中国家对气候变化不利...广东省例,增量型适应活动和能源领域减排措施的协同效应主要体现在以下3个方面:工程性适应项目建设与低碳能源生产、消费的关联效应,提高能效
  • 协同办公系统需求协同办公系统需求协同办公系统需求
  • 山西省临汾市作为研究对象,运用协同理论和RBF神经网络对临汾市生态经济系统进行研究。实证结果表明:2008—2019年,临汾市经济系统得到长足发展,生态经济协同发展水平不高,生态系统成为制约临汾市复合系统协同发展的...
  • 基于协同效应的现代农业产业链构建-都昌县例,查明珠,石英,
  • 文章目录介绍1.基于用户的协同过滤推荐2.基于项目(物品)的协同过滤推荐3....基于邻居的历史偏好信息,当前用户进行推荐。 即:归类相似用户ABC,推荐用户BC的物品给用户A 优点:可以间接发现相似用户的潜在兴

    一、介绍

    1.基于用户的协同过滤推荐

    基于用户的协同过滤推荐的基本原理是,根据所有用户对物品或者信息的偏好,发现与当前用户口味和偏好相似的“邻居”用户群。基于邻居的历史偏好信息,为当前用户进行推荐。
    即:归类相似用户ABC,推荐用户BC的物品给用户A
    在这里插入图片描述

    2.基于项目(物品)的协同过滤推荐

    基于项目的协同过滤推荐的基本原理是,使用所有用户对物品或者信息的偏好,发现物品和物品之间的相似度,然后根据用户的历史偏好信息,将类似的物品推荐给用户。
    即:归类相似物品ABC,推荐物品BC给购买了物品A的用户
    在这里插入图片描述
    详细区别见下表:

    -基于用户的协同过滤基于物品的协同过滤
    性能一般用于用户数小于物品数的场景(新闻博客社交类),用户太多时用户相似度矩阵计算代价大同理,一般用于物品数小于用户数的场景(购物类)
    领域时效性强,总是推送热门物品长尾物品丰富,用户个性化需求强
    实时性用户有新行为,不一定造成推荐结果立马变化用户有新行为会导致推荐结果变化
    推荐理由利用与当前用户相似的其他用户的行为给用户推荐做解释利用当前用户的历史行为给用户推荐做解释

    ps:
    1.用户协同场景下,系统会给出这种解释,某某和你有相似兴趣的人也看了这本书,这种解释适用于社交性较强用户彼此之间本身就有一定联系的网站,用户可能认识这个人,所以解释会令人信服。
    2.物品协同场景下,系统会给出这种解释,这本书和你以前看的某本书相似,这种解释在任意场景下都是一个不错的解释。

    3.基于模型的协同过滤推荐

    基于模型的协同过滤推荐就是基于样本的用户喜好信息,训练一个推荐模型,然后根据实时的用户喜好的信息进行预测,计算推荐。
    优点:1它不需要对物品或者用户进行严格的建模。2推荐是开放的,可以共用他人的经验
    缺点:1用户历史偏好是用稀疏矩阵进行存储的,而稀疏矩阵上的计算有些明显的问题,包括可能少部分人的错误偏好会对推荐的准确度有很大的影响等等。2方法更新迭代慢。


    二、实现步骤

    1.用户协同过滤和物品协同过滤的实现方法

    1)收集用户偏好

    将不同的行为进行分组:
    用户行为:查看、推荐、购买、借还、收藏等
    物品行为:被查看、被推荐、被购买等

    然后基于不同的行为,计算不同的用户 / 物品相似度。类似于
    “查看了这本图书的人还查看了A …”
    “没有搜到此书,但为您推荐类似图书B”
    “和你同一专业的人都在看这些书”

    加权操作:
    根据不同行为反映用户喜好的程度将它们进行加权,得到用户对于物品的总体喜好。一般来说,显式的用户反馈比隐式的权值大,但比较稀疏,毕竟进行显示反馈的用户是少数;同时相对于“查看”,“购买”行为反映用户喜好的程度更大,但这也因应用而异。

    收集了用户行为数据之后需要对数据进行预处理,主要就是 减噪 和 归一化。

    减噪
    用户行为数据是用户在使用应用过程中产生的,它可能存在大量的噪音和用户的误操作,可以通过一些算法过滤掉行为数据中的噪音。

    归一化
    将各个行为的数据统一在一个相同的取值范围中。最简单的归一化处理,就是将各类数据除以此类中的最大值,以保证归一化后的数据取值在 [0,1] 范围中。

    进行的预处理后,根据不同应用的行为分析方法,可以选择分组或者加权处理,之后可以得到一个用户偏好的二维矩阵,一维是用户列表,另一维是物品列表,值是用户对物品的偏好,一般是 [0,1]或者[-1, 1]的浮点数值。

    最后形成如下的 用户偏好表 或者 物品偏好表

    用户偏好表物品1物品2物品3物品4物品5
    用户10.50.80.10.3-
    用户20.8-0.2-0.2
    用户3-0.20.810.8
    物品偏好表用户1用户2用户3用户4用户5
    物品10.10.80.10.7-
    物品20.21--0.2
    物品3-0.20.910.3

    2)计算用户或物品的相似度

    采用余弦相似度算法比较相似性(余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比距离度量,余弦相似度更加注重两个向量在方向上的差异,而非距离或长度上)。
    在这里插入图片描述
    在这里插入图片描述
    计算形成如下相似度表

    用户相似度权值表用户A用户B用户C
    用户A10.30.4
    用户B0.810.2
    用户C-0.91
    物品相似度权值表物品A物品B物品C
    物品A10.50.9
    物品B0.81-
    物品C0.10.21

    ps:相似度权值归一化在[0,-1]或者[-1,1]之间

    3)推荐

    相似度矩阵 x 偏好矩阵 = 推荐列表
    ps:矩阵相乘前需要先将缺失值补充为所有权值的平均值,否则相乘后的推荐矩阵会倾向于评价人数多的物品,而不是评价结果高的物品。如果不想对权值进行补充,可以单独计算不使用矩阵相乘的方法。

    根据上面的相似度表查询出相似用户或相似物品 结合不同场景进行推荐

    2.模型协同过滤的实现方法

    1)待补充,根据具体需求实现

    展开全文
  • 协同通信软件

    2017-08-24 16:59:18
    协同通信
  • B2CB2C 模式下企业与消费者协同演化和动态能力分析 模式下企业与消费者协同演化和动态能力分析 B2CB2C 模式下企业与消费者协同演化和动态能力分析模式下企业与消费者协同演化和动态能力分析 京东京东...
  • 信呼协同办公系统是开源的一款办公系统,跨平台的系统,支持APP,pc网页版,pc客户端等。 简介: 1、让每个企业单位都有自己的工作系统。 2、移动,免费开源工作系统,数据全部自己管理。 3、自定义管理应用,模块...
  • 产学研协同创新的协同效应研究.doc
  • 协同程序

    千次阅读 2014-02-24 17:54:38
    1. 什么是协同程序  在主程序运行时同时开启另一段逻辑处理,来协同当前程序的执行。换句话说,开启协同程序就是开启一个线程。   2. 协同程序的开启与终止  在Unity3D中,使用MonoBehaviour....
    1. 什么是协同程序
    

          在主程序运行时同时开启另一段逻辑处理,来协同当前程序的执行。换句话说,开启协同程序就是开启一个线程。
     
    2. 协同程序的开启与终止

           在Unity3D中,使用MonoBehaviour.StartCoroutine方法即可开启一个协同程序,也就是说 该方法必须在 MonoBehaviour 或继承于MonoBehaviour的类中调用。

            在Unity3D中,使用StartCoroutine(string methodName)和StartCoroutine(IEnumerator routine)都可以开启一个线程。区别在于使用字符串作为参数可以开启线程并在线程结束前终止线程,相反使用IEnumerator 作为参数只能等待线程的结束而不能随时终止(除非使用StopAllCoroutines()方法);另外使用字符串作为参数时,开启线程时最多只能传递 一个参数,并且性能消耗会更大一点,而使用IEnumerator 作为参数则没有这个限制。

            在Unity3D中,使用StopCoroutine(string methodName)来终止一个协同程序,使用StopAllCoroutines()来终止所有可以终止的协同程序,但这两个方法都只能终止该 MonoBehaviour中的协同程序。


            还有一种方法可以终止协同程序,即将协同程序所在gameobject的active属性设置为false,当再次设置active为ture时,协同程序并不会再开启;如是将协同程序所在脚本的enabled设置为false则不会生效。这是因为协同程序被开启后作为一个线程在运行,而 MonoBehaviour也是一个线程,他们成为互不干扰的模块,除非代码中有调用,他们共同作用于同一个对象,只有当对象不可见才能同时终止这两个线 程。然而,为了管理我们额外开启的线程,Unity3D将协同程序的调用放在了MonoBehaviour中,这样我们在编程时就可以方便的调用指定脚本 中的协同程序,而不是无法去管理,特别是对于只根据方法名来判断线程的方式在多人开发中很容易出错,这样的设计保证了对象、脚本的条理化管理,并防止了重 名。


    3. 协同程序的输入、输出类型

            协同程序的返回类型为Coroutine类型。在Unity3D中,Coroutine类继承于YieldInstruction,所以,协同程序的返回类型只能为null、等待的帧数(frame)以及等待的时间。

            协同程序的参数不能指定ref、out参数。但是,我们在使用WWW类时会经常使用到协同程序,由于在协同程序中不能传递参数地址(引用),也不能输出对 象,这使得每下载一个WWW对象都得重写一个协同程序,解决这个问题的方法是建立一个基于WWW的类,并实现一个下载方法。如下:

    usingUnityEngine;
    usingSystem.Collections;
    
    public class WWWObject:MonoBehaviour
    {
     public WWW www;
     
     public WWWObject(string url)
     {
      if(GameVar.wwwCache)
       www = WWW.LoadFromCacheOrDownload(url,GameVar.version);
      else
       www =new WWW(url);
     }
     
     public IEnumerator Load()
     {
      Debug.Log("Start loading : "+www.url);
      while(!www.isDone)
      {
       if(GameVar.gameState ==GameState.Jumping||GameVar.gameState ==GameState.JumpingAsync)
        LoadScene.progress =www.progress;
       
       yield return 1;
      }
    
      if(www.error!=null)
       Debug.LogError("Loading error : "+www.url+"\n"+www.error);
      else
       Debug.Log("End loading : "+www.url);
     }
     
     public IEnumerator LoadWithTip(string resourcesName)
     {
      Debug.Log("Start loading : "+www.url);
      LoadScene.tipStr =  "Downloading  resources <"+ resourcesName +"> . . .";
      while(!www.isDone)
      {
       if(GameVar.gameState ==GameState.Jumping||GameVar.gameState ==GameState.JumpingAsync)
        LoadScene.progress =www.progress;
       
       yield return 1;
      }
    
      if(www.error!=null)
       Debug.LogError("Loading error : "+www.url+"\n"+www.error);
      else
       Debug.Log("End loading : "+www.url);
     }
    }
    
    调用:
    usingUnityEngine;
    usingSystem.Collections;
    usingSystem.Collections.Generic;
    
    public class LoadResources:MonoBehaviour
    {
     static string url ="http://61.149.211.88/Package/test.unity3d";
     public static WWW www =null;
    
     IEnumerator Start()
     {
      if(!GameVar.resourcesLoaded)
      {  
       GameVar.gameState =GameState.Jumping;
       
       WWWObject obj =newWWWObject(url);
       www = obj.www;
       yield return StartCoroutine(obj.LoadWithTip("Textures"));
       
       GameVar.resourcesLoaded =true;
       GameVar.gameState =GameState.Run;
      }
     }
    }
    


    
    
    展开全文
  • 协同协同进化算法设计的动态优化方法
  • 无人机协同目标的多无人机协同搜索方法
  • 协同滤波

    千次阅读 2018-08-21 16:09:25
    一、什么是协同过滤:人类聚,物以群分 类似于图像处理中使用超像素信息,协同过滤是利用集体智慧的一个典型方法。推荐系统的首要问题是了解你的用户,然后才能给出更好的推荐。 概念:协同过滤一般是在海量的...

    一、什么是协同过滤:人以类聚,物以群分

    类似于图像处理中使用超像素信息,协同过滤是利用集体智慧的一个典型方法。推荐系统的首要问题是了解你的用户,然后才能给出更好的推荐。

    概念:协同过滤一般是在海量的用户中发掘出一小部分和你品位(偏好)比较类似的,在协同过滤中,这些用户成为邻居,然后根据他们喜欢的其他东西组织成一个排序的目录作为推荐给你。

    核心的问题:

    • 如何确定一个用户是不是和你有相似的品位?
    • 如何将邻居们的喜好组织成一个排序的目录?

    主要的功能:预测和推荐。

    分类:基于用户的协同过滤算法(user-based collaboratIve filtering),和基于物品的协同过滤算法(item-based collaborative filtering)。

    二、协同过滤的基本流程

    首先,要实现协同过滤,需要以下几个步骤

    • 收集用户偏好
    • 找到相似的用户或物品
    • 计算推荐

    1、收集用户偏好

    要从用户的行为和偏好中发现规律,并基于此给予推荐,如何收集用户的偏好信息成为系统推荐效果最基础的决定因素。用户有很多方式向系统提供自己的偏好信息,而且不同的应用也可能大不相同,下面举例进行介绍:

    以上列举的用户行为都是比较通用的,推荐引擎设计人员可以根据自己应用的特点添加特殊的用户行为,并用他们表示用户对物品的喜好。在一般应用中,我们提取的用户行为一般都多于一种,关于如何组合这些不同的用户行为,基本上有以下两种方式:

    • 将不同的行为分组 
      一般可以分为“查看”和“购买”等等,然后基于不同的行为,计算不同的用户 / 物品相似度。类似于当当网或者 Amazon 给出的“购买了该图书的人还购买了 ...”,“查看了图书的人还查看了 ...”

    • 加权操作 
      根据不同行为反映用户喜好的程度将它们进行加权,得到用户对于物品的总体喜好。一般来说,显式的用户反馈比隐式的权值大,但比较稀疏,毕竟进行显示反馈的用户是少数;同时相对于“查看”,“购买”行为反映用户喜好的程度更大,但这也因应用而异。

    收集了用户行为数据,我们还需要对数据进行一定的预处理,其中最核心的工作就是:减噪和归一化。

    • 减噪 
      用户行为数据是用户在使用应用过程中产生的,它可能存在大量的噪音和用户的误操作,我们可以通过经典的数据挖掘算法过滤掉行为数据中的噪音,这样可以是我们的分析更加精确。

    • 归一化 
      如前面讲到的,在计算用户对物品的喜好程度时,可能需要对不同的行为数据进行加权。但可以想象,不同行为的数据取值可能相差很大,比如,用户的查看数据必然比购买数据大的多,如何将各个行为的数据统一在一个相同的取值范围中,从而使得加权求和得到的总体喜好更加精确,就需要我们进行归一化处理。最简单的归一化处理,就是将各类数据除以此类中的最大值,以保证归一化后的数据取值在 [0,1] 范围中。

    进行的预处理后,根据不同应用的行为分析方法,可以选择分组或者加权处理,之后我们可以得到一个用户偏好的二维矩阵,一维是用户列表,另一维是物品列表,值是用户对物品的偏好,一般是 [0,1] 或者 [-1, 1] 的浮点数值。

    2、找到相似的用户或物品

    当已经对用户行为进行分析得到用户喜好后,我们可以根据用户喜好计算相似用户和物品,然后基于相似用户或者物品进行推荐,这就是最典型的 CF 的两个分支:基于用户的 CF 和基于物品的 CF。这两种方法都需要计算相似度,下面我们先看看最基本的几种计算相似度的方法。
    (1)、相似度的计算 
    关于相似度的计算,现有的几种基本方法都是基于向量(Vector)的,其实也就是计算两个向量的距离,距离越近相似度越大。在推荐的场景中,在用户 - 物品偏好的二维矩阵中,我们可以将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度,或者将所有用户对某个物品的偏好作为一个向量来计算物品之间的相似度。下面我们详细介绍几种常用的相似度计算方法:

    • 欧几里德距离(Euclidean Distance)

    最初用于计算欧几里德空间中两个点的距离,假设 x,y 是 n 维空间的两个点,它们之间的欧几里德距离是: 

    可以看出,当 n=2 时,欧几里德距离就是平面上两个点的距离。 
    当用欧几里德距离表示相似度,一般采用以下公式进行转换:距离越小,相似度越大。 

    • 皮尔逊相关系数(Pearson Correlation Coefficient)

    皮尔逊相关系数一般用于计算两个定距变量间联系的紧密程度,它的取值在 [-1,+1] 之间。 

    sx, sy是 x 和 y 的样品标准偏差。

    • Cosine 相似度(Cosine Similarity)

    Cosine 相似度被广泛应用于计算文档数据的相似度: 

    Tanimoto 系数(Tanimoto Coefficient)

    • Tanimoto 系数

    也称为 Jaccard 系数,是 Cosine 相似度的扩展,也多用于计算文档数据的相似度: 

    2、相似邻居的计算 
    介绍完相似度的计算方法,下面我们看看如何根据相似度找到用户 - 物品的邻居,常用的挑选邻居的原则可以分为两类:图 1 给出了二维平面空间上点集的示意图。 
    图 1 相似邻居计算示意图

    • 固定数量的邻居:K-neighborhoods 或者 Fix-size neighborhoods

    不论邻居的“远近”,只取最近的 K 个,作为其邻居。如图 1 中的 A,假设要计算点 1 的 5- 邻居,那么根据点之间的距离,我们取最近的 5 个点,分别是点 2,点 3,点 4,点 7 和点 5。但很明显我们可以看出,这种方法对于孤立点的计算效果不好,因为要取固定个数的邻居,当它附近没有足够多比较相似的点,就被迫取一些不太相似的点作为邻居,这样就影响了邻居相似的程度,比如图 1 中,点 1 和点 5 其实并不是很相似。

    • 基于相似度门槛的邻居:Threshold-based neighborhoods

    与计算固定数量的邻居的原则不同,基于相似度门槛的邻居计算是对邻居的远近进行最大值的限制,落在以当前点为中心,距离为 K 的区域中的所有点都作为当前点的邻居,这种方法计算得到的邻居个数不确定,但相似度不会出现较大的误差。如图 1 中的 B,从点 1 出发,计算相似度在 K 内的邻居,得到点 2,点 3,点 4 和点 7,这种方法计算出的邻居的相似度程度比前一种优,尤其是对孤立点的处理。

    3、计算推荐

    经过前期的计算已经得到了相邻用户和相邻物品,下面介绍如何基于这些信息为用户进行推荐。

    • 基于用户的 CF(User CF)

    基于用户的 CF 的基本思想相当简单,基于用户对物品的偏好找到相邻邻居用户,然后将邻居用户喜欢的推荐给当前用户。计算上,就是将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度,找到 K 邻居后,根据邻居的相似度权重以及他们对物品的偏好,预测当前用户没有偏好的未涉及物品,计算得到一个排序的物品列表作为推荐。图 2 给出了一个例子,对于用户 A,根据用户的历史偏好,这里只计算得到一个邻居 - 用户 C,然后将用户 C 喜欢的物品 D推荐给用户 A。
    图 2 基于用户的 CF 的基本原理

    • 基于物品的 CF(Item CF)

    基于物品的 CF 的原理和基于用户的 CF 类似,只是在计算邻居时采用物品本身,而不是从用户的角度,即基于用户对物品的偏好找到相似的物品,然后根据用户的历史偏好,推荐相似的物品给他。从计算的角度看,就是将所有用户对某个物品的偏好作为一个向量来计算物品之间的相似度,得到物品的相似物品后,根据用户历史的偏好预测当前用户还没有表示偏好的物品,计算得到一个排序的物品列表作为推荐。图 3 给出了一个例子,对于物品 A,根据所有用户的历史偏好,喜欢物品 A 的用户都喜欢物品 C,得出物品 A 和物品 C 比较相似,而用户 C 喜欢物品 A,那么可以推断出用户 C 可能也喜欢物品 C。

    图 3 基于物品的 CF 的基本原理 

    4、两种算法的比较

    前面介绍了 User CF 和 Item CF 的基本原理,下面我们分几个不同的角度深入看看它们各自的优缺点和适用场景:

    • 计算复杂度

    Item CF 和 User CF 是基于协同过滤推荐的两个最基本的算法,User CF 是很早以前就提出来了,Item CF 是从 Amazon 的论文和专利发表之后(2001 年左右)开始流行,大家都觉得 Item CF 从性能和复杂度上比 User CF 更优,其中的一个主要原因就是对于一个在线网站,用户的数量往往大大超过物品的数量,同时物品的数据相对稳定,因此计算物品的相似度不但计算量较小,同时也不必频繁更新。但我们往往忽略了这种情况只适应于提供商品的电子商务网站,对于新闻,博客或者微内容的推荐系统,情况往往是相反的,物品的数量是海量的,同时也是更新频繁的,所以单从复杂度的角度,这两个算法在不同的系统中各有优势,推荐引擎的设计者需要根据自己应用的特点选择更加合适的算法。

    • 适用场景

    在非社交网络的网站中,内容内在的联系是很重要的推荐原则,它比基于相似用户的推荐原则更加有效。比如在购书网站上,当你看一本书的时候,推荐引擎会给你推荐相关的书籍,这个推荐的重要性远远超过了网站首页对该用户的综合推荐。可以看到,在这种情况下,Item CF 的推荐成为了引导用户浏览的重要手段。同时 Item CF 便于为推荐做出解释,在一个非社交网络的网站中,给某个用户推荐一本书,同时给出的解释是某某和你有相似兴趣的人也看了这本书,这很难让用户信服,因为用户可能根本不认识那个人;但如果解释说是因为这本书和你以前看的某本书相似,用户可能就觉得合理而采纳了此推荐。相反的,在现今很流行的社交网络站点中,User CF 是一个更不错的选择,User CF 加上社会网络信息,可以增加用户对推荐解释的信服程度。

    • 推荐多样性和精度

    研究推荐引擎的学者们在相同的数据集合上分别用 User CF 和 Item CF 计算推荐结果,发现推荐列表中,只有 50% 是一样的,还有 50% 完全不同。但是这两个算法确有相似的精度,所以可以说,这两个算法是很互补的。
    关于推荐的多样性,有两种度量方法: 
    第一种度量方法是从单个用户的角度度量,就是说给定一个用户,查看系统给出的推荐列表是否多样,也就是要比较推荐列表中的物品之间两两的相似度,不难想到,对这种度量方法,Item CF 的多样性显然不如 User CF 的好,因为 Item CF 的推荐就是和以前看的东西最相似的。
    第二种度量方法是考虑系统的多样性,也被称为覆盖率 (Coverage),它是指一个推荐系统是否能够提供给所有用户丰富的选择。在这种指标下,Item CF 的多样性要远远好于 User CF, 因为 User CF 总是倾向于推荐热门的,从另一个侧面看,也就是说,Item CF 的推荐有很好的新颖性,很擅长推荐长尾里的物品。所以,尽管大多数情况,Item CF 的精度略小于 User CF, 但如果考虑多样性,Item CF 却比 User CF 好很多。
    如果你对推荐的多样性还心存疑惑,那么下面我们再举个实例看看 User CF 和 Item CF 的多样性到底有什么差别。首先,假设每个用户兴趣爱好都是广泛的,喜欢好几个领域的东西,不过每个用户肯定也有一个主要的领域,对这个领域会比其他领域更加关心。给定一个用户,假设他喜欢 3 个领域 A,B,C,A 是他喜欢的主要领域,这个时候我们来看 User CF 和 Item CF 倾向于做出什么推荐:如果用 User CF, 它会将 A,B,C 三个领域中比较热门的东西推荐给用户;而如果用 ItemCF,它会基本上只推荐 A 领域的东西给用户。所以我们看到因为 User CF 只推荐热门的,所以它在推荐长尾里项目方面的能力不足;而 Item CF 只推荐 A 领域给用户,这样他有限的推荐列表中就可能包含了一定数量的不热门的长尾物品,同时 Item CF 的推荐对这个用户而言,显然多样性不足。但是对整个系统而言,因为不同的用户的主要兴趣点不同,所以系统的覆盖率会比较好。

    • 总结

    从上面的分析,可以很清晰的看到,这两种推荐都有其合理性,但都不是最好的选择,因此他们的精度也会有损失。其实对这类系统的最好选择是,如果系统给这个用户推荐 30 个物品,既不是每个领域挑选 10 个最热门的给他,也不是推荐 30 个 A 领域的给他,而是比如推荐 15 个 A 领域的给他,剩下的 15 个从 B,C 中选择。所以结合 User CF 和 Item CF 是最优的选择,结合的基本原则就是当采用 Item CF 导致系统对个人推荐的多样性不足时,我们通过加入 User CF 增加个人推荐的多样性,从而提高精度,而当因为采用 User CF 而使系统的整体多样性不足时,我们可以通过加入 Item CF 增加整体的多样性,同样同样可以提高推荐的精度。

    • 用户对推荐算法的适应度

    前面我们大部分都是从推荐引擎的角度考虑哪个算法更优,但其实我们更多的应该考虑作为推荐引擎的最终使用者 -- 应用用户对推荐算法的适应度。 
    对于 User CF,推荐的原则是假设用户会喜欢那些和他有相同喜好的用户喜欢的东西,但如果一个用户没有相同喜好的朋友,那 User CF 的算法的效果就会很差,所以一个用户对的 CF 算法的适应度是和他有多少共同喜好用户成正比的。
    Item CF 算法也有一个基本假设,就是用户会喜欢和他以前喜欢的东西相似的东西,那么我们可以计算一个用户喜欢的物品的自相似度。一个用户喜欢物品的自相似度大,就说明他喜欢的东西都是比较相似的,也就是说他比较符合 Item CF 方法的基本假设,那么他对 Item CF 的适应度自然比较好;反之,如果自相似度小,就说明这个用户的喜好习惯并不满足 Item CF 方法的基本假设,那么对于这种用户,用 Item CF 方法做出好的推荐的可能性非常低。

    四、实例演示

    1、基于用户的协同过滤算法

    基于用户的协同过滤算法是通过用户的历史行为数据发现用户对商品或内容的喜欢(如商品购买,收藏,内容评论或分享),并对这些喜好进行度量和打分。根据不同用户对相同商品或内容的态度和偏好程度计算用户之间的关系。在有相同喜好的用户间进行商品推荐。简单的说就是如果A,B两个用户都购买了x,y,z三本图书,并且给出了5星的好评。那么A和B就属于同一类用户。可以将A看过的图书w也推荐给用户B。

    • 寻找偏好相似的用户

    我们模拟了5个用户对两件商品的评分,来说明如何通过用户对不同商品的态度和偏好寻找相似的用户。在示例中,5个用户分别对两件商品进行了评分。这里的分值可能表示真实的购买,也可以是用户对商品不同行为的量化指标。例如,浏览商品的次数,向朋友推荐商品,收藏,分享,或评论等等。这些行为都可以表示用户对商品的态度和偏好程度。

    从表格中很难直观发现5个用户间的联系,我们将5个用户对两件商品的评分用散点图表示出来后,用户间的关系就很容易发现了。在散点图中,Y轴是商品1的评分,X轴是商品2的评分,通过用户的分布情况可以发现,A,C,D三个用户距离较近。用户A(3.3 6.5)和用户C(3.6 6.3),用户D(3.4 5.8)对两件商品的评分较为接近。而用户E和用户B则形成了另一个群体。

    散点图虽然直观,但无法投入实际的应用,也不能准确的度量用户间的关系。因此我们需要通过数字对用户的关系进行准确的度量,并依据这些关系完成商品的推荐。

    • 欧几里德距离评价

    欧几里德距离评价是一个较为简单的用户关系评价方法。原理是通过计算两个用户在散点图中的距离来判断不同的用户是否有相同的偏好。公式参考上面的介绍。 
    通过公式我们获得了5个用户相互间的欧几里德系数,也就是用户间的距离。系数越小表示两个用户间的距离越近,偏好也越是接近。不过这里有个问题,太小的数值可能无法准确的表现出不同用户间距离的差异,因此我们对求得的系数取倒数,使用户间的距离约接近,数值越大。在下面的表格中,可以发现,用户A&C用户A&D和用户C&D距离较近。同时用户B&E的距离也较为接近。与我们前面在散点图中看到的情况一致。

    • 皮尔逊相关度评价

    皮尔逊相关度评价是另一种计算用户间关系的方法。他比欧几里德距离评价的计算要复杂一些,但对于评分数据不规范时皮尔逊相关度评价能够给出更好的结果。以下是一个多用户对多个商品进行评分的示例。这个示例比之前的两个商品的情况要复杂一些,但也更接近真实的情况。我们通过皮尔逊相关度评价对用户进行分组,并推荐商品。

    这里我们使用用户评分数据如下:其中P1-P5表示五个用户,A-F表示六个商品。

    • 皮尔逊相关系数

    皮尔逊相关系数的计算公式参考上面介绍,结果是一个在-1与1之间的系数。该系数用来说明两个用户间联系的强弱程度。 假如我们需要给P5用户推荐东西,那么我们需要计算P5和P1-4的皮尔逊相关系数。计算结果如下:

     

     
    1. p5与p4之间的相关系数:0.3674234614174766

    2. p5与p3之间的相关系数:0.9185586535436919

    3. p5与p2之间的相关系数:0.6605782590758166

    4. p5与p1之间的相关系数:0.43915503282684004



     

     

    • 为相似的用户提供推荐物品

    目前我们得到的数据情况如下:我们需要为P5推荐三部电影中的一部,有直接推荐和加权排序推荐两种方法。

    直接推荐:假如我们需要为用户P5推荐电影,首先我们检查相似度列表,发现用户P5和用户P3的相似度最高。因此,我们可以对用户P5推荐P3的相关数据。但这里有一个问题。我们不能直接推荐前面A-F的商品。因为这这些商品用户P5已经浏览或者购买过了。不能重复推荐。因此我们要推荐用户P5还没有浏览或购买过的商品。如果直接推荐我们可以选择P3用户评价最高的商品,也就是环太平洋和变形金刚两个数据。

    加权排序推荐:我们根据不同用户间的相似度,对不同商品的评分进行相似度加权。按加权后的结果对商品进行排序,然后推荐给用户P5。这样,用户P5就获得了更好的推荐结果。

    上面的计算结果中,我们按照(变形金刚--环太平洋--玩命速递)的顺序把结果推荐给用户P5。

    以上是基于用户的协同过滤算法。这个算法依靠用户的历史行为数据来计算相关度。也就是说必须要有一定的数据积累(冷启动问题)。对于新网站或数据量较少的网站,还有一种方法是基于物品的协同过滤算法。

    展开全文
  • 通过整合校内外各种优质机电实验教学资源,搭建起机器人载体的协同创新人才培养平台、构建机器人载体的协同创新人才培养体系、探索协同创新人才培养新模式,建设创新型国家提供协同创新人力资源支持。
  • 协同神经网络

    2018-05-13 09:03:43
    简单的协同神经网络实现代码,通过对简单图片的特征识别,利用协同神经网络实现图片识别。
  • 协同分集程序

    2018-01-04 10:47:58
    无线通信协同分集技术的MATLAB代码,有关信道生成、协同传输、分集合并的程序代码。
  • 金蝶协同v7.0协同整体解决方案
  • 针对移动协同网络连接的不确定性,协同操作到其他节点并非完全可达,传统基于操作转换思想的协同算法在移动协同环境下其协同操作的因果关系会有不一致现象发生。分析了移动协同环境下的协同因果关系不一致的原因,并...
  • 论文抚顺西露天矿例,基于调研资料和已有研究成果,对西露天矿矿城空间演进过程进行了梳理,分析了西露天矿矿城空间组织特征,通过构建西露天矿矿城空间结构协同、空间功能协同、空间发展目标协同、空间区域方面...
  • 复杂性协同动力因子和协同效应因子,李宗诚,,复杂巨系统与环境的耦合关系基本研究对象的分析,可作为复杂巨系统完备协同因子动力学分析的一个重要方面。本文将给出内外部

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 314,652
精华内容 125,860
关键字:

以协同为