精华内容
下载资源
问答
  • 随着VoIP在Internet各类应用中占据越来越大的比重,其服务质量保证的问题也日益为业界所关注。实际上,VoIP的服务质量与网络的性能有着直接的关系,尤其是其中的四个性能参数:端到端时延、时延抖动、帧擦除和失序的...
  • 基于网络口碑数据挖掘的物流服务质量影响因素分析.pdf
  • 用户感知视角下传统戏曲类APP服务质量影响因素研究.pdf
  • 通过改进的SERVQUAL模型设计调查问卷,获取银行客户需求;并基于QFD方法,构建银行客户需求与银行内部技术措施之间的关系矩阵,得出银行技术力量、人员管理、理念建设等影响商业银行服务质量的关键因素
  • 旅游电子商务网站服务质量感知的影响因素分析管理论文 目录 中图分类号F59 文献标识码B 文章编号10099646(2D09)06008404 1 引言 21世纪 1.1 网站质量评估理论模型方面 1.2 网站服务质量体系的实证评价方面 2 研究...
  • 信息觅食视域下图书馆智慧阅读推荐服务质量影响因素及提升策略.pdf
  • QOS(QUALITY OF SERVICE,服务质量)指一个网络能够利用各种基础技术,为指定的网络通信提供更好的服务能力, 是网络的一种安全机制, 是用来解决网络延迟和阻塞等问题的一种技术。 在视频会议中QOS常用来指一组视频...

    QOS(QUALITY OF SERVICE,服务质量)指一个网络能够利用各种基础技术,为指定的网络通信提供更好的服务能力, 是网络的一种安全机制, 是用来解决网络延迟和阻塞等问题的一种技术。
    在视频会议中QOS常用来指一组视频服务要求,网络必须满足这些要求才能确保视频数据传输的服务需求,在实际应用中影响视频会议QOS的三大因素分别是传输协议、数据传输能力和网络带宽。
    要素一:传输协议
    在技术层面来看,视频会议就是一个数据包从收集端到接收端的交互传输过程,目前互联网传输层的网络传输协议主要是TCP(传输控制协议)和UDP(用户数据报协议)两种。
    在实际开发应用中,开发者多选择UDP在互联网上传输数据包,不过由于UDP缺乏拥塞避免控制算法,会侵占大量的宽带,导致网络过载和高丢包率(丢包率直接影响视频会议的质量)。在实际使用中多采用TCP传输协议。
    要素二:数据传输能力
    当前,互联网数据日益增多,网络服务的需求甚至会出现超过网络提供的能力,这就会造成传输时延变化,传输时延过大就会引起分组丢失,也就是大家常说的出现了网络拥塞。
    一般来说,一般的上网都会遇到网络拥塞,例如网站加载过慢需要等几秒,在游戏中出现加载排队等情况,人们也能够接受。但是视频会议等对传输时延要求比较苛刻的实时应用,网络拥塞却是不能容忍的,因为这直接导致了视频会议出现视音频不同步,延时传输等问题,严重影响用户体验。
    而在现实中,移动通信系统的共同点是误码率高,这会对视频会议在的音视频传输造成很大的影响,为保证视频会议的QOS,一般对视频会议的编解码和传输系统提出较高的要求——能克服信道的高误码比和丢包。
    要素三:网络带宽
    网络带宽对QOS的影响是显而易见的。带宽相当于一条马路,马路越宽承载的车辆就越多,相对于数据来说,带宽就好比马路,带宽越宽,就能允许更多的数据传输,从而会提供更好的视频会议QOS。
    在近年来,由于我国互联网、云计算等技术发展,网络带块有了很大的改善,基本较多的客户都在使用比较宽的带宽。但在视频会议中,带宽依然成为影响QOS的主要因素之一,主要原因是:“宽带的质量参差不齐”。就是很多时候用户使用视频会议的带宽即便较宽,但由对方的技术不完善或其他原因,也经常出现比较高的网络丢包率和较大的网络抖动等情况,这些都会对用户在使用视频会议中的视频会议QOS产生严重的影响。

    展开全文
  • “农消”对接电商模式下生鲜物流服务质量影响因素研究——基于消费者的调查.pdf
  • 基于客户代表视角的电信企业感知服务质量影响因素研究--以运营商Y企业为例,李贺,彭若弘,面对更加激烈的竞争环境,电信企业应以客户体验为导向,提高客户感知服务质量,增强自身竞争力。本文创新性地从客户代表...
  • 为了提供高质量的流媒体服务,内容发布网络(CDN)利用域名解析系统(DNS),将用户重定向到附近...该文阐明基于IPAnycast的域名解析系统对CDN网络内容发布模型的冲击,分析了其影响流媒体服务质量的各种因素,通过实验比较当使
  • 本文通过查阅文献研究与电子服务质量相关的因素,然后评估这些因素对德里和国家首都地区网上银行服务用户满意度的影响。 本研究中的用户被归类为零售银行用户。 这是一项基于目的抽样的初步研究,样本量为 400 名...
  • 不知不觉,我们已经讲到第五篇了,不知道听到这里,你对于秒杀系统的构建没有形成一些框架性的认识,这里我再带你简单回忆下前面的主线。 前面的四篇文章里,我介绍的内容多少都和优化有关: 第一篇介绍了一些指导...

    不知不觉,我们已经讲到第五篇了,不知道听到这里,你对于秒杀系统的构建有没有形成一些框架性的认识,这里我再带你简单回忆下前面的主线。

    前面的四篇文章里,我介绍的内容多少都和优化有关:
    第一篇介绍了一些指导原则;

    第二篇和第三篇从动静分离和热点数据两个维度,介绍了如何有针对性地对数据进行区分和优化处理;

    第四篇介绍了在保证实现基本业务功能的前提下,尽量减少和过滤一些无效请求的思路。

    这几篇文章既是在讲根据指导原则实现的具体案例,也是在讲如何实现能够让整个系统更“快”。我想说的是,优化本身有很多手段,也是一个复杂的系统工程。今天,我就来结合秒杀这一场景,重点给你介绍下服务端的一些优化技巧。

    影响性能的因素

    你想要提升性能,首先肯定要知道哪些因素对于系统性能的影响最大,然后再针对这些具体的因素想办法做优化,是不是这个逻辑?

    那么,哪些因素对性能有影响呢?在回答这个问题之前,我们先定义一下“性能”,服务设备不同对性能的定义也是不一样的,例如CPU主要看主频、磁盘主要看IOPS(Input/Output Operations Per Second,即每秒进行读写操作的次数)。

    而今天我们讨论的主要是系统服务端性能,一般用QPS(Query Per Second,每秒请求数)来衡量,还有一个影响和QPS也息息相关,那就是响应时间(Response Time,RT),它可以理解为服务器处理响应的耗时。

    正常情况下响应时间(RT)越短,一秒钟处理的请求数(QPS)自然也就会越多,这在单线程处理的情况下看起来是线性的关系,即我们只要把每个请求的响应时间降到最低,那么性能就会最高。

    但是你可能想到响应时间总有一个极限,不可能无限下降,所以又出现了另外一个维度,即通过多线程,来处理请求。这样理论上就变成了“总QPS =(1000ms / 响应时间)× 线程数量”,这样性能就和两个因素相关了,一个是一次响应的服务端耗时,一个是处理请求的线程数。

    接下来,我们一起看看这个两个因素到底会造成什么样的影响。

    首先,我们先来看看响应时间和QPS有啥关系。

    对于大部分的Web系统而言,响应时间一般都是由CPU执行时间和线程等待时间(比如RPC、IO等待、Sleep、Wait等)组成,即服务器在处理一个请求时,一部分是CPU本身在做运算,还有一部分是在各种等待。

    理解了服务器处理请求的逻辑,估计你会说为什么我们不去减少这种等待时间。很遗憾,根据我们实际的测试发现,减少线程等待时间对提升性能的影响没有我们想象得那么大,它并不是线性的提升关系,这点在很多代理服务器(Proxy)上可以做验证。

    如果代理服务器本身没有CPU消耗,我们在每次给代理服务器代理的请求加个延时,即增加响应时间,但是这对代理服务器本身的吞吐量并没有多大的影响,因为代理服务器本身的资源并没有被消耗,可以通过增加代理服务器的处理线程数,来弥补响应时间对代理服务器的QPS的影响。

    其实,真正对性能有影响的是CPU的执行时间。这也很好理解,因为CPU的执行真正消耗了服务器的资源。经过实际的测试,如果减少CPU一半的执行时间,就可以增加一倍的QPS。

    也就是说,我们应该致力于减少CPU的执行时间。

    其次,我们再来看看线程数对QPS的影响。

    单看“总QPS”的计算公式,你会觉得线程数越多QPS也就会越高,但这会一直正确吗?显然不是,线程数不是越多越好,因为线程本身也消耗资源,也受到其他因素的制约。例如,线程越多系统的线程切换成本就会越高,而且每个线程也都会耗费一定内存。

    那么,设置什么样的线程数最合理呢?其实很多多线程的场景都有一个默认配置,即“线程数 = 2 * CPU核数 + 1”。除去这个配置,还有一个根据最佳实践得出来的公式:

    线程数 = [(线程等待时间 + 线程CPU时间) / 线程CPU时间] × CPU数量

    当然,最好的办法是通过性能测试来发现最佳的线程数。

    换句话说,要提升性能我们就要减少CPU的执行时间,另外就是要设置一个合理的并发线程数,通过这两方面来显著提升服务器的性能。

    现在,你知道了如何来快速提升性能,那接下来你估计会问,我应该怎么发现系统哪里最消耗CPU资源呢?

    如何发现瓶颈

    就服务器而言,会出现瓶颈的地方有很多,例如CPU、内存、磁盘以及网络等都可能会导致瓶颈。此外,不同的系统对瓶颈的关注度也不一样,例如对缓存系统而言,制约它的是内存,而对存储型系统来说I/O更容易是瓶颈。

    这个专栏中,我们定位的场景是秒杀,它的瓶颈更多地发生在CPU上。
    那么,如何发现CPU的瓶颈呢?其实有很多CPU诊断工具可以发现CPU的消耗,最常用的就是JProfiler和Yourkit这两个工具,它们可以列出整个请求中每个函数的CPU执行时间,可以发现哪个函数消耗的CPU时间最多,以便你有针对性地做优化。

    当然还有一些办法也可以近似地统计CPU的耗时,例如通过jstack定时地打印调用栈,如果某些函数调用频繁或者耗时较多,那么那些函数就会多次出现在系统调用栈里,这样相当于采样的方式也能够发现耗时较多的函数。

    虽说秒杀系统的瓶颈大部分在CPU,但这并不表示其他方面就一定不出现瓶颈。例如,如果海量请求涌过来,你的页面又比较大,那么网络就有可能出现瓶颈。

    怎样简单地判断CPU是不是瓶颈呢?一个办法就是看当QPS达到极限时,你的服务器的CPU使用率是不是超过了95%,如果没有超过,那么表示CPU还有提升的空间,要么是有锁限制,要么是有过多的本地I/O等待发生。

    现在你知道了优化哪些因素,又发现了瓶颈,那么接下来就要关注如何优化了。

    如何优化系统
    对Java系统来说,可以优化的地方很多,这里我重点说一下比较有效的几种手段,供你参考,它们是:减少编码、减少序列化、Java极致优化、并发读优化。接下来,我们分别来看一下。

    1. 减少编码
      Java的编码运行比较慢,这是Java的一大硬伤。在很多场景下,只要涉及字符串的操作(如输入输出操作、I/O操作)都比较耗CPU资源,不管它是磁盘I/O还是网络I/O,因为都需要将字符转换成字节,而这个转换必须编码。

    每个字符的编码都需要查表,而这种查表的操作非常耗资源,所以减少字符到字节或者相反的转换、减少字符编码会非常有成效。减少编码就可以大大提升性能。

    那么如何才能减少编码呢?例如,网页输出是可以直接进行流输出的,即用resp.getOutputStream()函数写数据,把一些静态的数据提前转化成字节,等到真正往外写的时候再直接用OutputStream()函数写,就可以减少静态数据的编码转换。

    我在《深入分析Java Web技术内幕》一书中介绍的“Velocity优化实践”一章的内容,就是基于把静态的字符串提前编码成字节并缓存,然后直接输出字节内容到页面,从而大大减少编码的性能消耗的,网页输出的性能比没有提前进行字符到字节转换时提升了30%左右。

    1. 减少序列化

    序列化也是Java性能的一大天敌,减少Java中的序列化操作也能大大提升性能。又因为序列化往往是和编码同时发生的,所以减少序列化也就减少了编码。

    序列化大部分是在RPC中发生的,因此避免或者减少RPC就可以减少序列化,当然当前的序列化协议也已经做了很多优化来提升性能。有一种新的方案,就是可以将多个关联性比较强的应用进行“合并部署”,而减少不同应用之间的RPC也可以减少序列化的消耗。

    所谓“合并部署”,就是把两个原本在不同机器上的不同应用合并部署到一台机器上,当然不仅仅是部署在一台机器上,还要在同一个Tomcat容器中,且不能走本机的Socket,这样才能避免序列化的产生。

    另外针对秒杀场景,我们还可以做得更极致一些,接下来我们来看第3点:Java极致优化。

    1. Java极致优化

    Java和通用的Web服务器(如Nginx或Apache服务器)相比,在处理大并发的HTTP请求时要弱一点,所以一般我们都会对大流量的Web系统做静态化改造,让大部分请求和数据直接在Nginx服务器或者Web代理服务器(如Varnish、Squid等)上直接返回(这样可以减少数据的序列化与反序列化),而Java层只需处理少量数据的动态请求。针对这些请求,我们可以使用以下手段进行优化:

    • 直接使用Servlet处理请求。避免使用传统的MVC框架,这样可以绕过一大堆复杂且用处不大的处理逻辑,节省1ms时间(具体取决于你对MVC框架的依赖程度)。
    • 直接输出流数据。使用resp.getOutputStream()而不是resp.getWriter()函数,可以省掉一些不变字符数据的编码,从而提升性能;数据输出时推荐使用JSON而不是模板引擎(一般都是解释执行)来输出页面。
    1. 并发读优化

    也许有读者会觉得这个问题很容易解决,无非就是放到Tair缓存里面。集中式缓存为了保证命中率一般都会采用一致性Hash,所以同一个key会落到同一台机器上。虽然单台缓存机器也能支撑30w/s的请求,但还是远不足以应对像“大秒”这种级别的热点商品。那么,该如何彻底解决单点的瓶颈呢?

    答案是采用应用层的LocalCache,即在秒杀系统的单机上缓存商品相关的数据。

    那么,又如何缓存(Cache)数据呢?你需要划分成动态数据和静态数据分别进行处理:

    • 像商品中的“标题”和“描述”这些本身不变的数据,会在秒杀开始之前全量推送到秒杀机器上,并一直缓存到秒杀结束;
    • 像库存这类动态数据,会采用“被动失效”的方式缓存一定时间(一般是数秒),失效后再去缓存拉取最新的数据。

    你可能还会有疑问:像库存这种频繁更新的数据,一旦数据不一致,会不会导致超卖?

    这就要用到前面介绍的读数据的分层校验原则了,读的场景可以允许一定的脏数据,因为这里的误判只会导致少量原本无库存的下单请求被误认为有库存,可以等到真正写数据时再保证最终的一致性,通过在数据的高可用性和一致性之间的平衡,来解决高并发的数据读取问题。

    总结一下

    性能优化的过程首先要从发现短板开始,除了我今天介绍的一些优化措施外,你还可以在减少数据、数据分级(动静分离),以及减少中间环节、增加预处理等这些环节上做优化。

    首先是“发现短板”,比如考虑以下因素的一些限制:光速(光速:C = 30万千米/秒;光纤:V = C/1.5=20 万千米/秒,即数据传输是有物理距离的限制的)、网速(2017年11月知名测速网站Ookla发布报告,全国平均上网带宽达到61.24 Mbps,千兆带宽下10KB数据的极限QPS 为1.25万QPS=1000Mbps/8/10KB)、网络结构(交换机/网卡的限制)、TCP/IP、虚拟机(内存/CPU/IO等资源的限制)和应用本身的一些瓶颈等。

    其次是减少数据。事实上,有两个地方特别影响性能,一是服务端在处理数据时不可避免地存在字符到字节的相互转化,二是HTTP请求时要做Gzip压缩,还有网络传输的耗时,这些都和数据大小密切相关。

    再次,就是数据分级,也就是要保证首屏为先、重要信息为先,次要信息则异步加载,以这种方式提升用户获取数据的体验。

    最后就是要减少中间环节,减少字符到字节的转换,增加预处理(提前做字符到字节的转换)去掉不需要的操作。

    此外,要做好优化,你还需要做好应用基线,比如性能基线(何时性能突然下降)、成本基线(去年双11用了多少台机器)、链路基线(我们的系统发生了哪些变化),你可以通过这些基线持续关注系统的性能,做到在代码上提升编码质量,在业务上改掉不合理的调用,在架构和调用链路上不断的改进。

    展开全文
  • 发现电子商店服务质量与电子商店客户忠诚度之间很强的正相关性。 本文整合了有关服务质量和客户忠诚度的先前文献,并开发了基于绩效的有效且可靠的措施,以基于绩效的电子商店客户服务质量和电子商店客户忠诚度。
  • 在开放式问卷的基础上通过查阅大量国内外有关内部服务质量影响因素的相关文献,初步确定测评因子及对应问项。通过问卷调查的方式收集到184份有效的问卷数据,主要采用探测性因子分析和验证性因子分析对184份问卷调查...
  • 该研究旨在衡量服务质量,品牌形象和口碑对回购意向的影响。 此外,该研究还旨在衡量影响回购意向的最主要因素,包括直接影响和间接影响。 选择三宝垄市作为代表地点,是因为它在Java岛的省会城市中房间入住率最低...
  • 网站收录与百度蜘蛛有着直接的关系,我们平时主要是通过主动或被动的方式来吸引百度蜘蛛抓取网站页面。主动的方式就是通过站长平台的链接提交...影响百度蜘蛛抓取网站页面的因素有哪些 那么,影响百度蜘蛛抓取网站...

    网站收录与百度蜘蛛有着直接的关系,我们平时主要是通过主动或被动的方式来吸引百度蜘蛛抓取网站页面。主动的方式就是通过站长平台的链接提交工具或其它插件,来将自己网站新的内容链接提交给搜索引擎。被动的方式是靠搜索引擎蜘蛛自己来爬取,来的时间不一定。

    另外,需要注意的是主动推送的链接也不一定会被收录,这还要看内容质量度、站点质量等综合因素。

    影响百度蜘蛛抓取网站页面的因素有哪些

    那么,影响百度蜘蛛抓取网站页面的因素有哪些?

    1、robots协议设置:网站上线后roblts协议文件是搜索引擎第一个查看的文件,如果不小心设置错误禁止搜索引擎就会导致,搜索引擎蜘蛛无法抓取网站页面。

    2、内容质量度:随着搜索引擎算法的不断更新,如果网站内容原创度太低、不能解决用户需求或排版太差,就不会被优先收录,更别说展现了。

    3、服务器不稳定:服务器不稳定或者JS添加过多,就会导致网站加载速度变慢,甚至无法打开,严重影响用户体验,这种情况也会影响百度蜘蛛抓取网站页面的。

    4、网站被黑:这种情况下会导致网站页面数量爆炸式增长,且这些页面基本都是违法信息,搜索引擎一旦发现就会导致网站被K。

    影响网站收录的因素是各方面的,在查找原因的时候可采用排查法,一项一项的查找,只有查找到了原=因才能提升网站收录。同时提醒大家一点:搜索引擎的索引库是分级别的,网站内容被收录后,如果内容质量度高就会进入优质索引库,并给于优先展示,因此网站收录并不是量大就是好。

    本文源自: http://www.qzgi.cn/archives/502

    展开全文
  • 研究旨在了解使用DeLone和Mclean Conceptual IS Success模型在印度电子机票预订中网站的信息,系统和服务质量对用户满意度的影响。 方法论-数据来源将是主要的和次要的,所使用的研究方法是探索性的,使用问卷调查的...
  • 研究表明,电子服务质量对用户的感知有用性和易用性正向的影响,从而弥补了TAM对外生性因素关注不足的缺憾;用户的沉浸体验这一情感因素对其使用态度和使用意图正向的影响,从而突破了TAM理性行为的假设前提,使得...
  • 在一个网站或者app中,推荐系统通常会和整个大系统的多个方面交互,推荐系统本身也很多的组成部分,再加上整个系统所处的大环境,综合起来会很多因素影响着一个推荐系统最终效果的好坏,这里的效果指的是包括...

    在一个网站或者app中,推荐系统通常会和整个大系统的多个方面有交互,推荐系统本身也有很多的组成部分,再加上整个系统所处的大环境,综合起来会有很多因素影响着一个推荐系统最终效果的好坏,这里的效果指的是包括准确率、召回率、多样性等等指标在内的一个整体整体效果,不做具体区分。在这里我们试对其中一些主要的因素做一讨论。需要指出的是,这些因素里面并不是所有的我们都可以左右,但是了解它们究竟是什么对我们开发和优化系统还是非常有用的。

    一、用户因素

    与广告系统需要同时面对用户和广告主不同,推荐系统的服务对象只有一个,那就是用户,所以用户的因素很大程度会影响系统的效果。具体来讲,系统中新用户和老用户的比例可以说是对效果影响最大的因素之一。大家知道推荐系统是高度依赖用户行为的,而对于无任何行为或者行为非常少的新用户,效果肯定是不会太好的,所以整个系统中新用户的比例越高,系统的整体表现就会越差。

    这就是一个典型的推荐系统本身无法左右的因素,而是需要整个系统共同努力来解决。对于这个问题,有两种解决思路:一种是努力优化推荐系统的冷启动算法,这种方法肯定会有效,但是其天花板也是非常低的;而另一种方法,是努力将平台上的新用户转化为老用户,也就是说努力让他们与平台多交互,产生行为,从而脱离冷启动的阶段。这两种方法相比,可能第二种的效果要更好,这主要是因为冷启动算法的优化空间实在有限,而将其转为“热”用户之后,各种优化策略就都可以派上用场了。这也是一种可以在多种场景下借鉴的思路:将未知问题转化为已知问题,而不是创造新问题。

    二、产品设计因素

    所谓产品设计因素,指的是推荐出的物品在什么位置、以何种形式展示给用户。如果说推荐算法是一个人的内在,那么产品设计就是一个人的脸。在现在这个看脸的时代,长得好不好看会很大程度上影响算法能量的释放程度。最常见的影响效果的外在因素包括但不限于:

    图片的质量。互联网早已进入读图时代,无论任何物品的推荐,例如商品、资讯等,有图片的吸引力一定是大于无图片的。而对于都有图片的情况,图片的大小和清晰度则会对用户是否感兴趣产生很大影响。除了大小和清晰度这种基础的质量以外,图片本身传达出来的信息的质量也很关键,例如对于商品的图片,如果不能在图片中展示出该商品的主要信息和用户关心的内容,那么用户点击的概率就会大大降低,毕竟大家都很忙,点一下也是有代价的。所以对于C2C市场这样以用户自己拍摄的照片为主的场景,引导用户拍出高质量的商品图片就显得尤为重要,这个问题上Airbnb自费给房东拍照片的故事已经足够证明其重要性和意义了。

    主题的吸引程度。除了图片以外,以文字形式描述的主题也是非常重要的,毕竟文字还是人们获取信息的一个主要途径。在转转平台上,会有一些偷懒的用户在文字描述中只写类似“如图,私聊”这样的信息,可想而知这样的描述竞争力是比较弱的,同时也会让人觉得卖家对这个商品并不是很上心,所以除非你的商品在其他方面极具竞争力,否则是很难得到转化的。

    主题吸引人固然重要,但是过于“头重脚轻”,只关注主题质量,而忽略物品本身质量的话,反而会起到反作用,引起用户的反感。这里面最典型的例子就是现在充斥屏幕的各种标题党文章了,为了吸引用户的点击而在起标题上面大做文章,但用户点进去之后发现要么文章质量低下,要么文不对题,长期以往下去,会对平台的信誉度产生很大的负面影响,是一种杀鸡取卵的做法。

    所以说,在文字内容描述方面,要尽量信息周全,但也不能背离事实,单纯为了一时的点击率,而牺牲了平台的长远发展。

    关键信息是否露出。所谓关键信息,指的是能够左右或影响用户产生点击、转化的信息,除了上面提到的图片和文字描述以外,各个业务场景下都有一些有特点的关键信息,例如销量、评论数等等。一部分是因为这些信息本身就会对用户的转化产生影响,另一方面,推荐算法在召回或排序时可能用到了这些信息,那么将这些信息展现出来,一定程度上充当了推荐解释的功能。

    是否有干扰信息。这个指的是模块周围是否有影响用户注意力的其他内容,能否让用户比较专心地浏览推荐模块。典型的如一些亮闪闪的广告或者促销/活动banner之类的,放在推荐位的旁边会对用户的注意力产生不同程度的影响,进而影响转化。如果推荐系统在你的业务中是重要的一部分,那么就应该给予它足够专注(dedicated)的空间和位置,而尽量不要将其与其他内容混在一起。在这个纷繁复杂的世界里,很多时候,少就是多(lessismore)。

    三、数据因素

    推荐系统是典型算法驱动的系统,而如果说算法是系统的骨架,那么数据就是系统的血液。如果数据质量和数量不够,那么任何算法的效果都会打折扣。数据的数量不足是很容易理解的,而且数据量是否充足很多时候和整个网站或APP的发展状况有关,不是我们所能左右的,但数据质量则不同,是可以通过人为的努力而不断加强的。所以这里就简单说一下数据质量方面常见的可能存在的问题。

    关键信息缺失。信息缺失是数据质量方面最大的问题之一,尤其是影响到算法策略或排序模型的关键信息。例如曝光数据中没有具体曝光位置信息,展现日志中没有用户停留时长的信息等等,这些信息的确实会直接导致算法效果的下降,进而影响最终效果。类似这些问题的出现,很多时候是因为在最初的数据系统建设时,没有算法相关的人员参与,导致没有把这些相关信息设计进去。不过这类问题也相对好解决,只要在发现有缺失之后尽快补充进去就好了。

    数据设计欠佳,使用复杂。还有一种情况,就是关键信息都有,没有严重缺失,但是数据结构或表结构设计不够合理,导致获取一个信息要join多张表,或经过复杂的运算逻辑。这种情况下,虽然关键信息都可以获取到,但是由于获取成本高,很有可能在工程实现中被不同程度地做折中,导致数据质量打折扣,影响最终效果。这类问题的解决方法,从大的思路上来讲是要做好算法相关的数据仓库/数据集市建设,使得数据的获取、变动和维护都尽量简单化,减少数据建设的成本,从而提高数据的使用效率。

    推荐系统使用到的数据通常是整个网站的数据系统中的一个子集,所以这部分数据质量的把控需要推荐系统的开发人员和数据系统的开发人员共同的努力,才能保证数据的可用性和易用性。

    四、算法策略因素

    上面说了这么多,终于说到了推荐系统最核心的算法策略部分。算法策略对效果的影响是毋庸置疑的,但是其影响也是多方面的,具体来讲,算法可能会从以下几个方面影响效果。

    算法复杂度影响准确性。复杂度越高的算法整体上准确性较高,无论使用什么具体算法,这个大趋势整体来说是正确的。例如简单的排序模型可能干不过非线性模型,连续值特征有可能干不过离散化后的非线性特征,时序问题上vanillarnn干不过LSTM等等。在保证数据质量的前提下,用复杂度高的模型是一种能够确保收益的效果提升方式,当然前提是算法要与业务相契合,不能为了复杂而复杂。

    算法的稳定性影响效果的稳定性。我们知道在机器学习模型中有一类模型具有低偏差但同时也具有高方差,这里的高方差,指的是在训练出来的模型,在不同的数据集上表现差异会比较大,这种现象还有另外一个名字就是过拟合。如果数据量足够大的话,再加上合理的正则化手段,过拟合是比较容易避免的。所以问题更容易出现在数据量不足的情况下,在这种情况下,应该选择例如线性模型这样简单模型来保证结果的稳定性,甚至可以考虑使用基于规则的算法来保证稳定性。

    为什么要关注结果的稳定性呢?这里的原因和我们在学习算法设计分析时要关注算法的平均复杂度是类似的。我们虽然希望得到一个非常准确的模型,但是更希望这个模型在线上运行时稳定的,是可预期的,不会今天效果好,明天效果差。在实际使用中,无论准确率如何,都希望稳定性是有保证的。

    五、工程架构因素

    最后,我们再来简单说一下工程架构方面的因素。无论什么样的数据,什么样的算法,最终呈献给用户之前都需要具体的工程落地,那么这个落地过程中选择的具体工程架构也会对效果产生影响。

    效应耗时的影响。接口的响应速度无疑是工程架构对用户的最直接体现,响应速度慢肯定会导致用户的不耐烦,可能就直接流失掉了。要提高速度,通常会有几类方法,一类是对算法进行优化,减少不必要的计算;二是选择简单算法;三是使用缓存的思路,只在在线部分进行尽量少的计算,其余的计算都放到离线或近线层去做,减少实时计算的负担。

    架构设计对问题排查监控的影响。老司机们都知道,只能跑不能修的车是肯定不能上路的。同理,推荐系统的整体架构设计要对问题的排查比较友好,能够在出现问题或者需要验证猜想的时候能够快速在系统中进行定位,而不是现加debug信息现上线,导致问题排查过程被拖长。优秀的工程师会在系统设计的时候就给自己留好后路,而不是在出了问题时才临时抱佛脚。

    架构设计对迭代速度的影响。除了响应速度这种较为表面的影响以外,整个架构的设计能否支持快速的策略迭代对效果的隐形影响也是极大的。如果整体架构比较臃肿,模块分离不清晰,基础逻辑缺乏适当抽象同一,会导致数据和策略的迭代无法快速进行,每迭代一次都要走很复杂的流程,而且还不能保证正确性。这样的问题会拖累系统的发展速度,最终影响效果。

    总结

    除了上面提到的因素,还有很多细节会影响推荐系统的最终效果,所以说我们在提升推荐系统效果时,眼睛不能只盯着一处,而是要具有一定的全局观,能够从全局的角度找到当前对效果影响最大的是什么,进而进行针对性优化。对于那些暂时不能改变的因素,也要做到心里有数,在适当的时机进行干预。

    人工智能、大数据、云计算和物联网的未来发展值得重视,均为前沿产业,多智时代专注于人工智能和大数据的入门和科谱,在此为你推荐几篇优质好文:
    关联规则推荐算法的原理及实现
    http://www.duozhishidai.com/article-15567-1.html
    大数据教程视频推荐系统的常用算法概述
    http://www.duozhishidai.com/article-12484-1.html
    如何从零构建实时的个性化推荐系统?
    http://www.duozhishidai.com/article-11133-1.html


    多智时代-人工智能大数据学习入门网站|人工智能、大数据、物联网云计算的学习交流网站

    多智时代-人工智能大数据学习入门网站|人工智能、大数据、云计算、物联网的学习服务的好平台

    展开全文
  • 售后服务淘宝网电子服 务质量分析报告 淘宝网电子服务质量分析方案 目录 引言 4 1 淘宝网简介 5 2 淘宝网电子服务质量分析 6 2.1 服务质量 6 2.1.1 服务质量的含义 6 2.1.2 服务质量影响因素 6 2.1.3 服务质量要素...
  • 网页打开速度是影响用户体验的首要因素。 硬件因素包括:服务器端、客户端和网速。服务器端主要包括:服务器的地 域,是否双线,处理能力等等;客户端的因素主要包括:用户的硬件配置、用户使用的浏览器、是否...
  • 基于影响地方高等学校图书馆服务质量的图书馆环境、图书馆设备、馆藏资源、图书馆员、服务效果等五个主要影响因素,以某大学图书馆为例,基于LIBQUAL测度方法,用户对问卷中提出的每一个问题从容忍值、感受值和期望值等...
  • 这项研究的基本目的是找到参考电子银行服务的服务质量,客户满意度和信任之间的因果关系,从而检查服务质量,客户满意度和信任在EB环境中影响客户忠诚度的程度。 最初,用于收集变量数据的调查表是标准化的。 数据...
  • 针对这一问题,文章提出一种基于K-means聚类算法的服务等级评定方法,通过分析CDN性能的影响因素与关键指标,选取不同加速业务的性能指标建立质量评价模型,通过模型,利用K-means算法对CDN区域服务质量进行综合评判...
  • 运营商正在发展基于智能终端的视频通信业务,分析了视频通信业务的服务质量特点以及影响视频通信服务质量的关键因素,在此基础上,对视频主客观质量评估方法进行了分析,建立了视频通信业务服务质量的评测模型并进行...
  • VOIP通信中影响语音质量因素

    千次阅读 2014-11-13 13:19:14
    在VOIP通信中,影响语音质量因素比较多,归类起来就以下几个大的因素: 1、网络因素,网络一般体现在网络的延迟、抖动、丢包。延迟一般是语音的编解码速度、JitterBuffer延迟、TCP/IP协议栈处理速度、中间路由器...
  • 针对网络餐饮平台满意度的多目标决策问题,提出了一种基于DANP与TOPSIS法的多目标平台服务质量满意度分析方法。...研究表明该方法不仅提高了关键因素确定的可靠性,还为网络餐饮平台服务质量的提升提供依据。
  • 它还希望将服务质量维度分析的相对重要性确定为直接影响组织的最重要因素之一。 任何组织的未来都自己的发展根基,高层管理人员可以在服务问题上进行相同的更改来塑造未来。 它甚至不会成为大多数高层管理人员的...
  • 这项研究的目的是确定Altiplano国立大学(UNA-Puno)用户所感知的学术和行政服务质量的调节因素。 在方法部分,将不同的统计量表示为Kendall的Taub检验,成分的因子分析,因子提取,Varimax旋转,T检验和相关估计...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 147,425
精华内容 58,970
关键字:

影响服务质量的因素有哪些