精华内容
下载资源
问答
  • 市场营销常用理论【转】

    千次阅读 2012-09-26 17:14:03
    市场营销常用理论【转】 市场营销常用理论,理论而已… 一、二八法则 意大利经济学家帕累托提出 80%的收入来源于20%的客户 公司里20%的员工完成80%的业绩 20%的强势品牌占据着80%的市场 ………… “二八法则...

    市场营销常用理论【转】

    市场营销常用理论,理论而已…

    一、二八法则

    意大利经济学家帕累托提出
    80%的收入来源于20%的客户
    公司里20%的员工完成80%的业绩
    20%的强势品牌占据着80%的市场
    …………
    “二八法则”要求管理者在工作中不能“胡子眉毛一把抓”,而是要抓关键人员、关键环节、关键用户、关键项目、关键岗位。
    “二八法则”之所以得到业界的推崇,就在于其提倡的“有所为,有所不为”的经营方略,确定了传媒业的视野。

    二、CIS理论系统

    其英文全称是Corporation Identity System。中文译为“企业识别系统”。CIS理论主张将企业理念,企业文化,企业行为及企业视觉标志通过统一设计加以整合,强化其传播效果,使组织迅速提升自己的知名度,美誉度和公众的认可度。

    CIS有三部分构成:1 企业的理念识别(mind identity简称mi);2 企业行为识别(behavior identity,简称bi);3 企业视觉识别(visual identity, 简称vi).

    形象一点说,CI就是一支军队,MI是军心,是军队投入战争的指导思想,是最不可动手的一部分;VI是军旗,是军队所到之处的形象标志;而BI则是军纪,它是军队取得战争胜利的重要保证。

    三、USP理论

    罗瑟·瑞夫斯(Rosser Reeves)提出USP理论,要求向消费者说一个“独特的销售主张”( Unique Selling Proposition ),简称USP理论。

    USP理论包括三个方面:

    一是每个广告不仅靠文字或图象,还要对消费者提出一个建议,即买本产品将得到的明确利益;
    二是这一建议一定是该品牌独具的,是竞争品牌不能提出或不曾提出的;
    三是这一建议必须具有足够力量吸引、感动广大消费者,招徕新顾客购买你的东西。
    1954年,瑞夫斯为M&M糖果所作的“只溶在口,不溶在手”广告创意是USP理论典范之作。

    四、SWOT分析法

    SWOT 分析法又称为态势分析法,它是由旧金山大学的管理学教授于20世纪80年代初提出来的,是一种能够较客观而准确地分析和研究一个单位现实情况的方法。 SWOT四个英文字母分别代表:优势(Strength)、劣势(Weakness)、机会(Opportunity)、威胁(Threat)。

    从整体上看,SWOT可以分为两部分:第一部分为SW,主要用来分析内部条件;第二部分为OT,主要用来分析外部条件。将调查得出的各种因素根据轻 重缓急或影响程度等排序方式,构造SWOT矩阵。在完成环境因素分析和SWOT矩阵的构造后,便可以制定出相应的行动计划。制定计划的基本思路是:发挥优 势因素,克服弱点因素,利用机会因素,化解威胁因素;考虑过去,立足当前,着眼未来。运用系统分析的综合分析方法,将排列与考虑的各种环境因素相互匹配起 来加以组合,得出一系列公司未来发展的可选择对策。

    五、5W2H法

    这七个方面是:

    (1)Why:为何—-为什么要如此做?
    (2)What:何事—-做什么?准备什么?
    (3)Where:何处—-在何处着手进行最好?
    (4)When:何时—-什么时候开始?什么时候完成?
    (5)Who:何人—-谁去做?
    (6)How:如何—-如何做?
    (7)How much:何价—-成本如何?达到怎样的效果?
    包含了品牌从战略(WHO、WHY)到策略(WHAT、WHEN、WHER)直至战术(HOW)的完整运作系统,在加上另一个H—-HOW MUCH(多少)即品牌预算,实际就是一个完整的品牌运作全案!

    做任何工作都应该从5W2H来思考,?有助于我们的思路的条理化,杜绝盲目性。

    六、马太效应

    美国科学史研究者罗伯特·莫顿(Robert K. Merton)归纳“马太效应”为:任何个体、群体或地区,一旦在某一个方面(如金钱、名誉、地位等)获得成功和进步,就会产生一种积累优势,就会有更多 的机会取得更大的成功和进步。它的名字来自于圣经《新约·马太福音》中的一则寓言。

    此术语后为经济学界所借用,反映贫者愈贫,富者愈富,强者恒强,弱者恒弱,或者说,赢家通吃…..竞争将更加残酷。

    七、马斯洛需求理论

    美国心理学家马斯洛(Abraham h. maslow,1908-1970)所首创的一种理论。

    马斯洛提出需要的5个层次如下:

    1.生理需要,是个人生存的基本需要。如吃、喝、住处。
    2.安全需要,包括心理上与物质上的安全保障,如不受盗窃的威胁,预防危险事故,职业有保障,有社会保险和退休基金等。
    3.社交需要,人是社会的一员,需要友谊和群体的归宿感,人际交往需要彼此同情、互助和赞许。
    4.尊重需要,包括要求受到别人的尊重和自己具有内在的自尊心。
    5.自我实现需要,指通过自己的努力,实现自己对生活的期望,从而对生活和工作真正感到很有意义。
    心理学是营销学基础,对人类需求层次理论的高度把握能更好的为营销服务。

    八、麦克尔·波特竞争理论

    哈佛商学院的教授——麦克尔.波特

    他提出的竞争理论:一个企业要在市场竞争中取得优胜地位,有三种战略可供选择:最低成本、差异化营销、市场集中 (lowest cost,differentiation,focus),为企业的战略定位提供了构架。

    尽管波特的战略框架在学界评价不一,但对于全球商界领导人来说,有着非凡的说服力。而且,德鲁克也承认,波特是仅有的几个为管理做出重要贡献的学者之一。

    九、蓝海战略

    W.钱·金和勒妮·莫博涅教授合著的《蓝海战略》一书。

    蓝海战略其实就是企业超越传统产业竞争、开创全新的市场的企业战略。如今这个新的经济理念,正得到全球工商企业界的关注。“红海”是竞争极端激烈的 市场,但 “蓝海”也不是一个没有竞争的领域,而是一个通过差异化手段得到的崭新的市场领域,在这里,企业凭借其创新能力获得更快的增长和更高的利润。

    目前在某些领域蓝海战略受到质疑,其实完全没有这个必要。我们仔细分析一下,即使竞争再激烈的市场一样会有市场空白存在,发现市场空白并第一时间介入,这一过程被国外的老头子给冠了一个很动听名字——蓝海战略。

    十、长尾理论

    与二八法则相对,21世纪又出现了长尾理论,长尾理论的基本原理是:只要存储和流通的渠道足够大,需求不旺或销量不佳的产品所共同占据的市场份额可 以和那些少数热销产品所占据的市场份额相匹敌甚至更大。即众多小市场汇聚成可与主流大市场相匹敌的市场能量。在长尾理论中,实际上“长尾”是二八法则中原 先不怎么被重视的那80%非关键的市场和低收益客户等等。

    长尾理论要想发挥效果必须具备条件:足够的存储和流通的渠道,并且市场维护成本要尽可能小。计算机和网络技术高度发展使之得以实现。因此我们看到大批长尾理论的获利者都是互联网企业,传统市场中“二八定律”依旧大行其道,毋庸置疑。

    十一、定位理论

    创始人特劳特与里斯。定位起始于产品,但并不是对产品本身做什么行动。定位是指要针对潜在顾客的心理采取行动,即要将产品在潜在顾客的心目中确定一个适当的位置。因此,定位是对顾客的头脑进行争夺的理论。

    其目的是在潜在顾客心中得到有利的地位。

    定位的真谛就是“攻心为上”,消费者的心灵才是营销的终级战场。要抓住消费者的心,必须了解他们的思考模式,这是进行定位的前提。

    十二、品牌形象论

    20世纪60年代由大卫·奥格威提出的品牌形象论是广告创意策略理论中的一个重要流派。在此策略理论影响下,出现了大量优秀的、成功的广告。

    其基本要点是:

    1、为塑造品牌服务是广告的最主要的目标。广告就是力求是品牌具有并维持一个高知名度的品牌形象。
    2、任何一个广告都是对品牌的长程投资。从长远的观点来看,广告必须尽力去维护一个好的品牌形象,而不惜牺牲追求短期效益的诉求重点。
    3、随着同类产品差异性减小,品牌之间的同质性的增大,消费者选择品牌时所运用的理性就越少,因此,描绘品牌的形象要比强调产品的具体功能特征要重要得多。
    4、消费者购买时所追求的是“实质利益+心理利益”,对某些消费群来说,广告尤其应该运用形象来满足其心理的需求。

    十三、木桶理论

    所谓“木桶理论”也即“木桶定律”,其核心内容为:一只木桶盛水的多少,并不取决于桶壁上最高的那块木块,而恰恰取决于桶壁上最短的那块。根据这一 核心内容,“木桶理论”还有两个推论:其一,只有桶壁上的所有木板都足够高,那木桶才能盛满水。其二,只要这个木桶里有一块不够高度,木桶里的水就不可能 是满的。

    “木桶理论”可以启发我们思考许多问题,比如企业团队精神建设的重要性。在一个团队里,决定这个团队战斗力强弱的不是那个能力最强、表现最好的人, 而恰恰是那个能力最弱、表现最差的落后者。因为,最短的木板在对最长的木板起着限制和制约作用,决定了这个团队的战斗力,影响了这个团队的综合实力。也就 是说,要想方设法让短板子达到长板子的高度或者让所有的板子维持“足够高”的相等高度,才能完全发挥团队作用,充分体现团队精神。

    十四、羊群效应

    羊群效应是指管理学上一些企业的市场行为的一种常见现象。例如一个羊群(集体)是一个很散乱的组织,平时大家在一起盲目地左冲右撞。如果一头羊发现 了一片肥沃的绿草地,并在那里吃到了新鲜的青草,后来的羊群就会一哄而上,争抢那里的青草,全然不顾旁边虎视眈眈的狼,或者看不到其它还有更好的青草。

    羊群效应的出现一般在一个竞争非常激烈的行业上,而且这个行业上有一个领先者(领头羊)占据了主要的注意力,那么整个羊群就会不断摹仿这个领头羊的一举一动,领头羊到哪里去吃草,其它的羊也去哪里淘金。

    有则幽默也反映了羊群效应:一位石油大亨到天堂去参加会议,一进会议室发现已经座无虚席,没有地方落座,于是他灵机一动,喊了一声:“地狱里发现石 油了!” 这一喊不要紧,天堂里的石油大亨们纷纷向地狱跑去,很快,天堂里就只剩下那位后来的了。这时,这位大亨心想,大家都跑了过去,莫非地狱里真的发现石油了? 于是,他也急匆匆地向地狱跑去。

    十五、4P理论

    杰瑞?麦卡锡(Jerry McCarthy)教授在其《营销学》(Marketing,第一版,出版于1960年左右)最早提出了这个理论。4P为企业的营销策划提供了一个有用的框架。它的提出是自上而下的运行原则,站在企业立场,重视产品导向。

    产品—Product;
    价格—Price;
    通路—Place;
    促销—Promotion

    十六、4C理论

    4C 理论是由美国营销专家劳特朋教授在1990年提出的,它以消费者需求为导向。它强调企业首先应该把追求顾客满意放在第一位,其次是努力降低顾客的购买成 本,然后要充分注意到顾客购买过程中的便利性,而不是从企业的角度来决定销售渠道策略,最后还应以消费者为中心实施有效的营销沟通。

    消费者的需求与欲望(Consumer needs wants)把产品先搁到一边,赶紧研究消费者的需求与欲望,不要再卖你能制造的产品,而要卖某人确定想要买的产品;

    消费者愿意付出的成本(Cost)暂时忘掉定价策略,赶快去了解消费者要满足其需要与欲求所必须付出的成本;

    购买商品的便利(Convenience),忘掉通路策略,应当思考如何给消费者方便以购得商品;

    沟通(Communication),最后请忘掉促销,90年代以后的正确新词汇应该是沟通。

    十七、果子效应

    对于消费者而言,品牌是一种经验。在物质生活日益丰富的今天,同类产品多达数十上百甚至上千种,消费者根本不可能逐一去了解,只有凭借过去的经验, 或别人的经验加以选择。因为消费者相信,如果在一棵果树上摘下的一颗果子是甜的,那么这棵树上的其余的果子也都会是甜的。这就是品牌的“果子效应”。

    “果子效应”能保证企业在开发新产品,介入新的领域后利用原品牌影响力来为统领市场。

    十八、魏斯曼营销战略学说及竞争四种手段

    1、领导者战略:公司的相关产品在市场中占有最大的市场份额,它通常在价格变化、新产品引进创新、分销覆盖和促销强度上,对其他公司起着领导作用。
    2、挑战者战略:在行业中占有第二、第三和以后的位置,它可以攻击市场领先者和其他竞争者,以夺取更多的市场份额,提升自己,有可能取代领导者的地位。
    3、市场追随者战略:它们在市场上采取跟随领导者的策略,从产品、命名、宣传等都和领导者极为相似,利用领导者的资源分割市场。
    4、利基者战略:他们只注重小块市场,并把它做深做透,从中投入较少的资源,获取较大的利润,成为小块市场的领先者,他们经常避免与大公司竞争。

    十九、CI系统

    CI是英文Corporate Identity的简称,意译为企业形象识别或品牌形象识别。CI又称作CIS,是英文Corporate Identity Systemt(企业识别系统)的简称。

    CI是指企业有意识有计划地将自己企业或品牌特征向公众展示,使公众对某一个企业或品牌有一个标准化、差异化、美观化的印象和认识,以便更好地识别,达至提升企业的经济效益和社会效益。

    CI由MI、VI、BI组成。

    MI (Mind Identity)理念识别(企业思想系统),是指企业思想的整合化。通过企业的经营想法及做法,进行标语的整合,宣传画的美化,思想观念的教育,向公众 及员工传递独特的企业思想特点。它包括了经营理念、经营宗旨、事业目标、企业定位、企业精神、企业格言、管理观念、人才观念、创新观念、工作观念、客户观 念、人生观念、价值观念、品牌定位、品牌标准广告语等。

    VI(Visual Identity)视觉识别(品牌视觉系统),是指企业识别(或品牌识别)的视觉化。通过企业或品牌的统一化、标准化、美观化的对内对外展示,传递企业或 品牌个性(或独特的品牌文化)。它包括了基础要素和应用要素两大部分。基础要素是指:企业名称、品牌名称、标志、标准字、标准色、辅助色、辅助图形、辅助 色带、装饰图案、标志组合、标语组合等;应用要素是指:办公用品、公关用品、环境展示、专卖展示、路牌招牌、制服饰物、交通工具、广告展示等。

    BI (Behavior Identity)行为识别(行为规范系统):是企业思想的行为化,通过企业思想指导下的员工对内对外的各种行为,以及企业的各种生产经营活动,传达企业 的管理特色。它包括干部教育、员工培训、规章制度、质量管理、行为规范、文娱活动、公关活动、公益活动、品牌推广等。

    形象一点说,CI就是一支军队,MI是军心,是军队投入战争的指导思想,是最不可动手的一部分;VI是军旗,是军队所到之处的形象标志;而BI则是军纪,它是军队取得战争胜利的重要保证。


    展开全文
  • 【程序人生】程序员接私活常用平台汇总

    万次阅读 多人点赞 2020-01-10 20:23:52
    Freelancer 的工作类型覆盖了很多不同的领域,由程序开发到市场营销、广告、会计、法务等一系列的可以远程的工作。 官方网站: https://www.freelance.com/ 16. Dribbble Dribbble 不只是全球最受欢迎的设计师...

    00. 目录

    01. 前言

    关于程序员接私活,社会各界说法不一。按照作者的观点来说如果你确实急用钱,价格又合适,那就去做。如果不怎么缺钱,那就接私活之前要好好考虑。私活的钱不好挣是一个方面,更重要的是如果你把做私活的时间花在提升自己上,产生的价值就要大得多。等你提升了自己,提升了固定薪水,远比拿的这点私活的钱划算。千万不要“捡了芝麻丢了西瓜”。

    如果你主业上遇到了瓶颈,平时的时间比较充分,想有一些额外的收入,同时为了保持技术的熟练度,这种情况下,是可以考虑接一些私活的。对于那种投入时间巨大,回报很可怜的项目,千万不要接。

    下面介绍一些常用的平台可以接私活。

    02. 程序员客栈

    在这里插入图片描述

    程序员客栈中国非常领先的自由工作平台,为中高端程序员、产品经理和设计师等等互联网相关人员提供稳定的线上工作机会,包括自由工作、远程工作和兼职工作,还支持按需雇佣,工作模式非常多,感兴趣的推荐大家尝试一下。虽然名称叫程序员客栈,但是除了程序员,像产品经理,设计师等等互联网相关人员,都能在上面找到适合自己的项目。感兴趣的可以体验一下。

    程序员客栈官网:https://www.proginn.com/

    03. 码市

    在这里插入图片描述

    码市是 Coding 推出的互联网软件外包服务平台,意在连接需求方与广大开发者。让项目的需求方快速的找到合适的开发者,完成项目开发工作。

    码市官方网站:https://codemart.com/

    04. 猪八戒网

    在这里插入图片描述

    猪八戒网创建于2006年,是服务中小微企业的人才共享平台。开创式地为人才与雇主搭建起双边市场,通过线上线下资源整合与大数据服务,实现人才与雇主精准无缝对接。找兼职的地方,主要是入门级项目,不适合专业程序员,只适合新手。

    猪八戒官网:https://luoyang.zbj.com/

    05. 开源众包

    在这里插入图片描述
    开源众包–专业的软件众包平台,350万+ 优质开发者为您提供网站、APP、微信/小程序、企业应用等软件开发服务,有效降低企业 IT 软件开发成本、解决技术资源不足等问题。

    开源中国的众包平台,主要是以众包为主。

    开源众包官网:https://zb.oschina.net/

    06. 智城外包网

    在这里插入图片描述

    智城外包网,聚合全国软件团队资源,官方认证,1小时响应,零交易佣金,托管安全保障。十年口碑运营,万家靠谱团队。免费比价,免费一站式外包项目管理工具。平台汇集软件咨询专家,软件技术专家,软件开发专家,软件开发公司,软件外包公司,软件外派公司。在线竞标模式,让IT外包项目和短期IT招聘、人力派遣需求可以获得高性价比的候选。海量资源池包括:网站设计、网站开发、手机应用开发、移动应用开发、安卓应用开发、苹果应用开发、微信应用开发、Java技术、C#技术、Web前端开发、IT人力外包、IT人力外派、IT人力短期招聘、技术合伙人、通用软件开发,SaaS软件实施,软件运维等服务门类。

    网官方网站:http://www.taskcity.com/

    07. 实现网

    在这里插入图片描述

    北京实现与爱科技有限公司是一个互联网工程师兼职平台。解决创业公司招人难、成本高的问题。

    创业公司通过实现网可以快速预约知名互联网企业的工程师、设计师到自己的团队工作。上午预约工程师,最快晚上即可到班兼职。

    互联网工程师可以在实现网注册成为技术顾问,利用业余时间助力创业公司,并且获得以时薪为单位的报酬。

    目前已有9000+工程师或设计师可在线预约和支付,支付后工程师会到团队里坐班沟通,快速推进创业者的产品开发进度。

    实现网为企业提供BAT等名企背景的、靠谱的开发设计兼职人才和自由职业者,满足企业项目外包、驻场开发、远程兼职、技术咨询等短期人力需求。已服务2000多家企业,包括好未来、方正、人人贷、秒拍等知名企业。

    官方网站:https://shixian.com/

    08. 猿急送

    在这里插入图片描述

    猿急送,一个高级技术共享平台,这里汇聚知名互联网公司的技术、设计、产品大牛,通过实际坐班、远程等方式,一对一为创业公司解决问题,提高创业效率。

    猿急送为您提供兼职程序员,兼职工程师信息,猿急送是一个高级技术共享平台,是优质的程序员兼职网站,这里汇聚BAT等知名互联网公司的技术开发、产品、设计大牛,通过实际坐班等方式,一对一为创业公司解决程序员、工程师等开发、产品设计人力问题。

    官方网站:https://www.yuanjisong.com/

    09. 人人开发

    在这里插入图片描述

    人人开发基于可视化快速开发平台 - 捷得(Joget)/捷得云(Joget Cloud)(PaaS),集众多开发者资源,为企业提供企业管理软件服务。应用市场提供应用产品、插件的在线试用和销售,服务市场以威客众包模式提供管理软件定制开发服务,各类企业级应用开发服务,例如:协同OA产品,ERP,CRM,人事管理,项目管理,资产管理,设备管理等。

    官方网站:http://rrkf.com/

    10. 开发邦

    在这里插入图片描述

    公司位于北京中关村科技园区核心区海淀园,成立于2010年,专注于为客户提供互联网软件技术开发与咨询服务,致力于利用互联网软件技术为客户提高效率、降低成本、提升效能、优化管理。

    团队核心成员均具有十年以上软件互联网技术开发经验,毕业于工科名校。至今,已成功执行近百个项目,涵盖管理软件、互联网系统、移动APP、前端互动开发等。

    先后为华为公司、商汤科技、工信部中国软件评测中心、神州数码、深鉴科技、中软集团、中国万网、中石油吐哈气举中心、华北电力大学、中科院科技政策与管理研究所、浪潮集团、ADI、世界五百强伊顿中国、北京外国语大学、51talk、勤邦生物、安龙基因等知名企业及机构提供过互联网软件技术开发与技术咨询服务。

    开发邦致力于成为企业业务互联网软件服务与咨询的定制方案提供商。

    官方网站:https://www.kaifabang.com/

    11. 电鸭社区

    在这里插入图片描述

    电鸭社区旨在帮助更多人走上「只工作,不上班」的自由工作之路,我们是一个「分布式组织」,通过分享及行动带来积极的影响,相信点滴的力量能改变潮水的方向。

    官方网站:https://eleduck.com/

    12. 快码

    在这里插入图片描述

    深圳快码科技成立于2014年11月,是一家创新型的互联网公司,致力于通过创新的开发方式,为软件技术开发行业带来改变,提供更快速、更高性价比的软件定制服务。

    “快码”的意思是“快速编写代码”。公司采用“专属项目经理 + 自有开发团队 + 平台程序员”的创新开发方式,严格按照互联网公司的标准来管理开发团队,确保每个项目都有充足的人员投入,确保项目的进度和开发质量。2015年,我们和全球最大的手游、APP云测试平台Testin达成战略合作协议,并获得Testin数百万的战略投资。

    目前平台已注册的开发者达到3万多人,涵盖各种开发语言与类型,可以提供开发的项目有iOS APP、安卓APP、微信公众号、PC网站、手机网站、微信小程序、桌面软件、智能硬件APP等。上线以来,我们已经完成了数千项目&任务的开发。

    创业灵感来自于快码团队的从业经验。在近十年的互联网技术经历中,对由于创业公司、外包公司人员不稳定,招聘困难、人手有限等问题而导致现有团队开发任务过重,开发进度缓慢等问题有着切身之痛,将在P2P旅游行业2年多的共享经济经验,和自身最熟悉的“软件开发”结合,创立了“快码”。

    快码将立足于代码开发,深耕行业,面向未来,通过持续的产品创新,为广大项目方、开发者提供专业的服务,为软件技术开发行业带来改变。

    快码是一个创新的软件开发平台。项目方可以更省钱、高效地完成项目的开发;开发者可以充分利用闲置时间,实现更高的商业价值!

    官方网站:https://www.kuai.ma/

    13. 英选

    在这里插入图片描述

    英选,可信赖的软件外包服务。用优秀的人,做漂亮的产品,写干净的代码。平台以定制开发外包服务为主,也是外包项目平台。

    官方网站:https://www.yingxuan.io/

    14. Upwork

    在这里插入图片描述

    Upwork 是全球最大的、最优秀的、最规范的综合类人力外包服务平台,由著名的 Elance 和 oDesk 合并。这里聚集 900 万来自全球各地的自由工作者,你肯定可以在找到适合你的职位。

    官方网站:https://www.upwork.com/

    15. Freelancer

    在这里插入图片描述

    Freelancer 的工作类型覆盖了很多不同的领域,由程序开发到市场营销、广告、会计、法务等一系列的可以远程的工作。

    官方网站:https://www.freelance.com/

    16. Dribbble

    Dribbble 不只是全球最受欢迎的设计师社区,同样是设计师寻找远程工作的好出处。自从被 Tiny 收购后,Dribbble 的招聘属性正在慢慢增强,试着持续 PO 出自己的好作品,等待你的伯乐,同样你可以关注 Jobs 页面,给心仪的 Team 提交简历。

    官方网站:https://dribbble.com/jobs

    17. Remoteok

    在这里插入图片描述

    Remoteok 不仅提供最初的兼职类远程工作,还有全职类,签署合同类和实习类的工作。网站创始人 Pieter Levels 本身就是一名数字游民,他同样是 Nomadlist 的创始人。

    官方网站:https://remoteok.io/

    18. Toptal

    在这里插入图片描述

    Toptal 是一个高端一些的自由职业者平台,适合比较有经验和工作尽力的远程工作者。它将企业与全球的软件工程师,设计师和业务顾问联系起来。

    官方网站:https://www.toptal.com/

    19. AngelList

    在这里插入图片描述

    AngelList 主要是服务于初创公司和天使投资人的平台,这里还有初创公司提供的远程工作的机会,如果对远程加入初创公司感兴趣的,可以尝试一下。

    官方网站:https://angel.co/remote

    20. Topcoder

    在这里插入图片描述

    Topcoder 通过算法比赛吸引世界顶级的程序员,他会将一下大型项目分割成很多小模块,通过竞赛的模式交给用户来做,优胜者可以拿到制定模块的奖金。

    官方网站:https://www.topcoder.com/

    21. 附录

    展开全文
  • Java覆盖率工具jacoco,Cobertura

    千次阅读 2020-02-11 11:03:48
    最近研究Java覆盖率工具,了解到了jacoco,Cobertura这两款,...市场上主要代码覆盖率工具: Emma Cobertura Jacoco Clover(商用) 具体见下表: 工具 Jacoco Emma Cobertura 原理 使用 A...

    最近研究Java覆盖率工具,了解到了jacoco,Cobertura这两款,但是Cobertura没有维护了,不支持新的java语法。下面简单介绍一下这两个工具的使用。

    简介

    • 市场上主要代码覆盖率工具:
      • Emma
      • Cobertura
      • Jacoco
      • Clover(商用)

    具体见下表:

    工具 Jacoco Emma Cobertura
    原理 使用 ASM 修改字节码 修改 jar 文件,class 文件字节码文件 基于 jcoverage,基于 asm 框架对 class 文件插桩
    覆盖粒度 行,类,方法,指令,分支 行,类,方法,基本块,指令,无分支覆盖 项目,包,类,方法的语句覆盖/分支覆盖
    插桩 on the fly、offline on the fly、offline offline,把统计代码插入编译好的class文件中
    生成结果 在 Tomcat 的 catalina.sh 配置 javaangent 参数,指出需要收集覆盖率的文件,shutdown 时才收集,只能使用 kill 命令关闭 Tomcat,不要使用 kill -9 html、xml、txt,二进制格式报表 html,xml
    缺点 需要源代码 1、需要 debug 版本,并打来 build.xml 中的 debug 编译项; 2、需要源代码,且必须与插桩的代码完全一致 1、不能捕获测试用例中未考虑的异常; 2、关闭服务器才能输出覆盖率信息(已有修改源代码的解决方案,定时输出结果;输出结果之前设置了 hook,会与某些服务器的 hook 冲突,web 测试中需要将 cobertura.ser 文件来回 copy
    性能 小巧 插入的字节码信息更多
    执行方式 maven,ant,命令行 命令行 maven,ant
    Jenkins 集成 生成 html 报告,直接与 hudson 集成,展示报告,无趋势图 无法与 hudson 集成 有集成的插件,美观的报告,有趋势图
    报告实时性 默认关闭,可以动态从 jvm dump 出数据 可以不关闭服务器 默认是在关闭服务器时才写结果
    维护状态 持续更新中 停止维护 停止维护,不支持java1.8的lamda表达式

    考虑到方案实施的难度很大取决于工具是否仍保持维护更新,所以选择 jacoco 来进行实践。

    Jacoco 是一个开源的覆盖率工具。Jacoco 可以嵌入到 Ant 、Maven 中,并提供了 EclEmma Eclipse 插件,也可以使用 Java Agent 技术监控 Java 程序。很多第三方的工具提供了对 Jacoco 的集成,如 sonar、Jenkins、IDEA。

    Jacoco 包含了多种尺度的覆盖率计数器,包含指令级(Instructions,C0 coverage),分支(Branches,C1 coverage)、圈复杂度(Cyclomatic Complexity)、行(Lines)、方法(Non-abstract Methods)、类(Classes)。

    ➢ Instructions:Jacoco 计算的最小单位就是字节码指令。指令覆盖率表明了在所有的指令中,

    哪些被指令过以及哪些没有被执行。这项指数完全独立于源码格式并且在任何情况下有效,不需要类文件

    的调试信息。

    ➢ Branches:Jacoco 对所有的 if 和 switch 指令计算了分支覆盖率。这项指标会统计所有的分支数

    量,并同时支出哪些分支被执行,哪些分支没有被执行。这项指标也在任何情况都有效。异常处理不考虑在分支范围内。

    ➢ Cyclomatic Complexity:Jacoco 为每个非抽象方法计算圈复杂度,并也会计算每个类,包,组的复杂度。根据 McCabe1996 的定义,圈复杂度可以理解为覆盖所有的可能情况最少使用的测试用

    例数。这项参数也在任何情况下有效。

    ➢ Lines:该项指数在有调试信息的情况下计算。

    ➢ Methods:每一个非抽象方法都至少有一条指令。若一个方法至少被执行了一条指令,就认为它被执行过。因为 JaCoco 直接对字节码进行操作,所以有些方法没有在源码显示(比如某些构造方法和由编

    译器自动生成的方法)也会被计入在内。

    ➢ Classes:每个类中只要有一个方法被执行,这个类就被认定为被执行。同 5 一样,有些没有在源码声明的方法被执行,也认定该类被执行。

     

    1 JaCoCo

    JaCoCo是一个开源的覆盖率工具,可以作为Eclipse、IDEA插件使用,也可以通过Maven插件的方式使用,还可以使用其JavaAgent,实时生成Java程序的覆盖率报告等等。

    很多第三方的工具提供了对JaCoCo的集成,如sonar、Jenkins等。

    1.1 单元测试覆盖率

    1.1.1 Maven 属性

    1
    2
    3
    4
    5
    6
    7
    8
    9
    
    <properties>
        <maven.compiler.encoding>UTF-8</maven.compiler.encoding>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
     
        <!-- 默认跳过测试 -->
        <maven.test.skip>true</maven.test.skip>
        <!-- 设置覆盖率报告位置,配置成属性的目的是便于命令行改变位置 -->
        <jacoco.report.path>${project.build.directory}/coverage-reports/jacoco-ut</jacoco.report.path>
    </properties>
    

    1.1.2 插件配置

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    
    <plugin>
        <groupId>org.jacoco</groupId>
        <artifactId>jacoco-maven-plugin</artifactId>
        <version>0.8.2</version>
        <executions>
            <!-- 准备指向Jacoco运行时Agent的属性,在测试执行之前传递给虚拟机参数 -->
            <execution>
                <id>pre-unit-test</id>
                <goals>
                    <goal>prepare-agent</goal>
                </goals>
                <configuration>
                    <!-- 设置覆盖率数据文件路径 -->
                    <destFile>${project.build.directory}/coverage-reports/jacoco-ut.exec</destFile>
                </configuration>
            </execution>
            <!-- 确保在单元测试执行之后生成覆盖率报告 -->
            <execution>
                <id>post-unit-test</id>
                <phase>test</phase>
                <goals>
                    <goal>report</goal>
                </goals>
                <configuration>
                    <!-- 引用覆盖率文件的路径-->
                    <dataFile>${project.build.directory}/coverage-reports/jacoco-ut.exec</dataFile>
                    <!-- 设置覆盖率报告存放路径. -->
                    <outputDirectory>${jacoco.report.path}</outputDirectory>
                </configuration>
            </execution>
        </executions>
    </plugin>
    

    1.1.3 Exclude class from JaCoCo coverage

    Example:

    <plugin>
      <groupId>org.jacoco</groupId>
      <artifactId>jacoco-maven-plugin</artifactId>
      <version>0.8.5</version>
      <configuration>
        <excludes>
          <!-- exclude classes in package com.acme.models whose name starts with Spring -->
          <exclude>com/acme/models/Spring*</exclude>
          <!-- exclude classes in package com.acme.api whose name ends with Api -->
          <exclude>com/acme/api/*Api.class</exclude>
          <!-- exclude all classes in package com.acme.generated -->
          <exclude>com/acme/generated/**/*</exclude>
        </excludes>
      </configuration>
    </plugin>

    或者

     the following as per the Jacoco docs

    <configuration>
        <excludes>
            <exclude>**/*Config.*</exclude>
            <exclude>**/*Dev.*</exclude>
        </excludes>
    </configuration>

    The values of the exclude fields should be class paths (not package names) of the compiled classes relative to the directory target/classes/ using the standard wildcard syntax

    *   Match zero or more characters
    **  Match zero or more directories
    ?   Match a single character

    You may also exclude a package and all of its children/subpackages this way:

    <exclude>some/package/**/*</exclude>

     

    1.2 生成报告

    mvn clean test -Dmaven.test.skip=false

    生成 其他目录下面

    mvn clean test -Dmaven.test.skip=false -Djacoco.report.path=/opt/websuite/nginx/html

     

    1.3 接口测试覆盖率

    通过在JVM启动参数中加入-javaagent参数指定 JaCoCo 的代理程序,在Class Loader装载一个class前将统计代码插入class文件,达到在执行测试代码或者人工功能测试的时候,实时统计覆盖率的目的。

    1.3.1 下载 Agent

    下载地址: https://github.com/jacoco/jacoco/releases,下载之后解压,找到 lib/jacocoagent.jar 文件

    1.3.2 配置 Agent

    1
    
    -javaagent:/opt/jacocoagent.jar=includes=xyz.kail.*,output=tcpserver,address=127.0.0.1,port=8110
    
    1. javaagent : jacocoagent.jar 文件的的全路径
    2. includes: 为需要分析的 包
    3. output: 输出覆盖率报告数据的方式,其它还有
    4. address : 本机IP
    5. port: 暴露的端口

    详见官方文档: https://www.eclemma.org/jacoco/trunk/doc/agent.html

    1.3.3 dump报告数据

    找到 lib/jacococli.jar

    1
    2
    
    # dump 数据到 /opt/jacoco.exec 文件
    java -jar jacococli.jar dump --address 127.0.0.1 --port 8110 --destfile /opt/jacoco.exec
    

    1.3.4 生成 html 覆盖率报告

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    
    java -jar jacococli.jar \
    # 指定报告数据文件的路径
    report /opt/jacoco.exec \
    # 指定项目编译后的 class 文件路径
    --classfiles /workspace/some-project/target/some-project/WEB-INF/classes \
    # 指定生成 HTML 报告路径
    --html /opt \
    #指定源码路径(如果不指定无只能看到类和方法的覆盖率,没办法看到具体业务逻辑的服务概率)
    --sourcefiles /workspace/some-project/src/main/java \
    # 指定编码方式
    --encoding utf-8
    # 指定报告名称
    --name some-project
    

    1.4 其他

    1. JVM 启动 java agent 参数中加上 jmx 配置,可通过 MBean 的方式操作 dump 数据
    2. 官方有提供 可通过代码导出生成报告的示例,可封装成 HTTP 接口 进行管理

    1.5 与其他工具对比

    原理 使用 ASM 修改字节码 修改 jar 文件,class 文件字节码文件 基于 jcoverage,基于 asm 框架对 class 文件插桩
    覆盖粒度 行,类,方法,指令,分支 行,类,方法,基本块,指令,无分支覆盖 项目,包,类,方法的语句覆盖/分支覆盖
    插桩 on the fly、offline on the fly、offline offline,把统计代码插入编译好的class文件中
    生成结果 exec 数据文件 html、xml、txt,二进制格式报表 html,xml
    缺点 需要源代码 1、需要 debug 版本,并打来 build.xml 中的 debug 编译项;
    2、需要源代码,且必须与插桩的代码完全一致
    1、不能捕获测试用例中未考虑的异常;
    2、关闭服务器才能输出覆盖率信息
    性能 小巧 插入的字节码信息更多
    执行方式 maven,ant,命令行Sonar、Jenkins、IDE 命令行 maven,ant
    Jenkins 集成 生成 html 报告,展示报告,无趋势图 无法与 hudson 集成 有集成的插件,美观的报告,有趋势图
    报告实时性 默认关闭,可以动态从 jvm dump 出数据 可以不关闭服务器 默认是在关闭服务器时才写结果
    维护状态 持续更新中 停止维护 停止维护

    以上对比结果来自: Jacoco Code Coverage

    1.6 idea中使用JaCoCo

    https://blog.csdn.net/lvyuan1234/article/details/82836052

    1.7 Jacoco+Maven+Jenkins配置

    可参考:

    https://www.jianshu.com/p/e7fc806ea0e0

    https://blog.csdn.net/trisonlu123/article/details/81078272

    https://blog.csdn.net/Pokharar/article/details/86648077

     

    2 Cobertura

    命令:$ mvn cobertura:cobertura

    效果:打开项目目录:target/site/cobertura/下的index.xml文件,就能看到测试覆盖率报告:

    mvn cobertura:help                   查看cobertura插件的帮助
    mvn cobertura:clean                 清理插件生产的中间及最终报告文件
    mvn cobertura:check                 检查最后一次标注(instrumentation) 正确与否
    mvn cobertura:cobertura           运行cobertura的检查任务并生成报表,报表生成在target/site/cobertura目录下
    cobertura:dump-datafile Cobertura 数据文件 dump 指令 , 不常用
    mvn cobertura:instrument         标注编译好的 javaclass 文件
     

    2.1 Cobertura  的 pom.xml配置

    参考:

    https://www.cnblogs.com/testermark/p/4322018.html

    https://www.mojohaus.org/cobertura-maven-plugin/plugin-info.html

    https://blog.csdn.net/liqingjie_fjfz/article/details/47984337

    在pom.xml里配置: 

        <properties>
            <cobertura.version>2.7</cobertura.version>
        </properties>

       <build>
            <pluginManagement>

                  <plugins>
                    <plugin>
                        <groupId>org.codehaus.mojo</groupId>
                        <artifactId>cobertura-maven-plugin</artifactId>
                        <version>${cobertura.version}</version>
                        <configuration>
                            <check />
                            <formats>
                                <format>html</format>
                                <format>xml</format>
                            </formats>
                            <aggregate>true</aggregate>
                        </configuration>
                        <executions>
                            <execution>
                                <phase>package</phase>
                                <goals>
                                    <goal>cobertura</goal>
                                </goals>
                            </execution>
                        </executions>
                    </plugin>
                </plugins>
            </pluginManagement>
        </build>

    2.2 Maven之Cobertura Maven Plugin:

    https://www.cnblogs.com/qyf404/p/5040593.html

     

    2.3.分析结果指标及含义

    1> Line Coverage(行覆盖率)
    The percent of lines executed by this test run.
    2> Branch Coverage(分支覆盖率)
    The percent of branches executed by this test run.
    3> Complexity(复杂度)
    Average McCabe’s cyclomatic code complexity for all methods. This is basically a count of the number of different code paths in a method (incremented by 1 for each if statement, while loop, etc.)
    4> N/A
    Line coverage and branch coverage will appear as “Not Applicable” when Cobertura can not find line number information in the .class file. This happens for stub and skeleton classes, interfaces, or when the class was not compiled with “debug=true.”

    2.4.注意细节:

    1> 以上分析基于单模块(测试代码和源代码在同一个模块中),如果项目是多模块(测试代码和源代码在不同的模块中)则需要maven+Ant来具体分析,详细配置可以参考链接文档: http://blog.csdn.net/baynkbtg/article/details/53116683
    2> 如果要使用Ant,需要注意build.xml的配置
    3> 如果要得到单个测试用例的测试覆盖率,可以使用idea自带的run with coverage
     

    2.5 硬伤:Cobertura 不支持java1.8

         当升级到java8之后,如果项目的代码中使用了java的lamda表达式(类似 list.stream.foreach( i -> System.out.println(i))等,当执行 mvn clean cobertura:cobertura 命令的时候,会出现如下如下信息:

    [WARN] JavaNCSS got an error while parsing the java file
    Encountered " ">" "> "" at line
    Was expecting one of:
    "assert" ...
    "boolean" ...
    "byte" ...

    这个问题导致到原因是什么呢?

    (The root cause of this issue is that the NCSS library ( https://github.com/codehaus/javancss ) that Cobertura uses is not able to handle Java8 syntax)。

    javancss can't handle certain Java8 Code and you get an error while parsing.

    The last commit was 2 years ago so you have to try an alternative like SonarCube

    答案来自

    https://stackoverflow.com/questions/34664152/cobertura-parsing-errorcobertura-javancss-parser-parseexception

    https://github.com/cobertura/cobertura/issues/176

     

    暂时没有什么好的解决方法,只能屏蔽一些错误信息。

    <plugin>
        <groupId>org.codehaus.mojo</groupId>
        <artifactId>cobertura-maven-plugin</artifactId>
        <version>2.7</version>
        <configuration>
            **<quiet>true</quiet>**
            <formats>
                <format>xml</format>
            </formats>
            <instrumentation>
                **<ignoreTrivial>true</ignoreTrivial>**
            </instrumentation>
        </configuration>
        <executions>
            <execution>
                <phase>package</phase>
                    <goals>
                        <goal>cobertura</goal>
                    </goals>
            </execution>
        </executions>
    </plugin>

     

    3 参考

    https://tech.meituan.com/2017/06/16/android-jacoco-practace.html

    https://www.cnblogs.com/DFX339/p/8392019.html

    https://www.javatt.com/p/89111

    https://blog.csdn.net/qijin2016/article/details/80282016

    https://blog.csdn.net/gaofuliang/article/details/80097495

    展开全文
  • 常用数据分析方法总结

    千次阅读 2019-11-02 14:06:23
    在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表(李克特量表(Likert scale)是属评分加总式量表最常用的一种,属同一构念的这些项目是用加总方式来计分,单独或个别项目是无意义的。它是由美国社会...

    最近优化一个画像产品,用到一些数据分析方法,这里总结一下。

    主要参考:https://www.jianshu.com/p/809fb2261b23 ,补充一些细节

    一、描述统计

    描述统计是通过图表或数学方法,对数据资料进行整理、分析,并对数据的分布状态、数字特征和随机变量之间关系进行估计和描述的方法。描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分。

    1.集中趋势分析

    集中趋势分析主要靠平均数、中数、众数等统计指标来表示数据的集中趋势。例如被试的平均成绩多少?是正偏分布还是负偏分布?

    正偏态分布是相对正太分布而言的。当用累加次数曲线法检验数据是否为正态分布时,若M>Me>Mo时,即平均数大于中位数,中位数又大于众数,则数据的分布是属于正偏态分布。正偏态分布的特征是曲线的最高点偏向X轴的左边,位于左半部分的曲线比正态分布的曲线更陡,而右半部分的曲线比较平缓,并且其尾线比起左半部分的曲线更长,无限延伸直到接近X轴。

    负偏态分布也是相对正态分布而言的。当用累加次数曲线法检验数据是否为正态分布时,若M<Me<Mo时,即平均数小于中数,中数又小于众数,则数据的分布是属于负偏态分布。负偏态分布的特征是曲线的最高点偏向X轴的右边,位于右半部分的曲线比正态分布的曲线更陡,而左半部分的曲线比较平缓,并且其尾线比起右半部分的曲线更长,无限延伸直到接近X轴。

    用偏度系数反映数据分布偏移中心位置的程度,记为SK:

    SK= (均值一中位数)/标准差.

    在正态分布条件下,由于均值等于中位数,所以偏度系数等于0。当偏度系数大于0时,则为正偏态;当偏度系数小于0时,则为负偏态

    2.离中趋势分析

    离中趋势分析主要靠全距、四分差、平均差、方差(协方差:用来度量两个随机变量关系的统计量)、标准差等统计指标来研究数据的离中趋势。例如,我们想知道两个教学班的语文成绩中,哪个班级内的成绩分布更分散,就可以用两个班级的四分差或百分点来比较。

    全距是用来表示统计资料中的变异量数,其最大值与最小值之间的差距

    四分差,quartile deviation。它是上四分位数(Q3,即位于75%)与下四分位数(Q1,即位于25%)的差。Q = Q3-Q1

    平均差(Mean Deviation)是表示各个变量值之间差异程度的数值之一。指各个变量值同平均数的离差绝对值的算数平均数。

    3.相关分析

    相关分析探讨数据之间是否具有统计学上的关联性。这种关系既包括两个数据之间的单一相关关系——如年龄与个人领域空间之间的关系,也包括多个数据之间的多重相关关系——如年龄、抑郁症发生率、个人领域空间之间的关系;既包括A大B就大(小),A小B就小(大)的直线相关关系,也可以是复杂相关关系(A=Y-B*X);既可以是A、B变量同时增大这种正相关关系,也可以是A变量增大时B变量减小这种负相关,还包括两变量共同变化的紧密程度——即相关系数。

    实际上,相关关系唯一不研究的数据关系,就是数据协同变化的内在根据——即因果关系。获得相关系数有什么用呢?简而言之,有了相关系数,就可以根据回归方程,进行A变量到B变量的估算,这就是所谓的回归分析,因此,相关分析是一种完整的统计研究方法,它贯穿于提出假设,数据研究,数据分析,数据研究的始终。

    例如,我们想知道对监狱情景进行什么改造,可以降低囚徒的暴力倾向。我们就需要将不同的囚舍颜色基调、囚舍绿化程度、囚室人口密度、放风时间、探视时间进行排列组合,然后让每个囚室一种实验处理,然后用因素分析法找出与囚徒暴力倾向的相关系数最高的因素。

    假定这一因素为囚室人口密度,我们又要将被试随机分入不同人口密度的十几个囚室中生活,继而得到人口密度和暴力倾向两组变量(即我们讨论过的A、B两列变量)。然后,我们将人口密度排入X轴,将暴力倾向分排入Y轴,获得了一个很有价值的图表,当某典狱长想知道,某囚舍扩建到N人/间囚室,暴力倾向能降低多少。我们可以当前人口密度和改建后人口密度带入相应的回归方程,算出扩建前的预期暴力倾向和扩建后的预期暴力倾向,两数据之差即典狱长想知道的结果。

    4.推论统计

    推论统计是统计学乃至于心理统计学中较为年轻的一部分内容。它以统计结果为依据,来证明或推翻某个命题。具体来说,就是通过分析样本与样本分布的差异,来估算样本与总体、同一样本的前后测成绩差异,样本与样本的成绩差距、总体与总体的成绩差距是否具有显著性差异。

    例如,我们想研究教育背景是否会影响人的智力测验成绩。可以找100名24岁大学毕业生和100名24岁初中毕业生。采集他们的一些智力测验成绩。用推论统计方法进行数据处理,最后会得出类似这样儿的结论:“研究发现,大学毕业生组的成绩显著高于初中毕业生组的成绩,二者在0.01水平上具有显著性差异,说明大学毕业生的一些智力测验成绩优于中学毕业生组。”

    5.正态性检验

    很多统计方法都要求数值服从或近似服从正态分布,所以之前需要进行正态性检验。

    常用方法:非参数检验的K-量检验、P-P图、Q-Q图、W检验、动差法。

    二、假设检验

    1.参数检验

    参数检验是在已知总体分布的条件下(一股要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验。

    1)U验 :使用条件:当样本含量n较大时,样本值符合正态分布

    u检验是一种用来评估两个独立的顺序数据样本是否来自同一个总体的非参数检验

    2)T检验:使用条件:当样本含量n较小时,样本值符合正态分布

    A 单样本t检验:推断该样本来自的总体均数μ与已知的某一总体均数μ0 (常为理论值或标准值)有无差别;

    B 配对样本t检验:当总体均数未知时,且两个样本可以配对,同对中的两者在可能会影响处理效果的各种条件方面扱为相似;

    C 两独立样本t检验:无法找到在各方面极为相似的两样本作配对比较时使用。

    补充:

    在概率学和统计学中,t-分布t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时),则应该用正态分布来估计总体均值。假设X服从标准正态分布N(0,1),Y服从分布,那么的分布称为自由度为n的t分布,记为,t分布是一簇曲线,其形态变化与n(确切地说与自由度df)大小有关。自由度df越小,t分布曲线越低平;自由度df越大,t分布曲线越接近标准正态分布(u分布)曲线。随着自由度逐渐增大,t分布逐渐接近标准正态分布。标准正态分布,又称作u分布。所以,u分布是t分布的极限。

    u检验和t检验可用于样本均数与总体均数的比较以及两样本均数的比较。理论上要求样本来自正态分布总体。但在实用时,只要样本例数n较大,或n小但总体标准差σ已知时,就可应用u检验;n小且总体标准差σ未知时,可应用t检验,但要求样本来自正态分布总体。两样本均数比较时还要求两总体方差相等。

    比较的目的是推断样本所代表的未知总体均数μ与已知总体均数μ0有无差别。通常把理论值、标准值或经大量调查所得的稳定值作为μ0.根据样本例数n大小和总体标准差σ是否已知选用u检验或t 检验。

    若样本含量n较大,或n虽小但总体方差σ2已知,用u检验。u检验以u分布为基础,u分布是t分布的极限分布,当样本含量凡较大时(如n>60),t分布近似u分布,t检验等同u检验。u分布和u检验也称z分布和z检验。u检验统计量公式为

    式中,为样本均数;μ0为已知总体均数;n为样本含量;为标准差的估计值;为标准差的理论值。

    在成组设计的两样本均数比较的统计量u值计算中,需计算出两样本均数差的标准差,因此统计量u的计算公式为:

    t检验可分为单总体检验和双总体检验,以及配对样本检验

    单样本T检验是检验某个变量的总体均值和某指定值之间是否存在显著差异。T检验的前提是样本总体服从正态分布。

    当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计分布呈t分布。

    单总体t检验统计量为:

    双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况,一是独立样本t检验(各实验处理组之间毫无相关存在,即为独立样本),该检验用于检验两组非相关样本被试所获得的数据的差异性;一是配对样本t检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。

    1)独立样本t检验统计量为:

    (2)配对样本检验

    当我们计算出对应的t/u统计量,查表即可。所以,本质t检验和u检验是一致的,只是一个采用样本均值和已知样本均值的离差统计分布成u分布,一个采用样本均值和已知样本均值离差统计分布呈t分布。

    2.非参数检验

    非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一致性假设(如总体分布的位罝是否相同,总体分布是否正态)进行检验。

    适用情况:顺序类型的数据资料,这类数据的分布形态一般是未知的。

    A 虽然是连续数据,但总体分布形态未知或者非正态;

    B 体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下;

    主要方法包括:卡方检验、秩和检验、二项检验、游程检验、K-量检验等。

    三、信度分析

    信度(Reliability)即可靠性,它是指采用同样的方法对同一对象重复测量时所得结果的一致性程度。信度指标多以相关系数表示,大致可分为三类:稳定系数(跨时间的一致性),等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。信度分析的方法主要有以下四种:重测信度法、复本信度法、折半信度法、α信度系数法。

    1.方法

    1)重测信度法编辑:这一方法是用同样的问卷对同一组被调查者间隔一定时间重复施测,计算两次施测结果的相关系数。显然,重测信度属于稳定系数。重测信度法特别适用于事实式问卷,如性别、出生年月等在两次施测中不应有任何差异,大多数被调查者的兴趣、爱好、习惯等在短时间内也不会有十分明显的变化。如果没有突发事件导致被调查者的态度、意见突变,这种方法也适用于态度、意见式问卷。由于重测信度法需要对同一样本试测两次,被调查者容易受到各种事件、活动和他人的影响,而且间隔时间长短也有一定限制,因此在实施中有一定困难。

    2)复本信度法编辑:让同一组被调查者一次填答两份问卷复本,计算两个复本的相关系数。复本信度属于等值系数。复本信度法要求两个复本除表述方式不同外,在内容、格式、难度和对应题项的提问方向等方面要完全一致,而在实际调查中,很难使调查问卷达到这种要求,因此采用这种方法者较少。

    3)折半信度法编辑:折半信度法是将调查项目分为两半,计算两半得分的相关系数,进而估计整个量表的信度。折半信度属于内在一致性系数,测量的是两半题项得分间的一致性。这种方法一般不适用于事实式问卷(如年龄与性别无法相比),常用于态度、意见式问卷的信度分析。

    在问卷调查中,态度测量最常见的形式是5级李克特(Likert)量表(李克特量表(Likert scale)是属评分加总式量表最常用的一种,属同一构念的这些项目是用加总方式来计分,单独或个别项目是无意义的。它是由美国社会心理学家李克特于1932年在原有的总加量表基础上改进而成的。该量表由一组陈述组成,每一陈述有"非常同意"、"同意"、"不一定"、"不同意"、"非常不同意"五种回答,分别记为5、4、3、2、1,每个被调查者的态度总分就是他对各道题的回答所得分数的加总,这一总分可说明他的态度强弱或他在这一量表上的不同状态。)。

    进行折半信度分析时,如果量表中含有反意题项,应先将反意题项的得分作逆向处理,以保证各题项得分方向的一致性,然后将全部题项按奇偶或前后分为尽可能相等的两半,计算二者的相关系数(rhh,即半个量表的信度系数),最后用斯皮尔曼-布朗(Spearman-Brown)公式:求出整个量表的信度系数(ru)。

    4)α信度系数法:α信度系数是目前最常用的信度系数,其公式为:

    α=(k/(k-1))*(1-(∑Si^2)/ST^2)

    其中,K为量表中题项的总数, Si^2为第i题得分的题内方差, ST^2为全部题项总得分的方差。从公式中可以看出,α系数评价的是量表中各题项得分间的一致性,属于内在一致性系数。这种方法适用于态度、意见式问卷(量表)的信度分析。

    总量表的信度系数最好在0.8以上,0.7-0.8之间可以接受;分量表的信度系数最好在0.7以上,0.6-0.7还可以接受。Cronbach 's alpha系数如果在0.6以下就要考虑重新编问卷。用于检査测量的可信度,例如调查问卷的真实性。

    2.分类

    1)外在信度:不同时间测量时量表的一致性程度,常用方法重测信度

    2)内在信度:每个量表是否测量到单一的概念,同时组成两表的内在体项一致性如何,常用方法分半信度。

    四、列联表分析

    列联表是观测数据按两个或更多属性(定性变量)分类时所列出的频数表。

    1.简介

    若总体中的个体可按两个属性A、B分类,A有r个等级A1,A2,…,Ar,B有c个等级B1,B2,…,Bc,从总体中抽取大小为n的样本,设其中有nij个个体的属性属于等级Ai和Bj,nij称为频数,将r×c个nij排列为一个r行c列的二维列联表,简称r×c表。若所考虑的属性多于两个,也可按类似的方式作出列联表,称为多维列联表。

    列联表又称交互分类表,所谓交互分类,是指同时依据两个变量的值,将所研究的个案分类。交互分类的目的是将两变量分组,然后比较各组的分布状况,以寻找变量间的关系。用于分析离散变量或定型变量之间是否存在相关。

    列联表分析的基本问题是,判明所考察的各属性之间有无关联,即是否独立。如在前例中,问题是:一个人是否色盲与其性别是否有关?在r×с表中,若以pi、pj和pij分别表示总体中的个体属于等级Ai,属于等级Bj和同时属于Ai、Bj的概率(pi,pj称边缘概率,pij称格概率),“A、B两属性无关联”的假设可以表述为H0:pij=pi·pj,(i=1,2,…,r;j=1,2,…,с),未知参数pij、pi、pj的最大似然估计(见点估计)分别为行和及列和(统称边缘和)为样本大小。根据K.皮尔森(1904)的拟合优度检验或似然比检验(见假设检验),当h0成立,且一切pi>0和pj>0时,统计量的渐近分布是自由度为(r-1)(с-1)的Ⅹ分布,式中Eij=(ni·nj)/n称为期望频数。当n足够大,且表中各格的Eij都不太小时,可以据此对h0作检验:若Ⅹ值足够大,就拒绝假设h0,即认为A与B有关联。在前面的色觉问题中,曾按此检验,判定出性别与色觉之间存在某种关联。

    2.需要注意

    若样本大小n不很大,则上述基于渐近分布的方法就不适用。对此,在四格表情形,R.A.费希尔(1935)提出了一种适用于所有n的精确检验法。其思想是在固定各边缘和的条件下,根据超几何分布(见概率分布),可以计算观测频数出现任意一种特定排列的条件概率。把实际出现的观测频数排列,以及比它呈现更多关联迹象的所有可能排列的条件概率都算出来并相加,若所得结果小于给定的显著性水平,则判定所考虑的两个属性存在关联,从而拒绝h0。

    对于二维表,可进行卡方检验,对于三维表,可作Mentel-Hanszel分层分析。

    列联表分析还包括配对计数资料的卡方检验、行列均为顺序变量的相关检验。

    五、相关分析

    研究现象之间是否存在某种依存关系,对具体有依存关系的现象探讨相关方向及相关程度。

    1)单相关:两个因素之间的相关关系叫单相关,即研究时只涉及一个自变量和一个因变量;

    2)复相关 :三个或三个以上因素的相关关系叫复相关,即研究时涉及两个或两个以上的自变量和因变量相关;

    3)偏相关:在某一现象与多种现象相关的场合,当假定其他变量不变时,其中两个变量之间的相关关系称为偏相关。

    六、方差分析

    使用条件:各样本须是相互独立的随机样本;各样本来自正态分布总体;各总体方差相等。

    1.分类

    1)单因素方差分析:一项试验只有一个影响因素,或者存在多个影响因素时,只分析一个因素与响应变量的关系

    2)多因素有交互方差分析:一顼实验有多个影响因素,分析多个影响因素与响应变量的关系,同时考虑多个影响因素之间的关系

    3)多因素无交互方差分析:分析多个影响因素与响应变量的关系,但是影响因素之间没有影响关系或忽略影响关系

    4)协方差分析:传统的方差分析存在明显的弊端,无法控制分析中存在的某些随机因素,使之影响了分析结果的准确度。协方差分析主要是在排除了协变量的影响后再对修正后的主效应进行方差分析,是将线性回归与方差分析结合起来的一种分析方法。

    七、回归分析

    1.一元线性回归分析

    只有一个自变量X与因变量Y有关,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布。

    2.多元线性回归分析

    使用条件:分析多个自变量与因变量Y的关系,X与Y都必须是连续型变量,因变量y或其残差必须服从正态分布 。

    1)变呈筛选方式

    选择最优回归方程的变里筛选法包括全横型法(CP法)、逐步回归法,向前引入法和向后剔除法

    2)横型诊断方法

    A 残差检验:观测值与估计值的差值要艰从正态分布

    B 强影响点判断:寻找方式一般分为标准误差法、Mahalanobis距离法

    C 共线性诊断:

    • 诊断方式:容忍度、方差扩大因子法(又称膨胀系数VIF)、特征根判定法、条件指针CI、方差比例

    • 处理方法:增加样本容量或选取另外的回归如主成分回归、岭回归等

    3.Logistic回归分析

    线性回归模型要求因变量是连续的正态分布变里,且自变量和因变量呈线性关系,而Logistic回归模型对因变量的分布没有要求,一般用于因变量是离散时的情况

    分类:

    Logistic回归模型有条件与非条件之分,条件Logistic回归模型和非条件Logistic回归模型的区别在于参数的估计是否用到了条件概率。

    4.其他回归方法

    非线性回归、有序回归、Probit回归、加权回归等

    八、聚类分析

    聚类与分类的不同在于,聚类所要求划分的类是未知的。

    聚类分析是一种探索性的分析,在分类的过程中,人们不必事先给出一个分类的标准,聚类分析能够从样本数据出发,自动进行分类。聚类分析所使用方法的不同,常常会得到不同的结论。不同研究者对于同一组数据进行聚类分析,所得到的聚类数未必一致。

    从实际应用的角度看,聚类分析是数据挖掘的主要任务之一。而且聚类能够作为一个独立的工具获得数据的分布状况,观察每一簇数据的特征,集中对特定的聚簇集合作进一步地分析。聚类分析还可以作为其他算法(如分类和定性归纳算法)的预处理步骤。

    1.定义

    依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。

    各类事物缺乏可靠的历史资料,无法确定共有多少类别,目的是将性质相近事物归入一类。各指标之间具有一定的相关关系。

    变量类型:定类变量、定量(离散和连续)变量

    样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似性的统计量。

    2.性质分类

    Q型聚类分析:对样本进行分类处理,又称样本聚类分析使用距离系数作为统计量衡量相似度,如欧式距离、极端距离、绝对距离等。

    R型聚类分析:对指标进行分类处理,又称指标聚类分析使用相似系数作为统计量衡量相似度,相关系数、列联系数等。

    3.方法分类

    1)系统聚类法:适用于小样本的样本聚类或指标聚类,一般用系统聚类法来聚类指标,又称分层聚类。

    2)逐步聚类法:适用于大样本的样本聚类。

    3)其他聚类法:两步聚类、K均值聚类等。

    九、判别分析

    1.判断分析

    根据已掌握的一批分类明确的样品建立判别函数,使产生错判的事例最少,进而对给定的一个新样品,判断它来自哪个总体。

    2.与聚类分析区别

    1)聚类分析可以对样本逬行分类,也可以对指标进行分类;而判别分析只能对样本。

    2)聚类分析事先不知道事物的类别,也不知道分几类;而判别分析必须事先知道事物的类别,也知道分几类。

    3)聚类分析不需要分类的历史资料,而直接对样本进行分类;而判别分析需要分类历史资料去建立判别函数,然后才能对样本进行分类。

    3.进行分析

    1)Fisher判别分析法

    以距离为判别准则来分类,即样本与哪个类的距离最短就分到哪一类,适用于两类判别;

    以概率为判别准则来分类,即样本属于哪一类的概率最大就分到哪一类,适用于多类判别。

    2)BAYES判别分析法

    BAYES判别分析法比FISHER判别分析法更加完善和先进,它不仅能解决多类判别分析,而且分析时考虑了数据的分布状态,所以一般较多使用;

    十、主成分分析

    主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。

    主成分分析首先是由K.皮尔森(Karl Pearson)对非随机变量引入的,尔后H.霍特林将此方法推广到随机向量的情形。信息的大小通常用离差平方和或方差来衡量。

    1.原理

    在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,将重复的变量(关系紧密的变量)删去多余,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

    设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析,也是数学上用来降维的一种方法。

    2.缺点

    1、在主成分分析中,我们首先应保证所提取的前几个主成分的累计贡献率达到一个较高的水平(即变量降维后的信息量须保持在一个较高水平上),其次对这些被提取的主成分必须都能够给出符合实际背景和意义的解释(否则主成分将空有信息量而无实际含义)。

    2、主成分的解释其含义一般多少带有点模糊性,不像原始变量的含义那么清楚、确切,这是变量降维过程中不得不付出的代价。因此,提取的主成分个数m通常应明显小于原始变量个数p(除非p本身较小),否则维数降低的“利”可能抵不过主成分含义不如原始变量清楚的“弊”。

    十一、因子分析

    一种旨在寻找隐藏在多变量数据中、无法直接观察到却影响或支配可测变量的潜在因子、并估计潜在因子对可测变量的影响程度以及潜在因子之间的相关性的一种多元统计分析方法。

    与主成分分析比较:

    相同:都能够起到治理多个原始变量内在结构关系的作用

    不同:主成分分析重在综合原始变适的信息.而因子分析重在解释原始变量间的关系,是比主成分分析更深入的一种多元统计方法

    用途:

    1)减少分析变量个数

    2)通过对变量间相关关系探测,将原始变量进行分类

    十二、时间序列分析

    动态数据处理的统计方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题;时间序列通常由4种要素组成:趋势、季节变动、循环波动和不规则波动。

    主要方法:移动平均滤波与指数平滑法、ARIMA横型、量ARIMA横型、ARIMAX模型、向呈自回归横型、ARCH族模型

    时间序列是指同一变量按事件发生的先后顺序排列起来的一组观察值或记录值。构成时间序列的要素有两个:

    其一是时间;

    其二是与时间相对应的变量水平。

    实际数据的时间序列能够展示研究对象在一定时期内的发展变化趋势与规律,因而可以从时间序列中找出变量变化的特征、趋势以及发展规律,从而对变量的未来变化进行有效地预测。

    时间序列的变动形态一般分为四种:长期趋势变动,季节变动,循环变动,不规则变动。

    1.时间序列预算法的应用

    系统描述:根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述;

    系统分析:当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理;

    预测未来:一般用ARMA模型拟合时间序列,预测该时间序列未来值;

    决策和控制:根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到过程要偏离目标时便可进行必要的控制。

    2.特点

    假定事物的过去趋势会延伸到未来;

    预测所依据的数据具有不规则性;

    撇开了市场发展之间的因果关系。

    时间序列分析预测法是根据市场过去的变化趋势预测未来的发展,它的前提是假定事物的过去会同样延续到未来。事物的现实是历史发展的结果,而事物的未来又是现实的延伸,事物的过去和未来是有联系的。市场预测的时间序列分析法,正是根据客观事物发展的这种连续规律性,运用过去的历史数据,通过统计分析,进一步推测市场未来的发展趋势。市场预测中,事物的过去会同样延续到未来,其意思是说,市场未来不会发生突然跳跃式变化,而是渐进变化的。

    时间序列分析预测法的哲学依据,是唯物辩证法中的基本观点,即认为一切事物都是发展变化的,事物的发展变化在时间上具有连续性,市场现象也是这样。市场现象过去和现在的发展变化规律和发展水平,会影响到市场现象未来的发展变化规律和规模水平;市场现象未来的变化规律和水平,是市场现象过去和现在变化规律和发展水平的结果。

    需要指出,由于事物的发展不仅有连续性的特点,而且又是复杂多样的。因此,在应用时间序列分析法进行市场预测时应注意市场现象未来发展变化规律和发展水平,不一定与其历史和现在的发展变化规律完全一致。随着市场现象的发展,它还会出现一些新的特点。因此,在时间序列分析预测中,决不能机械地按市场现象过去和现在的规律向外延伸。必须要研究分析市场现象变化的新特点,新表现,并且将这些新特点和新表现充分考虑在预测值内。这样才能对市场现象做出既延续其历史变化规律,又符合其现实表现的可靠的预测结果。

    ②时间序列分析预测法突出了时间因素在预测中的作用,暂不考虑外界具体因素的影响。时间序列在时间序列分析预测法处于核心位置,没有时间序列,就没有这一方法的存在。虽然,预测对象的发展变化是受很多因素影响的。但是,运用时间序列分析进行量的预测,实际上将所有的影响因素归结到时间这一因素上,只承认所有影响因素的综合作用,并在未来对预测对象仍然起作用,并未去分析探讨预测对象和影响因素之间的因果关系。因此,为了求得能反映市场未来发展变化的精确预测值,在运用时间序列分析法进行预测时,必须将量的分析方法和质的分析方法结合起来,从质的方面充分研究各种因素与市场的关系,在充分分析研究影响市场变化的各种因素的基础上确定预测值。

    需要指出的是,时间序列预测法因突出时间序列暂不考虑外界因素影响,因而存在着预测误差的缺陷,当遇到外界发生较大变化,往往会有较大偏差,时间序列预测法对于中短期预测的效果要比长期预测的效果好。因为客观事物,尤其是经济现象,在一个较长时间内发生外界因素变化的可能性加大,它们对市场经济现象必定要产生重大影响。如果出现这种情况,进行预测时,只考虑时间因素不考虑外界因素对预测对象的影响,其预测结果就会与实际状况严重不符。

    十三、生存分析

    用来研究生存时间的分布规律以及生存时间和相关因索之间关系的一种统计分析方法

    1.包含内容

    1)描述生存过程,即研究生存时间的分布规律

    2)比较生存过程,即研究两组或多组生存时间的分布规律,并进行比较

    3)分析危险因素,即研究危险因素对生存过程的影响

    4)建立数学模型,即将生存时间与相关危险因素的依存关系用一个数学式子表示出来。

    2.方法

    1)统计描述:包括求生存时间的分位数、中数生存期、平均数、生存函数的估计、判断生存时间的图示法,不对所分析的数据作出任何统计推断结论

    2)非参数检验:检验分组变量各水平所对应的生存曲线是否一致,对生存时间的分布没有要求,并且检验危险因素对生存时间的影响。

    A 乘积极限法(PL法)

    B 寿命表法(LT法)

    3)半参数横型回归分析:在特定的假设之下,建立生存时间随多个危险因素变化的回归方程,这种方法的代表是Cox比例风险回归分析法

    4)参数模型回归分析:已知生存时间服从特定的参数横型时,拟合相应的参数模型,更准确地分析确定变量之间的变化规律

    十四、典型相关分析

    相关分析一般分析两个变量之间的关系,而典型相关分析是分析两组变量(如3个学术能力指标与5个在校成绩表现指标)之间相关性的一种统计分析方法。

    典型相关分析的基本思想和主成分分析的基本思想相似,它将一组变量与另一组变量之间单变量的多重线性相关性研究转化为对少数几对综合变量之间的简单线性相关性的研究,并且这少数几对变量所包含的线性相关性的信息几乎覆盖了原变量组所包含的全部相应信息。

    十五、ROC分析

    R0C曲线是根据一系列不同的二分类方式(分界值或决定阈).以真阳性率(灵敏度)为纵坐标,假阳性率(1-特异度)为横坐标绘制的曲线。

    1.用途

    1、R0C曲线能很容易地査出任意界限值时的对疾病的识别能力

    2、选择最佳的诊断界限值。R0C曲线越靠近左上角,试验的准确性就越高;

    3、两种或两种以上不同诊断试验对疾病识别能力的比较,一股用R0C曲线下面积反映诊断系统的准确性。

    十六、其他分析方法

    多重响应分析、距离分析、项目分析、对应分析、决策树分析、神经网络、系统方程、蒙特卡洛模拟等。

    决策树分析与随机森林:尽管有剪枝等等方法,一棵树的生成肯定还是不如多棵树,因此就有了随机森林,解决决策树泛化能力弱的缺点。(可以理解成三个臭皮匠顶过诸葛亮)

    决策树(Decision

    Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 系统的凌乱程度,使用算法ID3, C4.5和C5.0生成树算法使用熵。这一度量是基于信息学理论中熵的概念。

    分类树(决策树)是一种十分常用的分类方法。他是一种监管学习,所谓监管学习就是给定一堆样本,每个样本都有一组属性和一个类别,这些类别是事先确定的,那么通过学习得到一个分类器,这个分类器能够对新出现的对象给出正确的分类。这样的机器学习就被称之为监督学习。

    优点:决策树易于理解和实现,人们在在学习过程中不需要使用者了解很多的背景知识,这同时是它的能够直接体现数据的特点,只要通过解释后都有能力去理解决策树所表达的意义。

    对于决策树,数据的准备往往是简单或者是不必要的,而且能够同时处理数据型和常规型属性,在相对短的时间内能够对大型数据源做出可行且效果良好的结果。

    易于通过静态测试来对模型进行评测,可以测定模型可信度;如果给定一个观察的模型,那么根据所产生的决策树很容易推出相应的逻辑表达式。

    缺点:对连续性的字段比较难预测;对有时间顺序的数据,需要很多预处理的工作;当类别太多时,错误可能就会增加的比较快;一般的算法分类的时候,只是根据一个字段来分列。

    展开全文
  • Linux常用的英文总结

    千次阅读 2017-08-13 12:59:37
    态,方式,模  82。选择[si?lek ?? n] n。选择  83。函数[?f ?? k ?? n] n。函数,功能,操作  84。字[w?:d] n。字(词),单词  85。制作[meik] vt。制造,形成,接通  86。对[rait] a。右边的,正确...
  • iOS 增量代码覆盖率检测实践

    千次阅读 2018-12-27 19:58:00
    总第321篇2018年 第113篇本文介绍了对iOS覆盖率检测算法的研究,分享一种可以嵌入到现有开发流程中,并对开发透明的增量代码测试覆盖率工具的实现。到店餐饮技术部交易...
  • 金融市场体系

    千次阅读 2019-08-09 09:28:42
    1.1 金融市场的概念与功能 1.1.1 金融市场的概念 与产品市场不同,金融市场是要素市场的一种 金融市场是创造和交易金融资产的市场,是以金融资产为交易对象而形成的供求关系和交易机制的总和; 金融市场有固定场所...
  • 国际市场营销

    千次阅读 2019-09-16 15:13:07
    1. 市场概念的演变:(1)市场是商品交换的场所(2)市场是商品交换和流通的领域 1 2. 正确理解市场范畴的概念 1 第二节世界市场现状和发展趋势 2 第三节企业国际化经营: 2 第四节国际市场营销学的内容 2 第一...
  • 第1章 LTE室内覆盖概述 1.1 室内覆盖的必要性 > 70%的业务(语音+数据)发送在室内. > 70%的投诉发送在室内. 90%的数据业务发生在室内。 更多的基站形态(Small Cell、Femeto等)在室内 更多的终端...
  • Java 程序员常用的开发工具

    万次阅读 多人点赞 2018-03-30 11:45:16
    1、常用开发工具作为一名Java程序开发人员,可以的选择集成开发环境IDE(Integrated Development Environment)非常多,得益于Java是一门开源语言。有开源免费的;有商用收费的。如何选择一款适合自己的集成开发环境...
  • App登录方式和测试重点总结

    千次阅读 2018-11-04 22:01:21
    目前市场上APP常用的登录方式有账密登录、手势登录,账密登录里又支持邮箱、账号、手机号登录。对于同时支持多种登录方式的APP,测试时除了考虑每种方式是否能够登录成功以外,特别需要考虑不同登录方式的优先级、...
  • 作为一个测试人员,保证产品的软件质量是其工作首要目标,为了这个目标,测试人员常常会通过很多手段或工具来加以保证,覆盖率就是其中一环比较重要的环节。 我们通常会将测试覆盖率分为两个部分,即“需求覆盖率”...
  • 一、市场调研 目前市面主流的风控模型 1、互联网金融前10名排行榜(数据截止日期2017-09-12) 互联网金融公司排名分别是蚂蚁金服、陆金所、京东金融、苏宁金融、百度金融、腾讯理财通、宜信、钱大掌柜、万达金融和...
  • AppStore审核及排名规则及常用优化方法: 1.2017年6月9日app store最新审核指南; 2.AppStore排名规则; 3.AppStore上传失败原因,总有一款属于你(2016年8月28日更新【详 解】苹果加强审核力度,被拒原因终逃不过...
  • Android_编程规范与常用技巧

    千次阅读 2014-09-30 09:25:35
    25.同一个客户端如果要放在不同的市场,而且要统计各个市场下载及使用数据时 针对不同的客户端打不同的包,唯一的区别是versionName,apk文件名为versionName.apk 在升级时,要将自己的versionCode和...
  • 常用公共数据集

    万次阅读 多人点赞 2018-06-12 16:45:23
    ) 伯克利MHAD:综合多式联运行动数据库(Ferda Ofli) 伯克利多式联运行动数据库 - 扩大应用领域的五种不同方式(加利福尼亚大学伯克利分校和约翰霍普金斯大学) 早餐数据集 - 这是一个数据集,有1712个视频剪辑...
  • 程序员常用英语单词1700

    千次阅读 多人点赞 2019-08-01 08:37:12
     态,方式,模 82. selection n. 选择 83. function n. 函数,功能,操作 84. word n. 字(词),单词 85. make vt. 制造,形成,接通 86. right a. 右边的,正确的 87. value n. 值 88. button n. ...
  • 外企程序员常用英语单词

    千次阅读 2019-01-03 16:28:33
    1, cognitive ['kɒɡnɪtɪv] adj. 认知的,认识的 2, risk [rɪsk] n. 风险;危险;冒险 vt. 冒…的危险 n. (Risk)人名;(英、阿拉伯)里斯克 3, berries ['beriz] 浆果类 ...n....5, leafy ['liːfɪ...
  • 史上最全的常用开发工具类收集(持续更新中)

    万次阅读 多人点赞 2017-05-24 10:17:58
    getAppInstaller : 获取应用的安装市场 getAppSign : 获取应用签名 getAppTargetSdkVersion : 获取应用兼容sdk getAppUid : 获取应用uid getNumCores : 获取Cpu内核数 getRootPermission : 获得root权限 ...
  • http://wiki.mbalib.com/wiki/%E5%B8%82%E5%9C%BA%E7%BB%86%E5%88%86 市场细分(Market Segmentation)的概念是美国市场学家温德尔·史密斯(Wendell R.Smith)于20世纪50年代中期提...目录[隐藏]1 市场细分的含义2 市
  • R语言常用packages(常用R包)

    万次阅读 多人点赞 2017-11-26 11:22:39
    dplyr:本地数据集的常用操作 jsonlite:良好的网络API接口,适用于收集JSON数据 AWR:安装编译的Java模块 filesstrings:提供了多个工具操作字符和文件 ggraph:提供了多个函数,扩展ggplot2的可视化功能...
  • 制作h5最常用软件

    万次阅读 2020-08-03 14:20:04
    今天就为大家带来一些目前在市场上h5最常用软件,你们可以根据自己的喜好来选择。 一、人人秀 人人秀是用于设计H5页面,微信活动,粉丝活动的h5设计工具。通常,它还被用来生成PPT,它在营销方面具有非常出色的表现...
  • 常用保险术语大全

    千次阅读 2019-02-13 11:39:08
    财产保险 财产保险,又名产物保险,是以各种财产及其相关利益为保险标的的...财产保险业务的承保范围覆盖了除人的身体和生命以外的大部分风险。比如航天工业、核电工程、远洋石油开发、企业财产、民事法律责任、商...
  • 计算机专业常用英语词汇1695

    千次阅读 多人点赞 2015-07-01 09:59:48
    态,方式,模   82. selection n. 选择   83. function n. 函数,功能,操作   84. word n. 字(词),单词   85. make vt. 制造,形成,接通   86. right a. 右边的,正确的   87. value n....
  • 作为Web渗透的初学者,Linux基础知识和常用命令是我们的必备技能,本文详细讲解了Linux相关知识点及Web渗透免了高龄。如果想玩好Kali或渗透,你需要学好Linux及相关命令,以及端口扫描、漏洞利用、瑞士军刀等工具。...
  • 常用各类数据集

    万次阅读 多人点赞 2019-06-12 19:54:23
     - 扩大应用领域的五种不同方式(加利福尼亚大学伯克利分校和约翰霍普金斯大学) 早餐数据集  - 这是一个数据集,有1712个视频剪辑,显示10个厨房活动,手动分为48个原子动作类。(H.Kuehne,AB Arslan和T. ...
  • Java 程序员开发常用的工具

    万次阅读 多人点赞 2018-02-03 14:18:29
    1、常用开发工具 2、常用接口测试工具 3、常用远程连接工具 4、一些其他常用工具 5、总结 1、常用开发工具 作为一名Java程序开发人员,可以的选择集成开发环境IDE(Integrated Development Environment)非常...
  • 常用遥感卫星

    万次阅读 多人点赞 2015-07-12 15:20:01
    形成全天候、全天时、全球覆盖的对地观测能力,由天基观测系统、临近空间观测系统、航空观测系统、地面系统、应用系统等组成,于2010年经过国务院批准启动实施。 卫星名称 发射时间 ...
  • 有效覆盖范围10~75m之间,具体依据实际发射功率的大小和各种不同的应用模式而定,基本上能够覆盖普通的家庭或办公室环境。  ◆ 工作频段灵活。使用的频段分别为2.4GHz、868MHz(欧洲)及915MHz(美国),均为...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 20,901
精华内容 8,360
关键字:

常用的市场覆盖方式