精华内容
下载资源
问答
  • 环境影响评价中的科学认识与价值判断关系研究,计军平,,科学认识与价值判断在环境影响评价的不同阶段其相对重要性有所不同:在识别公众对于环境的关注点阶段,社会价值判断占主导地位;
  • 价值选择到重构思维模型

    千次阅读 2018-07-29 02:08:57
    维基百科的是这样定义的:价值观是一种处理事情判断对错、做选择取舍时的标准。 价值观有以下特点: 价值观会指引一个人去从事某些行为,比如认为人的生命是神圣的人就会反对安乐死,崇尚自由选择的人就认为堕胎...

    今天,我想谈谈价值观思维模型,这可能是我们平时很少思考,但是却深刻影响着我们的行为和思想的东西,这些概念比较抽象,讲得不好请还望批评指正。

     

    1、什么是价值观?

    维基百科的是这样定义的:价值观是一种处理事情判断对错、做选择取舍时的标准。

    价值观有以下特点:

    • 价值观会指引一个人去从事某些行为,比如认为人的生命是神圣的人就会反对安乐死,崇尚自由选择的人就认为堕胎无罪;

    • 价值观具有客观存在性,不管你承不承认,价值观都存在;

    • 价值观具有主观选择性,每个人认可的价值观有对应排序,比如那句耳熟能详的“生命诚可贵,爱情价更高,若为自由故,两者皆可抛”讲的就是价值观排序;

    • 价值观具有稳定性和持久性,在特定的时间、地点、条件下,人们的价值观总是相对稳定和持久的;

    • 价值观也具有可变性,随着年龄、阅历的增长或经历过重大变故,个人的价值观也可能会发生变化;

    • 价值观具有历史性和选择性,在不同时代、不同社会生活环境中形成的价值观是不同的,比如当代青年和民国时代的青年所信仰的价值观整体上就相去甚远。

    《学会提问》这本书中列举了一些常见的价值观,让我们从中选择出一些自己认可的价值观,然后按照重要程度进行排序(在内心问自己:在A和B面临冲突时,你会选哪个?你选的那个在你看来就更重要)。

    如果国家征兵让我去殖民非洲(当然这是不可能的,非洲的兄弟不要慌:),在面临爱国还是坚持正义的抉择时,如果你选择的是正义,那就不会响应号召入伍,甚至会对这种行为强烈谴责;如果你选择的是爱国,那很有可能弃笔从戎、远走他乡。别觉得我在开玩笑,想想二战时候的日本人入侵我华,难道不正是爱国主义压过正义之心的案例吗?

    基于你选择的价值观,你的行为、观点都会受此影响,当你和某人认可的价值观相同时,你会认可他的行为、观点(想想你为什么在朋友圈转发文章);相反,当你和某人认可的价值观不同时,稍微理性可能会说,我对你的行为、观点持保留态度,性格暴躁可能会直接开撕了。

     

    2、什么是思维模型?

    这个目前还没有一个明确的定义,我理解为:思维模型就是你看待世界的方式。

    比如著名投资大师、巴菲特的好基友查理·芒格使用的就是多元思维模型,他提倡要不断学习众多学科的知识来形成一个思维模型的复式框架。

    硅谷钢铁侠马斯克是第一性原理的代表人物,而第一性原理就是找到问题最开始的起点,即“元起点”或者“元问题”,只有弄清楚了问题的根源才会做出颠覆式的创新。想想马斯克创建的一系列公司:新能源汽车公司Tesla、太空探索公司SpaceX、新能源发电公司SolarCity、地下隧道传输公司Boring、脑机融合公司Neuralink、在线支付公司PayPal,这些公司都是致力于解决人类最根本的生存问题,相较而言为马斯克带来第一桶金的PayPal反而更靠谱一些,马老师将这个思维模型运用地如此炉火纯青,作为吃瓜群众,我只想双击666。

    混沌大学的李善友,逻辑思维的罗振宇,兜售的就是思维模型(感兴趣可以去看看李教授的公开课和罗胖对上面两个思维模型的介绍)。

    「长久以来,我坚信存在某个系统——几乎所有聪明人都能掌握的系统,它比绝大多数人用的系统管用。你需要的是在你的头脑里形成一种思维模型的复式框架。有了那个系统之后,你就能逐渐提高对事物的认识。」——查理·芒格

     

    3、价值观和思维模型有什么关系?

    你在运用思维模型看待世界的过程中,不可避免的会将价值观注入其中,思维模型的输出也就是你得出的观点或结论。

    《学会提问》中关于价值观冲突举了这样一个例子:

    “我们不应该允许消遣用的药品合法化,非法的药品引起了太多的街道暴力和其他犯罪行为。”

    这段话的结论是不应该允许消遣用的药品合法化;论据是非法的药品引起了太多的街道暴力和其他犯罪行为。乍一看,该论据是可以支持结论的,但实际上除了这个显性的论据,作者还将自己的价值观假设注入了其中,也就是认为“公众安全比选择自由更重要”

    如果你认可作者的价值观假设,你就会认可他的结论;反之,你需要的对作者的结论保持警惕和怀疑,这是因为提出这个论证的人希望能引导你自己作出这个论证(优秀的作者、演说家、辩手都具备这种说服别人的能力,他们就像是魔术师,使用的各种技巧来诱导我们)。

     

    4、如何改善我们的思维模型?

    最后,来谈谈如何改善我们的思维模型,我认为好的思维模型产生的结论或观点应该是普适性的、严谨的、令人信服的,每个人在成长过程中都会形成不同的思维模型,显性反映在大脑神经元连接的复杂程度上,学过高中生物的都知道:养成习惯就是大脑神经元之间建立突触的过程,我们的大脑结构和爱因斯坦的大脑结构大相径庭,而这也是人与人之间产生差异的根源。

    运用批判性思维模型可以对其他思维模型进行改善,因此可以称批判性思维是一种”元思维模型“。维基百科上对批判性思维的定义非常抽象,大家可以理解为:不轻信、不传谣、抛弃偏见、理性思考

    查理·芒格曾说过:一个人如果掌握100个思维模型,你就可以比别人更聪明。大师们的劝戒犹在耳畔,吾辈唯有奋勇向前。

    「我们认为批判性思考是一种有目的而自律的判断,并对判断的基础就证据、概念、方法学、标准厘定、背景因素层面加以诠释、分析、评估、推理与解释……有理想批判性思考能力的人凡事习惯追根究底,认知务求全面周到,判断必出于理据,心胸保持开放,态度保有弹性,评价必求公正,能坦然面对主观偏见,判断必求谨慎,且必要时愿意重新思量,对争议点清楚了解,处理复杂事物有条不紊,收集相关资料勤奋不懈,选取标准务求合理,专注于探索问题,而且在该问题该环境许可的情况下坚持寻求最精确的结果。」——维基百科

    展开全文
  • 这一节是使用聚类算法来对公司客户价值进行判断和分析。 提到聚类算法,大家应该都会想到是K-means。这是比较简单和经典的一种聚类算法。 k-means聚类算法的原理比较简单,实现也容易,可以直接调用python的sklearn...

    这一节是使用聚类算法来对公司客户价值进行判断和分析。

    提到聚类算法,大家应该都会想到是K-means。这是比较简单和经典的一种聚类算法。

    k-means聚类算法的原理比较简单,实现也容易,可以直接调用python的sklearn包中封装好的函数实现。

    这部分主要记录如何将聚类算法与显示案例应用联系起来判断和分析。


    对于这个项目的实现,在已知客户相关数据的情况下,需要发掘出忠实客户数据。实现的方法为:

    1. 整理好相关数据,把非必要特征去除

    2. 选择实现的算法

    3. 构建模型

    4. 绘图分析

    关键在于第三步和第四步。

    K-means聚类算法与分类算法都研究事物之间的划分,但是最大的区别在于,聚类是指在不确定类别的情况下对客户群体进行划分,而分类是已经有具体的类别标签。

    K-mean算法的步骤具体为:

    1. 将数据分为k个非空子集
    2. 计算每个类中心点(k-means<centroid>中心点是所有点的average),记为seed point
    3. 将每个object聚类到最近seed point
    4. 返回2,当聚类结果不再变化的时候stop

    概括起来就是,首先随机初始化聚类中心,然后计算事物到各个聚类中心的距离,选择距离最小的进行聚类;再计算新的聚类中心重新调整,重复以上步骤,直到聚类中心不再发生变化。

    下面通过与项目结合起来看。

    现在公司有以下的数据:


    包括客户的年龄,平均每次消费金额和平均消费周期,消费周期为0的表示只来过一次。

    现在想要寻找公司客户的潜在价值,比如设定为VIP客户/普通客户等,分析客户的分类以及特点,以便于对VIP等有更大价值的客户进行更加细节的推广,思考公司的战略决策等。

    下面通过聚类分析客户价值:

    # 通过聚类分析客户价值
    import pandas as pda
    import numpy as npy
    import matplotlib.pylab as pyl
    from sklearn.cluster import KMeans
    
    fname = "XX/company.csv"
    dataf = pda.read_csv(fname, encoding="GBK")
    x = dataf.as_matrix()
    kms = KMeans(n_clusters=3)
    y = kms.fit_predict(x)
    print(y)

    这里得到聚类的结果,n_clusters的值表示k的值,也就是想要最后分成几类。

    下面通过作图来分析客户价值:

    # 年龄-消费金额图,消费时间-消费金额图,年龄-消费时间图
    for i in range(0, len(y)):
        if(y[i] == 0):
            print(str(i)+"大众客户")
            pyl.subplot(2, 3, 1)
            # 年龄-消费金额图
            pyl.plot(dataf.iloc[i:i+1, 0:1].as_matrix(), dataf.iloc[i:i+1, 1:2].as_matrix(), "*r")
            pyl.subplot(2, 3, 2)
            # 消费时间-消费金额图
            pyl.plot(dataf.iloc[i:i+1, 2:3].as_matrix(), dataf.iloc[i:i+1, 1:2].as_matrix(), "*r")
            pyl.subplot(2, 3, 3)
            # 年龄-消费时间图
            pyl.plot(dataf.iloc[i:i+1, 0:1].as_matrix(), dataf.iloc[i:i+1, 2:3].as_matrix(), "*r")
        elif(y[i] == 1):
            print(str(i)+"超级VIP客户")
            pyl.subplot(2, 3, 1)
            # 年龄-消费金额图
            pyl.plot(dataf.iloc[i:i+1, 0:1].as_matrix(), dataf.iloc[i:i+1, 1:2].as_matrix(), "sy")
            pyl.subplot(2, 3, 2)
            # 消费时间-消费金额图
            pyl.plot(dataf.iloc[i:i+1, 2:3].as_matrix(), dataf.iloc[i:i+1, 1:2].as_matrix(), "sy")
            pyl.subplot(2, 3, 3)
            # 年龄-消费时间图
            pyl.plot(dataf.iloc[i:i+1, 0:1].as_matrix(), dataf.iloc[i:i+1, 2:3].as_matrix(), "sy")
        elif(y[i]==2):
            print(str(i)+"VIP客户")
            pyl.subplot(2, 3, 1)
            # 年龄-消费金额图
            pyl.plot(dataf.iloc[i:i+1, 0:1].as_matrix(), dataf.iloc[i:i+1, 1:2].as_matrix(), "pb")
            pyl.subplot(2, 3, 2)
            # 消费时间-消费金额图
            pyl.plot(dataf.iloc[i:i+1, 2:3].as_matrix(), dataf.iloc[i:i+1, 1:2].as_matrix(), "pb")
            pyl.subplot(2, 3, 3)
            # 年龄-消费时间图
            pyl.plot(dataf.iloc[i:i+1, 0:1].as_matrix(), dataf.iloc[i:i+1, 2:3].as_matrix(), "pb")
    pyl.show()
    





    这里图片得出有点问题,就没有贴上来,大家可以自己试一试,可以分析得出 年龄与消费时间的关系并不明显。并且可以分析后定义第一类为普通用户,第二类为超级VIP用户,第三类为VIP用户。

    展开全文
  • 转载请注明出处: 转载自 Thinkgamer的CSDN博客: blog.csdn...2:需求分析:挖掘CSDN博客的价值用户 3:算法模型:PeopleRank算法 4:架构设计:从数据准备到PR算法的MR化 5:程序开发:hadoop实现PeopleRank算法

    转载请注明出处: 转载自  Thinkgamer的CSDN博客: blog.csdn.net/gamer_gyt

    代码下载地址:点击查看


    pagerank算法的python实现请参考:http://blog.csdn.net/gamer_gyt/article/details/47443877

    pagerank算法的mapreduce实现请参考:http://blog.csdn.net/gamer_gyt/article/details/47451021


    1:PageRank 与 PeopleRank

    2:需求分析:挖掘CSDN博客的价值用户

    3:算法模型:PeopleRank算法

    4:架构设计:从数据准备到PR算法的MR化

    5:程序开发:hadoop实现PeopleRank算法


    一:PageRank与PeopleRank

            PageRank算法是Google从垃圾堆里捡黄金的重量级算法,它让谷歌的搜索引擎一度成为No.1,当然谷歌所公开的PR算法毕竟是过去式了,既然它能公开,那么肯定不是它最新的算法演化版本,但是不管怎样,我们依旧从中学习到很多创新和独特的思想。

            PR算法主要用于网页评分计算,它利用互联网的网页之间的连接关系,给网页进行打分,最终PR值越高的网页价值也就越高。

            自2012以来,中国开始进入社交网络的时代,开心网,人人网,新浪微博,腾讯微博,微信等社交网络应用,开始进入大家的生活。最早是由“抢车位”,“偷菜”等社交游戏带动的社交网络的兴起,如今人们会更多的利用社交网络,获取信息和分享信息。我们的互联网,正在从以网页信息为核心的网络,向着以人为核心的网络转变着。

            于是有人就提出了,把PageRank模型应用于社交网络,定义以人为核心的个体价值。这样PageRank模型就有了新的应用领域,同时也有了一个新的名字PeopleRank。


    二 . 需求分析:挖掘CSDN博客的价值用户


          

            如上图所示,CSDN博客的每个用户都有关注人数和粉丝人数,这在一定程度上和网页之间的连接关系是十分相似的,我个人比较菜,粉丝数太少,当然我希望看过我博客的人,如果你感觉不错的话是否可以关注以下呢,闲话少说,这种相互关注的关系在一定程度上体现了用户的价值,粉丝数目越多的人,在一定程度上,其本身所具有的重要性。

            顺便给大家看一个CSDN排名47的牛人

           

            这刚好符合PR算法,我们是否可以考虑使用PeopleRank算法,利用用户之间的关注关系,来计算不同用户的PR值,从而提取出“价值”更高的用户呢?答案是肯定的。


    三 . 算法模型:PeopleRank算法


           那么什么是PageRank算法?当然本篇博客并不是来谈PR算法的,而是将如何利用hadoop实现pr算法从而挖掘有价值的用户,所以以下只是简单的对pr算法的描述,更多还请自己搜索查看(以下部分摘自:http://blog.jobbole.com/71431/)

           互联网中的网页可以看出是一个有向图,其中网页是结点,如果网页A有链接到网页B,则存在一条有向边A->B,下面是一个简单的示例:

          

             这个例子中只有四个网页,如果当前在A网页,那么悠闲的上网者将会各以1/3的概率跳转到B、C、D,这里的3表示A有3条出链,如果一个网页有k条出链,那么跳转任意一个出链上的概率是1/k,同理D到B、C的概率各为1/2,而B到C的概率为0。一般用转移矩阵表示上网者的跳转概率,如果用n表示网页的数目,则转移矩阵M是一个n*n的方阵;如果网页j有k个出链,那么对每一个出链指向的网页i,有M[i][j]=1/k,而其他网页的M[i][j]=0;上面示例图对应的转移矩阵如下:

                       

              初试时,假设上网者在每一个网页的概率都是相等的,即1/n,于是初试的概率分布就是一个所有值都为1/n的n维列向量V0,用V0去右乘转移矩阵M,就得到了第一步之后上网者的概率分布向量MV0,(nXn)*(nX1)依然得到一个nX1的矩阵。下面是V1的计算过程:

                      

                 注意矩阵M中M[i][j]不为0表示用一个链接从j指向i,M的第一行乘以V0,表示累加所有网页到网页A的概率即得到9/24。得到了V1后,再用V1去右乘M得到V2,一直下去,最终V会收敛,即Vn=MV(n-1),上面的图示例,不断的迭代,最终V=[3/9,2/9,2/9,2/9]’:

                    


    四 .架构设计:从数据准备到PR算法的MR化

    这里我采用的是用户和用户之间的关注关系,例如 用户A 关注 用户B

    1:数据采集

    使用Python爬虫采集CSDN博客的用户和用户的关注关系,这里我使用的采集程序架构图如下:

            

           因为我这个PR计算是我做的另外一个项目(博客统计分析系统:github地址 在线演示地址:点击查看 该地址会在一定的时间内有效)的其中的一部分,所以数据也是从其中摘取的,原本的采集程序是为了采集所有CSDN博客用户udell信息和博客内容的,当然由于各种关系,最终采集的用户数量为七万左右,最终采集到的数据格式如下:

    用户信息数据:



    博客信息数据:



    2:数据整理

    我从中随机抽取了100个用户,同时利用一定的技术手段,给这个100个用户之间赋予一定的关注关系,整理后的数据如下,主要包括两部分,第一部分是用户之间的关注关系(用户id,关注的用户id),第二是给每个用户赋予一定的初始值(用户id,初始用户pr值全部为1)

                               (1)                                           (2)   


    3:PR算法的MR化设计

         我么以下面这个图来说一下

                            

              ID=1的页面链向2,3,4页面,所以一个用户从ID=1的页面跳转到2,3,4的概率各为1/3
            ID=2的页面链向3,4页面,所以一个用户从ID=2的页面跳转到3,4的概率各为1/2
            ID=3的页面链向4页面,所以一个用户从ID=3的页面跳转到4的概率各为1
            ID=4的页面链向2页面,所以一个用户从ID=4的页面跳转到2的概率各为1

           (1):构造邻接矩阵

               

           (2):构造邻接矩阵

               

             (3):转换为概率矩阵(转移矩阵)

                

              (4):阻尼系数概率矩阵

               

             (5):进行迭代计算

             

               至于迭代的次数有自己设定,并不是越多越好,根据六度分割理论来讲,一般迭代6次


    . 程序开发:hadoop实现PeopleRank算法

    程序架构如下:

    个人代码目录:


    下面我们具体说一说每一个文件是干什么的

    day7_author100_mess.csv:源文件,由dataEtl.java处理成我们所需要的数据格式

    people.csv,peoplerank.txt :day7_author100_mess.csv处理后得到的文件

    prjob.java:程序调度的主函数

    prMatrix.java:数据转换为矩阵形式

    prJisuan.java: 计算每个用户的PR值

    prNormal.java:PR值的标准化

    prSort.java:对转化后的PR值进行排序


    最终的输出文件目录


    下面只对部分代码进行展示,更多请前往github下载:点击查看

    dataEtl.java

    package pagerankjisuan;
    
    import java.io.BufferedReader;
    import java.io.File;
    import java.io.FileNotFoundException;
    import java.io.FileReader;
    import java.io.FileWriter;
    import java.io.IOException;
    
    public class dataEtl {
    
    	public static void main() throws IOException {
    
    		File f1 = new File("MyItems/pagerankjisuan/people.csv");
    		if(f1.isFile()){
    			f1.delete();
    		}
    		File f = new File("MyItems/pagerankjisuan/peoplerank.txt");
    		if(f.isFile()){
    			f.delete();
    		}
    		//打开文件
    		File file = new File("MyItems/pagerankjisuan/day7_author100_mess.csv");
    		//定义一个文件指针
    		BufferedReader reader = new BufferedReader(new FileReader(file));
    		try {
    			String line=null;
    			//判断读取的一行是否为空
    			while( (line=reader.readLine()) != null)
    			{
    					String[] userMess = line.split( "," );
    					//第一字段为id,第是个字段为粉丝列表
    					String userid = userMess[0];
    					if(userMess.length!=0){
    							if(userMess.length==11)
    							{
    									int i=0;
    									String[] focusName = userMess[10].split("\\|"); //  | 为转义符
    									for (i=1;i < focusName.length; i++) 
    										{
    											write(userid,focusName[i]);
    //											System.out.println(userid+ "           " + focusName[i]);
    										}
    							}
    							else
    							{
    									int j =0;
    									String[] focusName = userMess[9].split("\\|"); //  | 为转义符
    									for (j=1;j < focusName.length; j++) 
    									{
    										write(userid,focusName[j]);
    //										System.out.println(userid+ "           " + focusName[j]);
    									}
    							}		
    					}
    				}
    			} 
    			catch (FileNotFoundException e) {
    				// TODO Auto-generated catch block
    				e.printStackTrace();
    			}
    			finally
    			{
    					reader.close();
    				
    					//etl peoplerank.txt
    					for(int i=1;i<=100;i++){
    						FileWriter writer = new FileWriter("MyItems/pagerankjisuan/peoplerank.txt",true);
    						writer.write(i + "\t" + 1 + "\n");
    						writer.close();
    					}
    			}
    			System.out.println("OK..................");
    	}
    
    	private static void write(String userid, String nameid) {
    		// TODO Auto-generated method stub
    		//定义写文件,按行写入
    		try {
    			if(!nameid.contains("\n")){
    				FileWriter writer = new FileWriter("MyItems/pagerankjisuan/people.csv",true);
    				writer.write(userid + "," + nameid + "\n");
    				writer.close();
    			}
    		} catch (IOException e) {
    			// TODO Auto-generated catch block
    			e.printStackTrace();
    		}
    	}
    
    }
    

    prjob.java

    package pagerankjisuan;
    
    import java.text.DecimalFormat;
    import java.util.HashMap;
    import java.util.Map;
    
    /*
     * 调度函数
     */
    public class prjob {
    
    	public static final String  HDFS = "hdfs://127.0.0.1:9000";
    	
    	public static void main(String[] args) {
    		Map  <String, String> path= new HashMap<String, String>();	
    		
    		path.put("page" ,"/home/thinkgamer/MyCode/hadoop/MyItems/pagerankjisuan/people.csv");
    		path.put("pr" ,"/home/thinkgamer/MyCode/hadoop/MyItems/pagerankjisuan/peoplerank.txt");
    		
    		path.put("input", HDFS + "/mr/blog_analysic_system/people");          // HDFS的目录
            path.put("input_pr", HDFS + "/mr/blog_analysic_system/pr");       // pr存储目录
            path.put("tmp1", HDFS + "/mr/blog_analysic_system/tmp1");             // 临时目录,存放邻接矩阵
            path.put("tmp2", HDFS + "/mr/blog_analysic_system/tmp2");           // 临时目录,计算到得PR,覆盖input_pr
    
            path.put("result", HDFS + "/mr/blog_analysic_system/result");                   // 计算结果的PR
            
            path.put("sort", HDFS +  "/mr/blog_analysic_system/sort");  //最终排序输出的结果
            
            try {
            	   dataEtl.main();
                prMatrix.main(path);
                int iter = 3;           // 迭代次数
                for (int i = 0; i < iter; i++) {
                    prJisuan.main(path);
                }
               prNormal.main(path);
               prSort.main(path);
    
            	} catch (Exception e) {
            		e.printStackTrace();
            	}
            	System.exit(0);
        	}
    	
    	 	public static String scaleFloat(float f) {// 保留6位小数
    	        DecimalFormat df = new DecimalFormat("##0.000000");
    	        return df.format(f);
    	    }
    }

    prSort.java


    package pagerankjisuan;
    
    import java.io.IOException;
    import java.net.URISyntaxException;
    import java.util.Map;
    
    import org.apache.hadoop.fs.Path;
    import org.apache.hadoop.io.FloatWritable;
    import org.apache.hadoop.io.IntWritable;
    import org.apache.hadoop.io.IntWritable.Comparator;
    import org.apache.hadoop.io.Text;
    import org.apache.hadoop.io.WritableComparable;
    import org.apache.hadoop.mapreduce.Job;
    import org.apache.hadoop.mapreduce.Mapper;
    import org.apache.hadoop.mapreduce.Reducer;
    import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
    import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
      
    public class prSort {  
    	/**
         * @param args
         * @throws IOException 
         * @throws IllegalArgumentException 
         * @throws InterruptedException 
         * @throws ClassNotFoundException 
         */
        public static class myComparator extends Comparator {
            @SuppressWarnings("rawtypes")
            public int compare( WritableComparable a,WritableComparable b){
                return -super.compare(a, b);
            }
            public int compare(byte[] b1, int s1, int l1, byte[] b2, int s2, int l2) {
                return -super.compare(b1, s1, l1, b2, s2, l2);
            }
        }
        
        public static class sortMap extends Mapper<Object,Text,FloatWritable,IntWritable>{
            public void map(Object key,Text value,Context context) throws NumberFormatException, IOException, InterruptedException{
                String[] split = value.toString().split("\t");
                context.write(new FloatWritable(Float.parseFloat(split[1])),new IntWritable(Integer.parseInt(split[0])) );
            }
        }
        public static class Reduce extends Reducer<FloatWritable,IntWritable,IntWritable,FloatWritable>{
            public void reduce(FloatWritable key,Iterable<IntWritable>values,Context context) throws IOException, InterruptedException{
                for (IntWritable text : values) {
                    context.write( text,key);
                }
            }
        }
      
    	public static void main(Map<String, String> path) throws IOException, URISyntaxException, ClassNotFoundException, InterruptedException {
            // TODO Auto-generated method stub  
      
    		String input = path.get("result");
    		String output = path.get("sort");
    		hdfsGYT hdfs = new hdfsGYT();
    		hdfs.rmr(output);
    		
            Job job = new Job();  
            job.setJarByClass(prSort.class);  
            // 1  
            FileInputFormat.setInputPaths(job, new Path(input) );  
            // 2  
            job.setMapperClass(sortMap.class);  
            job.setMapOutputKeyClass(FloatWritable.class);  
            job.setMapOutputValueClass(IntWritable.class);  
            // 3  
            // 4  自定义排序
            job.setSortComparatorClass( myComparator.class); 
            // 5  
            job.setNumReduceTasks(1);  
            // 6  
            job.setReducerClass(Reduce.class);  
            job.setOutputKeyClass(IntWritable.class);  
            job.setOutputValueClass(FloatWritable.class);  
            // 7  
            FileOutputFormat.setOutputPath(job, new Path(output));  
            // 8  
            System.exit(job.waitForCompletion(true)? 0 :1 );  
        }  
    }
    
    

    最终排序输出的结果为:


    展开全文
  • 聊聊价值价值观和价值的积累     介绍 最近公司HR约我对新员工做一次关于价值观的培训,所以我想梳理和阐述我自己对价值观的理解,为这次培训做准备,这个是写本文的初衷。 理解价值 当我们要理解某个人...

    杨波先生这篇文章的确与我高度一致,因此必需转

     

    原创: 杨波 波波微课 今天

    聊聊价值、价值观和价值的积累

     

     

    介绍

    最近公司HR约我对新员工做一次关于价值观的培训,所以我想梳理和阐述我自己对价值观的理解,为这次培训做准备,这个是写本文的初衷。

    理解价值

    当我们要理解某个人的价值观,首先要看这个人是怎么理解价值的?什么是价值?每个人对价值的理解各不相同,原来我对这个概念也很模糊,去年看到《原则》的作者雷.达里奥说的几段话[附录1],深受启发,下面是这几段话的摘录:

    我认为,在遵循宇宙规律,在有利于进化的基础上追寻个人目标,就会获得奖赏。看看所有现存的物种吧:它们不断维护自身利益,同其它生物共生进化,却不知道它们的这种自利行为也推动了进化。

    自身利益和社会利益是相互共生的。追逐自身利益,会激励人们接受挑战,获得益处,推动社会有效发展。反过来,社会也会回馈那些推动其有效发展的个体。所以评判对社会有多少贡献的粗略标准是挣了多少钱,而不是多想挣钱。

    看看是什么促使人们挣钱,你就会发现,这同他们对社会的有效生产值成正相关,同他们想赚钱的欲望程度无关。不少盆满钵盈的人都没有把挣钱当做首要目标,他们只是认真工作,生产社会需要的东西,就逐渐变得富有了。也有不少人天天想赚一大笔钱,但从没有按社会的需求生产,就没有怎么挣钱。

    我认为上面的话隐含了雷.达里奥对价值的理解,我认同这种理解,比较客观,下面是我的一点解读:

    什么是价值,大部分人对钱非常感兴趣,所以用钱解释价值最简单直接,钱可以认为是衡量价值的粗略标准,挣钱越多,价值越大。什么样的人挣钱了?不是那些很想挣钱的人(但没有生产行动的人),而是那些认真工作,生产社会所需要的东西,推动社会进化的人。小到摆一个水果摊的商人,大到建立阿里巴巴商业帝国的马云,他们都或小或多的生产了社会所需要的东西,产生了价值,推动了它的进化。很多成功人士常说要为国家为社会做贡献,或者改变世界之类,我认为最终是推动社会进化。

    进化是宇宙中唯一永恒的力量,一旦开启,永远向前不停止。就像人类和生物的生长进化,可能会延缓,但从来没有倒过来生长的。社会其实也是一个生命体,能够自动奖赏推动它进化的个体,尽管个体的目标可能只是逐利(或自我成就),没想着要去推动社会进化,但是社会确通过一种无比精妙的反馈激励机制不断向前进化。

    价值产生于个体服务于他人和社会的过程中,为社会进行的有效生产值就是价值,有效的标准是多大程度推动了社会的进化。这里的有效很重要,有时你虽然生产了,但不是社会所需,不叫有效;你以损人利己不道德或者犯罪方式生产,综合价值是负的,也不叫有效。

    一个人拥有怎样的价值观,我认为和他对价值以及如何创造和获取价值的理解关系非常密切,对此理解的不同,可产生出截然不同的价值观。

    做正确的事情,等着被开除

    如上所述,为社会进行的有效生产值就是价值,有效的标准是多大程度推动了社会的进化,价值产生于个体服务他人和社会的过程中。基于对价值的理解,所谓的价值观即是对如何创造和获取价值的认知。比方说革故鼎新,追求卓越,简单靠谱,彼此成就这四点价值观,它表达了我们不能安于现状和舒适区,要不断突破推动进化(革故鼎新),挖掘更多用户需求,追求以更高效方式创造更多价值(追求卓越),要用合理道德方式获取价值,用勤劳汗水付出和执行去获取价值(简单靠谱),要通过与他人合作和服务他人的方式去获取价值(彼此成就),终极目标是推动个人,团队和公司的进化,进而为社会创造价值,推动社会的进化。

    我本人在很多公司工作过,看到过各种各样的价值观宣传语,很多已经淡忘了。根据我自己的经验和实践,我认为在我们创造和获取价值的过程中,最重要的价值观或者说品质是正直Integrity(对应到公司的简单靠谱),下图有点夸张,但形象说明什么是真正的正直。

    去年我看到Google元老级员工陈一鸣说的一句话~做正确的事情,等着被开除[附录2],我认为这句话是对正直诚实价值观的最好阐述。下面是陈一鸣原话的引用:

    谷歌新员工(我们称作"Nooglers")经常会问我是如何让自己做事这么高效的。我半开玩笑的告诉他们这很简单:我选择做正确的事情,为谷歌,为世界,然后回到座位上,等着被开除。如果没有被开除,那我就做了正确的事情--为所有人。如果被开除了,那我选错了老板。总之,两方面,我都是赢。这是我的职业发展策略。

     

     

    一个正直诚实的员工,他的出发点只有一个:始终选择做正确的事情。什么是正确的事情?帮助员工和团队成长,为公司创造价值(间接成就自我和推动社会进化),以高效的方式。但是人的能力有大有小,我们对正确的判断常常是主观的,你认为的正确,可能老板或者公司并不认为正确,或者相反,老板或者公司认为的正确,你并不认为正确。但只要你内心正直诚实,这些都没有关系,你依然应该遵循内心选择做正确的事情,为公司为社会,然后回到座位上继续做正确的事情。如果你做的事情被老板和公司认同了,那么双赢,皆大欢喜。如果你做的事情没有被老板和公司认可,这时候有两种情况,一种是你做得其实并不正确,那么很简单,道歉认错,吸取教训,继续做正确的事情,从错误中学习成长,你赢;另一种是你其实做得是对的,但是老板不认可,这种稍微麻烦一点,能沟通清楚最好,如果多次出现且无法沟通,那么你选错老板,老板是你创造价值的瓶颈,他在阻碍进化,你要慎重考虑找新的老板和公司,找到新公司继续创造价值,还是你赢。总是,只要你正直诚实,始终坚持做正确的事,那么你都是赢。这就是正直诚实。上述只是一个理想简化说法,现实世界问题很多是两难问题,没有明确对错,但是正直诚实原则不变。

    从表面看,我们大部分的员工平时基本都是比较正直诚实的,只有在面临大压力,犯错,损失,不被理解甚至误解,被否定指责的时候,最能看出一个人是否骨子里诚实。比方说你负责的系统出了问题(有可能是严重故障),骨子里是否诚实的两类人,表现会截然相反。骨子里诚实的第一反应是认错,担责,想办法补救,即使无法挽回也会主动承担甚至离职,即使被开除也坦然接受;骨子里不诚实的第一反应是慌张,推诿扯皮,不承担甚至推卸责任。第二种危害比较大,视情节可能会触犯企业价值观红线。

    在之前公司我还经历了一个事情,有个工程师平时表现还算不错,言谈之间也常常表达自己很诚实,但是在离职期间,由于受到各种压力和不确定性的困扰,整个人完全变了样,经常迟到早退,工作开始磨洋工,交接工作也没有心思认真做,让我有一种看走眼的唏嘘。所以,离职期的表现,也可以考察一个人是否骨子里真诚。

    成长式心智

    前面讲到,所谓价值观,一方面是对价值的理解,另一方面是对创造和获取价值方式及行为的认知。在现实世界中,人们的价值观各有差别,每个人所能创造和获取价值的效能也并不相同。除了能力之外,我认为这个和每个人的心智模式(mindset,对世界和自我的认知)关系密切。其中,我认为成长式心智是建立良好价值观的心理基础。

     

    人的心智模式可以简单分为两种,僵固式心智成长式心智。上图展示两种心智的差异。本质上两者在智力能力是确定还是不确定的根本性世界观不同,造成他们在面对挑战、挫折、努力、批评和别人的成功时,所表现出来的行为就完全不同。

    如果你留意观察,其实我们身边僵固式思维的人并不少,一个典型的例子,僵固心智的人常把别人的成功归结为运气或客观条件,而对于自己的失败和不努力,则总能找到借口和心里安慰。成长式心智的人则常把失败归结为内因,向成功人士借鉴学习,不断挑战突破自己。

    最终僵固式心智的人生会一直停留在平滑的直线上,完全没有发挥自己的潜能,为社会和他人创造的价值极其有限;而成长式心智的人则不断攀登人生的高峰,不断为社会创造价值,推动社会进化,社会也会反哺回馈这样的人,并让他们充分感受到自由意志的伟大力量。

    除了心智模式,控制焦点(the locus of control)心理学理论,对每个人创造和获取价值的效能,以及价值观的形成影响也很大。

     

    控制焦点理论把人分为内控型和外控型两类:

    • 内控型(Internal locus of control):认为人的命运主要由自己内心控制,外界因素有影响,但并不是决定因素。

    • 外控型(External locus of control):认为人自己无法控制自己的命运,命运完全由外界因素控制。

    例如,我们在日常工作生活中难免有各种各样的不如意或挫折,小到丢东西,工作不顺,大到经济损失,亲人病故等。内控型的人遭遇这些不如意或挫折时倾向于采取积极、具建设性的方式来应对这些突如其来的事件。而外控型的人则会把这些不如意或挫折归结为上天的安排,自己无法主宰,更多反应内心的恐惧而非关注建设性的改善。

    内控型的人一般意志坚定,内心强大,有格局有远见,有价值使命感,通常不易被外界杂音琐事甚至烂人烂事所干扰。外控型的人则一般缺乏主心骨,格局和价值感弱,容易随波逐流,常为外界的杂音琐事所困。现实中,大部分人的控制焦点处于内控和外控型之间。

    价值的探索和沉淀

    我们的人生有很多重要的事情,其中之一是自我身心的成长和进化,另外一件是价值的探索和创造,推动社会进化。即便我们理解了价值,也具有良好的价值观和心理基础,我们仍然需要不断努力和探索,才能找到我们自己,找到我们最能发挥潜能产出价值的机会点。好比我们每个人就像生来就行走在沙漠中,在找到真正的绿洲之前,都有一个需要在沙漠中不断努力探索的过程。这个过程漫长曲折甚至惊心动魄,需要严格的自律和锲而不舍的持久力。

     

     

    在实际的工作中,我发现不少员工(特别是一些年轻的员工)都很焦虑,都有急于求成的倾向,在工作中遭遇压力或者挫折容易气馁,甚至导致离职频繁换工作(我自己也犯过同样的错误),这样就无法形成有效的价值积累。这些员工没有理解价值探索的艰难性,正如雷.达里奥所言[附录1],想要成长进化,就要突破极限,承受痛苦。他们也没有理解价值沉淀的重要性,基本上,一个员工在一家公司要真正做出点成绩,对公司和自己都产生价值沉淀,需要至少不少于五年的不间断努力。如果是创业型事业,则这个价值探索和沉淀的周期通常要超过十年。如果你的思考周期以日或年为单位,一般很难捕捉到机会点,需要长线思维,思考以五年或十年为单位,才有可能捕捉到大机会。

     

     

     

    和人类社会的很多现象(人类发展,人口增长,道琼斯指数等)一样,价值的探索和沉淀同样遵循复利曲线效应。在相当长一段时间内,你需要耐得住在复利曲线的底部不断的探索和沉淀价值,直到拐点来临。

     

     

    套用一句古话:

    • 但行善事~坚持探索和做有价值的事情,

    • 莫问前程~不要急于求回报,

    • 你若盛开~如果你确实为社会进行了有效生产,推动了进化

    • 蝴蝶自来~回报自然会来。

    参考

    1.  

      我阅人无数,没有一个成功人士天赋异禀 http://www.cyzone.cn/a/20171202/319282.html

       

    2.  

      做正确的事情,等着被开除 http://www.aichengxu.com/other/4077330.htm

    展开全文
  • K-means算法分析航空公司客户价值

    千次阅读 2019-03-22 10:15:18
    信息时代的来临使得企业营销焦点从产品转向了客户,客户关系管理(Customerrelationship management,CRM)成为企业的核心问题。客户关系管理的关键问题是客户分群。通过客户分群,区分无价值客户和高价值客户。企业...
  • 航空公司客户价值分析

    千次阅读 2018-07-20 22:05:19
    准确的客户分类的结果是企业优化营销资源的重要依据,本文利用了航空公司的部分数据,利用Kmeans聚类方法,对航空公司的客户进行了分类,来识别出不同的客户群体,从来发现有用的客户,从而对不同价值的客户类别提供...
  • 用户生命周期价值及产品运营策略

    千次阅读 2019-07-02 14:07:47
    在电商运营中,常常会听到用户生命周期价值。 为什么要了解用户生命周期价值?这要从推广渠道价值说起。 做SaaS的都知道除了CAC(客户获取成本)之外,LTV(用户生命周期价值)也是十分重要的——比如支出2000元营销...
  • 利用RFM模型做电商客户价值分析

    万次阅读 2016-04-11 16:51:59
    客户细分是客户关系管理的一个主要的组成部分,本文尝试以电商企业为研究对象根据其客户特点,提出了一种基于客户价值分析RFM 模型,从而对客户进行分类,并对此结果进行动态的客户分析,以达到对不同的客户采取...
  • 全网极具参考价值的Python面试题,从创业公司到一线大厂的面经汇总整理。作者会持续维护更新!
  • 回顾价值策略 价值策略通俗地讲就是买入便宜股票,卖出昂贵股票,思想非常简单和直观。但是实际操作上这非常困难,因为我们没办法直接观察股票的真实价值。投资者可以从不同的视角采用不同的指标来估计股票内在价值...
  • pmp考试【5】emv期望货币价值计算

    万次阅读 2017-06-06 11:57:29
    EMV ,即 expected monetary value,EMV预期货币价值,是风险定量分析工具,决策树常用的一种计算 预期货币价值分析:(11.4.2.2 定量风险分析和建模技术)  当某些情况在未来可能发生或不发生时,计算平均结果的...
  • VaR方法(Value at Risk,简称VaR)[风险价值模型]

    万次阅读 多人点赞 2013-06-26 14:31:13
    VaR方法(Value at Risk,简称VaR),称为风险价值模型,也称受险价值方法、在险价值方法     风险价值VaR(Value at Risk)技术是目前市场上最流行、最为有效的风险管理技术。   VaR方法提出的背景  传统...
  •    1)为什么要进行客户价值分析?    2)什么是RFM模型?    3)RFM的详细介绍说明    4)RFM模型的应用(进行量化的一个过程)    5)RFM模型应用的举例说明   7、RFM实战的软件操作    1)数据...
  • 终极价值观与工具型价值观--罗克奇

    万次阅读 2008-01-13 16:52:00
    终极价值观与工具型价值观--罗克奇 终极价值观 工具型价值
  • 谁在使用我的网站——用户忠诚和价值分析 前面介绍的都是一些用户的行为指标和用户细分,这里要介绍的是基于每个用户行为的综合性的分析和评定,主要包括用户的忠诚度和用户的价值。“以用户为中心”的理论要求网站...
  • 小数据集也能有大价值!   https://mp.weixin.qq.com/s/xGnDcRtKKt4FyVRAMPSqYA      【导读】数据不够大,就不能玩深度学习?长期存在的一大挑战就是:只有极少数情况下有足够的数据进行深度学习。本文...
  • 推荐系统的价值

    千次阅读 2020-04-20 18:49:53
    作者丨gongyouliu来源丨大数据与人工智能(ID: ai-big-data)推荐系统作为满足人类不确定性需求的一种有效工具,是具有极大价值的,这种价值既体现在提升用户体验上,又体现...
  • 股票价值投资策略

    千次阅读 2019-08-18 21:08:37
    股票价值投资策略 什么样的股票才是好股票:我关注的好股票以下指标: 基本面指标: 1、净资产收益率(ROE :Rate of Return on Common Stockholders’ Equity) 上市公司的净资产与净利润的比值。 一家上市...
  • 组织行为学--选择判断改错

    千次阅读 2007-12-11 23:34:48
    [@more@]一、 单项选择题(10分)1 、被称为研究组织内部人的行为的里程碑是:( B )A、1949在美国芝加哥召开的科学讨论会B、霍桑试验C、1914年利莲。吉尔布雷斯出版的《管理心理学》D、泰罗的《科学管理...
  • 企业价值分析框架

    千次阅读 2019-10-10 18:31:23
    安全边际与估值——价值评估 优秀企业家与股权结构 K 线可以看做是一家公司的影子,K 线总是跟随公司而变化,想要研究 K 线,应该从公司本身来研究。 什么是行业的天花板 行业或者企业的产品或者服务趋于饱和,达到...
  • 大家可以关注我个人公众号,所有分享内容,会在公众号第一时间推送,且阅读...前一段时间,有朋友给我发邮件,咨询关于“价值串”与“事物/事务代码”的关系。由于各种原因,一直没有时间进一步讲述,本篇,我们...
  • 航空公司客户价值分析(正版/超详细/附数据)

    千次阅读 多人点赞 2020-09-10 17:57:23
    客户关系管理是精准化运营的基础,而客户关系管理的核心是客户分类。通过客户分类,对客户群体进行细分,区别出低价值客户、高价值客户,对不同的客户群体开展不同的个性化服务,将有限的资源合理地分配给不同价值的...
  • 判断路径的包含关系 》 8.  《 【 MoreWindows 工作笔记 8 】 PathFindSuffixArrayW 路径是否有给定的后缀 》   4.3 进程通信 1.  《 VC 利用 DLL 共享区间在进程间共享数据及进程间广播消息 》 2.  《 进程...
  • 企业价值观的作用

    千次阅读 2011-01-07 13:20:00
    企业的价值观是企业员工评价事物价值时所持有的观点和准,而企业核心价值观是企业价值体系中的元价值,是整个理念体系的核心.  对于任何一个企业而言,只有当企业内绝大部分员工的个人价值观趋同时,...
  • 数据挖掘之用户价值分析

    千次阅读 2015-08-26 15:47:45
    谁在使用我的网站——用户忠诚和价值分析   前面介绍的都是一些用户的行为指标和用户细分,这里要介绍的是基于每个用户行为的综合性的分析和评定,主要包括用户的忠诚度和用户的价值。“以用户为中心”的...
  • 大数据最核心的价值是什么?

    万次阅读 2018-07-23 14:33:58
     我把大数据的核心价值理解为核心商业价值。   “很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了。”——马云卸任演讲   本文尝试从三大产业的角度将...
  • 环境资源的价值评估方法

    千次阅读 2008-03-26 10:18:00
     1.1环境资源的价值:总经济价值 总经济价值:环境经济学家对环境资源的价值进行了重新界定,并把环境资源的价值称为总经济价值(total economic value, TEV)。 环境资源的总经济价值分为两个部分:①使用价值...
  • ” 的判断细节,并对价值和成本做了更全面深入的分析,从而将企业的注意力从产品和服务上吸引到了 “价值” 上,无论是有形商品的出售,还是无形服务的消费都可以用到这个最基本的概念。 美国著名营销学教授...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 121,841
精华内容 48,736
关键字:

价值判断价值选择关系