精华内容
下载资源
问答
  • Excel建模进行决策树分析

    千次阅读 2019-09-29 12:58:32
    决策树(Decision Tree)在机器学习中也是比较常见的一种算法,最早的决策树算法是ID3,改善后得到了C4.5算法,进一步改进后形成了我们现在使用的C5.0... 本文在Excel中建模进行决策树分析,属于基础的决策树学习,有...

           决策树(Decision Tree)在机器学习中也是比较常见的一种算法,最早的决策树算法是ID3,改善后得到了C4.5算法,进一步改进后形成了我们现在使用的C5.0算法,综合性能大幅提高。

           算法核心:为每一次分裂确定一个分裂属性。ID3采用的是“信息增益”为度量来选择分裂属性的。

           本文在Excel中建模进行决策树分析,属于基础的决策树学习,有兴趣的可以在SPSS Modeler和Python中进行操作。

    树模型(又称决策树或者树结构模型):基本思想和方差分析中的变异分解极为相似。
    目的(基本原则):将总研究样本通过某些牲(自变量取值)分成数个相对同质的子样本。每一子样本因变量的取值高度一致,相应的变异/杂质尽量落在不同子样本间。所有树模型的算法都遵循这一基本原则。
    不同树模型差异:差异在于对变异/杂质的定义不同。比如P值、方差、熵、Gini指数(基尼指数)、Deviance等作为测量指标。

    决策树图例

     现在我们来分析天气、温度、湿度、风这些属性对打球的影响

    首先确定样本集信息熵,然后计算各个属性的信息增益进行对比分析。

    熵:数据集中的不确定性、突发性或随机性的程度的度量。当一个数据集中的记录全部都属于同一类的时候,则没有不确定性,此时熵为0。

    信息增益:按照某个属性A把数据集S分裂,所得到的信息增益等于数据集S的熵减去各个子集的熵的加权和。

    计算是否打球的概率:

     

    计算天气对打球的影响:

     

     

     

     I(晴天)=-0.25*log(0.25,2)-0.75*log(0.75,2)=0.811278

    E(天气)=0.285714*0.811278+0.357143*0+0.357143*0.70951=0.578562

    Gain(天气)=E(all)-E(天气)=0.940286-0.578562=0.361724

    经计算得出天气的信息增益为0.361724,温度、湿度和风计算步骤类似

     

     

     对各属性的信息增益进行降序排序,选择最大的作为分裂属性

     

    转载于:https://www.cnblogs.com/Estate-47/p/9602043.html

    展开全文
  • treeplan Excel决策

    2018-05-04 14:26:18
    excel treeplan.xla decision tree excel treeplan.xla decision tree excel treeplan.xla decision tree excel treeplan.xla decision tree excel treeplan.xla decision tree
  • 探讨使用 Excel 构建决策模型的价值和重要性,以及对 Excel 复杂性的非常详细和深入的解释 使用 Excel 的图形功能来有效地呈现定量数据(比率和间隔)来通知和影响目标对象 利用 Excel 的内置数据可视化和操作功能...

    特点

    • 探讨使用 Excel 构建决策模型的价值和重要性,以及对 Excel 复杂性的非常详细和深入的解释
    • 使用 Excel 的图形功能来有效地呈现定量数据(比率和间隔)来通知和影响目标对象
    • 利用 Excel 的内置数据可视化和操作功能准备数据以供最终分析
    • 探索数据透视表和数据透视图报告的用途:内置的 Excel 功能允许快速轻松地进行交叉制表分析,有时也称为交叉表分析,用于确定一组数据中的两个或多个变量如何相互作用
    • 从样本中找到的网页偏好进行总体推断
    • 如何使用模型以及构建它们
    • 创建一个过程模型
    • 从单元格函数数组,到排序、过滤和查询,再到数据透视表和数据透视图报告,再到数据分析工具

    内容

    • 电子表格建模简介
    • 定量数据的呈现
    • 定量数据分析
    • 定性数据的呈现
    • 定性数据分析
    • 数据的推论统计分析
    • 建模和仿真:第 1 部分
    • 建模和仿真:第 2 部分
    • 求解器、场景和目标搜索工具

    详情参阅http://viadean.com/excel_model.html

    展开全文
  • 《即学即用:Excel2010营销决策与分析实战应用宝典》以解决实际工作中的常见问题为目标,不仅分专题详解Excel的应用,还设计了经验分享、常见问题、专家点拨和营销应用等单元,帮助读者更快更好地理解内容,抓住精髓...
  • 利用VBA在Excel中建立决策分析系统:本文研究的决策分析系统参考Palisade公司的决策分析软件PrecisionTree的风格进行设计,以决策树方法为理论基础。作者在人们熟悉的Excel环境中,利用VBA语言进行二次开发,结合了...
  • 利用excel设计融资租赁模型 有利于对融资租赁模型的了解和设计
  • 如何利用EXCEL求解线性规划问题及其灵敏度分析
  • max_depth=10,min_samples_leaf=2,min_samples_split=2) # 在训练集上训练决策树模型 clf.fit(x_train, y_train) ## 在训练集和测试集上分布利用训练好的模型进行预测 train_predict = clf.predict(x_train) test_...

    数据集:

    数据集获取,百度网盘:

    复制这段内容后打开百度网盘手机App,操作更方便哦 链接:

    网盘地址

    https://pan.baidu.com/s/1i9PAcOQ9g15qtMyiCvl3lQ

    提取码:6z30

    上代码:

    import matplotlib.pyplot as plt
    import pandas as pd
    from sklearn.tree import DecisionTreeClassifier
    import seaborn as sns
    import numpy as np
    # 前三个函数是为了把.xlsx文件转化为.csv
    def get_excel_sheet_list(filename):
        df = pd.read_excel(filename, sheet_name=None,engine='openpyxl')
        return df.keys()
    
    def get_excel_sheet_data(filename, sheetname=None):
        df = pd.read_excel(filename, sheet_name=sheetname,engine='openpyxl')
        dataList = df.to_dict(orient='records')  # 转换为列表
        return dataList
    
    def file_trans(Read_filepath):
        sheet_list = get_excel_sheet_list(Read_filepath)
        file_list=[]
        for file in sheet_list:
            Save_filepath = file + '.csv'
            file_list.append(Save_filepath)
            sheetData = pd.DataFrame(get_excel_sheet_data(Read_filepath, file))
            if sheetData.empty:
                continue
            sheetData.to_csv(Save_filepath, index=False, mode='w', encoding='utf-8')
        return file_list
    
    # 补足缺省值和返回训练数据,切片
    def getDataSet():
        Read_filepath = "../xiangmu/pythonProject/数据集_25.xlsx"
        list_file = file_trans(Read_filepath)
        df = pd.read_csv(list_file[0])
        # 所用的数据
        df_usage=df.iloc[:,:]
        df_usage.columns=['年龄','阶段','地区','文化程度','家庭教养','孩子性格','家庭情感','孩子应对','自我效能','交流情况','上网目的','创伤成长']
        df_index = df_usage.columns.values
        # df_usage = df_usage.reindex(np.random.permutation(df_usage.index))
        # print(df_index)
        # 数据转化为列表
        df_list=df_usage.values.tolist()
        return df_list,df_index
    
    def splitData(aaaaaaaaaa,bbbbbbbbbb):
        nrow = len(aaaaaaaaaa)
        ncol = len(bbbbbbbbbb)
        nxval=5
        test_data=[]
        train_data=[]
        for ixval in range(nxval):
            # 每一次循环将count置为零
            test_index = [a for a in range(nrow) if a % nxval == ixval]
            train_index = [a for a in range(nrow) if a % nxval != ixval]
            test_data = [aaaaaaaaaa[r] for r in test_index]
            train_data = [aaaaaaaaaa[r] for r in train_index]
        x_train=[]
        y_train=[]
        x_test=[]
        y_test=[]
        for i in test_data:
            x_test.append(i[:-1])
            y_test.append(i[-1])
        for j in train_data:
            x_train.append(j[:-1])
            y_train.append(j[-1])
        return x_train,y_train,x_test,y_test
    
    aa,bb=getDataSet()
    x_train,y_train,x_test,y_test=splitData(aa,bb)
    ## 定义 决策树模型
    clf = DecisionTreeClassifier(criterion='entropy',max_depth=10,min_samples_leaf=2,min_samples_split=2)
    # 在训练集上训练决策树模型
    clf.fit(x_train, y_train)
    
    ## 在训练集和测试集上分布利用训练好的模型进行预测
    train_predict = clf.predict(x_train)
    test_predict = clf.predict(x_test)
    from sklearn import metrics
    
    ## 利用accuracy(准确度)【预测正确的样本数目占总预测样本数目的比例】评估模型效果
    print('训练准确率:',metrics.accuracy_score(y_train,train_predict))
    print('测试准确率:',metrics.accuracy_score(y_test,test_predict))
    
    ## 查看混淆矩阵 (预测值和真实值的各类情况统计矩阵)
    confusion_matrix_result = metrics.confusion_matrix(test_predict,y_test)
    print('混淆矩阵:\n',confusion_matrix_result)
    
    # 利用热力图对于结果进行可视化
    plt.figure(figsize=(8, 6))
    sns.heatmap(confusion_matrix_result, annot=True, cmap='BrBG_r')
    plt.xlabel('true')
    plt.ylabel('predict')
    plt.show()
    

    结果:

     

     

    准确率达到0.97,已经是很高的数值了

     

    展开全文
  • 因此,可采用计算偏差度的方法求出客观权重,再利用客观权重对专家评价出的主观权重进行修正,得出综合权重。 与其他客观赋权方法相比,该方法不仅仅是建立在概率的基础之上,还以决策者预先确定的偏好系数为基础,...

    一、熵权法

    1.熵权法确定客观权重

    熵学理论最早产生于物理学家对热力学的研究,熵的概念最初描述的是一种单项流动、不可逆转的能量传递过程,随着思想和理论的不断深化和发展,后来逐步形成了热力学熵、统计熵、信息熵三种思路。信息熵方法用来确定权重己经非常广泛地应用于工程技术、社会经济等各领域。

    由信息熵的基本原理可知,对于一个系统来说,信息和熵分别是其有序程度和无序程度的度量,二者的符号相反、绝对值相等。假设一个系统可能处于不同状态,每种状态出现的概率为Pi(i=1,……,n)

    则该系统的熵就定义为:

    8341422c15d93c66e8363a8d456756f7.png

    在决策中,决策者获得信息的多少是决策结果可靠性和精度的决定性因素之一,然而,在多属性决策过程中,往往可能出现属性权重大小与其所传达的有价值的信息多少不成正比的情况。例如:某一指标所占的权重在所有指标中最大,但在整个决策矩阵中,这一指标所有方案的数值却相差甚微,即这一指标所传递的有用信息较少。显然,这一最重要的指标在决策过程中所起的作用却很小,如果不对其属性权重进行适当的处理,必将会造成评价决策方案的失真。

    熵本身所具有的物理意义及特性决定其应用在多属性决策上是一个很理想的尺度。某项指标之间值的差距越大,区分度越高,所携带和传输的信息就越多,该指标的熵值就会越小,在总体评价中起到的作用越大;相反,某项指标之间值的差距越小,区分度越低,所携带和传输的信息就越少,该指标的熵值就会越大,在总体评价中起到的作用越小。因此,可采用计算偏差度的方法求出客观权重,再利用客观权重对专家评价出的主观权重进行修正,得出综合权重。

    与其他客观赋权方法相比,该方法不仅仅是建立在概率的基础之上,还以决策者预先确定的偏好系数为基础,把决策者的主观判断和待评价对象的固有信息有机地结合起来,实现了主观与客观的统一,得出的权值准确性更高。

    对m 个方案、n 个属性构成的决策矩阵,求解权重向量的基本步骤如下:

    (1)计算在 j 属性下,第i 个方案的贡献度

    283d237eeb484deb74acd17df09f00ab.png

    78f4b278c5e76f5cb8d8e907d1ce9f22.png

    (5)得出所有属性的权重向量为 W=(w1,w2,……,wn)。

    2.熵值法修正复试指标主观权重

        确定复试指标综合权重。使用计算得到的熵值权重向量WEN,对主观权重向量WDM进行修正,得到最终的综合权重向量W。此外,为了使计算结果更加精确,本文引入权重系数θ的概念,其含义为主观权重WDM在综合权重W中的比重。θ值的大小取决于WDM与WEN的肯德尔相关系数kd,将肯德尔相关系数kd划分为20个置信区间,对应θ的取值如表1所列。

    fbc0930f4f687c1dc0c8cb45c806a189.png

    二、标准的TOPSIS方法

    TOPSIS为逼近理想解的排序方法。正理想解,各个属性值都达到各候选方案种的最好的值。负理想解,各个属性值都达到各候选方案种的最差的值。

    评价步骤:

    26a7e4cb8776f39b29c14d143354ac43.png

    86aabe515a42cbad79af3b6a75aeacf4.png

    三、改进的TOPSIS法

    TOPSIS法的一般解法存在以下不足:对初始决策矩阵所有指标的规范化处理没有区别;事先确定的权重值往往是主观值;取评估指标的最大值和最小值作为正理想解和负理想解,当评估目标个数改变时需要重新计算,可能出现前后结果相互矛盾的逆排序问题;目标值与理想值二者间的欧氏距离无法和权重建立起联系等等。

    改进方法:

    b98a03530a1e04c7005ccdc33338c3cb.png

    d0b90eaee43da1ce6b5645188b1edf2c.png

    展开全文
  • 原来酷炫的大屏,用Excel就能

    万次阅读 多人点赞 2020-04-16 19:42:26
      前段时间用tableau了可视化大屏,大家有的说说没学过tableau,有的说不会,...  通过本文,你将会收获如下这些知识:数据去重、excel常用函数、数据验证、excel常用图表、切片器,以及如何利用excel做数据...
  • 而topsis法是一种常见的多目标决策分析方法,适用于多方案、多对象的对比研究,从中找出最佳方案或竞争力最强的对象。熵权topsis是先由熵权法计算得到指标的客观权重,再利用TOPSIS法,对各评价对象进行评价。熵权...
  • 在上篇《IT如何才能助力业务实现大数据自助分析》中讲到,在大数据时代,企业IT为服务业务实现数据分析会上线各类数据分析工具,然而尽管有如此多的分析工具,很多业务仍旧钟爱使用Excel进行业务分析。 Excel...
  • 整存整取_Excel终值函数FV的应用.rar,将10000元存入银行,年利率是6%,按月计息,那么3年后存折上有多少钱?
  • excel做数据分析

    千次阅读 2019-04-05 11:00:55
    我们先来看看某公司全国产品销售的报表(截取了部分) 某公司全国产品销售的报表 ...我们使用 excel 进行数据分析,一般有以下步骤 需求收集 数据整理 数据简单统计 图表展示 分析结果撰写报告 第一...
  • 数据分析向导

    2019-07-26 22:46:38
    地图可视化 用Excel实现数据收集 从Excel 菜单中直接导入外部数据 自文本 自Access 自网站 利用 Power Query实现数据导入 Power BI Power Query 从文件加载数据(从工作薄、从CSV、从TXT) 从数据库加载数据 从Web...
  • 很多财务人员都会用EXCEL办公,财务报表,应收、应付款对账单,业务简单的公司还好,订单多的企业如果用EXCEL做起来那可就折磨人了,即使EXCEL有很多使用技巧,工作量还是不会变,这又直接关系到企业损益,可不...
  • 第8章 营销决策分析;PowerPoint 演示文稿;8.1.1 添加分析工具库;8.1.1 添加分析工具库;8.1.2 利用指数平滑工;8.1.2 利用指数平滑工;8.1.2 利用指数平滑工;8.1.2 利用指数平滑工;8.1.2 利用指数平滑工;PowerPoint ...
  • 利用决策树 ID3 算法进行预测

    千次阅读 2018-06-20 15:22:16
    构造决策树的核心问题是在每一步如何选择适当的属性对样本拆分。 对一个分类问题,从一直分类标价的训练样本中学习并构造出决策树是一个自上而下,分而治之的过程。 ID3算法: 基于信息熵来选择最佳测...
  • TargetData=pd.concat([TargetData,ContractDF],axis=1) TargetData.drop([i],axis=1,inplace=True) TargetData TargetData.to_excel('ChurnLabel_A.xls') # 模型构建 ## 尝试采用决策树这种经典的二分类模型作为...
  • 1.用到的主要三条熵公式: 1.1 信息熵 详情见香农信息论 概率越平衡 事件所含有的信息量越大 1.2 条件熵 代表某一属性下不同分类的信息熵之和...2.西瓜数据集2.0的详细手算结点划分 原创的Excel方法 zhonglihao...
  • 1. 使用背景:公司项目中需要导出Excel,使用了freemarker模板。 2. 操作步骤: (1)首先自己新建一个Excel表格,在里面写好自己的格式(最好同时写好一行假数据), (2)然后另存为xml格式的文件 ...
  • Drools决策表+SpringBoot使用及语法详解

    千次阅读 2020-05-12 18:31:38
    SpringBoot+Drools决策表的使用简介Drools决策表语法功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、...
  • 当一个比较成功的企业老板觉得好像该上ERP时,那一定是身边已有很多人在用了。于是乎老板开始每天接触大量国内外冠... 我的经验是,如果你是个非专业人士,甚至可能连非专业都谈不上,但当你决定要了,这里单指用勤
  • ETL详细讲解

    千次阅读 2019-08-27 23:04:35
    ETL是将业务系统的数据经过抽取、清洗转换之后加载到数据仓库的过程,目的是将企业中的分散、零乱、标准不统一的数据整合到一起,为企业的决策提供分析依据。ETL是BI项目重要的一个环节。 通常情况下,在BI项目中ETL...
  • 决策树之挑选西瓜

    2021-10-22 18:55:41
    决策树之挑选西瓜一、决策树二、将txt导入excel三、用python求解四、总结参考 一、决策决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价...
  • 练习用excel画图:凸函数、正太分布 用图解法和编程计算求解教材P28例子 练习excel公式与函数用法,用Solver解教材P28例子 附加练习: 用matlab画图、调用函数,求解教材P28例子     二、实验设备(环境)及...
  • 文章主要介绍较为客观的两种方法: 1、均方差决策法 均方差决策法通常用均方差来反映各个随机变量的离散程度。该方法是以各个评价指标 Zij为随机变量,以各方案 Pj在指标 j 下无量纲化处理后的属性值为随机变量的...
  • 在一些特殊的场景,需要将PLC的实时数据传输到Excel中,利用其强大的数据处理功能进行分析,以便进行监视和决策。如何来实现PLC与Excel进行数据交换呢?由于RSLinx和Excel都支持DDE,这将使得这一需求变得容易多了。...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 9,683
精华内容 3,873
关键字:

利用excel做决策