精华内容
下载资源
问答
  • 信息分类编码技术研究及应用

    千次阅读 2008-01-07 10:27:00
    本文从烟草机械制造企业信息化过程入手,介绍信息分类编码在企业信息化中的重要性, 对信息分类编码技术进行了较为详细的阐述,重点介绍烟草机械制造企业信息分类编码的方法、信息分类编码的原理与编码的内容。...
    信息化在企业中被越来越广泛的推广应用,作为信息化工作的基础支持技术:信息分类编码技术,在信息化工作中占有越来越重要的地位。本文从烟草机械制造企业信息化过程入手,介绍信息分类编码在企业信息化中的重要性, 对信息分类编码技术进行了较为详细的阐述,重点介绍烟草机械制造企业信息分类编码的方法、信息分类编码的原理与编码的内容。介绍了信息分类编码系统与CAD/CAPP/PDM/ERP等应用系统的关系,并结合实际应用,列举了具有代表性的原材料、外购件、零件特征码等几种分类编码方法。
    

        随着信息化在企业中的进一步推广应用,信息分类编码技术作为基础支持技术,在企业信息化技术中占有越来越重要的地位。国家经贸委2001年对我国企业信息化调查中提出:“企业信息化中信息编码是个普遍存在的问题”,信息分类编码技术在企业中能否成功应用直接关系到企业信息化的成败。企业信息化的诸系统的信息管理以代码为主线,以在企业中应用比较普遍的ERP系统为例,许多经验丰富的咨询顾问谈到ERP实施体会时说,要成功实施ERP系统,三分靠技术,七分靠人才,十二分靠数据。计算机只有在数据准确、完整、及时的情况下,才能发挥作用,否则可能带来错误的结果。可以说产品数据库是ERP系统运行的依据,而产品数据库建立的前提则是有信息分类编码技术的支持,由此可见信息分类编码技术是企业信息化的重中之重。

        一、信息分类编码的重要性

        1.  分类编码是信息标准化工作的一项重要内容

        标准化采用的一条重要原理是有序化原理。有序化是概括系统结构整体性、层次性和协调性的综合概念。有序化才使得人类社会成为有强大活力的自组织、自适应系统,信息分类编码技术是实现有序化的一种重要手段。不分类放置贮存物品就不能确定库存物资的位置,不编码就不能利用计算机调用已有的数据和程序软件。信息分类编码牵涉面广、分类编码对象复杂,为确保编写代码正确、无误、易认、易读,需要建立一套完整的分类编码标准,来给出分类依据、分类采用的方法以及编码所采用的代码类型、代码结构、编码方法等,并在具体的应用过程中严格依据标准编写代码才能达到预期的目的。

        2.信息分类编码为企业经营管理决策提供科学的数据依据

        信息分类编码技术关系到企业信息化的各个层次、各个方面。现代企业管理中一系列的物流、现金流在企业信息化的各系统中,都是以代码的形式表现出来的,代码与管理过程中出现的实物或虚拟件是一一对应的关系,企业信息化各系统通过对代码的处理来反映企业管理的各个实际过程,管理者通过对各个代码所反映出来的数据进行分析判断,并最终对经营管理的过程做出决策。

        3.信息分类编码技术可有效控制原材料的优先选用,降低产品制造成本。
       
        企业信息化的各系统通过一系列的代码来实现对物流的管理过程,因此可以通过控制代码的方法来实现对原材料的优先选用。首先在编制原材料代码前,由企业从事材料应用的权威工程技术人员诊断、优选材料品种、规格,确定优先选用的品种、规格的范围,其次由编制代码的工程技术人员对选用的多样性通过编制代码进行控制,仅当特别需求或形成采购批量时才允许批准新增加材料代码,从而达到减少选材的随意性,缩减原材料的品种、规格,最终达到降低产品成本的目的。

        4.信息分类编码是企业信息化各系统之间联系的纽带。

        信息分类编码是信息共享的基础,支撑烟草机械制造业信息化的软件与技术具体地体现为CAD、CAM、CAPP、PDM、MRP、ERP等, “信息(MRP、ERP)”管理和“过程(CAD、CAPP)”技术是企业信息化的不同方面,各个分系统之间既能独立运转,还可以以代码为信息纽带实现系统的集成,达到信息共享的目的。各个分系统中相同的代码代表同一事物,但描述事物的着重点不同。通过代码实现各个系统的信息互通,既可以避免重复录入带来的错误,还可以减少录入的工作量,达到一举两得的功效。

        二、信息分类编码的概念及原则

        1. 信息分类编码的概念

        信息分类就是根据信息内容的属性或特征,将信息按照一定的方法进行区分和归类,并建立起一定的分类系统和排列顺序,以便管理和使用信息。信息编码就是给事物或概念赋予一定规律性的易于人或计算机识别与处理的符号。

        2. 信息分类编码的基本原则

        烟草机械制造业企业信息量大,种类繁杂,在进行分类时应注意遵循下列分类原则:

        a. 科学性.选择分类对象的最稳定的本质属性或特征作为分类的基础和依据。

        b.  系统性.将选定的事物、概念的属性或特征按一定排列顺序予以系统化,并形成一个合理的科学分类体系。

        c. 可扩延性.设置收容类目,以便保证增加新的事物或概念时,不致于打乱已建立的分类体系,同时,还应为下级信息管理系统在本分类体系的基础上进行延拓细化创造条件。

        为了确保编码的可靠与有效,烟草机械制造业企业信息编码应遵循以下基本原则:

        a.  唯一性.虽然一个编码对象可有很多不同的名称,也可按各种不同方式对其进行描述,但是,在一个分类编码标准中,每一个编码对象仅有一个代码,一个代码只唯一表示一个编码对象。

        b.  合理性.代码结构要与分类体系相适应。

        c.  可扩充性.必须留有适当的后备容量,以便适应不断扩充的需要。

        d.  简单性.代码结构应尽量简单,长度尽量短,以便节省机器贮存空间和减少代码的差错率,同时提高机器处理的效率。

        e.  适用性.代码要尽可能反映编码对象的特点,有助于记忆,便于填写。

        f. 规范性.代码的类型、代码的结构以及代码的编写在一个信息分类代码标准中格式必须统一。

        三、信息分类编码技术在烟草机械制造业中的应用

        烟草机械制造业科技含量高,整套产品结构复杂,所用到的零部件、外购件种类繁多,在产品生产制造的过程中,再加上原材料、半成品、毛坯、产品订单、工作中心、责任部门、公司员工等,信息量极其庞大,没有一套科学、完整的分类编码方案对这些信息进行管理,企业信息化必将成为一句空话。

        利用信息分类编码技术对零部件、外购件、原材料、半成品、毛坯、产品订单、工作中心、责任部门、公司员工等各类信息进行科学的分类编码,使得围绕企业技术、生产、财务、供应、销售全过程的各个实物及虚拟件,都有一个科学、合理、唯一的编码反映到信息管理的系统中来,系统才能正常运作,企业信息化管理才能落到实处。

        根据编码对象的特征与属性的各异,以及在应用中的具体用途不同,烟草机械制造业企业一般采用线分类法和面分类法,运用这两种分类原理,对各种企业信息进行分类。在进行科学的分类的基础上,所编制的代码又分为无含义代码和有含义代码两种。其中无含义代码包括职工代码;有含义代码包括原材料码、外购件代码、进口件代码、零部件代码、零件特征码、订单代码、工作中心代码、责任部门代码等等。无含义的职工代码采用的是系列顺序码。以下将对一些有代表性的代码的信息分类与编码方法作一介绍。

        在实际应用中,对信息的分类较多采用线分类法。线分类法是将初始的分类对象按所选定的若干个属性或特征作为分类的划分基础,逐次地分成相应的若干个层级的类目,并排成一个有层次的,逐级展开的分类体系。在这个分类体系中,同位类类目之间存在着并列关系;下位类与上位类类目之间存在着录属关系;同位类类目不重复,不交叉。所谓上位类:即在线分类体系中,一个类目相对于由它直接划分出来的下一级类目而言,称为上位类;下位类:即在线分类体系中,由上位类直接划分出来的下一级类目相对于上位类而言,称为下位类;同位类:即在线分类体系中,由一个类目直接划分出来的下一级各类目,彼此称为同位类。

        例如原材料、外购件等的分类,采用的就是线分类法,这种分类方法可达到代码直观、节省码位,易于设计人员掌握等效果,在企业信息化各系统运行的过程中,这种编码方法很快得到了技术与管理人员的认可,应用效果良好。

        原材料分类代码示例见表1。

        外购件分类代码示例见表2。

        采用面分类法的有CAPP系统中用到的零件特征码。面分类法是将所选定的分类对象的若干个属性或特征视为若干个“面”,每个“面”中又可以分成许多彼此独立的若干个项目。根据需要将这些“面”中的类目组合在一起,形成一个复合类目。采用这种分类方法,我们编制了由七位数字构成的零件特征码,为CAPP系统的工艺设计提供了一条主线。根据零件特征编码,运用成组技术的原理,CAPP系统可以生成一套与此特征相适应的工艺规程。零件特征码分类编码示例见表3:

        结语

        为加快企业信息化步伐,在企业中应用信息分类编码技术刻不容缓。根据科学的编码方案编制代码,依据代码编制BOM,建立企业“信息(MRP、ERP)”管理和“过程(CAD、CAPP)”技术两条主线,通过BOM信息纽带,以PDM为核心,结合CAD/CAPP和ERP系统,辅以Internet和EDI系统,真正达到企业信息化建设的目标,增强企业的竞争力与生命力,为企业在剧烈的市场竞争中立于不败之地奠定坚实的基础。

    展开全文
  • 分类、层级与编码

    2014-12-04 14:32:37
    在使用技术技术解决现实问题时,为了描述客观世界,...常见的编码分为两类:一类是有限分类及层级,每层、每类的数量是有限的,比如常见的身份证编码,中国大陆的居民身份证号码由18位组成,前17位为数字,后一位多...

    在使用技术技术解决现实问题时,为了描述客观世界,有时候需要对一个集合中的对象进行分类、分层级。比如一群人,分类可以是男、女、老、友,分层级可以是按年龄少儿、青年、老人,少儿又可层级为新生儿、婴儿和小儿等。

    为参与计算,通常会对这些分类和层级进行编码。常见的编码分为两类:一类是有限分类及层级,每层、每类的数量是有限的,比如常见的身份证编码,中国大陆的居民身份证号码由18位组成,前17位为数字,后一位多数人为数字,少数人为字母“X”;另外一类是无限分类及层级,比如计算机中常用的二叉树。

    在有限分类及层级中,预先知道对象集合的规模,比如身份证的前6位是行政区编码,

    110000    北京市
    110100      市辖区
    110101        东城区

    这6位数分为三组,每两位为一层,如果只用数字来表示的话,意味着在每一层可以画出100个类别来,00-99。上面可以看到,北京市在省区的规划中代码是11,其中市辖区被记为01,也即1101,而东城区作为市辖区的下一级被记为01,也即110101。 这样计算机读取110101,展示给人们的就是北京市市辖区东城区,非直辖市的情况可以参考 -国家统计局 的 行政区划 -R/L2Sk 。与身份证类似,一些地理信息系统,也是采用这种编码的方式类记录地址信息到地址编码的。

    如果某一层出现第101个类别怎么办?

    有两种思路,一种是继续使用有限分类及层级,扩充每一级上的编码,比如上面的身份证编码,如果出现101个类别,则在每一层又2位扩增到3位,问题得以解决,但无法向前兼容,问题很大。

    另外一个思路时,如无无法估量对象集合的数量,或者数量是动态变化调整的,就需要用无限分类及层级。这种分类不去规划每层的宽度和容量,而是扁平的设计成每层每个类别,只需记住自己的“父类”即可,这样各找个家,也可以将一个集合有机的串起来。

    计算技术中的数据结构二叉树就是这样来设计,每层只知道parent是哪即可。同样的,我们常见的论坛(BBS)在设计论坛、子论坛和帖子编号时,也是基于这样的思路,因为无法估量某个论坛、子论坛到底会有多少个帖子。

    boardId   parentBoardId
    threadId  boardId
    子    父
    孙    子
    曾孙   孙

    使用这种对应关系即可串起来。

    无限分类与层级结构简单,伸缩性极好,但也有不足,比如统计比较困难。比如在有限分类及层级中,只要按一定的分组就可以理出其下所有子类,如11开头的身份证都是北京的,而使用无限分类及层级的话,需要检索出所有parentId为11的记录。在参与进一步的计算时,前者可能是一步,而后者需要两步及以上才能完成。

    宛如一个持有代码110101的人和一个持有01代码但直到其父是01的人同时站在面前,前者一看就知道其父、其祖,而后者只能回答其父,如果找其祖,需要使用后一个01再检索一次。

    前者的优势是每次所携带的信息容量较大,但同时也耗费更多的空间,实现以空间换时间。

    展开全文
  • 聚类算法(4)--Hierarchical clustering层次聚类

    万次阅读 多人点赞 2018-11-07 17:45:47
    目录   一、层次聚类 1、层次聚类的原理及分类 ...1)层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个...

    目录

     

    一、层次聚类

    1、层次聚类的原理及分类

    2、层次聚类的流程

    3、层次聚类的优缺点

    二、python实现

    1、sklearn实现

    2、scipy实现

    树状图分类判断


    一、层次聚类

    1、层次聚类的原理及分类

    1)层次法(Hierarchicalmethods)先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合成了一个类。其中类与类的距离的计算方法有:最短距离法,最长距离法,中间距离法,类平均法等。比如最短距离法,将类与类的距离定义为类与类之间样本的最短距离。

    层次聚类算法根据层次分解的顺序分为:自下底向上和自上向下,即凝聚的层次聚类算法和分裂的层次聚类算法(agglomerative和divisive),也可以理解为自下而上法(bottom-up)和自上而下法(top-down)。自下而上法就是一开始每个个体(object)都是一个类,然后根据linkage寻找同类,最后形成一个“类”。自上而下法就是反过来,一开始所有个体都属于一个“类”,然后根据linkage排除异己,最后每个个体都成为一个“类”。这两种路方法没有孰优孰劣之分,只是在实际应用的时候要根据数据特点以及你想要的“类”的个数,来考虑是自上而下更快还是自下而上更快。至于根据Linkage判断“类”的方法就是最短距离法、最长距离法、中间距离法、类平均法等等(其中类平均法往往被认为是最常用也最好用的方法,一方面因为其良好的单调性,另一方面因为其空间扩张/浓缩的程度适中)。为弥补分解与合并的不足,层次合并经常要与其它聚类方法相结合,如循环定位。

    2)Hierarchical methods中比较新的算法有BIRCH(Balanced Iterative Reducingand Clustering Using Hierarchies利用层次方法的平衡迭代规约和聚类)主要是在数据量很大的时候使用,而且数据类型是numerical。首先利用树的结构对对象集进行划分,然后再利用其它聚类方法对这些聚类进行优化;ROCK(A Hierarchical ClusteringAlgorithm for Categorical Attributes)主要用在categorical的数据类型上;Chameleon(A Hierarchical Clustering AlgorithmUsing Dynamic Modeling)里用到的linkage是kNN(k-nearest-neighbor)算法,并以此构建一个graph,Chameleon的聚类效果被认为非常强大,比BIRCH好用,但运算复杂度很高,O(n^2)。

    2、层次聚类的流程

    凝聚型层次聚类的策略是先将每个对象作为一个簇,然后合并这些原子簇为越来越大的簇,直到所有对象都在一个簇中,或者某个终结条件被满足。绝大多数层次聚类属于凝聚型层次聚类,它们只是在簇间相似度的定义上有所不同。 这里给出采用最小距离的凝聚层次聚类算法流程:

    (1) 将每个对象看作一类,计算两两之间的最小距离;

    (2) 将距离最小的两个类合并成一个新类;

    (3) 重新计算新类与所有类之间的距离;

    (4) 重复(2)、(3),直到所有类最后合并成一类。

    聚类的效果如下图,黑色是噪音点:

    另外我们可以看出凝聚的层次聚类并没有类似基本K均值的全局目标函数,没有局部极小问题或是很难选择初始点的问题。合并的操作往往是最终的,一旦合并两个簇之后就不会撤销。当然其计算存储的代价是昂贵的。

    3、层次聚类的优缺点

    优点:1,距离和规则的相似度容易定义,限制少;2,不需要预先制定聚类数;3,可以发现类的层次关系;4,可以聚类成其它形状

    缺点:1,计算复杂度太高;2,奇异值也能产生很大影响;3,算法很可能聚类成链状

    r语言中使用hclust(d,method = "complete", members=NULL) :进行层次聚类。d为距离矩阵;method表示类的合并方法,single最短距离法,complete最长距离法,median中间距离法,mcquitty 相似法,average 类平均法,centroid重心法,ward离差平方和法;members为NULL或d长度的矢量。

     

    二、python实现

    1、sklearn实现

    参数详解:

    sklearn库下的层次聚类是在sklearn.cluster的 AgglomerativeClustering中:

    AgglomerativeClustering类的构造函数的参数有簇的个数n_clusters,连接方法linkage,连接度量选项affinity三个重要参数。下面就这三个参数进行描述。

    簇的个数n_clusters是需要用户指定的,按照常理来说,凝聚层次聚类是不需要指定簇的个数的,但是sklearn的这个类需要指定簇的个数。算法会根据簇的个数判断最终的合并依据,这个参数会影响聚类质量。

    连接方法linkage指的是衡量簇与簇之间的远近程度的方法。具体说来包括最小距离,最大距离和平均距离三种方式。对应于簇融合的方法,即簇间观测点之间的最小距离作为簇的距离,簇间观测点之间的最大距离作为簇的距离,以及簇间观测点之间的平均距离作为簇的距离。一般说来,平均距离是一种折中的方法。

    连接度量选项affinity是一个簇间距离的计算方法,包括各种欧式空间的距离计算方法以及非欧式空间的距离计算方法。此外,该参数还可以设置为‘precomputed’,即用户输入计算好的距离矩阵。距离矩阵的生成方法:假设用户有n个观测点,那么先依次构造这n个点两两间的距离列表,即长度为n*(n-1)/2的距离列表,然后通过scipy.spatial.distance的dist库的squareform函数就可以构造距离矩阵了。这种方式的好处是用户可以使用自己定义的方法计算任意两个观测点的距离,然后再进行聚类。 聚类结束以后,需要对聚类质量进行评估。使用轮廓系数评估聚类质量。 对于n个对象的数据集D,假设D被划分为k个簇。对于D中的每个对象o,计算它和它所属的簇的其他对象的平均距离a(o)。类似的,计算它和它不属于的簇的最小平均距离b(o)。对数据集中的每个对象计算轮廓系数然后取平均值作为聚类的质量度量。轮廓系数的取值范围是[-1,1],越靠近1代表聚类质量越好,越靠近-1代表聚类质量越差。通过sklearn的metric库的silhouette_score函数即可,silhouette_score的参数有:X, labels, metric,X为距离矩阵,labels为聚类结果,metric为度量方法。由于我们输入的是距离矩阵,因此选择"precomputed"。

    实例:

    from sklearn.cluster import AgglomerativeClustering
    import numpy as np
    X = [[1,2],[3,2],[4,4],[1,2],[1,3]]#生成数据
    clustering = AgglomerativeClustering().fit(X)#训练模型

    clustering :

    AgglomerativeClustering(affinity='euclidean', compute_full_tree='auto',
                connectivity=None, linkage='ward', memory=None, n_clusters=2,
                pooling_func=<function mean at 0x110d8f840>)

    clustering.labels_ 

    array([1, 0, 0, 1, 1])

    clustering.children_

    array([[0, 3],
           [4, 5],
           [1, 2],
           [6, 7]])

    简单解释下(后面还会详细说明):

    X一共有5个样本,那么在进行层次聚类是,这5个样本各自一类,类别名称是0、1、2、3、4

    第一行:[0, 3]意思是类别0和类别3距离最近,首先聚成一类,并自动定义类别为5(=len(X)-1+1)

    第二行:[4, 5]意思是类别4和上面聚类的新类别5距离为第二近,4、5聚成一类,类别为6(=len(X)-1+2)

    第三行:[1, 2]意思是类别1、类别2距离为第三近,聚成一类,类别为7(=len(X)-1+3)

    第四行:[6, 7]意思是类别6、7距离为第四近,聚成一类,类别为8(=len(X)-1+4)

    因为类别5有两个样本,加上类别4形成类别6,有3个样本;

    类别7是类别1、2聚类形成,有两个样本;

    类别6、7聚成一类后,类别8有5个样本,这样X全部样本参与聚类,聚类完成。

    这样大家可能觉得优点乱,所以建议大家进行层次聚类是可以用下面的方法。

    2、scipy实现

    简单介绍:

    1.linkage(y, method=’single’, metric=’euclidean’) 共包含3个参数: y是距离矩阵,可以是1维压缩向量(距离向量),也可以是2维观测向量(坐标矩阵)。若y是1维压缩向量,则y必须是n个初始观测值的组合,n是坐标矩阵中成对的观测值。

    返回值:(n-1)*4的矩阵Z(后面会仔细的讲解返回值各个字段的含义)

    linkage方法用于计算两个聚类簇s和t之间的距离d(s,t),这个方法的使用在层次聚类之前。当s和t行程一个新的聚类簇u时,s和t被从森林(已经形成的聚类簇群)中移除,而用新的聚类簇u来代替。当森林中只有一个聚类簇时算法停止。而这个聚类簇就成了聚类树的根。 距离矩阵在每次迭代中都将被保存,d[i,j]对应于第i个聚类簇与第j个聚类簇之间的距离。每次迭代必须更新新形成的聚类簇之间的距离矩阵。 假定现在有|u|个初始观测值u[0],...,u[|u|-1]在聚类簇u中,有|v|个初始对象v[0],...,v[|v|-1]在聚类簇v中。回忆s和t合并成u。让v成为森林中的聚类簇,而不是u。

    由pdist得到;method是指计算类间距离的方法,比较常用的有3种: (1)single:最近邻,把类与类间距离最近的作为类间距 (2)complete:最远邻,把类与类间距离最远的作为类间距 (3)average:平均距离,类与类间所有pairs距离的平均 其他的method还有如weighted,centroid等等,具体可以参考: http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.linkage.html#scipy.cluster.hierarchy.linkage

    2.fcluster(Z, t, criterion=’inconsistent’, depth=2, R=None, monocrit=None) 第一个参数Z是linkage得到的矩阵,记录了层次聚类的层次信息; t是一个聚类的阈值-“The threshold to apply when forming flat clusters”,在实际中,感觉这个阈值的选取还是蛮重要的. 其他的参数我用的是默认的,具体可以参考:http://docs.scipy.org/doc/scipy/reference/generated/scipy.cluster.hierarchy.fcluster.html#scipy.cluster.hierarchy.fcluster

    实现:

    ###cluster.py
    #导入相应的包
    import scipy
    import scipy.cluster.hierarchy as sch
    from scipy.cluster.vq import vq,kmeans,whiten
    import numpy as np
    import matplotlib.pylab as plt
    
    #生成待聚类的数据点,这里生成了20个点,每个点4维:
    points=scipy.randn(20,4)  
    #加一个标签进行区分
    A=[]
    for i in range(20):
        a=chr(i+ord('A'))
        A.append(a)
    #1. 层次聚类
    #生成点与点之间的距离矩阵,这里用的欧氏距离:
    disMat = sch.distance.pdist(points,'euclidean') 
    #进行层次聚类:
    Z=sch.linkage(disMat,method='average') 
    #将层级聚类结果以树状图表示出来并保存为plot_dendrogram.png
    P=sch.dendrogram(Z,labels=A)

    为了跟前面sklearn进行对照,我们再来重新做一遍,顺便详细介绍下:

    from scipy.cluster.hierarchy import dendrogram, linkage,fcluster
    from matplotlib import pyplot as plt
    X = [[1,2],[3,2],[4,4],[1,2],[1,3]]
    Z = linkage(X, 'ward')
    f = fcluster(Z,4,'distance')
    fig = plt.figure(figsize=(5, 3))
    dn = dendrogram(Z)
    plt.show()

    同时我们看下Z:

    #Z:numpy.ndarry。
    层次聚类编码为一个linkage矩阵。
    Z共有四列组成,第一字段与第二字段分别为聚类簇的编号,在初始距离前每个初始值被从0~n-1进行标识,每生成一个新的聚类簇就在此基础上增加一对新的聚类簇进行标识,第三个字段表示前两个聚类簇之间的距离,第四个字段表示新生成聚类簇所包含的元素的个数。

    array([[0.        , 3.        , 0.        , 2.        ],
           [4.        , 5.        , 1.15470054, 3.        ],
           [1.        , 2.        , 2.23606798, 2.        ],
           [6.        , 7.        , 4.00832467, 5.        ]])

    我们来解释下:

    X一共有5个样本,那么在进行层次聚类是,这5个样本各自一类,类别名称是0、1、2、3、4

    Z的第一行:[0, 3]意思是类别0和类别3距离最近,首先聚成一类,并自动定义类别为5(=len(X)-1+1)

    Z的第二行:[4, 5]意思是类别4和上面聚类的新类别5距离为第二近,4、5聚成一类,类别为6(=len(X)-1+2)

    第三行、第四行以此类推,

    因为类别5有两个样本,加上类别4形成类别6,有3个样本;

    类别7是类别1、2聚类形成,有两个样本;

    类别6、7聚成一类后,类别8有5个样本,这样X全部样本参与聚类,聚类完成。

    Z第四列中有样本的个数,当最下面一行中的样本数达到样本总数时,聚类就完成了。

     我们可以根据树状图来进行分类,运用切割法进行,

    树状图分类判断

    想分两类时,就从上往下数有两根竖线时进行切割,那么所对应的竖线下面所连接的为一类

    例如,左边竖线下面链接的样本有4、0、3,那么4、0、3就聚为一类,

    右边竖线相连的样本有1、2,那么1、2就聚为一类。

    想分三类时

     就从上往下数有三根竖线时进行切割,那么所对应的竖线下面所连接的为一类

    例如,左边竖线下面链接的样本有4、0、3,那么4、0、3就聚为一类,

    中间竖线相连的样本有1,那么1就聚为一类,

    右边竖线相连的样本有2,那么2就聚为一类。

     

    当然:如果样本量比较多的时候,用树状图来判断就比较麻烦了!!!

    展开全文
  • 信息组织 | 信息组织分类法

    千次阅读 2020-05-02 09:51:22
    文章目录 1 重点与难点 2 分类法原理 2.1 分类分类检索 2.2 信息分类法的类型 2.2.1 按分类法处理的对象分 2.2.2 按分类法编制的结构形式分 2.3 分类法的宏观和微观结构 3 分类法的编制 3.1 分类法编制的基本程序 ...

    1 重点与难点

    • 重点:
      • 分类法的基本原理和编制结构体系
      • 《中图法》使用
    • 难点:
      • 分类法微观体系结构
      • 《中图法》使用

    2 分类法原理

    2.1 分类与分类检索

      分类:是指依据事物的属性或特征进行区分和类聚,并将区分的结果按照一定的次序予以组织的活动。

    分类检索的基本形式

    • 浏览式检索
    • 直接检索
    • 浏览与检索直接相结合

    2.2 信息分类法的类型

    2.2.1 按分类法处理的对象分

    1 文献分类法
      文献分类法是信息分类法中最重要的类型,因 为文献是人类知识最完整、最系统的记录,对 它的整序要求也最高。
       文献分类是各种分类法中最复杂、最庞大的, 包括:

    		1.图书分类法
    		2.档案分类法
    		3.专利分类法
    		4.标准分类法
    		5.资料分类法
    		6.公文分类法
    

    2 学科、专业(课程)分类法

    类型 分类对象 作用 特点
    学科分类法 学科 用于国家宏观科技管理、 科技统计等 较好地体现现有学科的知识联系
    专业(课程) 分类法 高等学校的专业 用于高等学校的专业设 置、课程建设、学位管 理、招生等 类目设置概括、实用
    科研项目分类 科研项目 用科研的管理、申报、 统计等 不稳定、时期阶段性

    3 网络信息分类法

      分类导航、分类目录

    网络信息分类法与文献分类法、学科分类法的差异

    • 类目体系比其他分类法的动态性高,对新事物反应迅速
    • 经常使用辅助的分类体系集中揭示某种类型的信息
    • 列类时重视信息的数量和用户利用的程度,逻辑性、等级性相对较弱
    • 注重实用性、易用性,而科学性不足
    • 类名高度简短,甚至无法准确判断类目的含义

    4 事物分类法
      是以实体的事物为主要分类对象,而不是抽象的知识,根据事物之间的异同按一定的分类标准聚 类和划分,依据事物关系的亲疏远近排列而成的 分类法。

    • 事物分类法的类型
      • 组织机构分类法——>具有唯一性,不求简短而力求明确。
      • 物品分类法——>商品分类占有重要的地位

    2.2.2 按分类法编制的结构形式分

    1. 列举式分类法

    • 基本特点

      1. 有一个严密的类目等级结构
      2. 代表信息信息与知识概念的类目以详尽列举的方式直接展现
    • 列举式分类法优缺点
      ■优点:

      • 概念直接表达,直观明确,不易产生歧义;
      • 在分类浏览检索中,可以使用户在层层深入的过程中发现所有的类目
        等级系统性,对于知识的系统组织和系统查询有良好的适应能力。

      ■缺点:

      • 难以揭示复杂知识主题和新主题,容纳性较差;
      • 篇幅巨大,使用不便。

    2. 组配式分类法

      也称分面分类法、组面分类法、分析一综合式分 类法,是根据概念的分析与综合的原理,将概括 文献、信息、事物的主题概念组成"知识大纲一分面一亚面一类目",的结构,按一定的规则、通 过各个分面内类目之间的组合来表达文献主题的一种分类法。

    ■著名的组配式分类法

    《冒号分类法》(CC)
    《布利斯书目分类法》(BC2 )

    ■分面分析.分面引用次序,分面标记制度, 是分面分类法的核心理论和关键技术。

    组配式分类法的优缺点

    ■优点:

    • 可以组配出大量新的、复杂的主题,容纳性较好。
    • 分面分析的方式,可以从多个方面反映概念的含 义,在网络信息组织方面具有较好的应用前景。

    ■缺点:

    • 组配技术和标记技术过于复杂且表达性较差,较难满足实用需要。

    3. 体系-组配式分类法

    • 是在等级体系分类法的基础上,引入分面分析和组配技术所形成的分类法。以等级体系分类为基础,以确保分类知识系统性的前提;
    • 引入分面分析和组配技术是为了提高体系分类对新主题、复杂主题的描述能力和灵活的检索能力。

    体系分类法吸收组配分类法的体现

    1. 多重分类的运用
    2. 是运用类目仿分,设置专类复分表和通用复分表等手段,增加细分的能力,提高标引专指度
    3. 是使用主类号直接组配表达新的主题

    2.3 分类法的宏观和微观结构

    分类法的宏观结构

      是指分类法的基本组成部分及其联系,各个组成部分一般是一个独立的模块,具有 特定的功能。

    分类法的宏观结构
    在这里插入图片描述

    分类法的微观结构

      分类法的微观结构,是指分类法的类目结构。

      一个类目是由类号、类名、类级、注释和参照组成的,其中类号、类名、类级是必须的
    在这里插入图片描述

    3 分类法的编制

    3.1 分类法编制的基本程序

    ■(一)分类法的功能分析与定位——>基础性工作、因素制约
    ■(二)系统用户需求调查与分析
    ■(三)分类体系设计
    ■(四)分类标记设计
    ■(五)分类法结构设计——>设计子系统
    ■(六)分类法主表设计
    ■(七)分类法辅助分类体系设计
    ■(八)分类法辅助表设计
    ■(九)分类法索引设计
    ■(十)试标引与修订

    3.2 类目的设置、划分与排列

    3.2.1 类目的设置(立类)

    立类的一般原则

    1. 立类的客观性原则——>类目要有文献、信息的保证;

    2. 分类法稳定的基础——>类目应当是稳定的;

    3. 立类的发展性原则——>类目应当是发展的;

    4. 类目应当是均衡的;

    5. 类目概念应当是清楚而简洁

    3.2.2 类目划分

      选用一定的分类标准,对一个较宽泛的上位概 进行分组,形成一组平行的类目(同位类)。
    类目划分的原则

    1. 应以事物本质属性中最有检索意义 的属性作为主要划分标准。
    2. 应基本遵循逻辑划分的规则。
    3. 应当力求全面,以保证类列的完整类目划分的级次不宜过粗也不宜过细(遵循文献保证原则

    类目划分的技术

    1. 划分层次的掌握——>总的原则是最末级子目应当有足够的文献、信息保证量。
    2. 总论与专论的掌握——>XX基本问题、XX一般性问题、XX一般著作
    3. “横向展开” 与 “纵向深入” 的掌握 ——>某类事物的共性问题 / 事物的个性差异
    4. 共性区分的处理类组的划分 ——>采用“对应列类”的方法,一致性,规律性
    5. 类目的多重划分(列类) ——>分面标头
    6. 类目划分中"集中"方向的选择 ——>满足某些专业特殊的检索需要(明确的注释和导引)
    7. 交替列类和交叉列类 ——>某种重点需求并依据其主要隶属关系在一个类下列 类,该类目称为正式类目或使用类目 / 在其他一个或几个类下也编列相应的类目,供选择使用,该类目称为交替类目。
    8. 类目划分中的逻辑性
    9. 双表列类法

    分类标准的使用次序

      ■分类标准的使用次序,决定着文献、信息聚合成类的次序和按某种属性集中的程度,决定着分类法局部的类目体系结构。

      ■分类标准使用次序应该遵循:

    1. 优先使用的分类标准一般是该学科、该事物的主要分类标准
    2. 优先使用能形成具有科学认识意义的类目体系的分类标准
    3. 优先使用具有较高检索意义的属性作为分体系的分类标准
    4. 分类标准次序:篇幅——>时代——> 国家——>题材

    3.2.3 类目关系显示及交叉关系的处理

    ■类目关系的显示
      分类法中类目的涵义是在一个由上位概念 、同位概念、下位概念和类目注释构成的 语义空间中进行限定后体现出来的,这也是等级体系分类法进行语义控制、显示类目间关系的基本方式。

    ■类目之间的关系

    1. 类目纵向的等级关系
      在这里插入图片描述

    2. 类目横向关系
      在这里插入图片描述

    3. 类目的同一关系在这里插入图片描述

    类目之间交叉关系的处理

    5. 理论及其应用的交叉在这里插入图片描述

    1. 自然科学基础理论与应用科学的交叉在这里插入图片描述

    2. 产品的理论、制造及其应用的交叉在这里插入图片描述

    3. 交叉学科(边缘学科)的编列在这里插入图片描述

    3.2.4 类目注释

    ■类目注释主要有以下几种类型:

    1. 类目内容注释——> —般采用〃见XX注〃(注释内容完全相同);

    2. 类目关系注释在这里插入图片描述

    3. 分类方法注释——>
        包括说明复分的依据、复分的次序、组配编 号方法、文献集中与分散分类的方法、某项 特殊的分类规则或组号规则、说明互见分类的方法、说明同类书的区分方法等在这里插入图片描述

    4. 类目沿革注释
      在这里插入图片描述

    3.2.5 分类法的修订

    修订的主要方面与技术:
    ■在渐变中实现结构性变化(为确保分为类法相对的稳定性)
    ■类目体系的扩充(适用于该类的文献、信息有了较大增长,而原 来的类目明显不敷使用)
    ■增补新的主题

    • 利用空号个别增加类目;
    • 修订类名,扩大 原类目的外延;
    • 将涵义相关的类目改为类组,容纳新的主 题;
    • 通过类目注释,增加新的主题内容等。

    ■删除陈旧或错误的类目、合并使用频率很低的类目;
    ■订正类目的错误;
    ■对类名、注释等进行规范化处理;
    ■完善注释参照系统;
    ■修订复分表

    • 复分表的修订一般多局限于扩大类目外延、增加新类目、 增加细分层次、增加注释、增加复分表种类等方面。

    Web版分类法的维护和修订
    Web版分类法的最大优点是:

    • 可以进行动态更新和维护,减少因版本性修订周期较与科学技术发展迅速产生的时滞

    Web版分类法维护修订方式

    1. 首先是确定曰常维护的权限和程序,通常可以划分为网络版维护组、主编、编委会三级修订审查机制;
    2. 其次是做好网络版修订日志;
    3. 第三是做好修订的发布工作,不仅要在分类表上更新,还应在专门栏目集中发布更新信息,使用 户全面了解更新的动态;
    4. 第四是充分利用网络版的平台,加强与用户的互动了解用户对分类法修订的建议

    4 分类法的标记系统

    4.1 分类标记的功能与要求

    (一)分类标记的功能

    ■以代号的形式表达类目
    ■固定定类目位置
    ■显示类目之间的关系

    (二)分类标记的要求
      容纳性、简明性、表达性、助记性

    4.2 分类标记的类型

    (一)按组成成分划分

    1. 单纯号码——>单纯数字号码\单纯字母号码
    2. 混合制号码——>《国际专利分类法》、《中图法》
    3. 层累标记制 ——>《中图法》

    • 层累制的主要优点是分类号码能够揭示类目的等 级关系、有很强的表达性、便于扩大或缩小检索 范围。
    • 其缺点是随着类目的逐级展开号码将越来越长,影响简短性;当同位类超过其进位基数后,就得 采用变通的方法来弥补,号码位数与类目的等级 就不能完全对应了。

    4. 顺序标记制——>《美国国会图书馆分类法》

      顺序制号码的优点是配号简单,由于不表达等级关系所 以号码较简短、号码利用率高。
      主要缺点是表达性差,不能体现类目之间的等级关系, 不便于扩大或缩小检索范围,对计算机信息处理的适应性也差,因此较少被采用。

    5. 混合标记制——>《科图法》

      是把层累制与顺序制相结合的一种标记制度 ,包括层累一顺序制和顺序一层累制两种基 本类型。

    6. 分面标记制——>《冒号分类法》

      分面标记制采用特定的符号或组配方式表示复杂主题 各个主题因素所属的分面,使号码不仅揭示类目的次 序和等级,也能显示类目的分面结构,其特点是灵活 的组配性能可以充分揭示文献主题。
      但是分面标记制造成号码冗长复杂,易识别性和排序性都不如其他类型的号码,因此完全的分面标记制很少被使用,而 将其融入其他的标记制度结合使用。

    7. 回归标记制——>《布利斯书目分类法》

      也称回溯标记制,是一种适用于分面组配式分类的标 记制。其配号的方法是直接将位置在前的组面类号加 在位置在后的组面类号上。

    8. 起讫标记制——>《联合国教科文组织叙词表》的分类表部

      又称扩充编号法,是用一个号码或一个起讫号码表示 一类,用起讫范围内的若干个号码(包括起讫号码) 标记某个起讫类号所在类目的下位类。在这里插入图片描述

    4.3 分类标记系统的构建技术

    4.3.1 分类法的结构形式

      分类法的不同结构形式对分类标记系统有不同的要求:

    • 等级体系式分类法最好使用层累标记制;
    • 分面分类法则需要相应的分面标记制才能满足其组面设置、主题组配的需要。

    4.3.2分类法的功能

      分类法的功能各不相同,对分类标记系统的要求也有所差异,分类标记系统除了显示等级结构外,还要便于计算机处理。

    • 文献分类法的标记系统最为复杂,其中是否具有文献排架功能 ,也对标记系统的要求不同。
    • 学科分类法由于不会划分的十分深细,号码长度不是主要因素 ,但等级显示的功能要强。
    • 某些事物分类法,比如电子商务的商品分类法的同位类可能相 当多,就必须考虑号码的容纳性,而无须考虑其组配的功能。
    • 对于网络信息分类法来说,最重要的构成直观的树型结构,以便于直接层层浏览检索。

    4.3.3 标记系统的辅助符号

    • 现代分类法不管是等级体系的还是分面式的,
多配有一定的辅助符号用于标记特定的主题、
或用于文献主题的组配。如UDC的+、/、:
、=•・・、(0—)等,《中图法》的V >、
""、一、a、+、()等。
    • 辅助符号的种类、功能、使用及其与主类号的
关系等都须根据分类法的功能要求进行设计。

    4.3.4 配号方法

    1.涉及总论与专论类目的配号
      有关某类文献、信息、事物的共性问题,都是总论性的。
      文献、信息分类法通常编制一组总论性类目置于该类之前,并用"0 —般性问题"来标记总论性类目。在这里插入图片描述

    2.通用复分表类目的配号

      通用复分表由于适用于整个分类表,配号时不 仅涉及号码编号制度,也常常涉及辅助标记符 号的使用。

    3.专用复分表类目的配号
      专用复分表类目的配号主要要考虑与主类号的组配需要,同时要与主表有关类目的配号相呼应。在这里插入图片描述

    4.号码扩充技术

    • 借号法——>借下位类号、借上位类号

    • 八分法——>也称扩九法,是同位类较多(或预计发展较多)但不超过16个时常用的扩充编号技术。
        ■基本编号方法是:使用前八个号码为前八同位类配号 ,将剩余的"9"扩成双位,为其他同位类配号。在这里插入图片描述

    • 双位法
        也称百分法,是用于同位类数量相当多时的一种扩号 技术。
        ■基本的编号方法是:1-9本身不使用,每个号码直接扩充为双位号,为同位类配号,这样在同一个类列中号码的位数与类目的等级是相对应的。在这里插入图片描述

    • 字顺扩号法
        当某类下同位类很多,但无须再进一步划分,且同位 类有不可预见性时,可使用类名的首字母进行扩号, 即"类号+字母"。在这里插入图片描述

    5.空号的技术
      在分类标记系统设计和实际配号中,为了给类目扩充或修订留有余地,或为了编号的逻辑性,或为了编号的对应性等目的,大量使用空号技术。
    (1)间隔空号——>当号码比较充裕,号码的预留难以预测时使用。
    (2)对应性空号——>为达到对应编号的目的,为性质相同的类列中没有列举的类目配以对应性空号。
    (3)逻辑性空号
      当列类时按逻辑性的原则应为某事物设立某类目,但 由于当时文献保证不足等原因没有列类,则为该主题应占据的位置进行逻辑性空号。
    (4)尾部空号
      这是最常用的空号法,编号时类列的前面类目依次顺 序配号,把"其他”或"XX应用〃置于类列最后, 用"9”配号,其余尾部号码为空号。
    (5)预测性空号
       在编表时根据类目今后可能展开的情况,有预见地在一定位置预留空号。

    5《中图法》

    5.1 《中国图书馆分类法》发展沿革

    ■《中图法》最早由中国科学技术出版社于 1975年正式出版。
    ■1980年出版第2版
    ■1990年出版第3版
    ■1999年出版第4版
    ■2002年《中图法》第4版电子版问世,标志 着我国文献、信息分类法已经开始从传统的印刷型分类法迈向电子分类法的新阶段。
    ■2009年《中图法》出版第五版。
    ■2011年《中图法》Web版正式上线。

    5.2 《中图法》的标记符号

    ■•间隔符号
    ■a推荐符号

    • 置于A类马列经典作家著作的互见分类号之后, 以示推荐作用。例如:G25a。

    ■/起止符号
    ■[]交替符号

    • [K902]经济地理学

    ■.总论复分符号

    • .03方法论;TU-80建筑艺术理论

    ■()国家、地区区分号

    • TJ761.2 ( 351 )印度的中程导弹

    ■=时代区分号

    • 0411.1= 535二十世纪80年代的数学物理方法

    ■“ ”民族.种族区分号

    • J732.2 〃510.5〃吉普赛民间舞蹈

    ■< >通用时间.地点区分号

    • TV553<113>冬季打桩工程

    ■:组配符号

    • Z89:TV21水利规划索引

    ■+联合符号

    • B2+G12中国哲学与中国教育

    ■—指示性类目提示符号在这里插入图片描述

    ■{}停用类目指示符

    • 例如:(0515} 超低温(小于1°K)获得
      <停用;4版改入0514.1>

    5.3 《中图法》评价

    ■优点:

    1. 《中图法》Web版开创了我国大型综合性分类法 Web版的先河,使分类法的应用和管理进入到一 个更高的层次。
    2. 《中图法》Web版最大的优点是实现了分类法的 动态更新,由此也对分类法的修订理论和方法产 生深远影响。
    3. 《中图法》Web版实现了OPAC检索,从而把《 中图法》与网络信息资源检索紧密连在一起。

    ■缺点:
    5. 没有提供组合检索方式;
    6. 与《中图法》电子版相比页面窗口固定,显示、 使用都欠灵活。

    6 参考资料

      《信息组织(第三版)》,戴维民主编,高等教育出版社,2014年.
      《信息组织(第三章)》PPT

    展开全文
  • 实验目的: 理解计算机图像分类的基本原理,掌握数字图像非监督分类以及监督分类的具体方法和过程,以及两种分类方法的区别。 二.实验平台:ERDAS IMAGINE 9.1 三.实验要求:掌握非监督分类;非监督分类结果评价;...
  • SVM实现多分类常用的两种方法以及一对一的代码(VS13+opencv3.4) SVM是一个二值分类器,处理多分类问题的时候需要构造合适的多类分类器。 (1)直接,直接在目标函数上进行修改,将多个分类面的参数求解合并到...
  • 从决策树学习谈到贝叶斯分类算法、EM、HMM

    万次阅读 多人点赞 2012-05-17 21:06:53
    第一篇:从决策树学习谈到贝叶斯分类算法、EM、HMM (Machine Learning & Data Mining交流群:8986884)引言 最近在面试中,除了基础 & 算法 & 项目之外,经常被问到或被要求介绍和描述下自己所知道...
  • 层次聚类详解(附代码)

    万次阅读 2018-07-31 14:48:39
    本篇博客主要介绍机器学习算法中的层次聚类,层次聚类不同于传统的K-Means聚类算法,它在初始K值和初始聚类中心点的选择问题上会存在优势。  层次聚类 层次聚类就是一层一层的进行聚类,可以由下向上,或由上向下...
  • 对比预测编码

    千次阅读 2019-07-16 21:12:43
    例如,当预先训练一个模型来进行图像分类时,诱导特征相当好地转移到其他图像分类领域,但也缺乏某些信息,如颜色或计数能力,这些信息与分类无关,但与图像标题[4]相关。类似地,用于转录人类语音的特征可能不适合...
  • 1.1 层次聚类的原理及分类 1)层次法(Hierarchicalmethods):先计算样本之间的距离。每次将距离最近的点合并到同一个类。然后,再计算类与类之间的距离,将距离最近的类合并为一个大类。不停的合并,直到合成了一...
  • 文本分类入门

    千次阅读 热门讨论 2012-03-04 02:08:57
    最近要做文本分类相关的课程project,因此上网找了一下文本分类的资料,下面这个感觉比较通俗易懂,收录在这里。 来源 http://www.blogjava.net/zhenandaci/category/31868.html?Show=All 文本分类入 门(一)文本...
  • 中国图书分类法--计算机与数学

    万次阅读 2006-03-26 00:32:00
    TP274+.3 自动分类与质量检查系统 TP274+.4 集中检测与巡回检测系统 TP274+.5 采用各种新技术的自动检测系统 TP274+.51 放射线检测及其设备 TP274+.52 红外线检测及其设备 TP274+.53 超声波检测及其...
  • 一期涉及新手入门、识别数字、图像分类、词向量、情感分析、语义角色标注、机器翻译、个性化推荐。 二期会有更多的图像内容。 随便,帮国产框架打广告:加入TechWriter队伍,强大国产深度学习利器。...
  • 传统情感分类方法与深度学习的情感分类方法对比

    万次阅读 多人点赞 2018-11-10 16:57:16
    标注:本博客是参考论文《传统情感分类方法与机遇深度学习的情感分类方法对比分析》写的,作者段传明。 情感分类是自然语言处理的重要分支,传统情感分类主要有基于情感词典的和基于机器学习的,最新的方法是基于...
  • 目前,构造SVM多类分类器的方法主要有两类:一类是直接,直接在目标函数上进行修改,将多个分类面的参数求解合并到一个最优化问题中,通过求解该最优化问题“一次性”实现多类分类。这种方法看似简单,但其计算...
  • Atitit 学科与知识领域分类门类分类法 目录 1. 学位学科门类是授予学位的学科类别。国际上大体有两种划分方法: 1 2. 三大类 文理科 医学 1 3. 五大门类 2 4. 13门类 2 5. 文科 理科 商科 工科 2 5.1. 商...
  • ORACLE错误编码大全

    千次阅读 2017-04-24 21:53:37
    初学Oracle 收集了所有的错误编码 ,以供自己以后在用到的时候查询使用
  • Unicode字符编码标准

    千次阅读 2018-08-16 16:46:05
    1. 编码知识  1.1 文本和字符  在计算机程序中或者数据文件里,文本(text)是作为数字序列存储的。序列中的数字是具有不同大小、取值和解释的整数。如何解释这些整数是由字符集(character set)、编码(encoding...
  • 自动编码

    万次阅读 2017-05-24 09:32:53
    Deep Learning最简单的一种方法是利用人工神经网络的特点,人工神经网络(ANN)本身就是具有层次结构的系统,如果给定一个神经网络,我们假设其输出与输入是相同的,然后训练调整其参数,得到每一层中的权重。...
  • 深度学习模型---自动编码 AutoEncoder

    千次阅读 2017-10-26 09:56:38
    DL最简单的一种方法是利用人工神经网络的特点,人工神经网络(ANN)本身就是具有层次结构的系统,如果给定一个神经网络,我们假设其输出与输入是相同的,然后训练调整其参数,得到每一层中的权重。自然地,我们就...
  • 附:ARC下编码注意事项 序此文档根据apple、google以及其他一些业界知名的oc编码规范整理而成,并作了大量精简,旨在为大家的iOS开发规范提供一份简单、清晰、统一的参考指南。1.格式和换行1.1 只使用2个空格来缩进,...
  • 评价中国制造业国际竞争力的实证方法研究——兼与波特指标及产业分类法比较 作者:陈立敏;谭力文 【原文出处】:中国工业经济 【原刊地名】:京 【原刊期号】:200405 【原刊页号】:30~37 【复印期号】:11 【分类...
  • 全面了解数据库设计中分类算法

    千次阅读 2010-01-06 19:02:00
    【转】推荐:全面了解数据库设计中分类算法 分类算法要解决的问题 在网站建设中,分类算法的应用非常的普遍。在设计一个电子商店时,要涉及到商品分类;在设计发布系统时,要涉及到栏目或者频道分类;在设计软件下载...
  • 细粒度图像分类(FGVC)---综述

    万次阅读 多人点赞 2019-04-28 16:28:02
    什么是细粒度图像分类 细粒度图像分类问题是对大类下的子类进行识别。细粒度图像分析任务相对通用图像(General/Generic Images)任务的区别和难点在于其图像所属类别的粒度更为精细。 以图1为例,通用图像分类其...
  • 栈式自编码算法

    千次阅读 2016-05-01 11:01:05
    栈式自编码算法 ...逐层贪婪训练依次训练网络的每一层,进而...在本节中,我们将会学习如何将自编码器“栈化”到逐层贪婪训练中,从而预训练(或者说初始化)深度神经网络的权重。 栈式自编码神经网络是
  • 二叉树和Huffman编码

    千次阅读 2013-05-27 22:34:08
    分类 满二叉树 满二叉树是指除了叶子节点之外的所有内部节点均有左右子树。 完全二叉树 如果一颗二叉树所有度数小于二的节点都集中在这棵树最下面两层,并且最下面一层的所有度数小于二的节点都集中在最...
  • AV1编码标准-算法描述

    千次阅读 2020-10-15 22:35:22
    AV1编码标准 本文档介绍了相关编解码器中包含的编码工具的技术方面。本文档不是相关编解码器的规范。相反,它总结了针对新开发人员的编码工具的突出功能。 缩略语 CfL: Chroma from Luma IntraBC: Intra block ...
  • 基于深度学习时间序列分类研究综述[论文阅读]

    万次阅读 多人点赞 2019-03-15 10:22:22
    时间序列分类研究简介核心论文写在前面的话原文概述摘要1引言2背景2.1时间序列分类2.2基于深度学习的时间序列分类2.3生成性或判别性方法生成模型判别模型3方法3.1为什么判别的端到端方法?3.2方法比较完全卷积神经...
  •  Deep Learning最简单的一种方法是利用人工神经网络的特点,人工神经网络(ANN)本身就是具有层次结构的系统,如果给定一个神经网络,我们假设其输出与输入是相同的,然后训练调整其参数,得到每一层中的权重。...
  • 用于视觉跟踪的层次化卷积特性

    千次阅读 2018-09-10 11:11:22
    用于视觉跟踪的层次化卷积特性 摘要 视觉目标跟踪是一项具有挑战性的工作,由于目标对象的变形、突然运动、背景杂波和遮挡等因素,使目标对象的外观发生明显变化。本文利用在对象识别数据集上训练的深度卷积神经...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 20,530
精华内容 8,212
关键字:

层次分类编码法