精华内容
下载资源
问答
  • 国家标准企业类型代码表 。他是依据国家最新定制标准制作 例如 (8000:集团)
  • 国家标准企业主体类型代码表 ,是依据国家最新定制标准而导出 mysql 脚本数据 例如 (1000:内资公司、8000:集团 等)
  • 标准企业网站源代码带调试,带后台控制,新手建站不错的程序,简单易用上后,很方便。
  • 无忧PHP企业网站管理系统是采用PHP+MYSQL技术和MVC模式进行开发的,架构清晰,代码易于维护。支持伪静态功能,可生成google和百度地图,支持自定义url、 关键字和描述,符合SEO标准。拥有企业网站常用的模块功能...
  • 企业代码

    2015-01-13 10:15:54
    企业标准html代码,用于初级html人员学习之用
  • 标准企业网站,完整无错ASP源代码,本人测试,后台完整无错
  • 企业所在行业分类国家标准 行业分类 代码
  • 企业数据标准规划、建设和应用

    千次阅读 2016-11-29 10:32:21
    今天我分享的内容,整体包括三个部分:第一部分主要介绍为什么要建标准,建设数据标准带来价值是什么;什么是数据标准,业界数据标准体系架构,数据标准具体表现形式是什么样...一、企业数据建设现状长久以来,大多...

    今天我分享的内容,整体包括三个部分:

    第一部分主要介绍为什么要建标准,建设数据标准带来价值是什么;什么是数据标准,业界数据标准体系架构,数据标准具体表现形式是什么样的,数据标准包含内容有哪些;
    
    第二部分结合我们数据标准实施经验,介绍标准如何建立、落地、维护的整个流程;并介绍几个标准落地的几个关键点;
    
    第三部分给出了一个案例,描述典型的数据标准实施路径,供参考。
    

    一、企业数据建设现状

    图片描述

    长久以来,大多数的系统都是在某些业务需求的基础上建立,没有考虑与其他系统的功能重复和数据重复,数据一致性和可用性的矛盾突出。由于缺乏这种对数据整体设计考虑,造成多种数据问题:

    数据需求缺乏规范,造成数据对象多份存储,存储结构各异,严重影响数据共享。
    

    例如:某金融公司客户信息存在于财务和产品两个系统中,由于建设时期和团队不同,其中对客户代码长度的定义不一致,财务系统中定义为4位,产品系统中定义为6位,导致同样的数据要素在财务系统和客户系统中标准不一致,造成同一客户财务和产品信息不能很好打通。

    数据标准依据各异,造成统计口径无法匹配。
    

    例如:某金融公司原有系统,业务类型采用业界标准包括资产收购与经营、投资、融资顾问等;由于公司发展,开展了新的业务,因此后来的系统中采用公司新标准,出现了商业收购、阶段性投融资等业务类型。结果新旧系统在业务类型上不一致,业务人员要人为的做关联。

    业务口径不统一,造成沟通困难,发生歧义。
    

    例如:某业务部门,需要财务部门提供一份月报表,由于对“余额”一词有不同的理解,一个认为是“期初余额”,而另一个认为是“期末余额”,造成统计结果大相径庭。经过多次沟通,才达到满意效果。

    数据缺乏标准造成的问题还有很多,总的来说,需要从数据对象、代码、业务指标等多方面实现标准化,才能从根本上减少这些数据问题。那数据标准能给我们带来什么?

    图片描述

    标准可以在业务、技术、管理多个方面给我们提供支撑。

    业务方面:

    提升业务规范性
    

    通过标准可以明确很多数据业务含义,使得不同业务部门之间,以及业务与技术之间沟通更加通畅,避免歧义。

    例如通过客户数据标准,我们在讲客户的时候,大家理解的是一致的,只有办了银行卡的人,才是银行客户。而不会再有认为在网站注册、或者通过本行转账的人都是客户的理解。

    提升数据对业务分析支持度
    

    通过数据标准,可以明确的把某个数据主题(例如客户)信息分为多类,例如基本信息、联系信息、财务信息等,为多维度分析和深度挖掘提供依据。

    通过数据标准,实现数据信息统一一致,使得数据更容易在各业务部门之间流转。
    

    技术方面:

    首先,相同结构的数据,才更容易实现共享和交换;因此公司内部标准促进数据在企业内部流转,行业标准促进数据在企业之间流转;
    
    其次,相同的数据标准,减少大量的转换、清洗工作,极大的提升数据处理效率;数据处理过程中也会减少出差几率,提升问题质量。
    

    管理方面:

    数据标准更多的是能提供完整、及时、准确、高质量的数据,为决策支持、精细化管理等提供支撑。
    

    那么,到底什么是数据标准呢?

    图片描述

    一般我们直观认为数据标准就是几个文档,描述了一些规范和要求,需要大家去遵守。

    更严谨一点定义,数据标准是为了使企业内外部使用和交换的数据是一致和准确的,经协商一致制定并由相关主管机构批准,共同使用和重复使用的一种规范性文件。

    而我们认为数据标准又不仅仅是一套规范,而是一套由管理规范、管控流程、技术工具共同组成的体系,是通过这套体系逐步实现信息标准化的过程。数据标准化是通过一整套的数据规范、管控流程和技术工具来确保的各种重要信息,例如产品、客户、机构、账户等在全公司内外的使用和交换都是一致、准确的过程。

    另外,数据标准也不仅仅是技术或者业务一个部门的事情,它是在数据层面上对重要业务主题的统一规范,也是业务规范在数据层面上的实现。数据标准实施依赖于业务部门之间的共识,以及业务和技术之间的配合。

    那么业界常用的数据标准体系是什么样的呢?标准长什么样,包含哪些内容?下面我会对数据标准的分类和参考体系、内容和形式做一下简单介绍,可以做一个直观的理解。

    图片描述

    首先,数据标准根据不同的数据域分为基础、分析类和专有类三类

    基础类数标是企业日常业务开展过程中所产生的具有共同业务特征的基础性数据,如客户、产品、财务等;
    
    分析类数标是为满足公司内部管理需要及外部监管要求,在基础性数据基础上按一定统计、分析规则加工后的数据;
    
    专有类数标是公司架构下子公司在业务经营及管理分析中所涉及的特有数据。
    

    其中,针对基础类数标,可以看一下金融行业经常用的数据标准十大主题模型。该模型是以主题组织数据,包括客户、资产、机构、产品等主题。

    那么针对某个数据主题,数据标准到底由那几部分组成呢?

    图片描述

    一般数据标准会包括:主题定义、信息项、标准代码三个文档,其中:

    标准主题定义文档:主要是记录数据标准的定义、分类,用于规范和识别数据的主题归属;
    
    标准信息项文档:记录数据主题的信息项业务属性(分类、业务含义、业务逻辑)和技术属性(类型、长度、默认规则);
    
    标准代码文档:记录信息项固定码值的编码、分类、使用规则等。
    

    信息项文档是数据标准的核心。内容包括分类、业务描述和技术描述,一般由信息大类、信息小类、信息项、信息项描述、信息类别、长度共6项组成。当然这些内容也可以调整,例如信息大类、小类,可以合并,或者拆除更多层级。

    信息大、小类是对信息项的常规分类,例如:例如客户信息大类包括基本信息、联系信息、关联信息、财务信息、风险信息、评价信息、往来信息七大类;信息小类,包括:客户编号、名称、证件、地址、评级信息、模型评分、等级、开办业务等;

    信息项是用来描述一个事物的最基本元素。表示一个事物的识别、限制、数量、分类、状态,或者事物间的关系,例如客户信息的名称、年龄、性别等;

    信息项描述是描写或者规范信息项的具体业务描述及界定;

    信息类别是根据业务需求,定义相应的信息项在数据库中所需要的技术格式。例如:编号、标志、代码、金额、日期、数值、文本等;

    长度是信息项的数据长度,供各系统建设参考使用。

    二、如何建设数据标准

    图片描述

    一般数据包标准包括制定、落地、维护等过程。其中制定过程包括规划、调研、设计;落地过程通过映射、标准执行等实现;维护过程保证了数据标准的持续更新。

    1、首先,在标准制定过程中的第一个阶段,标准规划阶段,要根据业界经验和企业实际情况确定实施范围,并根据优先级和难易度制定计划。

    例如,在金融行业,以金融行业十大主题为依据开展,通过业务了解,确定产品、客户、财务等几个主题是关键主题,其他主题业务关联性很弱;因此,确定实施范围,并根据紧迫度、资金等因此确定了实施计划,分多期建立。
    

    2、接下来,在调研阶段,通过制定调查问卷、安排现场访谈、收集文档资料等手段,针对各个业务系统以及应用系统进行调研,了解跟标准相关的内容,包括现有定义、使用习惯、数据分布、数据流向、业务规则、服务部门等,形成调研报告,分析问题,并讨论解决方案。

    实施过程中,如果多个部门不清楚项目意义和项目目标,首先需要对各部门做项目宣讲,让他们有充分了解。
    
    然后,通过调研问卷方式进行初步了解沟通,同期开始大批量研究企业现有的文档了解业务和数据集。
    
    最后,通过当面访谈深入了解信息,并讨论问题与解决方案。最终通过开评审会方式确定解决方案,并给出分析报告。
    

    3、有了素材,接下来就是开始标准设计工作。

    在这个阶段主要是在方法论指导下,完成数据标准设计和定义工作,包括数据业务描述定义(业务属性)、类型长度定义(技术属性)、其他标准信息定义。
    
    设计出定义与分类、信息项、标准码等文档,并通过各部门的评审验证。最终达成一致,形成企业级标准。
    

    到此,标准制定工作完毕。

    4、接下来主要是标准如何落地工作。把已定义的数据标准与业务系统、业务应用进行映射,标明标准和现状的关系以及可能影响到的应用。

    标准落地一般通过两种方式:
    
    1)新系统建设,直接参考数据标准;
    
    2)旧系统通过标准映射,实现数据关系转换,以及指导后续数据平台建设。
    

    5、做完数据标准映射,接下了就是标准落地执行。

    这个过程一般需要借助专业的工具实现标准落地检查。标准执行一般有两个过程
    
    1)第一步分析出来现有问题,例如数据缺失、数据不一致等;
    
    2)第二步修正,例如补录数据、修改系统、新建系统等。
    
    通过这些措施,逐步规范数据建设过程,实现数据标准的落地。
    

    6、数据标准也不是一成不变的,随着业务发展,有些标准需要不断的修订和完善。因此数据标准还有一个关键的管理环节,那就是需要能持续维护改进。

    在数据标准维护阶段,需要有相应的需求收集、需求评审、变更评审、发布等多个步骤,并能对所有的修订做版本管理,以方便将来问题查找。
    

    以上讲了数据标准管理的全过程,接下来我对数据标准落地的几个关键点做一个简单介绍。

    图片描述

    第一条关键点:数据标准应该只管理核心数据定义

    首先,标准不是模型,标准是可落地的核心元素。
    
    企业实际数据模型中有上万个字段,有些模型还会经常变换更新,如果把这些信息全部纳入到标准体系中,并且和数据标准建立映射,管理起来非常困难,很难真正实现落地。
    
    因此要实现数据标准落地,不能一味追求大而全,更多的是应该关注在众多数据中挑选出的核心数据,只管理这些核心数据定义,依照核心数据建立标准,就可以实现企业数据治理的目标,还能提升数据治理的效率。 
    
    其次,针对核心数据标准主题选择要多维度考虑。
    
    数据标准只会关注跟业务关联度高的,能够促进业务的规范管理的数据。因此,数据标准制定,选择标准主题很重要。
    
    在这里,我们通过业务影响度、系统关联度和可实施性等三个方面对各主题做分析,获取各数据主题建设的重要、紧迫程度。
    
    其中,
    
    1、针对业务影响度,可以通过组织集中讲解、面谈解答以及调查问卷等多种调研活动;获得主题涉及的问题数量、问题影响业务数量、问题影响业务的重要性;
    
    2、应用系统关联度,可以通过分析各部门关注次数、各系统和系统模块使用次数;并通过对应用系统功能梳理,提炼相关实体;以及对相关实体,进行数据主题归结,形成主题在系统中的分布情况;
    
    3、可实施分析,可以通过产品手册、各业务部门体系文件,获得主题定义和分类,以及信息项情况;分析获得数据差异性;获得数据定义不一致程度、业务规则整合难度。
    

    通过分析,每个主题关系的业务系统数量不同,业务关注程度也不同,可实施程度不同(差异量,技术等),最终形成主题选择分析图表。在这里每一个度量维度都有加权,通过评分确定实施优先级,例如其中评分在满分的50%以上的,作为本期实施的依据,最终选定实施范围。例如上面的产品、财务、机构、客户四个主题。

    图片描述

    第二条关键点:数据标准要包括技术与业务两种属性

    1、数据标准主要是针对业务,企业很多业务的语义十分依赖业务人员的人工梳理,难度大效率低,很可能出现因为梳理人员没有及时梳理,而造成业务语义难以被及时发现和管理的问题。

    未来企业将会面临数字化转型,从非结构化的文档中,将大部分业务语义抽取出来,并统一管理,成为未来的发展趋势,这种能力可以通过自然语言分析技术来实现,企业可以通过综合多个材料中对同一业务的描述,分析出最新与最广泛认可的业务定义,由业务人员确认之后,识别出业务语义,这样大大减少了业务人员的工作量,提升了业务人员梳理业务语义的积极性。

    2、在企业数据治理中,任何一个数据标准,如果没有对应的技术手段,都将难以落地,所以企业建立数据标准时,需要加入信息项的英文名称,来和实际数据库表中的字段相对应。

    在数据标准中加入信息项的英文名称能给企业数据治理带来两方面的好处:

    在做模型设计的时候,标准可以直接与模型设计工具集成,设计模型时就可以直接引用标准。
    
    对已有系统,标准能够通过英文名称直接和应用系统的相关字段对应,自动发现与不符合标准的字段,并通过元数据直接通知给相应的系统。
    

    3、标准中有了技术和业务信息,还需要有效的关联才能发挥效用。对于企业数据管理来说,技术能弄懂业务的前提是技术与业务之间要有对应,这种对应不能靠大量的人工梳理完成,否则业务部门负担很重,积极性不高。需要能够通过技术手段,利用数据治理工具提供商的行业实践积累,形成业务与技术的自动关联库,自动完成业务与技术对应,将能大大减少业务人员的工作量,同时提升技术与业务关联的准确度,消除业务与技术之间的鸿沟。

    图片描述

    第三条关键点:数据标准要持续更新

    对于企业数据治理来说,有很多数据标准建立以后,往往只是一套书,没有根据企业业务发展及时做出更新,时间长了就成为了摆设,实际上,数据标准是需要随着企业的业务变化而不断进行修订的,比如在企业拓展新业务的时候,需要增加相应的标准进去,对于没有价值的标准,也要及时废弃。只有这样,才能保证数据标准一直能适应业务发展需要,促进标准落地。

    三、数据标准实施案例

    图片描述

    一般企业数据标准建设完,只停留在册子和书本上,缺乏落地手段,不能有效执行;另外,针对数据标准本身缺乏管理,不能有效适应新业务发展。

    某银行数据管理建设思路侧重于事前预防,将各领域数据管理的要求融入到系统研发当中,从需求编写和需求分析等数据产生源头进行管理。严格按照数据标准进行需求编写,结合数据质量管理、元数据管理串联整个软件生命周期。同时在这个过程中,不断的验证和修订数据标准,使得数据标准一直能够适应新业务的发展需要。

    通过项目实施:

    借助技术手段实现了数据标准的实施落地。在需求、开发、上线等各阶段都会有数标检查,实现全生命周期数据管控;
    
    通过系统管理,推进了数标的持续更新,保持了数据标准生命力。
    

    普元云计算专区:http://primeton.csdn.net/m/zone/primeton/index#

    普元公众号:

    图片描述

    展开全文
  • 国家标准代号格式

    千次阅读 2014-10-28 22:57:31
    //=====================国家标准代号==========================// (1)、强制性国家标准:GB XXXXX - XXXX (2)、推荐性国家标准:GB/T XXXXX - XXXX (3)、强制性行业标准编号:XX XXXX - XXXX (4)、推荐性行业...
    //=====================国家标准代号==========================//
    (1)、强制性国家标准:GB XXXXX - XXXX
    (2)、推荐性国家标准:GB/T XXXXX - XXXX
    (3)、强制性行业标准编号:XX XXXX - XXXX
    (4)、推荐性行业标准编号:XX/T XXXX - XXXX
    (5)、强制性地方标准编号:DBXX XXX - XXXX
    (6)、推荐性地方标准编号:DBXX/T XXX - XXXX
    (7)、企业标准的编号:Q/XXX XXX - XXXX
    展开全文
  • Go语言邮件发送 QQ邮箱发送 QQ企业邮箱 163邮箱等...请务必下载代码包时间戳转换配置邮件发送基础信息发送邮件的内容完整代码 请务必下载代码包 查看源码地址 命令行安装: go get github.com/Gre-Z/common 邮箱...

    支持将 time.Time(time.Now())格式的数据编码转换标准显示格式
    支持将 整形时间戳(1603758504)的数据编码转换标准显示格式

    源码地址

    命令行安装:

    go get https://github.com/go-creed/common
    

    测试用例地址

    https://github.com/go-creed/common/tree/main/jtime
    

    Jtime

    jtime.Init

    models:

    type Int struct {
        CreatedAt jtime.Int `gorm:"comment:'创建时间';type:bigint not null;" json:"created_at"`
        Id        int       `json:"id"`
    }
    

    data:

    [{1603765784 1} {1603765900 4} {1603765907 5} {1603765933 6} {1603767542 7}]
    

    show:

    [{"created_at":"2020-10-27 10:29:44","id":1},{"created_at":"2020-10-27 10:31:40","id":4},{"created_at":"2020-10-27 10:31:47","id":5},{"created_at":"2020-10-27 10:32:13","id":6},{"created_at":"2020-10-27 10:59:02","id":7}]
    

    jtime.Time

    models:

    type Time struct {
        CreatedAt jtime.Time `gorm:"comment:'创建时间';type:timestamp not null;default:current_timestamp" json:"created_at"`
        Id        int        `json:"id"`
    }
    

    data:

    [{{0 63739362983 <nil>} 1} {{0 63739363002 <nil>} 2} {{0 63739363026 <nil>} 3} {{0 63739363146 <nil>} 4} {{0 63739363383 <nil>} 5} {{0 63739364434 <nil>} 6} {{0 63739364464 <nil>} 7}]
    

    show:

    [{"created_at":"2020-10-27 02:36:23","id":1},{"created_at":"2020-10-27 02:36:42","id":2},{"created_at":"2020-10-27 02:37:06","id":3},{"created_at":"2020-10-27 02:39:06","id":4},{"created_at":"2020-10-27 02:43:03","id":5},{"created_at":"2020-10-27 03:00:34","id":6},{"created_at":"2020-10-27 03:01:04","id":7}]
    
    展开全文
  • 基于Neo4j的外贸企业关系图谱做企业相似度查询一、外贸企业关系图谱的构建1.从Oracle导出数据2.导入数据到Neo4j3.Neo4j数据展示二、用Cypher做企业关联查询1.多层关系查询2.基于邻居信息的Jaccard相似度计算3.加权...

    一、外贸企业关系图谱的构建

    说来惭愧,本科、研究生期间还没写过博客,正巧最近在写论文,想结合自己开发的项目来构思,于是就通过这篇博客记录一下使用Neo4j图数据库来做企业相似度查询的过程,方便以后参考。
    这次外贸企业关系图谱的构建用到以前项目中测试库(Oracle)的数据,导入成csv格式后,再通过python的py2neo导入到neo4j中。
    -----------由于数据涉及项目的私密信息,暂时就不分享出来了------------

    1.从Oracle导出数据

    该表在Oracle数据库中的部分结构如下:
    在这里插入图片描述
    目前数据库中的外贸企业数据约30多万条,经过两轮的数据清洗和过滤,我选出了约12万条数据导出,并保存为csv格式。

    2.导入数据到Neo4j

    Neo4j有自己的csv导入工具,还可以通过cypher语句导入csv格式的数据,但是这里我使用的是pyhon的py2neo库来完成数据的导入。
    编写的python代码结构如下:
    在这里插入图片描述
    下面介绍每个函数的详细代码实现:

    '''初始化,用于连接到Neo4j'''
    def __init__(self, data):
        self.data = data
        self.g = Graph(
            host="127.0.0.1",  # neo4j 搭载服务器的ip地址
            http_port=7474,  # neo4j 服务器监听的端口号
            user="neo4j",  # 数据库user name
            password="112233") # 密码
    
    '''读取文件'''
    def read_nodes(self):
        # 共5类节点
        enterprise = self.data['COMP_NAME_CH']  # 企业
        region = set(self.data['PROVINCE_CH'])  # 地区
        if (np.nan in region):
            region.remove(np.nan)
        country = []  # 出口国家
        for index, row in self.data.iterrows():
            for r in row['EXPORT_COUNTRY_MXT'].split(','):
                country.append(r)
        # 企业类型:1-manufacture-生产型、2-trader-贸易型(贸信通)3-服务型
        enterprise_type = ['生产型', '贸易型', '服务型']  # 企业类型
        legal_representative = self.data['LEGAL_REPRESENTATIVE']  # 法人代表
    
        # 构建节点实体关系
        rels_region = []  # 企业-地区关系 locate
        rels_country = []  # 企业-出口国家关系 export
        rels_type = []  # 企业-企业类型关系 type
        # rels_product = [] # 企业-产品关系 product
        rels_legal = []  # 企业-法人代表关系 legal
        for index, row in self.data.iterrows():
            if (row['PROVINCE_CH'] is not np.nan):
                rels_region.append([row['COMP_NAME_CH'], row['PROVINCE_CH']])
            for r in row['EXPORT_COUNTRY_MXT'].split(','):
                # 一个企业有多个出口国家
                rels_country.append([row['COMP_NAME_CH'], r])
            rels_type.append([row['COMP_NAME_CH'], '生产型' if row['COMP_TYPE'] == 1\
                else ('服务型' if row['COMP_TYPE'] == 2 else '贸易型')])
            rels_legal.append([row['COMP_NAME_CH'], row['LEGAL_REPRESENTATIVE']])
    
        return set(enterprise), set(region), set(country), set(enterprise_type), set(legal_representative), \
               rels_region, rels_country, rels_type, rels_legal
    
    '''建立单标签节点'''
    def create_node(self, label, nodes):
        count = 0
        for node_name in nodes:
            node = Node(label, name=node_name)
            self.g.create(node)
            count += 1
            print(count, len(nodes))
        return
    
    '''创建知识图谱外贸企业的节点'''
    def create_enterprise_nodes(self):
        count = 0
        for index, row in self.data.iterrows():
            node = Node("Enterprise", name=row['COMP_NAME_CH'], credit_code=row['CREDIT_CODE'],
                        setup_time=row['SETUP_TIME'], address=row['ADDRESS_CH'],
                        captial=str(row['REG_CAPITAL']) + '万人民币')
            self.g.create(node)
            count += 1
            print(count)
        return
    
    '''创建实体关联边'''
    def create_relationship(self, start_node, end_node, edges, rel_type, rel_name):
        count = 0
        # 去重处理
        set_edges = []
        for edge in edges:
            set_edges.append('###'.join(edge))
        all = len(set(set_edges))
        for edge in set(set_edges):
            edge = edge.split('###')
            p = edge[0]
            q = edge[1]
            query = "match(p:%s),(q:%s) where p.name='%s'and q.name='%s' create (p)-[rel:%s{name:'%s'}]->(q)" % (
                start_node, end_node, p, q, rel_type, rel_name)
            try:
                self.g.run(query)
                count += 1
                print(rel_type, count, all)
            except Exception as e:
                print(e)
        return
    
    '''创建知识图谱实体节点类型schema'''
    def create_graphnodes(self):
        # 获取所有节点和关系
        Enterprises, Regions, Countries, Enterprise_types, Legal_representatives, \
        rels_region, rels_country, rels_type, rels_legal = self.read_nodes()
        # 创建图数据库节点
        self.create_enterprise_nodes() # 企业
        self.create_node('Region', Regions) # 地区
        print('地区:' + str(len(Regions)))
        self.create_node('Country', Countries) # 出口国家
        print('出口国家:' + str(len(Countries)))
        self.create_node('Type', Enterprise_types)  #企业类型
        print('企业类型:' + str(len(Enterprise_types)))
        # 暂不需要使用该节点和关系
        # self.create_node('Legal', Legal_representatives) # 法人代表
        # print('法人代表:' + len(Legal_representatives))
        return
    
    '''创建实体关系边'''
    def create_graphrels(self):
        # 获取所有关系组
        Enterprises, Regions, Countries, Enterprise_types, Legal_representatives, \
        rels_region, rels_country, rels_type, rels_legal = self.read_nodes()
        self.create_relationship('Enterprise', 'Region', rels_region, 'locate', '所在地区')
        self.create_relationship('Enterprise', 'Country', rels_country, 'export', '出口')
        self.create_relationship('Enterprise', 'Type', rels_type, 'type', '类型')
        # 暂不需要导入该关系
        # self.create_relationship('Enterprise', 'Legal', rels_legal, 'legal', '法人')
    

    最后是main函数:

    if __name__ == '__main__':
        # 获取当前路径,并转换为正确格式
        cur_dir = '/'.join(os.path.abspath(__file__).split('\\')[:-1])
        data_path = cur_dir + '/TB_ENTERPRISEINFO_FUSE_BAK.csv'
        print('read_csv from:' + data_path)
        data = pd.read_csv(data_path)
        # 创建实例
        handler = EnterpriseGragh(data)
        # 构建企业图谱的节点和关系
        handler.create_graphnodes()
        handler.create_graphrels()
    

    3.Neo4j数据展示

    大约运行了20多小时,终于成功在Neo4j构建好了外贸企业关系图谱,感觉应该是自己在代码优化上可能没有做好=_=||,如果使用Neo4j自带的工具感觉会快上不少。
    数据库信息以及查询效果如下图所示:(一共4类节点,3种关系)
    在这里插入图片描述

    二、用Cypher做企业关联查询

    简单查询就不打上来了,感觉有一定参考意义有以下几种查询,可以找到和查询企业关联度最高的企业,作为查询结果。

    1.多层关系查询

    由于该图数据的有向关系只有一层,所以查询时不能指定关系的方向,这里我们以‘陕西和沃进出口有限公司’为例,查询该企业的多层关系,查询结果如下图:
    在这里插入图片描述
    对应的Cypher查询语句如下:

    match p=(n:Enterprise{name:'陕西和沃进出口有限公司'})-[*2..3]-() return p limit 20
    

    2.基于邻居信息的Jaccard相似度计算

    以查询‘陕西和沃进出口有限公司’为例,根据企业的出口国家,计算企业之间的Jaccard相似度,作为相似度衡量标准。(由于Jaccard计算以出口国家关系为基准,所以结果与3.加权关联度得分计算得到的结果不同)
    Jaccard的计算公式参考如下:
    在这里插入图片描述
    根据计算公式,查询到的结果展示如下:
    在这里插入图片描述
    对应的Cypher查询语句如下:

    MATCH (n:Enterprise{name:'陕西和沃进出口有限公司'})-[:export]->(c:Country)<-[:export]-(other:Enterprise)
    with n,other,count(c) as intersection,collect(c.name) as collection
    match (n)-[:export]->(nc:Country)
    with n,other,intersection,collection,collect(nc.name) as s1
    match (other)-[:export]->(oc:Country)
    with n,other,intersection,collection,s1,collect(oc.name) as s2
    with n,other,intersection,s1,s2
    with n,other,intersection,s1+filter(x IN s2 where not x IN s1) as uni,s1,s2
    return n.name,other.name,s1,s2,((1.0*intersection)/SIZE(uni)) as jaccard
    order by jaccard DESC
    limit 20
    

    3.加权关联度得分计算

    以查询‘陕西和沃进出口有限公司’为例,找到和该企业有相同关系的节点,我们对三种关系企业类型、所在地区、出口国家(type、locate、export)进行加权求和并计算得分,以该得分作为企业相似度的评价标准,可以得到最相关的企业如下。
    在这里插入图片描述
    对应的Cypher查询语句如下:

    MATCH (n:Enterprise) where n.name='陕西和沃进出口有限公司'
    match (n)-[:type]->(t:Type)<-[:type]-(other:Enterprise)
    with n,other,count(t) as tn
    optional match (n)-[:locate]->(r:Region)<-[:locate]-(other)
    with n,other,tn,count(r) as rn
    optional match (n)-[:export]->(c:Country)<-[:export]-(other)
    with n,other,tn,rn,count(c) as cn
    return other.name as 推荐企业,tn as 相同企业类型,rn as 相同地区,cn as 相同出口国家,(3*tn)+(3*rn)+(1*cn) as score
    ORDER BY score DESC
    limit 100
    

    三、总结

    以上就是外贸企业关系图谱的构建+查询的整个流程,比较基础。

    个人认为可以应用和研究的方向:企业合作伙伴发现、相似企业推荐、投资风险预测、企业市场预测等场景。

    看起来像是那么回事奥,但是其实现在论文还没动笔。。。
    希望能尽早确定好论文方向,加油!!

    展开全文
  • Python开发企业标准环境搭建

    千人学习 2019-12-29 10:08:08
    报名须知 课程采取录播模式,课程永久有效,可无限次观看 课件、课程案例代码完全开放给你,你可以根据所学知识,自行修改、优化 如何开始学习? PC端:报名成功后可以直接进入课程学习 移动端:下载CSDN学院或CSDN
  • 超大气ASP标准企业网站源码 带后台生成静态源码完美
  • 软件著作权申报中60页标准代码文档的写作经验谈(1) 在申报著作权的工作中,都要提供软件的60页源代码。这是一种特殊要求的东西,它要求每页50行程序,并要求前30页是程序的前半部分有开头并连续,后30页是程序的...
  • VSCode 代码格式标准化插件

    千次阅读 2018-05-24 16:11:00
    2019独角兽企业重金招聘Python工程师标准>>> ...
  • 浅谈 标准代号和编号

    千次阅读 2012-04-30 17:47:34
    在谈标准化之前我们需要知道一些基本的定义比如说什么是标准化呢? 说的俗点就是满足了一定的规范和规程,说的专业点就是在经济、技术、科学及管理等社会实践中,以改进产品、过程和服务的适用性,防止贸易壁垒,...
  • Web快速开发:一套标准开发框架对企业有多重要   近十年,是中国互联网发展最为蓬勃的时期,互联网的快速发展颠覆了越来越多的传统行业,人们的生活随着互联网的发展,发生着天翻地覆的变化。 在这种互联网大潮...
  • 简介:代码托管产品是软件研发过程中的必备工具,不少企业在进行代码托管工具选型的时候会选择开源工具自建,然而,开源版本的代码管理工具往往只是提供了基础的代码仓储能力,无法满足企业在安全性、代码质量、权限...
  • SQL Server企业版/标准版/个人版的区别 ...--西部E网weste.net 2008-12-29 01:07分类:默认分类 字号: 大大 中中 小小 SQL Server企业版/标准版/个人版的
  • C#开发的管理系统,现在想嵌入腾讯企业邮箱,只有登录系统同时就登录腾讯企业邮箱,直接就可以查收信件,API都有 但是没弄过 找不到怎么加入代码??、 求高手指点 万分感谢! ----------腾讯提供的api部分代码...
  • 本课程是微信公众号支付的商业...系统对缴费时段,查询频率等进行严格控制,采用同步机制,确保支付安全稳定高效,采用jsp,springMVC,ajax,json,XML报文,SSLsocket,sqlserver数据库等。该项目已在20多个客户上线使用
  • 软件工程国家标准

    万次阅读 2018-03-09 17:35:55
    企业标准 1.2、标准的类型 强制性标准 推荐性标准 1.3、标准的表示 表1国家标准代号 序号 代号 含义 1 GB 中华人民共和国强制性国家标准 2 GB/T 中华人民共和国推荐性国家标准 3 GB...
  • 题目:企业发放的奖金根据利润提成。利润(I)低于或等于10万元时,奖金可提10%;利润高于10万元,低于20万元时,低于10万元的部分按10%提成,高于10万元的部分,可可提成7.5%;20万到40万之间时,高于20万元的部分,...
  • 什么是零代码开发平台,为什么企业IT应该重视?

    千次阅读 热门讨论 2019-09-23 11:41:48
    早在1992年,最早的零代码企业软件构建工具就出现在了微软的Office套件中,很多企业极客都记得那个叫做Access的数据库应用。只不过,当年的Access只是一个单机版的应用,数据共享依赖繁复的企业网络,而且它也只是...
  • Server 2005 迈出了巨大的一步,为世界上要求最为苛刻的企业系统提供了强大的支持。因为 SQL Server 是 Windows Server System 的一部分,通过 Windows Server System 产品中实现的通用工程策略可增强管理性和集成...
  • JavaFast是一款基于代码生成器的智能快速开发平台,可以帮助解决java项目中80%的重复工作,让开发者更多关注业务逻辑。...基于代码生成器的开发方式,可以将编码工作量减少80%以上,为企业开发节省人力成本
  • FreeEIM 企业即时通讯软件源代码2010年8月份最新版

    千次下载 热门讨论 2010-08-26 20:04:39
    FreeEIM 不同于传统的C/S 模式(Client/Server 结构)的软件,它采用最新的...界面清晰,操作简便是 FreeEIM 的设计重点之一,采用Win 32 GDI 标准控件,具有系统主题的特性。友好的界面让你使用起来更舒适,更简单。
  • http://www.jb51.net/html/200702/113/6776.htm对于新接触SQL数据库的...版本区别SQL Server 2000有四个版本:企业版/标准版/个人版/开发版企业版和标准版需要安装在服务器操作系统上,如Windows NT Server/Windows 20

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 390,364
精华内容 156,145
关键字:

企业标准代码如何查询