精华内容
下载资源
问答
  • 以专病真实世界研究为背景,分析了医疗数据治理和数据可用性存在的各种问题。从医院数据治理出发,延伸到区域数据治理、专科联盟数据治理以及医疗标注数据与知识型数据的治理,总结了不同层次、不同层面数据治理的...
  • 不少企业其实都面临着数据利用率低下的问题,企业日常运营80%的数据会被保存下来,但由于缺乏一个对海量数据进行深度挖掘的分析系统,90%的数据将会被浪费掉,最终用于日常分析数据可能只占10%。针对企业大量数据...

    在互联网大数据时代,各行各业都会收集各式各样的海量数据,但却不是每一个企业都知道如何利用数据创造价值。不少企业其实都面临着数据利用率低下的问题,企业日常运营80%的数据会被保存下来,但由于缺乏一个对海量数据进行深度挖掘的分析系统,90%的数据将会被浪费掉,最终用于日常分析的数据可能只占10%。

    针对企业大量数据储存与低下的数据处理能力产生的矛盾,一站式智能风控服务商天冕大数据实验室创造性提出无侵入式、可视化的大数据管理和分析解决方案,自主研发实时大数据处理平台(简称“天冕大数据平台”),聚焦数据难题,帮助合作伙伴秒级获取数据,智能挖掘数据价值。

    56f85dfec2c522e44704ddac3bf29c4f.png

    基于5年业务实操经验开发的实时大数据处理平台

    数据治理难是整个金融行业面临的问题,“科学规划运用大数据,加快完善数据治理机制”也在近日中国人民银行印发的《金融科技(FinTech)发展规划(2019-2021年)》中被提及。一个高效率、自动化、流程化、规范化、智能化的数据处理平台是不少企业迫在眉睫的需要,也是其迈向数字化的第一步。

    天冕大数据平台与其他大数据系统服务商最大的区别在于,其建立在天冕母公司WeLab中国区自营产品5年业务实操经验上开发,作为中国互联网金融第一批入局者,WeLab集团旗下C端产品已累计服务近4000万用户,利用实时大数据处理平台进行产品运营、风控、营销预测等多种支持,当中也根据业务人员需求和市场变化不断优化迭代,可以说是最懂运营者的大数据处理平台。

    天冕大数据平台具备实时全域数据获取速度快、处理数量大、处理能力强、全程在线可视化等特点。平台每天可处理来自5亿用户超过上百亿次的数据访问,近百台服务器支持万亿级数据实时计算,并支持超过10万位运营人员同时在线作业。在对接合作伙伴时支持一键私有化部署,无需改变企业现有业务和技术架构,迅速嫁接多种业务场景。

    展开全文
  • 由北京海创研发的金融业数据智能分析平台,通过嵌入 SpreadJS,实现...现阶段,金融IT行业已经开始推进数据治理的相关工作,虽然其IT系统相对健全,但由于数据量庞大、IT系统的数量众多,如果单纯从管理机制和人为因素

    由北京海创研发的金融业数据智能分析平台,通过嵌入 SpreadJS,实现了基于Web的数据采集、自助式报表设计与浏览、灵活查询、自主分析和数据预测等功能,简洁、易用,有效解决了用户数据填报、查询和分析需求,支持云部署及企业现场部署等多种方式。

    下面,让我们一起来看看北京海创是如何在“金融业数据智能分析平台”中应用表格技术,实现“数据填报”与数据钻取分析的。

    项目背景

    现阶段,金融IT行业已经开始推进数据治理的相关工作,虽然其IT系统相对健全,但由于数据量庞大、IT系统的数量众多,如果单纯从管理机制和人为因素出发,不依靠先进的技术手段和合适的产品支撑,则很难完成数据治理任务。

    北京海创基于长期在银行和保险等行业的经验积累,推出了一款自主研发的数据智能分析平台(Data Intelligence Platform),该平台在企业BI门户访问、元数据管理、KPI体系化、主数据管理、数据交换、数据处理、数据生命周期管理等方面进行了针对性的研发,既保证了数据质量,又借助灵活、强大的分析功能,有效提升了数据分析系统的使用体验,可以更好地挖掘和发挥数据的价值。

    40.png

    数据智能分析平台(DIP)的主要特点:

    · 基于浏览器WEB方式实现数据采集、自助式报表设计与浏览、灵活查询、自主分析和数据预测

    · 简洁、易用,有效解决了用户最后一公里的数据填报、数据查询和分析需求

    · 支持云部署及企业现场部署

    数据智能分析平台(DIP)中数据填报模块的特点和主要功能:

    · 嵌入 SpreadJS 后,可在线设计各类表单模板、在线填报数据、实现Excel导入导出、打印报送、实时预览、数据校验等功能

    · 提供三种模板设计方式:从零开始设计模板、查询主数据设计模板和使用系统提供的模板

    · 提供模板修改后对已填报数据的灵活迁移功能

    · 数据权限设置和自定义控制功能

    · 无缝衔接数据分析功能

    · 数据校验和审核功能

    数据智能分析平台(DIP)中数据分析模块的特点和主要功能:

    · 语义分析环境,完全自助分析

    · 基于 SpreadJS 在浏览器中实现了类Excel的拖拉式分析

    · 支持常见的表格、交叉表、图形、地图等方式的展现和钻取分析

    · 提供灵活的数据权限设置和控制

    · 可对分析结果二次分享

    项目截图

    1、数据智能分析平台的数据填报功能展示:

    41.png

    基于 SpreadJS 开发的模板设计器,在执行线上模板设计时,可以在当前模板上对需要采集的数据单元格设置映射,等审核通过后进行保存,数据会自动进入数据库中,此时,上级机构就可以实时对填报的数据进行聚合汇总统计。

    基于SpreadJS灵活的单元格映射机制,当前模板发生改动时,如果用户已经在原有旧模板上填报了数据,可以通过平台系统的一键迁移功能,将数据迁移至新的填报模板中。

    2、数据智能分析平台的数据查询功能展示**,以地图为例****:**

    42.png

    • 使用系统的拖拽或者批量映射业务对象至单元格,然后查询出所需数据;
    • 基于查询出的数据使用地图进行展现,先要对地图进行数据源映射:

    43.png

    • 下图为地图展示数据后的效果,更改单元格中的指标数据能实时在地图上体现出来:
      44.png

    • 双击省市名称对地图进行钻取操作:

    45.png

    • 按区域进行数据过滤,其它未选择的区域以灰色显示(也可以设置为隐藏):

    46.png

    • 区域的划分是随意的,可以根据业务分析的需要进行灵活组合;
    • 将当前结果导出到PowerPoint中,可实现如下效果,其中展示的表格和地图都不是静态的图片:

    47.png

    3、数据智能分析平台与****SpreadJS集成后的地图功能包括:

    • 内置全国31个省市/地市/区县地图,使用双击、单击钻取和切换功能,即可获取这些数据的钻取路径
    • 灵活添加和删除标注的功能(marker)
    • 地图颜色、边框颜色、告警区间均可自由设置
    • 可以对接GIS地图(如国内的高德地图、百度地图等)
    • 使用HTML5和JavaScript技术,没有其他依赖项目
    • 数据可以导出到PowerPoint中,地图中的省市、区县可以选择分别转换为形状(Shape)或是整体导出为图片

    表格技术带来的价值(选择表格控件 SpreadJS 的主要原因)

    1. 降低了产品使用门槛:市场上绝大部分数据分析工具对数据用户,尤其是一线业务用户和财务部门用户存在一定的使用门槛,需要培训和较长时间去学习适应,但基于SpreadJS研发的数据智能分析平台则不会存在这个问题,SpreadJS 具备了“与 Excel 高度兼容”的产品特性,可用来开发Web Excel的组件模块,实现如 Excel 般的数据分析和交互;
    2. 性能缺陷和数据质量问题一直是企事业单位信息化系统的通病,数据智能分析平台借助SpreadJS的高性能数据引擎和API进行二次扩展,很好的解决了以上问题。该平台操作简单,用户可灵活设计和维护数据采集模板,满足从源头控制数据质量的诉求;
    3. 随着企事业单位对数据价值认可度的提升,业务人员需要数据分析系统提供更高效的计算能力,嵌入了SpreadJS的数据智能分析平台,支持 450 多种 Excel 计算公式,可满足系统使用者自定义公式、跨表格引用等多场景下的计算需求。

    以上就是北京海创应用SpreadJS表格控件技术研发的“金融业数据智能分析平台”案例展示,如需查看 SpreadJS 的更多应用案例或需要了解 SpreadJS 的更多功能特性,欢迎访问SpreadJS 产品官网

    关于SpreadJS 纯前端表格控件

    SpreadJS 是一款基于 HTML5 的纯前端表格控件,兼容 450 种以上的 Excel 公式,具备“高性能、跨平台、与 Excel 高度兼容”的产品特性,备受华为、苏宁易购、天弘基金、远光软件等各领域龙头企业的青睐,并被中国软件行业协会认定为“中国优秀软件产品”。SpreadJS 可为用户带来亲切、易用的使用体验,并满足 Web Excel 组件开发、表格文档协同编辑、 数据填报、 类 Excel 报表设计等业务场景,可极大降低企业研发成本和项目交付风险。

    展开全文
  • 去年10月、11月的时候参加了DataFountain的面向数据安全治理数据内容智能发现与分级分类比赛https://www.datafountain.cn/competitions/471,最终获得了A榜第7、B榜第10的成绩。着这里记录一下此次比赛历程。 ...

    0.前言

    去年10月、11月的时候参加了DataFountain的面向数据安全治理的数据内容智能发现与分级分类比赛,最终获得了A榜第7、B榜第10的成绩。着这里记录一下此次比赛历程。

    github,欢迎star~

    1.赛题背景

    随着企业信息化水平的不断提高,数据共享与开放对企业发展的作用日益凸显,数据已成为重要生产要素之一,企业在产业与服务、营销支持、业务运营、风险管控、信息披露和分析决策等经营管理活动中涉及到大量的业务数据,其中可能会包含企业的商业秘密、工作秘密,以及员工的隐私信息等,若因为使用不当,造成数据泄露,则有可能造成巨大的经济损失,或在社会、法律、信用、品牌上对企业造成严重的不良影响。同时,在合规要求层面,围绕数据安全,国家近年密集颁布《网络安全法》、《民法典》、《数据安全法》(征求意见稿)、《个人信息保护法》(征求意见稿)等,从国家法律层面强调对关键基础设施、各类APP应用中的敏感数据保护要求。而为了有效、规范保护企业敏感数据,其首要问题是对数据进行分级分类,以识别敏感数据,从而进一步围绕保护对象的全生命周期进行开放、动态的数据安全治理,解决数据开放共享与数据隐私保护的矛盾与统一。
    现有的敏感数据识别与分级分类已广泛采用基于自然语言处理的语义识别技术,但会存在以下问题:
    1.需要有大批量、高质量的标注数据,花费大量的人力和时间,建设成本高。
    2.泛化能力不足,对新业务数据的适应能力弱,敏感数据的误报率和漏报率高。
    3.不能进行自我优化、自我学习,需要业务和技术领域专家共同进行人工干预,建设难度大。

    2.赛题任务

    识别样本中的敏感数据,构建基于敏感数据本体的分级分类模型,判断数据所属的类别以及级别。
    1.利用远程监督技术,基于小样本构建文档分类分级样本库。
    2.结合当下先进的深度学习和机器学习技术,利用已构建的样本库,提取文本语义特征,构建泛化能力强且能自我学习的文档分类分级模型。

    3.数据简介与说明

    (1)已标注数据:共7000篇文档,类别包含7类,分别为:财经、房产、家居、教育、科技、时尚、时政,每一类包含1000篇文档。
    (2)未标注数据:共33000篇文档。
    (3)分类分级测试数据:共20000篇文档,包含10个类别:财经、房产、家居、教育、科技、时尚、时政、游戏、娱乐、体育。

    本次大赛提供两份数据,已标注数据labeled_data.csv,未标注数据 unlabeled_data.csv,分类分级测试数据test_data.csv。
    (1)已标注数据 labeled_data.csv

    字段信息 类型 描述
    id String 数据ID
    class_label String 文本所属类别
    content String 文本内容

    (2)未标注数据unlabeled_data.csv

    字段信息 类型 描述
    id String 数据ID
    content String 文本内容

    (3)分类分级测试数据 test_data.csv

    字段信息 类型 描述
    id String 数据ID
    content String 文本内容

    (4)分级信息
    假设文档类别与文档级别有如下对应关系:

    文档类别 文档级别
    财经、时政 高风险
    房产、科技 中风险
    教育、时尚、游戏 低风险
    家居、体育、娱乐 可公开

    本次比赛不允许使用外部数据集~

    可以简单的理解为,此次比赛是一个文本分类问题;但是给的训练集有7类数据,测试集有10类数据,需要事先在未标注数据(共33000篇文档)中采用无监督的方法选取标签为另外3类的部分数据,加入到训练集中训练。

    4.无监督文本分类

    由于本次提供的训练集共7000篇文档,类别包含7类;首先需要在unlabled数据集中采用无监督的方法将另外3类(游戏、娱乐、体育)分出来;

    本文采用了LDA文本聚类算法,首先通过该算法将未标注33000篇文档聚为10类,然后从类别为游戏、娱乐、体育的数据中各随机出1000条,与原始数据组成10000条的训练集。

    5.方法介绍

    1. 句子长度选取

      由于本次数据文本为新闻内容,长度较长,而bert对于文本长度有所限制,考虑到新闻的关键信息常常集中在文首或文尾,所以采取截断的方式选取超长文本。

      if len(text) > 512:
          text = text[:256] + text[-256:]
      
    2. 模型尝试

      chinese_roberta_wwm_large_ext_pytorch模型跑分最高(模型较大,文本较长,吃GPU)。

    3. drouout选取

      在训练过程中,由于Bert后接了dropout层。为了加快模型的训练,我们使用multi-sample-dropout技术。通过对Bert后的dropout层进行多次sample,并对其多次输出的loss进行平均,增加了dropout层的稳定性,同时使得Bert后面的全连接层相较于前面的Bert部分能够得到更多的训练。

      dropout设置为0.9时效果最佳。

    4. 文本对抗(https://zhuanlan.zhihu.com/p/91269728)

      尝试了PGD和FGM,PGD最佳。

    5. loss权重

      通过比赛时发现,测试集中的类别基本平衡,所以根据分类结果,来调试loss的权重,使得分类结果保持基本平衡,这是本次比赛提分的一个关键。

      loss_fn = nn.CrossEntropyLoss(weight=torch.from_numpy(np.array(args.weight_list)).float())
      
    6. 模型融合

      通过对bert模型最后几层输出采用不同的方式组合构建多种模型,进行简单的投票融合。

      例如BertLastFourCls、BertLastFourEmbedding、BertRCNN、BertLastFourClsPooler、BertLastTwoEmbeddingsPooler等等,具体可参考代码。

    最终A榜成绩0.91007184 ,B榜0.91033015。

    6.使用的其他trick

    1. EDA文本增强技术(https://github.com/jasonwei20/eda_nlp)(无提升)。

    2. 采用半监督的思想,对测试集预测,并将预测结果与原有数据一起训练(无提升)。

    3. F1值优化(效果不稳定)

    4. 使用THUCnews进行模型预训练(后因主办方不允许使用外部数据放弃),单纯使用部分THUCnews做为训练集训练,对测试集进行预测得分只有0.5+。

      预训练参考(https://github.com/zhusleep/pytorch_chinese_lm_pretrain)

    7.前排大佬解决方案

    代更新~

    展开全文
  • 数字时代,智能为先一心既起,未来已来▼4月2日下午2点全球数据管理领导者Informatica正式宣布推出其新一代...创新功能速看↓↓↓Axon数据治理和数据市场这是行业第一个实现完全治理和自动化的数据市场,构建在Infor...

    数字时代,智能为先

    一心既起,未来已来

    4月2日下午2点

    全球数据管理领导者Informatica

    正式宣布推出其新一代智能数据平台

    内嵌Informatica CLAIRE 人工智能引擎

    拥有行业领先的智能化和自动化能力

    帮助企业加速云分析现代化

    提升客户体验

    本次重点发布的五大产品线创新功能

    五大产品线 创新功能速看

    ↓↓↓

    Axon数据治理和数据市场

    fca3246f3ff82c2cf4c4dba37e42fb4d.png

    这是行业第一个实现完全治理和自动化的数据市场,构建在Informatica智能数据平台之上,能够提供市场领先的数据治理、数据质量、数据隐私和元数据管理能力,帮助在整个企业中实现广泛的数据应用。新功能包括:

    数据工程团队可指定用于向数据消费者提供数据的一般选项,包括数据交付的方法、格式、位置、节奏,以及获取这些选项的安全限制。

    Data Collections对其所包含的数据集进行数据质量评分合计,并实时向数据消费者报告数据质量总体情况,以评估数据使用的恰当性。

    Axon Data Marketplace能够披露与Data Collections有关的安全性、隐私性和其他政策,便于数据消费者在确定数据的使用条款时理解政策背景。

    Axon Data Marketplace使数据所有者能够制定特定关联政策,以便在数据消费者申请流程中执行“可接受的使用条款”。

    集成至第三方ITSM中,以支持核心数据治理流程,捕捉处理Axon Data Marketplace中数据消费者访问请求的订单所需要的所有内容。订单和流程之间的操作关联可以供审计和报表使用。

    基于目录扫描结果自动为数据治理消费者发现和揭示血缘关系,并向利益相关者告知元数据变更,以确保业务和技术之间严格的治理监管。

    企业数据目录

    f2a35e4cb22eae2b6623fbe19e7c17e7.png

    作为行业第一个、也是唯一一个目录中的目录产品,Informatica Enterprise Data Catalog(企业数据目录,EDC)可综合企业的所有数据交付一个记录系统,它具有广泛的元数据连通性,可以在复杂的企业级系统中实现数据编目。Informatica EDC能够从复杂的企业级系统中提取出细微的元数据和端到端的数据血缘关系,通过元数据驱动的智能化和自动化在各个业务用例中提升数据的价值。新功能包括:

    推出更多新的元数据扫描器,适用于SAP BW和SAP BW/4HANA等分析应用,Apache Kafka等流处理平台,MongoDB等NoSQL数据库,Qlik Sense等BI工具,以及多个ETL工具。

    从复杂的企业级系统中提取出细微的数据血缘关系(如无黑盒),包括数据的详细转换。

    主数据管理

    ee90b66085bc016db1d23ee7961ecceb.png

    这个行业领先的模块化、端到端的主数据管理(MDM)解决方案,可提供智能、灵活和强大的多域现代化MDM和360解决方案,可以部署在本地和云端。Informatica MDM采用了Informatica CLAIRE人工智能引擎,拥有企业级统一元数据智能化能力,可以加快主数据管理并实现自动化,提供了一系列先进的功能,包括分级管理、主数据关系、AI / ML赋能的匹配调优、文件结构发现、文件映射和导入等,以管理整个数据价值链。Informatica可提供预构建的360解决方案,该解决方案利用Informatica MDM能力简化数据的管理和应用,特别提升了面向客户、产品和供应商数据的视图设计,能够实时为业务用户交付定制的场境洞察。新功能征包括:

    增强的分级管理和基于图形的关系导航。

    预配置的图表,以查看数据管护活动,实现从概要到细节的搜索和向下钻取。

    通过AI赋能的CLAIRE实现自我学习、匹配调优和规则建议。

    规模化管护,一键更新多份主数据记录,并以可视化的方式显示变更。

    基于工作流的协作和产品数据的动态数据模型创建,直观的图形显示,以发现所有产品之间的关系。

    云数据仓库和数据湖

    068de4629b227a26e413e04d34a51e71.png

    作为业界领先的全面云数据管理解决方案,拥有适用于云数据仓库和数据湖的大规模扩展、高性能无服务器能力。能够处理云生态系统间的新数据源和无数的目标应用;从数据库、文件和流处理源中摄取数据;可以实现实时分析和自助服务。新功能包括:

    云数据集成(CDI)和云数据集成-弹性(CDI-E)—— 实现了更动态、可扩展、灵活的数据集成,改进了对AWS的下拉支持,并与Operational Insights集成。云数据集成-弹性(CDI-E)支持分级数据类型,CLARE驱动Spark自动调优,轻松实现中流调试,增强Azure支持。推出CDI和CDI-E的无服务器运行时预览功能。

    云数据质量 —— 新功能包括解析和重名剔除,利用更多的数据清洗和数据验证功能增强数据剖析能力,同时实现了与Salesforce和微软通用数据模型(Microsoft Common Data Model)的连通。

    云批量摄取——针对这个统一集成的数据摄取服务提升了产品的可用性和弹性。加大对DevOps的支持,增强与GitHub的集成,以实现对流数据、文件和数据库的大规模摄取,增强与Databricks delta的连通性,支持文件、AWS Kenisis、ADLS Gen2(流),提升架构漂移支持等功能。

    CLAIRE赋能的数据工程管道建议,以及基于相似性、流数据血缘关系、数据准备清单建议的跨数据管道分类。提供下一个最佳转换建议,支持云数据集成-弹性源变换中的数据漂移,通过spark自动调优功能提出运行时的建议,能够在具有实时连接器的云数据集成、直通模式和非关系型输出中使用智能结构解析器。

    创新地利用区块链技术支持先进的数据工程用例,以及图像转换技术在金融服务、公共安全和医疗行业中的应用。

    iPaaS

    8f50b381a999d36086aec3d5880710fd.png

    Informatica创新型企业级现代iPaaS作为业内领先的技术产品,适用于多云混合环境,其自动化和智能化水平超越以往,包括云数据质量、云应用集成和API管理等新模式,通过CI / CD和GitHub团队集成更好地支持DevOps,拥有更多支持数据分析和云数据仓库计划的云原生能力。新功能包括:

    云数据集成(CDI)和云数据集成-弹性(CDI-E)——拥有更动态、可扩展、灵活的数据集成能力,改善对AWS的下拉支持,以及与Operational Insights的集成。云数据集成-弹性(CDI-E)支持分级数据类型,CLAIRE赋能的Spark自动调优,易于与中流调试,加大对Azure的支持。推出CDI和CDI-E的无服务器运行时预览功能。

    云数据质量——新功能包括解析和重名剔除,利用更多的数据清洗和数据验证功能增强数据剖析能力,适用于Salesforce和微软通用数据模型的CLAIRE赋能的数据质量规则建议。

    云应用集成和API管理——更易于调试的测试驱动型开发,使用数据库、JSON和XML内容类型,创建架构定义。改进API、流程的监测和管理,与Operational Insight连接。CLAIRE赋能的自动识别、阻断和记录包含PII敏感数据的API请求/应答。API网关目前可提供OAuth 2.0支持。

    先进的云数据管理——增强B2B网关的能力,如新合作伙伴门户、Drummond AS2互操作性认证和SFTP服务器支持,以及Reference 360的更新,如变更事件和Delta出口API、用户可见性安全性、改善大型数据集的性能和稳定性。

    多云/混合环境支持——扩大对云生态系统的覆盖,提高各种技术、系统和应用之间的连通性。

    CLAIRE人工智能引擎——提供下一个最佳转换建议,支持在云数据集成-弹性源转换中处理数据漂移,利用spark自动调优功能提出运行时建议,能够在具有实时连接器的云数据集成、直通模式和非关系型输出中使用智能结构解析器。

    平台——新增Github集成功能,能够在各种环境间导出/导入代理配置和调度对象。

    “数据驱动型企业需要智能的数据管理解决方案,以便更快速地实现其目标,应对如今的数据挑战,”Informatica首席执行官Amit Walia说。“Informatica通过行业领先的创新技术、元数据管理和AI赋能的自动化能力,帮助我们的客户实现数据驱动的数字化转型。”​​​​

    展开全文
  • 中国北京,2016年11月23日,可视化分析领导者 Qlik 和Forbes Insights 今天发布了来自全球调查商业智能突破进展:强大的数据治理如何成为实现更多可能性的重要因素,结果显示,商业智能正在为绝大多数接受调查的公司...
  • 上周参与了大数据筑基工程对现有数据平台的对标分析工作,各厂家要分析出自己平台的现状、差距以及要未来要改进的点,从而为筑基工程制定出接下来的行动计划。 通过分析,发现公司产品在数据清洗、数据质量以及数据...
  • 个推资深数据分析师 远见 ...本文将从三部分讲述个推数据治理数据治理概念解析、数据实践、常见问题分析。 01 什么是数据治理 讲具体概念前,我们先看一个生活中的例子。大家去超市...
  • 数据治理简单了解

    2020-12-07 15:25:11
    所有为提高数据质量而开展的业务、技术和管理活动都属于数据治理。从前端业务系统、后端业务数据库再到业务终端的数据分析,从源头到终端再回到源头,形成的一个闭环负反馈系统。 例如基于需求的智能制造、智慧市场...
  • 结合外部数据分析智能配电网中的大数据应用需求,对智能配电网的应用场景进行分析研究,对智能配网中数据的历史规律进行挖掘,从大数据技术的应用上为电力系统的服务提供保障,为业务的治理及优化提供决策支持。
  • 想系统地做BI智能可视化分析,BI顾问却建议先做数据治理?很多企业用户在咨询BI智能可视化分析时经常会遇到这种情况,那么,数据治理是否必要,是不是所有的数据可视化工具都能做数据治理?别的不清楚,但至少奥威BI...
  • 城市作为经济中心,在新时代到来之际,如何借助技术的力量,建立起新的治理架构,做到对城市...城市治理的目标不是获取大数据,而是对万物互联数据的整合、共享、开发、分析应用,达到用数据治理的目标。 二是当下有
  • 数据治理六要素

    2019-06-30 16:14:00
    帆软作为全球数据分析和商业智能平台提供商,这几年深刻的感受到了全球数据应用的热潮,但是随着越来越多的客户开始实施并广泛应用BI系统,数据治理的话题也在最近被越来越多地提及和讨论。 过去的十年,银行的IT...
  • 引言:近日,Gartner预测了2022年~2025年商业智能行业的发展趋势,阐明了现代分析与BI平台的15项关键功能领域。01Gartner简介1979 年成立的Gartner,是全球最权威性的IT研究咨询公司,研究的范围覆盖全部 IT 产业。在...
  • 数据治理中几个概念

    2019-06-20 22:12:28
    随着人工智能发展对数据的要求,在更大范围内整合数据,出现不少数据概念,对比之前概念,做简要总结分析。 1. 关系型数据库、数据仓库、数据集市 2. 数据湖、数据沼泽、数据河 3.... 4.数据治理、数据中台
  • 实验及分析结果表明,本文提出的方法比传统的数据标准构建方法在标准用语申请时间效率上具有明显的提升,特别是在大数据环境下,基于区块链智能合约的方法对时间效率提升更为明显,基于区块链的分布式存储等特性为...
  • 本篇文章汇总了国外2018年商业智能领域多份权威报告,将普遍受到认同的核心观点进行梳理,包含AI、移动BI、自助式BI、云部署、数据治理、增强型BI等多个方向,力求为读者呈现清晰的2019年商业智能蓝图。 2019年,...
  • 帆软作为全球数据分析和商业智能平台提供商,这几年深刻的感受到了全球数据应用的热潮,但是随着越来越多的客户开始实施并广泛应用BI系统,数据治理的话题也在最近被越来越多地提及和讨论。 过去的十年,银行的IT...
  • 本篇文章汇总了国外2018年商业智能领域多份权威报告,将普遍受到认同的核心观点进行梳理,包含AI、移动BI、自助式BI、云部署、数据治理、增强型BI等多个方向,力求为读者呈现清晰的2019年商业智能蓝图。 *文末附各...
  • 基于大数据分析的电信网络诈骗防范治理技术应用以数据挖掘 分析结果为驱动,整个过程包括“数据采集、数据处理、数据挖掘” 等多个环节。 在数据采集和处理层面,主要有三种数据来源:在企业自有系统 中沉淀的数据、...
  • 近年来,治理的职能不断扩大,然而,随着企业领导人开始意识到企业产生和存储的大量信息提供了一个现成的业务数据智能的资产。 信息治理专员则越来越多地被要求挖掘大数据分析,来寻找为公司创造收益的新方法,同时...
  • 帆软作为全球数据分析和商业智能平台提供商,这几年深刻的感受到了全球数据应用的热潮,但是随着越来越多的客户开始实施并广泛应用BI系统,数据治理的话题也在最近被越来越多地提及和讨论。 过去的十年,银行的IT...
  • 作者|个推CTO 安森 ...按照原先的规划,接下去的内容会涉及数据智能平台的数据治理、安全计算以及质量保障等方面。结合当前大环境,今天就数据的安全计算体系进行分析。 正文内容 目 录 ...
  • 3、主数据管理在大数据分析中的作用 4、大数据对主数据管理的挑战 三、基于云服务的主数据管理 1、云服务的定义和发展现状 2、主数据管理的云服务模式 3、主数据管理云服务平台的技术基础 4、云服务对企业主...
  • 智能电网数据资产的特征入手,结合电力行业特征、大数据研究方法和风险管理要素,为智能电网数据资产的风险识别与管理提出了数据治理、数据安全、供应链数据共享、客户信用风险控制以及智能电网稳健性建设等建议,...
  • 数据作为数字经济的核心生产要素,正成为经济转型和发展的新引擎,成为社会治理...如何在两者之间找到平衡,构建合理、有效的数据治理体系是一个重要的问题。 数字经济是新的经济形态,将重新定义原有生产方式和社会分
  • 数据分析平台实时采集、治理、存储、查询、展示数据,并搭载数据智能引擎,高效积累数据资产,赋能业务应用场景,助力企业构建扎实的数据根基,实现数字化经营。  数据其实是非常的客观的,但是数据本身并不会...
  • 蛋花花:人工智能治理的未来规划 。据蛋花花了解人工智能的影响普及全球,然而目前还没有任何实质的政策或措施去制定能使人工智能的潜力最大化并管理其风险的...人工智能的基石是数据,政府和企业在实际应用中所收集...

空空如也

空空如也

1 2 3 4 5 ... 15
收藏数 283
精华内容 113
关键字:

数据治理智能分析