精华内容
下载资源
问答
  • 可编程性2、计算机当前已应用于各种行业、各种领域,而计算机最早的26、计算机的应用范围很广,下列说法中正确的是______。辅设计是针对______。科学计算 助设计是用计算机进行产品设计和绘图3、计算机硬件系统的...

    1、一般认为,世界上第一台电子数字计算机诞生于______。194625、计算机的通用性使其可以求解不同的算术和逻辑问题,这年 1946 主要取决于计算机的______。可编程性

    2、计算机当前已应用于各种行业、各种领域,而计算机最早的26、计算机的应用范围很广,下列说法中正确的是______。辅设计是针对______。科学计算 助设计是用计算机进行产品设计和绘图

    3、计算机硬件系统的主要组成部件有五大部分,下列各项中不27、当前计算机的应用领域极为广泛,但其应用最早的领域是属于这五大部分的是______。软件 ______。科学计算

    4、计算机软件一般分为系统软件和应用软件两大类,不属于系28、最早设计计算机的目的是进行科学计算,其主要计算的问统软件的是______。客户管理系统 题面向于______。军事

    5、计算机系统中,最贴近硬件的系统软件是______。操作系统29 、计算机应用中最诱人、也是难度最大且目前研究最为活跃

    ______。人工智能 6、计算机内部用于处理数据和指令的编码是______。二进制码的领域之一是

    7、计算机程序设计语言中,可以直接被计算机识别并执行的是30、当前气象预报已广泛采用数值预报方法,这种预报方法会

    涉及计算机应用中的______。科学计算和数据处理 ______。机器语言

    8、二进制数10110001相对应的十进制数应是______。177 31、利用计算机对指纹进行识别、对图像和声音进行处理属于

    的应用领域是______。信息处理 9、计算机断电后,会使存储的数据丢失的存储器是______。RAM

    32、计算机最主要的工作特点是______。存储程序与自动控制 10、微型计算机中,微处理器芯片上集成的是______。控制器

    33、用来表示计算机辅助设计的英文缩写是______。CAD 和运算器

    11、计算机有多种技术指标,其中决定计算机的计算精度的是34、利用计算机来模仿人的高级思维活动称为______。人工智

    能 ______。字长

    12、保持微型计算机正常运行必不可少的输入输出设备是

    ______。键盘和显示器

    13、计算机中,信息的最小单位是______。位 35、计算机网络的目标是实现______。资源共享和信息传输 36、下列四项中,不属于多媒体所包括的媒体类型的是______。X光

    14、在微型计算机中,将数据送到软盘上,称为______。写盘 37、所谓的信息是指______。处理后的数据

    38、在下面的描述中,正确的是______。键盘是输入设备,显15、下列各项中,不是微型计算机的主要性能指标的是______。

    示器是输出设备 硬盘容量

    16、自计算机问世至今已经经历了四个时代,划分时代的主要39、一个完备的计算机系统应该包含计算机的______。硬件和

    软件 依据是计算机的______。构成元件

    17、世界上第一台电子数字计算机采用的逻辑元件是______。40、计算机系统由两大部分组成,它们是______。硬件系统和

    软件系统 电子管

    18、早期的计算机体积大、耗能高、速度慢,其主要原因是制41、构成计算机物理实体的部件被称为______。计算机硬件 约于______。元器件 42、组成计算机主机的主要是______。中央处理器和主存储器

    19、当前的计算机一般被认为是第四代计算机,它所采用的逻43、微型计算机的微处理器芯片上集成了______。控制器和运辑元件是______。大规模集成电路

    20、个人计算机属于______。微型计算机

    21、以下不属于数字计算机特点的是______。体积庞大

    22、计算机可以进行自动处理的基础是______。存储程序 算器 44、以下不属于外部设备是______。中央处理器和主存储器 45、下列对软件配置的叙述中不正确的是______。软件配置独立于硬件

    23、计算机进行数值计算时的高精确度主要决定于______。基46、下面各组设备中,同时包括了输入设备、输出设备和存储

    设备的是______。鼠标器、绘图仪、光盘 本字长

    24、计算机具有逻辑判断能力,主要取决于______。编制的软47、个人计算机(PC)必备的外部设备是______。显示器和键

    盘 件

    展开全文
  • 2019年电大计算机应用基础网考试题及答案1....第一代计算机,体积,耗电多,性能低,其主要原因是制约于 b 。A.工艺水平 B.元器件 C设计水平 D.原材料3. 世界上第一台电子数字计算机采用的电子器件是 d 。A...

    2019年电大计算机应用基础网考试题及答案

    1.一般认为,世界上第一台电子数字计算机诞生于 a 。

    A.1946 B.1952 C.1959 D.1962

    2.第一代计算机,体积大,耗电多,性能低,其主要原因是制约于 b 。

    A.工艺水平 B.元器件 C设计水平 D.原材料

    3. 世界上第一台电子数字计算机采用的电子器件是 d 。

    A.大规模集成电路 B 集成电路 C 晶体管 D 电子管

    4.第三代计算机采用的主要电子器件为____b_______。

    A.电子管 B.小规模集成电路 C.大规模集成电路 D.晶体管

    5.下列说法中,正确的一条是____b_______。

    A.任何存储器都有记忆能力,即其中的信息不会丢失

    B.控制器是计算机的指挥中心

    C.裸机是指没有配置任何外部设备的主机

    D.计算机内存不外存的存储速度慢

    6.运算器、控制器和寄存器属于______c_______。

    A.算术逻辑单元 B.主板 C.CPU D.累加器

    7.在微型计算机中,微处理器的主要功能是进行_____d______。

    A.算术运算 B.逻辑运算 C.算术和逻辑运算 D.算术和逻辑运算及全机的控制

    8.下列四项中不属于微型计算机的主要性能指标是____d_______。

    A.字长 B.主存容量 C.时钟脉冲 D.重量

    9.下列关于世界上第一台电子计算机ENIAC的叙述中,错误的是 c 。

    A、世界上第一台计算机是1946年在美国诞生的

    B、它主要采用电子管作为主要电子器件

    C、确定使用高级语言进行程序设计

    D、它主要用于弹道计算

    10.以下不属于电子数字计算机特点的是 d 。

    A、运算快速 B、计算精度高 C、体积硕大 D、通用性强

    11.计算机应用中最诱人、也是难度最大且目前研究最为活跃的领域之一是 a 。

    A、人工智能 B、信息处理 C、过程控制 D、辅助设计

    12.在计算机领域中,英文单词“byte”的含义是 c 。

    A、字 B、字长 C、字节 D、二进制位

    13.自计算机问世至今已经经历了四个时代,划分时代的主要依据是计算机的 d 。

    A、规模 B、功能 C、性能 D、构成元件

    14.“计算机能够进行逻辑判断,并根据逻辑运算的结果选择相应的处理。”该描述说明计算机具有 a 。

    A、自动控制能力 B、高速运算的能力

    C、记忆能力 D、逻辑判断能力

    15.在计算机内部,数据加工、处理和传送的形式是 a 。

    A、二进制码 B、八进制 C、十进制 D、十六进制

    16.在计算机程序设计语言中,可以直接被计算机识别并执行的是 a 。

    A、机器语言 B、汇编语言 C、算法语言 D、高级语言

    17.时至今日,计算机仍采用程序内存或称存储程序原理,原理的提出者是 b 。

    A、夏尔 B、比尔盖茨 C、冯.诺依曼 D、科博

    18.正常配置的计算机的内存储器比外存储器 c 。

    A、便宜 B、存储量大 C、存取速度快 D、虽贵但能存储更多的信息

    19.3.5英寸双面高密盘片的存储容量为 c 。

    - 2 -

    A、720KB B、1.2MB C、1.44MB D、2.8MB 20.微处理器是一块芯片上集成了 b 。

    A、控制器和存储器 B、控制器和运算器

    C、运算器和存储器 D、运算器、控制器和存储器

    21.电子计算机最主要的工作原理是 b 。

    A.高速度 B. 存储程序与程序控制 C.高精度 D. 记忆力强

    22.利用计算机来模仿人的高级思维活动称为 d 。

    A.数据处理 B. 自动控制 C.计算机辅助系统 D. 人工智能

    23.计算机内部用于处理数据和指令的编码是 b 。

    A.十进制码 B. 二进制码 C.ASCII码 D. 汉字编码

    24.假设给定一个十进制整数D,转换成对应的二进制整数B,那么就这两个数字的位数而言,B与D相比 c 。

    A、B的位数大于D B、D的位数大于B

    C、B的位数大于等于D D、D的位数大于等于B 25.汉字在计算机中的表示形式称为 b 。

    A、

    展开全文
  • 不过,当前的技术在执行特定类型任务方面取得了较成功,这些任务过去都依赖于人类智力。我们称这类人工智能为狭义人工智能或弱人工智能。弱人工智能主要指三种能力:学习、感知和认知。 ▲AI能力备忘单 上图...

    把所有这些认知能力融合到一台机器中,从而能够应对所有通用场景的人工智能称为通用人工智能。目前,通用人工智能还停留在理论阶段。

    不过,当前的技术在执行特定类型任务方面取得了较大成功,这些任务过去都依赖于人类智力。我们称这类人工智能为狭义人工智能或弱人工智能。弱人工智能主要指三种能力:学习、感知和认知。

    人工智能三大关键能力,终于有人讲明白了

    ▲AI能力备忘单

    上图概述了本文介绍的AI的核心能力。

    谈到AI的时候,客户们不停地在问:“这事儿成了吗?”在一个AI被过度炒作的世界,确实很难分清AI是幻想还是现实,是实际能力还是营销表演。

    所有这些能力在今天都是真实存在的。今天的AI是真实的,成千上万的公司正在使用AI进行业务转型。关注AI未来的可能性固然重要,但是你更需要了解现在的AI能做些什么。

    01 学习

    人工智能三大关键能力,终于有人讲明白了

    ▲学习——无显式编程的学习

    机器学习的首要特征就是随时间学习的能力,并且不需要明确编程。和人类一样,机器学习算法通过探索与实践学习,而不是遵循一步步的指令(当然我知道有些读者是小孩子的父母,有时候你们可不希望孩子们这样)。

    机器学习算法是按照学习方式分类的。当下最流行的、你的企业90%的时间可能都会采用的技术就是有监督学习。

    有监督学习使用包含输入和期望输出的数据集。通过迭代优化,学习算法可以找到一个函数,对输入如何转化为输出进行建模。这个模型会被应用于训练集外的新的输入,并预测对应的输出。

    找到正确的算法和参数,部分靠科学,部分靠创造力和直觉。如何将机器学习应用于这一过程本身就是个研究课题——这种技术称为自动化机器学习(AutoML)。

    有监督学习算法都有相同的缺陷:它们需要大量数据。而且不是任何数据都行,它们需要同时包含输入和对应输出的训练数据,也称之为标记数据。

    有时我们会有在记录系统或交互系统中存储的已经标记过的历史数据。例如,对于客户流失模型——我们可以查看流失客户的历史数据,加上客户的历史交互一起作为训练数据的输出部分。通过使用正确的算法,我们仅仅通过查看一系列的交互,就能够预测未来的客户流失情况。

    然而有时我们不会如此幸运,数据并不会被标记。无监督学习算法会处理一组没有标记的数据并找出其中的结构。聚类算法是无监督学习算法中最流行的一种,它通过不同的技术,在数据中找到共性并对其分组。你可能使用这种算法对你的客户群或网页访问者进行客户细分。

    其他常用的无监督学习算法有关联规则(定义数据间的关联,如购买某种特定产品的用户会对其他特定产品感兴趣)和异常检测(找出与主体数据不同的罕见或可疑部分数据)。

    在其他情况下,我们完全不使用训练数据。想想人们如何学会玩一款视频游戏。解决这个问题的有监督方法就是观看成千上万的游戏视频并从中学习。这是许多Youtube播主的商业模式,我的孩子们就看这种视频,但我发现这种方式极度枯燥。

    一个更有趣的学习方法是实际上手玩这个游戏。在玩的过程中,如果我们做对了(比如得分)就会得到正向强化,如果我们做错了(比如被杀死)就会得到负向强化。强化学习算法就是这么做的:它们通过探索环境并强化正确的行为来学习机器学习的功能。

    强化学习由于其不需要数据的特性,成为商业上一种极其有前途的机器学习方式。它特别适合自动化系统——无论是移动的(如车辆、遥控飞机)还是静止的(如空调系统、电力系统)——同时也可以应用于复杂的业务流程。强化学习通常被认为是AI中最困难的学科。

    02 感知

    人工智能三大关键能力,终于有人讲明白了

    ▲感知——解释周边世界

    如果说有某个领域为人类所独有,那就是感知了。数十年来,我们尝试模仿人类的能力去感知周围的世界,却鲜有成功。理解一幅图画或将语音转文字的复杂度使其几乎无法用编程的方式实现——想象一下如何用一步步的指令来定义图片里的一匹马。

    机器学习算法更适合解决这类问题。然而,传统机器学习算法在处理感知任务时的准确性与人类能做到的程度相去甚远(我仍然记得在Windows Vista上给开发们演示语音识别功能的情景……这件事教我学会要做个更坚强的人!)。

    以图像分类为例。ImageNet是图像分类中最著名的挑战。自2010年起,全球的参与者提交他们的算法来创建最精准的模型。在竞赛初期(即2010年),能达到的较好的误差率约在25%左右。作为比较,同一数据集下人类对应的误差率约为5.1%。

    到了2012年,Alex Krizhevsky(一位来自多伦多大学的学生)提交了他的方案:一个包含8层名为AlexNet的神经网络。AlexNet击败了其他竞争对手,达到了15.3%的误差率—比仅次于他的竞争者低了10个点。

    在接下来的数年内,他引入的技术被持续改进并增加了更多层数,直到2014年,一个名为GoogLeNet的22层神经网络达到了6.7%的误差率。

    次年,一个来自微软研究院的团队提交了使用全新神经网络技术的作品,其神经网络的深度达到了超大的152层,误差率仅为3.57%,首次超过了人类的表现。

    深度学习永远地改变了计算机视觉。如今,这项技术实际上已经被用于计算机视觉的所有高精度场景,这使其成为企业中最常见的用例。以下是一些计算机视觉在当今的应用:

    • 为图像的内容分类(影像分类)
    • 识别一幅图像中的多个物体,并识别每个物体的边界(物体检测)
    • 识别图像中的场景或行为(如:工作场所的不安全情形,或零售商店的补货)
    • 检测人脸,识别身份,甚至辨识每张脸的情绪
    • 识别书写文本,包含手写体文本(光学字符识别)
    • 鉴别图像或视频里的攻击性行为

    研究员Harold Stolovitch和Erica Keeps在他们的书Telling Ain’t Training(ASTD出版社)中断言,我们获取的信息中,有83%来自视觉,次之是听觉,提供了11%的感觉输入。两者合起来占据了我们从外界获取信息的94%。毫无疑问,音频处理是人工智能关注的另一个较大领域,仅次于计算机视觉。

    相似的深度学习技术可以应用到音频信号上,帮助计算机识别声音。你可以利用这项能力区分鸟儿们的歌声,或通过风力涡轮机发出的声音来预测故障。

    不过人工智能在音频处理方面最激动人心的还是语音识别。用于语音识别的参照数据集被称为总机,它包含了约260小时的电话交谈录音。测量后人类的转录误差率为5.9%。该误差率在2016年被微软研究院设计的神经网络追平,并于1年后被其以5.1%的误差率击败。有史以来第一次,一台机器可以比人类自身更好地理解人类。

    这些突破不但让机器更懂我们,而且使得机器可以用自然的方式与我们沟通。2018年,Azure上线了基于深度学习开发的文字转语音服务,该服务能够合成出与真人无异的人声。

    这些能力的结合将实现计算机科学的法宝:全自然用户接口(NUI)。机器既可以看见和理解人类,又可以用自然语言与人类交流,这看起来就像是我们已经实现了科幻电影的幻想一样。不过,我们真的做到了吗?要与计算机进行真正有意义的交流,计算机不但要能转录我们说的话,还要能理解话里的意思。

    自然语言处理(NLP)是人工智能中从人类语言中分析、理解并提取含义的领域。NLP最常见的场景之一就是语言理解,语言理解是现代会话型人工智能体验(比如数字助理)的基础。

    当你向Siri、Alexa或Cortana询问天气时,系统首先将你的会话音频转换成文字,然后通过自然语言理解模型抽取出你的意图,然后将意图(如“获取天气”)映射到对应输出(在这个例子中,就是提供当地的天气信息)。

    NLP技术在过去几年中飞速发展。有些只能处理简单任务,比如情绪分析、关键字抽取或个体识别,有些则可以处理更复杂的任务,如文本归纳或翻译。2018年,微软的机器翻译团队首次在自动翻译方面达到人类水平——这是个极度复杂的任务,曾一度被认为是不可能实现的。

    自然语言理解最激动人心的应用之一便是机器阅读理解。2018年1月,来自微软亚洲研究院的团队使用斯坦福问答数据集(SQuAD)达到了人类的水平,该数据集由针对一组维基百科文章的问题所组成。实际上,有关这些文章的开放性问题,系统能够给出比人类更好的答案。许多公司为之做出了贡献,帮助它走得更远。

    尽管如此,这些系统仍然无法达到人类的抽象层次。在其核心,问答算法会搜索文本来寻找可以指向正确答案的线索。对于每个问题,系统都要搜索整个文本来匹配。人类也这么做(特别是当我们很匆忙时),但是当我们真正想理解一段文字时,我们会从中抽取知识,进行概括,并使其更易于理解。

    想象一段描述加利福尼亚的文字。人类会从这段文字中归纳出“加利福尼亚”这个实体并给它赋予属性(如人口、面积),甚至与其他实体的关系(如邻州、地方长官)。归纳后,我们不再需要那段文字来回答关于加利福尼亚的问题。我们已经概括了有关的知识。

    人工智能中与此过程对应的是知识抽取,其对企业有着深远的意义。通过使用这些技术,我们可以从混沌、无序,甚至令人困惑的信息中抽取高阶概念。结果知识图不但能用于回答关于整个数据产业的宽泛问题,还能浏览和理解这些信息。

    这种水平的抽象远远超出了传统NLP的能力范围,使其更接近我们所说的认知。

    03 认知

    人工智能三大关键能力,终于有人讲明白了

    ▲认知——基于数据进行推理

    严格来说,认知是获取和处理知识的能力。它包含人脑用于推理、理解、解决问题、计划和决策的高层次概念。

    我们目前探索的技术包含了一定程度的认知,虽然有时不那么明显。以图像分类为例,如果我们仔细审视用于图像分类的深度神经网络,实际上就可以看出神经网络是如何在每一层将问题分解成更小的步骤的。

    没有人工干预,神经网络自动展示了某种程度的概括:第一层检测简单的特性,如边缘或纹理。往更深层走,每一层都能够抽取更复杂的属性,如图案或元素。某种意义上,神经网络已经可以获取一些知识并使用这些知识做一些基础推理。

    自然语言处理展示了类似的内在抽象。在其核心,大部分现代的NLP技术都使用了被称为词嵌入的技术。通过词嵌入技术,文本中的每个词都转换为一个代表单词含义的向量。在这个新的空间,语义相似的词(如“天气”和“预报”)彼此接近。

    通过这种方式,系统会将“今天天气如何?”和“获取未来24小时的预报”匹配为相同的意图。即使词不同,它们的含义却是相似的,因为它们的语义相近。翻译也是相同的工作原理:翻译技术使用词嵌入来抽象输入的文本,将其转换为与语言无关的“想法”,再用反向流程将其翻译为任意一种语言。

    在这些例子中,认知是感知的内在。然而,许多人工智能场景是单纯的认知。它们不专注于感知周围的世界,而是专注于抽象这个世界并基于抽象进行推理。一些最基础的有监督学习方法便是如此。回归分析是根据现有信息预测数值的能力,例如基于房屋的特征和位置评估其价值,或根据历史数据预估其销售额。

    分类是根据物品自身特征对其分级或分类的能力,例如,判断一栋房屋是不是会被出售给某个特定的买家。优化算法则是基于流程进行推论,从而最大化某个特定的结果,比如在医院里分配资源。

    推荐系统仅通过评分或购买习惯就能够找出电影、书籍或歌曲等物品间不为人知的共性。其他技术,如前所述,如聚类分析能找出数据中的模式,并以无监督方式对物品归类。

    我们在强化学习技术中也能看到认知能力。2017年,蒙特利尔微软研究院(前马鲁巴岛)跨越了100万分大关,创造了吃豆人游戏的新纪录。该系统通过玩成千上万把游戏来实现自我训练。

    同样地,在2018年,OpenAI Five(一个由五个神经网络组成的团队)在Dota2游戏中打败了人类队伍。OpenAI Five通过自我对战进行训练,每天的训练量相当于180年游戏时长。

    最著名的例子应该是由Google DeepMind取得的成就:其系统AlphaGo第一次击败了一位9段围棋专业选手。相对于其他游戏(如象棋),围棋被认为是对电脑来说更为困难的游戏。

    深入观察所有AI系统参与的游戏,你会觉得它们展现出了认知的另外一种特征——计划。系统能够提前“思考”最佳的方式来获得长期看来最大化的分数。

    展开全文
  • 详解数据治理九核心领域

    千次阅读 2021-07-27 00:30:49
    这些日益复杂的内外因决定了银行业对数据治理的超高标准要求,而目前对应的经验能力却稍显薄弱。 数据治理不仅需要完善的保障机制,还需要理解具体的治理内容,比如数据该怎么进行规范,元数据又该怎么来管理,每个...

    01 前言

    股份制改革对银行业来说只是一个开始,企业在风险管理、创造价值等方面还有很长的路要走。风险管理要求提供精准的数据模型、创造价值要求充分银行数据资产,这是数据治理的外部推动因素。此外,随着第三次工业革命的到来,银行业也需要进入定制化时代,以更低的成本,生产多样化的金融产品,从而满足不同顾客的不同需求。

    对数据本身而言,业务发展加快了数据膨胀的速度,也带来了数据不一致等问题,业务部门的频繁增加和剥离同样会对数据治理提出挑战。

    这些日益复杂的内外因决定了银行业对数据治理的超高标准要求,而目前对应的经验能力却稍显薄弱。

    数据治理不仅需要完善的保障机制,还需要理解具体的治理内容,比如数据该怎么进行规范,元数据又该怎么来管理,每个过程需要哪些系统或者工具来进行配合呢?这些问题都是数据治理过程中最实际的问题,也是最复杂的问题,下面将从数据治理的各个核心领域来解答这些问题。

    02 银行数据治理核心领域

    每个数据治理的领域都可作为一个独立方向进行研究治理,目前总结的数据治理领域包括但不限于以下内容:数据标准、元数据、数据模型、数据分布、数据存储、数据交换、数据生命周期管理、数据质量、数据安全以及数据共享服务。

    同时各领域之间需要有机结合,如数据标准、元数据、数据质量等几个领域相互协同和依赖:

    • 通过数据标准的管理,可以提升数据合法性、合规性,进一步提升数据质量,减少数据生产问题。

    • 在元数据管理的基础上,可进行数据生命周期管理,有效控制在线数据规模,提高生产数据访问效率,减少系统资源浪费。

    • 通过元数据和数据模型管理,将表、文件等数据资源按主题进行分类,可明确当事人、产品、协议等相关数据的主数据源归属、数据分布情况,有效实施数据分布的规划和治理。

    数据治理领域是随着银行业务发展而不断变化的,领域之间的关系也需要不断深入挖掘和分布,最终形成一个相互协同与验证的领域网,全方位的提升数据治理成效。

    03 数据治理九大核心领域

    1.数据模型

    数据模型是数据治理中的重要部分,合适、合理、合规的数据模型,能够有效提高数据的合理分布和使用,它包括概念模型、逻辑数据模型和物理数据模型,是数据治理的关键、重点。数据模型包含三个部分,数据结构、数据操作、数据约束。

    • 数据结构。数据模型中的数据结构主要用来描述数据的类型、内容、性质以及数据间的联系等。数据结构是数据模型的基础,数据操作和数据约束都基本是建立在数据结构的之上的。不同的数据结构有不同的操作和约束。

    • 数据操作。数据模型中的数据操作主要用来描述在相应的数据结构上的操作类型和操作方式。

    • 数据约束。数据模型中的数据约束主要用来描述数据结构内数据间的语法、词义联系、他们之间的制约和依存关系,以及数据动态变化的规则,以保证数据的正确、有效和相容。

    2.元数据管理

    元数据分为业务元数据、技术元数据和操作元数据,三者之间关系紧密。业务元数据指导技术元数据,技术元数据以业务元数据为参考进行设计,操作元数据为两者的管理提供支撑。

    (1)业务元数据。业务元数据是定义和业务相关数据的信息,用于辅助定位、理解及访问业务信息。

    业务元数据的范围主要包括:业务指标、业务规则、数据质量规则、专业术语、数据标准、概念数据模型、实体/属性、逻辑数据模型等。

    (2)技术元数据。它可以分成结构性技术元数据和关联性技术元数据。结构性技术元数据提供了在信息技术的基础架构中对数据的说明,如数据的存放位置、数据的存储类型、数据的血缘关系等。关联性技术元数据描述了数据之间的关联和数据在信息技术环境之中的流转情况。

    技术元数据的范围主要包括:技术规则(计算/统计/转换/汇总)、数据质量规则技术描述、字段、衍生字段、事实/维度、统计指标、表/视图/文件/接口、报表/多维分析、数据库/视图组/文件组/接口组、源代码/程序、系统、软件、硬件等。技术元数据一般以已有的业务元数据作为参考设计的。

    (3)操作元数据。操作元数据主要指与元数据管理相关的组织、岗位、职责、流程,以及系统日常运行产生的操作数据。

    操作元数据管理的内容主要包括:与元数据管理相关的组织、岗位、职责、流程、项目、版本,以及系统生产运行中的操作记录,如运行记录、应用程序、运行作业。

    3.数据标准

    数据标准是银行建立的一套符合自身实际,涵盖定义、操作、应用多层次数据的标准化体系,它包括基础标准和指标标准(或称应用标准)。与数据治理其他核心领域具有一定的交叉,比如元数据标准、数据交换和传输标准、数据质量标准等。

    商业银行的数据标准一般以业界的标准为基础,如国家标准、监管机构(如国家统计局、中国人民银行、工信部)制定的标准,结合商业银行本身的实际情况对数据进行规范化,一般会包括格式、编码规则、字典值等内容。

    良好的数据标准体系有助于商业银行数据的共享、交互和应用,可以减少不同系统间数据转换的工作。数据标准的主要由业务定义、技术定义和管理信息三部分构成。

    数据标准的主题构成

    (1)业务定义。业务定义主要是明确标准所属的业务主题以及标准的业务概念,包括业务使用上的规则以及标准的相关来源等。对于代码类标准,还会进一步明确编码规则以及相关的代码内容,以达到定义统一、口径统一、名称统一、参照统一以及来源统一的目的,进而形成一套一致、规范、开放和共享的业务标准数据。

    (2)技术定义。技术定义是指描述数据类型、数据格式、数据长度以及来源系统等技术属性,从而能够对信息系统的建设和使用提供指导和约束。

    (3)管理信息。管理信息是指明确标准的所有者、管理人员、使用部门等内容,从而使数据标准的管理和维护工作有明确的责任主体,以保障数据标准能够持续的进行更新和改进。

    4.数据质量管理

    数据质量管理已经成为银行数据治理的有机组成部分。高质量的数据是商业银行进行分析决策、业务发展规划的重要基础,只有建立完整的数据质量体系,才能有效提升银行数据整体质量,从而更好的为客户服务,提供更为精准的决策分析数据。

    (1)制度和规范。从技术层面上,应该完整全面的定义数据质量的评估维度,包括完整性、时效性等,按照已定义的维度,在系统建设的各个阶段都应该根据标准进行数据质量检测和规范,及时进行治理,避免事后的清洗工作。

    数据质量评价维度

    (2)明确相应的管理流程。数据质量问题会发生在各个阶段,因此需要明确各个阶段的数据质量管理流程,例如:

    • 在需求和设计阶段就需要明确数据质量的规则定义,从而指导数据结构和程序逻辑的设计;

    • 在开发和测试阶段则需要对前面提到的规则进行验证,确保相应的规则能够生效;

    • 最后在投产后要有相应的检查,从而将数据质量问题尽可能消灭在萌芽状态。

    数据质量管理措施,宜采用控制增量、消灭存量的策略,有效控制增量,不断消除存量。

    数据质量管理流程

    5.数据生命周期管理

    任何事物都具有一定的生命周期,数据也不例外。从数据的产生、加工、使用乃至消亡都应该有一个科学的管理办法,将极少或者不再使用的数据从系统中剥离出来,并通过核实的存储设备进行保留,不仅能够提高系统的运行效率,更好的服务客户,还能大幅度减少因为数据长期保存带来的储存成本。

    数据生命周期一般包含在线阶段、归档阶段(有时还会进一步划分为在线归档阶段和离线归档阶段)、销毁阶段三大阶段,管理内容包括建立合理的数据类别,针对不同类别的数据制定各个阶段的保留时间、存储介质、清理规则和方式、注意事项等。

    数据生命周期中各参数间的关系

    从上图数据生命周期中各参数间的关系中我们可以了解到,数据生命周期管理可以使得高价值数据的查询效率大幅提升,而且高价格的存储介质的采购量也可以减少很多;但是随着数据的使用程度的下降,数据被逐渐归档,查询时间也慢慢的变长;最后随着数据的使用频率和价值基本没有了之后,就可以逐渐销毁了。

    6. 数据分布和存储

    数据分布和存储主要涵盖了数据如何划分和存储,总行系统以及总分行数据如何分布,主数据及参考数据(也称为副本数据或者辅数据)如何管理。只有对数据进行合理的分布和存储,才能有效的提高数据的共享程度,才能尽可能的减少数据冗余带来的存储成本。

    通常情况下,综合数据规模、使用频率、使用特性、服务时效等因素,从存储体系角度,可以将商业银行的数据存储划分为四类存储区域,即交易型数据区、集成型数据区、分析型数据区、历史型数据区。

    数据存储布局

    1)交易型数据区。交易型数据区包括渠道接入、交互控制、业务处理、决策支持与管理等各类联机应用数据;存储客户自助或与银行操作人员在业务交互办理过过程中产生的原始数据的存储,包括业务处理数据,内部管理数据和一些外部数据,其存储的是当前状态数据。

    2)集成型数据区。集成型数据区包括操作型数据(OLTP)和数据仓库型数据(OLAP)。

    3)分析型数据区。分析型数据主要是用于决策支持与管理的各类集市应用的数据。为了对业务执行情况进行深入分析,需要对原始数据进行进一步汇总统计分析,统计分析结果用于最终的决策展示,因此分析型数据区存储了这些统计、分析模型结构的指标数据。

    4)历史数据区。这里存储了所有近线应用、归档应用、外部审计数据平台应用等的数据,主要满足各种历史数据归档后的数据保管和数据查询服务。

    7.数据交换

    数据交换是银行进行数据交互和共享的基础,合理的数据交换体系有助于银行提高数据共享程度和数据流转时效。

    一般商业银行会对系统间数据的交换规则制定一些原则,比如对接口、文件的命名、内容进行明确,规范系统间、银行系统与外部机构间的数据交换规则,指导数据交换工作有序进行。

    建立统一的数据交换系统,一方面可以提高数据共享的时效性,另一方面也可以精确掌握数据的流向。

    8.数据安全

    商业银行的重要且敏感数据大部分集中在应用系统中,例如客户的联络信息、资产信息等,如果不慎泄露,不仅给客户带来损失,也会给商业银行带来不利的声誉影响,因此数据安全在数据管理和治理过程中是相当重要的。

    (1)数据存储安全。包括物理安全、系统安全存储数据的安全,主要通过安全硬件的采购来保障数据存储安全。

    (2)数据传输安全。包括数据的加密和数据网络安全控制,主要通过专业加密软件厂商进行规范设计和安装。

    (3)数据使用安全。需要加强从业务系统层面进行控制,防范非授权访问和下载打印客户数据信息;部署客户端安全控制工具,建立完善的客户端信息防泄漏机制,防范将客户端上存储的个人客户信息非授权传播;建立完善的数据安全管理体系,建立数据安全规范制度体系,组建数据安全管理组织机构,建立有效的数据安全审查机制;对于生产及研发测试过程中使用的各类敏感数据进行严密管理;严格与外单位合作中的个人客户信息安全管理等。

    9.数据服务

    数据的管理和治理是为了更好的利用数据,是数据应用的基础。

    银行应该以数据为根本,以业务为导向,通过对大数据的集中、整合、挖掘和共享,实现对多样化、海量数据的快速处理及价值挖掘,利用大数据技术支持产品快速创新,提升以客户为中心的精准营销和差异化客户服务能力,增强风险防控实时性、前瞻性和系统性,推动业务管理向信息化、精细化转型,全面支持信息化银行的建设。

    建立结构化数据处理分析平台。数据仓库建设能够实现企业异构数据的集成,企业按照分析主题重组数据,建立面向全行的一致的信息视图。下图是一个典型的银行数据仓库服务体系:

    银行典型的数据仓库服务体系

    数据资产视图。在建立了数据仓库之后,需要建立统一的分析和可视化平台,解决数据在哪里,数据怎么用的问题。一个典型的应用是建立全行统一客户视图,包含客户信息统一视图、客户信息风险视图和网点业绩视图。

    数据资产视图示例

    04 数据治理的展望

    数据治理不是一个临时性的运动,从银行业务发展、数据治理意识形成、数据治理体系运行的角度,需要一个长效机制来进行保证。 在大数据时代,经过数据治理的银行数据可以发挥更大的作用。

    1.利用大数据挖掘技术分析各类海量信息,发现市场热点与需求,实现产品创新服务

    可以将大数据应用到产品生命周期,深入挖掘客户需求,把握客户痛点,推动产品创新。利用大数据技术对社交网络信息、在线客户评论、博客、呼叫中心服务工单、用户体验反馈等信息进行深度挖掘和分析,充分洞察客户,分析客户的情绪,了解客户对产品的想法,获知客户需求的变化趋势,从而对现有产品进行及时的调整和创新,事情贴近客户的生活场景和使用习惯。

    基于大数据创新产品评价方法,为产品创新提供数据支撑。通过大数据分析,改变目前以规模、总量为主的业务评价方式,建立一整套完整的以质量、结构为主的全新的评价方式,以引导全行真正追求有质量、有效益的发展。

    2.加强内外部信息联动,重点利用外部信息提升银行风险防控能力

    进一步加强与税务、海关、法院、电力部门、水务部门、房产交易登记中心、环保部门以及第三方合作机构的数据互联共享,有效拓宽信息来源渠道,深度挖掘整合系统内外客户信息、关联关系、交易行为、交易习惯、上下游交易对手、资金周转频率等数据信息,利用大数据技术查找与分析不同数据变量间的关联关系,并建立相应的决策模型,提升银行风险防控能力。

    在信用风险方面,可以结合外部数据,完善信用风险防范体系,基于可视化分析有效防控信用风险的传导。引入大数据理念和技术,统一信用风险模型管理,构建覆盖信用风险训练、模型管理、日常预警、评分评级、客户信用视图以及业务联动控制的信贷大数据平台,建立多维度、全方位的缝隙安全预警体系。

    在市场风险方面,基于市场信息有效预测市场变动,基于大数据处理技术提升海量金融数据交易的定价能力,构建定价估值引擎批量网格计算服务模式,支持对海量交易的实时定价,有效提升银行风险管控与定价能力,为金融市场业务的发展提供有力支撑。

    在操作风险方面,依托大数据信息整合优势,有效防控操作风险。通过可视化技术,从业务网数据中发现识别风险线索,实现由“风险监控”向“业务监控”模式转变,提升风险的提前预警能力。加强跨专业风险监控模型的研发,通过由点带线、由线及面的矩阵式关联监控,提前识别风险交织趋势,防范风险传染。

    3.利用大数据技术提升经营管理水平,优化业务流程,实现精细化经营决策

    在经营决策方面,通过外部数据的补充和整理,实现经营分析外延的拓展,从市场和经营环境的高度分析各级机构的发展方向、竞争压力,制定更合理、更有效的经营策略。同时,应用大数据可视化技术,实现复杂分析过程和分析要素向用户的有效传递,增强分析结果说服力和指导性,向经营人员提供有力的信息支撑。

    在资源配置方面,依托大数据采集和计算能力,提升测算的敏感性和有效性,加强财务预测的可靠性和有效性,为总体资源配置提供更好的信息支撑,实现对具体资源配置的动态管理。

    在过程改进方面,优化业务流程,对交易、日志的专业挖掘,探索当前业务处理流程节点的瓶颈,寻求最有效的解决方案。比如通过分析客户从排队到等候完成全部交易的流程合理性,提出过程改进方法,提升网点整体运营效率和客户体验。

    在运维保障方面,基于流数据处理技术,搭建准实时的应用交易级监控平台,实现交易运行情况的即时监控,保障业务运行稳定高效。

    本文来源CSDN,作者数据工程师金牛

    世界的真实格局分析,地球人类社会底层运行原理

    不是你需要中台,而是一名合格的架构师(附各大厂中台建设PPT)

    企业IT技术架构规划方案

    论数字化转型——转什么,如何转?

    华为干部与人才发展手册(附PPT)

    企业10大管理流程图,数字化转型从业者必备!

    【中台实践】华为大数据中台架构分享.pdf

    华为的数字化转型方法论

    华为如何实施数字化转型(附PPT)

    超详细280页Docker实战文档!开放下载

    华为大数据解决方案(PPT)

    展开全文
  • 浅析 DDD 领域驱动设计

    千次阅读 多人点赞 2021-08-22 10:31:44
    最近公司一场有关于领域驱动设计的技术分享会,引起了我的注意,主要讲解了服务的划分,Restful API的设计,如何将抽象具有统一业务的范畴的Model,使其模块化,同时能够提炼组合多个模块,使得业务能够独立服务化,...
  • 通讯、感知与行动是现代人工智能的三个关键能力,在这里我们将根据这些能力/应用对这三个技术领域进行介绍: 计算机视觉(CV) 自然语言处理(NLP) 在 NLP 领域中,将覆盖文本挖掘/分类、机器翻译和语音识别。 机器人 ...
  • Affective Computing》等神经计算领域顶级期刊,可通过五大人格测评得分异常情况实现对个体抑郁、焦虑水平的评估。据了解,该团队与红杉被投企业博睿康科技有限公司合作,已经初步形成面向个体心理健康测评的软硬件...
  • | 背景底层计算机视觉技术,如图像增强、图像复原等,一直以来都是一个重要且热门的研究方向。传统的方法多基于稀疏编码、小波变换等技术,近年来,深度学习的兴起为该领域带来了新的发展机遇,同时...
  • DDD领域驱动设计

    2021-06-04 16:32:17
    DDD领域驱动设计1. 领域驱动设计1.1 什么是领域驱动设计1.2 为什么用领域驱动设计2. DDD核心知识体系2.1 DDD核心概念2.2 DDD战略战术设计2.2.1 DDD战略设计2.2.1 DDD战术设计3. DDD微服务架构模型3.1 基本架构3.1.1 ...
  • 最近,亚马逊资深首席科学家、AI牛李沐,根据自己年的工作过往,在知乎中发表了《工作年反思》一文。 短短2天时间,便狂揽了5600+“赞同”。 许多网友在读完此文后感慨道,“收获颇丰”、“又一次impress了我...
  • 超全!2021互联网大厂职级对应薪资一览表

    千次阅读 多人点赞 2021-01-18 08:49:04
    按华为《2015 年虚拟受限股分红预通知》,每股分红 1.95 元,升值 0.91 元,合计 2.86 元,工作年基本可达十级,饱和配股(包括 TUP)9 万股,分红 + 升值达 2.86*9 万 =25.74 万元,即使不饱和配股,基本分红...
  • 系统在一个真正的农业机器人中完全实现德国和瑞士的农业领域。在(Picon等人,2019)中,提出了CNN拓扑用于分析早期识别三个欧洲相关性能地方性小麦疾病。分析是使用不同的手机完成的设备,并且在两个试点中捕获了...
  •  谈谈Presentation Presentation分为作报告,还有就是写paper 3.1 谈谈做报告 14年,刚来哥那会儿,每周是我们组会,导师让我在组会上present RCNN,这是我第一次给导师作报告,而且是在全组面前报告...
  • 人工智能目前还没有形成统一的理论,智能是多种能力的体现,目前的人工智能也是体现在具体的研究和应用领域:1.认知科学认知是和情感、动机、意志相对应的理智或认知过程,是为了一定目的,在一定的心理结构中进行的...
  • 之前做了个知识图谱的调研,正好回答这个问题。阿力阿哩哩:知识图谱调研​zhuanlan.zhihu.com1. 知识图谱...基于属性图存储的图数据库代表为Neo4j,目前还不支持管理三元组,但有向这方向演化的技术趋势的技术趋...
  • ​人工智能(AI)已成为多国科技...美国《福布斯》双周刊网站在3月15日的报道中,为我们列出了2021年人工智能领域备受期待的五大趋势。其中包括低代码/无代码工具纷纷出现,以及变得越来越“亲民”,儿童都可以很方便地..
  • 使用 EuRoC MAV 数据集和与城市行人导航对应的新的视觉-惯性数据集,比较了种开源方法 Vins-Mono、ROVIO、ORB-SLAM2、DSO 和 LSD-SLAM 的性能。对计算结果的详细分析确定了每种方法的优点和缺点。使用两个数据集...
  • 2020互联网大厂职级对应薪资一览表

    千次阅读 2021-01-17 00:00:00
    按华为《2015 年虚拟受限股分红预通知》,每股分红 1.95 元,升值 0.91 元,合计 2.86 元,工作年基本可达十级,饱和配股(包括 TUP)9 万股,分红 + 升值达 2.86*9 万 =25.74 万元,即使不饱和配股,基本分红...
  • 浅谈领域特定语言

    千次阅读 2021-07-16 15:43:29
    这些领域专家不是计算机科班出身,但是他们对自己的领域研究非常深入,他们非常期待能有一门面向领域的编程语言来帮助他们屏蔽计算机底层的复杂度,聚焦自己的领域,高效的进行编程。 在这样的背景下,.
  • DDDDDD(Domain Driven Design,领域驱动设计)作为一种软件开发方法,它可以帮助我们设计高质量的软件模型。在正确实现的情况下,我们通过DDD完成的设计恰恰就是软件的工作方式。UL(Ubiquitous Language,通用语言)是...
  • 简介:什么是领域驱动设计?传统分层架构在实际开发中存在哪些问题?业务开发人员如何设计并搭建自己的领域模型?阿里文娱技术专家战獒将为大家一一解答,并分享文娱在领域驱动设计上的实践。 一 什么是领域驱动...
  • 见字如面,我是军哥!上篇聊了《阿里 P6 到底应该具备哪些核心能力?》,然而我觉得那只是吃大餐前的冷菜,我们继续讨论阿里 P7。P7 级别到底需要哪些能力呢?如下图思维导图所示:需要高清...
  • “优秀IT顾问的七大能力--问题解决能力”; 本篇说明第六种能力:宏观把控能力。 6 宏观把控能力 “欲穷千里目,更上一层楼。”--《登颧雀楼》,王之涣。 站得高,才能越过低矮楼房,看得更远。IT本身是一种...
  • 提名一 ResNet和Transformer 作者:王晋东不在家 时至今日,许多大领域都离不开这两种结构。Transformer更是从NLP领域走入了CV领域,大有一统天下之势。 ResNet大道至简,更倾向于从原来的CNN结构设计出发,通过...
  • 产量预测领域中完成的部分工作通过ML利用某种遥感数据 场,特别是以标准化差异的形式,植被指数(NDVI),是植被的流行指标可以从近红外和红色光谱中检索到的活性渠道。这些索引具有提供以下优点对农场的直接观察...
  • 在备考阶段,九知识领域有关的知识重点需要背诵的内容整理。 注: 博客:https://blog.csdn.net/badao_liumang_qizhi 关注公众号 霸道的程序猿 获取编程相关电子书、教程推送与免费下载。 实现 项目整体管理 ...
  • Kafka 和 TubeMQ 在数据处理中往往充当分布式缓存的作用。 消息通讯 消息队列一般都内置了高效的通信机制,因此也可以用在纯的消息通讯。比如实现点对点消息队列,或者聊天室等。 Pulsar的应用场景 Pulsar 作为新...
  • 计算机操作系统的五大功能操作系统的功能主要体现在对计算机资源――微处理器、存储器、外部设备、文件和作业五大计算机资源的管理,操作系统将这种管理功能分别设置成相应的程序管理模块,每个管理模块分管一定的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 69,405
精华内容 27,762
关键字:

五大领域对应的能力