精华内容
下载资源
问答
  • 计算机网络名词解释

    万次阅读 多人点赞 2019-01-05 17:53:05
    名词解释 ADSL Asymmetric Digital Subscriber Line,即非对称数字用户线,用数字技术对现有模拟电话用户线进行改造,使其能够承载宽带数字业务。 AN Acess Network,即接入网,用来把用户接入...

    目录

    • 名词解释
      • 应用层
      • 传输层
      • 网络层
      • 链路层
      • 无线网络和移动网络
      • 计算机网络中的安全
    • 其他名词解释
      • 原文链接
    • 下载链接

    名词解释

    应用层

    • API
      应用程序编程接口
    • HTTP
      超文本传输协议
    • CDN
      内容分发网络
    • SMTP
      Simple Mail Transfer Protocol,即简单邮件传输协议,能传送可打印的7位ASCII码的邮件协议。
    • POP3
      Post Office Protocol,即第三版的邮局协议,用于电子邮件的接收。本协议主要用于支持使用客户端远程管理在服务器上的电子邮件。
    • IMAP
      因特网邮件访问协议
    • DNS
      Domain Name System,即域名系统,把域名翻译成IP地址的系统称为域名系统。

    传输层

    • ACK
      肯定确认
    • NAK
      否定确认
    • GBN
      后退N步协议
    • SR
      选择重传
    • FSM
      有限状态机
    • MSS
      最大报文段长度
    • MTU
      Maximum Transfer Unit,即最大传送单元,每一种链路层协议规定的所能传送的帧的数据部分长度上限。
    • RTT
      Round Trip Time,即往返时间,从发送方发送数据开始到发送发收到来自接收方的确认信息总共经历的时间。
    • ATM
      即异步传输方式,一种以信息元为基础的分组交换和复用技术。
    • ABR
      可用比特率
    • RM
      资源管理
    • AIMD
      加性增,乘性减

    网络层

    • VC
      虚电路
    • AQM
      主动队列管理
    • RED
      随机早期检测
    • HOL
      线路前部阻塞
    • IP
      Internet Protocol,即网际协议,为计算机网络相互连接进行通信而设计的协议。
    • CIDR
      Classless InterDomain Routing,即无分类域间路由选择,特点:消除了传统的A类、B类和C类地址以及划分子网的概念。
    • NAT
      Network Address Translation,即网络地址转换,使用本地地址的主机在和外界通信时,要在NAT路由器上将本地地址转化为全球IP地址,从而与因特网连接。
    • LS
      链路状态
    • DV
      距离向量
    • AS
      Autonomous System,即自治系统/鉴别服务器,在单一的技术管理下的一组路由器。
    • RIP
      Routing Information Protocol,即路由信息协议,一种分布式的基于距离向量的路由选择协议。
    • OSPF
      Open Shortest Path First,即开放最短通路优先,用于在单一自治系统内部使用的路由选择协议。
    • BGP
      Border Gateway Protocol,即边界网关协议,各自制系统间的路由选择协议
    • IGMP
      因特网组管理协议

    链路层

    • EDC
      差错检验和纠正比特
    • CRC
      Cyclic Redundancy Check,即循环冗余校验码,一种差错检验方法。
    • HDLC
      高级数据链路控制
    • TDM
      时分多路复用
    • FDM
      即时分多路复用技术,是在信道带宽超过原始信号所需带宽情况下,将物理停产的总带宽分成若干个与传输单个信号带宽相同的子停产,每个子信息传输一路信号。
    • CDMA
      即码分多址,一种扩频多址数字式通信技术,通过独特的代码序列建立信道的多路方式。
    • ARP
      Address Resolution Protocol,即地址解析协议,计算机用以匹配IP地址到硬件地址的协议。
    • MDC
      模块化数据中心

    无线网络和移动网络

    • BSS
      基本服务集
    • AP
      接入点
    • SSID
      即服务集标识符,可以将一个无线局域网分为几个需要不同身份验证的子网络,每一个子网络都需要独立的身份验证,只有通过身份验证的用户才可以进入相应的子网络,防止未被授权的用户进入本网络。
    • RTS
      请求发送
    • CSMA/CA
      Carrier Sense Multiple Access / Collision Avoidance,即载波侦听多点接入/冲突避免。
    • CSMA/CD
      Carrier Sense Multiple Access / Collision Detection,即载波监听多点接入/冲突检测,特点:多点接入 载波监听 碰撞检测
    • CTS
      允许发送
    • BTS
      收发基站
    • BSC
      基站控制器=>寻呼,切换,BTS,划信道
    • MSC
      移动交换中心
    • RNC
      无线电网络控制器
    • COA
      转交地址
    • MAC
      Medium Access Control,即媒体接入控制,是识别LAN(局域网)节点的标识。

    计算机网络中的安全

    • CBC
      密码块链接
    • MAC
      报文鉴别码
    • 报文摘要
      报文摘要即单向哈希函数算法将任意长度的输入报文经计算得出固定位的输出。
    • CA
      认证中心
    • SSL
      安全套接层,为网络通信提供安全及数据完整性的一种安全协议。
    • TLS
      运输层安全性
    • VPN
      Virtual Private Networks,即虚拟专用网,利用公共的因特网作为本机构各专用网之间的通信载体的专用网。
    • AH
      鉴别首部
    • ESP
      封装安全性载荷
    • SA
      安全关联
    • SPI
      安全参数索引
    • IDS
      入侵检测系统
    • IPS
      入侵防止系统
    • DES
      数据加密标准
    • AES
      高级加密标准

    其他名词解释

    • ARQ

    即自动重传请求,是一种差错控制方法。要求接收方检测出差错时,就设法通知发送端重发,直到正确的数据收到为止。

    • DOS

    Denial of Service,即拒绝服务,指攻击者向网上的某个服务器不停地发送分组,使服务器无法提供正常服务。

    • DDOS

    分布式拒绝服务

    • CGI

    Common Gateway Interface,即通用网关接口,CGI是一种标准,它定义了动态文档应如何创建,输入数据应如何提供给应用程序,以及输出结果如何使用。

    • DHCP

    Dynamic Host Configuration Protocol,即动态主机配置协议,一种自动为工作站分配IP地址并设置IP相关信息的方法。

    • FTP

    File Transfer Protocol,即文件传输协议,用互联网上各计算机之间传送文件的协议。

    • ICMP

    Internet Control Message Protocol,即网际控制报文协议,它是TCP/IP协议族的一个子协议,用于在IP主机、路由器之间传递控制消息,ICMP允许主机或路由器报告差错情况和提供有关异常情况的报告。具有ICMP差错报告报文和ICMP询问报文。

    • ISP

    Internet Service Provider,即因特网服务提供者,负责因特网运营,提供因特网服务的公司。

    • LAN

    Local Area Network,即局域网,是一种在有限的地理范围内将多台PC及各种网络设备互联,从而实现数据传输和资源共享的计算机网络。

    • OSI

    即开放系统互连基本参考模型,为ISO(国际标准化组织)制订的七层网络模型。

    • P2P

    Peer-to-peer,即对等计算机网络,是一种在对等者(Peer)之间分配任务和工作负载的分布式应用架构 ,是对等计算模型在应用层形成的一种组网或网络形式。

    • PDU

    Protocol Data Unit,即协议数据单元,对等层之间传送的数据单位。

    • PPP

    Point-to-Point Protocol,即点到点协议,为在点对点连接上传输多协议数据包提供了一个标准方法。

    • TCP

    Transmission Control Protocol,即传输控制协议,TCP是一种面向连接(连接导向)的、可靠的、基于字节流的运输层通信协议。

    • TLD

    顶级域名系统

    • TTL

    生存时间,或寿命

    • UDP

    UDP User Datagram Protocol,即用户数据报协议,是OSI参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务。

    • URL

    Uniform Resource Locator,即统一资源定位符,在Internet定位信息资源文件的完整标识。

    • VLAN

    Virtual Local Area Network,即虚拟局域网,由一些局域网构成的与物理位置无关的逻辑组,而这些网络具有某些共同的需求。

    • WAN

    Wide Area Network,即广域网。

    • WWW

    World Wide Web,即万维网,WWW服务采用客户机/服务器工作模式。它以超文本标记语言HTML与超文本传输协议HTTP为基础,为用户提供界面一致的信息浏览系统。

    • 带宽

    在计算机网络中,带宽用来表示网络的通信线路传送数据的能力,因此网络带宽表示在单位时间内从网络中的某一点到另一点所通过的“最高数据率”,带宽的单位是“比特每秒”,记为b/s。

    • 网络的体系结构

    计算机网络的各层及其协议的集合,称为网络的体系结构。

    • 移动IP

    移动IP又称为移动IP协议,是由IETF开发的一种技术,这种技术允许计算机移动到外地时,仍然保留其原来的IP地址(即永久地址或归属地址),在外地网络中会获得一个转交地址。

    • 虚电路服务

    网络层向运输层提供的一种面向连接的,使所有分组序到达目的系统的可靠的数据传输服务。

    • 协议及其三要素

    协议定义了在两个或多个通信实体之间交换的报文格式和次序,以及报文发送和/或接收一条报文或其他事件所采取的动作协议。组成三要素为语法、语义、时序。

    • 数字签名

    数字签名即只有信息的发送者才能产生的别人无法伪造的一段数字串。

    原文链接

    计算机网络名词解释大全
    计算机网络名词解释

    下载链接

    GitHub链接

    展开全文
  • 转录相关名词内含子 (Intron):真核生物细胞DNA中的序列,间隔存在,这些序列被转录时会保留在前体mRNA中,但经过剪接过程被去除,最终不存在于成熟的mRNA分子中。外显子 (Exon):真核生物细胞DNA中的序列,与内含子...

    d381fba5da6ee8bbe388494c343d1bdd.png

    转录相关名词

    内含子 (Intron):真核生物细胞DNA中的序列,间隔存在,这些序列被转录时会保留在前体mRNA中,但经过剪接过程被去除,最终不存在于成熟的mRNA分子中。

    外显子 (Exon):真核生物细胞DNA中的序列,与内含子相对应,这部分序列在mRNA前体剪接后仍会被保存下来,并可在翻译过程中用于指导蛋白质合成。

    基因间区 (Intergenic):在基因组中位于基因与基因之间的间隔序列,其不作为转录和翻译的模板,但是参与转录后调控影响其相关基因的表达。

    UTR (Untranslated Regions,非翻译区域):位于信使RNA分子两端的非编码片段,5'-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽直至AUG起始密码子,3'-UTR从编码区末端的终止密码子直至PolyA尾的前端,参与mRNA的转运、核糖体识别和转录后调控影响蛋白质的合成水平。

    转录本 (Transcript):由基因通过转录形成的一条编码蛋白质合成的成熟mRNA。

    同源异构体 (Isoform):同一个基因经可变剪切或内含子选择机制产生的不同转录本,这些不同转录本即称isoform。

    可变剪切:从同一个mRNA前体出发,通过不同剪接方式、选择不同的剪接位点,产生不同的mRNA剪接异构体的过程。

    融合基因:来自不同基因的外显子进行了组合,形成新的mRNA,最终产生与外显子来源基因表达产物所不同的蛋白质。

    RNA-Seq

    RNA-Seq:应用高通量测序技术对样品中的mRNA、small RNA和non-coding RNA进行测序的技术,针对不同的目的RNA,构建不同的文库进行测序,能够全面快速地获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息。

    RNA-Seq能够在全基因组水平研究基因表达的差异,其优势在于定量准确、可重复性高、检测范围广、分析结果可靠

    RNA-Seq不仅能够获得已知转录本的表达信息,还能够发现新的转录本、SNP、可变剪切,并提供等位基因特异的基因表达。

    转录组

    转录组 (Transcriptome):是指特定生物体在某种状态下所有基因转录产物的总和,转录组研究是功能基因组研究的一项重要内容。转录组是连接基因组遗传信息与生物功能(蛋白质组)的必然纽带。

    链特异性文库:一种特殊的转录组测序文库,主要用于鉴定真核生物的反义转录本或原核生物的ncRNA。其建库原理与普通转录组类似,不同之处在于合成第二链cDNA时,用dUTP代替dTTP,此时第二链cDNA上布满了含dUTP的位点,之后应用一种能够特异性识别尿嘧啶的酶消化掉第二链cDNA,得到只含第一链cDNA信息的文库。

    有参转录组:进行转录组测序的物种已有参考基因组,在进行数据分析时,无需进行转录本拼接,只需将转录组测序数据与参考基因组进行比对,即可确定各基因的表达水平。

    无参转录组:进行转录组测序的物种并无参考基因组,需先对转录组数据进行拼接得到样品中的转录本信息,进而对这些拼接得到的转录本进行功能注释,之后才能将转录组数据与拼接到的转录本进行比对,计算其表达水平。

    Unigene:在无参转录组中,经过拼接的到的转录本并不一定完全是正确的,同时还会得到许多相似度很高、但长度不等的转录本,Unigene即为这些相似转录本的集合,根据设置的相似度阈值,将拼接组装的到的转录本进行聚类,得到的每一个聚类即为一个Unigene,属于同一Unigene的转录本被认为是同一个基因,从中挑选出长度最长的转录组作为该Unigene的代表进行后续的功能注释和表达水平计算。

    全长转录组测序:应用以PacBio公司的SMRT单分子实时测序技术(Single molecule real-time sequencing)为代表的三代测序技术对样品的转录组进行高通量测序,与传统转录组测序相比,三代测序技术长读长的特点允许mRNA不经打断即可直接进行测序,从而能够直接获得mRNA的全长序列,保证了mRNA序列的精确性,该技术能够更好的识别普通转录组测序无法准确识别的Isoform、融合基因、可变剪接等

    互作转录组

    互作转录组 (Dual RNA-Seq):同时检测两个相互作用物种的转录组,之后利用生物信息学分析,获得物种特异性的基因表达和物种间的基因互相作用,主要用来解决宿主防御病原菌以及病原菌侵染宿主机制、易感和抗感基因筛选、共生物种协同进化等问题。

    互作转录组在构建测序文库时,无需将互作的两个物种分离,而是选择互作部位提取两个物种的总RNA进行建库和随后的RNA-Seq,再利用生物信息学手段将测序得到的Reads分别与两个物种的参考基因组进行匹配,从而识别各物种特异的转录本信息,因此需要进行研究的两个物种均具有参考基因组

    基因表达

    RPKM值 (Reads Per Kilobase of exon model per Million mapped reads):衡量基因表达水平的标准,具体意义为每一百万条与转录本匹配的序列中,目的基因每1000个碱基范围内匹配的reads数目。

    RNA-Seq的测序过程是将转录组中各转录本打碎后进行随机测序,因此,当某基因表达水平较高时,匹配到该转录本上的reads数目就应该较多,当某基因的长度较长时,匹配到该转录本上的reads数目也同样较多,基于此,提出了RPKM的概念,通过对基因长度和测序深度的均一化,得到RPKM数值用于比较基因的表达水平。

    差异基因:根据设定的阈值和统计学检验结果,在不同组样品中表达水平具有显著差别的基因。

    富集分析:当分析差异基因时,根据特定的分类方法 (GO、KEGG等) 对基因进行分类,因为不同分类所包含的基因数目不同,如果只通过某一类基因中差异基因的数目评估这一类基因是否具有差异表达,得到的结果是不准确的,富集分析就是利用超几何分布或Fisher精确检验的方法,消除测序总体背景值和基因分类背景值的影响,能够准确阐明样品间不同类别功能基因是否具有差异。


    高通量测序技术基础简介

    • 基因测序技术的发展历史

    • 基因测序技术的原理和应用

      • 第一代测序技术

      • 第二代测序技术

      • 第三代测序技术

    • 高通量测序技术的研究相关概念

      • 基因组研究相关名词解释 (一)——常见概念

      • 基因组研究相关名词解释 (二)——基因注释和进化

      • 基因组研究相关名词解释 (三)——表观遗传学和泛基因组

      • 转录调控研究相关名词解释(一)——转录组

      • 转录调控研究相关名词解释(二)——非编码RNA测序

      • 微生物群落谱研究相关名词解释

      • 宏组学研究相关名词解释

    d9d52cb63df5506604ea1865a07b8c8f.png


    展开全文
  • 软件工程名词解释

    千次阅读 2020-08-06 11:26:23
    答:内容:①软件开发技术②软件开发管理 面临的主要问题:①软件费用②软件可靠性③软件维护④软件生产率⑤软件重用 86、过程设计语言 (PDL) 也称程序描述语言,又称为伪码,是一种用于描述模块算法设计和处理细节...

    参考链接 :https://blog.csdn.net/qq_36721220/article/details/102936951

    1、软件生存周期

    内容:软件产品从形成概念开始,经过开发、运行(使用)和维护直到退役的全过程
    称为软件生存周期,包括软件定义、开发、使用和维护三部分

    软件生存周期模型:

    内容:软件生存周期模型是描述软件开发过程中各种活动如何执行的模型。

    软件开发环境

    指在计算机的基本软件的基础上,为了支持软件的开发而提供的一组工具软件系统。

    2、需求分析

    内容:是准确的理解用户的需求将其转换成需求定义,然后由需求定义转换成形式化
    的功能规约。

    3、程序设计风格

    4、白盒测试

    内容:白盒测试是已知产品内部工作过程 , 通过测试检验产品内部动作是否按照产品规格说明的规定正常进行。

    6、黑盒测试

    黑盒测试方法 是已知产品应该具有的功能 , 通过测试检验每个功能是否都能正常使用 ;

    7、软件测试

    内容:软件测试是以最少的时间和人力系统地找出软件中潜在的各种错误和缺陷。
    8、判定 /条件覆盖

    9、条件覆盖

    10、判定覆盖

    11、语句覆盖

    12、静态测试

    13、动态测试

    14、软件工程:

    内容:软件工程是用科学知识和技术原理来定义、开发、维护软件的一门学科。 (它
    是一门综合性的交叉学科,它涉及计算机科学、工程科学、管理科学、数学等。 )

    15、软件危机:

    内容:是计算机软件的开发和维护过程所遇到的一系列严重的问题。

    16、软件需求:

    内容:软件需求是指( 1)用户解决问题或达到目标所需的条件或能力; (2)系统或
    系统部件要满足合同、标准、规范或其它正式规定文档所需具有的条件或能力; (3)
    一种反映上面( 1)或( 2)所描述的条件或能力的文档说明。

    17、结构化程序设计

    内容:结构化程序设计是一种程序设计技术,采用自顶向下逐步求精的设计方法和单
    入口单出口的控制构件。

    18、 软件设计:

    内容:从抽象概括到具体实践过程 。

    19、信息隐蔽:

    内容:指在设计和确定模块时,使得一个模块内包含的信息(过程或数据) ,对于不
    需要这些信息的其它 模块来说,是不能访问的。

    20、对象:

    内容:是系统中描述客观事物的一个实体,它是构成系统的一个基本单位,由一组属
    性和对这组属性进行操作的一组服务组成,是类的一个实例

    21、 数据字典:

    内容:数据字典由数据条目组成,数据字典描述、组织和管理数据流图的数据流、加
    工、数据源及外部实体。

    22、耦合:

    内容:块间联系,软件系统结构中各模块间相互联系紧密程度的一种度量。

    23、数据抽象:

    内容:数据抽象把一个数据对象的定义 ( 或描述 ) 抽象为一个数据类型名,用此类型
    名可定义多个具有相同性质的数据对象。

    24、类:

    内容:具有相似或相同性质的对象的抽象就是类。

    25、系统测试:

    内容:系统测试是通过与系统的需求规格作比较,发现软件与系统需求规格不相符合
    或与之矛盾的地方。

    26、综合测试:

    内容:综合测试 是组装软件的系统测试技术 , 按设计要求把通过单元测试的各个模
    块组装在一起之后 , 进行综合测试以便发现与接口有关的各种错误。

    27、软件生存周期模型:

    内容:软件生存周期模型是描述软件开发过程中各种活动如何执行的模型。

    28、成熟度等级:

    内容:软件成熟度等级是指软件开发组织在走向成熟的途中几个具有明确定义的表示
    软件过程能力成熟度的平台。

    29、继承:

    内容:广义的说是指能够直接获得已有的性质和特征,而不必重复定义它们
    狭义的说是子类自动地共享基类中定义的数据和方法的机制

    30、项目管理:

    内容:就是通过合理地组织和利用一切可以利用的资源,按照计划的成本和计划的进
    度,完成一个计划的目标,它包含团队管理、风险管理、采购管理、流程管理、时间
    管理、成本管理和质量管理等。

    31、预防性维护:

    内容:预防性维护 是为了进一步改善软件系统的可维护性和可靠性 , 并为以后的改
    进奠定基础。

    32、编程风格:

    内容:是在不影响性能的前提下 , 有效地编排和组织程序以提高可读性和可维性。

    33、数据流图:

    内容:数据流图是结构化分析的基本工具,它描述了信息流和数据转换。

    34、内容:CASE工具是一些软件系统,支持软件过程的常规活动,如编辑设计图表、检

    查图表的连贯性、跟踪已经运行的程序测试等。

    35、模块作用域:

    内容:是指受该模块判定影响的所有模块。受该模块内的一个判定影响的所有模块的
    集合

    36、内聚性:

    内容:内聚性是模块独立性的衡量标准之一,它是指模块的功能强度的度量,即一个
    模块内部各个元素彼此结合的紧密程度的度量

    37、数据设计:

    内容:数据设计是为在需求规格说明中定义的那些数据对象选择合适的逻辑表示 , 并
    确定可能作用在这些逻辑结构上的所有操作 (包括选用已存在的程序包 )

    38、瀑布模型:

    内容:瀑布模型是将软件生命周期的各项活动规定为依线性顺序连接的若干阶段的模
    型,适合于软件需求很明确的软件项目。

    39、条件组合覆盖:

    内容:条件组合覆盖就是设计足够的测试用例,运行被测程序,使得每个判断的所有
    可能的条件取值组合至少执行一次。

    40、软件工程过程

    41、模块化

    42、集成测试

    43、软件可靠性

    44、模块的控制范围

    45、数据字典

    内容:数据字典由数据条目组成,数据字典描述、组织和管理数据流图的数据流、加工、数据源及外部实体。

    46、需求分析:

    内容:是准确的理解用户的需求将其转换成需求定义,然后由需求定义转换成形式化的功
    能规约。

    47、模块的作用范围

    48、错误推测法

    在测试程序时,人们可能根据经验或直觉推测程序中可能存在的各种错误,从而有针对性的编写检查这些错误的测试用例的方法。

    49、黑盒推测法

    50、软件质量保证

    是向用户及社会提供满意的高质量的产品,确保软件产品从诞生到消亡为止的所有阶段的质量的活动,即确定到达和维护需要的软件质量而进行的所有激活、有系统的管理活动

    51、瀑布模型

    将软件生存周期各个活动规定为以线性顺序连接的若干阶段的一种软件开发模型。它包括可行性分析、项目开发计划、需求分析、概要设计、详细设计、编码、测试和维护。

    52、增量构造模型有什么特点?

    1、增量构造模型是部分阶段进行增量开发,即在该模型中,需求分析阶段和设计段与瀑布模型一样,按照瀑布模型方式进行开发。
    2、而编码和测试阶段不采用瀑布模型方式,而采用增量方式开发
    3、即先对部分功能进行编码,进行测试,将这部分功能提交用户,然后再对另一部分功能进行编码,测试提交用户,直到把全部功能按这种方式开发完毕,
    4、在这种模型中,用户可以及早看到部分软件功能,及早发现问题,以便在其他软件功能开发及时解决。

    53、软件测试要经过哪些步骤?简述这些测试的基本任务

    1、单元测试 、集成测试、确认测试、系统测试。
    2、单元测试 :对源程序中的每个程序单元进行测试,检查各模块是否正确实现规定的功能,从而发现模块在编码中或算法中的错误。
    3、集成测试 :检查与设计相关的软件结构的有关问题
    4、确认测试 : 主要检查已实现的软件是否满足需求规格说明书中确定了的各种需求。

    54、简述需求分析方法应遵循的基本原则

    1、必须能够表达和理解问题的数据域和功能域
    2、可以把一个复杂问题按 功能进行分析并可逐层细化
    3、建模

    55、模块间的耦合性包括哪些类型

    1、无直接耦合
    2、数据耦合
    3、标记耦合
    4、控制耦合
    5、公共耦合

    56、数据流图

    57、信息隐蔽

    58、继承性

    59、投资回收期

    60、模块

    61、维护的副作用

    62、软件配置管理

    63、软件质量保证

    是向用户及社会提供满意的高质量的产品,确保软件产品从诞生到消亡为止的所有阶段的质量的活动,即确定、到达的和维护需要的软件质量而进行的所有计划、系统的管理活动

    64、 结构化程序设计

    内容:结构化程序设计是一种程序设计技术,采用自顶向下逐步求精的设计方法和单入口单出口的控制构件。

    65、软件设计:

    内容:从抽象概括到具体实践过程

    66、信息隐蔽:

    内容:指在设计和确定模块时,使得一个模块内包含的信息(过程或数据) ,对于不需要这些信息的其它 模块来说,是不能访问的。

    67、对象:

    内容:是系统中描述客观事物的一个实体,它是构成系统的一个基本单位,由一组属性和
    对这组属性进行操作的一组服务组成,是类的一个实例

    68、耦合:

    内容:块间联系,软件系统结构中各模块间相互联系紧密程度的一种度量。

    69、数据抽象:

    内容:数据抽象把一个数据对象的定义 ( 或描述 ) 抽象为一个数据类型名,用此类型名可定义多个具有相同性质的数据对象。

    70、 类:

    内容:具有相似或相同性质的对象的抽象就是类。

    71、 系统测试:
    内容:系统测试是通过与系统的需求规格作比较,发现软件与系统需求规格不相符合或与之矛盾的地方。

    72、 综合测试:

    内容:综合测试 是组装软件的系统测试技术 , 按设计要求把通过单元测试的各个模块组
    装在一起之后 , 进行综合测试以便发现与接口有关的各种错误。

    73、成熟度等级:
    内容:软件成熟度等级是指软件开发组织在走向成熟的途中几个具有明确定义的表示软件过程能力成熟度的平台。

    74、继承:

    内容:广义的说是指能够直接获得已有的性质和特征,而不必重复定义它们
    狭义的说是子类自动地共享基类中定义的数据和方法的机制

    75、项目管理:

    内容:就是通过合理地组织和利用一切可以利用的资源,按照计划的成本和计划的进度,完成一个计划的目标,它包含团队管理、风险管理、采购管理、流程管理、时间管理、成本管理和质量管理等。

    76、预防性维护:

    内容:预防性维护 是为了进一步改善软件系统的可维护性和可靠性 , 并为以后的改进奠
    定基础。

    77、编程风格:

    内容:是在不影响性能的前提下 , 有效地编排和组织程序以提高可读性和可维性。

    78、数据流图:

    内容:数据流图是结构化分析的基本工具,它描述了信息流和数据转换。

    79、软件测试:

    内容:软件测试是以最少的时间和人力系统地找出软件中潜在的各种错误和缺陷。

    80、CASE工具:

    内容:CASE工具是一些软件系统,支持软件过程的常规活动,如编辑设计图表、检查图表的连贯性、跟踪已经运行的程序测试等。

    81、模块作用域:

    内容:是指受该模块判定影响的所有模块。受该模块内的一个判定影响的所有模块的集合。

    82、内聚性:

    内容:内聚性是模块独立性的衡量标准之一,它是指模块的功能强度的度量,即一个模块内部各个元素彼此结合的紧密程度的度量

    83、数据设计:

    内容:数据设计是为在需求规格说明中定义的那些数据对象选择合适的逻辑表示 , 并确定可能作用在这些逻辑结构上的所有操作 ( 包括选用已存在的程序包 )

    84、条件组合覆盖:

    内容:条件组合覆盖就是设计足够的测试用例,运行被测程序,使得每个判断的所有可能的条件取值组合至少执行一次

    85、简述软件工程面临的问题。

    答:内容:①软件开发技术②软件开发管理
    面临的主要问题:①软件费用②软件可靠性③软件维护④软件生产率⑤软件重用

    86、过程设计语言 (PDL)

    也称程序描述语言,又称为伪码,是一种用于描述模块算法设计和处理细节的语言

    87、可移植性
    指程序从一个计算机环境移植到另一个计算机环境的容易程度

    88、.渐增式测试
    是把未经过测试的模块逐个组装到已经过测试的模块上进行集成测试,每增加一个模块进行一次集成测试,重复此过程直至完成集成测试。

    89、详细设计
    也称过程设计,是在概要设计的基础上,设计出软件各模块内部的详细算法, 并精确地表达这些算法。一般采用过程设计的表达工具给出适当的算法描述。

    90、条件覆盖
    指设计足够多的测试用例,使得判定表达式中每个条件的各种可能的值至少出现一次。

    91、信息隐蔽 答案:信息隐蔽指在设计和确定模块时,使得一个模块内包含的信息 (过程或数据),对于不需要 这些信息的其它模块来说,是不能访问的。

    92、原型 答案:原型是指模拟某种产品的原型模型。软件开发中的原型是软件的一个早期可运行的版本,它反映了最终系统的重要特征。

    93、事件 答案:事件是指定时刻发生的某件事情。它是某事情发生的信号,它没有持续时间,
    它是一种相 对性的快速事件。

    94、模块 答案:模块在程序中是数据说明、可执行语句等程序对象的集合,或者是单独命名和
    编址的元素

    95、多态性 答案:指相同的操作或函数、过程可作用于多种类型的对象上并获得不同结果。不同的对象,收 到同一消息可以产生不同的结果,这种现象称为多态性。

    96、软件: 一般是指计算机系统中的程序及其文档。

    软件工程 : 是应用计算机科学理论和技术以及工程管理原则和方法,按预算和进

    97、软件需求: 是产品 / 系统设计、实现以及验证的基本信息源之一,是任何软件工程项目的基础。

    98、功能需求: 规约了系统或系统构件必须执行的功能,是整个需求的主体。

    99、非功能需求:

    分为性能需求、外部接口需求、设计约束和质量属性需求。性能需求规约了一个系统或系统构件在性能方面必须具有的一些特征;外部接口需求规约了系统或系统构件必须与之交互的用户、硬件、软件或数据库元素;设计约束限制了软件系统或软件系统构件的设计方案的范围;质量属性规约了软件产品所具有的一个性质必须达到其质量方面一个所期望的水平。

    100、需求规约:

    是一个软件项 / 产品 / 系统所有需求陈述的正式文档,它表达了一个软件产品 / 系统的概念模型。

    101、变换型数据流图:具有较明显的输入部分和变换(主加工)部分之间的界面变换部分和输出部分之间界面的数据流图

    102、数据流图:表达功能模型的工具,即数据流图( Dataflow Diagram ) 简称 DFD图,简单的说, DFD图是一种描述数据变换的图形化工具,其中饮食的元素可以是数据流、数据存储、加工、数据源和数据潭等

    103、事务型数据流图:数据到达一个加工 T,该加工 T根据输入数据的值,在其后的基干动作序号(称为一个事务)中选出一个来执行

    104、模块:执行一个特殊任务的一个过程以及相关的数据结构

    105、过程内聚:一个模块内部的处理成分是相关的,而且这些处理必须以特定的次序执行

    106、通信内聚:一个模块的所有成分都操作同一数据集或生成同一数据集

    107、顺序内聚:一个模块的各个成分和同一个功能密切相关,而且一个成分的输出作为另一个成分的输入

    108、功能内聚:最理想的内聚,模块的所有成分对于完成单一的功能都是基本的。功能内聚的模块对完成其功能而言是充分必要的

    109、何谓模块的控制域和模块的作用域?并举例说明

    控制域:模块本身以及所有直接或间接从属于它的模块的集合。
    作用域:受该模块内的一个判定所影响的所有模块的影响

    110、过程域:

    是一个业务域中一束相关实践,当它们一起得以实现时,就满足被认为对该过程域的改善具有重要作用的一组条件。

    111、过程改善: 是指人为设计的一个活动程序, 其目的是改进组织的过程性能和成熟度,并改进这一程序的结果

    112、专用目标: 每一个过程域中都有一个或多个“专用目标” ,用于描述该过程域必须呈现的一些独有特征

    113、共用目标: 每一个过程域中都有一个或多个“共用目标” ,用于描述实现制度化的该过程必须呈现的特征

    114、专用实践: 每一个过程域中都有一个或多个“专用实践” ,这些专用实践被认为对于达到该过程域的专用目标是重要活动,即期望以专用实践所描述的活动,会导致达到一个过程域的专用目标

    115、共用实践: 每一个过程域中都有一个或多个“共用实践” ,这些共用实践被认为对于达到该过程域相关的共用目标是重要活动

    116、能力等级: 是指单一过程域中已达到的过程改善,能力等级是为了管理,对过程改善程序所设定的几个“台阶”

    117、成熟度等级: 是指达到预先定义的一组过程域所有目标的一种过程改善等级

    118、渐增式测试

    非渐增式测试
    在这里插入图片描述
    119、面向对象设计
    结构化分析
    在这里插入图片描述

    120、附加策略

    抛弃策略
    在这里插入图片描述
    121、抽象
    参数化抽象
    在这里插入图片描述
    122、模型 :
    瀑布模型
    增量模型
    喷泉模型
    在这里插入图片描述
    在这里插入图片描述
    123、功能模型
    动态模型
    在这里插入图片描述
    124、
    在这里插入图片描述
    125、
    在这里插入图片描述
    在这里插入图片描述

    126、类:对具有相同数据和相同操作的一组相似对象的定义。

    127、软件维护 :在软件已经交付使用之后 ,为了改正错误或满足新的需要而修改软件的过程 .
    128、继承 :子类自动地共享基类中定义的数据和方法的机制 .

    129、投资回收期 : 就是使累计的经济效果等于最初投资的需要的时间。

    130、结构化分析方法 : 就是面向数据流自顶向下逐步求精进行需求分析的方法。

    131、投资回收期:就是使累计的经济效果等于最初投资的需要的时间。

    132、宽度:是软件结构内同一个层次上的模块总数的最大值。

    133、事务流: 数据沿输入通路到达一个处理, 这个处理根据输入数据的类型在若干个动作序列中选出一个来
    执行。这类数据流应该划分为一类特殊的数据流,称为事务流。

    134、事件: 是某个特定时刻所发生的事情, 它是对引起对象从一种状态转换到另一种状态的现实世界中的事

    件的抽象。

    135、函数重载:指在同一作用域内的若干个参数特征不同的函数可以使用相同的函数名字。

    136、扇出:是一个模块直接控制的模块数目。

    137、纯收入 . 在整个生命周期内系统的累计经济效益(折合成现在值)与投资之差。

    138、模块独立性 :指每个模块只完成系统要求的独立的子功能(即:功能单一),并且与其他模块的联系

    最少且接口简单(比如:只有一个接口)。

    139、软件复用 :将已有软件的各种有关知识用于建立新的软件,以缩减软件开发和维护的花费。

    140、测试用例 :为某个特殊目标而编制的一组测试输入、 执行条件以及预期结果, 以便测试某个程序路径

    或核实是否满足某个特定需求

    141、信息隐蔽 :将每个程序的成分隐蔽或封装在一个单一的设计模块中 , 定义每一个模块时尽可能少

    地显露其内部的处理

    142、软件调试 :软件测试成功后,根据错误迹象确定错误的原因和准确位置,并加以改正。

    143、实体—关系图 描述系统所有数据对象的组成和属性,描述数据对象之间关系的图形语言。
    144、软件维护的副作用 指由于维护或在维护过程中其他一些不期望的行为引入的错误 ,

    145、软件过程 (software process) 软件开发人员为开发和维护软件及相关产品所实施的一系列步骤,这些步骤涉及方法、工具及人的组织和行为。

    146、过程抽象 把完成一个特定功能的动作序列抽象为一个过程名和参数表,通过指定过程名和实际参数调用此过程 ;

    147、水平原型 是指仅仅模拟目标软件系统某一层面 ( 通常是用户界面层 ) 的原型。

    148、部署图 (deployment diagram) 描述软件系统运行环境的硬件及网络的物理体系结构。

    149、垂直原型 是指模拟目标软件系统某一部分的多个层面的原型。 当目标系统的内部功能和用户界面都需要借助原型来确定时, 这类原型特别有用。 一般的进化性原型都属于垂直原型。

    150、适应性维护 :

    是为适应环境的变化而修改软件的活动。

    151、数据设计 是为在需求规格说明中定义的那些数据对象选择合适的逻辑表

    152、异步消息 (Asynchronous Message) 表示消息源发出消息后不必等待消息处理过程的返回,即可继续执行自己的后续操作。

    153、恢复测试 主要检查系统的容错能力。当系统出错时,能否在指定的时间间隔内修正错误并重新启动系统。

    154、部件合成 是指将库中的软部件 (经适当修改后 ) 相互连接,或者将它们与当前开发项目中的软件元素相连接,最终构成新的目标软件

    155、

    156、

    157、

    158、

    159、

    160、

    161、

    162、

    163、

    164、

    165、

    166、

    167、

    168、

    169、

    170、

    171、

    172、

    173、

    174、

    175、

    176、

    177、

    178、

    179、

    180、

    181、

    182、

    183、

    184、

    185、

    186、

    187、

    188、

    189、

    190、

    191、

    191、

    192、

    193、

    194、

    195、

    196、

    197、

    198、

    199、

    198、

    199、

    200、

    201、

    202、

    203、

    204、

    205、

    206、

    207、

    208、

    209、

    210、

    211、

    212、

    213、

    214、

    215、

    216、

    217、

    218、

    219、

    220、

    221、

    222、

    223、

    224、

    225、

    226、

    227、

    228、

    229、

    230、

    231、

    232、

    233、

    234、

    235、

    236、

    237、

    238、

    239、

    240、

    241、

    242、

    243、

    244、

    245、
    246、

    247、

    248、

    249、

    250、

    251、

    252、

    253、

    254、

    255、

    256、

    257、

    258、

    259、

    260、

    展开全文
  • 数据分析常用名词解释

    千次阅读 2020-01-09 09:13:32
    1、互联网常用名词解释 2、统计学名词解释 3、数据分析名词解释 一、互联网常用名词解释 1、PV(Page View)页面浏览量 指某段时间内访问网站或某一页面的用户的总数量,通常用来衡量一篇文章或一次活动带来的流量...

    数据分析常用的术语解释。 按照以下三类进行汇总。 1、互联网常用名词解释 2、统计学名词解释 3、数据分析名词解释

    一、互联网常用名词解释

    1、PV(Page View)页面浏览量

    指某段时间内访问网站或某一页面的用户的总数量,通常用来衡量一篇文章或一次活动带来的流量效果,也是评价网站日常流量数据的重要指标。PV可重复累计,以用户访问网站作为统计依据,用户每刷新一次即重新计算一次。

    2、UV(Unique Visitor)独立访客

    指来到网站或页面的用户总数,这个用户是独立的,同一用户不同时段访问网站只算作一个独立访客,不会重复累计,通常以PC端的Cookie数量作为统计依据。

    3、Visit 访问

    指用户通过外部链接来到网站,从用户来到网站到用户在浏览器中关闭页面,这一过程算作一次访问。

    Visit可重复累计,比如我打开一个网站又关闭,再重新打开,这就算作两次访问。

    4、Home Page 主页

    指一个网站起主目录功能的页面,也是网站起点。通常是网站首页。

    5、Landing Page 着陆页

    指用户从外部链接来到网站,直接跳转到的第一个页面。比如朋友给我发了一个介绍爆款T恤的淘宝链接,我点开会直接跳转到介绍T恤的那个页面,而不是淘宝网众多其他页面之一,这个介绍T恤的页面可以算作是着陆页。

    6、Bounce Rate 跳出率

    指用户通过链接来到网站,在当前页面没有任何交互就离开网站的行为,这就算作此页面增加了一个“跳出”,跳出率一般针对网站的某个页面而言。

    跳出率=在这个页面跳出的用户数/PV

    7、退出率

    一般针对某个页面而言。指用户访问某网站的某个页面之后,从浏览器中将与此网站相关的所有页面全部关闭,就算此页面增加了一个“退出“。

    退出率=在这个页面退出的用户数/PV

    8、Click 点击

    一般针对付费广告而言,指用户点击某个链接、页面、banner的次数,可重复累计。比如我在PC端看到一则新闻链接点进去看了一会就关了,过了一会又点进去看了一遍,这就算我为这篇新闻贡献两次点击。

    9、avr.time 平均停留时长

    指某个页面被用户访问,在页面停留时长的平均值,通常用来衡量一个页面内容的质量。

    avr.time=访客数量/用户总停留时长

    10、CTR 点击率

    指某个广告、Banner、URL被点击的次数和被浏览的总次数的比值。一般用来考核广告投放的引流效果。

    CTR=点击数(click)/被用户看到的次数

    11、Conversion rate 转化率

    指用户完成设定的转化环节的次数和总会话人数的百分比,通常用来评价一个转化环节的好坏,如果转化率较低则急需优化该转化环节。转化率=转化会话数/总会话数

    12、漏斗

    通常指产生目标转化前的明确流程,比如在淘宝购物,从点击商品链接到查看详情页,再到查看顾客评价、领取商家优惠券,再到填写地址、付款,每个环节都有可能流失用户,这就要求商家必须做好每一个转化环节,漏斗是评价转化环节优劣的指标。

    13、投资回报率(ROI:Return On Investment )

    反映投入和产出的关系,衡量我这个投资值不值得,能给到我多少价值的东西(非单单的利润),这个是站在投资的角度或长远生意上看的。

    其计算公式为:投资回报率(ROI)=年利润或年均利润/投资总额×100%,通常用于评估企业对于某项活动的价值,ROI高表示该项目价值高。

    14、重复购买率

    指消费者在网站中的重复购买次数。

    15、Referrer 引荐流量

    通常指将用户引导至目标页面的URL(超链接)。在百度统计中,引荐流量叫做“外部链接”。

    16、流失分析(Churn Analysis/Attrition Analysis)

    描述哪些顾客可能停止使用公司的产品/业务,以及识别哪些顾客的流失会带来最大损失。流失分析的结果用于为可能要流失的顾客准备新的优惠。

    17、顾客细分&画像(Customer Segmentation & Profiling)

    根据现有的顾客数据,将特征、行为相似的顾客归类分组。描述和比较各组。

    18、顾客的生命周期价值 (Lifetime Value, LTV)

    顾客在他/她的一生中为一个公司产生的预期折算利润。

    19、购物篮分析(Market Basket Analysis)

    识别在交易中经常同时出现的商品组合或服务组合,例如经常被一起购买的产品。此类分析的结果被用于推荐附加商品,为陈列商品的决策提供依据等。

    20、实时决策(Real Time Decisioning, RTD)

    帮助企业做出实时(近乎无延迟)的最优销售/营销决策。比如,实时决策系统(打分系统)可以通过多种商业规则或模型,在顾客与公司互动的瞬间,对顾客进行评分和排名。

    21、留存/顾客留存(Retention / Customer Retention)

    指建立后能够长期维持的客户关系的百分比。

    22、社交网络分析(Social Network Analysis, SNA)

    描绘并测量人与人、组与组、机构与机构、电脑与电脑、URL与URL、以及其他种类相连的信息/知识实体之间的关系与流动。这些人或组是网络中的节点,而它们之间的连线表示关系或流动。SNA为分析人际关系提供了一种方法,既是数学的又是视觉的。

    23、生存分析(Survival Analysis)

    估测一名顾客继续使用某业务的时间,或在后续时段流失的可能性。此类信息能让企业判断所要预测时段的顾客留存,并引入合适的忠诚度政策。

    二、统计学名词解释

    1、绝对数和相对数

    绝对数:是反应客观现象总体在一定时间、一定地点下的总规模、总水平的综合性指标,也是数据分析中常用的指标。比如年GDP,总人口等等。

    相对数:是指两个有联系的指标计算而得出的数值,它是反应客观现象之间的数量联系紧密程度的综合指标。相对数一般以倍数、百分数等表示。相对数的计算公式:

    相对数=比较值(比数)/基础值(基数)

    2、百分比和百分点

    百分比:是相对数中的一种,他表示一个数是另一个数的百分之几,也成为百分率或百分数。百分比的分母是100,也就是用1%作为度量单位,因此便于比较。

    百分点:是指不同时期以百分数的形式表示的相对指标的变动幅度,1%等于1个百分点。

    3、频数和频率

    频数:一个数据在整体中出现的次数。

    频率:某一事件发生的次数与总的事件数之比。频率通常用比例或百分数表示。

    4、比例与比率

    比例:是指在总体中各数据占总体的比重,通常反映总体的构成和比例,即部分与整体之间的关系。

    比率:是样本(或总体)中各不同类别数据之间的比值,由于比率不是部分与整体之间的对比关系,因而比值可能大于1。

    5、倍数和番数

    倍数:用一个数据除以另一个数据获得,倍数一般用来表示上升、增长幅度,一般不表示减少幅度。

    番数:指原来数量的2的n次方。

    6、同比和环比

    同比:指的是与历史同时期的数据相比较而获得的比值,反应事物发展的相对性。

    环比:指与上一个统计时期的值进行对比获得的值,主要反映事物的逐期发展的情况。

    7、变量

    变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念。变量可以通过变量名访问。

    8、连续变量

    在统计学中,变量按变量值是否连续可分为连续变量与离散变量两种。在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值。如:年龄、体重等变量。

    9、离散变量

    离散变量的各变量值之间都是以整数断开的,如人数、工厂数、机器台数等,都只能按整数计算。离散变量的数值只能用计数的方法取得。

    10、定性变量

    又名分类变量:观测的个体只能归属于几种互不相容类别中的一种时,一般是用非数字来表达其类别,这样的观测数据称为定性变量。可以理解成可以分类别的变量,如学历、性别、婚否等。

    11、均值

    即平均值,平均数是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。

    12、中位数

    对于有限的数集,可以通过把所有观察值高低排序后找出正中间的一个作为中位数。如果观察值有偶数个,通常取最中间的两个数值的平均数作为中位数。

    13、缺失值

    它指的是现有数据集中某个或某些属性的值是不完全的。

    14、缺失率

    某属性的缺失率=数据集中某属性的缺失值个数/数据集总行数。

    15、异常值

    指一组测定值中与平均值的偏差超过两倍标准差的测定值,与平均值的偏差超过三倍标准差的测定值,称为高度异常的异常值。

    16、方差

    是在概率论和统计方差衡量随机变量或一组数据时离散程度的度量。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。方差是衡量源数据和期望值相差的度量值。

    17、标准差

    中文环境中又常称均方差,是离均差平方的算术平均数的平方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的两组数据,标准差未必相同。

    18、皮尔森相关系数

    皮尔森相关系数是用来反映两个变量线性相关程度的统计量。相关系数用r表示,其中n为样本量,分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的绝对值越大表明相关性越强。

    19、相关系数

    相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母r表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔森相关系数。

    20、特征值

    特征值是线性代数中的一个重要概念。在数学、物理学、化学、计算机等领域有着广泛的应用。设A是向量空间的一个线性变换,如果空间中某一非零向量通过A变换后所得到的向量和X仅差一个常数因子,即AX=kX,则称k为A的特征值,X称为A的属于特征值k的特征向量或特征矢量。

    三、数据分析名词解释

    A

    聚合(Aggregation):搜索、合并、显示数据的过程。

    算法(Algorithms):可以完成某种数据分析的数学公式。

    分析法(Analytics):用于发现数据的内在涵义。

    异常检测(Anomaly detection):在数据集中搜索与预期模式或行为不匹配的数据项。除了“Anomalies”,用来表示异常的词有以下几种:outliers,exceptions,surprises,contaminants.他们通常可提供关键的可执行信息。

    匿名化(Anonymization):使数据匿名,即移除所有与个人隐私相关的数据。

    分析型客户关系管理(Analytical CRM/aCRM):用于支持决策,改善公司跟顾客的互动或提高互动的价值。针对有关顾客的知识,和如何与顾客有效接触的知识,进行收集、分析、应用。

    B

    行为分析法(Behavioural Analytics):这种分析法是根据用户的行为如“怎么做”,“为什么这么做”,以及“做了什么”来得出结论,而不是仅仅针对人物和时间的一门分析学科,它着眼于数据中的人性化模式。

    批量处理(Batch processing):尽管从大型计算机时代开始,批量处理就已经出现了。由于处理大型数据集,批量处理对大数据具有额外的意义。批量数据处理是处理一段时间内收集的大量数据的有效方式。

    商业智能(Business Intelligence): 分析数据、展示信息以帮助企业的执行者、管理层、其他人员进行更有根据的商业决策的应用、设施、工具、过程。

    C

    分类分析(Classification analysis):从数据中获得重要的相关性信息的系统化过程;这类数据也被称为元数据(meta data),是描述数据的数据。

    云计算(Cloud computing):构建在网络上的分布式计算系统,数据是存储于机房外的(即云端)。

    集群计算(Cluster computing):这是一个使用多个服务器集合资源的“集群”的计算术语。要想更技术性的话,就会涉及到节点,集群管理层,负载平衡和并行处理等概念。

    聚类分析(Clustering analysis):它是将相似的对象聚合在一起,每类相似的对象组合成一个聚类(也叫作簇)的过程。这种分析方法的目的在于分析数据间的差异和相似性。

    冷数据存储(Cold data storage):在低功耗服务器上存储那些几乎不被使用的旧数据。但这些数据检索起来将会很耗时。

    对比分析(Comparative analysis):在非常大的数据集中进行模式匹配时,进行一步步的对比和计算过程得到分析结果。

    相关性分析(Correlation analysis):是一种数据分析方法,用于分析变量之间是否存在正相关,或者负相关。

    D

    仪表板(Dashboard):使用算法分析数据,并将结果用图表方式显示于仪表板中。

    数据聚合工具(Data aggregation tools):将分散于众多数据源的数据转化成一个全新数据源的过程。

    数据分析师(Data analyst):从事数据分析、建模、清理、处理的专业人员。

    数据库(Database):一个以某种特定的技术来存储数据集合的仓库。

    数据湖(Data lake):数据湖是原始格式的企业级数据的大型存储库。与此同时我们可以涉及数据仓库,它在概念上是相似的,也是企业级数据的存储库,但在清理、与其他来源集成之后是以结构化格式。数据仓库通常用于常规数据(但不是专有的)。数据湖使得访问企业级数据更加容易,你需要明确你要寻找什么,以及如何处理它并明智地试用它。

    暗数据(Dark Data):基本上指的是,由企业收集和处理的,但并不用于任何意义性目的的数据,因此它是“暗”的,可能永远不会被分析。它可以是社交网络反馈,呼叫中心日志,会议笔记等等。有很多人估计,所有企业数据中的 60-90% 可能是“暗数据”,但谁又真正知道呢?

    数据挖掘(Data mining):数据挖掘是通过使用复杂的模式识别技术,从而找到有意义的模式,并得出大量数据的见解。

    数据中心(Data centre):一个实体地点,放置了用来存储数据的服务器。

    数据清洗(Data cleansing):对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。

    数据质量(Data Quality):有关确保数据可靠性和实用价值的过程和技术。高质量的数据应该忠实体现其背后的事务进程,并能满足在运营、决策、规划中的预期用途。

    数据订阅(Data feed):一种数据流,例如Twitter订阅和RSS。

    数据集市(Data Mart):进行数据集买卖的在线交易场所。

    数据建模(Data modelling):使用数据建模技术来分析数据对象,以此洞悉数据的内在涵义。

    数据集(Data set):大量数据的集合。

    数据虚拟化(Data virtualization):数据整合的过程,以此获得更多的数据信息,这个过程通常会引入其他技术,例如数据库,应用程序,文件系统,网页技术,大数据技术等等。

    判别分析(Discriminant analysis):将数据分类,按不同的分类方式,可将数据分配到不同的群组,类别或者目录。是一种统计分析法,可以对数据中某些群组或集群的已知信息进行分析,并从中获取分类规则。

    分布式文件系统(Distributed File System):提供简化的,高可用的方式来存储、分析、处理数据的系统。

    文件存贮数据库(Document Store Databases):又称为文档数据库,为存储、管理、恢复文档数据而专门设计的数据库,这类文档数据也称为半结构化数据。

    E

    探索性分析(Exploratory analysis):在没有标准的流程或方法的情况下从数据中发掘模式。是一种发掘数据和数据集主要特性的一种方法。

    提取-转换-加载(ETL:Extract,Transform and Load):是一种用于数据库或者数据仓库的处理过程,天善学院有国内唯一的最全的ETL学习课程。即从各种不同的数据源提取(E)数据,并转换(T)成能满足业务需要的数据,最后将其加载(L)到数据库。

    G

    游戏化(Gamification):在其他非游戏领域中运用游戏的思维和机制,这种方法可以以一种十分友好的方式进行数据的创建和侦测,非常有效。

    图形数据库(Graph Databases):运用图形结构(例如,一组有限的有序对,或者某种实体)来存储数据,这种图形存储结构包括边缘、属性和节点。它提供了相邻节点间的自由索引功能,也就是说,数据库中每个元素间都与其他相邻元素直接关联。

    网格计算(Grid computing):将许多分布在不同地点的计算机连接在一起,用以处理某个特定问题,通常是通过云将计算机相连在一起。

    H

    Hadoop:一个开源的分布式系统基础框架,可用于开发分布式程序,进行大数据的运算与存储。

    Hadoop数据库(HBase):一个开源的、非关系型、分布式数据库,与Hadoop框架共同使用。

    HDFS:Hadoop分布式文件系统(Hadoop Distributed File System);是一个被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统。

    高性能计算(HPC:High-Performance-Computing):使用超级计算机来解决极其复杂的计算问题。

    I

    内存数据库(IMDB:In-memory):一种数据库管理系统,与普通数据库管理系统不同之处在于,它用主存来存储数据,而非硬盘。其特点在于能高速地进行数据的处理和存取。

    物联网(IoT):最新的流行语是物联网(IOT)。IOT通过互联网将嵌入式对象(传感器,可穿戴设备,汽车,冰箱等)中的计算设备进行互连,并且能够发送以及接收数据。IOT生成大量数据,提供了大量大数据分析的机会。

    K

    键值数据库(Key-Value Databases):数据的存储方式是使用一个特定的键,指向一个特定的数据记录,这种方式使得数据的查找更加方便快捷。键值数据库中所存的数据通常为编程语言中基本数据类型的数据。

    L

    负载均衡(Load balancing):将工作量分配到多台电脑或服务器上,以获得最优结果和最大的系统利用率。

    位置信息(Location data):GPS信息,即地理位置信息。

    日志文件(Log file):由计算机系统自动生成的文件,记录系统的运行过程。

    M

    M2M数据(Machine 2 Machine data):两台或多台机器间交流与传输的内容。

    机器数据(Machine data):由传感器或算法在机器上产生的数据。

    机器学习(Machine learning):人工智能的一部分,指的是机器能够从它们所完成的任务中进行自我学习,通过长期的累积实现自我改进。

    Map Reduce:是处理大规模数据的一种软件框架(Map:映射,Reduce:归纳)。

    大规模并行处理(MPP:Massivel yParallel Processing):同时使用多个处理器(或多台计算机)处理同一个计算任务。

    元数据(Meta data):被称为描述数据的数据,即描述数据数据属性(数据是什么)的信息。

    多维数据库(Multi-Dimensional Databases):用于优化数据联机分析处理(OLAP)程序,优化数据仓库的一种数据库。

    多值数据库(MultiValue Databases):是一种非关系型数据库(NoSQL),一种特殊的多维数据库:能处理3个维度的数据。主要针对非常长的字符串,能够完美地处理HTML和XML中的字串。

    N

    自然语言处理(Natural Language Processing):是计算机科学的一个分支领域,它研究如何实现计算机与人类语言之间的交互。

    网络分析(Network analysis):分析网络或图论中节点间的关系,即分析网络中节点间的连接和强度关系。

    NewSQL:一个优雅的、定义良好的数据库系统,比SQL更易学习和使用,比NoSQL更晚提出的新型数据库。

    NoSQL:顾名思义,就是“不使用SQL”的数据库。这类数据库泛指传统关系型数据库以外的其他类型的数据库。这类数据库有更强的一致性,能处理超大规模和高并发的数据。

    O

    对象数据库(Object Databases):(也称为面象对象数据库)以对象的形式存储数据,用于面向对象编程。它不同于关系型数据库和图形数据库,大部分对象数据库都提供一种查询语言,允许使用声明式编程(declarative programming)访问对象。

    基于对象图像分析(Object-based Image Analysis):数字图像分析方法是对每一个像素的数据进行分析,而基于对象的图像分析方法则只分析相关像素的数据,这些相关像素被称为对象或图像对象。

    操作型数据库(Operational Databases):这类数据库可以完成一个组织机构的常规操作,对商业运营非常重要,一般使用在线事务处理,允许用户访问、收集、检索公司内部的具体信息。

    优化分析(Optimization analysis):在产品设计周期依靠算法来实现的优化过程,在这一过程中,公司可以设计各种各样的产品并测试这些产品是否满足预设值。

    本体论(Ontology):表示知识本体,用于定义一个领域中的概念集及概念之间的关系的一种哲学思想。(译者注:数据被提高到哲学的高度,被赋予了世界本体的意义,成为一个独立的客观数据世界)

    异常值检测(Outlier detection):异常值是指严重偏离一个数据集或一个数据组合总平均值的对象,该对象与数据集中的其他它相去甚远,因此,异常值的出现意味着系统发生问题,需要对此另加分析。

    联机分析处理(On-Line Analytical Processing,OLAP):能让用户轻松制作、浏览报告的工具,这些报告总结相关数据,并从多角度分析。

    P

    模式识别(Pattern Recognition):通过算法来识别数据中的模式,并对同一数据源中的新数据作出预测

    平台即服务(PaaS:Platform-as-a-Service):为云计算解决方案提供所有必需的基础平台的一种服务。

    预测分析(Predictive analysis):大数据分析方法中最有价值的一种分析方法,这种方法有助于预测个人未来(近期)的行为,例如某人很可能会买某些商品,可能会访问某些网站,做某些事情或者产生某种行为。通过使用各种不同的数据集,例如历史数据,事务数据,社交数据,或者客户的个人信息数据,来识别风险和机遇。

    公共数据(Public data):由公共基金创建的公共信息或公共数据集。

    Q

    数字化自我(Quantified Self):使用应用程序跟踪用户一天的一举一动,从而更好地理解其相关的行为。

    R

    R:是一种编程语言,在统计计算方面很出色。如果你不知道 R,你就称不上是数据科学家。R 是数据科学中最受欢迎的语言之一。

    再识别(Re-identification):将多个数据集合并在一起,从匿名化的数据中识别出个人信息。

    回归分析(Regression analysis):确定两个变量间的依赖关系。这种方法假设两个变量之间存在单向的因果关系(译者注:自变量,因变量,二者不可互换)。

    实时数据(Real-time data):指在几毫秒内被创建、处理、存储、分析并显示的数据。

    推荐引擎(Recommendation engine):推荐引擎算法根据用户之前的购买行为或其他购买行为向用户推荐某种产品。

    路径分析(Routing analysis):–针对某种运输方法通过使用多种不同的变量分析从而找到一条最优路径,以达到降低燃料费用,提高效率的目的。

    S

    半结构化数据(Semi-structured data):半结构化数据并不具有结构化数据严格的存储结构,但它可以使用标签或其他形式的标记方式以保证数据的层次结构。

    结构化数据(Structured data):可以组织成行列结构,可识别的数据。这类数据通常是一条记录,或者一个文件,或者是被正确标记过的数据中的某一个字段,并且可以被精确地定位到。

    情感分析(Sentiment Analysis):通过算法分析出人们是如何看待某些话题。

    信号分析(Signal analysis):指通过度量随时间或空间变化的物理量来分析产品的性能。特别是使用传感器数据。

    相似性搜索(Similarity searches):在数据库中查询最相似的对象,这里所说的数据对象可以是任意类型的数据。

    仿真分析(Simulation analysis):仿真是指模拟真实环境中进程或系统的操作。仿真分析可以在仿真时考虑多种不同的变量,确保产品性能达到最优。

    软件即服务(SaaS:Software-as-a-Service):基于Web的通过浏览器使用的一种应用软件。

    空间分析(Spatial analysis):空间分析法分析地理信息或拓扑信息这类空间数据,从中得出分布在地理空间中的数据的模式和规律。

    SQL:在关系型数据库中,用于检索数据的一种编程语言。

    流处理(Stream processing):流处理旨在对有“连续”要求的实时和流数据进行处理。结合流分析,即在流内不间断地计算数学或统计分析的能力。流处理解决方案旨在对高流量进行实时处理。

    T

    时序分析(Time series analysis):分析在重复测量时间里获得的定义良好的数据。分析的数据必须是良好定义的,并且要取自相同时间间隔的连续时间点。

    拓扑数据分析(Topological Data Analysis):拓扑数据分析主要关注三点:复合数据模型、集群的识别、以及数据的统计学意义。

    交易数据(Transactional data):随时间变化的动态数据

    透明性(Transparency):–消费者想要知道他们的数据有什么作用、被作何处理,而组织机构则把这些信息都透明化了。

    文本挖掘(Text Mining):对包含自然语言的数据的分析。对源数据中词语和短语进行统计计算,以便用数学术语表达文本结构,之后用传统数据挖掘技术分析文本结构。

    U

    非结构化数据(Un-structured data):非结构化数据一般被认为是大量纯文本数据,其中还可能包含日期,数字和实例。

    V

    价值(Value):(译者注:大数据4V特点之一)所有可用的数据,能为组织机构、社会、消费者创造出巨大的价值。这意味着各大企业及整个产业都将从大数据中获益。

    可变性(Variability):也就是说,数据的含义总是在(快速)变化的。例如,一个词在相同的推文中可以有完全不同的意思。

    多样(Variety):(译者注:大数据4V特点之一)数据总是以各种不同的形式呈现,如结构化数据,半结构化数据,非结构化数据,甚至还有复杂结构化数据

    高速(Velocity):(译者注:大数据4V特点之一)在大数据时代,数据的创建、存储、分析、虚拟化都要求被高速处理。

    真实性(Veracity):组织机构需要确保数据的真实性,才能保证数据分析的正确性。因此,真实性(Veracity)是指数据的正确性。

    可视化(Visualization):只有正确的可视化,原始数据才可被投入使用。这里的“可视化”并非普通的图型或饼图,可视化指是的复杂的图表,图表中包含大量的数据信息,但可以被很容易地理解和阅读。

    大量(Volume):(译者注:大数据4V特点之一)指数据量,范围从Megabytes至Brontobytes。

    W

    天气数据(Weather data):是一种重要的开放公共数据来源,如果与其他数据来源合成在一起,可以为相关组织机构提供深入分析的依据。

    网络挖掘/网络数据挖掘(Web Mining / Web Data Mining):使用数据挖掘技术从互联网站点、文档或服务中自动发现和提取信息。

    X

    XML数据库(XML Databases):XML数据库是一种以XML格式存储数据的数据库。XML数据库通常与面向文档型数据库相关联,开发人员可以对XML数据库的数据进行查询,导出以及按指定的格式序列化。

    以上就是数据分析相关术语的盘点

    本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

    展开全文
  • 数据库名词解释&概念题

    千次阅读 多人点赞 2019-04-19 19:34:35
    1. 解释事务和程序还有他们的区别。 –事务:事务是数据库提供的一种手段,通过这一手段,应用程序员将一系列的数据库操作组合在一起作为一个整体以便数据库系统提供一组保证,即事务的ACID性质。 –程序:由序列...
  • 一、名词解释 1.虚拟机:指由软件实现的机器,以区别于由固件/硬件实现的物理机器。 2. 系统加速比:总执行时间改进前/总执行时间改进后 3. Amdahl定律:加快某部件执行速度所获得的系统性能加速比,受限于该...
  • |220个遥感名词解释

    千次阅读 2019-08-06 10:17:57
    15. 图像增强:用来改善图像的对比度,突出感兴趣的地物信息,提高图像的目视解释效果。从一般意义上看,图像增强是使得图像看起来更好的图像处理方法。常用 方法如:灰度拉伸、平滑、锐化、彩色合成、代数运算 、...
  • 压力测试:也被称为强度测试,主要通过时间,模拟实际应用的软硬件环境及用户使用过程的系统负荷,长时间或超大负荷的运行测试软件,来测试软件系统的性能、可靠性、稳定性等。 负载测试:负载测试有时也会被称为...
  • 计算机系统结构名词解释

    千次阅读 2020-08-08 21:15:42
    ,是硬件子系统的概念结构及其功能特性 2、地址映象 把虚拟地址空间映象到主存地址空间,具体地说,就是把用户用虚拟地址编写的程序按照某种规则装入到主存储器中,并建立多用户虚地址与主存实地址之间的对应关系...
  • 大数据技术之名词解释

    千次阅读 2018-12-04 14:34:27
    正是因为软件的特性,所以分布式系统具有高度的内聚和透明。因此,网络和分布式系统之间的区别更多的在于高层软件(特别是操作系统),而不是硬件。 Hadoop Hadoop是一个由Apache基金会所开发的分布式系统基础...
  • 地图比例尺指地图上的线段长度与实地...小比例尺地图,内容概括强,不宜于进行图上测量。 地图比例尺是指图上某线段的长度与相应的实地水平距离之比。即:地图比例尺=图上距离/相应实地水平距离。 我国的国家基...
  • 计算机网络名词解释知识点简答题整理

    千次阅读 多人点赞 2020-03-14 11:09:04
    名词解释: 基带传输:比特流直接向电缆发送,无需调制到不同频段; 基带信号:信源发出的没有经过调制的原始电信号; URL:统一资源定位符,标识万维网上的各种文档,全网范围唯一; 传输时延:将分组的所有...
  • 计算机网络-名词解释整理

    千次阅读 2020-02-12 11:29:55
    传输控制与处理功能分离,较大灵活 基本配置: 平衡配置:一个主站控制整个链路 非平衡配置:两个站都是复合站,平等地发起数据传输 站:主站,从站,复合站   29. HTML(超文本标记语言) :...
  • JavaWeb开发常用名词解释

    千次阅读 2018-05-31 10:06:04
    6.CAS(Central Authentication Server)中央认证服务:是 Yale 大学发起的一个开源项目,旨在为 Web 应用系统提供一种可靠的单点登录方法。 7.DSL(Domain Specific Languages领域定义语言):是一种帮助用户从...
  • 计算机网络名词解释和简答

    万次阅读 多人点赞 2017-12-21 11:20:23
     TCP是高度可靠的,而UDP是不可靠的。 16.CSMA的3种形式(非坚持、1-坚持、P-坚持)  1-持续CSMA(1-persistent CSMA):当信道忙或发生冲突时,要发送帧的站,不断持续侦听,一有空闲,便可发送. 其中,长的传播延迟...
  • 计算机类相关专业名词解释

    千次阅读 2019-07-29 13:19:28
    服务器的构成包括处理器、硬盘、内存、系统总线等,和通用的计算机架构类似,但是由于需要提供高可靠的服务,因此在处理能力、稳定性、可靠性、安全性、可扩展性、可管理性等方面要求较高。在网络环境下,根据服务器...
  • 大数据名词解释

    千次阅读 2020-05-11 18:04:29
    大数据名词解释大数据知识体系架构第一阶段:Hadoop一、ELK技术栈:二、HDFS:Hadoop分布式文件系统三、MapReduce:四、Apache Hive:五、Apache HBase:六、Apache Sqoop:七、Zeppelin可视化:第二阶段:Spark一、Scala...
  • 集群(cluster)技术是一种较新的技术,通过集群技术,可以在付出较低成本的情况下获得在性能、可靠性、灵活性方面的相对较高的收益,其任务调度则是集群系统中的核心技术。用户若想扩展系统能力,不得不购买更高...
  • 计算机网络常用名词解释&概念题

    千次阅读 2018-10-31 20:52:18
    OSI七层参考模型 应用层:应用层是用户与网络的界面,应用层需要采用不同的...传输层:负责主机中的两个进程间的通信,为端到端的连接提供可靠的传输服务,为端到端的连接提供流量控制、差错控制、服务质量、数据...
  • 操作系统名词解释 操作系统 操作系统是一个控制程序,作为一个系统软件给用户程序提供各种服务,防止错误,方便用户使用。是一个资源管理器,有效组织管理计算机硬件和软件资源,解决资源访问冲突。 分时系统 在一台...
  • 各种文件系统名词解释

    千次阅读 2017-10-16 14:06:23
    可靠性的底层存储支持。 FastDFS: 是淘宝开源的一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。...
  • linux名词解释

    千次阅读 2019-04-10 08:39:44
    Secure Shell 安全外壳协议,SSH 是目前较可靠,专为远程登录会话和其他网络服务提供安全的协议。 ftp、pop和telnet在本质上都是不安全的,因为它们在网络上用明文传送口令和数据。 SSL Secure Sockets Layer...
  • 试在交互性及时性和可靠性方面将分时系统与实时系统进行比 较. a. 分时系统是一种通用系统主要用于运行终端用户程序因而它具有 较强的交互能力而实时系统虽然也有交互能力但其交互能力不及前 者.
  • 软件工程常见名词解释&概念题

    千次阅读 2019-04-19 19:48:20
    优点:设计机制清晰,易于理解,支持并行开发,更好的可复用和内部可修改 缺点:交互协议难以修改,性能损失(禁止跨层调用,每次请求都要层次深入,多次调用,可能生成冗余的调用处理),难以确定层次数量和...
  • DEM、DSM、DOM 名词解释

    千次阅读 2017-11-25 20:13:00
    它可作为背景控制信息,评价其它数据的精度、现实和完整,也可从中提取自然资源和社会经济发展信息,为防灾治害和公共设施建设规划等应用提供可靠依据。 ) 转载于:...
  • 信息安全常见名词解释

    万次阅读 多人点赞 2016-10-06 10:17:36
    32.VxWorks:嵌入式实时操作系统,它以其良好的可靠性和卓越的实时性被广泛地应用在通信、军事、航空、航天等高精尖技术及实时性要求极高的领域中。 33.双因子认证:常规密码、挑战应答、动态口令、物理设备、...
  • Storm相关名词解释

    千次阅读 2015-08-21 10:38:37
    同Hadoop一样Storm也可以处理大批量的数据,然而Storm在保证高可靠性的前提下还可以让处理进行的更加实时;也就是说,所有的信息都会被处理。Storm同样还具备容错和分布计算这些特性,这就让Storm可以扩展到不同的...
  • AI 可靠性论文整理

    千次阅读 多人点赞 2019-09-25 11:35:10
    AI 可靠性论文整理鲁棒性 Robustness相关文献高优先级对抗样本设计与抵御...Lineage相关文献名词解释 鲁棒性 Robustness 通过暴露和修复漏洞来确保AI系统的安全性和可靠性 识别并防御新的攻击 设计新的对抗性训练方...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 17,779
精华内容 7,111
关键字:

名词解释可靠性