精华内容
下载资源
问答
  • 使用spaCy POS标记的术语提取算法的Python实现,例如C值,基本,组合基本,怪异和术语提取器。 如果您对其他ATE算法有建议,则希望在此软件包中实施该算法,并将其作为该算法所基于的论文的一个问题。 对于用...
  • 知识图谱术语抽取

    2020-12-08 11:25:38
    术语抽取 术语抽取简介 术语: • 代表文章重要内容的一组词,可用于构建术语的上下位关系和其他本体关系,并且对文本聚类、分类、自动摘要等应用起到重要支撑作用 术语抽取: • 提高信息获取效率 • 信息处理中...

    术语抽取

    术语抽取简介

     

    术语:
    代表文章重要内容的一组词,可用于构建术语的上下位关系和其他本体关系,并且对文本聚类、分类、自动摘要等应用起到重要支撑作用

    术语抽取:
    • 提高信息获取效率
    • 信息处理中一个很重要的课题;
    • 有利于信息检索、数据挖掘、建立领域概念体系等自然语言处理课题的研究

    高质量短语:

    连续出现的单词序列,本质上是一个N-Gram, N指短语的长度。

    例:support vector machine

    1-Gram:support,vector,machine

    2-Gram:support vector,vector machine

    3-Gram:support vector machine

    高质量短语评估标准:

    a) 频率:一个N-Gram出现的频率越高,是高质量短语的可能性越大

    b) 一致性:N-Gram中的单词搭配是否合理

    c) 信息量:高质量的短语需要表达一定的主题和概念 例:“机器学习”和“这篇文章”相比,在机器学习的语料库中,前者的质量更高

    a) 完整性:高质量的短语需要是一个完整的语义单元 例:“支持向量机“与“向量机”相比完整性要更高

     

    术语抽取实现算法

    有监督(不常用)

    无监督: 基于统计特征;基于词图模型;基于主题模型

    深度学习:基于Word2Vec词聚类算法

     

    基于统计特征-TF-IDF

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    展开全文
  • 该方法将术语提取视为分类任务,因为提取的目的可以看作是将候选分类为术语或非术语。 下图显示了 MATE-ML 的四个步骤,它们是完全自动化的,并允许根据将使用提取的术语的应用程序调整它们。 输入:语料库、通用...
  • 用于开发、评估和测试关键字提取算法的不同数据集。 有关基准性能,请参阅:O. Medelyan。 2009. 。 博士论文。 新西兰怀卡托大学。 使用受控词汇表或同义词库作为来源提取关键字: NLM_500.zip - 500 个带有 MeSH ...
  • 针对科技资源中缩略语大量出现,但传统算法识别准确率不高,运行速度较慢问题,提出一种基于逆序扫描和共现分析相结合的术语缩略语快速提取算法。从科技资源中提取缩略语、候选全称及上下文信息;采用启发式模糊匹配...
  • 我觉得这个算法可用于帮助译者提取一篇待译文章中的“术语”,所以准备写一篇文章来简要介绍这个算法的实现方法。我将使用百度的分词技术来处理中文文本,用以计算中文词语的“TF-IDF”值。在本公众号之前的文章中,...
  • 实验表明,该算法是一种有效的重复模式提取算法,其I/O读写次数同语料规模呈线性关系,远小于使用首字符进行语料划分的方法,能快速有效地从规模远大于内存容量的文本语料中提取重复模式,特别适合于大规模语料的高频重复...
  • 领域词典作为中文信息处理的基础,在各个领域都有着重要的应用。而人工构建领域词典不仅工作量大,而且缺乏时效性。...实验证明,本文提出的算法不仅能够有效地提取术语,同时在小语料和低词频情况下也能取得较好的效果。
  • 了解信息隐藏中最常用的LSB算法特点,掌握LSB算法原理,设计并实现一种基于图像的LSB隐藏算法;了解如何通过峰值信噪比来对图像质量进行客观评价,并计算峰值信噪比。 【实验环境】 (1) Windows XP 或 Vista 操作...

    0x00 信息内容安全实验报告

    【实验目的】

    了解信息隐藏中最常用的LSB算法特点,掌握LSB算法原理,设计并实现一种基于图像的LSB隐藏算法;了解如何通过峰值信噪比来对图像质量进行客观评价,并计算峰值信噪比。

    【实验环境】

    (1) Windows XP 或 Vista 操作系统;

    (2) Matlab7.1 科学计算软件;

    (3) BMP 灰度图像文件。

    【原理简介】

    任何多媒体信息,在数字化时,都会产生物理随机噪,而人的感观系统对这些随机噪声不敏感。信息隐藏技术就是利用这个原理,通过使用秘密信息比特替换随机噪声,从而完成信息隐藏目标。

    BMP 灰度图像的每个像素值为 8bit 二进制值,表示该点亮度。不同位平面对视觉影响不同,图像高位平面对图像感官质量起主要作用,去除图像最低位平面并不会造成画面质量的明显下降。利用这个原理可用秘密信息(或称水印信息)替代载体图像低位平面以实现信息嵌入。

    本实验中算法选用最低位平面来嵌入秘密信息。最低位平面对图像的视觉效果影响最轻微,但很容易受噪声影响和攻击,解决办法可采用冗余嵌入的方式来增强稳健性。即在一个区域(多个像素)中嵌入相同的信息,提取时根据该区域中的所有像素判断。


    因为暂时还没来得及学习 Matlab 的使用,所以先简单地用 python 实现一下,且以 RGB 图像为例。

    0x01 Hide

    from PIL import Image
    
    def mod(x,y):
        return x % y
    
    def bin_ord(flag):
    	string = ""
    	with open(flag) as f:
    		txt = f.read()
    		for i in range(len(txt)):
    			string = string + bin(ord(txt[i])).replace('0b','').zfill(8)
    	return string
    
    def hide(pic,flag,new_pic):
    	count = 0
    	im = Image.open(pic)
    	width = im.size[0]
    	height = im.size[1]
    	string = bin_ord(flag)
    	for h in range(height):
    		for w in range(width):
    			pixel = im.getpixel((w,h))
    			x = pixel[0]
    			y = pixel[1]
    			z = pixel[2]
    			if count == len(string):
    				break
    			x = x - mod(x,2) + int(string[count]) 
    			im.putpixel((w,h),(x,y,z))
    			count = count + 1
    			if count == len(string):
    				break
    			y = y - mod(y,2) + int(string[count]) 
    			im.putpixel((w,h),(x,y,z))
    			count = count + 1
    			if count == len(string):
    				break
    			z = z - mod(z,2) + int(string[count])
    			im.putpixel((w,h),(x,y,z))
    			count = count + 1
    	im.save(new_pic)
    
    pic = r"C:\Users\lyz\Desktop\test.png"
    
    flag = r"C:\Users\lyz\Desktop\flag.txt"
    
    new_pic = r"C:\Users\lyz\Desktop\new.png"
    
    hide(pic,flag,new_pic)
    

    虽然标准 ASCII 是 7 位编码,但由于计算机基本处理单位为字节( 1byte = 8bit ),所以一般仍以一个字节来存放一个 ASCII 字符。

    隐写前的图片:
    在这里插入图片描述
    隐写后的图片:
    在这里插入图片描述
    隐写的内容:
    在这里插入图片描述

    0x02 Extract

    from PIL import Image
    
    def mod(x,y):
    	return x % y
    
    def extract(pic,lenth,hide):
    	binary = ""
    	string = ""
    	count = 0
    	im = Image.open(pic)
    	width = im.size[0]
    	height = im.size[1]
    	for h in range(height):
    		for w in range(width):
    			pixel = im.getpixel((w,h))
    			x = pixel[0]
    			y = pixel[1]
    			z = pixel[2]
    			if count == lenth:
    				break
    			binary = binary + str(mod(x,2))
    			count = count + 1
    			if count == lenth:
    				break
    			binary = binary + str(mod(y,2))
    			count = count + 1
    			if count == lenth:
    				break
    			binary = binary +str(mod(z,2))
    			count = count + 1
    	with open(hide,"w",encoding="UTF-8") as f:
    		for i in range(0,len(binary),8):
    			string = string + chr(int(binary[i:i+8],2))
    		f.write(string)
    
    pic = r"C:\Users\lyz\Desktop\new.png"
    
    lenth = 200
    
    hide = r"C:\Users\lyz\Desktop\hide.txt"
    
    extract(pic,lenth,hide)
    

    提取的内容:
    在这里插入图片描述

    0x03 PSNR

    峰值信噪比(英语:Peak signal-to-noise ratio,常缩写为PSNR)是一个表示信号最大可能功率和影响它的表示精度的破坏性噪声功率的比值的工程术语。由于许多信号都有非常宽的动态范围,峰值信噪比常用对数分贝单位来表示。
    峰值信噪比经常用作图像压缩等领域中信号重建质量的测量方法,它常简单地通过均方误差(MSE)进行定义。两个 m×n 单色图像 I 和 K,如果一个为另外一个的噪声近似,那么它们的均方误差定义为:
    在这里插入图片描述
    峰值信噪比定义为:
    在这里插入图片描述
    其中,MAXI是表示图像点颜色的最大数值,如果每个采样点用 8 位表示,那么就是 255。更为通用的表示是,如果每个采样点用B位线性脉冲编码调制表示,那么MAXI就是:
    在这里插入图片描述
    对于每点有RGB三个值的彩色图像来说峰值信噪比的定义类似,只是均方误差是所有方差之和除以图像尺寸再除以3。
    图像压缩中典型的峰值信噪比值在 30 到 40dB 之间,愈高愈好。

    import cv2 as cv
    import math
    import numpy as np
    
    
    def psnr(old_pic,new_pic):
    	mse = np.mean((old_pic/1.0-new_pic/1.0)**2)
    	if mse < 1e-10:
    		return 100
    	psnr = 20*math.log10(255/math.sqrt(mse))
    	return psnr
    
    old_pic = cv.imread(r"C:\Users\lyz\Desktop\test.bmp")
    
    new_pic = cv.imread(r"C:\Users\lyz\Desktop\new.bmp")
    
    if __name__ == '__main__':
    	res= psnr(old_pic,new_pic)
    	print("psnr:",res)
    

    运行结果如下:
    在这里插入图片描述

    0x04 Summary

    网上的图片大多数都是 jpg 格式。在实验过程中,jpg 后缀的图片无法完成隐写,而将图片后缀改为 png 或 bmp 后,均能成功完成隐写。

    格式压缩模式透明支持
    JPG有损压缩不支持
    PNG无损压缩支持
    BMP无压缩不支持

    JPG:使用的一种失真压缩标准方法,24 bit真彩色,不支持动画、不支持透明色。JPEG的压缩方式通常是破坏性资料压缩(lossy compression),即在压缩过程中图像的品质会遭受到可见的破坏。一张图片多次上传下载后,图片逐渐会失真。

    PNG:格式是无损数据压缩的,PNG格式有8位、24位、32位三种形式,其中8位PNG支持两种不同的透明形式(索引透明和alpha透明),24位PNG不支持透明,32位PNG在24位基础上增加了8位透明通道(32-24=8),因此可展现256级透明程度。

    BMP:是一种与硬件设备无关的图像文件格式,使用非常广。它采用位映射存储格式,除了图像深度可选以外,不采用其他任何压缩,因此,BMP图像所占用的空间很大。BMP文件的图像深度可选lbit、4bit、8bit及24bit。BMP文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。

    JPG:
    在这里插入图片描述
    在这里插入图片描述
    PNG:
    在这里插入图片描述
    在这里插入图片描述
    BMP:
    在这里插入图片描述
    在这里插入图片描述

    LSB算法
    .
    全称为Least Significant Bit,在二进制数中意为最低有效位,一般来说,MSB(最高有效位)位于二进制数的最左侧,LSB位于二进制数的最右侧。
    .
    由于图像的每一个像素点都是由RGB(红、绿、蓝)三原色组成,而这三种颜色又可以组合成各种其它颜色,每个颜色占8位(如#FFFFFF),LSB隐写即是修改每个颜色值的最低一位,将其替换为我们想要嵌入的信息中的内容,以此来实现数据隐藏。
    .
    一个像素点包含三种颜色,每个颜色修改最后1位,这样一个像素点就可以携带3位信息。
    .
    应用LSB算法的图像格式需为位图形式,即图像不能经过压缩,如LSB算法多应用于png、bmp等格式,而jpg格式较少。
    .
    详细参考:https://wenku.baidu.com/view/ff590e9d5f0e7cd1842536d7.html
    .
    Python Imaging Library
    .
    Python Imaging
    Library(简称PIL)为Python解释器提供了图像处理的功能,PIL提供了广泛的文件格式支持、高效的内部表示以及相当强大的图像处理功能。PIL图像处理库的核心被设计成为能够快速访问以几种基本像素类型表示的图像数据,它为通用图像处理工具提供了一个坚实基础。
    .
    结合PIL可以方便的编写Python脚本处理图片隐写问题。
    .
    StegSolve
    .
    StegSolve是一款基于Java开发的流行图片隐写分析软件,其支持常见的图片文件格式,可以对不同的文件进行结合(包括XOR、ADD、SUB等操作),可以对图片文件格式进行分析,可以提取GIF文件中的帧等,覆盖了基本的图片隐写分析需求。

    展开全文
  • 算法常用术语中英对照

    万次阅读 2018-11-19 23:12:06
    算法常用术语中英对照 Data Structures 基本数据结构 Dictionaries 字典 Priority Queues 堆 Graph Data Structures 图 Set Data Structures 集合 Kd-Trees 线段树 Numerical Problems 数值问题 Solving Linear ...

    算法常用术语中英对照

    Data Structures 基本数据结构
    Dictionaries 字典
    Priority Queues 堆
    Graph Data Structures 图
    Set Data Structures 集合
    Kd-Trees 线段树
    Numerical Problems 数值问题
    Solving Linear Equations 线性方程组
    Bandwidth Reduction 带宽压缩
    Matrix Multiplication 矩阵乘法
    Determinants and Permanents 行列式
    Constrained and Unconstrained Optimization 最值问题
    Linear Programming 线性规划
    Random Number Generation 随机数生成
    Factoring and Primality Testing 因子分解/质数判定
    Arbitrary Precision Arithmetic 高精度计算
    Knapsack Problem 背包问题
    Discrete Fourier Transform 离散Fourier变换
    Combinatorial Problems 组合问题
    Sorting 排序
    Searching 查找
    Median and Selection 中位数
    Generating Permutations 排列生成
    Generating Subsets 子集生成
    Generating Partitions 划分生成
    Generating Graphs 图的生成
    Calendrical Calculations 日期
    Job Scheduling 工程安排
    Satisfiability 可满足性
    Graph Problems – polynomial 图论-多项式算法
    Connected Components 连通分支
    Topological Sorting 拓扑排序
    Minimum Spanning Tree 最小生成树
    Shortest Path 最短路径
    Transitive Closure and Reduction 传递闭包
    Matching 匹配
    Eulerian Cycle / Chinese Postman Euler回路/中国邮路
    Edge and Vertex Connectivity 割边/割点
    Network Flow 网络流
    Drawing Graphs Nicely 图的描绘
    Drawing Trees 树的描绘
    Planarity Detection and Embedding 平面性检测和嵌入
    Graph Problems – hard 图论-NP问题
    Clique 最大团
    Independent Set 独立集
    Vertex Cover 点覆盖
    Traveling Salesman Problem 旅行商问题
    Hamiltonian Cycle Hamilton回路
    Graph Partition 图的划分
    Vertex Coloring 点染色
    Edge Coloring 边染色
    Graph Isomorphism 同构
    Steiner Tree Steiner树
    Feedback Edge/Vertex Set 最大无环子图
    Computational Geometry 计算几何
    Convex Hull 凸包
    Triangulation 三角剖分
    Voronoi Diagrams Voronoi图
    Nearest Neighbor Search 最近点对查询
    Range Search 范围查询
    Point Location 位置查询
    Intersection Detection 碰撞测试
    Bin Packing 装箱问题
    Medial-Axis Transformation 中轴变换
    Polygon Partitioning 多边形分割
    Simplifying Polygons 多边形化简
    Shape Similarity 相似多边形
    Motion Planning 运动规划
    Maintaining Line Arrangements 平面分割
    Minkowski Sum Minkowski和
    Set and String Problems 集合与串的问题
    Set Cover 集合覆盖
    Set Packing 集合配置
    String Matching 模式匹配
    Approximate String Matching 模糊匹配
    Text Compression 压缩
    Cryptography 密码
    Finite State Machine Minimization 有穷自动机简化
    Longest Common Substring 最长公共子串
    Shortest Common Superstring 最短公共父串
    DP——Dynamic Programming——动态规划
    recursion —— 递归

    编程词汇
    A2A integration A2A整合
    abstract 抽象的
    abstract base class (ABC)抽象基类
    abstract class 抽象类
    abstraction 抽象、抽象物、抽象性
    access 存取、访问
    access level访问级别
    access function 访问函数
    account 账户
    action 动作
    activate 激活
    active 活动的
    actual parameter 实参
    adapter 适配器
    add-in 插件
    address 地址
    address space 地址空间
    address-of operator 取地址操作符
    ADL (argument-dependent lookup)
    ADO(ActiveX Data Object)ActiveX数据对象
    advanced 高级的
    aggregation 聚合、聚集
    algorithm 算法
    alias 别名
    align 排列、对齐
    allocate 分配、配置
    allocator分配器、配置器
    angle bracket 尖括号
    annotation 注解、评注
    API (Application Programming Interface) 应用(程序)编程接口
    app domain (application domain)应用域
    application 应用、应用程序
    application framework 应用程序框架
    appearance 外观
    append 附加
    architecture 架构、体系结构
    archive file 归档文件、存档文件
    argument引数(传给函式的值)。参见parameter
    array 数组
    arrow operator 箭头操作符
    ASP(Active Server Page)活动服务器页面
    ASP.NET worker process ASP.NET工作者进程
    assembly 装配件、配件
    assembly language 汇编语言
    assembly manifest 装配件清单
    assert(ion) 断言
    assign 赋值
    assignment 赋值、分配
    assignment operator 赋值操作符
    associated 相关的、相关联的
    associative container 关联式容器(对应sequential container)
    asynchronous 异步的
    atomic 原子的
    atomic operation 原子操作
    attribute 特性、属性
    authentication service 验证服务
    authorization 授权
    audio 音频
    A.I. 人工智能
    B2B integration B2B整合、B2B集成(business-to-business integration)
    background 背景、后台(进程)
    backward compatible 向后兼容、向下兼容
    backup 备份
    backup device备份设备
    backup file 备份文件
    bandwidth 带宽
    base class 基类
    base type 基类型
    batch 批处理
    BCL (base class library)基类库
    binary 二进制
    binary search 二分查找
    binary tree 二叉树
    binary function 双参函数
    binary large object二进制大对象
    binary operator 二元操作符
    binding 绑定
    bit 位
    bitmap 位图
    bitwise 按位…
    bitwise copy 为单元进行复制;位元逐一复制,按位拷
    bitwise operation 按位运算
    block 块、区块、语句块
    bookkeeping 簿记
    boolean 布林值(真假值,true或false)
    border 边框
    bounds checking 边界检查
    boxing 装箱、装箱转换
    brace (curly brace) 大括号、花括号
    bracket (square brakcet) 中括号、方括号
    breakpoint 断点
    browser applications 浏览器应用(程序)
    browser-accessible application 可经由浏览器访问的应用程序
    build 编连(专指编译和连接
    built-in 内建、内置
    bus 总线
    business 业务、商务(看场合)
    business Logic 业务逻辑
    business rules 业务规则
    buttons 按钮
    bug 臭虫
    by/through 通过
    byte 位元组(由8 bits组成)
    cache 高速缓存
    calendar 日历
    call 调用
    callback 回调
    call-level interface (CLI)调用级接口(CLI)
    call operator 调用操作符
    candidate key 候选键 (for database)
    cascading delete 级联删除 (for database)
    cascading update 级联更新 (for database)
    casting 转型、造型转换
    catalog 目录
    chain 链(function calls)
    character 字符
    character format 字符格式
    character set 字符集
    CHECK constraints CHECK约束 (for database)
    checkpoint 检查点 (for database)
    check box 复选框
    check button 复选按钮
    child class 子类
    CIL (common intermediate language)通用中间语言、通用中介语言
    class 类
    class declaration 类声明
    class definition 类定义
    class derivation list 类继承列表
    class factory 类厂
    class hierarchy 类层次结构
    class library 类库
    class loader 类装载器
    class template 类模板
    class template partial specializations 类模板部分特化
    class template specializations 类模板特化
    classification 分类
    clause 子句
    client application 客户端应用程序
    client cursor 客户端游标 (for database)
    code page 代码页
    cleanup 清理、清除
    CLI (Common Language Infrastructure) 通用语言基础设施
    client 客户、客户端
    client area 客户区
    client-server 客户机/服务器、客户端/服务器
    clipboard 剪贴板
    clone 克隆
    CLS (common language specification) 通用语言规范
    code access security 代码访问安全
    COFF (Common Object File Format) 通用对象文件格式
    collection 集合
    COM (Component Object Model) 组件对象模型
    combo box 组合框
    command line 命令行
    comment 注释
    commit 提交 (for database)
    communication 通讯
    compatible 兼容
    compile time 编译期、编译时
    compiler 编译器
    component组件
    composite index 复合索引、组合索引 (for database)
    composite key 复合键、组合键 (for database)
    composition 复合、组合
    concept 概念
    concrete具体的
    concrete class 具体类
    concurrency 并发、并发机制
    constraint 约束 (for database)
    configuration 配置、组态
    connection 连接 (for database)
    connection pooling 连接池
    console 控制台
    constant 常量
    construct 构件、成分、概念、构造(for language)
    constructor (ctor) 构造函数、构造器
    container 容器
    containment包容
    context 环境、上下文
    control 控件
    cookie (不译)
    copy 拷贝
    CORBA 通用对象请求中介架构(Common Object Request Broker Architecture)
    cover 覆盖、涵盖
    create/creation 创建、生成
    crosstab query 交叉表查询 (for database)
    CRTP (curiously recurring template pattern)
    CTS (common type system)通用类型系统
    cube 多维数据集 (for database)
    cursor 光标
    cursor 游标 (for database)
    custom 定制、自定义
    data 数据
    data connection 数据连接 (for database)
    Data Control Language (DCL) 数据控制语言(DCL) (for database)
    Data Definition Language (DDL) 数据定义语言(DDL) (for database)
    data dictionary 数据字典 (for database)
    data dictionary view 数据字典视图 (for database)
    data file 数据文件 (for database)
    data integrity 数据完整性 (for database)
    data manipulation language (DML)数据操作语言(DML) (for database)
    data mart 数据集市 (for database)
    data pump 数据抽取 (for database)
    data scrubbing 数据清理 (for database)
    data source 数据源 (for database)
    Data source name (DSN) 数据源名称(DSN) (for database)
    data warehouse 数据仓库 (for database)
    dataset 数据集 (for database)
    database 数据库 (for database)
    database catalog 数据库目录 (for database)
    database diagram 数据关系图 (for database)
    database file 数据库文件 (for database)
    database object 数据库对象 (for database)
    database owner 数据库所有者 (for database)
    database project 数据库工程 (for database)
    database role 数据库角色 (for database)
    database schema 数据库模式、数据库架构 (for database)
    database script 数据库脚本 (for database)
    data-bound 数据绑定 (for database)
    data-aware control数据感知控件 (for database)
    data member 数据成员、成员变量
    dataset 数据集 (for database)
    data source 数据源 (for database)
    data structure数据结构
    data table 数据表 (for database)
    datagram 数据报文
    DBMS (database management system)数据库管理系统 (for database)
    DCOM (distributed COM)分布式COM
    dead lock 死锁 (for database)
    deallocate 归还
    debug 调试
    debugger 调试器
    decay 退化
    decision support 决策支持
    declaration 声明
    declarative referential integrity (DRI)声明引用完整性(DRI) (for database)
    deduction 推导
    DEFAULT constraint默认约束 (for database)
    default database 默认数据库 (for database)
    default instance 默认实例 (for database)
    default result set 默认结果集 (for database)
    default 缺省、默认值
    defer 推迟
    definition 定义
    delegate 委托
    delegation 委托
    dependent name
    deploy 部署
    dereference 解引用
    dereference operator (提领)运算子
    derived class 派生类
    design by contract 契约式设计
    design pattern 设计模式
    destroy 销毁
    destructor(dtor)析构函数、析构器
    device 设备
    DHTML (dynamic HyperText Markup Language)动态超文本标记语言
    dialog 对话框
    digest 摘要
    digital 数字的
    DIME (Direct Internet Message Encapsulation)直接Internet消息封装
    directive (编译)指示符
    directory 目录
    dirty pages脏页 (for database)
    dirty read 脏读 (for database)
    disassembler 反汇编器
    DISCO (Discovery of Web Services)Web Services的查找
    disk 盘
    dispatch 调度、分派、派发(我喜欢“调度”)
    DISPID (Dispatch Identifier)分派标识符
    distributed computing 分布式计算
    distributed query 分布式查询 (for database)
    DNA (Distributed interNet Application) 分布式网间应用程序
    document 文档
    DOM (Document Object Model)文档对象模型
    dot operator (圆)点操作符
    driver 驱动(程序)
    DTD (document type definition) 文档类型定义
    double-byte character set (DBCS)双字节字符集(DBCS)
    dump 转储
    dump file 转储文件
    dynamic cursor 动态游标 (for database)
    dynamic filter 动态筛选 (for database)
    dynamic locking 动态锁定 (for database)
    dynamic recovery 动态恢复 (for database)
    dynamic snapshot 动态快照 (for database)
    dynamic SQL statements 动态SQL语句 (for database)
    dynamic assembly 动态装配件、动态配件
    dynamic binding 动态绑定
    EAI (enterprise application integration)企业应用程序集成(整合)
    EBCO (empty base class optimization) 空基类优化(机制)
    e-business 电子商务
    EDI (Dlectronic Data Interchange)电子数据交换
    efficiency 效率
    efficient 高效
    end-to-end authentication 端对端身份验证
    end user 最终用户
    engine 引擎
    entity 实体
    encapsulation 封装
    enclosing class 外围类别(与巢状类别 nested class有关)
    enum (enumeration) 枚举
    enumerators 枚举成员、枚举器
    equal 相等
    equality 相等性
    equality operator 等号操作符
    error log 错误日志 (for database)
    escape code 转义码
    escape character 转义符、转义字符
    exclusive lock 排它锁 (for database)
    explicit transaction 显式事务 (for database)
    evaluate 评估
    event 事件
    event driven 事件驱动的
    event handler 事件处理器
    evidence 证据
    exception 异常
    exception declaration 异常声明
    exception handling 异常处理、异常处理机制
    exception-safe 异常安全的
    exception specification 异常规范
    exit 退出
    explicit 显式
    explicit specialization 显式特化
    export 导出
    expression 表达式
    facility 设施、设备
    fat client 胖客户端
    feature 特性、特征
    fetch 提取
    field 字段(java)
    field 字段 (for database)
    field length 字段长度 (for database)
    file 文件
    filter 筛选 (for database)
    finalization 终结
    firewall 防火墙
    finalizer 终结器
    firmware 固件
    flag 标记
    flash memory 闪存
    flush 刷新
    font 字体
    foreign key (FK) 外键(FK) (for database)
    form 窗体
    formal parameter 形参
    forward declaration 前置声明
    forward-only 只向前的
    forward-only cursor 只向前游标 (for database)
    fragmentation 碎片 (for database)
    framework 框架
    full specialization 完全特化
    function 函数
    function call operator (即operator ()) 函数调用操作符
    function object 函数对象
    function overloaded resolution函数重载决议
    functionality 功能
    function template函数模板
    functor 仿函数
    GAC (global assembly cache) 全局装配件缓存、全局配件缓存
    GC (Garbage collection) 垃圾回收(机制)、垃圾收集(机制)
    game 游戏
    generate 生成
    generic 泛化的、一般化的、通用的
    generic algorithm通用算法
    genericity 泛型
    getter (相对于 setter)取值函数
    global 全局的
    global object 全局对象
    global scope resolution operator 全局范围解析操作符
    grant 授权 (for database)
    granularity 粒度
    group 组、群
    group box 分组框
    GUI 图形界面
    GUID (Globally Unique Identifier) 全球唯一标识符
    hand shaking 握手
    handle 句柄
    handler 处理器
    hard-coded 硬编码的
    hard-copy 截屏图
    hard disk 硬盘
    hardware 硬件
    hash table 散列表、哈希表
    header file头文件
    heap 堆
    help file 帮助文件
    hierarchy 层次结构、继承体系
    hierarchical data 阶层式数据、层次式数据
    hook 钩子
    Host (application)宿主(应用程序)
    hot key 热键
    hyperlink 超链接
    HTML (HyperText Markup Language) 超文本标记语言
    HTTP pipeline HTTP管道
    HTTP (HyperText Transfer Protocol) 超文本传输协议
    icon 图标
    IDE (Integrated Development Environment)集成开发环境
    IDL (Interface Definition Language) 接口定义语言
    identifier 标识符
    idle time 空闲时间
    if and only if当且仅当
    IL (Intermediate Language) 中间语言、中介语言
    image 图象
    IME 输入法
    immediate base 直接基类
    immediate derived 直接派生类
    immediate updating 即时更新 (for database)
    implicit transaction隐式事务 (for database)
    incremental update 增量更新 (for database)
    index 索引 (for database)
    implement 实现
    implementation 实现、实现品
    implicit 隐式
    import 导入
    increment operator 增加操作符
    infinite loop 无限循环
    infinite recursive 无限递归
    information 信息
    infrastructure 基础设施
    inheritance 继承、继承机制
    inline 内联
    inline expansion 内联展开
    initialization 初始化
    initialization list 初始化列表、初始值列表
    initialize 初始化
    inner join 内联接 (for database)
    in-place active 现场激活
    instance 实例
    instantiated 具现化、实体化(常应用于template)
    instantiation 具现体、具现化实体(常应用于template)
    integrate 集成、整合
    integrity 完整性、一致性
    integrity constraint完整性约束 (for database)
    interprocess communication (IPC)进程间通讯(IPC)
    interacts 交互
    interface 接口
    for GUI 界面
    interoperability 互操作性、互操作能力
    interpreter 解释器
    introspection 自省
    invariants 不变性
    invoke 调用
    isolation level 隔离级别 (for database)
    iterate 迭代
    iterative 反复的、迭代的
    iterator 迭代器
    iteration 迭代(回圈每次轮回称为一个iteration)
    item 项、条款、项目
    JIT compilation JIT编译 即时编译
    key 键 (for database)
    key column 键列 (for database)
    laser 激光
    late binding 迟绑定
    left outer join 左向外联接 (for database)
    level 阶、层例
    high level 高阶、高层
    library 库
    lifetime 生命期、寿命
    link 连接、链接
    linkage 连接、链接
    linker 连接器、链接器
    literal constant 字面常数
    list 列表、表、链表
    list box 列表框
    livelock 活锁 (for database)
    load 装载、加载
    load balancing 负载平衡
    loader 装载器、载入器
    local 局部的
    local object 局部对象
    lock 锁
    log 日志
    login 登录
    login security mode登录安全模式 (for database)
    lookup table 查找表 (for database)
    loop 循环
    loose coupling 松散耦合
    lvalue 左值
    machine code 机器码、机器代码
    macro 宏
    maintain 维护
    managed code 受控代码、托管代码
    Managed Extensions 受控扩充件、托管扩展
    managed object 受控对象、托管对象
    mangled name
    manifest 清单
    manipulator 操纵器(iostream预先定义的一种东西)
    many-to-many relationship 多对多关系 (for database)
    many-to-one relationship 多对一关系 (for database)
    marshal 列集
    member 成员
    member access operator 成员取用运算子(有dot和arrow两种)
    member function 成员函数
    member initialization list成员初始值列表
    memberwise 以member为单元…、members 逐一…
    memberwise copy
    memory 内存
    memory leak 内存泄漏
    menu 菜单
    message 消息
    message based 基于消息的
    message loop 消息环
    message queuing消息队列
    metadata 元数据
    metaprogramming元编程
    method 方法
    micro 微
    middleware 中间件
    middle tier 中间层
    modeling 建模
    modeling language 建模语言
    modifier 修饰字、修饰符
    modem 调制解调器
    module 模块
    most derived class最底层的派生类
    mouse 鼠标
    mutable 可变的
    mutex 互斥元、互斥体
    multidimensional OLAP (MOLAP) 多维OLAP(MOLAP) (for database)
    multithreaded server application 多线程服务器应用程序
    multiuser 多用户
    multi-tasking 多任务
    multi-thread 多线程
    multicast delegate 组播委托、多点委托
    named parameter 命名参数
    named pipe 命名管道
    namespace 名字空间、命名空间
    native 原生的、本地的
    native code 本地码、本机码
    Native Image Generator (NGEN)本地映像生成器
    nested class 嵌套类
    nested query 嵌套查询 (for database)
    nested table 嵌套表 (for database)
    network 网络
    network card 网卡
    nondependent name
    object 对象
    object based 基于对象的
    object file 目标文件
    object model 对象模型
    object oriented 面向对象的
    object pooling 对象池化
    ODBC data source ODBC数据源 (for database)
    ODBC driver ODBC驱动程序 (for database)
    ODR (one-definition rule)
    OLE Automation objects OLE自动化对象 (for database)
    OLE Automation server OLE自动化服务器 (for database)
    OLE DB consumer OLE DB使用者 (for database)
    OLE DB for OLAP 用于OLAP的OLE DB (for database)
    OLE DB provider OLE DB提供者 (for database)
    one-to-many relationship 一对多关系 (for database)
    one-to-one relationship 一对一关系 (for database)
    online analytical processing (OLAP) 联机分析处理(OLAP) (for database)
    online redo log 联机重做日志 (for database)
    online transaction processing (OLTP) 联机事务处理(OLTP) (for database)
    Open Data Services (ODS) 开放式数据服务(ODS) (for database)
    Open Database Connectivity (ODBC) 开放式数据库连接(ODBC) (for database)
    operand 操作数
    operating system (OS) 操作系统
    operation 操作
    operator 操作符、运算符
    option 选项
    optimizer 优化器
    outer join 外联接 (for database)
    overflow 上限溢位(相对于underflow)
    overhead 额外开销
    overload 重载
    overload resolution 重载决议
    overloaded function 重载的函数
    overloaded operator 被重载的操作符
    override 覆写、重载、重新定义
    package 包
    packaging 打包
    palette 调色板
    parallel 并行
    parameter 参数、形式参数、形参
    parameter list 参数列表
    parameterize 参数化
    parent class 父类
    parentheses 圆括弧、圆括号
    parse 解析
    parser 解析器
    part 零件、部件
    partial specialization 局部特化
    pass by address 传址(函式引数的传递方式)(非正式用语)
    pass by reference 传地址、按引用传递
    pass by value 按值传递
    pattern 模式
    PDA (personal digital assistant)个人数字助理
    PE (Portable Executable) file 可移植可执行文件
    performance 性能
    persistence 持久性
    PInvoke (platform invoke service) 平台调用服务
    pixel 像素
    placement delete
    placement new
    placeholder 占位符
    platform 平台
    POD (plain old data (type))
    POI (point of instantiation)
    pointer 指针
    poll 轮询
    pooling 池化
    polymorphism 多态
    pop up 弹出式
    port 端口
    postfix 后缀
    precedence 优先序(通常用于运算子的优先执行次序)
    prefix 前缀
    preprocessor 预处理器
    primary key (PK)主键(PK) (for database)
    primary table 主表 (for database)
    primary template原始模板
    primitive type 原始类型
    print 打印
    printer 打印机
    procedure 过程
    procedural 过程式的、过程化的
    process 进程
    profile 评测
    profiler 效能(性能)评测器
    program 程序
    programmer 程序员
    programming编程、程序设计
    progress bar 进度指示器
    project 项目、工程
    property 属性
    protocol 协议
    pseudo code伪码
    qualified 经过资格修饰(例如加上scope运算子)
    qualified name
    qualifier 修饰符
    quality 质量
    queue 队列
    race condition 竞争条件(多线程环境常用语)
    radian 弧度
    radio button 单选按钮
    raise 引发(常用来表示发出一个exception)
    random number 随机数
    range 范围、区间
    rank 等级
    raw 未经处理的
    readOnly只读
    record 记录 (for database)
    recordset 记录集 (for database
    recursive 递归
    re-direction 重定向
    refactoring 重构
    refer 引用、参考
    reference 引用、参考
    reference counting引用计数
    referential integrity (RI)引用完整性(RI) (for database)
    register 寄存器
    reflection 反射
    refresh data 刷新数据 (for database)
    regular expression 正则表达式
    relational database 关系数据库
    remote 远程
    remote request 远程请求
    represent 表述,表现
    resolve 解析、决议
    resolution 解析过程
    result set 结果集 (for database)
    retrieve data 检索数据
    return 返回
    return type 返回类型
    return value 返回值
    right outer join 右向外联接 (for database)
    revoke 撤销
    robust 健壮
    robustness 健壮性
    roll back 回滚 (for database)
    roll forward 前滚 (for database)
    routine 例程
    row 行 (for database)
    row lock 行锁 (for database)
    rowset 行集 (for database)
    RPC (remote procedure call)RPC(远程过程调用)
    runtime 执行期、运行期、执行时、运行时
    rvalue 右值
    save 保存
    savepoint 保存点 (for database)
    SAX (Simple API for XML)
    scalable 可伸缩的、可扩展的
    schedule 调度
    scheduler 调度程序
    schema 模式、纲目结构
    scroll bar滚动条
    scope 作用域、生存空间
    scope operator 生存空间操作符
    scope resolution operator 生存空间解析操作符
    screen 屏幕
    SDK (Software Development Kit)软件开发包
    sealed class 密封类
    search 查找
    semantics 语义
    semaphore 信号量
    sequential container序列式容器
    server 服务器、服务端
    serial 串行
    serialization/serialize 序列化
    server cursor服务端游标、服务器游标 (for database)
    session 会话 (for database)
    setter 设值函数
    shared lock 共享锁 (for database)
    sibling 同级
    side effect 副作用
    signature 签名
    single-threaded 单线程
    slider滑块
    slot 槽
    smart pointer 智能指针
    SMTP (Simple Mail Transfer Protocol) 简单邮件传输协议
    snapshot 截屏图
    snapshot 快照 (for database)
    specialization 特化
    specification 规范、规格
    splitter 切分窗口
    SOAP (simple object access protocol) 简单对象访问协议
    software 软件
    source code 源码、源代码
    SQL (Structured Query Language) 结构化查询语言 (for database)
    stack 栈、堆栈
    stack unwinding 叠辗转开解(此词用于exception主题)
    standard library 标准库
    standard template library 标准模板库
    stateless 无状态的
    statement 语句、声明
    static cursor 静态游标 (for database)
    static SQL statements 静态SQL语句 (for database)
    stored procedure 存储过程 (for database)
    status bar 状态条
    stream 流
    string 字符串
    stub 存根
    subobject子对象
    subquery 子查询 (for database)
    subroutine 子例程
    subscript operator 下标操作符
    subset 子集
    subtype 子类型
    support 支持
    suspend 挂起
    symbol 记号
    syntax 语法
    system databases 系统数据库 (for database)
    system tables 系统表 (for database)
    table 表 (for database)
    table lock 表锁 (for database)
    table-level constraint 表级约束 (for database)
    tape backup 磁带备份 (for database)
    target 标的,目标
    task switch 工作切换
    TCP (Transport Control Protocol) 传输控制协议
    template 模板
    template-id
    template argument deduction 模板参数推导
    template explicit specialization 模板显式特化
    template parameter 模板参数
    template template parameter
    temporary object 临时对象
    temporary table 临时表 (for database)
    text 文本
    text file 文本文件
    thin client 瘦客户端
    third-party 第三方
    thread 线程
    thread-safe 线程安全的
    throw 抛出、引发(常指发出一个exception)
    token 符号、标记、令牌(看场合)
    trace 跟踪
    transaction 事务 (for database)
    transaction log 事务日志 (for database)
    transaction rollback 事务回滚 (for database)
    transactional replication 事务复制 (for database)
    translation unit 翻译单元
    traverse 遍历
    trigger 触发器 (for database)
    two-phase commit 两阶段提交 (for database)
    tuple
    two-phase lookup 两阶段查找
    type 类型
    UDDI(Universary Description, Discovery and Integration)统一描述、查询与集成
    UML (unified modeling language)统一建模语言
    unary function 单参函数
    unary operator 一元操作符
    unboxing 拆箱、拆箱转换
    underflow 下限溢位(相对于overflow)
    Union query 联合查询 (for database)
    UNIQUE constraints UNIQUE约束 (for database)
    unique index 唯一索引 (for database)
    unmanaged code 非受控代码、非托管代码
    unmarshal 散集
    unqualified 未经限定的、未经修饰的
    URI (Uniform Resource identifier) 统一资源标识符
    URL (Uniform Resource Locator) 统一资源定位器
    user 用户
    user interface 用户界面
    value types 值类型
    variable 变量
    vector 向量(一种容器,有点类似array)
    viable 可行的
    video 视频
    view 视图
    VEE (Virtual Execution Engine)虚拟执行引擎
    vendor 厂商
    view 视图 (for database)
    virtual function 虚函数
    virtual machine 虚拟机
    virtual memory 虚拟内存
    vowel 元音字母
    Web Services web服务
    WHERE clause WHERE子句 (for database)
    wildcard characters 通配符字符 (for database)
    wildcard search 通配符搜索 (for database)
    window 窗口
    window function 窗口函数
    window procedure 窗口过程
    Windows authentication Windows身份验证
    wizard 向导
    word 单词
    word processor 字处理器
    wrapper 包装、包装器
    write enable 写启用 (for database)
    write-ahead log 预写日志 (for database)
    write-only 只写
    WSDL (Web Service Description Language)Web Service描述语言
    XML Message Interface (XMI) XML消息接口
    XML (eXtensible Markup Language) 可扩展标记语言
    XSD (XML Schema Definition) XML模式定义语言
    XSL (eXtensible Stylesheet Language) 可扩展样式表语言
    XSLT (eXtensible Stylesheet Language Transformation)可扩展样式表语言转换
    xxx based 基于xxx的
    xxx oriented 面向xxx

    展开全文
  • 关键词提取算法之RAKE

    千次阅读 2018-07-06 17:41:04
    关键词提取算法之RAKE RAKE(Rapid Automatic Keyword Extraction)算法,作者Alyona Medelyan,RAKE的更新版本就是她完成的,muai indexer也是她的杰作,她的GitHub上有很多关键字提取的项目。 算法的亮点在于“R”...

    关键词提取算法之RAKE

    RAKE(Rapid Automatic Keyword Extraction)算法,作者Alyona Medelyan,她的GitHub上有很多关键字提取的项目。

    RAKE算法的亮点在于“R” : Rapid , 快速却能取得很不错的效果。

    作者的思路大致是:
    1).分词。在提取英文关键词中,给定一篇英文文档,以标点符号及停用词作为分词标准;
    2).共现矩阵。 构建共现矩阵;
    3).特征提取。包含词频freq、度deg 以及度与频率之比 deg/freq 三个特征;
    4).定义score。score = deg/freq
    5).降序输出。 按score大小降序输出1/3文档词汇量的关键词。

    其中,提取特征后有个特殊处理,对于相邻的关键词,如果满足同一文档和相同顺序中至少两次相邻,则进行合并,成为新的候选关键词后,score 定义为合并前的候选关键词score之和。这样操作的原因是,这些相邻候选关键词相对较少,简单对score相加,增加了它们的重要性。

    引用原论文的栗子:
    测试文本

    分词后
    分词结果
    共现矩阵
    共现矩阵构建
    提取特征
    特征提取

    降序输出
    降序结果

    从上面的思路可以看到,RAKE算法
    1).算法简单而高效;
    2).提取的关键词并不是单一的单词,也有可能是短语,能够提取一些较长的专业术语;

    遗憾的是,在处理中文文本中,中文使用停用词来划分短语的效果远不及英文,一句话根本分不了几个关键词,几乎全部粘连在一起,因此效果不好。

    原始的RAKE的GitHub地址:
    https://github.com/zelandiya/RAKE-tutorial
    论文链接下载:
    https://www.researchgate.net/profile/Stuart_Rose/publication/227988510_Automatic_Keyword_Extraction_from_Individual_Documents/links/59edf51fa6fdccbbefd5434a/Automatic-Keyword-Extraction-from-Individual-Documents.pdf

    展开全文
  • 相对于监督学习,无监督学习的方法就无需标注数据,常用的无监督关键词提取算法包括:TF-IDF算法、TextRank算法和主题模型算法(LDA、LSA、LSI) ,现重点介绍LDA算法,其他算法后续再讲. 我不喜欢讲大多学术上比较...
  • 本文研究了开发的程序,并报告了进行的实验,以研究使用WordNet [1]和本地词库[2]来应用文本句子和术语扩展的组合结构属性在选择最合适的提取性文本摘要中的效用用于特定文档。 标记句子并对其进行归一化,然后使用...
  • 这个基于python的应用程序( pygrams.py )旨在从大量(> 1,000)文档pygrams.py自由文本中提取流行或紧急出现的n-gram /术语(单词或短短语)。 出于测试目的,包括了已授予专利文件摘要的示例语料库。 应用程序...
  • 文章目录1、关键词提取2、TF-IDF算法原理3、编程实例 1、关键词提取  关键词是指能反映文本主题或者主要内容的词语。关键词提取就是从文本里面把跟这篇文档意义最相关的一些词抽取出来,是NLP领域的一个重要的子...
  • TextRank算法提取关键词的Java实现

    千次阅读 2016-10-26 10:31:34
    TextRank算法提取关键词的Java实现
  • hanlp关键词提取算法TextRank

    万次阅读 2018-05-24 15:44:05
    TextRank是在Google的PageRank算法启发下,针对文本里的句子设计的权重算法,目标是自动摘要。它利用投票的原理,让每一个单词给它的邻居(术语称窗口)投赞成票,票的权重取决于自己的票数。这是一个“先有鸡还是先...
  • python 基于LDA算法的长文本主题提取分类并预测类别

    千次阅读 多人点赞 2020-04-26 11:53:07
    python 基于LDA长文本主题提取并预测分类 Lda算法原理,知乎上有很完善的算法介绍,这里就不多废话了。 数据准备 这一阶段主要是对你的问题本进行处理,清洗你的数据。中文文本预处理,主要包括去空格、去表单符号、...
  • 语音识别算法有哪些本文列举了几种不同的语音识别算法。第一种:基于动态时间规整(Dynamic Time Warping)的算法在连续语音识别中仍然是主流方法。该方法的运算量较大,但技术上较简单,识别正确率高。在小词汇量、...
  • 一个后缀剥离算法 M.F.Porter 1980 1.介绍 通过自动的方法去掉单词后缀是一个在信息检索领域尤其有用的操作。一个典型的信息检索系统包括一个文档集合,每个文档被它标题和摘要里的单词描述。如果忽略单词出现的位置...
  • 深度学习常见算法的介绍和比较

    万次阅读 多人点赞 2018-02-08 22:00:06
    具体的话,深度学习是机器学习中的具有深层结构的神经网络算法,即机器学习>神经网络算法>深度神经网络(深度学习)。 关于深度学习的理论推导,太大太复杂,一些常见的深度学习算法本人也是模模糊糊的,看过好多次...
  • python 基于TF-IDF算法的关键词提取

    千次阅读 2018-10-31 10:10:02
    import jiaba.analyse jieba.analyse.extract_tags(content, top...默认为False allowPOS:指定词性的值,默认值为空 承接python、R、sql、spss作业代写:数据分析、数据挖掘、数据爬虫、机器学习、模型代跑、算法优化 ...
  • 用专业术语去描述绘制出轮廓的中心线叫做(提取图像的骨架)。然后这一篇博客呢是我对这个细化算法的解读与实操~ 一、thinning algorithm算法描述 图像细化(Image Thinning),一般指二值图像的骨架化(Image ...
  • 人工智能

    千次阅读 多人点赞 2019-08-09 19:03:15
    它的应用领域包括:机器翻译,文本、语音、图片转换,聊天机器人,自动摘要,情感分析,文本分类,信息提取等。以下给出了自然语言处理简要的知识架构图。 4.5 机器人视觉 视觉对人很重要,人类获得讯息90% 以上...
  • @基于itf-idf算法的关键词提取 提出问题 假设我们现在有一篇文章,需要提取这篇文章的关键词,要怎样才能通过计算机实现呢? TF-IDF算法介绍 一篇文章的关键词基本都是能体现文章的内容,而且几乎是在文章中频繁出现...
  • 3.7 边缘提取 如果阈值选定错误,由于从前景灰度值到背景灰度值是平滑过渡的,那么提取出来的物体将通常会变得更大或者更 小。当光照改变时,这个问题尤其严重,因为此时要求阔值必须非常准确地适应改变后的照明情况...
  • 人工智能时代,所需要了解人工智能的基本常识

    万次阅读 多人点赞 2018-12-10 22:49:44
     揭秘人工智能的首要步骤就是定义专业术语,勾勒历史,同时描述基础性的核心技术。  1、人工智能的定义  人工智能领域苦于存在多种概念和定义,有的太过有的则不够。作为该领域创始人之一的NilsNilsson先生...
  • 1.目标检测算法分类: Two stage: 1)先生成Region Proposal, 2)通过卷积神经网络进行分类。 步骤:特征提取 ——> 生成Region Proposal ——> 分类/回归 代表算法:R-CNN、 Spp-Net、Fast R-CNN、Faster-...
  • 文章观点提取的几种测试

    千次阅读 2016-08-25 09:30:20
    有时候想想,在NLP的领域,有好多算法真的是难以施展拳脚,甚至不如一些土办法来的准确率可能高一些。保持学习的过程中,还是要多思考,不能盲目的去实践,结合论文和实际生产环境来判断应该使用什么方法。在这个...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 21,023
精华内容 8,409
关键字:

术语提取算法