精华内容
下载资源
问答
  • CAD中线性标注的快捷命令是【DLI】,其快捷键是【ALT+NL】 ,CAD常用标注快捷命令还有:1、【DLI】为直线标注;2、【DAL】为对齐标注;3、【DRA】为半径标注;4、【DDI】为直径标注;5、【DAN】为角度标注等等。CAD...

    CAD中线性标注的快捷命令是【DLI】,其快捷键是【ALT+NL】 ,CAD常用标注快捷命令还有:1、【DLI】为直线标注;2、【DAL】为对齐标注;3、【DRA】为半径标注;4、【DDI】为直径标注;5、【DAN】为角度标注等等。

    CAD作图完成后常常需要使用到标注命令,CAD中线性标注的快捷命令是:DLI,快捷键是:ALT+NL 。下面本篇文章就来给大家介绍CAD常用标注快捷命令,希望对大家有所帮助。

    CAD(Computer Aided Design),计算机辅助设计,指利用计算机及其图形设备帮助设计人员进行设计工作。

    在设计中通常要用计算机对不同方案进行大量的计算、分析和比较,以决定最优方案;各种设计信息,不论是数字的、文字的或图形的,都能存放在计算机的内存或外存里,并能快速地检索;设计人员通常用草图开始设计,将草图变为工作图的繁重工作可以交给计算机完成;由计算机自动产生的设计结果,可以快速作出图形,使设计人员及时对设计做出判断和修改;利用计算机可以进行与图形的编辑、放大、缩小、平移、复制和旋转等有关的图形数据加工工作。

    CAD是一个可视化的绘图软件,许多命令和操作可以通过菜单选项和工具按钮等多种方式实现。而且具有丰富的绘图和绘图辅助功能,如实体绘制、关键点编辑、对象捕捉、标注、鸟瞰显示控制等,它的工具栏、菜单设计、对话框、图形打开预览、信息交换、文本编辑、图像处理和图形的输出预览为用户的绘图带来很大方便。其次它不仅在二维绘图处理更加成熟,三维功能也更加完善,可方便地进行建模和渲染。

    CAD常用标注快捷命令:

    ● DLI, *DIMLINEAR(直线标注)

    ● DAL, *DIMALIGNED(对齐标注)

    ● DRA, *DIMRADIUS(半径标注)

    ● DDI, *DIMDIAMETER(直径标注)

    ● DAN, *DIMANGULAR(角度标注)

    ● DCE, *DIMCENTER(中心标注)

    ● DOR, *DIMORDINATE(点标注)

    ● TOL, *TOLERANCE(标注形位公差)

    ● LE, *QLEADER(快速引出标注)

    ● DBA, *DIMBASELINE(基线标注)

    ● DCO, *DIMCONTINUE(连续标注)

    ● D, *DIMSTYLE(标注样式)

    ● DED, *DIMEDIT(编辑标注)

    ● DOV, *DIMOVERRIDE(替换标注系统变量)

    ● DAR,(弧度标注,CAD2006)

    ● DJO,(折弯标注,CAD2006)

    以上就是本篇文章的全部内容,希望能对大家的学习有所帮助。更多精彩内容大家可以关注php中文网相关教程栏目!!!

    展开全文
  • 中文词性标注

    2020-12-19 09:09:12
    虽然是愚人节,但是这个不是愚人节...所以打包文件里只是mecab用于发布的二进制词典和模型文件,目前在mac os和linux ubuntu系统下测试无误,其他系统请自行测试使用:使用前请按上述文档安装mecab,下载这个中文分...

    虽然是愚人节,但是这个不是愚人节玩笑,最近花了一些时间在MeCab身上,越发喜欢这个来自岛国的开源分词系统,今天花了一些时间训练了一个更适用的模型和词典,打包提供给大家使用,因为数据和词典涉及到一些版权问题,所以打包文件里只是mecab用于发布的二进制词典和模型文件,目前在mac os和linux ubuntu系统下测试无误,其他系统请自行测试使用:

    使用前请按上述文档安装mecab,下载这个中文分词模型和词典之后解压,解压后得到一个mecab-chinese-data目录,执行:

    mecab -d mecab-chinese-data

    扬帆远东做与中国合作的先行

    扬帆v,*,*,*,*,*,扬帆,*,*

    远东ns,*,*,*,*,*,远东,*,*

    做v,*,*,*,*,*,做,*,*

    与p,*,*,*,*,*,与,*,*

    中国ns,*,*,*,*,*,中国,*,*

    合作v,*,*,*,*,*,合作,*,*

    的u,*,*,*,*,*,的,*,*

    先行vn,*,*,*,*,*,先行,*,*

    EOS

    上述第二列提供了词性标注结果。

    如果想得到单行的分词结果,可以这样执行:

    mecab -d ./mecab-chinese-data/ -O wakati

    扬帆远东做与中国合作的先行

    扬帆 远东 做 与 中国 合作 的 先行

    如果想直接对文件分词,可以这样执行:

    mecab -d ./mecab-chinese-data/ INPUT -o OUTPUT

    具体可以参考上述两个文档,另外我在mac下测试了一下中文维基百科语料的切分速度,大概700多M的语料,不到90秒切分完毕,大概7M/s的切分速度完全达到了工业届的使用标准。另外Mecab还支持Nbest输出,多种输出格式,全切分模式,系统词典和用户词典定制等等,同时通过SWIG提供了perl, ruby, python, java的调用接口,非常方便。

    以下是在backoff2005 人民日报语料库上的测试结果:

    === SUMMARY:

    === TOTAL INSERTIONS:3803

    === TOTAL DELETIONS:1981

    === TOTAL SUBSTITUTIONS:5004

    === TOTAL NCHANGE:10788

    === TOTAL TRUE WORD COUNT:104372

    === TOTAL TEST WORD COUNT:106194

    === TOTAL TRUE WORDS RECALL:0.933

    === TOTAL TEST WORDS PRECISION:0.917

    === F MEASURE:0.925

    === OOV Rate:0.058

    === OOV Recall Rate:0.482

    === IV Recall Rate:0.961

    ###pku_test.result380319815004107881043721061940.9330.9170.9250.0580.4820.961

    召回率93.3%,准确率91.7%, F值为92.5%, 虽然还没有一个单纯针对这个测试语料比赛的分词结果好,但是测试了一些其他语料后觉得这个版本完全可以作为一个基准版本使用,另外mecab也提供了用户定制词典接口,方便用户按自己的需求定制使用。

    最后提供一个demo仅供测试使用: 中文分词Demo

    展开全文
  • 中文词性标注数据集

    2021-07-03 01:58:12
    中文词性标注数据集 1. Chinese Treebank X.0 (CTBX) 数据集简介: 由LDC构建的中文树库。CTBX中X表示版本,随着版本数据规模扩大,以及部分标准修正。CTB1标注数据来自新华日报;CTB2对CTB1进行部分纠正以及进行...

    中文词性标注数据集

    1. Chinese Treebank X.0 (CTBX)

    • 数据集简介:

      由LDC构建的中文树库。CTBX中X表示版本,随着版本数据规模扩大,以及部分标准修正。CTB1标注数据来自新华日报;CTB2对CTB1进行部分纠正以及进行发布;CTB4标注数据来自新华日报、香港政府新闻处发布的新闻、以及台湾Sinorama magazine;CTB5标注数据来源同CTB4,对规模进行扩大;CTB6增加了来自广播节目的标注数据;CTB7增加了广播新闻、微博数据、以及广播电视谈话类节目数据;CTB8标注数据来源新闻数据、新闻杂志、广播新闻、广播谈话节目、微博、以及网页数据;CTB9标注数据来自新闻数据、新闻杂志、广播新闻、广播谈话节目、微博、论坛、聊天对话、电话数据。

    • 数据集详情:

      名称规模创建日期作者单位论文下载评测
      CTB1100000个词,325篇文章2000年LDC链接未发布N/A
      CTB2100000个词,325篇文章2001年Martha Palmer, et al.LDC链接会员下载N/A
      CTB4404156词,664663个汉字,15162个句子,838个文件2004年Martha Palmer, et al.LDCN/A会员下载N/A
      CTB5507222词,824983个汉字,18782个句子,890个文件2005年Martha Palmer, et al.LDC链接会员下载N/A
      CTB6781351词,1285149个汉字,28295个句子,2036个文件2007年Martha Palmer, et al.LDCN/A会员下载N/A
      CTB71196329词,1931381个汉字,51447个句子,2448个文件2010年Nianwen Xue, et al.LDC链接会员下载N/A
      CTB81620561词,2589848个汉字,71369个句子,3007个文件2013年Nianwen Xue, et al.LDCN/A会员下载N/A
      CTB92084387词,3247331个汉字,132076个句子,3726个文件2016年Nianwen Xue, et al.LDCN/A会员下载N/A
    • 基于该数据集发表的相关论文:

      • Chen, Xinchi, Xipeng Qiu, and Xuanjing Huang. “A feature-enriched neural model for joint Chinese word segmentation and part-of-speech tagging.” arXiv preprint arXiv:1611.05384 (2016).
      • Diao, Shizhe, et al. “ZEN: Pre-training Chinese Text Encoder Enhanced by N-gram Representations.” arXiv preprint arXiv:1911.00720 (2019).
    展开全文
  • 词性标注

    2020-12-31 14:46:21
    什么是词性 在语言学上,词性(Par-Of-Speech, Pos )指的是单词的语法分类,也称为词类。同一个类别的词语具有相似的语法性质,所有词性的集合称为词性标注集。不同的语料库采用了不同的词性标注集,一般都含有形容词...

    纯属为了记录自己学习的点滴过程,99%都是复制别人的东西,引用资料都附在参考列表

    1 基本概念

    什么是词性
    在语言学上,词性(Par-Of-Speech, Pos )指的是单词的语法分类,也称为词类。同一个类别的词语具有相似的语法性质,所有词性的集合称为词性标注集。不同的语料库采用了不同的词性标注集,一般都含有形容词、动词、名词等常见词性。下图就是HanLP输出的一个含有词性的结构化句子。

    词性的用处
    词性的作用是提供词语的抽象表示,词的数量是无穷的,但词性的数量是有限的。词性支撑着许多高级应用,当下游应用遇到 OOV 时,可以通过 OOV 的词性猜测用法,比如上面的句子“林晚霞”就识别为人名进行处理,而不会拆开。
    词性也可以直接用于抽取一些信息,比如抽取所有描述特定商品的形容词等。

    序列标注问题
    序列标注指的是给定一个序列 ,找出序列中每个元素对应标签 的问题。其中,y 所有可能的取值集合称为标注集。比如,输入一个自然数序列,输出它们的奇偶性。
    求解序列标注问题的模型一般称为序列标注器,通常由模型从一个标注数据集中学习相关知识后再进行预测。在NLP问题中,x 通常是字符或词语,而 y 则是待预测的组词角色或词性等标签。中文分词、词性标注以及命名实体识别,都可以转化为序列标注问题。

    2 问题

    以1998年《人民日报》一月份语料库作为训练、测试数据;
    训练集:
    在这里插入图片描述
    测试集:
    在这里插入图片描述
    除了文本具体内容,两个数据集标注标准、词性标注集完全一样。
    在上面的数据中,每个词组成的序列称为观测序列,每个词对应的词性组成的序列称为状态序列。

    3 解决思路

    3.1 基于隐马尔可夫模型的词性标注

    HMM是概率有向图模型中的一种,应该是机器学习中推理最繁琐的算法了,并且用到了动态规划算法,具体数学细节参考《统计学习方法》;
    隐马尔可夫模型( Hidden Markov Model, HMM)是描述两个时序序列联合分布 p(x,y) 的概率模型: x 序列外界可见(外界指的是观测者),称为观测序列(obsevation sequence); y 序列外界不可见,称为状态序列(state sequence)。比如观测 x 为单词,状态 y 为词性,我们需要根据单词序列去猜测它们的词性。隐马尔可夫模型之所以称为“隐”,是因为从外界来看,状 态序列(例如词性)隐藏不可见,是待求的因变量。从这个角度来讲,人们也称状态为隐状态(hidden state),而称观测为显状态( visible state)。隐马尔可夫模型之所以称为“马尔可夫模型”,”是因为它满足马尔可夫假设;
    从数据–>HMM模型–>预测词性,要解决概率计算问题、学习问题、预测问题,预测问题就是根据观测序列,预测概率最大的状态序列(即词性序列);

    3.2 基于条件随机场的词性标注

    CRF是概率无向图模型中的一种,数学细节和HMM基本类似,具体数学细节参考《统计学习方法》;
    Hanlp中的CRF实现由于基于java虚拟机,速度比c++要慢,所以作者建议直接在本机上安装crf++,mac安装很简单:brew install crf++,其它安装方法参考https://blog.csdn.net/zzzzlei123123123/article/details/104299040这篇博客。
    即使在本机上安装了crf++,训练上面的数据依然有点漫长,大概1h+😊;

    3.3 基于感知机的词性标注

    perceptron算法可以说是一层神经网络,多层perceptron便成了深度学习模型,具体参考《统计学习方法》;
    按照中文分词时的经验,感知机能够利用丰富的上下文特征,是优于隐马尔可夫模型的选择,对于词性标注也是如此。
    感知机词性标注模板
    状态特征:
    x t − 1 , x t , x t + 1 x_{t-1}, x_t, x_{t+1} xt1,xt,xt+1 x t x_t xt第一个字符, x t x_t xt长2前缀, x t x_t xt长3前缀, x t x_t xt最后一个字符, x t x_t xt长2后缀, x t x_t xt长3后缀
    转移特征:
    y t − 1 y_{t-1} yt1

    4 实现

    4.1 基于隐马尔可夫模型实现

    from pyhanlp import *
    # 这里使用的是1998年《人民日报》1月份语料
    from tests.book.ch07.pku import PKU199801_TRAIN
    
    HMMPOSTagger = JClass('com.hankcs.hanlp.model.hmm.HMMPOSTagger')
    AbstractLexicalAnalyzer = JClass('com.hankcs.hanlp.tokenizer.lexical.AbstractLexicalAnalyzer')
    PerceptronSegmenter = JClass('com.hankcs.hanlp.model.perceptron.PerceptronSegmenter')
    FirstOrderHiddenMarkovModel = JClass('com.hankcs.hanlp.model.hmm.FirstOrderHiddenMarkovModel')
    SecondOrderHiddenMarkovModel = JClass('com.hankcs.hanlp.model.hmm.SecondOrderHiddenMarkovModel')
    
    def train_hmm_pos(corpus, model):
        tagger = HMMPOSTagger(model)  # 创建词性标注器
        tagger.train(corpus)  # 训练
        # 词性标注器不负责分词,所以只接受分词后的单词序列
    #     print(', '.join(tagger.tag("他", "的", "希望", "是", "希望", "上学")))  # 预测
        # 加上analyzer可以同时执行分词和词性标注
        analyzer = AbstractLexicalAnalyzer(PerceptronSegmenter(), tagger)  # 构造词法分析器
        # 英文缩写词性
    #     print(analyzer.analyze("今年元旦我要去看升国旗!"))  # 分词+词性标注
        # 把英文缩写词性转化为英文
        print(analyzer.analyze("他的希望是希望上学").translateLabels())  # 分词+词性标注
        return tagger
     
    
    # 一阶隐马尔可夫
    tagger = train_hmm_pos(PKU199801_TRAIN, FirstOrderHiddenMarkovModel())
    # 二阶隐马尔可夫
    tagger = train_hmm_pos(PKU199801_TRAIN, SecondOrderHiddenMarkovModel()) 
    

    运行结果:

    /代词 的/助词 希望/名词 是/动词 希望/动词 上学/动词
    他/代词 的/助词 希望/名词 是/动词 希望/动词 上学/动词
    

    4.2 基于条件随机场模型实现

    
    from pyhanlp import *
    from tests.book.ch07.demo_hmm_pos import AbstractLexicalAnalyzer, PerceptronSegmenter
    from tests.book.ch07.pku import POS_MODEL, PKU199801_TRAIN
    
    CRFPOSTagger = JClass('com.hankcs.hanlp.model.crf.CRFPOSTagger')
    
    
    def train_crf_pos(corpus):
        # 选项1.使用HanLP的Java API训练,慢
        tagger = CRFPOSTagger(None)  # 创建空白标注器
        tagger.train(corpus, POS_MODEL)  # 训练
        tagger = CRFPOSTagger(POS_MODEL) # 加载
        # 选项2.使用CRF++训练,HanLP加载。(训练命令由选项1给出)
        # tagger = CRFPOSTagger(POS_MODEL + ".txt")
        print(', '.join(tagger.tag("他", "的", "希望", "是", "希望", "上学")))  # 预测
        analyzer = AbstractLexicalAnalyzer(PerceptronSegmenter(), tagger)  # 构造词法分析器
        print(analyzer.analyze("李狗蛋的希望是希望上学"))  # 分词+词性标注
        return tagger
    
    
    if __name__ == '__main__':
        tagger = train_crf_pos(PKU199801_TRAIN)
    
    
    • 跑了近2h没有成功,😭!,笔记本风扇一直狂叫,还是转移到服务器上干吧!

    4.3 基于感知机模型实现

    from pyhanlp import *
    from tests.book.ch07.demo_hmm_pos import AbstractLexicalAnalyzer, PerceptronSegmenter
    from tests.book.ch07.pku import PKU199801_TRAIN, POS_MODEL
    
    POSTrainer = JClass('com.hankcs.hanlp.model.perceptron.POSTrainer')
    PerceptronPOSTagger = JClass('com.hankcs.hanlp.model.perceptron.PerceptronPOSTagger')
    
    
    def train_perceptron_pos(corpus):
        trainer = POSTrainer()
        # trainer.train(corpus, POS_MODEL)  # 训练
        tagger = PerceptronPOSTagger(POS_MODEL)  # 加载
        print(', '.join(tagger.tag("他", "的", "希望", "是", "希望", "上学")))  # 预测
        analyzer = AbstractLexicalAnalyzer(PerceptronSegmenter(), tagger)  # 构造词法分析器
        print(analyzer.analyze("李狗蛋的希望是希望上学"))  # 分词+词性标注
        return tagger
    
    
    if __name__ == '__main__':
        train_perceptron_pos(PKU199801_TRAIN)
    

    运行结果:

    /r 的/u 希望/n 是/v 希望/v 上学/v
    

    4.4 词性标注评测

    可以对每种标签计算一套 P , R , F 1 P, R, F_1 P,R,F1, 也可以笼统地为所有标签计算一套值,此时预测的标签总数=测试集中的标签总数,三个指标退化为相等的 A c c u r a c y Accuracy Accuracy
    Accuracy = #{预测正确的标签数} / #{标签总数}。
    将 PKU 语料库按 9:1 分隔为训练集和测试集,分别用以上三种模型来训练,准确率如下:

    算法准确率
    一阶隐马尔可夫模型44.99%
    二阶隐马尔可夫模型40.53%
    结构化感知机83.07%
    条件随机场82.12%

    从上图可知,结构化感知机和条件随机场都要优于隐马尔可夫模型,判别式模型能够利用更多的特征来进行训练,从而提高更多的精度。

    5 参考文献

    1. 何晗《自然语言处理入门》;
    2. 宗成庆《统计自然语言处理》;
    3. 李航《统计学习方法》;

    6 需要解决的问题

    1. 从毛数据到喂给模型训练,数据是怎样处理的?
    2. 三种模型在学习之前,具体的表达形式是什么?
    3. hanlp把数据处理和训练、预测高度集成化,尤其是python代码很难将其拆解为数据预处理、特征提取,模型训练这样标准的流程,能否找到对应的工具,将以上实验重现?
    4. 同一份数据,为什么CRF模型训练的速度如此之慢(其它两个模型10倍时间)?
    展开全文
  • pytorch-sequencelabeling是一个支持softmax、crf、span等模型,只依赖pytorch、transformers、tensorboardX和numpy,专注于序列标注(命名实体识别、词性标注中文分词)的轻量级自然语言处理工具包。 目录 ...
  • 安装系统需要安装Java1.6+使用说明标注器有三个模式:标注、训练、测试这里我们用已经训练好的标注模型, 对于中文有两个(model目录下)chinese-distsim.tagger(性能比较好)chinese-nodistsim.tagger二者区别使用java...
  • pyhanlp 中文词性标注与分词简介pyhanlp实现的分词器有很多,同时pyhanlp获取hanlp中分词器也有两种方式第一种是直接从封装好的hanlp类中获取,这种获取方式一共可以获取五种分词器,而现在默认的就是第一种维特比分...
  • 之前发文剖析了「结巴分词」中用「DAG」和「Viterbi」算法进行中文分词的两个方案。有了前面的基础,这里再来讨论词性标注(POS)与关键词提取。词性标注如图,在 DAG分词时所用的 dict 里面含有词汇、词频和词性三个...
  • Viterbi算法目标过程词典分词统计分词词性标注附录附录二附录三 目标 实现基于词典的分词方法和统计分词方法 对分词结果进行词性标注 对分词及词性标注结果进行评价,包括4个指标:正确率、召回率、F1值和效率 ...
  • 计算机视觉的飞速发展离不开大量图像标注数据的支撑,随着各类图像检测、识别算法的商业化落地,市场对图像标注精准度愈发严格,同时针对不同的应用场景,也衍生出了不同的图像标注方法。 今天景联文科技给大家介绍...
  • 我们在NLP领域主要探索统一、自洽的多任务标注规范,从语义框架出发,将词性、实体识别、问答标注与自动扩充、事件抽取、三元组关系及知识图抽取、因果抽取等方向深入探索。 针对通用语料的探索性标注,我们标注了...
  • 深度学习-自然语言处理(NLP)-文本预处理:词性标注
  • Spacy自训练中文词性标注模型 谭楷城 181205101874 2021/4/14 首先加载相关包并读入数据文件: # 读入相关包 from __future__ import unicode_literals, print_function import plac import random from pathlib ...
  • 从数据标注角度看自动驾驶的数据逻辑 数据标注行业的小伙伴可能都知道,自动驾驶相关的项目或许撑起了数据标注行业的半边天。近几年基本上也都经历了各个厂商不同自动驾驶解决方案下的数据标注要求。 这部分我们从...
  • 目前流行的中文词性标签有两大类:北大词性标注集和宾州词性标注集。现代汉语的词可以分为两类12种词性:一类是实词:名词、动词、形容词、数词、量词和代词;另一类是虚词:副词、介词、连词、助词、叹词和拟声词。...
  • 原标题:一文了解语义角色标注本文转自公众号:AI小白入门 本文记录自然语言基础技术之语义角色标注学习过程,包括定义、常见方法、例子、以及相关评测,最后推荐python实战利器,并且包括工具的用法。定义先来看看...
  • Pytorch-NLU是一个只依赖pytorch、transformers、numpy、tensorboardX,专注于文本分类、序列标注的极简自然语言处理工具包。 支持BERT、ERNIE、ROBERTA、NEZHA、ALBERT、XLNET、ELECTRA、GPT-2、TinyBERT、XLM、T5...
  • 该“标注”系列博文的标注引擎使用“标准标注引擎(standard label engine)”,这个概念如不知道,可不...普通标注这里不讲述,先从一个简单的换行标注开始讲起。两行标注可以很简单的通过下面的VB语句来实现[字段...
  • python饼图标注标签

    2021-04-27 09:35:41
    什么想法。。。我是Python的初学者。在错误,如AttributeError:“list”对象没有属性“theta2”TypeError:“function”对象不可读取属性错误:'数字.int64'对象没有属性'theta2'这是我的代码:from collections ...
  • [1] S. Pradhan, K. Hacioglu, V. Krugler, et al. Support vector learning for semantic argument classification [J]. Machine Learning Journal, 2005, vol. 60, no. 1-3, 11-39.[2] N. Kwon, M....
  • 这是一款用于标注汉字骨架关键点的web应用。 输入应为: ① 要标注的数据集图片 ② 数据集图片对应的汉字汉字的笔画顺序 输出应为: 每一张图片对应的每一种笔画按照顺序的关键点坐标 How to use 直接运行此应用
  • 1、自定义,工具条,勾选标注,勾选使用Maplex标注引擎。 2、图层右键属性,标注,符号,勾选CJK字符方向。
  • 经过多方查找,发现是geoserver 服务器上没有安装中文字体,如图,这是我安装过的有48个字体,乱码之前是默认的28个字体,只能显示字母和数字。 解决方法: 1.在服务器找到 usr/share/fonts/myfonts 没有fonts...
  • 什么是词性标注?2. 词性标注的难点2.1 兼类现象2.1.1 英语词的兼类现象2.1.2 汉语词的兼类现象3. 词性标记集4. 基于HMM的词性标注4.1 什么是基于HMM的词性标注?4.1.1 HMM的提出4.1.2 数学角度4.1.3 Maekov模型4.2...
  • 本申请涉及自然语言处理技术领域,特别涉及一种自然语言处理中的序列标注方法、装置、设备及存储介质。背景技术:序列标注是解决自然语言处理问题时经常遇到的基本问题之一。而隐变量条件随机场模型是序列标注常用的...
  • python的词性标注

    2020-12-24 01:56:36
    这里写目录标题词性标注词性标注的特殊问题词性标注的方法设计简单标注器常用标注器介绍词性标注器的应用词性分布基于词性标注 研究词的组合 词性标注:在给定的句子中判定每个词的语法范畴,确定词性并加以标注的...
  • 自然语言处理(NLP)之pyltp的介绍与使用(中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注) pyltp的简介   语言技术平台(LTP)经过哈工大社会计算与信息检索研究中心 11 年的持续研发和推广, 是国...
  • 依存关系的五条公理,分别如下: 1.一个句子中只有一个成分是独立的; 2.句子的其他成分都从属于某一成分;...依存句法分析标注关系(共14种)及含义如下所示: 原文: https://soyoger.blog.csdn.net/article
  • 序列标注:Bi-LSTM + CRF

    2020-12-18 23:15:59
    最近在序列标注的相关任务,为了理解bi-lstm + crf的原理及细节,找了很多相关资料,以及代码实现,这里分享给大家并附上一些自己的理解。CRF相关资料推荐关于crf,我看了很多资料,这里推荐几个 - 英文的crf ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 71,691
精华内容 28,676
关键字:

中文标注是做什么的