精华内容
下载资源
问答
  • 语料库 corpora是一个Django项目,用于收集不同语言的corpora。 它的构建是为了支持Te ReoMāori的第一种语言。 该应用程序的目标是简化少数族裔语言的语料库收集,以便听写,私人助理和其他技术可以在te reoMāori...
  • 为了便于将雷达回波仿真应用于实践,提出一种雷达回波实时仿真的软件实现设计方法。按照雷达信号接收处理的工作原理,对雷达工作方式和战场环境分别建模并作适当简化,利用软件编程实现雷达回波仿真。...
  • 口语会话语料库上的文本聚类
  • 大学英语学习者口语语料库 COLSEC (5万) 上海交大香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学中国英语专业语料库 CEME (148万) 南京大学中国英语学习者口语语料库 SECCL (100万) 南京大学国际外语...

    大学英语学习者口语语料库 COLSEC (5万) 上海交大

    香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学

    中国英语专业语料库 CEME (148万) 南京大学

    中国英语学习者口语语料库 SECCL (100万) 南京大学

    国际外语学习者英语口语语料库中国部分 LINSEI-China (10万) 华南师大

    硕士写作语料库 MWC (12万) 华中科技大学

    平行语料库 汉英平行语料库 PCCE 北外

    南大-国关平行语料库 南京大学

    英汉文学作品语料库; 外研社

    冯友兰《中国哲学史》汉英对照语料库

    李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库

    计算机专业的双语语料库;国家语言文字工作委员会语言文字应用研究所

    柏拉图(Plato)哲学名著《理想国》的双语语料库

    英汉双语语料库(15万对) 中科院软件所

    英汉双语语料库:LDC香港新闻英汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对中国科学院自动化研究所

    英汉双语语料库(100万),网上英汉语段电子词典及网上电子英汉搭配词典(1000万) 东北大学

    英汉双语语料库(40-50万句子对) 哈尔滨工业大学

    双语语料库(5万多对) 北京大学计算语言学研究所

    对比语料库 LIVAC(Linguistic variety in Chinese communities) 香港城市理工大学

    平衡语料库(Sinica Corpus);树图语料库(Sinica Treebank) 台湾

    特殊英语语料库 中国英语(China English)语料库河南师范大学

    军事英语语料库(Corpus of Military Texts) 解放军外语学院

    新视野大学英语教材语料库 上海交通大学

    汉语语料库汉语现代文学作品语料库(1979年,527万字) 武汉大学

    现代汉语语料库(1983年,2000万字) 北京航空航天大学

    中学语文教材语料库(1983年,106万8000字) 北京师范大学

    现代汉语词频统计语料库(1983年,182万字) 北京语言学院

    国家级大型汉语均衡语料库(2000万字) 国家语言文字工作委员会

    《人民日报》语料库(2700万字) 北京大学计算机语言学研究所

    大型中文语料库(5亿字,10分库) 北京语言文化大学

    现代汉语语料库(1亿字) 清华大学

    汉语新闻语料库;(1988年,250万字) 山西大学

    标准语料库(2000年,70万字)

    生语料库(3000万字);《作家文摘》的标注语料库(100万字) 上海师范大学

    现代自然口语语料库 中国社会科学院语言所

    旅游咨询口语对话语料库和旅馆预定口语对话语料库中国科学院自动化所

    北京大学汉语语言学研究中心的三个语料库

    展开全文
  • 英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大大学英语学习者口语语料库 COLSEC (5万) 上海交大香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学中国英语专业语料库 CEME ...

    英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大

    大学英语学习者口语语料库 COLSEC (5万) 上海交大

    香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学

    中国英语专业语料库 CEME (148万) 南京大学

    中国英语学习者口语语料库 SECCL (100万) 南京大学

    国际外语学习者英语口语语料库中国部分 LINSEI-China (10万) 华南师大

    硕士写作语料库 MWC (12万) 华中科技大学

    平行语料库 汉英平行语料库 PCCE 北外

    南大-国关平行语料库 南京大学

    英汉文学作品语料库; 外研社

    冯友兰《中国哲学史》汉英对照语料库

    李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库

    计算机专业的双语语料库;国家语言文字工作委员会语言文字应用研究所

    柏拉图(Plato)哲学名著《理想国》的双语语料库

    英汉双语语料库(15万对) 中科院软件所

    英汉双语语料库:LDC香港新闻英汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对中国科学院自动化研究所

    英汉双语语料库(100万),网上英汉语段电子词典及网上电子英汉搭配词典(1000万) 东北大学

    英汉双语语料库(40-50万句子对) 哈尔滨工业大学

    双语语料库(5万多对) 北京大学计算语言学研究所

    对比语料库 LIVAC(Linguistic variety in Chinese communities)

    香港城市理工大学

    平衡语料库(Sinica Corpus);树图语料库(Sinica Treebank) 台湾

    特殊英语语料库 中国英语(China English)语料库河南师范大学

    军事英语语料库(Corpus of Military Texts) 解放军外语学院

    新视野大学英语教材语料库 上海交通大学

    汉语语料库汉语现代文学作品语料库(1979年,527万字) 武汉大学

    现代汉语语料库(1983年,2000万字) 北京航空航天大学

    中学语文教材语料库(1983年,106万8000字) 北京师范大学

    现代汉语词频统计语料库(1983年,182万字) 北京语言学院

    国家级大型汉语均衡语料库(2000万字) 国家语言文字工作委员会

    《人民日报》语料库(2700万字) 北京大学计算机语言学研究所

    大型中文语料库(5亿字,10分库) 北京语言文化大学

    现代汉语语料库(1亿字) 清华大学

    汉语新闻语料库;(1988年,250万字) 山西大学

    标准语料库(2000年,70万字)

    生语料库(3000万字);《作家文摘》的标注语料库(100万字) 上海师范大学

    现代自然口语语料库 中国社会科学院语言所

    旅游咨询口语对话语料库和旅馆预定口语对话语料库中国科学院自动化所

    北京大学汉语语言学研究中心的三个语料库

    展开全文
  • 基于上下文特征的口语会话语料库中文自动聚类
  • 小说中的书面对话自动建立情感口语文本语料库
  • 基于对普通语音语料库构建方法的研究与分析,结合自然口语语音识别研究相关需求以及藏语自然口语语音的基本特点,研究设计了适用于藏语语音识别的口语语音语料库建设方案以及相应的标注规范,并据此构建了时长50小时...
  • NLP语料库

    千次阅读 2014-04-24 18:00:50
    大学英语学习者口语语料库 COLSEC (5万) 上海交大 香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学 中国英语专业语料库 CEME (148万) 南京大学 中国英语学习者口语语料库 SECCL (100万) 南京大学 ...

    自然语言处理的很多工作都离不开语料库,我在网上找到了别人分享的一个国内语料库的汇总,借过来,分享给需要的朋友!

    英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大
    大学英语学习者口语语料库 COLSEC (5万) 上海交大
    香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学
    中国英语专业语料库 CEME (148万) 南京大学
    中国英语学习者口语语料库 SECCL (100万) 南京大学
    国际外语学习者英语口语语料库中国部分 LINSEI-China (10万) 华南师大
    硕士写作语料库 MWC (12万) 华中科技大学
    平行语料库 汉英平行语料库 PCCE 北外
    南大-国关平行语料库 南京大学
    英汉文学作品语料库; 外研社
    冯友兰《中国哲学史》汉英对照语料库
    李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库
    计算机专业的双语语料库;国家语言文字工作委员会语言文字应用研究所
    柏拉图(Plato)哲学名著《理想国》的双语语料库
    英汉双语语料库(15万对) 中科院软件所
    英汉双语语料库:LDC香港新闻英汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对中国科学院自动化研究所
    英汉双语语料库(100万),网上英汉语段电子词典及网上电子英汉搭配词典(1000万) 东北大学
    英汉双语语料库(40-50万句子对) 哈尔滨工业大学
    双语语料库(5万多对) 北京大学计算语言学研究所
    对比语料库 LIVAC(Linguistic variety in Chinese communities)香港城市理工大学
    平衡语料库(Sinica Corpus);树图语料库(Sinica Treebank) 台湾
    特殊英语语料库 中国英语(China English)语料库河南师范大学
    军事英语语料库(Corpus of Military Texts) 解放军外语学院
    新视野大学英语教材语料库 上海交通大学
    汉语语料库汉语现代文学作品语料库(1979年,527万字) 武汉大学
    现代汉语语料库(1983年,2000万字) 北京航空航天大学
    中学语文教材语料库(1983年,106万8000字) 北京师范大学
    现代汉语词频统计语料库(1983年,182万字) 北京语言学院
    国家级大型汉语均衡语料库(2000万字) 国家语言文字工作委员会
    《人民日报》语料库(2700万字) 北京大学计算机语言学研究所
    大型中文语料库(5亿字,10分库) 北京语言文化大学
    现代汉语语料库(1亿字) 清华大学
    汉语新闻语料库;(1988年,250万字) 山西大学
    标准语料库(2000年,70万字)
    生语料库(3000万字);《作家文摘》的标注语料库(100万字) 上海师范大学
    现代自然口语语料库 中国社会科学院语言所
    旅游咨询口语对话语料库和旅馆预定口语对话语料库中国科学院自动化所

    转自http://blog.sina.com.cn/s/blog_62a9902f0100tvh9.html
    展开全文
  • 国内语料库建设

    千次阅读 2013-02-25 18:38:07
    大学英语学习者口语语料库 COLSEC (5万) 上海交大 香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学 中国英语专业语料库 CEME (148万) 南京大学 中国英语学习者口语语料库 SECCL (100万) 南京大学 国际...

    英语学习者语料库(书面语及口语)中国学习者语料库 CLEC(100万)广外、上海交大
    大学英语学习者口语语料库 COLSEC (5万) 上海交大
    香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学
    中国英语专业语料库 CEME (148万) 南京大学
    中国英语学习者口语语料库 SECCL (100万) 南京大学
    国际外语学习者英语口语语料库中国部分 LINSEI-China (10万) 华南师大
    硕士写作语料库 MWC (12万) 华中科技大学
    平行语料库 汉英平行语料库 PCCE 北外
    南大-国关平行语料库 南京大学
    英汉文学作品语料库; 外研社
    冯友兰《中国哲学史》汉英对照语料库
    李约瑟(Joself Needham)《中国科学技术史》英汉对照语料库
    计算机专业的双语语料库;国家语言文字工作委员会语言文字应用研究所
    柏拉图(Plato)哲学名著《理想国》的双语语料库
    英汉双语语料库(15万对) 中科院软件所
    英汉双语语料库:LDC香港新闻英汉双语对齐语料36294段以及香港法律英汉双语对齐语料31万句子对中国科学院自动化研究所
    英汉双语语料库(100万),网上英汉语段电子词典及网上电子英汉搭配词典(1000万) 东北大学
    英汉双语语料库(40-50万句子对) 哈尔滨工业大学
    双语语料库(5万多对) 北京大学计算语言学研究所
    对比语料库 LIVAC(Linguistic variety in Chinese communities) 香港城市理工大学
    平衡语料库(Sinica Corpus);树图语料库(Sinica Treebank) 台湾
    特殊英语语料库 中国英语(China English)语料库河南师范大学
    军事英语语料库(Corpus of Military Texts) 解放军外语学院
    新视野大学英语教材语料库 上海交通大学
    汉语语料库汉语现代文学作品语料库(1979年,527万字) 武汉大学
    现代汉语语料库(1983年,2000万字) 北京航空航天大学
    中学语文教材语料库(1983年,106万8000字) 北京师范大学
    现代汉语词频统计语料库(1983年,182万字) 北京语言学院
    国家级大型汉语均衡语料库(2000万字) 国家语言文字工作委员会
    《人民日报》语料库(2700万字) 北京大学计算机语言学研究所
    大型中文语料库(5亿字,10分库) 北京语言文化大学
    现代汉语语料库(1亿字) 清华大学
    汉语新闻语料库;(1988年,250万字) 山西大学
    标准语料库(2000年,70万字)
    生语料库(3000万字);《作家文摘》的标注语料库(100万字) 上海师范大学
    现代自然口语语料库 中国社会科学院语言所
    旅游咨询口语对话语料库和旅馆预定口语对话语料库中国科学院自动化所

    北京大学汉语语言学研究中心的三个语料库

    现代汉语语料库
    http://ccl.pku.edu.cn/yuliao.asp?item=1
     古代汉语语料库
    http://ccl.pku.edu.cn/yuliao.asp?item=2
     汉英双语语料库
    http://ccl.pku.edu.cn/yuliao.asp?item=3

    http://www.corpus4u.org/printthread.php?t=2742

    展开全文
  • 在自然语言处理中,人工标注的口语
  • CCL的语料库有部分口语(北京话调查)语料,包含部分影视作品(如百家讲坛、周星驰电影等)语料,网络语料,书面语语料。其中,报纸语料占绝对大比例。CCL最新一次更新,增加了许多学术论文语料;此外CCL还有古代汉语和...
  • 国内常见语料库

    2014-02-24 19:07:00
    类型 语料库名称及大小 ...大学英语学习者口语语料库COLSEC (5万) 上海交大 香港科技大学学习者语料库HKUST Learner Corpus 香港科技大学 中国英语专业语料库CEME (148万) ...
  • 国内语料库建设一览表

    千次阅读 2013-04-23 18:07:12
    大学英语学习者口语语料库 COLSEC (5万) 上海交大 香港科技大学学习者语料库 HKUST Learner Corpus 香港科技大学 中国英语专业语料库 CEME (148万) 南京大学 中国英语学习者口语语料库 SECCL (100万) ...
  • COCA语料库

    2018-07-29 12:50:47
    COCA 20000高频词汇。... 简单的说,coca就是把1990-2012年美国最有代表性的报纸,杂志,小说,学术,口语口语可能是用的电视剧或者脱口秀之类的节目转录的)汇集起来,每部分各占1/5,生成4.5亿单词量语料库
  • 语料库名称及大小 建设单位英语学习者语料库(书面语及口语) 中国学习者语料库 CLEC(100万) 广外、上海交大大学英语学习者口语语料库 COLSEC (5万) 上海交大香港科技大学学习者语料库 HKUST Learner Corpus
  • 吕苏语口语的汉语标注语料自动分词是后续建立高质量的吕苏语口语语料库和吕苏语典藏系统的基础性工作。目前对于吕苏语标注语料分词的研究几乎为零,对吕苏语特点进行了分析,同时将中文自动分词结巴方法应用到吕苏语...
  • 柏林情感语料库

    2019-03-04 15:28:10
    德国柏林语料库,共535条数据,由十个演员(5男5女)录制,7种情感。(中性/nertral、生气/anger、害怕/fear、高兴/joy、悲伤/sadness、厌恶/disgust、无聊/boredom),采样率48kHz(后压缩到16kHz),16bit量化,语料...
  • 国内主要语料库总汇

    千次阅读 2013-07-26 00:21:59
    说明:引用此文请注明出处,并务请保留后面的有效链接地址,谢谢!... 国内主要语料库总汇 ...语料库名称及大小 ...英语学习者语料库(书面语及口语) 中国学习者语料库 CLEC(100万) 广外、上海交大
  • 语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或 口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规 模的语料库能够反映和记录语言的实际使用情况...
  • 搜索引擎-语料库

    千次阅读 2007-01-19 22:05:00
    语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。经过科学选材和标注、具有适当规模的语料库能够反映和记录语言的实际使用情况。...
  • 三、基于语料库的语篇分析研究发展趋势 基于语料库的语篇分析研究正...语料库从收集文本语料阶段发展到储备口语语料阶段,目前逐渐步入多媒体语篇的发展阶段。组建多媒体语料库的优势在于其应用性:首先,在教学方面...
  • 美国当代英语语料库20000词频表完整版 含词性。优先背下来口语常用词,适合以提高英语口语水平和实际交流能力为目的的学习者。
  • 美国当代英语语料库(Corpus of Contemporary ...其语料均衡分布在口语、小说、杂志、报纸以及学术文章五类文体中,被认为是用来观察美国英语当前发展变化的最合适的英语语料库,也是广大英语爱好者的学习宝库。

空空如也

空空如也

1 2 3 4 5
收藏数 84
精华内容 33
关键字:

口语语料库