精华内容
下载资源
问答
  • 常用的maven数据

    2021-05-27 20:53:25
    内容如下 <mirror> <id>alimaven<...aliyun maven</name> <url>http://maven.aliyun.com/nexus/content/groups/public/</url> <mirrorOf>central</mirrorO

    内容如下

    
            <mirror>
                <id>alimaven</id>
                <name>aliyun maven</name>
                <url>http://maven.aliyun.com/nexus/content/groups/public/</url>
                <mirrorOf>central</mirrorOf>
            </mirror>
            
             <mirror>
                <id>alimaven</id>
                <name>aliyun maven</name>
                <url>http://central.maven.org/maven2</url>
                <mirrorOf>central</mirrorOf>
            </mirror>
            <mirror>
                <id>uk</id>
                <mirrorOf>central</mirrorOf>
                <name>Human Readable Name for this Mirror.</name>
                <url>http://uk.maven.org/maven2/</url>
            </mirror>
    
            <mirror>
                <id>CN</id>
                <name>OSChina Central</name>
                <url>http://maven.oschina.net/content/groups/public/</url>
                <mirrorOf>central</mirrorOf>
            </mirror>
    
            <mirror>
                <id>nexus</id>
                <name>internal nexus repository</name>
                <url>http://repo.maven.apache.org/maven2</url>
                <mirrorOf>central</mirrorOf>
            </mirror>
           
    
    展开全文
  • pom.xml 支持jkbc:org.springframework.bootspring-boot-starter-jdbcOracle:pom.xml:...

    pom.xml 支持jkbc:

    org.springframework.boot

    spring-boot-starter-jdbc

    Oracle:

    pom.xml:

    com.oracle

    ojdbc6

    12.1.0.1-atlassian-hosted

    application.properties:

    spring.datasource.url=jdbc:oracle:thin:@localhost:1521:orcl

    spring.datasource.username=userstudy

    spring.datasource.password=userstudy

    spring.datasource.driver-class-name=oracle.jdbc.driver.OracleDriver

    MySql:

    pom.xml:

    mysql

    mysql-connector-java

    5.1.21

    application.properties:

    spring.datasource.url=jdbc:mysql://localhost:3306/test

    spring.datasource.username=dbuser

    spring.datasource.password=dbpass

    spring.datasource.driver-class-name=com.mysql.jdbc.Driver

    展开全文
  • 这种一般是开启了依赖检查,检查时发现引入的多个依赖中都包含相同的子依赖,而且版本一致。 所以可以通过设置在某些依赖中排除相同依赖的方法进行解决,如下示例中在kafka依赖中排除log4j等依赖: <dependency> ...

    问题

    在编译某些开源项目时,会提示如下内容:

    Require upper bound dependencies error for io.airlift:aircompressor:0.15 paths to dependency are:
    +-io.hetu.core:presto-vv:1.3.0
      +-io.hetu.core:presto-main:1.3.0
        +-io.airlift:aircompressor:0.15 (managed) <-- io.airlift:aircompressor:0.16
    and
    +-io.hetu.core:presto-vv:1.3.0
      +-org.apache.pulsar:managed-ledger:2.8.0
        +-org.apache.pulsar:pulsar-common:2.8.0
          +-io.airlift:aircompressor:0.15 (managed) <-- io.airlift:aircompressor:0.16
    and
    +-io.hetu.core:presto-vv:1.3.0
      +-io.hetu.core:presto-main:1.3.0
        +-io.hetu.core:hetu-transport:1.3.0
          +-io.airlift:aircompressor:0.15 (managed) <-- io.airlift:aircompressor:0.16
    and
    +-io.hetu.core:presto-vv:1.3.0
      +-io.hetu.core:presto-tests:1.3.0
        +-io.hetu.core:presto-main:1.3.0
          +-io.airlift:aircompressor:0.15 (managed) <-- io.airlift:aircompressor:0.16
    ,
    Require upper bound dependencies error for com.fasterxml.jackson.dataformat:jackson-dataformat-yaml:2.11.4 paths to dependency are:
    +-io.hetu.core:presto-vv:1.3.0
      +-org.apache.pulsar:managed-ledger:2.8.0
        +-org.apache.pulsar:pulsar-common:2.8.0
          +-com.fasterxml.jackson.dataformat:jackson-dataformat-yaml:2.11.4 (managed) <-- com.fasterxml.jackson.dataformat:jackson-dataformat-yaml:2.12.3
    ]
    [INFO] ------------------------------------------------------------------------
    [INFO] BUILD FAILURE
    [INFO] ------------------------------------------------------------------------
    [INFO] Total time:  5.581 s
    [INFO] Finished at: 2021-09-15T14:53:10+08:00
    [INFO] ------------------------------------------------------------------------
    [ERROR] Failed to execute goal org.apache.maven.plugins:maven-enforcer-plugin:3.0.0-M3:enforce (default) on project presto-vv: Some Enforcer rules have failed. Look above for specific messages explaining why the rule failed. -> [Hel
    p 1]
    [ERROR]
    [ERROR] To see the full stack trace of the errors, re-run Maven with the -e switch.
    [ERROR] Re-run Maven using the -X switch to enable full debug logging.
    [ERROR]
    [ERROR] For more information about the errors and possible solutions, please read the following articles:
    [ERROR] [Help 1] http://cwiki.apache.org/confluence/display/MAVEN/MojoExecutionException
    
    

    原因及解决方法

    这种一般是开启了依赖检查,检查时发现引入的多个依赖中都包含相同的子依赖,而且版本不一致。

    所以可以通过设置在某些依赖中排除相同依赖的方法进行解决,如下示例中在kafka依赖中排除log4j等依赖:

    <dependency>
        <groupId>org.apache.kafka</groupId>
        <artifactId>kafka_2.10</artifactId>
        <version>${dep.kafka.version}</version>
        <exclusions>
            <exclusion>
                <groupId>log4j</groupId>
                <artifactId>log4j</artifactId>
            </exclusion>
            <exclusion>
                <groupId>org.slf4j</groupId>
                <artifactId>slf4j-log4j12</artifactId>
            </exclusion>
            <exclusion>
                <artifactId>zookeeper</artifactId>
                <groupId>org.apache.zookeeper</groupId>
            </exclusion>
            <exclusion>
                <artifactId>netty</artifactId>
                <groupId>io.netty</groupId>
            </exclusion>
            <exclusion>
                <groupId>org.scala-lang</groupId>
                <artifactId>scala-library</artifactId>
            </exclusion>
        </exclusions>
    </dependency>
    
    展开全文
  • 点击蓝字关注我们AI TIME欢迎每一位AI爱好者的加入!事件检测任务是事件抽取的第一步,对事件语义建模有重要意义。然而现有事件检测数据集存在两个严重的问题:(1)数据稀缺,现有小规模数...

    点击蓝字

    关注我们

    AI TIME欢迎每一位AI爱好者的加入!

    事件检测任务是事件抽取的第一步,对事件语义建模有重要意义。然而现有事件检测数据集存在两个严重的问题:

    (1)数据稀缺,现有小规模数据集不足以充分训练和稳定评测复杂的神经网络模型;

    (2)覆盖率低,现有数据集关心的有限数据类型不足以覆盖通用域中的广泛事件语义,也限制了事件检测模型的应用范围。

    为了缓解这些问题带来的影响,本文构建了一个大规模通用域事件检测数据集MAVEN,它包含4480篇文章和118732个事件实例,覆盖了168种事件类型。同时也在MAVEN数据集上复现了一系列当前最佳的模型并进行了全面的实验。实验结果显示在传统数据集上表现极好的模型并不能在MAVEN上也取得理想的表现,这表明事件检测仍是一个具有挑战性的方向。本文也通过一些实证分析讨论了事件检测任务后续的发展方向。

     

    本期AI TIME PhD直播间,我们有幸邀请到了清华大学计算机系的博士一年级研究生王晓智,为大家分享这项研究工作!

    王晓智:清华大学计算机系博士一年级研究生,导师李涓子教授。主要研究方向为事件抽取和预训练语言模型。已在EMNLP、NAACL、COLING等会议发表多篇文章。

    一、背景

     

    一、    事件检测的定义

    事件检测任务旨在从文本中识别事件触发词并正确分类事件类型。触发词指的是最能清晰明显表达事件出现的核心词语或短语,事件类型则需要在数据集中预先定义。

    比如,在图1中,born是一个触发词,触发了birth这一事件,同时baptized也是一个触发词,触发了baptism这一事件。简单地说,事件检测任务的目的是从文本中检测出所关心的事件。

    图1:事件检测举例

     

    二、现有事件检测数据集的严重缺陷

    事件检测在事件语义建模中具有基础性的作用,近些年来中外学者在事件检测的任务上做了很多的研究工作,提出了很多先进的模型,也取得了越来越好的事件检测的表现。然而值得注意的是,尽管整个事件抽取领域的模型更新非常快速,标准数据集的更新换代却非常的缓慢。不仅如此,标准数据集通常存在数据稀缺和覆盖率低这两个严重问题。

     

    以目前最广泛使用的事件检测数据集ACE 2005为例,它只有不到600篇文档和5000多个标注出来的事件实例,仅仅覆盖了33个事件类型,这样的事件规模在现在看来是非常小而且难以充分训练模型的。同时由于难以避免的数据不平衡性,在这33个类别中,有20个事件类别只有不到100个标注实例。数据本身就非常小,再加上这么长尾的分布,很难去训练和稳定评测对数据量需求比较大的神经网络模型。

    图2:ACE 2005统计数据

    图3:事件检测数据集统计细节

     

    二、解决方案

    一、MAVEN数据集的构建

    从数据稀缺和覆盖率低这两个问题出发,作者构造了MAVEN,一个大规模通用域的事件检测数据集。

     

    首先看一下MAVEN的统计信息:针对数据稀缺这一问题,标注的Event Mentions的数量超过了10万,比起之前的数据集具备数量级级别的提升;针对覆盖率低的问题,MAVEN定义的Event Type达到了168个。可以看到,MAVEN比所有的现有数据检测数据集规模都要大很多,可以显著缓解数据稀缺和覆盖率低这两个问题。

    图4:MAVEN的统计信息

     

    构建的第一步,需要做Document Selection,选择一些合适的语料来用于标注。具体来说,选择的是4480篇英文维基的文章作为标注的基础语料。

    选择英文维基的原因:

    首先,被使用范围比较广泛,语言的形式也相对流畅,比较好理解;

    第二,虽然事件抽取目前与知识图谱的结合工作不算特别多,但是长远来看,它也是一个信息抽取任务,它的目的是为了丰富知识库中的资源,因此选用英文维基这么一个比较容易与其它的信息抽取任务和知识图谱相结合的一个语料,对于将来的数据构建和模型开发都是有一定帮助的。

    具体来说,这4480篇文章的主题描述的是大事件,因为描述大事件的文章要比描述客观的实体,比如说香蕉、苹果,的文章含有更多的需要标注的基础事件,原子级别的事件。

     

    第二步,做Candidate Selection(选择一些词作为用于标注的candidate)和Automatic Labeling(自动标注,比如预先用一些模型来做一个预置的推荐的标注结果),从而节省标注员的一些时间和精力,对整体的标注质量也是有帮助的。

     

    最后一步是一个两阶段的人工标注,这一步与之前的ACE2005等数据集的构建思路非常类似:第一阶段中,对于每篇文档,邀请了2位独立的标注员来做独立的互相不知道结果的标注,从而能够比较好的提升标注的召回;第二阶段,邀请一位受过严格训练的标注员在第一阶段标注结果的基础上进行最终的标注。这个标注过程是实践证明会比较可靠的。

    图5:MAVEN的构建

     

    在做数据标注之外,要保证数据集有一个好的覆盖率,因此从FrameNet中推导派生出了一个Event Type Schema,它的特点是不仅覆盖率比较高,而且具备层次化,有比较明确的父子继承关系,会比较方便后面的模型做一些工作。这里展示的仅仅是一小部分的例子,如果对整个的168个事件的schema感兴趣,可以参阅论文的附录。

    图6:层次化的Event Type Schema

     

    二、MAVEN标注出的数据分布

    整体来讲,MAVEN的数据分布还是非常长尾的。虽然数据分布本身的长尾不可避免,但是因为整体的数据规模做得非常大,其中41%的事件类型是超过500个标注实例的,82%的事件类型是超过100个标注实例的,对模型的训练会有很好的帮助。

     

    另外一个比较关键的观察是,在MAVEN中会有多个事件在同一个句子中出现,模型可以考虑到一句话中不同事件类型之间的联系,更好地做事件类型的分类。这必定对模型是会有帮助的。然而,由于之前的一些小规模的数据集覆盖率比较低,一个句子中出现多个事件的现象是比较少见的,这也鼓励了模型设计针对这一现象做更多的考虑。

     

    二、实验结果

    一、模型表现

    实验中实现了6个神经网络模型,同时在ACE 2005和MAVEN上比较了模型的表现。可以看出,模型在MAVEN上的表现显著差于在ACE 2005上的表现,这说明通用域的事件检测难度是非常大的,需要更多的研究精力来解决这个任务。同时,MAVEN上的模型表现标准差常常是比ACE 2005上的标准差低非常多的,这也证明小数据规模的数据集是不能稳定评测神经网络模型的。

     

    进一步来看,以BiLSTM和BiLSTM+CRF作为模型,DMBERT和BERT+CRF作为模型,两对模型对比可以看出,加入CRF的模型表现在MAVEN上是要比基础模型要好的,而在ACE 2005上,它的提升不会很明显。考虑到CRF的主要作用是考虑一句话中多个事件之间的联系,可以证明之前所说的观察,启发之后的模型设计更多的往这一点上考虑。

     

    另一个发现是,BiLSTM模型的表现在ACE 2005上是非常高的,甚至比BERT还要高,这可能也是证明了在ACE 2005这个小数据集上有一些不稳定性,而在MAVEN上并没有这个问题。

    图7:ACE 2005和MAVEN的模型表现

    二、对比实验

    MAVEN数据集的一个显著优势是做了更多的数据和事件类型,为了观察数据量和事件类型是否足够,做了两个对比实验。

     

    首先随机选择了一定比例MAVEN的训练数据,看这些比例下的训练数据的表现结果。从数据规模上来看,随着数据规模的上升,模型表现也在上升。现有数据集的规模无法使得模型得到充分训练,不足以得到稳定的比较结果,而在整个MAVEN的大小上,表现结果是再增加数据也不会带来很大的模型表现的提升;从事件类型的数量上来看,随着数量的上升,模型的表现在下降,这也证明了高覆盖率会带来一些新的挑战。

    图8:对比实验的结果

     

    三、Transferability实验

    另一个要研究的问题是,在MAVEN上学习到了一些通用的事件检测的知识,然而通用域的知识能不能迁移到其它的检测工作上,在这里做了一个简单的实验来探索这个方向。实验采用了两种knowledge transfer的方式,一种是Direct Data Augmentation,一种是Intermediate Pretrain。可以看到,直接做数据增强的结果呈现比起原始结果的表现是要低一些的,这可能是由于MAVEN的语料与ACE语料之间domain的差异,把数据直接加进去的话表现会受到一定的影响。另一方面,Intermediate Pretrain的表现是要高一些的,证明将来可以探索怎样开发更好的knowledge transfer的方式。

    图9:knowledge transfer的实验表现

     

    四、错误分析

    除了之前的实验,我们还对实现的模型做了错误分析,以期得到一些将来可以改进的方向。

    第一种类型的错误,即假阳性和假阴性,可以看到这个类型的错误占错误比例是最高的,表明真正从文本中检测事件语义这一步骤是非常困难的,这也是将来模型要首先攻克的方向。

     

    而第二种类型的错误Event Type Mistakes,即将数据错误分类到另一个Event Type中,可以看到在层次化的Event Type Schema下面,父子兄弟这种比较接近的类型之间互相分错的比例显著高于分错到别的类型的比例。

     

    最后一种情况指的是,把一个数据错误的分类到数据量位于前50%的event type中去,可以看到这个比例非常的高,证明数据不平衡带来了很大的影响。

    图10:错误分析

    这些错误分析希望可以对大家做的模型开发有一些帮助。

     

    总结及未来展望

    首先,MAVEN是大规模的,人工标注的,具有高覆盖率的一个数据集。

     

    其次,作者通过实证研究指出了开发新的通用域的事件检测模型的方向。比如,可以更高的建模一句话中多个事件的联系,可以对长尾类型做更好的理解,可以用knowledge transfer帮助一些数据量比较小的工作。在这些方向中,层次化的Event Type Schema会比较有帮助。

     

    未来作者也计划在MAVEN上继续Event Argument Extraction和Event Relation Extraction的数据,从而能够使得MAVEN变成事件语义理解的一个大平台。

     

    相关代码和数据集可以从https://github.com/THU-KEG/MAVEN-dataset获取,模型的预测结果可以在CodaLab上提交,欢迎大家多多使用。

     

    论文原文和链接:

    Xiaozhi Wang, et al. "MAVEN: A Massive General Domain Event Detection Dataset."

    https://arxiv.org/pdf/2004.13590.pdf

     

      e           m     t

    往期精彩

     AI                i

    整理:san

    排版:岳白雪

    审稿:王晓智

    AI TIME欢迎AI领域学者投稿,期待大家剖析学科历史发展和前沿技术。针对热门话题,我们将邀请专家一起论道。同时,我们也长期招募优质的撰稿人,顶级的平台需要顶级的你!

    请将简历等信息发至yun.he@aminer.cn!

    微信联系:AITIME_HY

    AI TIME是清华大学计算机系一群关注人工智能发展,并有思想情怀的青年学者们创办的圈子,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法、场景、应用的本质问题进行探索,加强思想碰撞,打造一个知识分享的聚集地。

    更多资讯请扫码关注

     

    (直播回放:https://b23.tv/GoTxPR)

    (点击“阅读原文”下载本次报告ppt)

    展开全文
  • Maven

    2021-08-03 09:54:26
    MavenMaven基础1.Maven简介1.1 Maven是什么1.2 Maven的作用2.Maven环境搭建2.1 下载2.2 安装2.3 环境配置3.Maven基础概念3.1 仓库3.2 坐标3.3 仓库配置4.Maven项目搭建4.1 手动搭建maven项目4.2 IDEA工具搭建maven...
  • 当我们进入mybatis – MyBatis 3 | 配置网站时,会出现下面这个页面 这是专门用来防止爬虫爬取数据的认证方式,修改DNS就可以了,亲测有效: 第一步,打开网络和Internet设置 第二步,点击更改适配器选项 第三步,...
  • 在开发过程中, 在使用Maven来引入Oracle数据库驱动时, 会报错:Missing artifact com.oracle:ojdbc6:jar:11.2.0.4.0报这个错是因为版权原因, Maven的中央仓库并没有收录Oracle的驱动Oracle驱动这时, 我们需要手动把...
  • 1、驱动加载之后,发现找到对应的数据库(数据库已存在) 2、导致这个原因是本地服务中,启动了两个mysql,一个是Mysql,一个是mysqlzt。把mysqlzt终止。 上次自己也出现过一次这样的,但是没录下来,...
  • 点击上方蓝色字体,选择“标星公众号”优质文章,第一时间送达看到题目有人就会说了,Maven谁不会啊?而且Maven还有要被淘汰的趋势,最近Gradle很火热,大有取代Maven的势头,移动...
  • 步骤一:配置pom.xml 给pom.xml添加如下代码 <build> <plugins> <plugin>...org.apache.maven.plugins</groupId> <artifactId>maven-war-plugin</artifactId> <
  • 一、现状 dubbo-api 使用规范,导致项目之间耦合高,隐藏风险大。 在项目开发过程中,可避免的需要跨团队...2、现在对maven项目没有做版本管理。出现的问题是:比如:依赖tms-api的项目用的是log4j打印日志。而tm
  • 服务能启动,因为是用的dubbo,下面也一直在有写数据,但是url输入地址,打开,一直转圈,好几分钟都不行一直进去。 运行窗口有提示一个bug,bug如下: 严重: Unable to process Jar entry [module-info.class] ...
  • Maven 插件

    2020-12-18 18:00:29
    Maven 插件Maven 有以下三个标准的生命周期:clean:项目清理...这些 phase 就相当于 Maven 提供的统一的接口,然后这些 phase 的实现由 Maven 的插件完成。我们在输入 mvn 命令的时候 比如 mvn clean,clean 对应...
  • 1.确认Maven安装正常,在cmd窗口输入mvn -version 可以获得版本号;2. 确认maven安装包下/conf/setting.xml配置文件正确本地仓库位置:D:\03sources\mvn-repository远程中央仓库:nexus-aliyuncentralNexus ...
  • Spark大数据分析与实战:IDEA使用Maven构建Spark项目 一、创建maven工程 二、修改pom.xml文件导入依赖 pom.xml文件代码如下: <?xml version="1.0" encoding="UTF-8"?> <project xmlns=...
  • 解决maven编译在nexus上...Nexus是一套“开箱即用”的系统需要数据库,它使用文件系统加Lucene组织数据。 需求背景 使用gitlab项目发布到服务器的时候都需要先进行编译,公司使用nexus作为maven管理。 问题发现 nex
  • Maven 仓库

    2021-11-18 17:34:46
    Maven 仓库 何为Maven仓库 在Maven世界中,任何一个依赖、插件或者项目构建的输出,都可以称为构件。例如依赖log4j-1.2.15.jar是一个构件,插件maven-compiler-plugin-2.0.2.jar是一个构件,项目构建完成后的输出jar...
  • 现象: IDEA使用Maven始终无法下来jar包! 解决方式: 通过 Execute Maven Goal 添加 dependency:sources ,然后执行。
  • maven re

    2021-06-16 06:26:22
    maven repository怎么理解简单点说,repository就是个仓库。 maven里有两种仓库,本地仓库和远程仓库。远程仓库相当于公共的仓库,大家都能看到。 本地仓库是你本地的一个山寨版,只有你看的到,主要起缓存作用。 ...
  • maven skywalking

    2021-05-14 10:19:34
    maven-resources-plugin:3.1.0:resources maven-compiler-plugin:3.8.1:compile maven-resources-plugin:3.1.0:testResources maven-compiler-plugin:3.8.1:testCompile maven-surefire-plugin:2.22.2:test maven-...
  • 默认情况下,Maven项目中java和resource路径下的资源文件能导出,所以我们要在Maven项目里的pom.xml中添加以下代码,然后代码一旦运行就能把相关的.properties .xml .tld等文件一并打包导出: <build> <...
  • 读入数据总结 前言 Maven 除了以程序构建能力为特色之外,还提供高级项目管理工具。由于 Maven 的缺省构建规则有较高的可重用性,所以常常用两三行 Maven 构建脚本就可以构建简单的项目。由于 Maven 的面向项目的...
  • Maven打包技巧

    千次阅读 2020-12-20 00:03:48
    “打包“这个词听起来比较土,比较正式的说法应该是”构建项目软件包“,具体说就是将...作为一款”打包工具“,Maven自然有义务帮助用户创建各种各样的包,规范的JAR包和WAR包自然不再话下,略微复杂的自定义打包...
  • maven

    2021-10-27 14:56:58
    1.Maven概述 1.1.为什么要学习Maven? 1.1.1.从构建角度解释 1.1.1.1.个人开发流程 1.1.1.2.团队开发流程 引申:更大范围内的团队协作 1.1.2.从依赖角度解释 1.1.2.1.jar包的规模 随着我们使用越来越多的框架,...
  • maven 资源配置 将jdbc.properties的数据信息 配置到pom里 jdbc.driver=com.mysql.jdbc.Driver jdbc.url=jdbc:mysql://localhost:3306/ssm_db jdbc.username=root jdbc.password=itheima 将jdbc.properties的数据...
  • Maven高级

    2021-10-31 18:59:24
    Maven工程关系:依赖,继承,聚合 有三种关系:依赖,继承,聚合 【3】依赖的好处: 省去了程序员手动添加jar包测操作,省事!! 还可以帮我们解决jar包冲突的问题: 依赖传递性: 案例演示依赖的传递性: 然后...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 267,277
精华内容 106,910
关键字:

maven数据出不来