精华内容
下载资源
问答
  • 常见中文分词列举

    2020-08-26 10:45:57
    采用是自行采集词频词典,并辅以一定程度上专有名称、人名、地名、数字年代等规则,经小范围测试大概准确率在 90% ~ 95% 之间。 网址: http://www.ftphp.com/scws/ 3、PhpanAlysis – PHP无组

    1、 HTTPCWS – 基于HTTP协议的开源中文分词系统

    基于ICTCLAS 3.0 共享版,分词精度98.45%。可以采用HTTP方式调用借口。

    网址: http://blog.s135.com/httpcws_v100/

    2、 SCWS – 简易中文分词系统

    采用的是自行采集的词频词典,并辅以一定程度上的专有名称、人名、地名、数字年代等规则集,经小范围测试大概准确率在 90% ~ 95% 之间。

    网址: http://www.ftphp.com/scws/

    3、PhpanAlysis – PHP无组件分词系统

    PhpanAlysis分词系统是基于字符串匹配的分词方法 ,这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在词典中找到某个字符串,则匹配成功(识别出一个词)。
    网址: http://www.itgrass.com/phpanalysis/

    4、结巴分词
    https://pypi.org/project/jieba/
    分词效果也比较好,加停词表,加字典也比较容易。可以过滤词性、统计词频(tf-idf),功能完整,效果不错,用起来简单。

    5、HanLP
    http://hanlp.linrunsoft.com/
    全称Han Language Processing

    6、snownlp
    python语言
    直接用pip安装,比较简单

    7、LTP
    哈工大
    有Java也有python
    需要Visual C++
    8、ansj分词器
    Java语言
    https://github.com/NLPchina/ansj_seg

    9、pynlpir分词
    中科院计算所
    python语言
    https://github.com/NLPIR-team/NLPIR

    10、thulac分词
    清华大学
    python语言,Java语言也有

    个人搜索引擎项目:
    海豚搜索 www.haiteem.com
    联系我:
    在这里插入图片描述

    我也是一个歌手哦 网易云主页

    展开全文
  • JAVA面试题最全集

    2010-03-13 13:09:10
    如何取得从1970年到现在毫秒 如何获取某个日期是当月最后一天 如何格式化日期 5.数组和集合 6.文件和目录(I/O)操作 如何列出某个目录下所有文件 如何列出某个目录下所有子目录 判断一个文件或...
  • 常见数集的集合 集,合表示方法:列举法和描述法 用描述法表示时候要有相当明确(清晰)概念。 空集是任何元素子集, 记 ∅∅\varnothing 补集,都带“相当于XX集”来说,集合A相当于全集U 补集 →CuA→...

    中国大学MOOC
    高数先修课


    函数的定义

    《集合论》

    1. 常见数集的集合
    2. 集合的表示方法:列举法和描述法
      • 用描述法表示时候要有相当明确(清晰)的概念。
    3. 空集是任何元素的子集, 记
    4. 补集,都带“相当于XX集”来说,集合A相当于全集U 的补集 CuA
    5. 直积(笛卡尔积)
    6. 符号
    对于任意正数 M,都能在区间 [a,+] 中找到一个数,满足 x>M
    M>0,x[a,+),x>M
    映射
    • 满射
    • 单射
    常量和变量
    • 有些量虽然变化,但幅度比较小,可以当作常量处理

    函数的定义域

    f(x)=lg(3x)sinx+5+4xx2
    解析:解析
    即结果:Df = {x1x<3,x0}[1,0)(0,3)


    函数相同: 定义域相同 + 对应法则完全一致

    例题:

    • f(x)=|x|φ(x)=x2 两种相同。
    • f(x)=(1x)2φ(x)=1x 定义域相同但对应法则不一样。

    函数的性质
    • 单调性
    • 有界性

      有界函数定义:存在 K1K2 ,任意 xIK2<f(x)<K1


      • f(x)I 上有界 有正数 M ,对 xI,|f(x)|M 恒成立。其中 M=max{|K1|,|K2|}

    例题:
    1、判断 f(x)= sin x 的有界性 【M=1】
    2、判断 f(x)=1x 在区间 ( 0, 1 ) 的有界性。

    答:假定 定值 Mf(x) 在 (0, 1) 上任意处的值,此时 x=1M
    x0=11+M
    x0肯定在 (0,1) 内,此时 f(x0)=1+M >M 恒成立
    即对 M ,都能找到 x0(0,1) ,使 |f(x0)|=f(x0)>M
    f(x) 在 (0,1) 内无界。

    • 奇偶性(必须是关于原点对称)
      f(x)=f(x)f(x)=f(x)

    • 周期性
      f(x+T)=f(x) 最小正周期

      函数不一定存在周期,比如常量函数 f(x)=C 和迪利克雷函数 f(x)={1x0x


    展开全文
  • 数学:集合

    2019-07-11 11:32:41
    德国数学家 康托尔 《集合论》 集合:指定对象的全体 A B C ... 常见的数集表示: 5个常见数集 集合的表示法 列举法:将集合A中所有元素列举出来的表示方法; 0,1,2,3,4,5,6,7,8,9 统称为:A ...

        德国数学家  康托尔 《集合论》
        集合:指定对象的全体    A    B    C
        元素:集合中的每个对象  a    b    c
        
        常见的数集表示:  5个常见数集
      
        
        集合的表示法
        
            列举法:将集合A中所有元素列举出来的表示方法;
            0,1,2,3,4,5,6,7,8,9  统称为:A
            表示为:
            A={0,1,2,3,4,5,6,7,8,9}
            
            描述法:用一个命题“n是小于10的非负整数”来描述集合A中所有元素n的属性;
            A{n|n是小于10的非负整数}
            
            通常我们使用描述法来表示一个集合
            {x|p(x)}      所有满足命题p(x)的实数x的集合
            例如:{x|x+4=8} 表示为:x+4=8的实数x构成的集合
                
            注意描述法来表示一个集合时:定义集合的命题要有清晰的概念
            例如:身高比较高的女生;   这个命题就不清晰,没有给出范围
            正确: 身高在175cm以上的高个子女生
            
            A={1,2}       B={1,2,3}
            A包含于B    A ⊆ B
            A是B的子集;
            当A ⊆ B 且 B ⊆ A 则称 A = B
            当A ⊆ B 且 A ≠ B 则称 A 是 B的一个真子集 记作 A ⊊ B
            
            空集:不包含任何元素的集合,记号是Ø;
            例如:{x|x^2+1=0,X ∈ R} 就是空集;
                X的平方只可能是整数 再加1  不可能等于0  ;
            空集是任何集合的子集;
            没有特别声明就是非空集合;
            
            全集:U
                若所考虑的集合总数某个特定集合的子集,则称该特定集合为全集;
                
            
            集合的运算及性质
            
            并集是指给定2个集合:A B ,把他们所有的元素合并在一起的集合,叫做集合A和集合B的并集;
            记作A U B 读作 A并B;

     

     

    给定两个集合A,B,把他们所有的元素合并在一起组成的集合,叫做集合A与集合B的并集。

    集合论中,设A,B是两个集合,由所有属于集合A且属于集合B的元素所组成的集合:叫做集合A与集合B的交集(intersection)

    并集:以属于A或属于B的元素为元素的集合称为A与B的并(集),记作A∪B(或B∪A),读作“A并B”(或“B并A”),即A∪B={x|x∈A,或x∈B}。

    交集:以属于A且属于B的元素为元素的集合称为A与B的交(集),记作A∩B(或B∩A),读作“A交B”(或“B交A”),即A∩B={x|x∈A,且x∈B}。一系列集合A1,A2,…,An的交集即A1∩A2∩…∩An。Unicode中,符号∩为$2229。

    补集:属于全集U不属于集合A的元素组成的集合称为集合A的补集,记作CuA,即CuA={x|x∈U,且x不属于A}。

     

    在这有点绕了

    集合符号
    符号 含义 符号 含义
    a∈A,a是A的元素
    交  A⊆B,A不大于B
    A属于B A⊇B,A不小于B
    A包括B Φ 空集
    R 实数 N 自然数
    Z 整数 Z+ 正整数
    Z- 负整数    

         集合运算与性质

    交换律:A  ∩(交)   B   =    B  ∩(交)  A   ,   A  ∪(并)   B   =    B  ∪(并)  A   就是交换,换个位置

    结合律:A  ∩ (交)(B∩C) =(A∩B) ∩C     , A  ∪(并)  (B∪C)    =   (A∪B) ∪  C    就是结合 , 相当于1+(2+3)=(1+2)+3

    分配律:A  ∩(交)(B∩C)=(A∩B) ∩ (A∩C)   ,A  ∪(并)  (B∪C)=(A∪B) ∪ (A∪C)  分配也简单  就是分开匹配;

    对偶律(德摩根律); Cu(A ∩(交) B)=(CuA)  ∪(并)  (CuB)    ,Cu(A  ∪(并)  B) =(CuA) ∩ (交) (CuB);

             
     
    直积:集合{(x,y)|x∈A,y∈B}    A与B的笛卡尔积(直积)记作AxB;

    设:  A={-1,1}
      B={1,2,3}

    A与B的直积为:AxB{(-1,1),(-1,2),(-1,3),(1,1),(1,2),(1,3),}

     

    区间:介于两个实数之间的全体实数构成的集合;

    常见区间形式
    区间名称 区间含义 备注
    开区间  (a,b) 所有满足不等式a<x<b的实数x构成的集合 a<x<b只取中间不取两边的点
    闭区间  [a,b] 所有满足不等式a≦x≦b的实数x构成的集合 a≦x≦b区间所有都取
    半开区间 (a,b],[a,b)

    (a,b] :{x|a<x≦b}的集合

    [a,b): {x|a<x≦b}的集合

     
    无限区间[a,+∞) {x|x≧a}的集合  

    无限区间

    (-∞,+∞)

    全体实数的集合R 

    几何上对应整个实数轴

    只是一种符号不是实数,不能参与运算

    领域:

    定义   : 设a为实数,对预先给定的正数δ,称满足不等式|x-a|<δ的全体实数构成的集合,

    即数集{ x|  | x − a |<δ }为点a的δ领域,记作U(a,δ)

    U(a,δ)={x |   a-δ <x<a+δ}  = {x|  | x-a|  <δ}=(a-δ,a+δ)   

    其中点a称为该领域的中心,称δ为该领域的半径.

    这是一个以点a为中心,长度为2δ的开区间(a-δ,a+δ),      

    这个集合中所有的点x与a的距离|x-x^0|都小于δ.(半径);

     

    有时候用到的领域需要把领域中心去掉,从领域U(a,δ)中去掉中心a而得得数集,

    称为点a的去心δ领域,记作

    (这符号不好打--原谅下)

    有时把开区间(a-δ,a)称之为a的左δ领域

    把开区间(a,a+δ)称之为a的右δ领域
     
     

     

    展开全文
  • 编码相关1 基础知识

    2016-10-14 20:14:22
    一、编码基本知识 1、字符、字符编码是什么: 字符是一个系统支持的所有抽象字符的集合 字符编码: 不同的字符编码其实是不同的法则,该法则可以使某种自然语言,与其他信号...2、常见的编码方式(列举):

    一、编码基本知识


    1、字符集、字符编码是什么:


    字符集是一个系统支持的所有抽象字符的集合


    字符编码:

    不同的字符编码其实是不同的法则,该法则可以使某种自然语言,与其他信号(信息、号码、电脉冲)相配对——即在自然语言符号与数字系统之间建立特定联系。


    简而言之,各种符号通过字符编码转化为可以被计算机识别的数字。


    2、常见的编码方式(列举):


    ASCII、GB2312、GBK、GB18030、BIG5、Unicode、UTF-8、UTF-16…


    3、计算机编码的大体发展史:


    【1】ASCII

    在英文中,字符的个数非常有限(一共不过一百多个)。一个字节为8bit,8bit能够表示256个字符。ASCII一共使用7个bit,编码了128个字符。


    【2】EASCII

    后来当计算机发展到欧洲地区,人们发现很多欧洲所特有的字符ASCII中没有,于是出现了可扩展的ASCII,并且完全兼容ASCII,称为EASCII。

    EASCII保留了ASCII的前128个字符,从第129个开始增加西欧独特的字符,一直到第256个。

    (EASCII时代比较混乱,没有统一标准)


    【3】GB2312

    当计算机发展到中国,需要表示的字符远远超出了前面两种编码方式的范围。于是在ASCII的基础上,从第128个开始,每两个编码组合一个汉字。


    【4】GBK、GB18030

    以上的GB2312仍然没有办法满足汉字的需求(比如一些繁体字、特殊符号等),于是在此基础上,增加了新的内容,形成GBK。

    在GBK基础上,加入了藏文、蒙文等主要少数民族字符,形成了GB18030。


    【5】Unicode

    情况同中国类似,在世界各个地区,都形成了自己的编码标准,相互之间无法交流。于是ISO组织提出了Unicode编码方式。


    Unicode规定:任何字符的编码长度由原来的8位改为16个bit组合(即个字节)

    注意:Unicode不与前面任何一种编码方式兼容。


    【6】UTF-8

    UTF-8是为了解决Unicode在网络上传输问题而出现的,意思是一次传输8个bit,它其实是Unicode的一种使用方式


    UTF-8中的字符编码长度是可变的,它根据具体情况,使用不同个数的bit来编码字符:

    例如ASCII字母继续使用1字节储存,重音文字、希腊字母或西里尔字母等使用2字节来储存,而常用的汉字就要使用3字节。辅助平面字符则使用4字节


    4、关于Unicode和UTF-8的关系:


    UTF-8是Unicode的应用——具体UTF-8规则如下:

    1)对于单字节的符号,字节的第一位设为0,后面7位为这个符号的unicode码。因此对于英语字母,UTF-8编码和ASCII码是相同的。
    2)对于n字节的符号(n>1),第一个字节的前n位都设为1,第n+1位设为0,后面字节的前两位一律设为10。剩下的没有提及的二进制位,全部为这个符号的unicode码。



















    展开全文
  • (3)结构之法:汇集了常见的对字符串、链表、队列,以及树等进行操作的题目。 (4)数学之趣:列举了一些不需要写具体程序的数学问题,锻炼读者的抽象思维能力。 书中绝大部分题目都提供了详细的解说。 每道题目...
  • 编程之美(高清版)pdf

    2018-03-13 15:46:18
    (3)结构之法:汇集了常见的对字符串、链表、队列,以及树等进行操作的题目。 (4)数学之趣:列举了一些不需要写具体程序的数学问题,锻炼读者的抽象思维能力。 书中绝大部分题目都提供了详细的解说。 每道题目...
  • 以下是我列举的经典题目(带 91 字样表示出自 91 天学算法活动): 面试题 17.12. BiNode 0001. 两之和 0020. 有效括号 0021. 合并两个有序链表 0026. 删除排序数组中重复项 0053. 最大子序和 ...
  • 关于统计信息的常见误区 339 总结 341 聚簇因子、柱状图与执行计划(作者:段林仲) 343 CLUSTERING_FACTOR对于执行计划影响 344 CURSOR_SHARING与SQL执行计划 348 Histograms对于执行计划影响 352 表...
  • CruiseYoung提供带有详细书签电子书籍目录 http://blog.csdn.net/fksec/article/details/7888251 Oracle SQL高级编程(资深Oracle专家力作,OakTable团队推荐) 基本信息 原书名: Pro Oracle SQL 原出版社: ...
  • 实战系列03:请避开Stream流式编程常见的坑 实战系列04:使用Java8 Optional类优雅解决空指针问题 数据结构和算法 学什么? 有些同学可能要问了:我学 Java 的有必要学习算法吗?答案是:别无选择! 国内互联网...
  • 1.1.8 NFS 和 SMB 是最常见的两种 NAS(Network Attached Storage)协议,当把一个文件系统同时通过 NFS 和 SMB 协议共享给多个主机访问时,以下哪些说法是错误的 1.1.9 输入 ping IP 后敲回车,发包前会发生什么?...
  • 7.4 常见的已检查型异常 实例166 类未发现异常 实例167 非法访问异常 实例168 文件未发现异常 实例169 数据库操作异常 7.5 处理异常 实例170 方法中抛出异常 实例171 方法上抛出异常 实例172 自定义异常类 ...
  • 7.4 常见的已检查型异常 实例166 类未发现异常 实例167 非法访问异常 实例168 文件未发现异常 实例169 数据库操作异常 7.5 处理异常 实例170 方法中抛出异常 实例171 方法上抛出异常 实例172 自定义异常类 ...
  • 7.4 常见的已检查型异常 214 实例166 类未发现异常 214 实例167 非法访问异常 215 实例168 文件未发现异常 216 实例169 数据库操作异常 217 7.5 处理异常 218 实例170 方法中抛出异常 218 实例171 方法上抛出异常 ...
  • 7.4 常见的已检查型异常 214 实例166 类未发现异常 214 实例167 非法访问异常 215 实例168 文件未发现异常 216 实例169 数据库操作异常 217 7.5 处理异常 218 实例170 方法中抛出异常 218 实例171 方法上抛出异常 ...
  • 《Microsoft SQL Server 2008技术内幕:T-SQL查询》内容丰富、文字简洁明快,列举的实例具有一定难度,而且实用性很强,可以把它们作为解决实际问题标准模式。阅读《Microsoft SQL Server 2008技术内幕:T-SQL查询...
  • DRCD数据由中国台湾台达研究院发布,其形式与SQuAD相同,是基于繁体中文抽取式阅读理解数据。 由于ERNIE中去除了繁体中文字符,故不建议在繁体中文数据上使用ERNIE(或转换成简体中文后再处理)。 评测指标为...
  • 包括Java简介、程序基本概念、面向对象基本概念、面向对象高 级知识、包及访问控制权限、异常捕获及处理、Eclipse开发工具、Java新特性、多线程、Java常用类库、Java IO编程、Java网络编程、Java类框架、Java...
  • C# 程序设计手册(WORD)

    2010-10-19 15:40:30
    建立列举型别新方法 199 建构函式 200 使用建构函式 201 实例建构函式 204 私用建构函式 209 静态建构函式 211 撰写复制建构函式 213 对象和集合初始化表达式 217 初始化对象但不呼叫建构函式 219 使用集合初始化...
  • CruiseYoung提供带有详细书签电子书籍目录 http://blog.csdn.net/fksec/article/details/7888251 该资料是《Oracle SQL高级编程》源代码 对应书籍资料见: Oracle SQL高级编程(资深Oracle专家力作,...
  • 16. hibernate进行多表查询每个表中各取几个字段,也就是说查询出来结果没有一个实体类与之对应如何解决; 123 17.介绍一下Hibernate二级缓存 123 18、Spring 依赖注入是什么意思? 给一个 Bean message ...
  • 最新Java面试宝典pdf版

    热门讨论 2011-08-31 11:29:22
    16. hibernate进行多表查询每个表中各取几个字段,也就是说查询出来结果没有一个实体类与之对应如何解决; 123 17.介绍一下Hibernate二级缓存 123 18、Spring 依赖注入是什么意思? 给一个 Bean message ...
  • Java面试宝典2010版

    2011-06-27 09:48:27
    16. hibernate进行多表查询每个表中各取几个字段,也就是说查询出来结果没有一个实体类与之对应如何解决; 17.介绍一下Hibernate二级缓存 18、Spring 依赖注入是什么意思? 给一个 Bean message 属性, ...
  • 实例112 计算两个日期间月份 第5章 复杂查询技术 5.1 使用子查询 实例113 将子查询作为表达式 实例114 用子查询作为派生表 实例115 通过子查询关联数据 实例116 使用IN谓词限定查询范围 实例117 使用NOT IN子...
  • 软件工程教程

    热门讨论 2012-07-06 23:10:29
    过去十种面向对象建模语言各自为战,而UML可以消除一些潜在差异,一统江湖 通过统一语义和符号表示,提高面向对象技术 使项目建立在一个成熟标准建模语言基础之上 便于沟通和交流,统一理解 UML主要内容 ...
  • 8.2.1 将子查询结果用于比较 251 8.2.2 星型转换(Star Transformation) 252 8.2.3 生成执行SELECT语句表 253 8.2.4 生成投影值 253 8.2.5 生成传递给DML语句行 253 8.3 列举子查询类型 255 8.3.1 ...
  • Java开发实战1200例.第2卷.part3

    热门讨论 2013-05-08 22:46:34
    实例112 计算两个日期间月份 192 第5章 复杂查询技术 194 5.1 使用子查询 195 实例113 将子查询作为表达式 195 实例114 用子查询作为派生表 196 实例115 通过子查询关联数据 197 实例116 使用IN谓词限定查询范围...
  • Java开发实战1200例.第2卷.part2

    热门讨论 2013-05-08 22:45:35
    实例112 计算两个日期间月份 192 第5章 复杂查询技术 194 5.1 使用子查询 195 实例113 将子查询作为表达式 195 实例114 用子查询作为派生表 196 实例115 通过子查询关联数据 197 实例116 使用IN谓词限定查询范围...

空空如也

空空如也

1 2 3
收藏数 44
精华内容 17
关键字:

列举常见的数集