精华内容
下载资源
问答
  • 全国各省城市名称及拼音全国各省城市名称及拼音全国各省城市名称及拼音全国各省城市名称及拼音
  • 2017全国行政区划省市区完整版附经纬度及拼音,系统已投入使用
  • 一年级语文拼音学习重点及拼音专项训练.pdf
  • 本资源收集了5000以上的汉字及拼音和首字母 https://mp.csdn.net/postedit/81201171(在这里作者提供了收集方法)
  • 本DLL可查20876个不同汉字的拼音拼音首字母,支持GBK大字符集。
  • 行业分类-设备装置-拼音教具及拼音训练方法
  • 初中七到九年级语文生字及拼音大全[有拼音].doc
  • 全国行政区划2017年最新完整版,省市区完整信息及拼音检索等高级版,可完美导入各类数据库。
  • json文件,key为城市的拼音,value为城市对应的汉语词汇。使用Python语言的接口是: import json with open(r'country.json', encoding = 'utf-8') as json_data: country_dict = json.load(json_data)
  • ip获取所在地及拼音

    2013-03-18 12:22:26
    ip获取所在地及拼音---------C#.Net实例代码
  • 最好用的五笔及拼音输入法 最好用的五笔及拼音输入法
  • 随机生成中文姓名,并将姓名转换为拼音以及拼音简写,同时能够生成SQL脚本,或者直接插入到数据库中
  • 中文分词及拼音分词

    千次阅读 2019-02-27 15:57:37
    注:根据实际需求修改远程热更新分词停止词,请求为文件,默认一行一个关键词或停止词 拼音插件安装 #在elasticsearch的plugins/目录下创建pinyin文件夹 mkdir pinyin #解压文件 cd pinyin unzip /es/...

    相关软件下载

    elasticsearch-analysis-ik-6.4.2.zip
    elasticsearch-analysis-pinyin-6.4.2.zip

    安装插件

    ik分词插件安装

    #在elasticsearch的plugins/目录下创建ik文件夹
    cd elasticsearch/plugins/
    mkdir ik
    #解压文件
    cd ik
    unzip /es/tools/elasticsearch-6.4.2/elasticsearch-analysis-ik-6.4.2.zip
    #修改配置文件
    vi config/IKAnalyzer.cfg.xml

    注:根据实际需求修改远程热更新分词及停止词,请求为文件,默认一行一个关键词或停止词

    拼音插件安装

    #在elasticsearch的plugins/目录下创建pinyin文件夹
    mkdir pinyin
    #解压文件
    cd pinyin
    unzip /es/tools/elasticsearch-6.4.2/elasticsearch-analysis-pinyin-6.4.2.zip
    #启动
    #重启elasticsearch

    展开全文
  • 中国城市拼音列表,里面有三千多个城市,如果需要db文件可以下载SQLite Expert Professional 3 来转换 ,希望可帮到大家
  • ElasticSearch使用入门及拼音搜索介绍

    千次阅读 2018-08-04 14:49:17
    最近有个项目需要用到拼音搜索并高亮显示所匹配的中文,其实拼音搜索可以通过将中文转化为拼音存储在库表如mysql中,然后通过sql like语句查询搜索到对应的中文,在一些并发要求并不高、中文已知的情况下是完全可以...

    最近有个项目需要用到拼音搜索并高亮显示所匹配的中文,其实拼音搜索可以通过将中文转化为拼音存储在库表如mysql中,然后通过sql like语句查询搜索到对应的中文,在一些并发要求并不高、中文已知的情况下是完全可以做到拼音搜索。但是由于项目要求不仅能够搜索出来对应的中文,但是对于高亮显示匹配的中文难度成本就比较高了,此时需要通过中文拼音分词来实现。
    经过一番调研,鉴于elasticsearch社区的活跃,及相关拼音分词插件也比较丰富,选用ES作为搜索方案。虽然现在ES版本已经到了6.x了,而且每隔一个月左右都会有新版本发布,由于机器条件等的限制,ES版本越高越吃内存和CPU,所以选择2.4.2版本,稳定、占用内存小、支持集群,满足本次需求,如果空间不够也可多安装几个ES组成集群。

    es安装

    官网选择2.4.2的linux版本tgz安装包下载上传到linux服务器,解压后在bin中启动,两种启动方式:
    1.前台启动./elasticsearch,启动日志显示在前台console,关闭会话则关闭ES
    2.后台启动./elasticsearch -d,启动日志打印在logs文件夹下。
    此时可通过linux的curl命令来请求ES的http restful接口创建索引、type、增删改查等基本操作,也可通过Post等工具请求ES的Http接口。本文通过head工具进行操作。

    安装plugin-head

    使用head插件是ES必备的工具,除了可以操作请求restful接口操作ES数据库,还可以用于观察ES的状态等。
    通过在bin文件下执行命令./plugin install mobz/elasticsearch-head,ES则自动到github上下载并安装。
    通过ip:port/_plugin/head即可访问ES,port默认为9200,如果发现不能访问,则需要在config文件下的elasticsearch.yml修改或添加如下网络配置,然后重启es后再通过ip:port/_plugin/head访问即可(http.port可配置)。
    安装head后的效果图1

    elasticsearch.yml配置,暂未知es的关闭方法,可通过kill命令关闭es

    #网络及端口配置
    network.host: 0.0.0.0
    http.port: 11192

    创建索引index

    ES的Restful接口语法规则一般是用json来进行数据存储或设置,可通过head插件中的【复合查询】菜单栏进行操作,支持多数HTTP传输模式。
    head http操作界面

    ES中的索引相当于mysql的库,type相当于mysql中的表。
    ES创建索引的方式也很简单,通过http PUT接口即可创建一个索引,如下:

    http://172.168.1.11:11192/es_dev_v1
    //通过对以上接口进行PUT操作,即可创建名为 es_dev_v1 的索引

    创建完成后如下
    index创建

    创建type,并创建mapping

    ES默认是可以不用设置type的mapping的,可以直接通过http存储数据,ES会根据存储的json数据自动创建一个type及对应的字段mapping,如下

    http://172.168.1.11:11192/es_dev_v1/temp/12
    
    //传输方式:POST
    {
      "name":"test",
      "address":"America",
      "tel":"132134542"
    }
    //通过POST存储数据,即在es_dev中的temp type(表)中存储了一条id=12的数据,如果id不传,则ES会自动创建一个id用于引用这条数据。

    添加后的数据及mapping如下,3个字段都默认为String类型
    添加数据

    通过访问http://172.168.1.11:11192/es_dev_v1
    数据mapping

    如何修改索引字段类型(即mapping)

    ES索引一旦创建,不支持修改索引的mapping,如修改某个字段的类型、分词、搜索规则等,ES的规则是字段类型只能是创建索引的时候就设置好或者由ES自动设置,如果要修改只能重新创建一个索引index,然后重新设置mapping.当然线上生产环境是不允许这么做的。
    可以借用别名来切换ES库表,创建一个索引es_dev_v1时,指定它的别名为es_dev,当需要修改mapping时,再创建一个索引es_dev_v2设置新的mapping,然后将数据刷入es_dev_v2,删除es_deves_dev_v1的别名关系,重新建立es_deves_dev_v2的关联。此时使用es_dev即可访问索引库。
    参考:https://blog.csdn.net/lengfeng92/article/details/38230521

    使用搜索

    网上百度或博客上对于Http或Java客户端搜索有很多的文章讲解得很清楚,本文就不再赘述,再下节拼音搜索会简单搜索。

    中文拼音分词工具使用

    下载对应版本的拼音搜索插件,解压copy至elasticsearch-2.4.2/plugins/pinyin文件夹下面,其中包括elasticsearch-analysis-pinyin-1.8.2.jarnlp-lang-1.7.jarplugin-descriptor.properties文件,重启es服务,如下图
    拼音插件安装

    • 创建索引添加拼音分词
      给索引es_dev_v3添加拼音分析工具
    http://172.168.1.11:11192/es_dev_v3   PUT
    
    {
        "index" : {
            "analysis" : {
                "analyzer" : {
                    "pinyin_analyzer" : {
                        "tokenizer" : "my_pinyin"
                        }
                },
                "tokenizer" : {
                    "my_pinyin" : {
                        "type" : "pinyin",
                        "keep_separate_first_letter" : false,
                        "keep_full_pinyin" : true,
                        "keep_original" : true,
                        "limit_first_letter_length" : 10,
                        "lowercase" : true,
                        "remove_duplicated_term" : true
                    }
                }
            }
        }
    }
    • 测试分词工具

    访问http://172.168.1.11:11192/es_dev_v3/_analyze?text=刘德华&analyzer=pinyin_analyzer,返回拼音分词结果如下,可看出elasticsearch-analysis-pinyin支持拼音分词和首字母缩写

    {
        "tokens": [
            {
                "token": "liu",
                "start_offset": 0,
                "end_offset": 1,
                "type": "word",
                "position": 0
            },
            {
                "token": "de",
                "start_offset": 1,
                "end_offset": 2,
                "type": "word",
                "position": 1
            },
            {
                "token": "hua",
                "start_offset": 2,
                "end_offset": 3,
                "type": "word",
                "position": 2
            },
            {
                "token": "刘德华",
                "start_offset": 0,
                "end_offset": 3,
                "type": "word",
                "position": 3
            },
            {
                "token": "ldh",
                "start_offset": 0,
                "end_offset": 3,
                "type": "word",
                "position": 4
            }
        ]
    }
    • 配置mapping
      mapping添加如下设置,表示user表中的userName字段采用拼音分词搜索功能,而userPhone字段则不进行分词。ES默认对所有String类型的字段进行分词,意味着搜索是一个一个词去匹配搜索的,如果不需要分词,则设置为not_analyzed即可,此时则只支持精确匹配该字段搜索。
    http://172.168.1.11:11192/es_dev_v3/user/_mapping   POST
    
    {
      "user": {
        "properties": {
          "userName": {
            "type": "string",
            "fields": {
              "pinyin": {
                "type": "string",
                "store": false,
                "term_vector": "with_offsets",
                "analyzer": "pinyin_analyzer",
                "boost": 10
              }
            }
          },
          "userAddress": {
            "type":"string",
            "similarity": "classic"
          },
          "userPhone": {
            "type":"string",
            "index": "not_analyzed"
          }
        }
      }
    }
    • 搜索
      以下均用match_phrase短语搜索匹配,其它搜索如termmatch_all等感兴趣的同学可以在网上搜下其它技术博客研究下。
      1.通过POST接口上传demo数据
      部分数据

    2.userName搜索

    POST请求接口 http://172.168.1.11:11192/es_dev_v3/user/_search
    {
      "query": {
        "match_phrase": {
          "userName": "张"
        }
      },
      "highlight": {
        "fields": {
          "userName": {}
        }
      }
    }
    
    返回结果
    {
        "took": 126,
        "timed_out": false,
        "_shards": {
            "total": 5,
            "successful": 5,
            "failed": 0
        },
        "hits": {
            "total": 1,
            "max_score": 0.19178301,
            "hits": [
                {
                    "_index": "es_dev_v3",
                    "_type": "user",
                    "_id": "1",
                    "_score": 0.19178301,
                    "_source": {
                        "userName": "张三",
                        "userAddress": "深圳南山",
                        "userPhone": "1387897454"
                    },
                    "highlight": {
                        "userName": [
                            "<em>张</em>三"
                        ]
                    }
                }
            ]
        }
    }

    3.userName拼音搜索

    POST请求 http://172.168.1.11:11192/es_dev_v3/user/_search
    {
      "query": {
        "match_phrase": {
          "userName.pinyin": "zhang"
        }
      },
      "highlight": {
        "fields": {
          "userName.pinyin": {}
        }
      }
    }
    
    返回结果
    {
        "took": 1,
        "timed_out": false,
        "_shards": {
            "total": 5,
            "successful": 5,
            "failed": 0
        },
        "hits": {
            "total": 1,
            "max_score": 1.5342641,
            "hits": [
                {
                    "_index": "es_dev_v3",
                    "_type": "user",
                    "_id": "1",
                    "_score": 1.5342641,
                    "_source": {
                        "userName": "张三",
                        "userAddress": "深圳南山",
                        "userPhone": "1387897454"
                    },
                    "highlight": {
                        "userName.pinyin": [
                            "<em>张</em>三"
                        ]
                    }
                }
            ]
        }
    }
    • 如何修改index设置
    http://172.168.1.11:11192/es_im_dev/_close   POST  关闭索引
    http://172.168.1.11:11192/es_im_dev/_settings   PUT
    
    {
      "index": {
        "analysis": {
          "analyzer": {
            "pinyin_analyzer": {
              "tokenizer": "my_pinyin"
            }
          },
          "tokenizer": {
            "my_pinyin": {
              "type": "pinyin",
              "keep_separate_first_letter": true,
              "keep_full_pinyin": true,
              "keep_joined_full_pinyin": false,
              "keep_original": true,
              "limit_first_letter_length": 16,
              "lowercase": true,
              "remove_duplicated_term": true
            }
          }
        }
      }
    }
    
    http://172.168.1.11:11192/es_im_dev/_open   POST  打开索引

    ES其它设置

    • ES的内存设置
      通过/elasticsearch-2.4.2/bin/elasticsearch.in.sh文件可修改ES的内存。
    # check in case a user was using this mechanism
    if [ "x$ES_CLASSPATH" != "x" ]; then
        cat >&2 << EOF
    Error: Don't modify the classpath with ES_CLASSPATH. Best is to add
    additional elements via the plugin mechanism, or if code must really be
    added to the main classpath, add jars to lib/ (unsupported).
    EOF
        exit 1
    fi
    
    ES_CLASSPATH="$ES_HOME/lib/elasticsearch-2.4.2.jar:$ES_HOME/lib/*"
    # 内存大小设置
    if [ "x$ES_MIN_MEM" = "x" ]; then
        ES_MIN_MEM=256m
    fi
    if [ "x$ES_MAX_MEM" = "x" ]; then
        ES_MAX_MEM=1g
    fi
    if [ "x$ES_HEAP_SIZE" != "x" ]; then
        ES_MIN_MEM=$ES_HEAP_SIZE
        ES_MAX_MEM=$ES_HEAP_SIZE
    fi
    
    # min and max heap sizes should be set to the same value to avoid
    # stop-the-world GC pauses during resize, and so that we can lock the
    # heap in memory on startup to prevent any of it from being swapped
    • ES日志设置
      ES的日志遵循log4j的设置模式,有多种类型可选择。ES默认日志是每天滚动记录,默认类型(type)为dailyRollingFile的方式,通过修改elasticsearch-2.4.2/config/logging.yml文件可设置日志记录方式为rollingFile,并设置日志记录数量maxBackupIndex及大小maxFileSize即可有效减小日志大小、防止吃满硬盘。
    appender:
      console:
        type: console
        layout:
          type: consolePattern
          conversionPattern: "[%d{ISO8601}][%-5p][%-25c] %m%n"
    
      file:
        type: rollingFile
        file: ${path.logs}/${cluster.name}.log
        maxFileSize: 10000000
        maxBackupIndex: 5
        layout:
          type: pattern
          conversionPattern: "[%d{ISO8601}][%-5p][%-25c] %.10000m%n"
    展开全文
  • 最全中文汉字拼音

    2014-12-14 13:39:53
    最全中文-》拼音库,Mysql整理,GBK汉字对应拼音数据表
  • 全国省市区关系表格,省与市的拼音拼音为个人拼写的不保证完全正确,希望有错误大家可以联系我更正。区与县的拼音没有给,太多了没精力。包含地区的坐标位置,是直接从mysql中导出的excel表格,可原样导入直接...
  • 主要介绍了JS实现获取汉字首字母拼音、全拼音及混拼音的方法,涉及针对ChinesePY.js插件的使用及事件响应相关操作技巧,需要的朋友可以参考下
  • 功能 分布式的搜索引擎和数据分析引擎 全文检索,结构化检索,数据分析 对海量数据进行近实时的处理 环境搭建 从官网下载压缩包 elasticsearch-5.6.1.tar.gz; 解压 tar -zxvf elasticsearch-5.6.1.tar.gz $ES_HOME...

    功能

    • 分布式的搜索引擎和数据分析引擎
    • 全文检索,结构化检索,数据分析
    • 对海量数据进行近实时的处理

    环境搭建


    1. 从官网下载压缩包 elasticsearch-5.6.1.tar.gz;
    2. 解压 tar -zxvf elasticsearch-5.6.1.tar.gz $ES_HOME
    3. 因es只能由除root以外的用户启动,则给予相应的权限,如给common用户,chown -R common:root elasticsearch-5.6.1
    4. 配置,vi $ES_HOME/config/elasticsearch.yml
      主要修改以下配置
      cluster.name: **
      node.name: node-1
      network.host: 192.168.0.250
      http.port: 9200
    5. 添加ik、pinyin插件,将对应版本的插件下载放到$ES_HOME/plugins下即可
      https://github.com/medcl/elasticsearch-analysis-ik
      https://github.com/medcl/elasticsearch-analysis-pinyin
    6. 用户common启动es

    bin/elasticsearch -d 后台启动
    • 可通过chrome插件 elasticsearch-head 连接es

    应用

    • 新建index,自定义ik_pinyin_analyzer分析器
    curl -XPUT "http://localhost:9200/index_name/" -d'
    {
        "index": {
            "analysis": {
                "analyzer": {
                    "ik_pinyin_analyzer": { "type": "custom", "tokenizer": "ik_smart", "filter": ["my_pinyin", "word_delimiter"] }
                },
                "filter": {
                    "my_pinyin": { "type": "pinyin", "first_letter": "prefix", "padding_char": " " }
                }
            }
        }
    }
    • 创建一个type并设置mapping
    curl -XPOST http://localhost:9200/index_name/app/_mapping -d'
    {
        "app": {
            "properties": {
                "appname": {
                    "type": "keyword",
                    "fields": {
                        "pinyin": {
                            "type": "text",
                            "store": "no",
                            "term_vector": "with_positions_offsets",
                            "analyzer": "ik_pinyin_analyzer",
                            "boost": 10
                        }
                    }
                }
            }
        }
    }
    • 可通过外部数据导入index,或者手动put
    • 最后便可通过es来搜索
    curl -XGET http://localhost:9200/index_name/app/_search?q=appname.pinyin:wangzhe荣耀
    展开全文
  • 该表格可以在EXCEL中利用微软拼音库进行汉字转拼音操作,转换后的拼音带有声调,而且能在转换时自动识别多音字,使用时必须先安装微软拼音。(在安装office的过程中如果选择了微软拼音则不用另外单独安装)。
  • 汉字转换为拼音及拼音首字母示例 编程环境: Windows 2003 VS.NET2005 C#
  • 微信小程序源码,前端源码,简单展示源码,原生小程序源码 非uniapp,仅供参考,如有涉及版权问题请联系作者。微信小程序源码,前端源码,简单展示源码,原生小程序源码 非uniapp,仅供参考,如有涉及版权问题请联系...
  • 由于其组合生成的文本文档有765MB大小. 压缩后也有114MB 现为加快下载速度,将其做成程序. 运行 CreateChinaName.exe 后会以当前目录下生成相应的TXT文件 程序没有界面,生成完毕后,会自动退出. ...
  • 目录Swift中文转拼音(带声调)中文转拼音(无声调)中文提取首字母Objective-C中文转拼音(带声调)中文转拼音(无声调)中文提取首字母 Swift 中文转拼音(带声调) 比如:中国 -> zhōng guó let base = 中国 let ...
  • 批量加拼音工具(拼音居士)小工具。 批量为汉字加拼音的小工具,小巧实用。让你不再为应付大量加拼音任务而发愁。
  • 5000常用字带拼音

    2020-12-05 23:49:14
    我自己写代码生成的拼音,5000个常用汉字,已经制作成word文档格式,适合家里有小孩的家长下载,幼儿园、小学均可。 格式大致如下: --------------------------- | xiè | wò | fù | huà | --------------------...
  • 百度OCR文字转拼音

    2020-06-24 10:55:40
    百度ocr文字转拼音实例,只需要加入百度Api Key和Secret Key,或者license文件。代码全都来源于网络,IDE版本androidstudio3.5.2
  • QT下谷歌拼音输入法

    2021-01-15 14:06:57
    这是安卓底层的谷歌拼音输入法源码,基于Qt5.4.2
  • 生成拼音代码

    2018-07-11 14:14:26
    汉字转化成拼音,在ORACLE已经用了一段时间了,能够正常转换,有需要的朋友可以下载看看

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 120,809
精华内容 48,323
关键字:

及的拼音