精华内容
下载资源
问答
  • 继上一篇D3.js - 某招聘网信息统计可视化简单统计了一些职位和公司比例信息,有时候某些简历自动分拣系统等对关键字进行过滤,这时就有必要去统计一下某些职位下关键字权重。准备数据这里取职位描述内容进行关键词...

    继上一篇D3.js - 某招聘网信息统计可视化简单统计了一些职位和公司比例信息,有时候某些简历自动分拣系统等对关键字进行过滤,这时就有必要去统计一下某些职位下关键字的权重。

    准备数据

    这里取职位描述内容进行关键词提取,一次性从数据库提取匹配记录汇总到一个文本文件,直接对标题进行like匹配,这里以“世上最好的语言PHP”为例

    select title, content from job where title like "%php%";

    写到一个文件

    print(len(res))
    with open('php.txt', 'wt') as f:
        for r in res:
            f.write(r['content'])

    分词统计

    这里使用Python版结巴分词jieba中基于TF-IDF算法的关键词抽取进行权重计算;相对统计数量,权重显得更直观一点。

    这里使用自带的demo extract_tags_with_weight.py就行了

    取前十关键字权重(34882条PHP招聘信息)

    python3 extract_tags_with_weight.py php.txt -k 10 -w 1

    这里写图片描述

    这里有中文,这些并不怎么需要,过滤掉中文取听top10技术关键字

    python3 extract_tags_with_weight.py php.txt -k 999999 -w 1 | grep 'tag: [a-z]' | sed -n '1,10p'

    这里把-k参数调最大取全部,同时也要将文本全转成小写或大写防止重复

    这里写图片描述

    其他职位

    权重是全部关键字统计所得,已去除中文部分

    php top 50

    记录:34882

    tag: php                  weight: 0.241653
    tag: mysql                weight: 0.127151
    tag: web                  weight: 0.070640
    tag: linux                weight: 0.062477
    tag: css                  weight: 0.061224
    tag: javascript           weight: 0.060166
    tag: html                 weight: 0.052278
    tag: ajax                 weight: 0.040207
    tag: jquery               weight: 0.033997
    tag: mvc                  weight: 0.024620
    tag: sql                  weight: 0.024506
    tag: thinkphp             weight: 0.021231
    tag: lamp                 weight: 0.020800
    tag: xml                  weight: 0.020014
    tag: div                  weight: 0.018878
    tag: redis                weight: 0.018336
    tag: apache               weight: 0.017596
    tag: js                   weight: 0.016749
    tag: yii                  weight: 0.015015
    tag: nginx                weight: 0.014331
    tag: html5                weight: 0.011799
    tag: nosql                weight: 0.011088
    tag: xhtml                weight: 0.010838
    tag: app                  weight: 0.010734
    tag: http                 weight: 0.010595
    tag: unix                 weight: 0.010556
    tag: shell                weight: 0.010319
    tag: json                 weight: 0.010156
    tag: memcache             weight: 0.010130
    tag: oop                  weight: 0.010030
    tag: lnmp                 weight: 0.009845
    tag: java                 weight: 0.008475
    tag: ci                   weight: 0.008348
    tag: mongodb              weight: 0.007690
    tag: smarty               weight: 0.007537
    tag: api                  weight: 0.007303
    tag: python               weight: 0.007112
    tag: memcached            weight: 0.007014
    tag: zend                 weight: 0.006881
    tag: svn                  weight: 0.006774
    tag: ecshop               weight: 0.006349
    tag: bug                  weight: 0.006180
    tag: git                  weight: 0.005200
    tag: discuz               weight: 0.005051
    tag: oracle               weight: 0.004645
    tag: w3c                  weight: 0.004577
    tag: c++                  weight: 0.004544
    tag: cms                  weight: 0.004515
    tag: framework            weight: 0.004012
    tag: css3                 weight: 0.003905

    python top 50

    记录:3229

    tag: python               weight: 0.217281
    tag: web                  weight: 0.107951
    tag: linux                weight: 0.085868
    tag: mysql                weight: 0.061585
    tag: django               weight: 0.060428
    tag: redis                weight: 0.030252
    tag: javascript           weight: 0.029916
    tag: css                  weight: 0.029580
    tag: html                 weight: 0.028722
    tag: tornado              weight: 0.028125
    tag: mongodb              weight: 0.027454
    tag: flask                weight: 0.024022
    tag: java                 weight: 0.021075
    tag: git                  weight: 0.020255
    tag: http                 weight: 0.019471
    tag: php                  weight: 0.017905
    tag: shell                weight: 0.016562
    tag: sql                  weight: 0.015741
    tag: nginx                weight: 0.015480
    tag: c++                  weight: 0.014809
    tag: api                  weight: 0.013503
    tag: jquery               weight: 0.012981
    tag: nosql                weight: 0.012086
    tag: js                   weight: 0.011713
    tag: mvc                  weight: 0.011228
    tag: postgresql           weight: 0.010668
    tag: app                  weight: 0.010594
    tag: github               weight: 0.009586
    tag: tcp                  weight: 0.009437
    tag: ip                   weight: 0.008691
    tag: html5                weight: 0.007908
    tag: unix                 weight: 0.007460
    tag: ruby                 weight: 0.007199
    tag: restful              weight: 0.007087
    tag: apache               weight: 0.006267
    tag: ajax                 weight: 0.006043
    tag: py                   weight: 0.006006
    tag: openstack            weight: 0.005968
    tag: hadoop               weight: 0.005670
    tag: mac                  weight: 0.005670
    tag: memcache             weight: 0.005483
    tag: com                  weight: 0.005260
    tag: socket               weight: 0.005036
    tag: xml                  weight: 0.004961
    tag: wecash               weight: 0.004887
    tag: oracle               weight: 0.004513
    tag: www                  weight: 0.004103
    tag: svn                  weight: 0.003991
    tag: experience           weight: 0.003991
    tag: bug                  weight: 0.003954

    java top 50

    记录:53599

    tag: java                 weight: 0.173577
    tag: web                  weight: 0.069864
    tag: spring               weight: 0.069113
    tag: mysql                weight: 0.065630
    tag: oracle               weight: 0.048071
    tag: j2ee                 weight: 0.046025
    tag: sql                  weight: 0.045887
    tag: javascript           weight: 0.045806
    tag: linux                weight: 0.040972
    tag: hibernate            weight: 0.038958
    tag: jquery               weight: 0.033819
    tag: html                 weight: 0.032508
    tag: tomcat               weight: 0.031317
    tag: css                  weight: 0.029937
    tag: struts               weight: 0.028279
    tag: ajax                 weight: 0.026473
    tag: jsp                  weight: 0.022588
    tag: mvc                  weight: 0.020513
    tag: ibatis               weight: 0.020188
    tag: mybatis              weight: 0.019560
    tag: servlet              weight: 0.015777
    tag: xml                  weight: 0.015701
    tag: js                   weight: 0.014403
    tag: redis                weight: 0.013724
    tag: eclipse              weight: 0.013452
    tag: weblogic             weight: 0.012535
    tag: springmvc            weight: 0.011370
    tag: jboss                weight: 0.011296
    tag: struts2              weight: 0.011183
    tag: http                 weight: 0.010566
    tag: server               weight: 0.010471
    tag: svn                  weight: 0.009402
    tag: ssh                  weight: 0.009260
    tag: nosql                weight: 0.008990
    tag: sqlserver            weight: 0.008626
    tag: html5                weight: 0.008624
    tag: uml                  weight: 0.008324
    tag: apache               weight: 0.008202
    tag: maven                weight: 0.008192
    tag: app                  weight: 0.007383
    tag: mongodb              weight: 0.007200
    tag: shell                weight: 0.007161
    tag: nginx                weight: 0.007028
    tag: jdbc                 weight: 0.006908
    tag: unix                 weight: 0.006865
    tag: json                 weight: 0.006723
    tag: webservice           weight: 0.006723
    tag: tcp                  weight: 0.006310
    tag: websphere            weight: 0.006182
    tag: io                   weight: 0.005851

    android top 50

    记录:33434

    tag: android              weight: 0.477328
    tag: java                 weight: 0.092136
    tag: app                  weight: 0.057003
    tag: ui                   weight: 0.047871
    tag: sdk                  weight: 0.039509
    tag: http                 weight: 0.037914
    tag: tcp                  weight: 0.025357
    tag: socket               weight: 0.024767
    tag: ip                   weight: 0.020937
    tag: c++                  weight: 0.020032
    tag: ios                  weight: 0.019612
    tag: xml                  weight: 0.015327
    tag: api                  weight: 0.014370
    tag: json                 weight: 0.013632
    tag: framework            weight: 0.012522
    tag: linux                weight: 0.012276
    tag: eclipse              weight: 0.009863
    tag: ndk                  weight: 0.009170
    tag: sqlite               weight: 0.007842
    tag: html5                weight: 0.007360
    tag: web                  weight: 0.007267
    tag: jni                  weight: 0.005627
    tag: andriod              weight: 0.005464
    tag: bug                  weight: 0.005176
    tag: os                   weight: 0.004833
    tag: svn                  weight: 0.004469
    tag: git                  weight: 0.004406
    tag: gui                  weight: 0.003779
    tag: github               weight: 0.003699
    tag: javascript           weight: 0.003682
    tag: https                weight: 0.003599
    tag: sql                  weight: 0.003401
    tag: html                 weight: 0.003359
    tag: com                  weight: 0.003169
    tag: udp                  weight: 0.003079
    tag: service              weight: 0.003075
    tag: mysql                weight: 0.002957
    tag: wifi                 weight: 0.002829
    tag: j2me                 weight: 0.002683
    tag: studio               weight: 0.002631
    tag: www                  weight: 0.002548
    tag: mvc                  weight: 0.002517
    tag: google               weight: 0.002309
    tag: js                   weight: 0.002305
    tag: lbs                  weight: 0.002257
    tag: im                   weight: 0.002233
    tag: objective            weight: 0.002177
    tag: server               weight: 0.002125
    tag: activity             weight: 0.002118
    tag: iphone               weight: 0.002115

    ios top 50

    记录:27632

    tag: ios                  weight: 0.366072
    tag: app                  weight: 0.084167
    tag: objective            weight: 0.071731
    tag: iphone               weight: 0.069397
    tag: sdk                  weight: 0.051040
    tag: xcode                weight: 0.047470
    tag: c++                  weight: 0.045456
    tag: ui                   weight: 0.042223
    tag: http                 weight: 0.039140
    tag: ipad                 weight: 0.032945
    tag: android              weight: 0.025376
    tag: tcp                  weight: 0.021865
    tag: socket               weight: 0.021082
    tag: json                 weight: 0.020783
    tag: xml                  weight: 0.020325
    tag: store                weight: 0.019605
    tag: mac                  weight: 0.018228
    tag: cocoa                weight: 0.016381
    tag: ip                   weight: 0.015349
    tag: object               weight: 0.014816
    tag: os                   weight: 0.012732
    tag: appstore             weight: 0.011205
    tag: java                 weight: 0.010568
    tag: swift                weight: 0.009782
    tag: web                  weight: 0.008317
    tag: api                  weight: 0.007768
    tag: touch                weight: 0.007061
    tag: interface            weight: 0.006853
    tag: builder              weight: 0.006794
    tag: html5                weight: 0.006774
    tag: sqlite               weight: 0.006387
    tag: gui                  weight: 0.006187
    tag: mvc                  weight: 0.005925
    tag: uikit                weight: 0.005908
    tag: bug                  weight: 0.005272
    tag: github               weight: 0.005055
    tag: udp                  weight: 0.004772
    tag: instruments          weight: 0.004752
    tag: core                 weight: 0.004327
    tag: ue                   weight: 0.004152
    tag: git                  weight: 0.004057
    tag: framework            weight: 0.003807
    tag: macos                weight: 0.003582
    tag: service              weight: 0.003483
    tag: runtime              weight: 0.003233
    tag: javascript           weight: 0.003037
    tag: com                  weight: 0.003025
    tag: im                   weight: 0.002896
    tag: apple                weight: 0.002863
    tag: oop                  weight: 0.002642
    展开全文
  • 1.根据权重获取关键字 复制代码 代码如下: function getkey($contents){ $rows = strip_tags($contents); $arr = array(' ',' ',"\s", "\r\n", "\n", "\r", "\t", ">", "“", "”"); $qc_rows = str_replace($...
  • 根据权重获取关键字 去掉文章中的超链接简单,简洁
  • 能马上根据关键字查出您在百度的权重的工具 
  • 能马上根据关键字查出您在百度的权重的工具
  • 现在可以使用WordPress更方便地搭建博客网站,但是如果网站具有一定的权重后,一些恶意人员将过来创建恶意内容,例如刻意搜索邪恶关键字,垃圾邮件评论等。 而被搜索引擎抓取到这些关键词的话很有可以导致降权或者...

    现在可以使用WordPress更方便地搭建博客网站,但是如果网站具有一定的权重后,一些恶意人员将过来创建恶意内容,例如刻意搜索邪恶关键字,垃圾邮件评论等。

    而被搜索引擎抓取到这些关键词的话很有可以导致降权或者其他影响,所以,今天这篇文章就来说说如何规避这种问题出现

    一、方法一

    1,使用代码屏蔽,不使用插件的解决方法

    在当前主题目录下/wp-content/themes/主题名/functions.php文件添加下列代码 

    点击下载 functions.php 文件(访问密码:1112)

    2,进入Wordpress网站后台设置–>阅读–>找到搜索关键词屏蔽–>添加您想屏蔽的搜索关键词,比如(恶意关键词1,恶意关键词2…),一行一个关键词

    在后台(设置→阅读)中添加要屏蔽的关键词

    保存之后,自己可以测试搜索下。

    3、添加完毕后,直接在前台输入已经屏蔽的关键词就会提示‘请不要搜索非法关键字’。

    二、方法二

    设置robots.txt

    如果你不希望搜索引擎抓取你的搜索结果,或者被人恶意刷搜索的结果,你可以新建一个robots.txt,然后再最下面加一行禁止蜘蛛抓取搜索结果的代码。

    Disallow: /?s=*

    这里有一份完整的,可以根据需要求改。

    点击获取资源 https://474b.com/f/24162793-483365738-76f6ca
    (访问密码:1112)

    展开全文
  • 我们搜索关键字“排序方式”,找到如下代码段,一般在727行左右。然后加入下图绿框里面的代码。即: else if($orderby == "weight") { $ordersql = " order by arc.weight $orderWay"; ...

    因为dede:list标签并为加入按weight排序的方法。我们在include下面找到arc.listview.class.php打开

    我们搜索关键字“排序方式”,找到如下代码段,一般在727行左右。然后加入下图绿框里面的代码。即:

    else if($orderby == "weight") {

    $ordersql = " order by arc.weight $orderWay";

    }

    接着我们往下拉找到下面代码段,加了刚才的代码之后大概在779行左右。在lastpost后面加上weight,如下面所示。

    //如果不用默认的sortrank或id排序,使用联合查询(数据量大时非常缓慢)

    if(preg_match('/hot|click|lastpost|weight/', $orderby))

    调用方式:

    {dede:list isweight="Y" orderby="weight" orderway="asc" pagesize="8" addfields="position" channelid="1"}

    dede:arclist标签也是一样的,注意要加上isweight=”Y”;

    展开全文
  • 1.定位,网站名称,关键字,描述,分类目录,内容 【这里推荐用脑图软件,可以用百度脑图】 2.想好域名 二、选择购买域名和服务器 1.选择域名。 中国常用民用域名权重排序: Google版: com>org>net>biz&...

    零基础搭建一个基于PHP+MYSQL网站教程,个人建站全过程

    一、网站计划编写
    1.定位,网站名称,关键字,描述,分类目录,内容 【这里推荐用脑图软件,可以用百度脑图】
    2.想好域名

         二、选择购买域名和服务器
    1.选择域名。
    中国常用民用域名权重排序:
    Google版:
    com>org>net>biz>com.cn>cn>info
    百度版:
    org>com>biz>net>info>com.cn>cn

    网站都是由对应的站点域名来访问的,如何我们想要做一个网站,那么就得注册一个独一无二的域名,域名的注册可以去“腾讯云”、“新网”、“阿里云”、等域名注册商的官方网站去注册,域名注册须知:可以包含英文字母(a-z,不区分大小写)、数字(0-9)。
    做国外联盟、或者做国外网站,特别是对EMU的小伙伴,建议在namesilo上购买,支持支付宝:
    第一、域名购买费用相对便宜,第一年什么价,续费也是什么价;

    第二、域名解析速度相对快一些;

    第三、有域名注册信息隐藏功能,防止别人查你的域名所有人信息。

    域名注册成功后,就可以通过域名管理后台进行DNS、设置解析记录等操作了。

    2.选择服务器

    网站它是存放在服务器/域名空间里面的,就像是一个水杯,网站的HTML页面文件相当于是水,好比如一个容器里面放入了东西,服务器/主机空间也可以在“阿里云”“腾讯云”等服务器商处进行购买。
    选主机类型,一定要根据自己建站目的来选。
    一、建站目的要求你必须备案,如SSP、淘宝客、国内联盟、企业网站等,建议你去买国内空间;比如阿里云,腾讯云; 这里新手 推荐 腾讯云1核2G云服务器,首年99元 

     

    二、对备案要求不明确,可以按你的具体项目来选择,比

    如作EMU,可以选择美国主机;而只是个人爱好建个人博客,那就选择香港主机。

    三、VPS主机,云主机、服务器之类的主机,对于新手没必要考虑,除非你的站流量非常大,或者你就是冲着流量大去建站的目的,可以考虑。但前期可以选择低成本的虚拟主机,等流量做大了再考虑VPS主机、云主机等高成本的主机类型。
    共享IP和独立IP问题建议有可能选择独立IP,

    三、网站安装。
    网站域名的解析
    1.域名解析:通过域名后台管理,找到域名解析,然后找到解析记录的对应编辑栏。

    2.开始解析:域名解析的常见主机记录分别为“@(顶级域名)”、“*(泛解析)”、“www(国际标准)”、只需要将服务器IP对应输入在记录值里面,然后进行解析“@(顶级域名)”与“www(国际标准)”即可,“*(泛解析)”我们并不经常使用到,所有的解析记录类型为“A(将域名指向一个IPV4地址)”。
    1.“FTP连接地址”、“数据库地址”、“服务器的IP地址”等信息。
    通过VPS或者虚拟主机的安装,获得网站的FTP帐号和密码,以及MYSQL等数据库的用户名和密码。
    如果是VPS的话建议用CENTOS等LIUNUX系统直接安装宝塔面板。这样可以一键安装源码。
    2.网站程序的上传
    通过FTP上传软件,连接我们刚才购买的服务器,将我们网站的HTML页面文件全部上传到该服务器,然后进行安装我们的网站程序,如果是全部是“静态页面”请跳过安装这个步骤。

    linux服务器VPS使用宝塔面板搭建网站完整教程(wordpress)

    四、网站内容完善
    网站标题的设置,各种插件的安装,优化。填充内容,适当的SEO
         五、网站的推广。
    1.外链建设
    2.友情链接
    3.QQ或者微信微博群发推广;
    4.搜索引擎站长工具
        六、联盟,广告的添加
    做站的最终目的就是需要赚钱,带着兴趣之类的估计是走不远的,也无法长期稳定更新。兴趣站做着做着就挂了,要么就停更了。 因为域名服务器本身就需要费用。联盟推荐谷歌,百度等联盟。

     

    这个就是整个是零基础搭建网站的全过程。

     

    展开全文
  • 6.sp值网站权重排名,此排名类似于google的PR值,只是算法不同! 7.违法关键字过滤功能 8.网站无限级分类 9.违法作弊网站一键删除 10.网站登录入口,可在后台设置自动收录,或者人工审核收录! 11.搜索关键字批量删除...
  • 6.sp值网站权重排名,此排名类似于google的PR值,只是算法不同! 7.违法关键字过滤功能 8.网站无限级分类 9.违法作弊网站一键删除 10.网站登录入口,可在后台设置自动收录,或者人工审核收录! 11.搜索关键字批量删除功能 ...
  • 6.sp值网站权重排名,此排名类似于google的PR值,只是算法不同! 7.违法关键字过滤功能 8.网站无限级分类 9.违法作弊网站一键删除 10.网站登录入口,可在后台设置自动收录,或者人工审核收录! 11.搜索关键字批量删除功能 ...
  • 首先一个网站如果存在大量的死链接,必将大大损伤网站的整体形象,再者搜索引擎蜘蛛是通过链接来爬行搜索,如果太多链接无法到达,不但收录页面数量会减少,而且你的网站在搜索引擎中的权重会大大降低。该查询可以...
  • 中文是写的程序关键字翻译的。 去除了GPU调用,所以是纯CPU的,没有增加多线程支持。 优化权重存储结构 优化张量操作 优化模型操作 优化层操作 优化反向传播 优化权重保存与读取 原版 LSTM没有写完,所以我也无法...
  • 百度知道开放平台OPEN API PHP SDK V0.1 (数据合作) 提供接口: getQuestionList 基于百度知道分类ID获取对应分类下的问题列表 getQuestionSearch 基于检索关键字在百度知道中搜索匹配的问题列表 getQuestionInfo ...
  • 百度知道开放**台OPEN API PHP SDK V0.1 (数据合作) 提供接口: getQuestionList 基于百度知道分类ID获取对应分类下的问题列表 ...虽然百度不给百度知道外链赋予权重,但其他搜索引擎给百度知道的外链赋予权重
  • 亮剑SEO 6.3.1

    2015-08-21 23:45:57
    亮剑SEO集众多功能一身,助您秒收、被K也能恢复、提高排名、提升网站权重、加强用户体验让您无往而不利 1.支持超级伪原创功能,解决传统伪原创功能影响用户体验的问题 2.支持网站地图功能,能自动更新百度地图,希望...
  • 首先一个网站如果存在大量的死链接,必将大大损伤网站的整体形象,再者搜索引擎蜘蛛是通过链接来爬行搜索,如果太多链接无法到达,不但收录页面数量会减少,而且你的网站在搜索引擎中的权重会大大降低。该查询可以...
  • 标签:根据帖子内容智能抽取关键字进行标签自动补全,一篇帖子关联多个标签。标签和标签之间以带边权重的图结构进行描述,方便进行相关计算 领域:一个领域下包含了多个标签,通过标签将帖子自动聚合到具体领域,...

空空如也

空空如也

1 2
收藏数 21
精华内容 8
关键字:

php关键字权重