精华内容
下载资源
问答
  • 互联网招聘流程及技巧分享 通常互联网公司的校招流程是:一轮笔试+若干轮技术面试+HR面试,如果是比较优秀的学生,在HR面之后还会有技术加面(一轮或者多轮加面),加面如果通过的话一般会发sp或者ssp的offer,比较...

    互联网招聘流程及技巧分享

    通常互联网公司的校招流程是:一轮笔试+若干轮技术面试+HR面试,如果是比较优秀的学生,在HR面之后还会有技术加面(一轮或者多轮加面),加面如果通过的话一般会发sp或者ssp的offer,比较出名的比如阿里的阿里星,腾讯的腾讯大咖等都会有至少5轮以上的技术面试,所以难度还是比较大的。

    每一轮技术面试的考察侧重点不太一样,比如第一轮考察基础知识,第二轮考察思维发散能力等等。但每一轮的大致流程几乎都是差不多的,所以也会有一些面试技巧可以去学习,只有掌握了一些基本的面试技巧,面试时才能表现得游刃有余。

    下面我就从头开始聊一聊互联网的招聘流程吧。


    一、笔试

    笔试的类型一般分为两种:一种是纯代码题,一种是相关岗位方向的基础知识(选择+简答题)+代码题。

    首先说下代码题,也就是纯算法题,通常为4道题左右,语言任选,C/C++/Java/Python都可以。如果代码题能100%AC,那固然是最好。如果AC不了,比如只AC了30%-60%左右,那么我建议最多考虑5分钟,AC不了就可以去做下一道题了,因为笔试时间很紧张,后面的题目也许还要花大量时间思考。如果AC了80%左右,那一般是边界条件没有考虑对,可以仔细读一遍题目,再检查一下数组越界等问题。

    然后是基础知识考察,这部分主要是平时的积累,一般来说考试的之前,最好是能再去看一下你投递公司的岗位的职能要求,这里面一般会写需要的技术栈和业务能力,可以根据招聘需要的技术栈去针对性的复习准备,这样的效果比盲目的复习好很多。

    二、技术面

    虽然每一轮的技术面侧重点不一样,但是面试流程都是大同小异的,所以这里就一起说了。

    1、自我介绍

    技术面的开始一般是一个简单的自我介绍,时间一般是1-2分钟。自我介绍除了最基本的学校、学历、成绩以及奖项之外,需要突出的就是你自己的技术栈和当前岗位的匹配程度,所以在自我介绍的时候,最好说的技术栈能和招聘的技术栈相匹配。

    2、项目/实习经历

    自我介绍完了以后,一般面试官会开始问你简历上的项目,面试官会根据你所描述的项目内容有针对性的对你进行提问。所以你所介绍的项目一定要保证是你最擅长也是最熟悉的项目,并且要确保你对简历上所提到的技术栈都能很熟悉,在面试官提问的时候能准确的说出来每个知识点的答案。

    3、基础知识

    问完了项目经历就来到了第三关,也就是基础知识考察。这里以算法岗为例,一般算法岗面试官会问一些机器学习,深度学习的知识,还有具体深入到某一个具体领域,比如NLP,CV,推荐系统等。对于这一关的准备,可以多注意收集一些高频的面试问题,可以刷刷以前师兄师姐的面经。后期我也会专门出几期面经分享的文章,绝对干货,有需要的小伙伴可以期待一下。

    4、手撕代码

    这一关应该是面试中最难的一关了,这里分远程面试和现场面试。远程面试的话一般会在牛客网,面试官现场出算法题,你现场写代码解决,屏幕共享,你写代码的整个过程面试官都能看见。

    现场面试一般会给你一张纸和一支笔,现场出题之后需要你在纸上写出来,也就是我们常听说的白板编程。对于这一关的准备,我在前几篇文章都分享过正确的准备方法,没看过的小伙伴可以去看下以前的文章。

    这里值得说一下的,对于现场面试的白板编程,这和我们平时编程很不一样。平时我们都是用IDE编程,比如Pycharm,IntelliJ IDEA等,这些软件有很多智能提示,一些小错误也会帮我们自动修改过来。但白板编程的时候,这些好用的功能都没有了,所以在准备白板编程的时候,可以提前一段时间断奶IDE,多尝试白板编程,找找手感

    5、反问环节

    代码题写完之后,这场面试就接近了尾声,一般面试官会问你有什么想问他的吗。这时你一般不能直接问面试官你这场面试的结果,也不能问薪资等保密的信息。

    这里我觉得比较好的反问有如下两个:

    一是问面试官目前部门的技术栈和业务方向等问题,这代表你关心部门业务,是真的想去这个公司,面试官也许就会更多的考虑你。

    二是可以问一下面试官对目前的这个岗位的技术发展前景的看法。这可以让面试官分享一些他的经验,你也可以通过面试官的描述了解到更前沿的技术。

    三、HR面

    很多小伙伴以为到了HR面就稳了,但很多公司HR是有一票否决权的,我经常在牛客网上看到有些同学HR面被刷掉的,甚是可惜。

    我个人认为HR面不用过于紧张,只要面试的时候表现出足够自信,诚恳以及有强烈的意愿想去该公司的话,90%的几率都是通过的。注意HR面千万不要传达一些消极的思想,比如抱怨、吐槽之类的话就千万别说了。

    四、结语

    ​面试中细节和坑的地方还是不少的,要把笔试,技术面,HR面全部拿下,还是很不容易的,在任何一个环节上出了问题,都意味着你在这家公司的招聘流程结束。

    对于我们来说,能够做到的就是好好准备相关知识,放平心态,不打没把握的仗,只要准备好了,再难的面试也是可以通过的。面试的时候尽量表现好一些,同一个岗位,尽量争取到sp或者ssp,虽然都是打工人,但每月多拿几K,也算是对你努力准备的回报吧。

    关于面试的坑点和面试技巧还有很多值得讨论的地方,每一部分都可以单独拿出来聊一聊。后期我会针对每一个环节,再具体讲讲有哪些坑的地方,喜欢的小伙伴可以持续关注文章更新。

    最后,你的点赞,转发是小哇创作最大的动力,我们下期再见

    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 该楼层疑似违规已被系统折叠隐藏此楼查看此楼盘点:2014年互联网名企招聘人数排名前十学校2014-08-06 11:14谷歌1、清华大学2、北京邮电大学3、北京大学4、上海交通大学5、中科院大学6、浙江大学7、北京航空航天大学8...

    该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

    盘点:2014年互联网名企招聘人数排名前十学校

    2014-08-06 11:14

    谷歌

    1、清华大学

    2、北京邮电大学

    3、北京大学

    4、上海交通大学

    5、中科院大学

    6、浙江大学

    7、北京航空航天大学

    8、同济大学

    9、复旦大学

    10、南京大学

    微软

    1、北京邮电大学

    2、北京大学

    3、中科院大学

    4、清华大学

    5、上海交通大学

    6、浙江大学

    7、北京航空航天大学

    8、华南理工大学

    9、东南大学

    10、同济大学

    百度

    1、北京邮电大学

    2、北京大学

    3、北京航空航天大学

    4、中科院大学

    5、华中科技大学

    6、浙江大学

    7、清华大学

    8、上海交通大学

    9、北京工业大学

    10、东北大学

    阿里巴巴

    1、北京邮电大学

    2、浙江大学

    3、清华大学

    4、杭州电子科技大学

    5、上海交通大学

    6、东南大学

    7、南京大学

    8、中国科学技术大学

    9、华中科技大学

    10、北京航空航天大学

    腾讯

    1、华中科技大学

    2、中山大学

    3、华南理工大学

    4、北京邮电大学

    5、西安电子科技大学

    6、北京大学

    7、清华大学

    8、浙江大学

    9、北京航空航天大学

    10、电子科技大学

    搜狗

    1、北京邮电大学

    2、清华大学

    3、中科院大学

    4、北京大学

    5、浙江大学

    6、北京航空航天大学

    7、华中科技大学

    8、西安电子科技大学

    9、东北大学

    10、大连理工大学

    网易

    1、华南理工大学

    2、浙江大学

    3、中山大学

    4、清华大学

    5、北京邮电大学

    6、电子科技大学

    7、北京航空航天大学

    8、华中科技大学

    9、北京大学

    10、西安电子科技大学

    360

    1、北京邮电大学

    2、北京大学

    3、清华大学

    4、西安电子科技大学

    5、西安交通大学

    6、浙江大学

    7、中科院大学

    8、华中科技大学

    9、北京航空航天大学

    10、北京工业大学

    yahoo

    1、北京邮电大学

    2、清华大学

    3、浙江大学

    4、中科院大学

    5、北京航空航天大学

    6、北京大学

    7、上海交通大学

    8、华中科技大学

    9、南京大学

    10、西安交通大学

    雅虎中除了前五的人数比较多外,其他学校都小于5,有点随机。

    亚马逊

    1、北京邮电大学

    2、清华大学

    3、北京大学

    4、北京航空航天大学

    5、浙江大学

    6、华中科技大学

    7、上海交通大学

    8、东北大学

    9、哈尔滨工业大学

    10、大连理工大学

    美团

    1、西安电子科技大学

    2、北京邮电大学

    3、华中科技大学

    4、电子科技大学

    5、清华大学

    6、北京大学

    7、北京航空航天大学

    8、大连理工大学

    9、东北大学

    10、哈尔滨工业大学

    UC

    1、华南理工大学

    2、中山大学

    3、华中科技大学

    4、广东工业大学

    5、武汉大学

    6、电子科技大学

    7、四川大学

    8、西安电子科技大学

    9、暨南大学

    10、武汉理工大学

    大众点评

    1、上海交通大学

    2、复旦大学

    3、同济大学

    4、浙江大学

    5、北京邮电大学

    6、清华大学

    7、东南大学

    8、华中科技大学

    9、中国科学技术大学

    10、杭州电子科技大学

    下面所列企业招人少,但给钱很多,是清北学生最爱去的地方

    hulu

    1、清华大学

    2、北京大学

    3、中国科学院大学

    4、北京邮电大学

    5、浙江大学

    豌豆荚

    1、北京邮电大学

    2、西安电子科技大学

    3、清华大学

    4、中国科学院大学

    5、北京大学

    豌豆荚为什么招那么多西电的人?暂时也没搞清楚

    豆瓣

    1、清华大学

    2、北京邮电大学

    3、北京大学

    4、华中科技大学

    5、北京师范大学

    豆瓣招人特别少,大家凑合着看吧

    融360

    1、北京邮电大学

    2、北京大学

    3、清华大学

    4、北京航空航天大学

    5、中国科学院大学

    融360这种土豪企业基本上不出北京校招(来源:IT实习机会;编选:中国电子商务研究中心)

    版权声明

    (1)凡本中心注明“来源:中国电子商务研究中心”或带有中国电子商务研究中心水印LOGO的所有文字、图片、音频、视频及其他任何形式的作品 ,其版权均属中国电子商务研究中心所有,任何媒体、网站或个人未经本中心协议授权不得转载、链接、转贴或以其他方式复制发布/发表。已与本中心协议授权的媒体、网站,在下载使用时必须注明“稿件来源:中国电子商务研究中心”,违者本中心将依法追究责任。

    (2)转载或引用本中心内容必须是以新闻性或资料性公共免费信息为使用目的的合理、善意引用,不得对本中心内容原意进行曲解、修改,同时必须保留本中心注明的“稿件来源”,并自负版权等法律责任。

    (3)对于不当转载或引用本中心内容而引起的民事纷争、行政处理或其他损失,本中心不承担责任。

    展开全文
  • 互联网招聘数据分析处理与可视化

    千次阅读 2021-01-02 16:38:15
    移动互联网 悦谦科技 50-150人 “双休 扁平化管理 发展平台好 团队氛围好” 移动互联网 互联网金融 Python NaN python 广州 4 5 5 python开发工程师 113.264434 23.129162 1-3年 大专 10-15K 广州 全职 ......

    数据分析与处理

    数据预处理

    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns
    
    plt.rcParams['font.sans-serif']=['Simhei']#用来显示汉字
    plt.rcParams['axes.unicode_minus']=False #用来显示负号
    
    df=pd.read_excel('D:\\大学\\2020数据处理综合实训\\数据处理综合实训\jobs.xls')
    

    数据分析

    PYTHON

    df1=df[df['job']=='python']
    df1
    
    idpositionIDpositionNamelongitudelatitudeworkYeareducationsalarycityjobNature...industryFieldcompanyShortNamecompanySizecompanyLabelListpositionAdvantagelabel_2label_3label_4jobdistrict
    011python113.26443423.1291621-3年本科10-15K广州全职...消费生活省省回头车150-500人“五险一金 年底双薪”GolangGONaNNaNpython广州
    122python113.26443423.1291623-5年本科15-25K广州全职...消费生活省省回头车150-500人“五险一金 年底双薪”GolangGONaNNaNpython广州
    233Python开发工程师113.26443423.1291621-3年本科15-25K广州全职...移动互联网悦谦科技50-150人“双休,发展空间大,团队氛围好,扁平化管理”金融Python数据挖掘图像算法python广州
    344Python开发工程师113.26443423.1291623-5年本科15-25K广州全职...移动互联网悦谦科技50-150人“双休 扁平化管理 发展平台好 团队氛围好”移动互联网互联网金融PythonNaNpython广州
    455python开发工程师113.26443423.1291621-3年大专10-15K广州全职...移动互联网广州游爱500-2000人“双休,五险一金,包三餐,年底双薪”后端PythonNaNNaNpython广州
    ..................................................................
    382103821138211高级Python开发工程师121.47370131.2304163-5年本科25K以上上海全职...企业服务CloudChef50-150人“带薪年假,五险一金,团建旅游,补充公积金”PythonLinux/UnixMySQL云计算python上海
    382113821238212中级Python开发工程师121.47370131.2304163-5年本科15-25K上海全职...移动互联网NextTao 互道信息50-150人“技术氛围浓郁 团队氛围轻松 发展空间大”新零售企业服务后端分布式python上海
    382123821338213Python高级开发工程师121.47370131.2304163-5年本科25K以上上海全职...移动互联网NextTao 互道信息50-150人“互联网零售革命的推动者”新零售PythonNaNNaNpython上海
    382133821438214Python开发工程师120.15507030.2740843-5年本科15-25K杭州全职...移动互联网智云健康500-2000人“前景行业,待遇丰厚”python爬虫NaNNaNNaNpython杭州
    382143821538215Python开发工程师(兼职)113.26443423.129162应届本科5K以下广州兼职...移动互联网微宽信息15-50人“兼职”python爬虫NaNNaNNaNpython广州

    38215 rows × 23 columns

    df1.loc[df1['workYear']==' 不限','workYear']='不限'
    df1.loc[df1['workYear']=='不限 ','workYear']='不限'
    df1.loc[df1['workYear']==' 应届','workYear']='应届'
    
    c:\users\13530\appdata\local\programs\python\python37\lib\site-packages\pandas\core\indexing.py:1765: SettingWithCopyWarning: 
    A value is trying to be set on a copy of a slice from a DataFrame.
    Try using .loc[row_indexer,col_indexer] = value instead
    
    See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
      isetter(loc, value)
    

    Python岗位按照城市数量统计

    citys=df1['city'].value_counts()
    citys
    
    北京    7341
    上海    6391
    深圳    5519
    成都    4895
    广州    3889
          ... 
    盐城       1
    贵港       1
    钦州       1
    南通       1
    日照       1
    Name: city, Length: 70, dtype: int64
    
    plt.figure(figsize=(15,10))
    citys=citys[citys.values>300]
    citys_num=len(citys)
    plt.barh(range(citys_num),citys.values,alpha=0.8)
    plt.yticks(range(citys_num),list(citys.index))
    plt.title('Python岗位按照城市数量统计')
    for x,y in enumerate(citys):
        plt.text(y + 0.2, x - 0.1, '%s' % y)
    plt.show()
    

    Python岗位按照薪水范围数量统计

    Fare=df1['salary'].value_counts()
    Fare
    
    15-25K    14652
    10-15K    11322
    25K以上      6929
    5-10K      4070
    5K以下       1242
    Name: salary, dtype: int64
    
    plt.figure(figsize=(15,10))
    Fare_num=len(Fare)
    plt.barh(range(Fare_num),Fare.values,alpha=0.8)
    plt.yticks(range(Fare_num),list(Fare.index))
    plt.title('Python岗位按照薪水范围数量统计')
    for x,y in enumerate(Fare):
        plt.text(y + 0.2, x - 0.1, '%s' % y)
    plt.show()
    

    Python岗位按照行业领域数量统计

    industryField=df1['industryField'].value_counts()
    industryField
    
    移动互联网        15145
    企业服务          3624
    数据服务          2655
    金融            2449
    电商            2124
    信息安全          1950
    文娱            1522
    消费生活          1161
    人工智能          1087
    社交             958
    游戏             900
    教育             650
    医疗             578
    其他             544
    硬件             544
    通讯电子           497
    软件开发           388
    旅游             209
    电子商务           165
    物流             164
    体育             154
    工具             126
    汽车             113
    大数据             87
    广告营销            81
    房产家居            72
    不限              62
    区块链             56
    电商、广告营销         53
    物联网             40
    企业服务、软件开发       13
    金融、企业服务         11
    数据服务、软件开发       10
    物联网、软件开发         4
    电商、社交            2
    金融、软件开发          2
    信息安全、数据服务        2
    物联网、教育           2
    软件开发、人工智能        1
    硬件、通讯电子          1
    企业服务、数据服务        1
    人工智能、其他          1
    社交、软件开发          1
    消费生活、电商          1
    电商、企业服务          1
    数据服务、教育          1
    信息安全、人工智能        1
    金融、电商            1
    软件开发、其他          1
    Name: industryField, dtype: int64
    
    plt.figure(figsize=(15,10))
    industryField=industryField[industryField.values>1000]
    industryField_num=len(industryField)
    plt.barh(range(industryField_num),industryField.values,alpha=0.8)
    plt.yticks(range(industryField_num),list(industryField.index))
    plt.title('Python岗位按照行业领域数量统计')
    for x,y in enumerate(industryField):
        plt.text(y + 20, x - 0.1, '%s' % y)
    plt.show()
    

    Python岗位按照公司规模数量统计

    companySize=df1['companySize'].value_counts()
    companySize
    
     150-500人      9835
     50-150人       8433
     2000人以上       8064
     500-2000人     5926
     15-50人        4925
     少于15人         1017
     少于50人            9
     2000-5000人       3
    5679              2
     1000-9999人       1
    Name: companySize, dtype: int64
    
    plt.figure(figsize=(15,10))
    #companySize=companySize[companySize.values>1000]
    companySize_num=len(companySize)
    plt.barh(range(companySize_num),companySize.values,alpha=0.8)
    plt.yticks(range(companySize_num),list(companySize.index))
    plt.title('Python岗位按照公司规模数量统计')
    for x,y in enumerate(companySize):
        plt.text(y + 20, x - 0.1, '%s' % y)
    plt.show()
    

    Python岗位按照公司规模数量统计

    Python岗位按照学历数量统计

    education=df1['education'].value_counts()
    education
    
    本科    31142
    大专     3706
    不限     2327
    硕士     1009
    博士       31
    Name: education, dtype: int64
    
    plt.figure(figsize=(15,10))
    education_num=len(education)
    plt.barh(range(education_num),education.values,alpha=0.8)
    plt.yticks(range(education_num),list(education.index))
    plt.title('Python岗位按照学历数量统计')
    for x,y in enumerate(education):
        plt.text(y + 20, x - 0.1, '%s' % y)
    plt.show()
    

    在这里插入图片描述

    Python岗位按照工作年限数量统计

    workYear=df1['workYear'].value_counts()
    workYear
    
    3-5年     18069
    1-3年     10624
    5-10年     3632
    不限        3618
    应届        2104
    1年以下       105
    10年以上       63
    Name: workYear, dtype: int64
    
    plt.figure(figsize=(15,10))
    workYear_num=len(workYear)
    plt.barh(range(workYear_num),workYear.values,alpha=0.8)
    plt.yticks(range(workYear_num),list(workYear.index))
    plt.title('Python岗位按照工作年限数量统计')
    for x,y in enumerate(workYear):
        plt.text(y + 20, x - 0.1, '%s' % y)
    plt.show()
    

    在这里插入图片描述

    Python岗位按照岗位标签数量统计

    plt.figure(figsize=(15,10))
    label_1=df1['positionAdvantage'].value_counts()
    label_2=df1['label_2'].value_counts()
    label_3=df1['label_3'].value_counts()
    label_4=df1['label_4'].value_counts()
    label=label_1+label_2+label_3+label_4
    label=label[label.values>500]
    label=label.sort_values()
    label_num=len(label)
    plt.barh(range(label_num),label.values,alpha=0.8)
    plt.yticks(range(label_num),list(label.index))
    plt.title('Python岗位按照工作年限数量统计')
    for x,y in enumerate(label):
        plt.text(y + 0.2, x - 0.1, '%s' % y)
    plt.show()
    

    在这里插入图片描述

    Python工作年限与工资薪水之间的相关关系

    a=df1[['workYear','salary']]
    a.apply(lambda x: x.factorize()[0]).corr()
    
    workYearsalary
    workYear1.0000000.299888
    salary0.2998881.000000
    sns.heatmap(pd.crosstab(a.workYear,a.salary),cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='workYear'>
    

    在这里插入图片描述

    Python学历要求与工资薪水之间的相关关系

    b=df1[['education','salary']]
    b.apply(lambda x: x.factorize()[0]).corr()
    
    educationsalary
    education1.0000000.022579
    salary0.0225791.000000
    sns.heatmap(pd.crosstab(b.education,b.salary),cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='education'>
    

    在这里插入图片描述

    Python公司规模与工资薪水之间的相关关系

    c=df1[['companySize','salary']]
    c.apply(lambda x: x.factorize()[0]).corr()
    
    companySizesalary
    companySize1.0000000.137736
    salary0.1377361.000000
    sns.heatmap(pd.crosstab(c.companySize,c.salary),cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='companySize'>
    

    在这里插入图片描述

    Python行业领域与工资薪水之间的相关关系

    e=df1[['industryField','salary']]
    e.apply(lambda x: x.factorize()[0]).corr()
    
    industryFieldsalary
    industryField1.0000000.060122
    salary0.0601221.000000
    f,ax=plt.subplots(figsize=(10,15))
    sns.heatmap(pd.crosstab(e.industryField,e.salary),ax=ax,linewidths=0.01,linecolor='pink',cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='industryField'>
    

    在这里插入图片描述

    Python城市与工资薪水之间的相关关系

    d=df1[['city','salary']]
    d.apply(lambda x: x.factorize()[0]).corr()
    
    citysalary
    city1.000000-0.028087
    salary-0.0280871.000000
    f,ax=plt.subplots(figsize=(10,15))
    sns.heatmap(pd.crosstab(d.city,d.salary),ax=ax,linewidths=0.01,linecolor='pink',cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='city'>
    

    在这里插入图片描述

    公司融资轮数与工资薪水之间的相关关系

    f=df1[['financeStage','salary']]
    f.apply(lambda x: x.factorize()[0]).corr()
    
    financeStagesalary
    financeStage1.0000000.125897
    salary0.1258971.000000
    sns.heatmap(pd.crosstab(f.financeStage,f.salary),cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='financeStage'>
    

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zhB1G7ow-1609576483730)(output_43_1.png)]

    Python公司规模与工作城市之间的相关关系

    g=df1[['companySize','city']]
    g.apply(lambda x: x.factorize()[0]).corr()
    
    companySizecity
    companySize1.0000000.068158
    city0.0681581.000000
    f,ax=plt.subplots(figsize=(10,15))
    sns.heatmap(pd.crosstab(g.city,g.companySize),linewidths=0.01,linecolor='pink',cmap='Blues')
    
    <AxesSubplot:xlabel='companySize', ylabel='city'>
    

    在这里插入图片描述

    Python行业领域与工作城市之间的相关关系

    h=df1[['industryField','city']]
    h.apply(lambda x: x.factorize()[0]).corr()
    
    industryFieldcity
    industryField1.00000.0566
    city0.05661.0000
    f,ax=plt.subplots(figsize=(10,15))
    sns.heatmap(pd.crosstab(h.city,h.industryField),linewidths=0.01,linecolor='pink',cmap='Blues')
    
    <AxesSubplot:xlabel='industryField', ylabel='city'>
    

    在这里插入图片描述

    Python城市活力榜单

    import numpy as np
    
    # 替换薪水
    df1.replace('5K以下', 1, inplace=True)
    df1.replace('5-10K', 2, inplace=True)
    df1.replace('10-15K', 3, inplace=True)
    df1.replace('15-25K', 4, inplace=True)
    df1.replace('25K以上', 5, inplace=True)
    # 替换公司规模
    df1.replace('少于50人', 1, inplace=True)
    df1.replace(' 50-150人', 2, inplace=True)
    df1.replace(' 150-500人', 3, inplace=True)
    df1.replace(' 500-2000人', 4, inplace=True)
    df1.replace(' 2000人以上', 5, inplace=True)
    # 替换工作年限
    df1.replace('1年以下', 1, inplace=True)
    df1.replace('1-3年', 2, inplace=True)
    df1.replace('3-5年', 3, inplace=True)
    df1.replace('5-10年', 4, inplace=True)
    df1.replace('10年以上', 5, inplace=True)
    
    c:\users\13530\appdata\local\programs\python\python37\lib\site-packages\pandas\core\frame.py:4382: SettingWithCopyWarning: 
    A value is trying to be set on a copy of a slice from a DataFrame
    
    See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
      method=method,
    
    # 北京
    beijing_values = []
    beijing = df1[df1['city'] == '北京']
    beijing_values.append(beijing['salary'].value_counts().index[0])
    beijing_values.append(beijing['companySize'].value_counts().index[0])
    beijing_values.append(beijing['workYear'].value_counts().index[0])
    # 西安
    xian_values = []
    xian = df1[df1['city'] == '西安']
    xian_values.append(xian['salary'].value_counts().index[0])
    xian_values.append(xian['companySize'].value_counts().index[0])
    xian_values.append(xian['workYear'].value_counts().index[0])
    # 郑州
    zhengzhou_values = []
    zhengzhou = df1[df1['city'] == '郑州']
    zhengzhou_values.append(zhengzhou['salary'].value_counts().index[0])
    zhengzhou_values.append(zhengzhou['companySize'].value_counts().index[0])
    zhengzhou_values.append(zhengzhou['workYear'].value_counts().index[0])
    # 青岛
    qingdao_values = []
    qingdao = df1[df1['city'] == '青岛']
    qingdao_values.append(qingdao['salary'].value_counts().index[0])
    qingdao_values.append(qingdao['companySize'].value_counts().index[0])
    qingdao_values.append(qingdao['workYear'].value_counts().index[0])
    
    feature = ['薪水','公司规模','工作年限']
    N = len(feature)
    angles = np.linspace(0,2*np.pi,N,endpoint=False)
    
    #使雷达图封闭起来
    angles = np.concatenate((angles,[angles[0]]))
    beijing = np.concatenate((beijing_values,[beijing_values[0]]))
    xian = np.concatenate((xian_values,[xian_values[0]]))
    zhengzhou = np.concatenate((zhengzhou_values,[zhengzhou_values[0]]))
    qingdao = np.concatenate((qingdao_values,[qingdao_values[0]]))
    #绘图
    fig = plt.figure(figsize=(6, 6))
    #设置为极坐标格式
    ax = fig.add_subplot(111, polar=True)
    #绘制折线图
    ax.plot(angles,beijing,'o-',linewidth=2,label='北京')
    ax.fill(angles,beijing,'r',alpha=0.2)
    
    ax.plot(angles,xian,'o-',linewidth=2,label='西安')
    ax.fill(angles,xian,'b',alpha=0.2)
    
    ax.plot(angles,zhengzhou,'o-',linewidth=2,label='郑州')
    ax.fill(angles,zhengzhou,'y',alpha=0.2)
    
    ax.plot(angles,qingdao,'o-',linewidth=2,label='青岛')
    ax.fill(angles,qingdao,'g',alpha=0.2)
    
    #添加每个特质的标签
    ax.set_thetagrids(angles[:3]*180/np.pi,feature)
    #设置极轴范围
    ax.set_ylim(0, 5)
    #添加标题
    plt.title('Python城市活力榜单')
    plt.legend(loc='right', bbox_to_anchor=(1.5, 0.5))
    #增加网格纸
    ax.grid(True)
    plt.show()
    

    在这里插入图片描述

    Python公司活力榜单

    # Xmov
    Xmov_values = []
    Xmov = df1[df1['companyShortName'] == 'Xmov']
    Xmov_values.append(Xmov['salary'].value_counts().index[0])
    Xmov_values.append(Xmov['companySize'].value_counts().index[0])
    Xmov_values.append(Xmov['workYear'].value_counts().index[0])
    #小红书
    book_values = []
    book = df1[df1['companyShortName'] == '小红书']
    book_values.append(book['salary'].value_counts().index[0])
    book_values.append(book['companySize'].value_counts().index[0])
    book_values.append(book['workYear'].value_counts().index[0])
    # 华为技术有限公司
    huawei_values = []
    huawei = df1[df1['companyShortName'] == '华为技术有限公司']
    huawei_values.append(huawei['salary'].value_counts().index[0])
    huawei_values.append(huawei['companySize'].value_counts().index[0])
    huawei_values.append(huawei['workYear'].value_counts().index[0])
    # 途游
    tuyou_values = []
    tuyou = df1[df1['companyShortName'] == '途游']
    tuyou_values.append(tuyou['salary'].value_counts().index[0])
    tuyou_values.append(tuyou['companySize'].value_counts().index[0])
    tuyou_values.append(tuyou['workYear'].value_counts().index[0])
    
    feature = ['薪水','公司规模',"工作年限"]
    N = len(feature)
    angles = np.linspace(0,2*np.pi,N,endpoint=False)
    
    #使雷达图封闭起来
    angles = np.concatenate((angles,[angles[0]]))
    Xmov = np.concatenate((Xmov_values,[Xmov_values[0]]))
    book = np.concatenate((book_values,[book_values[0]]))
    huawei = np.concatenate((huawei_values,[huawei_values[0]]))
    tuyou = np.concatenate((tuyou_values,[tuyou_values[0]]))
    #绘图
    fig = plt.figure(figsize=(6, 6))
    #设置为极坐标格式
    ax = fig.add_subplot(111, polar=True)
    #绘制折线图
    ax.plot(angles,Xmov,'o-',linewidth=2,label='Xmov')
    ax.fill(angles,Xmov,'r',alpha=0.2)
    
    ax.plot(angles,book,'o-',linewidth=2,label='小红书')
    ax.fill(angles,book,'b',alpha=0.2)
    
    ax.plot(angles,huawei,'o-',linewidth=2,label='华为技术有限公司')
    ax.fill(angles,huawei,'y',alpha=0.2)
    
    ax.plot(angles,tuyou,'o-',linewidth=2,label='途游')
    ax.fill(angles,tuyou,'g',alpha=0.2)
    
    #添加每个特质的标签
    ax.set_thetagrids(angles[:3]*180/np.pi,feature)
    #设置极轴范围
    ax.set_ylim(0,5)
    #添加标题
    plt.title('Python公司活力榜单')
    plt.legend(loc='right', bbox_to_anchor=(1.5, 0.5))
    #增加网格纸
    ax.grid(True)
    plt.show()
    

    在这里插入图片描述

    JAVA

    df1=df[df['job']=='java']
    df1
    
    idpositionIDpositionNamelongitudelatitudeworkYeareducationsalarycityjobNature...industryFieldcompanyShortNamecompanySizecompanyLabelListpositionAdvantagelabel_2label_3label_4jobdistrict
    382153821638216java开发工程师106.55155629.5630091-3年本科10-15K重庆全职...人工智能,物联网缺月智能15-50人“团队氛围好、上升空间大、员工福利有保障”JavaNaNNaNNaNjava重庆
    382163821738217Java开发工程师108.94017434.3415685-10年本科15-25K西安全职...移动互联网,数据服务销售易500-2000人“腾讯领投、D+轮,六险一金,扁平化管理”即时通讯NaNNaNNaNjava西安
    382173821838218java开发工程师121.47370131.2304163-5年本科15-25K上海全职...电商中通快递2000人以上“每年两次晋升机会,平台成熟”物流NaNNaNNaNjava上海
    382183821938219java开发工程师114.30539230.5930983-5年不限10-15K武汉全职...移动互联网朗蕴科技15-50人“做五休二,五险一金”J2EENaNNaNNaNjava武汉
    382193822038220java开发工程师113.26443423.1291625-10年本科10-15K广州全职...其他华谋-学府信息150-500人“五险一金,周末双休,带薪年假,节日福利”后端NaNNaNNaNjava广州
    ..................................................................
    655306553165531java工程师116.40752639.9040303-5年本科15-25K北京全职...数据服务,移动互联网trustdata15-50人“福利好,大牛多,氛围好”后端NaNNaNNaNjava北京
    655316553265532java开发工程师116.40752639.9040303-5年本科15-25K北京全职...移动互联网掌文50-150人“带薪年假、季度奖金、团建活动、年度体检”软件开发NaNNaNNaNjava北京
    655326553365533Java开发工程师116.40752639.904030应届本科10-15K北京全职...移动互联网,教育易编科技少于15人“一周工作四天,每天有效工作6小时。”电商NaNNaNNaNjava北京
    655336553465534java开发工程师121.47370131.2304161-3年大专10-15K上海全职...移动互联网,企业服务羿海科技150-500人“五险一金 绩效奖金 加班补助”电商NaNNaNNaNjava上海
    655346553565535java开发工程师114.05786822.5430993-5年大专15-25K深圳全职...移动互联网,企业服务羿海科技150-500人“五险一金 绩效奖金 加班补助”服务器端NaNNaNNaNjava深圳

    27320 rows × 23 columns

    df1.loc[df1['workYear']==' 不限','workYear']='不限'
    df1.loc[df1['workYear']=='不限 ','workYear']='不限'
    df1.loc[df1['workYear']==' 应届','workYear']='应届'
    
    c:\users\13530\appdata\local\programs\python\python37\lib\site-packages\pandas\core\indexing.py:1765: SettingWithCopyWarning: 
    A value is trying to be set on a copy of a slice from a DataFrame.
    Try using .loc[row_indexer,col_indexer] = value instead
    
    See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
      isetter(loc, value)
    

    JAVA岗位按照城市数量统计

    citys=df1['city'].value_counts()
    citys
    
    深圳      5734
    北京      5209
    上海      3563
    杭州      2670
    成都      1648
            ... 
    娄底         1
    铜陵         1
    蚌埠         1
    晋城         1
    博尔塔拉       1
    Name: city, Length: 125, dtype: int64
    
    plt.figure(figsize=(15,10))
    citys=citys[citys.values>300]
    citys_num=len(citys)
    plt.barh(range(citys_num),citys.values,alpha=0.8)
    plt.yticks(range(citys_num),list(citys.index))
    plt.title('Java岗位按照城市数量统计')
    for x,y in enumerate(citys):
        plt.text(y + 0.2, x - 0.1, '%s' % y)
    plt.show()
    

    在这里插入图片描述

    JAVA岗位按照薪水范围数量统计

    Fare=df1['salary'].value_counts()
    Fare
    
    15-25K    11770
    10-15K     7712
    25K以上      5102
    5-10K      2479
    5K以下        257
    Name: salary, dtype: int64
    
    plt.figure(figsize=(15,10))
    Fare_num=len(Fare)
    plt.barh(range(Fare_num),Fare.values,alpha=0.8)
    plt.yticks(range(Fare_num),list(Fare.index))
    plt.title('Java岗位按照薪水范围数量统计')
    for x,y in enumerate(Fare):
        plt.text(y + 0.2, x - 0.1, '%s' % y)
    plt.show()
    

    在这里插入图片描述

    JAVA岗位按照行业领域数量统计

    industryField=df1['industryField'].value_counts()
    industryField
    
    移动互联网          3650
    金融             1670
    企业服务           1479
    移动互联网,金融       1245
    移动互联网,企业服务     1144
                   ... 
    体育、软件开发           1
    文化娱乐 电子商务         1
    人工智能,教育           1
    数据服务 金融           1
    企业服务、软件开发         1
    Name: industryField, Length: 258, dtype: int64
    
    plt.figure(figsize=(15,10))
    industryField=industryField[industryField.values>1000]
    industryField_num=len(industryField)
    plt.barh(range(industryField_num),industryField.values,alpha=0.8)
    plt.yticks(range(industryField_num),list(industryField.index))
    plt.title('Java岗位按照行业领域数量统计')
    for x,y in enumerate(industryField):
        plt.text(y + 20, x - 0.1, '%s' % y)
    plt.show()
    

    在这里插入图片描述

    JAVA岗位按照公司规模数量统计

    companySize=df1['companySize'].value_counts()
    companySize
    
     2000人以上      7087
     150-500人     6095
     500-2000人    5019
     50-150人      4832
     15-50人       3586
     少于15人         701
    Name: companySize, dtype: int64
    
    plt.figure(figsize=(15,10))
    #companySize=companySize[companySize.values>1000]
    companySize_num=len(companySize)
    plt.barh(range(companySize_num),companySize.values,alpha=0.8)
    plt.yticks(range(companySize_num),list(companySize.index))
    plt.title('Java岗位按照公司规模数量统计')
    for x,y in enumerate(companySize):
        plt.text(y + 20, x - 0.1, '%s' % y)
    plt.show()
    

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9N8v1VTX-1609576483734)(output_73_0.png)]

    JAVA岗位按照学历数量统计

    education=df1['education'].value_counts()
    education
    
    本科    22939
    大专     2917
    不限     1157
    硕士      307
    Name: education, dtype: int64
    
    plt.figure(figsize=(15,10))
    education_num=len(education)
    plt.barh(range(education_num),education.values,alpha=0.8)
    plt.yticks(range(education_num),list(education.index))
    plt.title('Java岗位按照学历数量统计')
    for x,y in enumerate(education):
        plt.text(y + 20, x - 0.1, '%s' % y)
    plt.show()
    

    JAVA岗位按照工作年限数量统计

    workYear=df1['workYear'].value_counts()
    workYear
    
    3-5年     14140
    5-10年     6620
    1-3年      4167
    不限        1433
    应届         860
    10年以上       55
    1年以下        45
    Name: workYear, dtype: int64
    
    plt.figure(figsize=(15,10))
    workYear_num=len(workYear)
    plt.barh(range(workYear_num),workYear.values,alpha=0.8)
    plt.yticks(range(workYear_num),list(workYear.index))
    plt.title('Python岗位按照工作年限数量统计')
    for x,y in enumerate(workYear):
        plt.text(y + 20, x - 0.1, '%s' % y)
    plt.show()
    

    在这里插入图片描述

    JAVA岗位按照岗位标签数量统计

    plt.figure(figsize=(15,10))
    label=df1['positionAdvantage'].value_counts()
    #label_2=df1['label_2'].value_counts()
    #label_3=df1['label_3'].value_counts()
    #label_4=df1['label_4'].value_counts()
    #label=label_1+label_2+label_3+label_4
    label=label[label.values>500]
    label=label.sort_values()
    label_num=len(label)
    plt.barh(range(label_num),label.values,alpha=0.8)
    plt.yticks(range(label_num),list(label.index))
    plt.title('Java岗位按照工作年限数量统计')
    for x,y in enumerate(label):
        plt.text(y + 0.2, x - 0.1, '%s' % y)
    plt.show()
    

    在这里插入图片描述

    JAVA工作年限与工资薪水之间的相关关系

    a=df1[['workYear','salary']]
    a.apply(lambda x: x.factorize()[0]).corr()
    
    workYearsalary
    workYear1.0000000.025818
    salary0.0258181.000000
    sns.heatmap(pd.crosstab(a.workYear,a.salary),cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='workYear'>
    

    在这里插入图片描述

    JAVA学历要求与工资薪水之间的相关关系

    b=df1[['education','salary']]
    b.apply(lambda x: x.factorize()[0]).corr()
    
    educationsalary
    education1.000000-0.010061
    salary-0.0100611.000000
    sns.heatmap(pd.crosstab(b.education,b.salary),cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='education'>
    

    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-bt8p2PWb-1609576483736)(output_87_1.png)]

    JAVA公司规模与工资薪水之间的相关关系

    c=df1[['companySize','salary']]
    c.apply(lambda x: x.factorize()[0]).corr()
    
    companySizesalary
    companySize1.00000.0103
    salary0.01031.0000
    sns.heatmap(pd.crosstab(c.companySize,c.salary),cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='companySize'>
    

    在这里插入图片描述

    JAVA行业领域与工资薪水之间的相关关系

    e=df1[['industryField','salary']]
    e.apply(lambda x: x.factorize()[0]).corr()
    
    industryFieldsalary
    industryField1.0000000.023247
    salary0.0232471.000000
    f,ax=plt.subplots(figsize=(10,15))
    sns.heatmap(pd.crosstab(e.industryField,e.salary),ax=ax,linewidths=0.01,linecolor='pink',cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='industryField'>
    

    在这里插入图片描述

    JAVA城市与工资薪水之间的相关关系

    d=df1[['city','salary']]
    d.apply(lambda x: x.factorize()[0]).corr()
    
    citysalary
    city1.0000000.129413
    salary0.1294131.000000
    f,ax=plt.subplots(figsize=(10,15))
    sns.heatmap(pd.crosstab(d.city,d.salary),ax=ax,linewidths=0.01,linecolor='pink',cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='city'>
    

    在这里插入图片描述

    JAVA公司融资轮数与工资薪水之间的相关关系

    f=df1[['financeStage','salary']]
    f.apply(lambda x: x.factorize()[0]).corr()
    
    financeStagesalary
    financeStage1.00000-0.06504
    salary-0.065041.00000
    sns.heatmap(pd.crosstab(f.financeStage,f.salary),cmap='Blues')
    
    <AxesSubplot:xlabel='salary', ylabel='financeStage'>
    

    在这里插入图片描述

    JAVA公司规模与工作城市之间的相关关系

    g=df1[['companySize','city']]
    g.apply(lambda x: x.factorize()[0]).corr()
    
    companySizecity
    companySize1.000000-0.005961
    city-0.0059611.000000
    f,ax=plt.subplots(figsize=(10,15))
    sns.heatmap(pd.crosstab(g.city,g.companySize),linewidths=0.01,linecolor='pink',cmap='Blues')
    
    <AxesSubplot:xlabel='companySize', ylabel='city'>
    

    JAVA行业领域与工作城市之间的相关关系

    h=df1[['industryField','city']]
    h.apply(lambda x: x.factorize()[0]).corr()
    
    industryFieldcity
    industryField1.0000000.104283
    city0.1042831.000000
    f,ax=plt.subplots(figsize=(15,20))
    sns.heatmap(pd.crosstab(h.city,h.industryField),linewidths=0.01,linecolor='pink',cmap='Blues')
    
    <AxesSubplot:xlabel='industryField', ylabel='city'>
    

    在这里插入图片描述

    JAVA城市活力榜单

    import numpy as np
    
    # 替换薪水
    df1.replace('5K以下', 1, inplace=True)
    df1.replace('5-10K', 2, inplace=True)
    df1.replace('10-15K', 3, inplace=True)
    df1.replace('15-25K', 4, inplace=True)
    df1.replace('25K以上', 5, inplace=True)
    # 替换公司规模
    df1.replace('少于50人', 1, inplace=True)
    df1.replace(' 50-150人', 2, inplace=True)
    df1.replace(' 150-500人', 3, inplace=True)
    df1.replace(' 500-2000人', 4, inplace=True)
    df1.replace(' 2000人以上', 5, inplace=True)
    # 替换工作年限
    df1.replace('1年以下', 1, inplace=True)
    df1.replace('1-3年', 2, inplace=True)
    df1.replace('3-5年', 3, inplace=True)
    df1.replace('5-10年', 4, inplace=True)
    df1.replace('10年以上', 5, inplace=True)
    
    c:\users\13530\appdata\local\programs\python\python37\lib\site-packages\pandas\core\frame.py:4382: SettingWithCopyWarning: 
    A value is trying to be set on a copy of a slice from a DataFrame
    
    See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
      method=method,
    
    # 北京
    beijing_values = []
    beijing = df1[df1['city'] == '北京']
    beijing_values.append(beijing['salary'].value_counts().index[0])
    beijing_values.append(beijing['companySize'].value_counts().index[0])
    beijing_values.append(beijing['workYear'].value_counts().index[0])
    # 西安
    xian_values = []
    xian = df1[df1['city'] == '西安']
    xian_values.append(xian['salary'].value_counts().index[0])
    xian_values.append(xian['companySize'].value_counts().index[0])
    xian_values.append(xian['workYear'].value_counts().index[0])
    # 郑州
    zhengzhou_values = []
    zhengzhou = df1[df1['city'] == '郑州']
    zhengzhou_values.append(zhengzhou['salary'].value_counts().index[0])
    zhengzhou_values.append(zhengzhou['companySize'].value_counts().index[0])
    zhengzhou_values.append(zhengzhou['workYear'].value_counts().index[0])
    # 青岛
    qingdao_values = []
    qingdao = df1[df1['city'] == '青岛']
    qingdao_values.append(qingdao['salary'].value_counts().index[0])
    qingdao_values.append(qingdao['companySize'].value_counts().index[0])
    qingdao_values.append(qingdao['workYear'].value_counts().index[0])
    
    feature = ['薪水','公司规模','工作年限']
    N = len(feature)
    angles = np.linspace(0,2*np.pi,N,endpoint=False)
    
    #使雷达图封闭起来
    angles = np.concatenate((angles,[angles[0]]))
    beijing = np.concatenate((beijing_values,[beijing_values[0]]))
    xian = np.concatenate((xian_values,[xian_values[0]]))
    zhengzhou = np.concatenate((zhengzhou_values,[zhengzhou_values[0]]))
    qingdao = np.concatenate((qingdao_values,[qingdao_values[0]]))
    #绘图
    fig = plt.figure(figsize=(6, 6))
    #设置为极坐标格式
    ax = fig.add_subplot(111, polar=True)
    #绘制折线图
    ax.plot(angles,beijing,'o-',linewidth=2,label='北京')
    ax.fill(angles,beijing,'r',alpha=0.2)
    
    ax.plot(angles,xian,'o-',linewidth=2,label='西安')
    ax.fill(angles,xian,'b',alpha=0.2)
    
    ax.plot(angles,zhengzhou,'o-',linewidth=2,label='郑州')
    ax.fill(angles,zhengzhou,'y',alpha=0.2)
    
    ax.plot(angles,qingdao,'o-',linewidth=2,label='青岛')
    ax.fill(angles,qingdao,'g',alpha=0.2)
    
    #添加每个特质的标签
    ax.set_thetagrids(angles[:3]*180/np.pi,feature)
    #设置极轴范围
    ax.set_ylim(0, 5)
    #添加标题
    plt.title('Java城市活力榜单')
    plt.legend(loc='right', bbox_to_anchor=(1.5, 0.5))
    #增加网格纸
    ax.grid(True)
    plt.show()
    

    在这里插入图片描述

    JAVA公司活力榜单

    # Xmov
    Xmly_values = []
    Xmly = df1[df1['companyShortName'] == '喜马拉雅']
    Xmly_values.append(Xmly['salary'].value_counts().index[0])
    Xmly_values.append(Xmly['companySize'].value_counts().index[0])
    Xmly_values.append(Xmly['workYear'].value_counts().index[0])
    #小红书
    book_values = []
    book = df1[df1['companyShortName'] == '小红书']
    book_values.append(book['salary'].value_counts().index[0])
    book_values.append(book['companySize'].value_counts().index[0])
    book_values.append(book['workYear'].value_counts().index[0])
    # 华为技术有限公司
    huawei_values = []
    huawei = df1[df1['companyShortName'] == '华为技术有限公司']
    huawei_values.append(huawei['salary'].value_counts().index[0])
    huawei_values.append(huawei['companySize'].value_counts().index[0])
    huawei_values.append(huawei['workYear'].value_counts().index[0])
    # 途游
    Dd_values = []
    Dd = df1[df1['companyShortName'] == '当当网']
    Dd_values.append(Dd['salary'].value_counts().index[0])
    Dd_values.append(Dd['companySize'].value_counts().index[0])
    Dd_values.append(Dd['workYear'].value_counts().index[0])
    
    feature = ['薪水','公司规模',"工作年限"]
    N = len(feature)
    angles = np.linspace(0,2*np.pi,N,endpoint=False)
    
    #使雷达图封闭起来
    angles = np.concatenate((angles,[angles[0]]))
    Xmly = np.concatenate((Xmly_values,[Xmly_values[0]]))
    book = np.concatenate((book_values,[book_values[0]]))
    huawei = np.concatenate((huawei_values,[huawei_values[0]]))
    Dd = np.concatenate((Dd_values,[Dd_values[0]]))
    #绘图
    fig = plt.figure(figsize=(6, 6))
    #设置为极坐标格式
    ax = fig.add_subplot(111, polar=True)
    #绘制折线图
    ax.plot(angles,Xmly,'o-',linewidth=2,label='喜马拉雅')
    ax.fill(angles,Xmly,'r',alpha=0.2)
    
    ax.plot(angles,book,'o-',linewidth=2,label='小红书')
    ax.fill(angles,book,'b',alpha=0.2)
    
    ax.plot(angles,huawei,'o-',linewidth=2,label='华为技术有限公司')
    ax.fill(angles,huawei,'y',alpha=0.2)
    
    ax.plot(angles,Dd,'o-',linewidth=2,label='当当网')
    ax.fill(angles,Dd,'g',alpha=0.2)
    
    #添加每个特质的标签
    ax.set_thetagrids(angles[:3]*180/np.pi,feature)
    #设置极轴范围
    ax.set_ylim(0,5)
    #添加标题
    plt.title('Java公司活力榜单')
    plt.legend(loc='right', bbox_to_anchor=(1.5, 0.5))
    #增加网格纸
    ax.grid(True)
    plt.show()
    

    在这里插入图片描述

    df1=df[df['job']=='python']
    df1
    
    idpositionIDpositionNamelongitudelatitudeworkYeareducationsalarycityjobNature...industryFieldcompanyShortNamecompanySizecompanyLabelListpositionAdvantagelabel_2label_3label_4jobdistrict
    011python113.26443423.1291621-3年本科10-15K广州全职...消费生活省省回头车150-500人“五险一金 年底双薪”GolangGONaNNaNpython广州
    122python113.26443423.1291623-5年本科15-25K广州全职...消费生活省省回头车150-500人“五险一金 年底双薪”GolangGONaNNaNpython广州
    233Python开发工程师113.26443423.1291621-3年本科15-25K广州全职...移动互联网悦谦科技50-150人“双休,发展空间大,团队氛围好,扁平化管理”金融Python数据挖掘图像算法python广州
    344Python开发工程师113.26443423.1291623-5年本科15-25K广州全职...移动互联网悦谦科技50-150人“双休 扁平化管理 发展平台好 团队氛围好”移动互联网互联网金融PythonNaNpython广州
    455python开发工程师113.26443423.1291621-3年大专10-15K广州全职...移动互联网广州游爱500-2000人“双休,五险一金,包三餐,年底双薪”后端PythonNaNNaNpython广州
    ..................................................................
    382103821138211高级Python开发工程师121.47370131.2304163-5年本科25K以上上海全职...企业服务CloudChef50-150人“带薪年假,五险一金,团建旅游,补充公积金”PythonLinux/UnixMySQL云计算python上海
    382113821238212中级Python开发工程师121.47370131.2304163-5年本科15-25K上海全职...移动互联网NextTao 互道信息50-150人“技术氛围浓郁 团队氛围轻松 发展空间大”新零售企业服务后端分布式python上海
    382123821338213Python高级开发工程师121.47370131.2304163-5年本科25K以上上海全职...移动互联网NextTao 互道信息50-150人“互联网零售革命的推动者”新零售PythonNaNNaNpython上海
    382133821438214Python开发工程师120.15507030.2740843-5年本科15-25K杭州全职...移动互联网智云健康500-2000人“前景行业,待遇丰厚”python爬虫NaNNaNNaNpython杭州
    382143821538215Python开发工程师(兼职)113.26443423.129162应届本科5K以下广州兼职...移动互联网微宽信息15-50人“兼职”python爬虫NaNNaNNaNpython广州

    38215 rows × 23 columns

    df1.loc[df1['workYear']==' 不限','workYear']='不限'
    df1.loc[df1['workYear']=='不限 ','workYear']='不限'
    df1.loc[df1['workYear']==' 应届','workYear']='应届'
    
    c:\users\13530\appdata\local\programs\python\python37\lib\site-packages\pandas\core\indexing.py:1765: SettingWithCopyWarning: 
    A value is trying to be set on a copy of a slice from a DataFrame.
    Try using .loc[row_indexer,col_indexer] = value instead
    
    See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
      isetter(loc, value)
    

    Python岗位的职位描述进行分析,分析工作内容

    import os
    
    path='D:\\大学\\2020数据处理综合实训\\数据处理综合实训\\job_data'
    files=os.listdir(path)#得到文件夹下的所有文件名称
    txts=[]
    for file in files:#遍历文件夹
        position=path+'\\'+file#构造绝对路径
        #print(position)
        with open(position,'r',encoding='utf-8') as f:
            data=f.read()#读取文件
            txts.append(data)
    txts=','.join(txts)#转化为非数组类型
    print(txts)
    
    岗位职责
    
    
    1、负责集成各种维度的数据源,使用各种数据获取技巧,转换、分析、调度、存储数据,为公司业务提供正确稳定的数据;
    2、负责建设高可靠、高并发的分布式系统;
    3、负责提升系统的稳定性,持续迭代更新,保证系统质量和交付及时性;
    4、负责编写相关的技术文档和单元测试,对产品质量负责。
    
    
    岗位要求
    
    
    1、统招本科及以上学历,具备英语读写能力;
    2、熟悉 Git/GitHub,通信协议 TCP/HTTP 及 RESTful 标准;
    3、五年及以上 Python 开发工作经验,有 Scrapy 等使用经验;
    4、有 MySQL, Redis 或 MongoDB 等相关数据库使用经验;
    5、有数据意识,有产品数据方面相关经验。
    
    
    
    加分项
    
    
    1、有 CI/CD使用经验 ;
    2、有使用 Docker、Kubernetes、AWS 或 GCP 等经验;
    3、熟悉 Tornado、Django 或 Flask ;
    4、有写 Blog 的习惯,活跃于技术社区,参与开源项目等;
    5、有代码洁癖,对代码精益求精,对技术有极客热情;
    6、有软件著作权申请,有专利发明申请。,职责描述:
    1. 负责算法平台模块的开发维护工作
    2. 负责核心技术问题的攻关,架构设计,系统优化,协助解决项目开发过程中的技术难题
    3. 与算法工程师紧密配合,共同创造稳定可靠的算法项目
    ……
    ……
    ……
    
    d={'开发':0,'测试':0,'设计':0,'维护':0,'实现':0,'修复':0,'编写':0,'Python':0,'处理':0,'SQL':0,
       '爬虫':0,'多线程':0,'监控':0,'优化':0,'框架':0}
    num=txts.count('开发')
    d['开发']=num
    num=txts.count('测试')
    d['测试']=num
    num=txts.count('设计')
    d['设计']=num
    num=txts.count('维护')
    d['维护']=num
    num=txts.count('实现')
    d['实现']=num
    num=txts.count('修复')
    d['修复']=num
    num=txts.count('编写')
    d['编写']=num
    num=txts.count('Python')
    d['Python']=num
    num=txts.count('处理')
    d['处理']=num
    num=txts.count('SQL')
    d['SQL']=num
    num=txts.count('爬虫')
    d['爬虫']=num
    num=txts.count('多线程')
    d['多线程']=num
    num=txts.count('监控')
    d['监控']=num
    num=txts.count('优化')
    d['优化']=num
    num=txts.count('框架')
    d['框架']=num
    d
    
    {'开发': 171,
     '测试': 29,
     '设计': 57,
     '维护': 19,
     '实现': 17,
     '修复': 2,
     '编写': 17,
     'Python': 43,
     '处理': 16,
     'SQL': 28,
     '爬虫': 12,
     '多线程': 6,
     '监控': 5,
     '优化': 35,
     '框架': 41}
    
    from wordcloud import WordCloud
    
    wc = WordCloud(
        max_words=500,  # 最多显示词数
        # max_font_size=100,  # 字体最大值
        background_color="white",  # 设置背景为白色,默认为黑色
        width = 1500,  # 设置图片的宽度
        height= 960,  # 设置图片的高度
        margin= 10,  # 设置图片的边缘
        #font_path=’./fonts/simhei.ttf’
        font_path='msyh.ttc')
    wc.generate_from_frequencies(d)  # 从字典生成词云
    plt.imshow(wc)  # 显示词云
    plt.axis('off')  # 关闭坐标轴
    plt.show()  # 显示图像
    

    d={'本科':0,'英语':0,'经验':0,'HTML5':0,'CSS3':0,'RBAC':0,'django':0,'Python':0,'SQL':0,
       '沟通':0,'JavaScript':0,'Linux':0,'前端':0,'HTTP':0,'计算机':0}
    num=txts.count('本科')
    d['本科']=num
    num=txts.count('英语')
    d['英语']=num
    num=txts.count('经验')
    d['经验']=num
    num=txts.count('HTML5')
    d['HTML5']=num
    num=txts.count('CSS3')
    d['CSS3']=num
    num=txts.count('RBAC')
    d['RBAC']=num
    num=txts.count('django')
    d['django']=num
    num=txts.count('Python')
    d['Python']=num
    num=txts.count('SQL')
    d['SQL']=num
    num=txts.count('沟通')
    d['沟通']=num
    num=txts.count('JvaScript')
    d['JavaScript']=num
    num=txts.count('Linux')
    d['Linux']=num
    num=txts.count('前端')
    d['前端']=num
    num=txts.count('HTTP')
    d['HTTP']=num
    num=txts.count('计算机')
    d['计算机']=num
    d
    
    {'本科': 29,
     '英语': 5,
     '经验': 92,
     'HTML5': 3,
     'CSS3': 3,
     'RBAC': 1,
     'django': 10,
     'Python': 43,
     'SQL': 28,
     '沟通': 21,
     'JavaScript': 0,
     'Linux': 15,
     '前端': 12,
     'HTTP': 9,
     '计算机': 27}
    
    wc = WordCloud(
        max_words=500,  # 最多显示词数
        # max_font_size=100,  # 字体最大值
        background_color="white",  # 设置背景为白色,默认为黑色
        width = 1500,  # 设置图片的宽度
        height= 960,  # 设置图片的高度
        margin= 10,  # 设置图片的边缘
        #font_path=’./fonts/simhei.ttf’
        font_path='msyh.ttc')
    wc.generate_from_frequencies(d)  # 从字典生成词云
    plt.imshow(wc)  # 显示词云
    plt.axis('off')  # 关闭坐标轴
    plt.show()  # 显示图像
    

    在这里插入图片描述

    附加内容

    import jieba
    path='D:\\大学\\2020数据处理综合实训\\数据处理综合实训\\job_data'
    files=os.listdir(path)#得到文件夹下的所有文件名称
    result=''
    for file in files:
        position=path+'\\'+file#构造绝对路径
        with open(position,'r',encoding='utf-8') as f:
            lines=f.readlines()
            for index,line in enumerate(lines):
                if '岗位要求'in line or '任职要求'in line or '任职资格'in line:
                    for line in lines[1:index]:
                        result +=line.strip('\n')
    with open ('停用词表.txt','r',encoding='utf-8')as f:
        stop =f.read()
    words=jieba.lcut_for_search(result)
    word_list=[]
    for word in words:
        if len(word)>1 and word not in stop:
            word_list.append(word)
    keyword1=set(word_list)
    
    result=''
    for file in files:
        position=path+'\\'+file#构造绝对路径
        with open(position,'r',encoding='utf-8') as f:
            lines=f.readlines()
            for index,line in enumerate(lines):
                if '岗位要求'in line or '任职要求'in line:
                    for line in lines[index+1:]:
                        result +=line.strip('\n')
    words=jieba.lcut_for_search(result)
    word_list=[]
    for word in words:
        if len(word)>1 and word not in stop:
            word_list.append(word)
    keyword2=set(word_list)
    
    jiao=keyword1&keyword2
    keyword1_alone=keyword1-jiao
    keyword2_alone=keyword2-jiao
    keyword1_count=0
    keyword2_count=0
    str_='''1、本科及以上学历,熟悉Python语言,有3年以上的实际 Python Web 开发经验;
    2、熟练掌握 Python Web开发框架Django ;
    3、熟悉Postgresql/Redis/MongoDB等数据库及相关操作;
    4、熟悉Linux 操作系统及基础命令,熟悉Shell;
    5、熟悉Docker,能使用docker部署应用python/django项目;
    6、具备较强的学习能力和责任心,良好的沟通能力、文档编写能力;
    7、为团队引入创新的技术、创新的解决方案,用创新的思路解决问题;
    8、对现存或未来系统进行宏观的思考,规划形成统一的组件、框架或平台
    9、较好的产品意识,愿意将产品效果做为工作最重要的驱动因素
    10、良好的设计和编码规范,热爱写代码'''
    words=jieba.lcut_for_search(str_)
    for word in words:
        if word in keyword1_alone:
            keyword1_count += 1
    #         print(word)
        if word in keyword2_alone:
    #         print(word)
            keyword2_count += 1
    if keyword1_count > keyword2_count:
        print('***********职位描述************')
    else:
        print('***********任职要求************')
    
    ***********任职要求************
    

    Web可视化

    from pyecharts.charts import Bar
    from pyecharts.globals import ThemeType
    
    df=pd.read_excel('D:\\大学\\2020数据处理综合实训\\数据处理综合实训\jobs.xls')
    
    df1=df[df['job']=='python']
    df1
    PY_city=df1['city'].value_counts()
    PY_city=PY_city.head(20)
    
    c=(
        Bar({'theme':ThemeType.MACARONS})
        .add_xaxis(PY_city.index.tolist())
        .add_yaxis('Python',PY_city.values.tolist())
        .set_global_opts(
            title_opts={'t]ext':'语言与城市'})
        .render('语言与城市.html'))
    

    在这里插入图片描述

    展开全文
  • 每年的秋季招聘会刚刚落幕,随着后疫情时代的到来,越来越多的企业开始选择网上招聘的人才,比如字节跳动,自去年以来,超过九成的面试都在网上进行。而事实上早在疫情爆发之前,这一趋势就已悄然开始。而这背后也离...

    每年的秋季招聘会刚刚落幕,随着后疫情时代的到来,越来越多的企业开始选择网上招聘的人才,比如字节跳动,自去年以来,超过九成的面试都在网上进行。而事实上早在疫情爆发之前,这一趋势就已悄然开始。而这背后也离不开人力资源数字化的技术支持。

    我国人力资源数字化目前还处于起步阶段,企业数字化转型是每一个企业都必须经历的过程。

    加快社会环境的变革,激发出类似无人自助、智能自动化等数字化创新的需求,在智能环境下,企业要获得更好的发展机会,必然要顺应时代环境,利用新工具、技术实现与社会要素的链接,所谓物竞天择,适者生存,这一规则照常适用。

    我们所说的数字化转型,就是运用数字化技术(例如大数据、云计算、人工智能等)推动企业组织改变商业模式、组织结构、企业文化等的措施,例如衍生出的智能制造、智慧城市等概念。

    其中,人力资源数字化是企业数字化转型的重要组成部分。在疫情影响下,大部分行业经济受到严重冲击,但有部分企业则抓住机遇,推动数字化转型,提高管理效率,降低运营成本。

    因此,如何才能实现人力资源数字化呢?

    四个层次的转型需要完成:信息自动化、流程自动化、决策自动化、实现“数字化超越”。

    第一,信息自动化。达到办公场景的数字化,如办公所需文字、视频通信、网上文件传输与共享等。这些都需要一些协同办公工具的技术支持。

    Tracup:集成Bug追踪的轻量级项目管理平台

    更符合极客式工作方式的项目管理工具。

     

    接下来是过程自动化。实现人事流程和服务的数字化,包括过程的申请、审批以及大部分员工服务等。

    最终“数字化超越”指的是数字化的员工体验,更注重员工的创造性、幸福度、信任感、凝聚力,创造一种新型的协同共生组织。

    然而正是互联网企业自身的天然优势,使得互联网企业得以大量采用线上招聘。使招聘工作在疫情爆发的困难时期更容易展开,提高了招聘效率。

    这里就要推荐一下:蒲公英企服内推 | 每天更新大量好职位,免费内推

     

    展开全文
  • 一,各大互联网公司JD CVTE 岗位要求: 1.熟练掌握Java语言,具有独立开发项目的经验 2.掌握常用算法、数据结构、网络协议等 3.掌握数据库基础,有至少一种主流数据库产品使用、维护、性能优化的经验 4.具有较...
  • 深扒互联网大厂招聘中的学历鄙视链

    千次阅读 多人点赞 2021-04-02 17:10:37
    本文转载自 九章算法 ...阿里新财年的招聘计划即将开启,今天就让我们来盘一盘,BAT大厂那些不为人知的招聘鄙视链。 阿里:社招不把学历卡死,只要经历够牛逼 在阿里社招中,学历不是特别重要的一
  • 职位描述/要求: 岗位职责: 1....二年以上WEB开发、维护经验,或有一年以上大、中型网站开发、维护经验; 10.具有PHP或Python开发经验者优先; 11.具有财经、证券网站开发经验者优先。 有考虑者请加我QQ:329282397
  • ** 一、基于互联网招聘信息统计与分析:** 项目流程 1.项目简介: 该项目通过挖掘和分析互联网招聘信息,并将进行数据统计与分析,把不同的岗位薪酬,相同岗位的不同待遇等方面进行对比。可以直观的感受...
  • 现在的IT互联网行业怎么样了呢,乐字节fafa带你详细了解: 2月25日,BOSS直聘研究院发布**《2021年春节复工首周就业趋势观察》**。据介绍,2021年春节后复工一周,市场招聘需求快速增长,较疫情笼罩的2020年同期增长...
  • 已经到了八月中旬了,程序员们即将迎来金九银十面试季,今天刚好有一位粉丝找到我,他上周刚面完奇虎360,经过了几轮的面试,最后薪资也谈了,今天主要是问我想这样的大型互联网公司一般多久会正式下offer。...
  • 微软微软 STCA · 自然语言处理组,致力于自然语言处理(NLP)核心技术的深入研究、成果在全球产品中的落地应用,由北京、苏州两地的 200 多位热爱技术、勤于实践、勇于梦想的科学家和工...
  • 聊下如今互联网招聘情况下把。 往年都是金9银10,正所谓9月份最佳找工作时间段,10月份还可以冲一冲,接下来可能就是等补录了(补录一般情况下都是offer收割机最终勉为其难只能选择一个,其他只能拒掉),这时候坑位...
  • 所以从“一个神奇的网站”58同城,到“找工作我要和老板谈”的BOSS直聘,都是顺应时代需求的产物。 而在历经了行业的跌宕起伏之后,如今的网络招聘行业似乎正处于关键的转折点,行业内大事频频发生。一面是新秀BOSS...
  • 23个海外求职找各种工作的招聘网站

    千次阅读 2021-05-27 00:06:33
    我们在找工作的时候,除了通过熟人介绍工作,更多的是要通过招聘网站来获取更多的工作机会,使用招聘网站来搜索所在行业的工作职位是找工作最有效的方法之一。而在国外寻找工作也一样,招聘网站上会列出...
  • 【大数据实战】招聘网站职位分析

    千次阅读 多人点赞 2021-04-21 19:11:19
    通过采集招聘网站大数据职位信息、利用数据清洗、数据分析、jieba分词、数据挖掘完成整体项目的开发工作。任务包含爬取招聘网站大数据职位信息、使用BeautifulSoup清洗职位信息网页、使用PySpark对智联数据进行分析...
  • 大家纷纷给求职者出谋划策,有人说招聘网站的在线简历随便瞎填,只有附件简历是真实内容,等遇到合适的再把附件简历发送过去。 有人说简历上别写现在的工作内容,等猎头hr找的时候再说简历没更新。 有人说可以用...
  • BOSS招聘网站数据分析岗位分析详情 数据来源于BOSS招聘网站,仅供学习 #导包 import numpy as np import pandas as pd import matplotlib.pyplot as plt import re #中文显示及负号显示 plt.rcParams[‘font.sans-...
  • 招聘网站有很多数据分析师的招聘信息,那接下就用数据分析可视化更加直观的分析数据分析师目前的薪资,学历等信息以及公司规模情况。 数据分析思维导图: 最终可视化展示(Power BI) 1.数据信息 数据来源:爬取...
  • 其中蜻蜓招聘网属于成都本地招聘平台,求职招聘成功率更高一些! 主要招聘岗位有,程序员,编辑,sem推广!安卓开发师以及区块链等领域的人才!大家去看看呢! 其中安卓开发师的职位需求量今天依旧火爆!你做好准备...
  • 雇主思维:,先内部提升,没有就去找有好的方式证明自己行的人(比如说,你是程序员,把自己写的牛逼程序带上来),再没有就走内部推荐的方式,还是没有的,发布岗位到互联网招聘网站上。你看,到了最后一步,才考虑...
  • 互联网、大公司常用的英文缩写

    千次阅读 2021-09-18 16:12:56
    求职、招聘过程 HC (Head Count),俗称人头数,指的是招聘名额。 JD(Job Description),工作职责描述,也就是企业的招聘要求。 OC (Offer Call),当企业决定录用你时,会打电话发 Offer,并询问你是否接受。...
  • PHP大学生求职招聘网站通过PHP+MySQL进行开发,是一个为应届毕业的大学生以及用人单位搭建的一个互联网沟通平台。通过本系统用人单位可以在上面发布招聘信息,大学生可以发布自己的简历信息,然后大学生和企业之间...
  • 人才招聘网络化管理系统主要用于快捷、高效地处理招聘管理活动,使企业的招聘工作得以高速运行。管理趋于正规化、系统化、信息化。系统使用微软公司推出的SELSERVER2000进行开发,它能很好地与Office套装办公软件...
  • 基于Springboot和Mysql实现的大学生招聘网站系统 ,主要功能包括职位搜索、登陆、注册、岗位申请、简历编辑等功能 技术 使用springboot mybatis数据库为mysql。部分表结构 DROP TABLE IF EXISTS `company`; ...
  • 互联网招聘下半场,BOSS直聘交出上市之后的首份成绩单:2021年二季度,其总收入11.68亿元,同比增长173.9%;经调整后净利润为2.465亿元,当季扭亏为盈。 7月5日,BOSS直聘曾因数据安全问题接受网络安全审查,消息...
  • 曾经大名鼎鼎的某联招聘,我们至少认为这样一个大的网站应该跟互联网行业的京东、阿里、腾讯是一个层次级别的,然鹅经过一次使用发现完全不是这么一回事。 先是因为需要招人注册了公司账号,一个客服很快打来...
  • 中国电信校园招聘笔试试题

    千次阅读 2021-07-20 00:54:48
    《中国电信校园招聘笔试试题》由会员分享,可在线阅读,更多相关《中国电信校园招聘笔试试题(5页珍藏版)》请在人人文库网上搜索。1、中国电信校园招聘笔试试题国电信分专业类进行,一般有营销类、通信类、计算机类、...
  • 其实,想这些互联网大厂,尤其是新兴的这些 TMD(头条,美团,滴滴)等移动互联网公司,他们成立总共都不到 10 年,从创业开始招聘的时候,假如是 23 岁的年轻人,到现在都不到 33 岁,何况每年都会加入很多新的...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 87,742
精华内容 35,096
关键字:

互联网招聘网站