精华内容
下载资源
问答
  • msyql 员工员工样本数据库, 由于官方得下载路径速度太慢, 本人做了一次搬运 有关法律信息,请参阅《法律声明》。 有关使用MySQL的帮助,请访问 MySQL论坛,您可以在此与其他MySQL用户讨论您的问题。 本资源仅供个人...
  • 最近在学习《从零开始学Python数据分析》这本书,第六章的综合实例——巴尔的摩公务员工资数据集,原网站上数据集被清除,于是在Kaggle上寻找了相似的数据“Employee_monthly_salary.csv”进行可视化数据分析。...

    前言

    最近在学习《从零开始学Python数据分析》这本书,第六章的综合实例——巴尔的摩公务员工资数据集,原网站上数据集被清除,于是在Kaggle上寻找了相似的数据“Employee_monthly_salary.csv”进行可视化数据分析。

    工作环境

    系统: windows10

    工具: pycharm2019.2.6

    第三方包:
    pandas1.1.4
    numpy
    1.19.4
    matplotlib==3.3.2


    文件(Employee_monthly_salary.csv)

    在这里插入图片描述


    完整代码

    # import numpy as np
    import pandas as pd
    # from pandas import DataFrame
    import matplotlib.pyplot as plt
    # import matplotlib as mlb
    
    pd.set_option('mode.chained_assignment', None)  # 消除链接操作时警示(治标不治本)
    
    
    """
    EmpID 职工ID
    Name 姓名
    Gender 性别
    Date_of_Birth 出生日期 
    Age 年龄
    Join_Date 入职日期
    Tenure_in_org_in_months 工作总月份 
    GROSS 总工资
    Net_Pay 实际工资
    Deduction 扣除部分
    Deduction_percentage 扣除百分比 
    Designation 职位
    Department 部门
    """
    
    """
    我们即将实现的功能:
    	1.男女平均工资对比;
    	2.男性和女性最高工资和最低工资对比;
    	3.月薪的分布状况 
    	4.人数最多的职位Top5的平均工资;
    	5.不同月份入职人员数量;
    	6.任职时间和工资的关系
    	"""
    
    # 主菜单
    def menu():
        print('*' * 10, '请选择功能', '*' * 10, '\n')
        print('请输入对应功能的序号:')
        print("1.男女工资平均对比")
        print('2.最高工资和最低工资对比')
        print('3.月薪分布状况')
        print('4.人数最多的职位Top5的平均工资')
        print('5. 不同月份入职人员数量')
        print('6. 入职时间和工资的关系')
        print("输入0字符退出")
        print('*' * 10, '退出程序', '*' * 10, '\n')
    
    
    # 男女平均工资对比
    def sex_salary(salary):
        avg_salary = salary.groupby('Gender')['Net_Pay'].mean()  # 求平均数
        avg_salary.plot.bar(color='orange')   # 设置柱的颜色
        plt.show() #  画布
    
    
    # 男性和女性最高工资和最低工资对比
    def salary_contrast(salary):
        max_salary = salary.groupby('Gender', as_index=False)['Net_Pay'].max()  # 求最大值
        print(max_salary)
        min_salary = salary.groupby('Gender', as_index=False)['Net_Pay'].min()  # 求最小值
        print(min_salary)
        salary_s = pd.merge(max_salary, min_salary, on='Gender', suffixes=['_max_salary', '_min_salary'])  # 数据合并,suffixes设置区分两个数据同名列
        # 由于最低工资过低,我们这里将它扩大100倍来进行比较
        salary_s['Net_Pay_min_salary'] = salary_s.loc[:, 'Net_Pay_min_salary'] * 100
        salary_s.plot(kind='bar')  # bar代表柱形图
        plt.show()
    
    
    # 工资的分布状况
    def salary_distribution(salary):
        salary['Net_Pay'].hist(bins=20)  # bins将值分段,不设置默认为10, hist绘制直方图
        plt.show()
    
    
    # 人数最多的职位Top5的平均工资
    def designation_top(salary):
        avg_salary = salary.groupby('Designation')['Net_Pay'].agg(['mean', 'count'])  # 数据分组,mean求不同职位工资平均值,count计算不同职位人数
        sort_salary = avg_salary.sort_values(by='count', ascending=False)[:5]  # by指定排序列名,ascending=False设置降序,默认升序
        sort_salary['mean'].plot(kind='bar')  # 这里的mean是自动创建的平均值列名,绘制柱形图
        plt.show()
    
    # conversion函数用于将数据里类似“01”,“02”等转化为12,类型为str
    def conversion(x):
        data = {
            '01': 1,
            '02': 2,
            '03': 3,
            '04': 4,
            '05': 5,
            '06': 6,
            '07': 7,
            '08': 8,
            '09': 9,
        }
        list_data = ['01', '02', '03', '04', '05', '06', '07', '08', '09']
    
        if x in list_data:
            x = data[x]
            return str(x)
        else:
            return x
    
    
    # 不同月份入职人员数量
    def month_count(salary):
        salary['month'] = salary['month'].map(conversion)  # 使用map函数将month列传入conversion实现数据修改
        month_counts = salary['month'].value_counts()  # value_counts统计每个月份入职人员数
        month_counts.plot(kind='bar')
        plt.show()
    
    
    # 工作时间和工资的关系
    def work_months(salary):
        salary.plot(kind='scatter', x='Tenure_in_org_in_months', y='Net_Pay')  # 绘制散点图,展示工作时间和工资的关系
        plt.show()
    
    
    # 主函数
    def main():
        df = pd.read_csv('Employee_salary.csv')  # 读取数据集
        # print(df.info())  # 打印信息
        # print(df.shape)  # DataFrame维度
        # print(df.isnull().sum())  # 统计缺失值总数
        df = df.dropna()  # 删除有缺失值的行
        salary = df[['EmpID', 'Name', 'Gender', 'Age', 'Join_Date', 'Tenure_in_org_in_months', 'Net_Pay',
                     'Designation']]  # 选择部分字段使用
        # df.to_csv('employee.csv')  # 将新DataFrame对象数据写入csv文件中
        salary['month'] = salary['Join_Date'].str.split('/').str[1]  # 将Join_Date入职日期分离,获取入职月份,添加新列到salary中
        menu()
    
        n = eval(input("请输入编号:(1/2/3/4/5/6/0):"))  # 输入对应整数选择功能
        print("\n")
        if n == 1:
            sex_salary(salary)
        elif n == 2:
            salary_contrast(salary)
        elif n == 3:
            salary_distribution(salary)
        elif n == 4:
            designation_top(salary)
        elif n == 5:
            month_count(salary)
        elif n == 6:
            work_months(salary)
        else:
            exit(0)
    
    
    if __name__ == "__main__":  # 当程序因为自身调动是才启动程序
        main()
    
    

    功能效果展示


    男女平均工资对比

    男女平均工资对比
    分析:M(male)代表男性,F(female)代表女性,女性平均工资低于男性,大致接近(可能存在样本量不足因素)


    男性和女性最高工资和最低工资对比

    在这里插入图片描述
    分析:0为女性,1为男性(忘了改了,问题不大),无论男性还是女性最低和最高工资差距极大(注意这里最低工资已经乘了100倍);最高工资男性较高,最低工资男女接近。


    工资的分布状况

    在这里插入图片描述
    分析:满足正太分布,工资在100000左右的居大多数。


    人数最多的职位Top5的平均工资

    在这里插入图片描述


    不同月份入职人员数量

    在这里插入图片描述
    分析:没有按照顺序排列月份(自己搞去),默认从高到低排列,7月入职的人最多,2月最少。


    工作时间和工资的关系

    在这里插入图片描述
    分析:数据可见,工作时间长工资不一定就高啊。

    数据集

    最最重要的来了,拿走不用谢

    码云(gitee)

    注意:
    我在项目文件里修改了文件名称,切莫忘记修改

    展开全文
  • SGD_SVM_RF_Classifier_Employee_Turnover:在“员工流失”数据集上应用预测模型
  • 这个本为世界上最大的公开人脸识别数据集,现在已经不能通过微软的渠道访问。 这个数据集包含了 10 万张名人面部图像,常被用来作为人脸识别的训练。对于微软删除的真实原因,我们不得而知,但其背后牵扯到的数据...

    640?wx_fmt=gif

    640?wx_fmt=jpeg

    作者 | 神经小姐姐

    责编 | 郭芮

    本文经授权转自HyperAI超神经(ID:HyperAI)

    前几日,微软静悄悄地删除了一个公开的名人图片数据集。这个本为世界上最大的公开人脸识别数据集,现在已经不能通过微软的渠道访问。

    这个数据集包含了 10 万张名人面部图像,常被用来作为人脸识别的训练。对于微软删除的真实原因,我们不得而知,但其背后牵扯到的数据隐私问题,包括人脸识别技术的安全规范,都值得一番深思。

    在这次「静默」删除行为背后,又牵扯到了哪些问题呢?

     

    640?wx_fmt=png

    微软想解决的麻烦:MS Celeb 名人数据集

     

    MS Celeb 1M 数据集,最早是微软在 2016 年发布,其中共包含了 10 万个名人,近 1000 万张面部图片,而这些数据都是从网络上搜集而来。

    从网络中 100 万个名人中,根据受欢迎程选出 10 万个,然后利用搜索引擎,跳出每个人的大约 100 张图片,就得到了这个庞大的数据集。

    640?wx_fmt=jpeg

    MS Celeb 数据集中的 Jobs 图片,其中绿色是年轻时代的图片,红色是合成图像

    而这个数据集最初是用来服务比赛的。MSR IRC 是世界上最高水平的图像识别赛事之一,MS Celeb 1M 数据集最初就是这个赛事所用。

    MS Celeb 1M 常被用来做面部识别的训练。但对于这些图片均来自网络,所以也曾受到了质疑。而微软则表示,是根据「知识共享许可 C.C 协议」,来抓取和获得这些图像的。

    根据协议,可以将照片重新用于学术研究,(照片中的人物并不一定授权许可,而是版权所有者授权。)但微软发布数据集后,却并不能掌管它的使用。英国「金融时报」进行了一项深入调查,结果表明数据被大量的用在了多个企业测试中。

    包括 IBM,松下,阿里巴巴,Nvidia 和日立等公司,都存在使用这个数据集的情况。

    而这就涉及到了数据集使用的一些规范性问题,一位研究人员还指出,这涉及到人脸识别图像数据集的伦理,起源和个人隐私等问题。

     

    640?wx_fmt=png

    删除原因:负责该数据集的员工离职?

     

    微软已经在线上默默地删除了MS Celeb 1M,并没有特别的说明。

    640?wx_fmt=png

    Github 上数据集的下载页面已经变成了 404 

    在金融时报的报道中,微软表示「该网站主要目的是用于学术」,而删除它的原因是,「负责运营这个项目的员工离职了,不再与微软合作,所以进行了删除。」

    我们都相信肯定有其他原因,可能也有数据集图片存在的问题。虽然微软称数据集均来自于公众人物的照片。但其中还包括少量非知名人物。这部分人脸照片的所有者,对微软使用他们的名称和图像信息,曾提出过质疑和批评。

    还有技术人员推测,微软可能会因违反欧盟《通用数据保护条例》(GDPR)而删除数据,该法规于去年生效,旨在建立起数据安全的保护措施。

    640?wx_fmt=png

    GDPR对个人信息的保护及其监管,达到了前所未有的高度

    但微软表示,它们没有涉及到 GDPR 的条款,数据集相关网站退役只是因为,「曾经的竞赛已经结束」。

    当然,此次微软移除 MS Celeb 数据集,并不妨碍它在学术研究等途径的正常使用。那些用于处理数据库的工具,现在也可正常访问。

     

    640?wx_fmt=png

    常用公开数据集,也可能有隐私问题

     

    在英国「金融时报」调查之后,还有另外两个学术单位也删除了相关的数据集:分别是杜克大学的 Duke MTMC 监控数据集,和斯坦福大学的 Brainwash 数据集。

    关于数据集和隐私问题,这不是第一次进入人们的视野。在今年 1 月底,IBM 发布了百万级别的无偏见「人脸多样性」数据集,就曾引发了广泛的争议。

    虽然 IBM 强调此举是为减少面部识别中的「偏见」问题,但数据集的来源,人物的是知情度等问题,都引发了不少质疑声。

    有媒体还报道, IBM 表示会按照被摄影者的意愿,删除数据集里的相关照片,但都只是一面之词,并没有实际的行动。

    640?wx_fmt=gif

    今年 5 月,旧金山曾颁布法令,禁止政府机构使用人脸识别技术

    对于数据集的采集和使用规则,还是一个很不太明确的区域,尤其是网络便利之后,很多机构都能轻易地获得大量图片,用于面部识别等用途。

    其实,对于数据集涉及的隐私问题,解决方案可以很简单:关乎到用户个人隐私信息时,应保证用户的知情权,确保用户是否愿意贡献数据。

    但似乎缺少的从来都不是方法,而是意识。

    5G之后,中国的人工智能发展趋势如何?

    https://edu.csdn.net/topic/ai30?utm_source=csdn_bw

     

    【END】

    640?wx_fmt=jpeg

    6月29-30日,2019以太坊技术及应用大会特邀以太坊创始人V神与以太坊基金会核心成员,以及海内外知名专家齐聚北京,聚焦前沿技术,把握时代机遇,深耕行业应用,共话以太坊2.0新生态。扫码即享优惠购票!

    640?wx_fmt=jpeg

     热 文 推 荐 

    他是浙大 19 岁大一新生,三个月斩获 WWDC 19 奖学金!

    TIOBE 6 月编程语言排行榜:Python 势不可挡,或在四年之内超越 Java、C

    无良老板拖欠程序员工资,一怒开源冲上 GitHub TOP1

    ☞ 9 年前他用 1 万个比特币买了两个披萨, 9 年后他把当年的代码卖给了苹果,成为了 GPU 挖矿之父

    17 岁的程序员告诉你关于编程的 7 个重要教训!

    Bert时代的创新:Bert在NLP各领域的应用进展 | 技术头条

    Lambda 表达式有何用处?

    Python编写循环的两个建议 | 鹅厂实战

    漫威金刚狼男主弃影炒币了?

    ☞“是!互联网从此没有 BAT!”

    640?wx_fmt=png你点的每个“在看”,我都认真当成了喜欢

    展开全文
  • 校园招聘 使用校园布局数据集进行数据分析和机器学习 探索性数据分析*预测学生是否被录用 确定影响放置的因素 确定影响新员工薪水的因素。
  • KITTI数据集转化为ROS bag包(解决各种类型数据集,实测有效) 1.raw data数据集转化 raw data数据集的转化可以参考我之前的博客 将KITTI数据集转化为ROS bag包——kitti2bag使用教程 2.其他数据集转化 除了上面...

    KITTI数据集转化为ROS bag包(解决各种类型数据集,实测有效)

    1.raw data数据集转化

    raw data数据集的转化可以参考我之前的博客
    将KITTI数据集转化为ROS bag包——kitti2bag使用教程

    2.其他数据集转化

    除了上面kitti2bag数据集转化工具外,我们再介绍另一个非常好用的工具
    这里阿里员工在github上开源的工具包,大家可以通过下面的链接进行访问
    lidar2rosbag_KITTI
    工具非常好用,建议star或者fork方便下次使用

    下面介绍lidatr2rosbag工具包的使用方法:

    编译工具包

    $ cd ~/catkin_ws/src/
    $ git clone  git@github.com:AbnerCSZ/lidar2rosbag_KITTI.git
    $ cd ~/catkin_ws
    $ catkin_make -DCMAKE_BUILD_TYPE=Release 
    $ source ~/catkin_ws/devel/setup.bash
    

    运行:

    rosrun lidar2rosbag lidar2rosbag KITTI_input_dir output_name
    
    Please confirm that the input path contains the file times.txt and the folder 	velodyne.
    
    └── dataset
       └── sequences
        └── 04
            ├── calib.txt
            ├── image_0 [271 entries exceeds filelimit, not opening dir]
            ├── image_1 [271 entries exceeds filelimit, not opening dir]
            ├── times.txt
            └── velodyne [271 entries exceeds filelimit, not opening dir]
    

    示例:

    rosrun lidar2rosbag lidar2rosbag /data/KITTI/dataset/sequences/04/ 04
    
    or
    
    rosrun lidar2rosbag lidar2rosbag /data/KITTI/dataset/sequences/01/ bag01
    
    and so on...
    

    特别提示:
    如果遇到LZ4_stream_t, LZ4_streamDecode_t build error错误可以通过下面链接中的方法解决
    救命稻草

    展开全文
  • 微软表格数据集 重点 (Top highlight)Over the course of August 2020, more than 300 Microsoft employees shared their salaries, bonuses, and stock awards in a Google spreadsheet to continue their push for...

    微软表格数据集

    重点 (Top highlight)

    Over the course of August 2020, more than 300 Microsoft employees shared their salaries, bonuses, and stock awards in a Google spreadsheet to continue their push for fairer compensation.

    Ø版本2020八月的过程中,300名多名微软员工分享了他们的工资,奖金和股票奖励在谷歌电子表格,以继续推动公平的补偿。

    “You are legally protected to share this info, and you should share it so your coworkers can determine if they’re being underpaid; however, you should still exercise caution,” the Google Form to submit information reads.

    “在法律上您可以共享此信息,因此您应该共享此信息,以便您的同事可以确定他们是否被低薪; 但是,您仍应谨慎行事。”

    Sharing compensation data has become an annual tradition at Microsoft during this time of year, when full-time employees are notified of any raises or bonuses. Last year, more than 400 employees similarly shared their salaries, OneZero reported. The employees who respond to each year’s survey are mainly based in Redmond, Microsoft’s Washington headquarters. By the last day of August 2020, 310 employees had added their data to the spreadsheet. Microsoft employs more than 150,000 employees around the world.

    共享补偿数据已成为 在每年的这个时间里,Microsoft都会采用这种惯例,将所有加薪或奖金通知全职员工。 OneZero报道说 ,去年,有400多名员工类似地分享了他们的薪水。 每年进行调查的员工主要位于微软华盛顿总部的雷德蒙德。 到2020年8月的最后一天,有310名员工将其数据添加到了电子表格中。 Microsoft在全球拥有超过150,000名员工。

    Image for post

    Employees shared their previous base salary, any cash bonuses, other bonuses paid out in stock, and merit-based increases in salary. This year’s spreadsheet also included two new questions: one asking whether the employee was a person of color, and another asking whether the employee felt marginalized or at risk of being marginalized due to their gender or gender identity. Microsoft’s latest diversity report showed the company was mainly white and male, especially at the highest levels.

    员工共享以前的基本工资,任何现金奖金,以股票支付的其他奖金以及基于绩效的工资增加。 今年的电子表格还包含两个新问题:一个询问员工是否是有色人种,另一个询问员工是否由于性别或性别认同而感到边缘化或有被边缘化的风险。 微软最新的多元化报告显示,该公司主要由白人和男性组成,尤其是在最高级别。

    At Microsoft, like most tech companies, seniority and compensation is based on a person’s level. At Microsoft, the levels start at 59 and go beyond 80. Microsoft’s senior positions start at level 63, according to the crowdsourced tech compensation website Levels.fyi.

    像大多数科技公司一样,在Microsoft,资历和薪酬取决于个人的水平。 在众包技术补偿网站Levels.fyi上 ,微软的级别从59开始并超过80。微软的高级职位从63开始。

    The average entry-level engineer or program manager will have a total compensation of $125,665.

    平均入门级工程师或项目经理的总薪酬为125,665美元。

    The compensation spreadsheet shared with OneZero was obtained from the Young Microsoft FTE group on Facebook, which means the data is skewed toward younger employees. More than 250 of the 310 respondents in this year’s compensation sharing spreadsheet were levels 59 to 62.

    OneZero共享的薪酬电子表格是从Facebook上的Microsoft青年FTE组获得的,这意味着数据偏向年轻员工。 在今年的薪酬共享电子表格中,在310位受访者中,超过250位处于59至62级。

    Based on this year’s respondents, the average entry-level engineer or program manager will have a total compensation of $125,665. A vast majority (87%) of that will come from an average base salary of $111,096, with an average cash award of $10,701 and stock award of $3,867.

    根据今年的受访者,平均入门级工程师或项目经理的总薪酬为125,665美元。 其中绝大多数(87%)将来自平均底薪111,096美元,平均现金奖励10,701美元和股票奖励3,867美元。

    By level 62, stock and cash bonuses start to become a more significant part of annual compensation. That levels’ total compensation sits at an average of $174,962, with a $20,028 cash award and $13,713 stock award on top of a $141,220 base salary.

    到62级时,股票和现金奖金开始成为年度薪酬的重要组成部分。 该级别的总薪酬平均为174,962美元,除了141,220美元的基本工资外,还有20,028美元的现金奖励和13,713美元的股票奖励。

    Image for post
    Image for post

    At level 64, which includes only 11 of the respondents, salary counted for only 72% of an average total compensation of $234,249.

    在64级(仅包括11位受访者)中,薪水仅占平均总薪酬234,249美元的72%。

    A majority — 194 out of 310 — total respondents said they were people of color. Also, 69 respondents reported feeling marginalized or at risk of being marginalized due to their gender or gender identity. In total, 22% of respondents said that their gender or gender identity had or might hinder them at work.

    在310名受访者中,有194名是大多数人,他们是有色人种。 另外,有69位受访者表示由于自己的性别或性别认同而感到被边缘化或有被边缘化的风险。 总共有22%的受访者表示,他们的性别或性别认同已经或可能妨碍他们工作。

    Microsoft dealt with an internal reckoning over harassment and discrimination last year after an internal email chain, in which dozens of women shared their stories of verbal abuse and being sidelined due to their gender, made its way around the company. The company made sweeping changes, including hiring a new team to help employees companywide navigate HR investigations, a new training regimen for managers, and an internal review of pending cases that were overlooked.

    去年,在内部电子邮件链中,数十名妇女分享了自己遭受口头虐待的故事,并且由于性别而被边缘化之后,微软对骚扰和歧视进行了内部清算 。 该公司进行了彻底的更改,包括雇用一个新团队来帮助公司范围内的员工进行人力资源调查,针对经理的新培训方案以及对被忽略的未决案件的内部审查。

    While the sample size is small, this new data shows that some Microsoft employees still feel marginalized within Microsoft’s culture due to their gender identity.

    尽管样本量很小,但这些新数据表明,一些Microsoft员工由于其性别认同,在Microsoft文化中仍然被边缘化。

    While a few hundred employees contributed to this internal sharing of salary information, there are other pools of salary data available online. The largest is Levels.fyi, which has nearly 4,000 entries from Microsoft employees, which date back to 2017.

    虽然数百名员工为这种内部的薪资信息共享做出了贡献,但在线上还有其他薪资数据池。 最大的是Levels.fyi,它拥有近4,000个Microsoft员工的条目,可追溯到2017年。

    Other tech companies have salary sharing drives as well. Former Google employee Erica Joy started an infamous salary sharing spreadsheet at the company, which she chronicled in a Twitter thread in 2015.

    其他科技公司也有薪资共享的动力。 谷歌前员工埃里卡·乔伊(Erica Joy)在该公司创建了一个臭名昭著的薪酬共享电子表格 ,她于2015年在Twitter帖子中进行了编年史。

    翻译自: https://onezero.medium.com/leaked-salary-spreadsheet-reveals-microsoft-employee-earnings-for-a-second-year-d1466132d309

    微软表格数据集

    展开全文
  • 背景Mnist数据集的识别问题可以算得上是——机器学习在视觉领域的hello world了,至少Gemfield这样认为。它的训练集有6万项数据,而测试集有1万项数据(其中前5000个来自最初NIST项目的训练集.,后5000个来自最初...
  • MNIST数据集学习

    2020-04-28 16:14:12
    目录一、MNIST数据介绍首先,我们...本章使用MNIST数据集,这是一组由美国高中生和人口调查局员工手写的70000个数字的图片。每张图像都用其代表的数字标记。这个数据集被广为使用,因此也被称作是机器学习领域的“He...
  • 员工减员数据分析:对公司进行减员数据集的多个分类(KNN,朴素贝叶斯,随机森林,决策树,ANN,SVM),以预测公司对减员的主要贡献从而提高生产率
  • 表演 1“低” 2“好” 3“优秀” 4“优秀” 关系满意度 1“低” 2“中等” 3“高” 4“非常高” 工作平衡 1“坏” 2“好” 3“更好” 4“最佳” 大家可以到官网地址下载数据集,我自己也在百度网盘分享了一份。...
  • 员工离职预测数据集 https://dongfangyou.blog.csdn.net/article/details/109398904
  • kitti数据集仅velodyne数据转rosbag 最近做3D激光雷达,于是在kitti上下了个80g的数据集,发现.bin不会用,想转成rosbag,发现官方推荐的工具似乎还要把相机数据一起下载下来。。 搞了半天,后来找到一个很好的工具...
  • 03多维数据集函数03X01 多维数据集函数说明03X02 全部多维数据集函数列表 03X01 多维数据集函数说明 需要链接到数据源时才可用。 03X02 全部多维数据集函数列表 函数 说明 CUBEKPIMEMBER 函数 返回重要性能...
  • 本项目的数据集来源kaggle竞赛项目:HR-Analytics,自行下载即可! 1.提出问题 公司当中员工们离职的原因是什么? 什么样的员工会离职呢? 2.读取数据,理解数据 导入数据分析工具包,这次我们用seaborn库来优化我们...
  • 人力资源数据集名称:IBM HR Analytics员工流失与绩效目的:预测有价值员工的流失描述:发现导致员工流失的因素,并探讨重要问题,例如“按工作角色和距离显示离家距离的细分减员”或“按教育程度和减员率比较平均...
  • 该项目旨在建立一个分类器,该分类器可以基于公共的安然财务和电子邮件数据集来预测安然员工涉及欺诈的情况。 有关安然丑闻的更多详细信息,请参见 。 工作流程 该项目分为3个主要阶段: 功能选择和工程 算法选择 ...
  • (1)Age:员工年龄 (2)Attrition:员工是否已经离职,1表示已经离职,2表示未离职,这是目标预测值; (3)BusinessTravel:商务差旅频率,Non-Travel表示不出差,Travel_Rarely表示不经常出差,Travel_...
  • mnist数据集读取并保存为Numpy数组

    千次阅读 2018-04-02 10:16:08
    背景信息MNIST数据集简介MNIST数据集是从 NIST 的Special Database 3(SD-3)和Special Database 1(SD-1)构建而来。由于SD-3是由美国人口调查局的员工进行标注,SD-1是由美国高中生进行标注,因此SD-3比SD-1更...
  • MNIST数据集是一组由美国高中生和人口调查局员工手写的70000个数字的图片,每个图片有784个特征,即28*28的像素点。每张图像都用其代表的数字标记。此数据集堪称机器学习领域的“hello world”。 那么我们如何使用该...
  • report中跨数据集取数

    2011-03-03 10:46:00
    例如有销售和生产两个数据集,销售中有销售数量,日期和员工,生产中有生产数量,日期和员工,现在我需要把销售数量和生产数量同时展现在一个表中。我们可以使用 Lookup 从指定的数据集中为具有一对一关系的名称-值对...
  • 在计划结束时,基于各种因素,例如培训绩效,KPI完成(仅考虑KPI大于60%的员工)等,员工才能晋升 他们提供了有关员工过去和当前表现以及人口统计的多个属性。 现在,任务是预测在评估过程之后是否会提升测试集中...
  • 数据介绍:本章使用MNIST数据集,这是一组由美国高中生和人口调查局员工手写的70000个数字的图片。每张图像都用其代表的数字标记。这个数据集被广为使用,因此也被称作是机器学习领域的“Hello World”:但凡有人想到...
  • 优达学诚--对安然事件数据集的分析

    千次阅读 2019-01-25 15:55:24
    我们之所以选择使用安然事件的数据集来做机器学习的项目,是因为我们已经有安然的电子邮件数据库,它包含150名前安然员工之间的50万封电子邮件,主要是高级管理人员。这也是唯一的大型公共的真实邮件数据库。 感兴趣...
  • 由于每个小节都会用到数据集,所以先在此整理一份,最后这一系列结束的时候,会把所有章节的练习题目单独拿出来让大家来做练习,敬请期待。 我们一起来看下数据集 这份数据集,是来自一家自行车连锁商店,主要是有 ...
  • 小伙伴们好啊,今天咱们来分享一个数据整理的实例。...首先来看看K列姓名的规律:每个姓名之间都间隔一行:利用这个规律,咱们就可以在“考勤整理”工作表里,使用公式提取员工姓名了。在“考勤整理”工作...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 780
精华内容 312
关键字:

员工数据集