python 灵云平台

2016-08-15 16:31:15 weixin_33713350 阅读数 99

源码

GitHub

在线语音识别

SDK下载

灵云SDK下载

SDK集成

下载SDK以后,将jar和so导入工程

权限

<uses-permission android:name="android.permission.INTERNET" />
<uses-permission android:name="android.permission.WRITE_EXTERNAL_STORAGE" />
<uses-permission android:name="android.permission.ACCESS_NETWORK_STATE" />
<uses-permission android:name="android.permission.SYSTEM_ALERT_WINDOW" />
<uses-permission android:name="android.permission.ACCESS_COARSE_LOCATION" />
<uses-permission android:name="android.permission.ACCESS_FINE_LOCATION" />
<uses-permission android:name="android.permission.RECORD_AUDIO" />

封装

灵云配置类

package kong.qingwei.kqwhcidemo;

/**
 * Created by kqw on 2016/8/12.
 * 灵云配置信息
 */
public final class ConfigUtil {

    /**
     * 灵云APP_KEY
     */
    public static final String APP_KEY = "3d5d5466";

    /**
     * 开发者密钥
     */
    public static final String DEVELOPER_KEY = "eca643ff7b3c758745d7cf516e808d34";

    /**
     * 灵云云服务的接口地址
     */
    public static final String CLOUD_URL = "test.api.hcicloud.com:8888";

    /**
     * 需要运行的灵云能力
     */
    public static final String CAP_KEY = "tts.local.synth";
    //    public static final String CAP_KEY = "tts.cloud.wangjing";
    public static final String CAP_KEY_NUL = "nlu.cloud";
}

初始化灵云语音能力的工具类

package kong.qingwei.kqwhcidemo;

import android.app.Activity;
import android.os.Environment;
import android.util.Log;
import android.widget.Toast;

import com.sinovoice.hcicloudsdk.api.HciCloudSys;
import com.sinovoice.hcicloudsdk.common.AuthExpireTime;
import com.sinovoice.hcicloudsdk.common.HciErrorCode;
import com.sinovoice.hcicloudsdk.common.InitParam;

import java.io.File;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.Locale;

/**
 * Created by kqw on 2016/8/12.
 * 初始化灵云语音
 */
public class HciUtil {

    private static final String TAG = "HciUtil";
    private Activity mActivity;
    private final String mConfigStr;

    public HciUtil(Activity activity) {
        mActivity = activity;

        // 加载信息,返回InitParam, 获得配置参数的字符串
        InitParam initParam = getInitParam();
        mConfigStr = initParam.getStringConfig();
    }

    public boolean initHci() {
        // 初始化
        int errCode = HciCloudSys.hciInit(mConfigStr, mActivity);
        if (errCode != HciErrorCode.HCI_ERR_NONE && errCode != HciErrorCode.HCI_ERR_SYS_ALREADY_INIT) {
            Toast.makeText(mActivity, "hciInit error: " + HciCloudSys.hciGetErrorInfo(errCode), Toast.LENGTH_SHORT).show();
            return false;
        }

        // 获取授权/更新授权文件 :
        errCode = checkAuthAndUpdateAuth();
        if (errCode != HciErrorCode.HCI_ERR_NONE) {
            // 由于系统已经初始化成功,在结束前需要调用方法hciRelease()进行系统的反初始化
            Toast.makeText(mActivity, "CheckAuthAndUpdateAuth error: " + HciCloudSys.hciGetErrorInfo(errCode), Toast.LENGTH_SHORT).show();
            HciCloudSys.hciRelease();
            return false;
        }
        return true;
    }

    /**
     * 释放
     */
    public void hciRelease(){
        HciCloudSys.hciRelease();
    }

    /**
     * 加载初始化信息
     *
     * @return 系统初始化参数
     */
    private InitParam getInitParam() {
        String authDirPath = mActivity.getFilesDir().getAbsolutePath();
        // 前置条件:无
        InitParam initparam = new InitParam();
        // 授权文件所在路径,此项必填
        initparam.addParam(InitParam.AuthParam.PARAM_KEY_AUTH_PATH, authDirPath);
        // 是否自动访问云授权,详见 获取授权/更新授权文件处注释
        initparam.addParam(InitParam.AuthParam.PARAM_KEY_AUTO_CLOUD_AUTH, "no");
        // 灵云云服务的接口地址,此项必填
        initparam.addParam(InitParam.AuthParam.PARAM_KEY_CLOUD_URL, ConfigUtil.CLOUD_URL);
        // 开发者Key,此项必填,由捷通华声提供
        initparam.addParam(InitParam.AuthParam.PARAM_KEY_DEVELOPER_KEY, ConfigUtil.DEVELOPER_KEY);
        // 应用Key,此项必填,由捷通华声提供
        initparam.addParam(InitParam.AuthParam.PARAM_KEY_APP_KEY, ConfigUtil.APP_KEY);
        // 配置日志参数
        String sdcardState = Environment.getExternalStorageState();
        if (Environment.MEDIA_MOUNTED.equals(sdcardState)) {
            String sdPath = Environment.getExternalStorageDirectory().getAbsolutePath();
            String packageName = mActivity.getPackageName();
            String logPath = sdPath + File.separator + "sinovoice" + File.separator + packageName + File.separator + "log" + File.separator;
            // 日志文件地址
            File fileDir = new File(logPath);
            if (!fileDir.exists()) {
                fileDir.mkdirs();
            }
            // 日志的路径,可选,如果不传或者为空则不生成日志
            initparam.addParam(InitParam.LogParam.PARAM_KEY_LOG_FILE_PATH, logPath);
            // 日志数目,默认保留多少个日志文件,超过则覆盖最旧的日志
            initparam.addParam(InitParam.LogParam.PARAM_KEY_LOG_FILE_COUNT, "5");
            // 日志大小,默认一个日志文件写多大,单位为K
            initparam.addParam(InitParam.LogParam.PARAM_KEY_LOG_FILE_SIZE, "1024");
            // 日志等级,0=无,1=错误,2=警告,3=信息,4=细节,5=调试,SDK将输出小于等于logLevel的日志信息
            initparam.addParam(InitParam.LogParam.PARAM_KEY_LOG_LEVEL, "5");
        }
        return initparam;
    }

    /**
     * 获取授权
     *
     * @return 授权结果
     */
    private int checkAuthAndUpdateAuth() {
        // 获取系统授权到期时间
        int initResult;
        AuthExpireTime objExpireTime = new AuthExpireTime();
        initResult = HciCloudSys.hciGetAuthExpireTime(objExpireTime);
        if (initResult == HciErrorCode.HCI_ERR_NONE) {
            // 显示授权日期,如用户不需要关注该值,此处代码可忽略
            Date date = new Date(objExpireTime.getExpireTime() * 1000);
            SimpleDateFormat sdf = new SimpleDateFormat("yyyy-MM-dd", Locale.CHINA);
            Log.i(TAG, "expire time: " + sdf.format(date));
            if (objExpireTime.getExpireTime() * 1000 > System.currentTimeMillis()) {
                // 已经成功获取了授权,并且距离授权到期有充足的时间(>7天)
                Log.i(TAG, "checkAuth success");
                return initResult;
            }
        }
        // 获取过期时间失败或者已经过期
        initResult = HciCloudSys.hciCheckAuth();
        if (initResult == HciErrorCode.HCI_ERR_NONE) {
            Log.i(TAG, "checkAuth success");
            return initResult;
        } else {
            Log.e(TAG, "checkAuth failed: " + initResult);
            return initResult;
        }
    }
}

语音识别的类

package kong.qingwei.kqwhcidemo;

import android.app.Activity;
import android.util.Log;

import com.sinovoice.hcicloudsdk.android.asr.recorder.ASRRecorder;
import com.sinovoice.hcicloudsdk.common.asr.AsrConfig;
import com.sinovoice.hcicloudsdk.common.asr.AsrInitParam;
import com.sinovoice.hcicloudsdk.common.asr.AsrRecogResult;
import com.sinovoice.hcicloudsdk.recorder.ASRRecorderListener;
import com.sinovoice.hcicloudsdk.recorder.RecorderEvent;


/**
 * Created by kqw on 2016/8/15.
 * 语音识别类
 */
public class AsrUtil {

    private static final String TAG = "AsrUtil";
    private Activity mActivity;
    private ASRRecorder mAsrRecorder;
    private AsrConfig asrConfig;
    private OnAsrRecogListener mOnAsrRecogListener;

    public AsrUtil(Activity activity) {
        mActivity = activity;
        initAsr();
    }

    private void initAsr() {
        Log.i(TAG, "initAsr: ");
        // 初始化录音机
        mAsrRecorder = new ASRRecorder();

        // 配置初始化参数
        AsrInitParam asrInitParam = new AsrInitParam();
        String dataPath = mActivity.getFilesDir().getPath().replace("files", "lib");
        asrInitParam.addParam(AsrInitParam.PARAM_KEY_INIT_CAP_KEYS, ConfigUtil.CAP_KEY_ASR_CLOUD_FREETALK);
        asrInitParam.addParam(AsrInitParam.PARAM_KEY_DATA_PATH, dataPath);
        asrInitParam.addParam(AsrInitParam.PARAM_KEY_FILE_FLAG, AsrInitParam.VALUE_OF_PARAM_FILE_FLAG_ANDROID_SO);
        Log.v(TAG, "init parameters:" + asrInitParam.getStringConfig());

        // 设置初始化参数
        mAsrRecorder.init(asrInitParam.getStringConfig(), new ASRResultProcess());

        // 配置识别参数
        asrConfig = new AsrConfig();
        // PARAM_KEY_CAP_KEY 设置使用的能力
        asrConfig.addParam(AsrConfig.SessionConfig.PARAM_KEY_CAP_KEY, ConfigUtil.CAP_KEY_ASR_CLOUD_FREETALK);
        // PARAM_KEY_AUDIO_FORMAT 音频格式根据不同的能力使用不用的音频格式
        asrConfig.addParam(AsrConfig.AudioConfig.PARAM_KEY_AUDIO_FORMAT, AsrConfig.AudioConfig.VALUE_OF_PARAM_AUDIO_FORMAT_PCM_16K16BIT);
        // PARAM_KEY_ENCODE 音频编码压缩格式,使用OPUS可以有效减小数据流量
        asrConfig.addParam(AsrConfig.AudioConfig.PARAM_KEY_ENCODE, AsrConfig.AudioConfig.VALUE_OF_PARAM_ENCODE_SPEEX);
        // 其他配置,此处可以全部选取缺省值

        asrConfig.addParam("intention", "weather");
    }

    /**
     * 开始语音识别
     */
    public void start(OnAsrRecogListener listener) {
        mOnAsrRecogListener = listener;
        if (mAsrRecorder.getRecorderState() == ASRRecorder.RECORDER_STATE_IDLE) {
            asrConfig.addParam(AsrConfig.SessionConfig.PARAM_KEY_REALTIME, "no");
            mAsrRecorder.start(asrConfig.getStringConfig(), null);
        } else {
            Log.i(TAG, "start: 录音机未处于空闲状态,请稍等");
        }
    }

    private class ASRResultProcess implements ASRRecorderListener {
        @Override
        public void onRecorderEventError(RecorderEvent event, int errorCode) {
            Log.i(TAG, "onRecorderEventError: errorCode = " + errorCode);
            if (null != mOnAsrRecogListener) {

                mOnAsrRecogListener.onError(errorCode);
            }
        }

        @Override
        public void onRecorderEventRecogFinsh(RecorderEvent recorderEvent, final AsrRecogResult arg1) {
            if (recorderEvent == RecorderEvent.RECORDER_EVENT_RECOGNIZE_COMPLETE) {
                Log.i(TAG, "onRecorderEventRecogFinsh: 识别结束");
            }
            if (null != mOnAsrRecogListener) {
                mActivity.runOnUiThread(new Runnable() {
                    @Override
                    public void run() {
                        mOnAsrRecogListener.onAsrRecogResult(arg1);
                    }
                });
            }
        }

        @Override
        public void onRecorderEventStateChange(RecorderEvent recorderEvent) {
            if (recorderEvent == RecorderEvent.RECORDER_EVENT_BEGIN_RECORD) {
                Log.i(TAG, "onRecorderEventStateChange: 开始录音");
            } else if (recorderEvent == RecorderEvent.RECORDER_EVENT_BEGIN_RECOGNIZE) {
                Log.i(TAG, "onRecorderEventStateChange: 开始识别");
            } else if (recorderEvent == RecorderEvent.RECORDER_EVENT_NO_VOICE_INPUT) {
                Log.i(TAG, "onRecorderEventStateChange: 无音频输入");
            } else {
                Log.i(TAG, "onRecorderEventStateChange: recorderEvent = " + recorderEvent);
            }
        }

        @Override
        public void onRecorderRecording(byte[] volumedata, int volume) {
            if (null != mOnAsrRecogListener) {
                mOnAsrRecogListener.onVolume(volume);
            }
        }

        @Override
        public void onRecorderEventRecogProcess(RecorderEvent recorderEvent, AsrRecogResult arg1) {
            if (recorderEvent == RecorderEvent.RECORDER_EVENT_RECOGNIZE_PROCESS) {
                Log.i(TAG, "onRecorderEventRecogProcess: 识别中间反馈");
            }
            if (arg1 != null) {
                if (arg1.getRecogItemList().size() > 0) {
                    Log.i(TAG, "onRecorderEventRecogProcess: 识别中间结果结果为:" + arg1.getRecogItemList().get(0).getRecogResult());
                } else {
                    Log.i(TAG, "onRecorderEventRecogProcess: 未能正确识别,请重新输入");
                }
            }
        }
    }

    /**
     * 语音识别的回调接口
     */
    public interface OnAsrRecogListener {
        // 识别结果
        void onAsrRecogResult(AsrRecogResult asrRecogResult);

        // 识别错误码
        void onError(int errorCode);

        // 录音音量
        void onVolume(int volume);
    }
}

使用

初始化灵云的语音能力和语音识别

// 灵云语音工具类
mInitTts = new HciUtil(this);
// 初始化灵云语音
boolean isInitHci = mInitTts.initHci();
if (isInitHci) { // 初始化成功
    ……
    // 语音识别
    mAsrUtil = new AsrUtil(this);
}

语音识别

/**
 * 语音识别(语音转文字)
 *
 * @param view view
 */
public void asr(View view) {
    mAsrUtil.start(new AsrUtil.OnAsrRecogListener() {
        @Override
        public void onAsrRecogResult(AsrRecogResult asrRecogResult) {
            StringBuilder stringBuffer = new StringBuilder();
            ArrayList<AsrRecogItem> asrRecogItemArrayList = asrRecogResult.getRecogItemList();
            for (AsrRecogItem asrRecogItem : asrRecogItemArrayList) {
                String result = asrRecogItem.getRecogResult();
                Log.i(TAG, "onAsrRecogResult: " + result);
                stringBuffer.append(result).append("\n");
            }
            showDialog("识别结果", stringBuffer.toString());
        }

        @Override
        public void onError(int errorCode) {
            Log.i(TAG, "onError: " + errorCode);
        }

        @Override
        public void onVolume(int volume) {
            Log.i(TAG, "onVolume: " + volume);
        }
    });
}

离线语音识别

离线命令词和在线很类似,只需要更改CapKey,导入离线资源包即可,我们先下载离线资源

下载完解压

解压后的源文件png

将里面所有的文件重命名,前面加lib,后面加.so,然后导入工程

重命名

修改CapKey为asr.local.freetalk

注意,灵云的离线语音功能第一次使用需要联网激活,激活以后才可以使用离线功能。

在线语音识别 + 语义理解

直接在在线语音识别的基础上实现语义理解更加简单,只要将CapKey换成asr.cloud.dialog即可

但是需要注意一点的是,想要使用哪个场景,必须开通以后,在参数里加上对应的场景,才是识别出来。

类似这样

asrConfig.addParam("intention", "weather");
2018-05-02 23:12:27 xudailong_blog 阅读数 1321

写在前面

通过使用pandas对智联招聘上的数据进行分析,进一步的了解,熟悉pandas为后面学习数据挖掘打基础

更多学习链接可访问主页:
https://blog.csdn.net/xudailong_blog

运行环境:

python3 ,jupyter notebook

## 下面为jupyter notebook上代码(含详细注释) # 数据表基本信息(维度,列名称,数据格式,所占空间) df.info()

    <class 'pandas.core.frame.DataFrame'>
    RangeIndex: 4541 entries, 0 to 4540
    Data columns (total 7 columns):
    address     4453 non-null object
    company     4541 non-null object
    job_info    4541 non-null object
    job_link    4541 non-null object
    job_name    4541 non-null object
    job_tags    4541 non-null object
    salary      4541 non-null float64
    dtypes: float64(1), object(6)
    memory usage: 248.4+ KB



```python




<div class="se-preview-section-delimiter"></div>

# 每一列数据的格式
df.dtypes




<div class="se-preview-section-delimiter"></div>
address object company object job_info object job_link object job_name object job_tags object salary float64 dtype: object




<div class="se-preview-section-delimiter"></div>

# 某一列格式
df['job_name'].dtype




<div class="se-preview-section-delimiter"></div>
dtype(‘O’)




<div class="se-preview-section-delimiter"></div>

# 空值
df.isnull()




<div class="se-preview-section-delimiter"></div>
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary
0 False False False False False False False
1 False False False False False False False
2 False False False False False False False
3 False False False False False False False
4 False False False False False False False
5 False False False False False False False
6 False False False False False False False
7 False False False False False False False
8 False False False False False False False
9 False False False False False False False
10 False False False False False False False
11 False False False False False False False
12 False False False False False False False
13 False False False False False False False
14 False False False False False False False
15 False False False False False False False
16 False False False False False False False
17 False False False False False False False
18 False False False False False False False
19 False False False False False False False
20 False False False False False False False
21 False False False False False False False
22 False False False False False False False
23 False False False False False False False
24 False False False False False False False
25 False False False False False False False
26 False False False False False False False
27 False False False False False False False
28 False False False False False False False
29 False False False False False False False
4511 False False False False False False False
4512 False False False False False False False
4513 False False False False False False False
4514 False False False False False False False
4515 False False False False False False False
4516 False False False False False False False
4517 False False False False False False False
4518 False False False False False False False
4519 False False False False False False False
4520 False False False False False False False
4521 False False False False False False False
4522 False False False False False False False
4523 False False False False False False False
4524 False False False False False False False
4525 False False False False False False False
4526 False False False False False False False
4527 False False False False False False False
4528 False False False False False False False
4529 False False False False False False False
4530 False False False False False False False
4531 False False False False False False False
4532 False False False False False False False
4533 False False False False False False False
4534 False False False False False False False
4535 False False False False False False False
4536 False False False False False False False
4537 False False False False False False False
4538 False False False False False False False
4539 False False False False False False False
4540 False False False False False False False

4541 rows × 7 columns





<div class="se-preview-section-delimiter"></div>

# 某一列的格式
df.dtypes




<div class="se-preview-section-delimiter"></div>
address      object
company      object
job_info     object
job_link     object
job_name     object
job_tags     object
salary      float64
dtype: object




<div class="se-preview-section-delimiter"></div>

# 查看某一列的唯一值
df['job_tags'].unique()




<div class="se-preview-section-delimiter"></div>
array(['五险一金;年底双薪;绩效奖金;加班补助;交通补助;餐补;采暖补贴;定期体检',
       '五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作',
       '五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助', ...,
       '创业公司;周末双休;五险一金;带薪年假;弹性工作;通讯补贴',
       '14薪;健身俱乐部;周末双休;五险一金;餐补;带薪年假;弹性工作;补充医疗保险', '五险一金;股票期权'], dtype=object)




<div class="se-preview-section-delimiter"></div>

# 查看数据表的值
df.values




<div class="se-preview-section-delimiter"></div>
array([['北京市朝阳区裕民路12号 中国国际科技会展中心A座10层', '大连飞创信息技术有限公司',
        '岗位职责:1、按照有关制度和规范的要求,承担代码的编写工作。对开发任务、需求理解透彻,积极配合测试团队开展集成测试工作;2、按照有关制度和规范的要求,参与项目和产品的详细设计工作,并编写设计文档、操作手册;3、可在一定程度上指导初级别开发人员完成相关研发工作。与同事之间进行技术交流,知识共享;4、前沿技术研究,难点攻关。任职要求:1、IT方面学士或学士以上学历;2、工作经验不限;3、掌握C/C++编程, 基本功扎实;4、熟练掌握STL、boost、apr、ACE库中的一种;5、熟悉常用数据结构、算法;6、熟悉TCP/IP协议,熟练掌握Socket编程;7、熟练掌握多线程编程,对并发控制有深入理解;8、熟悉Linux系统,了解Linux C/C++开发、调试工具gcc,g++,gdb,make;9、熟悉Windows图形界面开发技术MFC或WTL,熟练使用开发工具VisualC++。',
        ..., 'C++开发工程师', '五险一金;年底双薪;绩效奖金;加班补助;交通补助;餐补;采暖补贴;定期体检', 17500.0],
       ['丰台区航丰路一号时代财富天地大厦28层', '深圳市八斗才数据有限公司',
        '岗位职责:1、 负责互联网网站产品开发;2、 参与产品设计、架构设计和代码编写;3、 负责问题排查、调试、性能调优等开发相关工作。岗位要求:1、 本科及以上学历2、 学习能力强;3、 精通Python,有2年以上开发经验;4、 熟悉Django开发框架;5、 了解HTML5,JavaScript,CSS3 等前端技术;6、 熟悉MySQL、MongoDB数据库、数据建模、数据处理调优;7、 熟悉Linux环境下的开发环境;8、 熟练掌握git代码管理工具和敏捷开发流程;9、 习惯阅读英文技术文档;10、富有团队合作精神,乐于接受挑战,能承受工作压力。',
        ..., 'python开发工程师(北京)',
        '五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作', 14000.0],
       ['北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦', '深圳市芒柠科技有限公司',
        '岗位职责:1、维护现有的平台代码。2、参与项目的架构设计,明确负责开发部分的设计需求。3、按照设计要求和源代码编写规范编写程序代码,对其质量、性能负责。4、编写相关技术文档,负责进行开发阶段的软件测试,包括:单元测试、集成测试。5、产品上线后,配合运维团队保障运营平台的稳定,解决相关技术问题。任职要求:1、熟悉Linux系统操作,精通Python语言开发,同时有C++语言开发经验优先。2、熟悉Gevent/Eventlet 和常用web框架(cherrypy,tornado)优先考虑。3、熟悉网络编程,熟悉Socket、TCP/IP、HTTP及相关标准。4、熟练使用Mysql, 熟练使用Couchbase, Memcache, Redis。5、熟悉常用数据结构和算法。6、熟悉软件开发流程,具备独立开发调试,测试等实践能力。7、具有良好的沟通能力、团队合作能力和创新精神,具备较好的文档创作能力,能承受一定的工作压力。8、有较强的英文读写能力。',
        ..., 'python开发工程师(北京)',
        '五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助', 12500.0],
       ..., 
       ['北京市东城区灯市口大街33号国中商业大厦423室', '北京树优信息技术有限公司',
        '工作职责:    1 负责或参与流体分析技术服务项目2 负责或参与流体优化技术服务项目3 负责软件售前/售后技术支持服务任职要求:1 具有责任感,较强的沟通能力和发现问题与解决问题能力2 具有1~2年或以上的工程应用经验,如汽车热管理、除霜除雾、气动噪声计算、船舶阻力计算、航空航天、电子等领域的CFD分析和优化3 熟练使用至少一种CAD建模工具(如UG,ProE,Catia,Rihno, NAPA等)和前处理软件(如hypermesh,ANSA,tgrid等)进行几何修补和建模处理4 具有通用CFD软件(如Xflow, Fluent,StarCCM+,Shipflow, NUMECA, CFX等)的学习和应用经验5 最好有优化软件(如 Isight,PIAnO, CAESES, Sculptor,TOSCA等)的学习和应用经验6 最好具有DEM离散元软件(如EDEM, StreamDEM等)的学习和应用经验7 最好具有用VB、C、C++、PCL、Python、APDL等相关语言进行二次开发经验8 具有良好的中英文文献调研和报告论文的撰写能力',
        ..., '流体力学仿真优化工程师', '五险一金;绩效奖金;加班补助;交通补助;房补;带薪年假;员工旅游;节日福利', 7000.0],
       ['朝阳区来广营叶青大厦北园308', '北京行易道科技有限公司',
        '岗位职责:1、进行高可靠高安全嵌入式软件测试,包含代码测试、功能测试、性能测试、安全性测试等;2、编写测试计划、规划详细的测试方案、编写测试用例;3、根据测试计划搭建和维护测试环境;4、执行测试工作,提交测试报告。包括编写用于测试的自动测试脚本,完整地记录测试结果,编写完整的测试报告等相关的技术文档;5、对测试中发现的问题进行详细分析和准确定位,与开发人员讨论缺陷解决方案;6、提出对产品的进一步改进的建议,并评估改进方案是否合理;对测试结果进行总结与统计分析,对测试进行跟踪,并提出反馈意见;7、为业务部门提供相应技术支持,确保软件质量指标。任职资格:1)计算机、汽车等相关专业本科以上学历,2年以上测试工作经验;2)具有计算机嵌入式编程、软件测试、系统集成等相关基础知识;3)熟练掌握C语言,理解能力强,善于阅读并理解代码,正确理解开发文档并编写用例;4)熟练掌握至少1门脚本语言(Tcl,PYTHON、SHELL等);5)有责任心、踏实、努力,具有良好的沟通能力、表达能力与逻辑思维能力;工作认真细致、善于思考、勤于学习;',
        ..., '嵌入式软件测试工程师', '14薪;健身俱乐部;周末双休;五险一金;餐补;带薪年假;弹性工作;补充医疗保险',
        10500.0],
       ['东城区王府井东街8号 澳门中心B1层funwork', '睿医(北京)数据技术有限公司',
        '职位描述:1.根据项目需求,独立完成各类型的临床数据的统计分析工作2.参与产品统计模块的功能设计和测试3.根据产品、应用方向,对医疗大数据整体进行统计分析及数据挖掘岗位要求1.卫生统计、流行病学、统计学、应用统计等相关专业背景,硕士及以上学历;至少1年以上统计师、SAS Programmer、医疗行业数据分析等相关工作经验2.有临床经验优先,有医疗/健康数据分析及建模的经验优先3.熟悉医学研究相关的统计方法;熟练掌握至少一门统计编程软件:SAS、R、Python、Stata;4.熟悉临床研究思路、方案设计、样本量计算、随机方案等;5.良好的学习能力、逻辑思维和语言表达能力。',
        ..., '医学统计经理', '五险一金;股票期权', 22500.0]], dtype=object)




<div class="se-preview-section-delimiter"></div>

# 查看列名称
df.columns




<div class="se-preview-section-delimiter"></div>
Index(['address', 'company', 'job_info', 'job_link', 'job_name', 'job_tags',
       'salary'],
      dtype='object')




<div class="se-preview-section-delimiter"></div>

# 查看前10行,后10行数据




<div class="se-preview-section-delimiter"></div>

# 默认前10行数据
df.head()




<div class="se-preview-section-delimiter"></div>

# 默认后10行数据




<div class="se-preview-section-delimiter"></div>

# df.tail()




<div class="se-preview-section-delimiter"></div>
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary
0 北京市朝阳区裕民路12号 中国国际科技会展中心A座10层 大连飞创信息技术有限公司 岗位职责:1、按照有关制度和规范的要求,承担代码的编写工作。对开发任务、需求理解透彻,积极配… https://m.zhaopin.com//jobs/210653218250637/ C++开发工程师 五险一金;年底双薪;绩效奖金;加班补助;交通补助;餐补;采暖补贴;定期体检 17500.0
1 丰台区航丰路一号时代财富天地大厦28层 深圳市八斗才数据有限公司 岗位职责:1、 负责互联网网站产品开发;2、 参与产品设计、架构设计和代码编写;3、 负责问… https://m.zhaopin.com//jobs/cz562550030j000298… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 14000.0
2 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市芒柠科技有限公司 岗位职责:1、维护现有的平台代码。2、参与项目的架构设计,明确负责开发部分的设计需求。3、按… https://m.zhaopin.com//jobs/cz466965980j000547… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助 12500.0
3 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市源极光科技有限公司 技术要求:1、精通Python语言,熟悉Python多线程 socket通信机制;2、精通流… https://m.zhaopin.com//jobs/cz897833860j000551… python工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;年底双薪;带薪年假;弹性工作;员工旅游 12500.0
4 海淀区中关村软件园11号楼大洋大厦 深圳市芒柠科技有限公司 岗位职责:1. 负责云平台应用的开发维护;2. 负责服务器端API的设计与开发。岗位要求:1… https://m.zhaopin.com//jobs/cz730936640j000955… Python开发工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;员工旅游;带薪年假;弹性工作;节日福利 12500.0




<div class="se-preview-section-delimiter"></div>

# 数据表清洗工作
df.fillna(value=0)




<div class="se-preview-section-delimiter"></div>
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary
0 北京市朝阳区裕民路12号 中国国际科技会展中心A座10层 大连飞创信息技术有限公司 岗位职责:1、按照有关制度和规范的要求,承担代码的编写工作。对开发任务、需求理解透彻,积极配… https://m.zhaopin.com//jobs/210653218250637/ C++开发工程师 五险一金;年底双薪;绩效奖金;加班补助;交通补助;餐补;采暖补贴;定期体检 17500.0
1 丰台区航丰路一号时代财富天地大厦28层 深圳市八斗才数据有限公司 岗位职责:1、 负责互联网网站产品开发;2、 参与产品设计、架构设计和代码编写;3、 负责问… https://m.zhaopin.com//jobs/cz562550030j000298… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 14000.0
2 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市芒柠科技有限公司 岗位职责:1、维护现有的平台代码。2、参与项目的架构设计,明确负责开发部分的设计需求。3、按… https://m.zhaopin.com//jobs/cz466965980j000547… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助 12500.0
3 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市源极光科技有限公司 技术要求:1、精通Python语言,熟悉Python多线程 socket通信机制;2、精通流… https://m.zhaopin.com//jobs/cz897833860j000551… python工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;年底双薪;带薪年假;弹性工作;员工旅游 12500.0
4 海淀区中关村软件园11号楼大洋大厦 深圳市芒柠科技有限公司 岗位职责:1. 负责云平台应用的开发维护;2. 负责服务器端API的设计与开发。岗位要求:1… https://m.zhaopin.com//jobs/cz730936640j000955… Python开发工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;员工旅游;带薪年假;弹性工作;节日福利 12500.0
5 北京市海淀区苏州街3号大恒科技大厦南座17层 北京乐学创想教育科技有限公司 岗位职责:1、题库全栈开发和维护,包括需求分析、技术改进、后期维护2、构建数据分析模型,对视… https://m.zhaopin.com//jobs/244101282250512/ Python工程师 节日福利;五险一金;餐补;创业公司 22500.0
6 北京市朝阳区来广营中街甲1号朝来科技产业园创远路36号院4-6号楼 北京尚德在线教育科技有限公司 岗位职责:1、负责公司电商平台如天猫微店、京东、苏宁等商城日常的运营管理,包括店铺整体策划、… https://m.zhaopin.com//jobs/424628486272009/ python自动化 创业公司;无试用期;绩效奖金;不加班 1500.0
7 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 职位职责:1. 基于 Python 的分布式集群管理软件开发2. 基于 Web 的工具软… https://m.zhaopin.com//jobs/567369733250977/ Python实习生 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 9000.0
8 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 工作方向openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等技术要… https://m.zhaopin.com//jobs/567369733250978/ Python开发实习(接受零基础) 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 9000.0
9 北京市海淀区上地农大南路88号万霖大厦3层 北京云纵信息技术有限公司 岗位职责:1)负责业务系统运行环境的基础服务管理,系统架构的维护;2)参与基于大数据平台的维… https://m.zhaopin.com//jobs/311289936253904/ linux运维工程师(熟练python) 节日福利;五险一金;绩效奖金;加班补助;交通补助;餐补;带薪年假;健身俱乐部 23000.0
10 后沙峪安庆大街巨鸿大厦A座5层 天津狮桥国际物流有限公司 一、岗位职责:1、搭建系统开发环境,完成系统框架和核心代码的实现,负责解决开发过程中的技术问… https://m.zhaopin.com//jobs/670247822251376/ Python软件开发工程师 五险一金;绩效奖金;包住;餐补;通讯补贴;带薪年假 15000.0
11 北京市海淀区互联网金融中心21层 北京融七牛信息技术有限公司 岗位职责:1. 负责天机风控系统模型在线服务的架构设计、优化和研发工作; 2. 负责线上服务… https://m.zhaopin.com//jobs/435840920250697/ 高级python研发工程师(000650) 五险一金;绩效奖金;餐补;通讯补贴;补充医疗保险;定期体检;节日福利 32500.0
12 北京市朝阳区工体 北京科锐国际人力资源股份有限公司 岗位职责:1. 基于公司CRM系统 的产品研发、以及项目开发;2. 公司内部电商平台开发工作… https://m.zhaopin.com//jobs/263940938259405/ 直聘软件研发(Golang , Python, Ruby) 节日福利;周末双休;五险一金;年底双薪;绩效奖金;年终分红;补充医疗保险;定期体检 17500.0
13 北京市海淀区西北旺东路10号院东区1号楼领创空间2层204A 北京彼速信息技术有限公司 职位要求:1.本科以上学历,计算机相关专业;2.熟悉B/S软件结构;3. 精通C#,熟练掌握… https://m.zhaopin.com//jobs/136473062250465/ C#/Asp.Net高级软件工程师 五险一金 15000.0
14 北京市东城区和平里东街11号雍和航星园三号楼一层 浙江齐聚科技有限公司北京分公司 1. 负责产品功能性需求的开发、维护。2. 负责优化系统的性能和稳定性3. 能独立完成个人承… https://m.zhaopin.com//jobs/32922521700041200311/ 高级java工程师 25000.0
15 (中关村)北京市海淀区王庄路1号清华同方科技广场A座17层 北京固鸿科技有限公司 岗位职责:1、负责公司软件系统集成开发;2、按规范编写系统需求、概要设计、详细设计及系统部署… https://m.zhaopin.com//jobs/137279958250759/ Windows C++软件开发工程师 五险一金;年终分红;交通补助;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 15000.0
16 马尼拉分公司 皇室科技有限公司 只要你有能力,薪资不是问题!只要你有能力,薪资不是问题!任职要求1、计算机及相关专业,国家统… https://m.zhaopin.com//jobs/cz735252640j001365… php工程师/php程序员/php 住房补贴;每年多次调薪;健身俱乐部;包吃;包住;房补;通讯补贴;带薪年假 20000.0
17 北京市朝阳区北京市朝阳区广渠路3号竞园图片产业园1号库 Forgame–云游控股集团 岗位职责:1、负责在线娃娃机的管理后台系统的研发2、负责统计后台搭建 3、负责监控后台搭建1… https://m.zhaopin.com//jobs/571816225250634/ python后台研发工程师 25000.0
18 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 职位职责:1、负责产品的服务端开发;2、负责优化产品的性能,根据产品设计完成高质量的服务端产… https://m.zhaopin.com//jobs/562114535250039/ python开发工程师 [北京] 五险一金;年底双薪;绩效奖金;带薪年假;弹性工作;补充医疗保险;定期体检;员工旅游 17500.0
19 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 岗位职责:1、负责数据后台服务的设计、开发、优化、测试等研发工作;2、负责支撑业务的其他项目… https://m.zhaopin.com//jobs/cz562114530j000297… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 12500.0
20 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、爬虫系统开发和优化;2、文档识别和提取;3、互联网数据采集。专业素质要求:1、… https://m.zhaopin.com//jobs/444406089252927/ python爬虫数据采集实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
21 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1. 参与公司软件产品后台研发和维护工作;2. 参与建筑物联网数据分析算法的设计和… https://m.zhaopin.com//jobs/444406089252925/ Python工程师招实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
22 北京市海淀区西二旗 广州百单网互联网科技有限公司 【岗位职责】1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、… https://m.zhaopin.com//jobs/444406089252924/ Python开发工程师待遇从优 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
23 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/444406089252923/ 后端工程师/Python工程师 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
24 北京市东城区和平里西街51号雍和宫壹中心A4楼3层 游族网络 岗位职责:1、创新项目及公司内部管理系统后台相关服务端的研发和维护;2、网页信息抓取结果的抽… https://m.zhaopin.com//jobs/264844217254121/ Python开发工程师-base北京 15000.0
25 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市八斗才数据有限公司 工作职责:1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、效… https://m.zhaopin.com//jobs/562550032250030/ Python开发工程师(北京) 五险一金;补充医疗保险;绩效奖金;定期体检;年底双薪;带薪年假;节日福利;员工旅游 20000.0
26 北京市海淀区北三环中路44号院 北京华信智原教育技术有限公司 岗位职责:1.积极参与教学大纲的制定,并按照教学大纲授课;2.通过QQ与学员交流,并耐心给学… https://m.zhaopin.com//jobs/134503487251283/ Python老师 五险一金;年底双薪;带薪年假;员工旅游;高温补贴;节日福利 17500.0
27 昌平区建材城西路育新小区对面金燕龙办公楼传智播客 江苏传智播客教育科技股份有限公司北京分公司 工作职责:按照教学大纲高质量完成日常授课任务; 根据市场需求,改进教学方法和内容,完善教学体… https://m.zhaopin.com//jobs/374740583250235/ python导师J10091 五险一金;交通补助;餐补;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 23000.0
28 北京市海淀区西二旗 广州百单网互联网科技有限公司 工作方向:openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等。技… https://m.zhaopin.com//jobs/444406089252926/ python开发实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
29 北京市海淀区西二旗 北京升凯网络科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/540062934250725/ 后端工程师/Python工程师 五险一金;年底双薪;绩效奖金;餐补;房补;定期体检;员工旅游 5000.0
4511 北京市朝阳区远洋国际中心A座2306 国信嘉宁数据技术有限公司 岗位职责:1、配合开发人员对公司主营产品的应用部署及环境调优;2、跟进解决系统运维技术问题;… https://m.zhaopin.com//jobs/268720686250316/ Linux系统运维工程师 周末双休;五险一金;绩效奖金;餐补;带薪年假;定期体检 11500.0
4512 五棵松地铁附近 北京海思瑞格科技有限公司 职位描述:1. 通过深度学习方法解决临床问题;2. 搭建基于深度学习框架的时序信号处理和医疗… https://m.zhaopin.com//jobs/30130628000026679212/ 算法工程师(深度学习方向) 创业公司;每年多次调薪;定期体检;节日福利;绩效奖金;餐补;五险一金 18500.0
4513 北京市海淀区北三环西路32号恒润国际大厦9层911 北京法宣在线科技有限公司 带薪年假、子女教育金、父母赡养金、节日礼物、扁平管理、定期体检、年度旅游、全勤奖、发展空间大… https://m.zhaopin.com//jobs/56636092500023946611/ AI算法工程师-人人律智能大数据科技公司 创业公司;五险一金;股票期权;带薪年假;弹性工作;节日福利;员工旅游;定期体检 25000.0
4514 朝阳 北京未来进程信息技术有限公司 要求:1、PC端、移动端都可以测试;2、基本要求:功能测试的能力必须非常好。加分项:1、懂基… https://m.zhaopin.com//jobs/375117787250204/ 软件测试工程师 12500.0
4515 北京朝阳区望京阜通东大街6号方恒国际中心B座507 神州灵云(北京)科技有限公司 岗位职责:一、岗位要求:1、 根据产品需求、特点编写测试计划、测试方案、测试报告;2、 按照… https://m.zhaopin.com//jobs/415933738250011/ 软件测试工程师 五险一金;绩效奖金 9000.0
4516 北京市朝阳区望京利泽中一路中辰大厦3A02 北京泺喜教育科技有限公司 工作职责 :1、根据开发需求,高效完成相关程序的开发、测试;2、在工作或业余时间,完成对未来… https://m.zhaopin.com//jobs/38338392500023634710/ 应用工程师(软件方向) 7000.0
4517 北京市朝阳区大屯里金泉时代3单元1815 北京禾唐科技有限公司 岗位职责:. 负责卖家云平台前后端技术开发、优化和维护. 积极响应运营团队反馈的问题,提供技… https://m.zhaopin.com//jobs/cz196212610j000307… java开发工程师 20000.0
4518 北京市海淀区信息路30号上地大厦5层502室 北京恒济引航科技股份有限公司 工作职责:1、负责软件平台系统架构设计与实现及优化工作;2、负责总体设计和重要技术决策,指导… https://m.zhaopin.com//jobs/41176342400025277013/ 高级系统架构师 五险一金;通讯补贴;定期体检;员工旅游;节日福利;带薪年假;股票期权 22500.0
4519 海淀区腾讯公司 车音智能科技有限公司 【工作职责】:负责金融应用类产品移动终端的版本测试,版本类型包括H5应用、ios/安卓上的A… https://m.zhaopin.com//jobs/52755368000141636501/ 测试工程师(自选股) 周末双休;五险一金;免费班车;员工旅游 11000.0
4520 京市朝阳区朝外北街蓝筹名座D座2单元501 北京奋青榜科技有限公司 岗位职责:1 维护所有数据库稳定运行,关注数据库集群整体运行情况,持续发现和解决潜在的问题;… https://m.zhaopin.com//jobs/334310587250246/ DBA 五险一金;年底双薪;绩效奖金;加班补助;带薪年假;弹性工作;员工旅游;节日福利 14000.0
4521 北京市朝阳区朝外大街20号联合大厦506 博易智讯(北京)信息技术有限公司 岗位职责:1、负责数据资源中心建设(大数据及分析)类项目的咨询和涉及工作,完成具体指定的数据… https://m.zhaopin.com//jobs/14231517100025758215/ BI资深售前/资深数据咨询顾问 五险一金;绩效奖金;定期体检;员工旅游;节日福利;不加班;带薪年假 17500.0
4522 北京市海淀区北四环西路9号银谷大厦1504 北京永鼎致远网络科技有限公司 岗位职责:1、基于海量数据,挖掘数据规律并建立分析模型;2、对海量数据进行提炼、分析、归纳用… https://m.zhaopin.com//jobs/38037292500028068015/ 数据挖掘工程师 五险一金;年底双薪;绩效奖金;交通补助;餐补;通讯补贴;补充医疗保险 17500.0
4523 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1 在业务场景下验证产品的功能与性能;2 进行大数据产品的安装部署与测试实施,进行… https://m.zhaopin.com//jobs/326767032250168/ 大数据工程师 五险一金;带薪年假;节日福利;员工旅游;定期体检;补充医疗保险 15000.0
4524 北京市西城区电研大厦 北京善友正信科技有限公司 工作职责:1、负责数据仓库ETL流程的优化及解决ETL相关技术问题;2、负责大数据分析系统和… https://m.zhaopin.com//jobs/229707532250069/ ETL数据工程师 五险一金;节日福利;带薪年假 10000.0
4525 北京市丰台区国投财富广场 北京虹信万达科技有限公司 岗位职责:1. 研发自动化运维平台,提高运维、开发协作效率,规范操作流程;2. 研发基础服务… https://m.zhaopin.com//jobs/341610437250040/ 自动化运维开发工程师 五险一金;绩效奖金;节日福利 15000.0
4526 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1、hadoop,storm,hive,kafka,flume,hbase,ran… https://m.zhaopin.com//jobs/326767032250109/ 运维工程师 五险一金;带薪年假;节日福利;定期体检;员工旅游;补充医疗保险 11500.0
4527 北京市朝阳区安立路60号润枫商务B座24层 玩咖欢聚文化传媒(北京)有限公司 工作职责: 1、负责公司项目中产品的页面交互及功能实现; 2、负责前端新技术研究及公司前端框… https://m.zhaopin.com//jobs/203128481251262/ 前端技术经理 周末双休;五险一金;年底双薪;加班补助;餐补;带薪年假;弹性工作;员工旅游 30000.0
4528 北京市朝阳区建国路92号世茂大厦B座20层 北京极点触碰科技有限公司 岗位职责:1.参与产品评审,分析产品需求,根据项目需求和测试计划设计和编写测试用例;2.执行… https://m.zhaopin.com//jobs/cz525380730j000367… 测试工程师 五险一金;每年多次调薪;弹性工作;绩效奖金;带薪年假 11500.0
4529 北京市海淀区启明星辰大厦 北京望时高科科技有限公司 此职位为人力外包职位,不接受的请慎重投简历,谢谢!PS:此职位仅招收男性。岗位职责:1.负责… https://m.zhaopin.com//jobs/43216162800038403612/ linux系统工程师 8000.0
4530 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 任职要求:1)本科以上学历,有2年以上工作经验,至少1年大数据ETL开发经验、熟悉Hadoo… https://m.zhaopin.com//jobs/326767032250120/ 应用开发工程师 五险一金;带薪年假;节日福利;定期体检;补充医疗保险;员工旅游 11500.0
4531 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责1. 从事金融、政府行业大数据项目有关数据ETL处理的设计、实现和优化,涵盖数据采集… https://m.zhaopin.com//jobs/326767032250161/ ETL工程师(项目) 五险一金;弹性工作;定期体检;节日福利;补充医疗保险;带薪年假 11500.0
4532 北京市海淀区西三旗建材城中路12号院26栋 北京荣联科创科技有限公司 岗位职责:1、根据具体项目要求,承担开发任务,按计划完成任务目标;2、根据用户需求按时完成开… https://m.zhaopin.com//jobs/48747592300027909814/ 研发工程师 绩效奖金;全勤奖;交通补助;餐补;定期体检;员工旅游;节日福利;带薪年假 5000.0
4533 北京市海淀区上地十街辉煌国际大厦 北京近颐科技有限公司 岗位职责:1负责服务集群的设计与搭建配置;2.负责Linux平台系统的安全管理;3.负责服务… https://m.zhaopin.com//jobs/292524636250052/ linux系统工程师 五险一金;交通补助;餐补;通讯补贴 8000.0
4534 北京市海淀区中关村软件园11号楼 北京精一强远科技有限公司 公司介绍:北京精一强远科技有限公司,致力于高端IT专业产品的专业设计、专业制造业务。公司拥有… https://m.zhaopin.com//jobs/287608631250052/ 软件开发工程师 五险一金;年底双薪;绩效奖金;包吃;通讯补贴;带薪年假;补充医疗保险;定期体检 12500.0
4535 北京市朝阳区双桥Dream2049园区世联文创一层107(东侧) 北京华沁智联科技有限公司 岗位职责1、 负责项目/产品的测试工作,参与产品需求分析,负责测试计划制定,并能预先评估项目… https://m.zhaopin.com//jobs/331013133250043/ 开发测试工程师(白盒) 创业公司;五险一金;绩效奖金;股票期权;餐补;带薪年假;弹性工作;节日福利 20000.0
4536 广顺北大街5号院内融创动力科技文化创意产业园B230 北京书生云科技有限公司 https://m.zhaopin.com//jobs/45496253700037561514/ 实施工程师 创业公司;周末双休;五险一金;带薪年假;弹性工作;通讯补贴 11500.0
4537 北京市东城区朝内大街298号 北京国研数通软件技术有限公司 岗位职责:1、负责大数据平台的开发和维护,负责大数据平台持续集成相关工具平台的架构设计与产品… https://m.zhaopin.com//jobs/120900932250257/ 大数据JAVA开发工程师 12500.0
4538 北京市东城区灯市口大街33号国中商业大厦423室 北京树优信息技术有限公司 工作职责: 1 负责或参与流体分析技术服务项目2 负责或参与流体优化技术服务项目3 负… https://m.zhaopin.com//jobs/226257529250059/ 流体力学仿真优化工程师 五险一金;绩效奖金;加班补助;交通补助;房补;带薪年假;员工旅游;节日福利 7000.0
4539 朝阳区来广营叶青大厦北园308 北京行易道科技有限公司 岗位职责:1、进行高可靠高安全嵌入式软件测试,包含代码测试、功能测试、性能测试、安全性测试等… https://m.zhaopin.com//jobs/22757003700087605207/ 嵌入式软件测试工程师 14薪;健身俱乐部;周末双休;五险一金;餐补;带薪年假;弹性工作;补充医疗保险 10500.0
4540 东城区王府井东街8号 澳门中心B1层funwork 睿医(北京)数据技术有限公司 职位描述:1.根据项目需求,独立完成各类型的临床数据的统计分析工作2.参与产品统计模块的功能… https://m.zhaopin.com//jobs/cz752253770j000214… 医学统计经理 五险一金;股票期权 22500.0

4541 rows × 7 columns





<div class="se-preview-section-delimiter"></div>

# 使用列salary的均值对NA进行填充
df['salary'].fillna(df['salary'].mean())




<div class="se-preview-section-delimiter"></div>
0       17500.0
1       14000.0
2       12500.0
3       12500.0
4       12500.0
5       22500.0
6        1500.0
7        9000.0
8        9000.0
9       23000.0
10      15000.0
11      32500.0
12      17500.0
13      15000.0
14      25000.0
15      15000.0
16      20000.0
17      25000.0
18      17500.0
19      12500.0
20       5000.0
21       5000.0
22       5000.0
23       5000.0
24      15000.0
25      20000.0
26      17500.0
27      23000.0
28       5000.0
29       5000.0
         ...   
4511    11500.0
4512    18500.0
4513    25000.0
4514    12500.0
4515     9000.0
4516     7000.0
4517    20000.0
4518    22500.0
4519    11000.0
4520    14000.0
4521    17500.0
4522    17500.0
4523    15000.0
4524    10000.0
4525    15000.0
4526    11500.0
4527    30000.0
4528    11500.0
4529     8000.0
4530    11500.0
4531    11500.0
4532     5000.0
4533     8000.0
4534    12500.0
4535    20000.0
4536    11500.0
4537    12500.0
4538     7000.0
4539    10500.0
4540    22500.0
Name: salary, Length: 4541, dtype: float64




<div class="se-preview-section-delimiter"></div>

# 查看列salary的均值
df['salary'].mean()




<div class="se-preview-section-delimiter"></div>
18552.686632900241




<div class="se-preview-section-delimiter"></div>

# 清除job_info字段的字符空格
df['job_info'] = df['job_info'].map(str.strip)




<div class="se-preview-section-delimiter"></div>




<div class="se-preview-section-delimiter"></div>

# 大小写转换
df.dtypes
df['job_name']=df['job_name'].str.lower()




<div class="se-preview-section-delimiter"></div>
df.dtypes




<div class="se-preview-section-delimiter"></div>
address      object
company      object
job_info     object
job_link     object
job_name     object
job_tags     object
salary      float64
dtype: object




<div class="se-preview-section-delimiter"></div>

# 更改数据格式
df['salary'].astype('int')




<div class="se-preview-section-delimiter"></div>
0       17500
1       14000
2       12500
3       12500
4       12500
5       22500
6        1500
7        9000
8        9000
9       23000
10      15000
11      32500
12      17500
13      15000
14      25000
15      15000
16      20000
17      25000
18      17500
19      12500
20       5000
21       5000
22       5000
23       5000
24      15000
25      20000
26      17500
27      23000
28       5000
29       5000
        ...  
4511    11500
4512    18500
4513    25000
4514    12500
4515     9000
4516     7000
4517    20000
4518    22500
4519    11000
4520    14000
4521    17500
4522    17500
4523    15000
4524    10000
4525    15000
4526    11500
4527    30000
4528    11500
4529     8000
4530    11500
4531    11500
4532     5000
4533     8000
4534    12500
4535    20000
4536    11500
4537    12500
4538     7000
4539    10500
4540    22500
Name: salary, Length: 4541, dtype: int32




<div class="se-preview-section-delimiter"></div>

# 更改列名称




<div class="se-preview-section-delimiter"></div>

#df.rename(columns={''})
df.dtypes
df.rename(columns={'salary':'salary-money'})




<div class="se-preview-section-delimiter"></div>
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary-money
0 北京市朝阳区裕民路12号 中国国际科技会展中心A座10层 大连飞创信息技术有限公司 岗位职责:1、按照有关制度和规范的要求,承担代码的编写工作。对开发任务、需求理解透彻,积极配… https://m.zhaopin.com//jobs/210653218250637/ c++开发工程师 五险一金;年底双薪;绩效奖金;加班补助;交通补助;餐补;采暖补贴;定期体检 17500.0
1 丰台区航丰路一号时代财富天地大厦28层 深圳市八斗才数据有限公司 岗位职责:1、 负责互联网网站产品开发;2、 参与产品设计、架构设计和代码编写;3、 负责问… https://m.zhaopin.com//jobs/cz562550030j000298… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 14000.0
2 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市芒柠科技有限公司 岗位职责:1、维护现有的平台代码。2、参与项目的架构设计,明确负责开发部分的设计需求。3、按… https://m.zhaopin.com//jobs/cz466965980j000547… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助 12500.0
3 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市源极光科技有限公司 技术要求:1、精通Python语言,熟悉Python多线程 socket通信机制;2、精通流… https://m.zhaopin.com//jobs/cz897833860j000551… python工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;年底双薪;带薪年假;弹性工作;员工旅游 12500.0
4 海淀区中关村软件园11号楼大洋大厦 深圳市芒柠科技有限公司 岗位职责:1. 负责云平台应用的开发维护;2. 负责服务器端API的设计与开发。岗位要求:1… https://m.zhaopin.com//jobs/cz730936640j000955… python开发工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;员工旅游;带薪年假;弹性工作;节日福利 12500.0
5 北京市海淀区苏州街3号大恒科技大厦南座17层 北京乐学创想教育科技有限公司 岗位职责:1、题库全栈开发和维护,包括需求分析、技术改进、后期维护2、构建数据分析模型,对视… https://m.zhaopin.com//jobs/244101282250512/ python工程师 节日福利;五险一金;餐补;创业公司 22500.0
6 北京市朝阳区来广营中街甲1号朝来科技产业园创远路36号院4-6号楼 北京尚德在线教育科技有限公司 岗位职责:1、负责公司电商平台如天猫微店、京东、苏宁等商城日常的运营管理,包括店铺整体策划、… https://m.zhaopin.com//jobs/424628486272009/ python自动化 创业公司;无试用期;绩效奖金;不加班 1500.0
7 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 职位职责:1. 基于 Python 的分布式集群管理软件开发2. 基于 Web 的工具软… https://m.zhaopin.com//jobs/567369733250977/ python实习生 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 9000.0
8 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 工作方向openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等技术要… https://m.zhaopin.com//jobs/567369733250978/ python开发实习(接受零基础) 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 9000.0
9 北京市海淀区上地农大南路88号万霖大厦3层 北京云纵信息技术有限公司 岗位职责:1)负责业务系统运行环境的基础服务管理,系统架构的维护;2)参与基于大数据平台的维… https://m.zhaopin.com//jobs/311289936253904/ linux运维工程师(熟练python) 节日福利;五险一金;绩效奖金;加班补助;交通补助;餐补;带薪年假;健身俱乐部 23000.0
10 后沙峪安庆大街巨鸿大厦A座5层 天津狮桥国际物流有限公司 一、岗位职责:1、搭建系统开发环境,完成系统框架和核心代码的实现,负责解决开发过程中的技术问… https://m.zhaopin.com//jobs/670247822251376/ python软件开发工程师 五险一金;绩效奖金;包住;餐补;通讯补贴;带薪年假 15000.0
11 北京市海淀区互联网金融中心21层 北京融七牛信息技术有限公司 岗位职责:1. 负责天机风控系统模型在线服务的架构设计、优化和研发工作; 2. 负责线上服务… https://m.zhaopin.com//jobs/435840920250697/ 高级python研发工程师(000650) 五险一金;绩效奖金;餐补;通讯补贴;补充医疗保险;定期体检;节日福利 32500.0
12 北京市朝阳区工体 北京科锐国际人力资源股份有限公司 岗位职责:1. 基于公司CRM系统 的产品研发、以及项目开发;2. 公司内部电商平台开发工作… https://m.zhaopin.com//jobs/263940938259405/ 直聘软件研发(golang , python, ruby) 节日福利;周末双休;五险一金;年底双薪;绩效奖金;年终分红;补充医疗保险;定期体检 17500.0
13 北京市海淀区西北旺东路10号院东区1号楼领创空间2层204A 北京彼速信息技术有限公司 职位要求:1.本科以上学历,计算机相关专业;2.熟悉B/S软件结构;3. 精通C#,熟练掌握… https://m.zhaopin.com//jobs/136473062250465/ c#/asp.net高级软件工程师 五险一金 15000.0
14 北京市东城区和平里东街11号雍和航星园三号楼一层 浙江齐聚科技有限公司北京分公司 1. 负责产品功能性需求的开发、维护。2. 负责优化系统的性能和稳定性3. 能独立完成个人承… https://m.zhaopin.com//jobs/32922521700041200311/ 高级java工程师 25000.0
15 (中关村)北京市海淀区王庄路1号清华同方科技广场A座17层 北京固鸿科技有限公司 岗位职责:1、负责公司软件系统集成开发;2、按规范编写系统需求、概要设计、详细设计及系统部署… https://m.zhaopin.com//jobs/137279958250759/ windows c++软件开发工程师 五险一金;年终分红;交通补助;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 15000.0
16 马尼拉分公司 皇室科技有限公司 只要你有能力,薪资不是问题!只要你有能力,薪资不是问题!任职要求1、计算机及相关专业,国家统… https://m.zhaopin.com//jobs/cz735252640j001365… php工程师/php程序员/php 住房补贴;每年多次调薪;健身俱乐部;包吃;包住;房补;通讯补贴;带薪年假 20000.0
17 北京市朝阳区北京市朝阳区广渠路3号竞园图片产业园1号库 Forgame–云游控股集团 岗位职责:1、负责在线娃娃机的管理后台系统的研发2、负责统计后台搭建 3、负责监控后台搭建1… https://m.zhaopin.com//jobs/571816225250634/ python后台研发工程师 25000.0
18 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 职位职责:1、负责产品的服务端开发;2、负责优化产品的性能,根据产品设计完成高质量的服务端产… https://m.zhaopin.com//jobs/562114535250039/ python开发工程师 [北京] 五险一金;年底双薪;绩效奖金;带薪年假;弹性工作;补充医疗保险;定期体检;员工旅游 17500.0
19 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 岗位职责:1、负责数据后台服务的设计、开发、优化、测试等研发工作;2、负责支撑业务的其他项目… https://m.zhaopin.com//jobs/cz562114530j000297… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 12500.0
20 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、爬虫系统开发和优化;2、文档识别和提取;3、互联网数据采集。专业素质要求:1、… https://m.zhaopin.com//jobs/444406089252927/ python爬虫数据采集实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
21 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1. 参与公司软件产品后台研发和维护工作;2. 参与建筑物联网数据分析算法的设计和… https://m.zhaopin.com//jobs/444406089252925/ python工程师招实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
22 北京市海淀区西二旗 广州百单网互联网科技有限公司 【岗位职责】1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、… https://m.zhaopin.com//jobs/444406089252924/ python开发工程师待遇从优 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
23 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/444406089252923/ 后端工程师/python工程师 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
24 北京市东城区和平里西街51号雍和宫壹中心A4楼3层 游族网络 岗位职责:1、创新项目及公司内部管理系统后台相关服务端的研发和维护;2、网页信息抓取结果的抽… https://m.zhaopin.com//jobs/264844217254121/ python开发工程师-base北京 15000.0
25 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市八斗才数据有限公司 工作职责:1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、效… https://m.zhaopin.com//jobs/562550032250030/ python开发工程师(北京) 五险一金;补充医疗保险;绩效奖金;定期体检;年底双薪;带薪年假;节日福利;员工旅游 20000.0
26 北京市海淀区北三环中路44号院 北京华信智原教育技术有限公司 岗位职责:1.积极参与教学大纲的制定,并按照教学大纲授课;2.通过QQ与学员交流,并耐心给学… https://m.zhaopin.com//jobs/134503487251283/ python老师 五险一金;年底双薪;带薪年假;员工旅游;高温补贴;节日福利 17500.0
27 昌平区建材城西路育新小区对面金燕龙办公楼传智播客 江苏传智播客教育科技股份有限公司北京分公司 工作职责:按照教学大纲高质量完成日常授课任务; 根据市场需求,改进教学方法和内容,完善教学体… https://m.zhaopin.com//jobs/374740583250235/ python导师j10091 五险一金;交通补助;餐补;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 23000.0
28 北京市海淀区西二旗 广州百单网互联网科技有限公司 工作方向:openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等。技… https://m.zhaopin.com//jobs/444406089252926/ python开发实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
29 北京市海淀区西二旗 北京升凯网络科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/540062934250725/ 后端工程师/python工程师 五险一金;年底双薪;绩效奖金;餐补;房补;定期体检;员工旅游 5000.0
4511 北京市朝阳区远洋国际中心A座2306 国信嘉宁数据技术有限公司 岗位职责:1、配合开发人员对公司主营产品的应用部署及环境调优;2、跟进解决系统运维技术问题;… https://m.zhaopin.com//jobs/268720686250316/ linux系统运维工程师 周末双休;五险一金;绩效奖金;餐补;带薪年假;定期体检 11500.0
4512 五棵松地铁附近 北京海思瑞格科技有限公司 职位描述:1. 通过深度学习方法解决临床问题;2. 搭建基于深度学习框架的时序信号处理和医疗… https://m.zhaopin.com//jobs/30130628000026679212/ 算法工程师(深度学习方向) 创业公司;每年多次调薪;定期体检;节日福利;绩效奖金;餐补;五险一金 18500.0
4513 北京市海淀区北三环西路32号恒润国际大厦9层911 北京法宣在线科技有限公司 带薪年假、子女教育金、父母赡养金、节日礼物、扁平管理、定期体检、年度旅游、全勤奖、发展空间大… https://m.zhaopin.com//jobs/56636092500023946611/ ai算法工程师-人人律智能大数据科技公司 创业公司;五险一金;股票期权;带薪年假;弹性工作;节日福利;员工旅游;定期体检 25000.0
4514 朝阳 北京未来进程信息技术有限公司 要求:1、PC端、移动端都可以测试;2、基本要求:功能测试的能力必须非常好。加分项:1、懂基… https://m.zhaopin.com//jobs/375117787250204/ 软件测试工程师 12500.0
4515 北京朝阳区望京阜通东大街6号方恒国际中心B座507 神州灵云(北京)科技有限公司 岗位职责:一、岗位要求:1、 根据产品需求、特点编写测试计划、测试方案、测试报告;2、 按照… https://m.zhaopin.com//jobs/415933738250011/ 软件测试工程师 五险一金;绩效奖金 9000.0
4516 北京市朝阳区望京利泽中一路中辰大厦3A02 北京泺喜教育科技有限公司 工作职责 :1、根据开发需求,高效完成相关程序的开发、测试;2、在工作或业余时间,完成对未来… https://m.zhaopin.com//jobs/38338392500023634710/ 应用工程师(软件方向) 7000.0
4517 北京市朝阳区大屯里金泉时代3单元1815 北京禾唐科技有限公司 岗位职责:. 负责卖家云平台前后端技术开发、优化和维护. 积极响应运营团队反馈的问题,提供技… https://m.zhaopin.com//jobs/cz196212610j000307… java开发工程师 20000.0
4518 北京市海淀区信息路30号上地大厦5层502室 北京恒济引航科技股份有限公司 工作职责:1、负责软件平台系统架构设计与实现及优化工作;2、负责总体设计和重要技术决策,指导… https://m.zhaopin.com//jobs/41176342400025277013/ 高级系统架构师 五险一金;通讯补贴;定期体检;员工旅游;节日福利;带薪年假;股票期权 22500.0
4519 海淀区腾讯公司 车音智能科技有限公司 【工作职责】:负责金融应用类产品移动终端的版本测试,版本类型包括H5应用、ios/安卓上的A… https://m.zhaopin.com//jobs/52755368000141636501/ 测试工程师(自选股) 周末双休;五险一金;免费班车;员工旅游 11000.0
4520 京市朝阳区朝外北街蓝筹名座D座2单元501 北京奋青榜科技有限公司 岗位职责:1 维护所有数据库稳定运行,关注数据库集群整体运行情况,持续发现和解决潜在的问题;… https://m.zhaopin.com//jobs/334310587250246/ dba 五险一金;年底双薪;绩效奖金;加班补助;带薪年假;弹性工作;员工旅游;节日福利 14000.0
4521 北京市朝阳区朝外大街20号联合大厦506 博易智讯(北京)信息技术有限公司 岗位职责:1、负责数据资源中心建设(大数据及分析)类项目的咨询和涉及工作,完成具体指定的数据… https://m.zhaopin.com//jobs/14231517100025758215/ bi资深售前/资深数据咨询顾问 五险一金;绩效奖金;定期体检;员工旅游;节日福利;不加班;带薪年假 17500.0
4522 北京市海淀区北四环西路9号银谷大厦1504 北京永鼎致远网络科技有限公司 岗位职责:1、基于海量数据,挖掘数据规律并建立分析模型;2、对海量数据进行提炼、分析、归纳用… https://m.zhaopin.com//jobs/38037292500028068015/ 数据挖掘工程师 五险一金;年底双薪;绩效奖金;交通补助;餐补;通讯补贴;补充医疗保险 17500.0
4523 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1 在业务场景下验证产品的功能与性能;2 进行大数据产品的安装部署与测试实施,进行… https://m.zhaopin.com//jobs/326767032250168/ 大数据工程师 五险一金;带薪年假;节日福利;员工旅游;定期体检;补充医疗保险 15000.0
4524 北京市西城区电研大厦 北京善友正信科技有限公司 工作职责:1、负责数据仓库ETL流程的优化及解决ETL相关技术问题;2、负责大数据分析系统和… https://m.zhaopin.com//jobs/229707532250069/ etl数据工程师 五险一金;节日福利;带薪年假 10000.0
4525 北京市丰台区国投财富广场 北京虹信万达科技有限公司 岗位职责:1. 研发自动化运维平台,提高运维、开发协作效率,规范操作流程;2. 研发基础服务… https://m.zhaopin.com//jobs/341610437250040/ 自动化运维开发工程师 五险一金;绩效奖金;节日福利 15000.0
4526 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1、hadoop,storm,hive,kafka,flume,hbase,ran… https://m.zhaopin.com//jobs/326767032250109/ 运维工程师 五险一金;带薪年假;节日福利;定期体检;员工旅游;补充医疗保险 11500.0
4527 北京市朝阳区安立路60号润枫商务B座24层 玩咖欢聚文化传媒(北京)有限公司 工作职责: 1、负责公司项目中产品的页面交互及功能实现; 2、负责前端新技术研究及公司前端框… https://m.zhaopin.com//jobs/203128481251262/ 前端技术经理 周末双休;五险一金;年底双薪;加班补助;餐补;带薪年假;弹性工作;员工旅游 30000.0
4528 北京市朝阳区建国路92号世茂大厦B座20层 北京极点触碰科技有限公司 岗位职责:1.参与产品评审,分析产品需求,根据项目需求和测试计划设计和编写测试用例;2.执行… https://m.zhaopin.com//jobs/cz525380730j000367… 测试工程师 五险一金;每年多次调薪;弹性工作;绩效奖金;带薪年假 11500.0
4529 北京市海淀区启明星辰大厦 北京望时高科科技有限公司 此职位为人力外包职位,不接受的请慎重投简历,谢谢!PS:此职位仅招收男性。岗位职责:1.负责… https://m.zhaopin.com//jobs/43216162800038403612/ linux系统工程师 8000.0
4530 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 任职要求:1)本科以上学历,有2年以上工作经验,至少1年大数据ETL开发经验、熟悉Hadoo… https://m.zhaopin.com//jobs/326767032250120/ 应用开发工程师 五险一金;带薪年假;节日福利;定期体检;补充医疗保险;员工旅游 11500.0
4531 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责1. 从事金融、政府行业大数据项目有关数据ETL处理的设计、实现和优化,涵盖数据采集… https://m.zhaopin.com//jobs/326767032250161/ etl工程师(项目) 五险一金;弹性工作;定期体检;节日福利;补充医疗保险;带薪年假 11500.0
4532 北京市海淀区西三旗建材城中路12号院26栋 北京荣联科创科技有限公司 岗位职责:1、根据具体项目要求,承担开发任务,按计划完成任务目标;2、根据用户需求按时完成开… https://m.zhaopin.com//jobs/48747592300027909814/ 研发工程师 绩效奖金;全勤奖;交通补助;餐补;定期体检;员工旅游;节日福利;带薪年假 5000.0
4533 北京市海淀区上地十街辉煌国际大厦 北京近颐科技有限公司 岗位职责:1负责服务集群的设计与搭建配置;2.负责Linux平台系统的安全管理;3.负责服务… https://m.zhaopin.com//jobs/292524636250052/ linux系统工程师 五险一金;交通补助;餐补;通讯补贴 8000.0
4534 北京市海淀区中关村软件园11号楼 北京精一强远科技有限公司 公司介绍:北京精一强远科技有限公司,致力于高端IT专业产品的专业设计、专业制造业务。公司拥有… https://m.zhaopin.com//jobs/287608631250052/ 软件开发工程师 五险一金;年底双薪;绩效奖金;包吃;通讯补贴;带薪年假;补充医疗保险;定期体检 12500.0
4535 北京市朝阳区双桥Dream2049园区世联文创一层107(东侧) 北京华沁智联科技有限公司 岗位职责1、 负责项目/产品的测试工作,参与产品需求分析,负责测试计划制定,并能预先评估项目… https://m.zhaopin.com//jobs/331013133250043/ 开发测试工程师(白盒) 创业公司;五险一金;绩效奖金;股票期权;餐补;带薪年假;弹性工作;节日福利 20000.0
4536 广顺北大街5号院内融创动力科技文化创意产业园B230 北京书生云科技有限公司 https://m.zhaopin.com//jobs/45496253700037561514/ 实施工程师 创业公司;周末双休;五险一金;带薪年假;弹性工作;通讯补贴 11500.0
4537 北京市东城区朝内大街298号 北京国研数通软件技术有限公司 岗位职责:1、负责大数据平台的开发和维护,负责大数据平台持续集成相关工具平台的架构设计与产品… https://m.zhaopin.com//jobs/120900932250257/ 大数据java开发工程师 12500.0
4538 北京市东城区灯市口大街33号国中商业大厦423室 北京树优信息技术有限公司 工作职责: 1 负责或参与流体分析技术服务项目2 负责或参与流体优化技术服务项目3 负… https://m.zhaopin.com//jobs/226257529250059/ 流体力学仿真优化工程师 五险一金;绩效奖金;加班补助;交通补助;房补;带薪年假;员工旅游;节日福利 7000.0
4539 朝阳区来广营叶青大厦北园308 北京行易道科技有限公司 岗位职责:1、进行高可靠高安全嵌入式软件测试,包含代码测试、功能测试、性能测试、安全性测试等… https://m.zhaopin.com//jobs/22757003700087605207/ 嵌入式软件测试工程师 14薪;健身俱乐部;周末双休;五险一金;餐补;带薪年假;弹性工作;补充医疗保险 10500.0
4540 东城区王府井东街8号 澳门中心B1层funwork 睿医(北京)数据技术有限公司 职位描述:1.根据项目需求,独立完成各类型的临床数据的统计分析工作2.参与产品统计模块的功能… https://m.zhaopin.com//jobs/cz752253770j000214… 医学统计经理 五险一金;股票期权 22500.0

4541 rows × 7 columns





<div class="se-preview-section-delimiter"></div>

# 删除  后出现的  重复值
df.dtypes
df['company'].drop_duplicates()




<div class="se-preview-section-delimiter"></div>
0                大连飞创信息技术有限公司
1                深圳市八斗才数据有限公司
2                 深圳市芒柠科技有限公司
3                深圳市源极光科技有限公司
5              北京乐学创想教育科技有限公司
6              北京尚德在线教育科技有限公司
7                 北京欣如信科技有限公司
9                北京云纵信息技术有限公司
10               天津狮桥国际物流有限公司
11              北京融七牛信息技术有限公司
12           北京科锐国际人力资源股份有限公司
13               北京彼速信息技术有限公司
14            浙江齐聚科技有限公司北京分公司
15                 北京固鸿科技有限公司
16                   皇室科技有限公司
17            Forgame--云游控股集团
20             广州百单网互联网科技有限公司
24                       游族网络
26             北京华信智原教育技术有限公司
27      江苏传智播客教育科技股份有限公司北京分公司
29               北京升凯网络科技有限公司
30                 北京奇虎科技有限公司
32                 深圳码隆科技有限公司
33             北京华卓餐饮连锁股份有限公司
34              北京好巧国际旅行社有限公司
35                       京东金融
36               中公教育-IT培训事业部
37             北京中公教育科技股份有限公司
39                 TCL互联网事业本部
40             北京明特量化信息技术有限公司
                ...          
4502                   智美体育集团
4503           优识云创(北京)科技有限公司
4504           广州优家投资管理有限责任公司
4506             上海索辰信息科技有限公司
4508           北京四三九九信息科技有限公司
4510           北京精图天下科技发展有限公司
4511             国信嘉宁数据技术有限公司
4512             北京海思瑞格科技有限公司
4513             北京法宣在线科技有限公司
4515           神州灵云(北京)科技有限公司
4516             北京泺喜教育科技有限公司
4517               北京禾唐科技有限公司
4518           北京恒济引航科技股份有限公司
4519               车音智能科技有限公司
4520              北京奋青榜科技有限公司
4521         博易智讯(北京)信息技术有限公司
4522           北京永鼎致远网络科技有限公司
4523             北京东方金信科技有限公司
4524             北京善友正信科技有限公司
4525             北京虹信万达科技有限公司
4527         玩咖欢聚文化传媒(北京)有限公司
4528             北京极点触碰科技有限公司
4529             北京望时高科科技有限公司
4532             北京荣联科创科技有限公司
4533               北京近颐科技有限公司
4534             北京精一强远科技有限公司
4535             北京华沁智联科技有限公司
4536              北京书生云科技有限公司
4539              北京行易道科技有限公司
4540           睿医(北京)数据技术有限公司
Name: company, Length: 1982, dtype: object




<div class="se-preview-section-delimiter"></div>

# 删除  先出现的 重复值:
df.dtypes
df['company'].drop_duplicates(keep='last')




<div class="se-preview-section-delimiter"></div>
0             大连飞创信息技术有限公司
5           北京乐学创想教育科技有限公司
10            天津狮桥国际物流有限公司
13            北京彼速信息技术有限公司
14         浙江齐聚科技有限公司北京分公司
15              北京固鸿科技有限公司
16                皇室科技有限公司
17         Forgame--云游控股集团
26          北京华信智原教育技术有限公司
28          广州百单网互联网科技有限公司
31            北京升凯网络科技有限公司
34           北京好巧国际旅行社有限公司
45          北京玖易创新网络科技有限公司
46            广州胖虾网络科技有限公司
64            大连东博恒翼科技有限公司
67            北京芝华安方科技有限公司
69                复华投资有限公司
70              北京硬球科技有限公司
72         深圳市前海谷雨网络科技有限公司
74       宜昌市西陵区金艺辰图文设计制作中心
79            柔持(北京)科技有限公司
85      北京人和众达汽车用品销售有限责任公司
86          成安(北京)科技发展有限公司
99              普天信息技术有限公司
100       银谷普惠信息咨询(北京)有限公司
105             北京品今控股有限公司
109           绫致时装(天津)有限公司
119         新博卓畅技术(北京)有限公司
124                   北明软件
125         北京金色华勤数据服务有限公司
               ...        
4508        北京四三九九信息科技有限公司
4509          北京创源微致软件有限公司
4510        北京精图天下科技发展有限公司
4511          国信嘉宁数据技术有限公司
4512          北京海思瑞格科技有限公司
4513          北京法宣在线科技有限公司
4514        北京未来进程信息技术有限公司
4515        神州灵云(北京)科技有限公司
4516          北京泺喜教育科技有限公司
4517            北京禾唐科技有限公司
4518        北京恒济引航科技股份有限公司
4519            车音智能科技有限公司
4520           北京奋青榜科技有限公司
4521      博易智讯(北京)信息技术有限公司
4522        北京永鼎致远网络科技有限公司
4524          北京善友正信科技有限公司
4525          北京虹信万达科技有限公司
4527      玩咖欢聚文化传媒(北京)有限公司
4528          北京极点触碰科技有限公司
4529          北京望时高科科技有限公司
4531          北京东方金信科技有限公司
4532          北京荣联科创科技有限公司
4533            北京近颐科技有限公司
4534          北京精一强远科技有限公司
4535          北京华沁智联科技有限公司
4536           北京书生云科技有限公司
4537        北京国研数通软件技术有限公司
4538          北京树优信息技术有限公司
4539           北京行易道科技有限公司
4540        睿医(北京)数据技术有限公司
Name: company, Length: 1982, dtype: object




<div class="se-preview-section-delimiter"></div>

# 数据替换
df['company'].replace('有限','youxian')




<div class="se-preview-section-delimiter"></div>
0                大连飞创信息技术有限公司
1                深圳市八斗才数据有限公司
2                 深圳市芒柠科技有限公司
3                深圳市源极光科技有限公司
4                 深圳市芒柠科技有限公司
5              北京乐学创想教育科技有限公司
6              北京尚德在线教育科技有限公司
7                 北京欣如信科技有限公司
8                 北京欣如信科技有限公司
9                北京云纵信息技术有限公司
10               天津狮桥国际物流有限公司
11              北京融七牛信息技术有限公司
12           北京科锐国际人力资源股份有限公司
13               北京彼速信息技术有限公司
14            浙江齐聚科技有限公司北京分公司
15                 北京固鸿科技有限公司
16                   皇室科技有限公司
17            Forgame--云游控股集团
18               深圳市源极光科技有限公司
19               深圳市源极光科技有限公司
20             广州百单网互联网科技有限公司
21             广州百单网互联网科技有限公司
22             广州百单网互联网科技有限公司
23             广州百单网互联网科技有限公司
24                       游族网络
25               深圳市八斗才数据有限公司
26             北京华信智原教育技术有限公司
27      江苏传智播客教育科技股份有限公司北京分公司
28             广州百单网互联网科技有限公司
29               北京升凯网络科技有限公司
                ...          
4511             国信嘉宁数据技术有限公司
4512             北京海思瑞格科技有限公司
4513             北京法宣在线科技有限公司
4514           北京未来进程信息技术有限公司
4515           神州灵云(北京)科技有限公司
4516             北京泺喜教育科技有限公司
4517               北京禾唐科技有限公司
4518           北京恒济引航科技股份有限公司
4519               车音智能科技有限公司
4520              北京奋青榜科技有限公司
4521         博易智讯(北京)信息技术有限公司
4522           北京永鼎致远网络科技有限公司
4523             北京东方金信科技有限公司
4524             北京善友正信科技有限公司
4525             北京虹信万达科技有限公司
4526             北京东方金信科技有限公司
4527         玩咖欢聚文化传媒(北京)有限公司
4528             北京极点触碰科技有限公司
4529             北京望时高科科技有限公司
4530             北京东方金信科技有限公司
4531             北京东方金信科技有限公司
4532             北京荣联科创科技有限公司
4533               北京近颐科技有限公司
4534             北京精一强远科技有限公司
4535             北京华沁智联科技有限公司
4536              北京书生云科技有限公司
4537           北京国研数通软件技术有限公司
4538             北京树优信息技术有限公司
4539              北京行易道科技有限公司
4540           睿医(北京)数据技术有限公司
Name: company, Length: 4541, dtype: object




<div class="se-preview-section-delimiter"></div>

# 数据预处理
df1=pd.DataFrame({, 
"gender":['male','female','male','female','male','female','male','female'],
"pay":['Y','N','Y','Y','N','Y','N','Y',],
"m-point":[10,12,20,40,40,40,30,20]})




<div class="se-preview-section-delimiter"></div>




<div class="se-preview-section-delimiter"></div>

# 数据表合并




<div class="se-preview-section-delimiter"></div>

# df_inner=pd.merge(df,df1,how='inner')  # 匹配合并,交集





<div class="se-preview-section-delimiter"></div>

# 设置索引列
df1.set_index('id')




<div class="se-preview-section-delimiter"></div>
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
gender m-point pay
id
1001 male 10 Y
1002 female 12 N
1003 male 20 Y
1004 female 40 Y
1005 male 40 N
1006 female 40 Y
1007 male 30 N
1008 female 20 Y




<div class="se-preview-section-delimiter"></div>

# 按照特定的值排序
df1.sort_values(by=['m-point'])
df.sort_values(by=['salary'])




<div class="se-preview-section-delimiter"></div>
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary
2311 海淀区知春路 海尔集团公司 https://m.zhaopin.com//jobs/cz755644850j000300… java开发工程师 绩效奖金 1450.0
73 朝阳区来广营 北京尚德在线教育科技有限公司 岗位职责:1、负责公司电商平台如天猫微店、京东、苏宁等商城日常的运营管理,包括店铺整体策划、… https://m.zhaopin.com//jobs/42462848600041223310/ python 绩效奖金;餐补 1500.0
522 北京市海淀区首体南路6号新世纪饭店写字楼9层 易鑫集团 岗位职责:职位描述:1. 负责物体检测, 识别, 追踪, 语义分割等某个领域前沿技术的研发和… https://m.zhaopin.com//jobs/688310727255679/ 算法实习生j12009 1500.0
1076 北京市海淀区首体南路6号新世纪饭店写字楼6层 易车公司 岗位职责:1、设计和开发分布式网络爬虫程序;2、分析爬取过程,提供技术实现方案;3、分析静态… https://m.zhaopin.com//jobs/136211339266075/ jtsjzx-爬虫工程师 1500.0
3252 北京市朝阳区建国路92号世茂大厦C座13层 和信电子商务有限公司 【岗位职责】1、根据公司风险管控策略,构建个人信用贷款风险模型;2、用大数据技术进行风险模型… https://m.zhaopin.com//jobs/58463342700041224909/ 风控模型师 五险一金;绩效奖金;弹性工作;定期体检;节日福利;员工旅游 1500.0
3848 北京市朝阳区利泽中园106号楼3层313A 北京译泰教育科技有限公司 工作职责:1、负责协助量表工具的信效度检验工作,包括而不限于数据录入、数据整理、数据分析等工… https://m.zhaopin.com//jobs/69935062900029494110/ 数据分析实习生 1500.0
1236 北京市海淀区知春路7号致真大厦B座18层 展讯通信(上海)有限公司 工作职责:负责android 手机各类测试,涉及各个功能模块,功能性能测试,执行测试,汇报结… https://m.zhaopin.com//jobs/000536366251977/ android 测试实习生 餐补 1500.0
6 北京市朝阳区来广营中街甲1号朝来科技产业园创远路36号院4-6号楼 北京尚德在线教育科技有限公司 岗位职责:1、负责公司电商平台如天猫微店、京东、苏宁等商城日常的运营管理,包括店铺整体策划、… https://m.zhaopin.com//jobs/424628486272009/ python自动化 创业公司;无试用期;绩效奖金;不加班 1500.0
3264 北京市西城区广安门内大街311号院祥龙商务大厦A座5层 北京汇通金财信息科技有限公司 岗位职责:1.根据业务需求制定网络安全解决方案,负责规划、设计、部署网络安全系统,制订和实施… https://m.zhaopin.com//jobs/174866323251417/ 桌面运维工程师 五险一金;绩效奖金;带薪年假;定期体检 2250.0
3105 北京市西城区广安门内大街311号院祥龙商务大厦A座5层 北京汇通金财信息科技有限公司 岗位职责:1.负责中间件产品的日常运维工作,应用包部署、性能优化、故障定位处理等;2.负责中… https://m.zhaopin.com//jobs/174866323251400/ 运维工程师 五险一金;绩效奖金;带薪年假;定期体检 2250.0
3083 北京市丰台区洋桥12号院3层至19层 北京值得买科技股份有限公司 岗位职责:1、负责数据评估、数据整理等工作;2、定期收集数据需求方的问题反馈,归纳总结问题类… https://m.zhaopin.com//jobs/328489736250304/ 数据实习生 五险一金;餐补;带薪年假;弹性工作;补充医疗保险;定期体检;员工旅游;节日福利 2500.0
734 北京海淀区北清路68号用友软件园 用友网络科技股份有限公司 岗位要求:1.计算机或相关专业本科及以上学历,实习半年以上 2.熟悉软件测试理论和方法… https://m.zhaopin.com//jobs/120887036262005/ 测试工程师 周末双休;餐补;弹性工作 2500.0
2419 北京市海淀区北三环西路43号中航广场 北京字节跳动科技有限公司 岗位职责:1、参与应用安全、数据安全、云安全以及威胁检查系统研发;2、开发和完善后台相关工具… https://m.zhaopin.com//jobs/469217519256850/ 后台开发实习生 - 安全 弹性工作 3000.0
440 望京绿地中心A座C区 北京鸿风网络科技有限公司 职位职责:1、参与系统架构设计、优化,提升系统性能和开发效率,保证高并发高可靠;2、通过不断… https://m.zhaopin.com//jobs/cz404029980j000376… python高级开发工程师 创业公司;14薪;五险一金;周末双休;弹性工作;节日福利;年终分红;绩效奖金 3000.0
2579 北京市海淀区东北旺西路8号中关村软件园4号楼云基地 北京永信至诚科技股份有限公司 岗位职责:1、协助e春秋产线所有产品的实施、升级、安装调试、数据迁移、数据备份工作,推进项目… https://m.zhaopin.com//jobs/46410521300039192312/ 实施工程师实习生 周末双休;餐补;定期体检;员工旅游;节日福利 3000.0
69 北京市朝阳区建国门外大街IFC大厦20层 复华投资有限公司 岗位职责:1) 计算机相关专业本科及以上学历;2) 熟悉常用数据结构和算法;3) 熟练使用 … https://m.zhaopin.com//jobs/312859337250056/ python开发实习生 节日福利;绩效奖金;餐补;通讯补贴;员工旅游 3000.0
1651 北京朝阳区建国路81号华贸中心1号楼21层、11层、12层 北京戴斯克商务有限公司 工作职责:1. 收集整理数据,根据业务需求整理文件资料归档,2. 熟悉web开发流程,熟练使… https://m.zhaopin.com//jobs/189223122254194/ 前/后端实习生 3000.0
52 朝阳区来广营 北京尚德在线教育科技有限公司 任职资格:1.有4年以上Java程序员的工作经验;2.沟通能力强,能很好的理解客户的需求,并… https://m.zhaopin.com//jobs/42462848600040523710/ python实习生 创业公司;采暖补贴;通讯补贴;14薪 3000.0
1649 广东深圳市 深圳市长亮科技股份有限公司 https://m.zhaopin.com//jobs/120564559253235/ 数据挖掘建模分析/机器学习实习生 周末双休;五险一金;年底双薪;餐补;通讯补贴;定期体检 3000.0
4192 北京市海淀区清华科技园科技大厦C座18层 启迪汇智(北京)投资管理有限公司 工作地点:北京学历要求:本科工作年限要求:不限基本技能要求:sql,(python|java… https://m.zhaopin.com//jobs/391309933250067/ 爬虫实习生 节日福利;周末双休;餐补;员工旅游 3000.0
2485 北京市 海淀区 北京鱼游四海科技有限公司 职位描述:1. 负责金融或游戏等业务数据采集、整合和整理方案的设计;2. 负责对海量业务数据… https://m.zhaopin.com//jobs/57864253900034114115/ 大数据分析师(企业内训)接受转行 周末双休;包住;五险一金;14薪;节日福利 3000.0
410 北京市海淀区西小口路18号新华创新大厦5层 北京上格云技术有限公司 岗位职责1. 参与公司软件产品后台研发和维护工作2. 参与建筑物联网数据分析算法的设计和开发… https://m.zhaopin.com//jobs/405232187250047/ python工程师-实习生 弹性工作;节日福利;创业公司;五险一金;补充医疗保险;定期体检 3000.0
3511 北京市海淀区北四环西路9号银谷大厦20层2005 中标软件有限公司 岗位职责:1、负责x86、龙芯等平台linux操作系统产品研发与升级维护;2、负责市场项目开… https://m.zhaopin.com//jobs/120343909250980/ linux研发实习生 餐补;弹性工作 3000.0
3498 北京市海淀区学院南路15号院6号楼 中央编办事业发展中心(政务和公益机构域名注册管理中心) 岗位职责:负责NLP语料库整理, 网站、微博等资源列表整理,算法调优以及算法参数调优任职要求… https://m.zhaopin.com//jobs/134571998250346/ 数据结构与算法工程师实习生 节日福利;包吃;弹性工作 3000.0
3073 北京市海淀区永丰产业基地中关村壹号D1栋 拉卡拉云商网络有限公司 实习岗位不提供转正机会,所以最好是大三或者研一研二的学生任职要求1.统招本科,计算机/数学/… https://m.zhaopin.com//jobs/419574338250579/ 大数据实习生 节日福利;五险一金;餐补;带薪年假;免费班车 3000.0
2503 北京市东城区东直门外大街39号院2号楼航空服务大厦6层602 北京腾云天下科技有限公司 岗位职责:1、\t协助行业分析研究;2、\t协助处理项目相关数据;3、\t协助部门支撑与交付… https://m.zhaopin.com//jobs/399875122250913/ 数据分析师实习生j10106 五险一金;年底双薪;绩效奖金;弹性工作 3000.0
3647 北京市海淀区苏州街29号院18号楼维亚大厦 去哪儿网专车事业部 岗位职责:1.负责专车产品交易、派发、供应链等系统质量保障工作,负责和产品研发等人员紧密合作… https://m.zhaopin.com//jobs/143301296270452/ 测试开发实习生-专车事业部j12632 周末双休;弹性工作;定期体检 3000.0
1403 北京市地锦路5号院E-F座 Nestle China MainResponsibilities:1. Assist statistician on… https://m.zhaopin.com//jobs/000025063259960/ r&d intern 餐补;免费班车 3000.0
349 北京银通易汇科技有限公司 北京银通易汇科技有限公司 岗位职责:1.负责爬虫系统的开发工作;2.负责网页、文本信息抽取、数据清洗等研发和优化工作;… https://m.zhaopin.com//jobs/41753068800042423809/ python工程师实习生 创业公司;周末双休;节日福利;14薪;交通补助;餐补;通讯补贴;补充医疗保险 3000.0
2708 北京市海淀区苏州街16号神州数码大厦3层 北京精真估信息技术有限公司 岗位职责:1、基本的数据库操作,包括但不限于从数据库(HDFS/MongoDB等)中读取数据… https://m.zhaopin.com//jobs/646742427250652/ 数据挖掘实习生 五险一金;年底双薪;绩效奖金;带薪年假;定期体检 3000.0
1071 北京市海淀区北三环西路43号中航广场 北京字节跳动科技有限公司 岗位职责:1、负责头条广告以及其他变现产品的后端开发架构开发工作,;2、负责代码规范制定,持… https://m.zhaopin.com//jobs/469217519383070/ 广告系统web架构师 弹性工作;五险一金 55000.0
728 北京市海淀区海淀大街银科大厦 北京抱财金融信息服务有限公司 岗位职责:1、实现用户画像标签体系;2、实现渠道效果评价体系;3、与相关团队协作进行数据建模… https://m.zhaopin.com//jobs/24482578800040012010/ 数据总监 每年多次调薪;交通补助;餐补;通讯补贴;弹性工作;补充医疗保险;节日福利;带薪年假 55000.0
3876 北京市 北京聚辉管理咨询有限公司 - 建立和完善推荐系统的基础算法、框架和策略。- 不断优化供给端和需求端的策略,保障平台供需… https://m.zhaopin.com//jobs/346286011250186/ 算法负责人 60000.0
3901 北京市海淀区北四环丹棱街3号中国电子大厦B座10层 汽车之家 岗位职责:1、负责自然语言处理相关核心技术算法与产品化等研究工作,包括但不限于如下方向:知识… https://m.zhaopin.com//jobs/199013411260301/ nlp技术专家 五险一金;健身俱乐部 60000.0
3093 北京市海淀区北四环西路58号理想国际大厦12层 汽车之家 岗位职责:1、负责自然语言处理相关核心技术算法与产品化等研究工作,包括但不限于如下方向:知识… https://m.zhaopin.com//jobs/19901341100037751214/ nlp技术专家 60000.0
3706 北京市望京绿地中心 中国证券报有限责任公司 任岗位职责:1. 负责Android客户端的设计与开发工作 2. 负责客户端应用框架、SD… https://m.zhaopin.com//jobs/429380716250098/ android技术专家 60000.0
749 腾讯众创空间 大连铭睿信息技术有限公司 职位描述:1. 负责自动驾驶汽车激光/视觉SLAM算法、高清地图创建及特征匹配定位的研发工作… https://m.zhaopin.com//jobs/29680338400098449503/ 算法工程师 五险一金 60000.0
4404 朝阳区 财栋(上海)网络科技有限公司 岗位职责:l 参与后端系统架构l 优化的测试框架,根据业务需求开发自动化工具,提高测试质… https://m.zhaopin.com//jobs/42883183200061843608/ 资深php研发工程师 五险一金;定期体检;员工旅游;带薪年假;每年多次调薪;节日福利 60000.0
2406 北京 上海赤犬投资管理有限公司 工作职责:1. 独立完成App端所负责功能的测试用例设计、评测方案的设计。 2. 执行测试用… https://m.zhaopin.com//jobs/cz605618980j000839… 移动端测试开发工程师/总监(腾讯) 60000.0
3943 北京市海淀区北四环丹棱街3号中国电子大厦B座10层 汽车之家 岗位职责:1、负责汽车之家汽车领域和通用领域的知识图谱构建,研发大规模知识图谱半自动/自动化… https://m.zhaopin.com//jobs/199013411260302/ 知识图谱高级工程师 五险一金;健身俱乐部 60000.0
1570 北京市海淀区上地东路9号得实大厦5层北区 北京梦疆咨询有限公司 派派社交为北京知名互联网企业,正在申请登陆主板上市,公司发展神速。ps:公司每周工作6天,每… https://m.zhaopin.com//jobs/711610520250315/ 游戏golang开发工程师(需一周工作六天) 五险一金 60000.0
4386 北京市望京东浦项中心 北京博雅恒辉咨询顾问有限公司 岗位职责:1 参与果小美数据仓库架构设计与研发,建设百PB级的公共数据平台和服务系统,实现高… https://m.zhaopin.com//jobs/347640916250961/ 数据开发工程师 每年多次调薪;绩效奖金;年终分红;全勤奖;弹性工作 60000.0
681 北京市海淀区五棵松路49号新奥特科技大厦8层 新奥特(北京)视频技术有限公司 工作职责:-负责公司大数据底层框架的整体架构设计,结合公司实际业务情况进行技术选型及大数据战… https://m.zhaopin.com//jobs/000393785252017/ 大数据架构师 节日福利;五险一金;餐补;带薪年假;补充医疗保险;定期体检 60000.0
4176 朝阳区嘉润花园B座 北京每日优鲜电子商务有限公司 工作职责:1、组建并带领团队完成个性化推荐系统的研发和优化;2、利用电商交易和用户行为海量数… https://m.zhaopin.com//jobs/208367582251807/ ai总监 创业公司;五险一金;绩效奖金;加班补助;带薪年假;弹性工作;补充医疗保险;定期体检 60000.0
2591 朝阳区思源大厦 北京梦疆咨询有限公司 思源集团是美股上市公司,中国最大的物业管理软件公司和政府it化服务供应商。目前整个集团的科技… https://m.zhaopin.com//jobs/711610520250331/ 运维集成部总经理 五险一金 60000.0
3532 北京市朝阳区文学馆路芍药居39号楼 北京中联利信科技有限公司 岗位职责:1、负责统筹CDN平台架构设计和研发、部署;2、负责设计、实现、优化上层客户系统、… https://m.zhaopin.com//jobs/20849903000041365813/ cdn研发总监 定期体检;周末双休;五险一金;年底双薪;员工旅游;每年多次调薪;健身俱乐部 60000.0
950 上海市徐汇区宜山路900号c幢20楼 上海复星高科技(集团)有限公司 职位描述1、负责复星云平台系统级架构设计2、基于云端平台API,面向媒体行业定制开发系统级应… https://m.zhaopin.com//jobs/000384820255281/ 复星云-系统架构师 60000.0
1180 北京市崇文区广渠门内大街80号9层912室 北京经舆典网络科技有限公司 岗位职责:在以下方向跟踪前沿技术并落实到产品中:印刷体文字识别, 离线手写文字识别, 手写人… https://m.zhaopin.com//jobs/402756813250060/ 算法科学家(​文字识别方向) 五险一金;餐补;带薪年假;不加班;健身俱乐部;节日福利;周末双休 60000.0
1408 北京伯众联合管理咨询有限公司 北京伯众联合管理咨询有限公司 职位描述:1. 数据挖掘算法设计、测试、优化、数据训练等;2. 推荐引擎的设计与开发;3… https://m.zhaopin.com//jobs/406475887250237/ 数据挖掘工程师(资深) 五险一金;年底双薪;绩效奖金;股票期权 60000.0
3650 北京市海淀区北四环西路58号理想国际大厦12层 汽车之家 岗位职责:1. 参与业务需求讨论,针对应用场景判研可行性和实现路径,制定数据方案,设计和… https://m.zhaopin.com//jobs/19901341100037764114/ 机器学习资深工程师(计算机视觉方向) 60000.0
1293 北京 天津坦途企业管理咨询有限公司 岗位职责:1、负责汽车领域和通用领域的知识图谱构建,研发大规模知识图谱半自动/自动化构建方法… https://m.zhaopin.com//jobs/46918751900064432108/ 知识图谱高级工程师 五险一金 60000.0
3320 北京市朝阳区北辰世纪中心B座6层 北京钱得乐科技有限公司 岗位职责:1、充分理解公司战略和业务,前瞻性的构建公司技术系统总架构(平台、数据库、接口和应… https://m.zhaopin.com//jobs/233541338250884/ 技术负责人 节日福利;五险一金;年底双薪;餐补;员工旅游 60000.0
3639 北京市海淀区学院路51号首享科技大厦13层 暴风影音 职位描述:1、能够设计、规划、推动实现大型的算法解决方案;2、对海量数据的处理,需要涉及包括… https://m.zhaopin.com//jobs/145248343253246/ 高级算法架构师 60000.0
4090 昌平区回龙观东大街腾讯众创空间3层 北京云信合创软件有限公司 职位描述:1. 负责自动驾驶汽车激光/视觉SLAM算法、高清地图创建及特征匹配定位的研发工作… https://m.zhaopin.com//jobs/27945608100037064614/ 自动驾驶slam算法工程师 75000.0
178 厦门市思明区软件园二期观日路28号102室 厦门晨华贸易有限公司 我们正在开发一个大型互联网方向项目,一个基于视频的平台,打造在线真人社区。该项目已开发多年,… https://m.zhaopin.com//jobs/539583128250047/ python/django cto/senior developer 五险一金;年底双薪;绩效奖金;全勤奖;带薪年假 75000.0
4099 北京市海淀区东北旺西路君正大厦A座4层 北京智慧眼科技股份有限公司湖南分公司 职位描述:1)岗位职责:1、带领一个团队设计、开发和部署智慧眼人脸识别及算法产品的定制应用。… https://m.zhaopin.com//jobs/489650620250638/ 算法首席科学家 五险一金;年底双薪;绩效奖金;年终分红;股票期权;带薪年假 75000.0
4061 北京市海淀区上地东路35号颐泉汇写字楼516 北京智启蓝墨信息技术有限公司 岗位职责:1.负责规划蓝墨人工智能AIMOSO的发展,训练小蓝和小墨两个教育机器人快速成长,… https://m.zhaopin.com//jobs/56245302700039466710/ 高级人工智能工程师 健身俱乐部;五险一金;周末双休;餐补;带薪年假;员工旅游;弹性工作;定期体检 85000.0
333 北京市西城区阜成门外大街2号万通新世界A1008室 北京阿提拉科技有限公司 岗位职责:1、负责公司产品功能开发,优化,测试;稳定产品,减少软件保修,减少软件资源占用;2… https://m.zhaopin.com//jobs/147646001250611/ python开发工程师 85000.0
935 朝阳区思源大厦 北京梦疆咨询有限公司 思源集团为美股上市公司,最早做物业管理软件起家,此后涉及地产销售行业,2013年开始为政府i… https://m.zhaopin.com//jobs/711610520250330/ 企业信息系统安全部总经理 五险一金 125000.0
1469 深圳市福田区中央西谷大厦502(地铁上沙站) 深圳市快乐人生人力资源有限公司 岗位职责:职位描述:1. 负责公司大数据技术体系的规划;2. 配合产品经理进行大数据项目组织… https://m.zhaopin.com//jobs/202726787250057/ 财务大数据总监 125000.0

4541 rows × 7 columns





<div class="se-preview-section-delimiter"></div>

#  按照索引序列排序
df1.sort_index()
df.sort_index()




<div class="se-preview-section-delimiter"></div>
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary
0 北京市朝阳区裕民路12号 中国国际科技会展中心A座10层 大连飞创信息技术有限公司 岗位职责:1、按照有关制度和规范的要求,承担代码的编写工作。对开发任务、需求理解透彻,积极配… https://m.zhaopin.com//jobs/210653218250637/ c++开发工程师 五险一金;年底双薪;绩效奖金;加班补助;交通补助;餐补;采暖补贴;定期体检 17500.0
1 丰台区航丰路一号时代财富天地大厦28层 深圳市八斗才数据有限公司 岗位职责:1、 负责互联网网站产品开发;2、 参与产品设计、架构设计和代码编写;3、 负责问… https://m.zhaopin.com//jobs/cz562550030j000298… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 14000.0
2 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市芒柠科技有限公司 岗位职责:1、维护现有的平台代码。2、参与项目的架构设计,明确负责开发部分的设计需求。3、按… https://m.zhaopin.com//jobs/cz466965980j000547… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助 12500.0
3 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市源极光科技有限公司 技术要求:1、精通Python语言,熟悉Python多线程 socket通信机制;2、精通流… https://m.zhaopin.com//jobs/cz897833860j000551… python工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;年底双薪;带薪年假;弹性工作;员工旅游 12500.0
4 海淀区中关村软件园11号楼大洋大厦 深圳市芒柠科技有限公司 岗位职责:1. 负责云平台应用的开发维护;2. 负责服务器端API的设计与开发。岗位要求:1… https://m.zhaopin.com//jobs/cz730936640j000955… python开发工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;员工旅游;带薪年假;弹性工作;节日福利 12500.0
5 北京市海淀区苏州街3号大恒科技大厦南座17层 北京乐学创想教育科技有限公司 岗位职责:1、题库全栈开发和维护,包括需求分析、技术改进、后期维护2、构建数据分析模型,对视… https://m.zhaopin.com//jobs/244101282250512/ python工程师 节日福利;五险一金;餐补;创业公司 22500.0
6 北京市朝阳区来广营中街甲1号朝来科技产业园创远路36号院4-6号楼 北京尚德在线教育科技有限公司 岗位职责:1、负责公司电商平台如天猫微店、京东、苏宁等商城日常的运营管理,包括店铺整体策划、… https://m.zhaopin.com//jobs/424628486272009/ python自动化 创业公司;无试用期;绩效奖金;不加班 1500.0
7 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 职位职责:1. 基于 Python 的分布式集群管理软件开发2. 基于 Web 的工具软… https://m.zhaopin.com//jobs/567369733250977/ python实习生 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 9000.0
8 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 工作方向openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等技术要… https://m.zhaopin.com//jobs/567369733250978/ python开发实习(接受零基础) 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 9000.0
9 北京市海淀区上地农大南路88号万霖大厦3层 北京云纵信息技术有限公司 岗位职责:1)负责业务系统运行环境的基础服务管理,系统架构的维护;2)参与基于大数据平台的维… https://m.zhaopin.com//jobs/311289936253904/ linux运维工程师(熟练python) 节日福利;五险一金;绩效奖金;加班补助;交通补助;餐补;带薪年假;健身俱乐部 23000.0
10 后沙峪安庆大街巨鸿大厦A座5层 天津狮桥国际物流有限公司 一、岗位职责:1、搭建系统开发环境,完成系统框架和核心代码的实现,负责解决开发过程中的技术问… https://m.zhaopin.com//jobs/670247822251376/ python软件开发工程师 五险一金;绩效奖金;包住;餐补;通讯补贴;带薪年假 15000.0
11 北京市海淀区互联网金融中心21层 北京融七牛信息技术有限公司 岗位职责:1. 负责天机风控系统模型在线服务的架构设计、优化和研发工作; 2. 负责线上服务… https://m.zhaopin.com//jobs/435840920250697/ 高级python研发工程师(000650) 五险一金;绩效奖金;餐补;通讯补贴;补充医疗保险;定期体检;节日福利 32500.0
12 北京市朝阳区工体 北京科锐国际人力资源股份有限公司 岗位职责:1. 基于公司CRM系统 的产品研发、以及项目开发;2. 公司内部电商平台开发工作… https://m.zhaopin.com//jobs/263940938259405/ 直聘软件研发(golang , python, ruby) 节日福利;周末双休;五险一金;年底双薪;绩效奖金;年终分红;补充医疗保险;定期体检 17500.0
13 北京市海淀区西北旺东路10号院东区1号楼领创空间2层204A 北京彼速信息技术有限公司 职位要求:1.本科以上学历,计算机相关专业;2.熟悉B/S软件结构;3. 精通C#,熟练掌握… https://m.zhaopin.com//jobs/136473062250465/ c#/asp.net高级软件工程师 五险一金 15000.0
14 北京市东城区和平里东街11号雍和航星园三号楼一层 浙江齐聚科技有限公司北京分公司 1. 负责产品功能性需求的开发、维护。2. 负责优化系统的性能和稳定性3. 能独立完成个人承… https://m.zhaopin.com//jobs/32922521700041200311/ 高级java工程师 25000.0
15 (中关村)北京市海淀区王庄路1号清华同方科技广场A座17层 北京固鸿科技有限公司 岗位职责:1、负责公司软件系统集成开发;2、按规范编写系统需求、概要设计、详细设计及系统部署… https://m.zhaopin.com//jobs/137279958250759/ windows c++软件开发工程师 五险一金;年终分红;交通补助;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 15000.0
16 马尼拉分公司 皇室科技有限公司 只要你有能力,薪资不是问题!只要你有能力,薪资不是问题!任职要求1、计算机及相关专业,国家统… https://m.zhaopin.com//jobs/cz735252640j001365… php工程师/php程序员/php 住房补贴;每年多次调薪;健身俱乐部;包吃;包住;房补;通讯补贴;带薪年假 20000.0
17 北京市朝阳区北京市朝阳区广渠路3号竞园图片产业园1号库 Forgame–云游控股集团 岗位职责:1、负责在线娃娃机的管理后台系统的研发2、负责统计后台搭建 3、负责监控后台搭建1… https://m.zhaopin.com//jobs/571816225250634/ python后台研发工程师 25000.0
18 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 职位职责:1、负责产品的服务端开发;2、负责优化产品的性能,根据产品设计完成高质量的服务端产… https://m.zhaopin.com//jobs/562114535250039/ python开发工程师 [北京] 五险一金;年底双薪;绩效奖金;带薪年假;弹性工作;补充医疗保险;定期体检;员工旅游 17500.0
19 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 岗位职责:1、负责数据后台服务的设计、开发、优化、测试等研发工作;2、负责支撑业务的其他项目… https://m.zhaopin.com//jobs/cz562114530j000297… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 12500.0
20 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、爬虫系统开发和优化;2、文档识别和提取;3、互联网数据采集。专业素质要求:1、… https://m.zhaopin.com//jobs/444406089252927/ python爬虫数据采集实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
21 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1. 参与公司软件产品后台研发和维护工作;2. 参与建筑物联网数据分析算法的设计和… https://m.zhaopin.com//jobs/444406089252925/ python工程师招实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
22 北京市海淀区西二旗 广州百单网互联网科技有限公司 【岗位职责】1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、… https://m.zhaopin.com//jobs/444406089252924/ python开发工程师待遇从优 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
23 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/444406089252923/ 后端工程师/python工程师 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
24 北京市东城区和平里西街51号雍和宫壹中心A4楼3层 游族网络 岗位职责:1、创新项目及公司内部管理系统后台相关服务端的研发和维护;2、网页信息抓取结果的抽… https://m.zhaopin.com//jobs/264844217254121/ python开发工程师-base北京 15000.0
25 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市八斗才数据有限公司 工作职责:1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、效… https://m.zhaopin.com//jobs/562550032250030/ python开发工程师(北京) 五险一金;补充医疗保险;绩效奖金;定期体检;年底双薪;带薪年假;节日福利;员工旅游 20000.0
26 北京市海淀区北三环中路44号院 北京华信智原教育技术有限公司 岗位职责:1.积极参与教学大纲的制定,并按照教学大纲授课;2.通过QQ与学员交流,并耐心给学… https://m.zhaopin.com//jobs/134503487251283/ python老师 五险一金;年底双薪;带薪年假;员工旅游;高温补贴;节日福利 17500.0
27 昌平区建材城西路育新小区对面金燕龙办公楼传智播客 江苏传智播客教育科技股份有限公司北京分公司 工作职责:按照教学大纲高质量完成日常授课任务; 根据市场需求,改进教学方法和内容,完善教学体… https://m.zhaopin.com//jobs/374740583250235/ python导师j10091 五险一金;交通补助;餐补;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 23000.0
28 北京市海淀区西二旗 广州百单网互联网科技有限公司 工作方向:openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等。技… https://m.zhaopin.com//jobs/444406089252926/ python开发实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
29 北京市海淀区西二旗 北京升凯网络科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/540062934250725/ 后端工程师/python工程师 五险一金;年底双薪;绩效奖金;餐补;房补;定期体检;员工旅游 5000.0
4511 北京市朝阳区远洋国际中心A座2306 国信嘉宁数据技术有限公司 岗位职责:1、配合开发人员对公司主营产品的应用部署及环境调优;2、跟进解决系统运维技术问题;… https://m.zhaopin.com//jobs/268720686250316/ linux系统运维工程师 周末双休;五险一金;绩效奖金;餐补;带薪年假;定期体检 11500.0
4512 五棵松地铁附近 北京海思瑞格科技有限公司 职位描述:1. 通过深度学习方法解决临床问题;2. 搭建基于深度学习框架的时序信号处理和医疗… https://m.zhaopin.com//jobs/30130628000026679212/ 算法工程师(深度学习方向) 创业公司;每年多次调薪;定期体检;节日福利;绩效奖金;餐补;五险一金 18500.0
4513 北京市海淀区北三环西路32号恒润国际大厦9层911 北京法宣在线科技有限公司 带薪年假、子女教育金、父母赡养金、节日礼物、扁平管理、定期体检、年度旅游、全勤奖、发展空间大… https://m.zhaopin.com//jobs/56636092500023946611/ ai算法工程师-人人律智能大数据科技公司 创业公司;五险一金;股票期权;带薪年假;弹性工作;节日福利;员工旅游;定期体检 25000.0
4514 朝阳 北京未来进程信息技术有限公司 要求:1、PC端、移动端都可以测试;2、基本要求:功能测试的能力必须非常好。加分项:1、懂基… https://m.zhaopin.com//jobs/375117787250204/ 软件测试工程师 12500.0
4515 北京朝阳区望京阜通东大街6号方恒国际中心B座507 神州灵云(北京)科技有限公司 岗位职责:一、岗位要求:1、 根据产品需求、特点编写测试计划、测试方案、测试报告;2、 按照… https://m.zhaopin.com//jobs/415933738250011/ 软件测试工程师 五险一金;绩效奖金 9000.0
4516 北京市朝阳区望京利泽中一路中辰大厦3A02 北京泺喜教育科技有限公司 工作职责 :1、根据开发需求,高效完成相关程序的开发、测试;2、在工作或业余时间,完成对未来… https://m.zhaopin.com//jobs/38338392500023634710/ 应用工程师(软件方向) 7000.0
4517 北京市朝阳区大屯里金泉时代3单元1815 北京禾唐科技有限公司 岗位职责:. 负责卖家云平台前后端技术开发、优化和维护. 积极响应运营团队反馈的问题,提供技… https://m.zhaopin.com//jobs/cz196212610j000307… java开发工程师 20000.0
4518 北京市海淀区信息路30号上地大厦5层502室 北京恒济引航科技股份有限公司 工作职责:1、负责软件平台系统架构设计与实现及优化工作;2、负责总体设计和重要技术决策,指导… https://m.zhaopin.com//jobs/41176342400025277013/ 高级系统架构师 五险一金;通讯补贴;定期体检;员工旅游;节日福利;带薪年假;股票期权 22500.0
4519 海淀区腾讯公司 车音智能科技有限公司 【工作职责】:负责金融应用类产品移动终端的版本测试,版本类型包括H5应用、ios/安卓上的A… https://m.zhaopin.com//jobs/52755368000141636501/ 测试工程师(自选股) 周末双休;五险一金;免费班车;员工旅游 11000.0
4520 京市朝阳区朝外北街蓝筹名座D座2单元501 北京奋青榜科技有限公司 岗位职责:1 维护所有数据库稳定运行,关注数据库集群整体运行情况,持续发现和解决潜在的问题;… https://m.zhaopin.com//jobs/334310587250246/ dba 五险一金;年底双薪;绩效奖金;加班补助;带薪年假;弹性工作;员工旅游;节日福利 14000.0
4521 北京市朝阳区朝外大街20号联合大厦506 博易智讯(北京)信息技术有限公司 岗位职责:1、负责数据资源中心建设(大数据及分析)类项目的咨询和涉及工作,完成具体指定的数据… https://m.zhaopin.com//jobs/14231517100025758215/ bi资深售前/资深数据咨询顾问 五险一金;绩效奖金;定期体检;员工旅游;节日福利;不加班;带薪年假 17500.0
4522 北京市海淀区北四环西路9号银谷大厦1504 北京永鼎致远网络科技有限公司 岗位职责:1、基于海量数据,挖掘数据规律并建立分析模型;2、对海量数据进行提炼、分析、归纳用… https://m.zhaopin.com//jobs/38037292500028068015/ 数据挖掘工程师 五险一金;年底双薪;绩效奖金;交通补助;餐补;通讯补贴;补充医疗保险 17500.0
4523 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1 在业务场景下验证产品的功能与性能;2 进行大数据产品的安装部署与测试实施,进行… https://m.zhaopin.com//jobs/326767032250168/ 大数据工程师 五险一金;带薪年假;节日福利;员工旅游;定期体检;补充医疗保险 15000.0
4524 北京市西城区电研大厦 北京善友正信科技有限公司 工作职责:1、负责数据仓库ETL流程的优化及解决ETL相关技术问题;2、负责大数据分析系统和… https://m.zhaopin.com//jobs/229707532250069/ etl数据工程师 五险一金;节日福利;带薪年假 10000.0
4525 北京市丰台区国投财富广场 北京虹信万达科技有限公司 岗位职责:1. 研发自动化运维平台,提高运维、开发协作效率,规范操作流程;2. 研发基础服务… https://m.zhaopin.com//jobs/341610437250040/ 自动化运维开发工程师 五险一金;绩效奖金;节日福利 15000.0
4526 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1、hadoop,storm,hive,kafka,flume,hbase,ran… https://m.zhaopin.com//jobs/326767032250109/ 运维工程师 五险一金;带薪年假;节日福利;定期体检;员工旅游;补充医疗保险 11500.0
4527 北京市朝阳区安立路60号润枫商务B座24层 玩咖欢聚文化传媒(北京)有限公司 工作职责: 1、负责公司项目中产品的页面交互及功能实现; 2、负责前端新技术研究及公司前端框… https://m.zhaopin.com//jobs/203128481251262/ 前端技术经理 周末双休;五险一金;年底双薪;加班补助;餐补;带薪年假;弹性工作;员工旅游 30000.0
4528 北京市朝阳区建国路92号世茂大厦B座20层 北京极点触碰科技有限公司 岗位职责:1.参与产品评审,分析产品需求,根据项目需求和测试计划设计和编写测试用例;2.执行… https://m.zhaopin.com//jobs/cz525380730j000367… 测试工程师 五险一金;每年多次调薪;弹性工作;绩效奖金;带薪年假 11500.0
4529 北京市海淀区启明星辰大厦 北京望时高科科技有限公司 此职位为人力外包职位,不接受的请慎重投简历,谢谢!PS:此职位仅招收男性。岗位职责:1.负责… https://m.zhaopin.com//jobs/43216162800038403612/ linux系统工程师 8000.0
4530 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 任职要求:1)本科以上学历,有2年以上工作经验,至少1年大数据ETL开发经验、熟悉Hadoo… https://m.zhaopin.com//jobs/326767032250120/ 应用开发工程师 五险一金;带薪年假;节日福利;定期体检;补充医疗保险;员工旅游 11500.0
4531 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责1. 从事金融、政府行业大数据项目有关数据ETL处理的设计、实现和优化,涵盖数据采集… https://m.zhaopin.com//jobs/326767032250161/ etl工程师(项目) 五险一金;弹性工作;定期体检;节日福利;补充医疗保险;带薪年假 11500.0
4532 北京市海淀区西三旗建材城中路12号院26栋 北京荣联科创科技有限公司 岗位职责:1、根据具体项目要求,承担开发任务,按计划完成任务目标;2、根据用户需求按时完成开… https://m.zhaopin.com//jobs/48747592300027909814/ 研发工程师 绩效奖金;全勤奖;交通补助;餐补;定期体检;员工旅游;节日福利;带薪年假 5000.0
4533 北京市海淀区上地十街辉煌国际大厦 北京近颐科技有限公司 岗位职责:1负责服务集群的设计与搭建配置;2.负责Linux平台系统的安全管理;3.负责服务… https://m.zhaopin.com//jobs/292524636250052/ linux系统工程师 五险一金;交通补助;餐补;通讯补贴 8000.0
4534 北京市海淀区中关村软件园11号楼 北京精一强远科技有限公司 公司介绍:北京精一强远科技有限公司,致力于高端IT专业产品的专业设计、专业制造业务。公司拥有… https://m.zhaopin.com//jobs/287608631250052/ 软件开发工程师 五险一金;年底双薪;绩效奖金;包吃;通讯补贴;带薪年假;补充医疗保险;定期体检 12500.0
4535 北京市朝阳区双桥Dream2049园区世联文创一层107(东侧) 北京华沁智联科技有限公司 岗位职责1、 负责项目/产品的测试工作,参与产品需求分析,负责测试计划制定,并能预先评估项目… https://m.zhaopin.com//jobs/331013133250043/ 开发测试工程师(白盒) 创业公司;五险一金;绩效奖金;股票期权;餐补;带薪年假;弹性工作;节日福利 20000.0
4536 广顺北大街5号院内融创动力科技文化创意产业园B230 北京书生云科技有限公司 https://m.zhaopin.com//jobs/45496253700037561514/ 实施工程师 创业公司;周末双休;五险一金;带薪年假;弹性工作;通讯补贴 11500.0
4537 北京市东城区朝内大街298号 北京国研数通软件技术有限公司 岗位职责:1、负责大数据平台的开发和维护,负责大数据平台持续集成相关工具平台的架构设计与产品… https://m.zhaopin.com//jobs/120900932250257/ 大数据java开发工程师 12500.0
4538 北京市东城区灯市口大街33号国中商业大厦423室 北京树优信息技术有限公司 工作职责: 1 负责或参与流体分析技术服务项目2 负责或参与流体优化技术服务项目3 负… https://m.zhaopin.com//jobs/226257529250059/ 流体力学仿真优化工程师 五险一金;绩效奖金;加班补助;交通补助;房补;带薪年假;员工旅游;节日福利 7000.0
4539 朝阳区来广营叶青大厦北园308 北京行易道科技有限公司 岗位职责:1、进行高可靠高安全嵌入式软件测试,包含代码测试、功能测试、性能测试、安全性测试等… https://m.zhaopin.com//jobs/22757003700087605207/ 嵌入式软件测试工程师 14薪;健身俱乐部;周末双休;五险一金;餐补;带薪年假;弹性工作;补充医疗保险 10500.0
4540 东城区王府井东街8号 澳门中心B1层funwork 睿医(北京)数据技术有限公司 职位描述:1.根据项目需求,独立完成各类型的临床数据的统计分析工作2.参与产品统计模块的功能… https://m.zhaopin.com//jobs/cz752253770j000214… 医学统计经理 五险一金;股票期权 22500.0

4541 rows × 7 columns

df1




<div class="se-preview-section-delimiter"></div>

# 如果m-point列的值大于>=30,pay则显示Y,否则显示N
df1['pay'] = np.where(df1['m-point'] >= 30,'Y','N')
df1




<div class="se-preview-section-delimiter"></div>
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
gender id m-point pay
0 male 1001 10 N
1 female 1002 12 N
2 male 1003 20 N
3 female 1004 40 Y
4 male 1005 40 Y
5 female 1006 40 Y
6 male 1007 30 Y
7 female 1008 20 N




<div class="se-preview-section-delimiter"></div>

# 对符合多个条件的数据进行分组标记
df1
df1.loc[(df1['gender'] == 'male') & (df1['m-point'] >=30 ),'sign'] = '优秀'
df1
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
gender id m-point pay sign
0 male 1001 10 N NaN
1 female 1002 12 N NaN
2 male 1003 20 N NaN
3 female 1004 40 Y NaN
4 male 1005 40 Y 优秀
5 female 1006 40 Y NaN
6 male 1007 30 Y 优秀
7 female 1008 20 N NaN

pandas链接:https://blog.csdn.net/liufang0001/article/details/77856255

# 对符合多个条件的数据进行分组标记 df1 df1.loc[(df1[‘gender’] == ‘male’) & (df1[‘m-point’] >=30 ),’sign’] = ‘优秀’ df1 “`
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
gender id m-point pay sign
0 male 1001 10 N NaN
1 female 1002 12 N NaN
2 male 1003 20 N NaN
3 female 1004 40 Y NaN
4 male 1005 40 Y 优秀
5 female 1006 40 Y NaN
6 male 1007 30 Y 优秀
7 female 1008 20 N NaN

更多数据挖掘学习系列请访问:https://blog.csdn.net/xudailong_blog
pandas用法大全

2018-09-14 13:32:43 qq_43067912 阅读数 301

1. Python的安装和简介

1.1 Python基础常识

1.1.1 简介

Python是一门面向对象的解释性计算机设计语言

1.1.2 Python语言特色

  1. python是一门解释性语言
    • 解释性语言:在系统中运行时需要使用解释器(如Java、php等)
    • 编译性语言:在系统中运行时不需要使用解释器(如C,C++)
  2. 弱类型语言
    • 弱类型语言:变量在使用之前不需要提前声明变量的类型就可以直接使用
    • 强类型语言:变量在使用之前需要提前声明变量的类型
  3. 面向对象的语言
    • Python支持面向对象的编程,也在一定程度上支持面向过程和面向函数
  4. 胶水语言
    • Python的底层和扩张库都是由C语言写成,可以很好支持C和C++

1.2.3 Python语言的优点

  1. 简单
  2. 易学
  3. 速度快(这里指python的开发速度相对较快,python的运行速度相对一般)
  4. 免费,开源
  5. 高层语言(这里的高低指的是距离硬件的远近,python距离硬件相对比较远)
  6. 可移植性(python在linux,windows,mac os都可以使用)
  7. 可扩张性
  8. 可嵌入性

1.2 Python安装及版本检测

1.2.1 Python windows上安装需要注意事项

勾选add python to paith 若没有勾选就需要手动去配置环境变量

1.2.2 Python版本检测

  1. 方法一:在cmd中直接输入python,第一行会显示python的当前版本
  2. 方法二:在cmd中输入python -V
  3. 方法三:打开idle

1.3 程序执行

  • 交互式
    • 优势:适合探索、研究、学习需求
    • 劣势:不能做大项目
    • 四种执行方式:
    • 系统自带的Shell
    • IPython:增强版的Shell
    • QTconsole:GUI版的IPython
    • Jupyter Notebook:重要 =======================
  • 工程式
    • 优势:做大项目
    • 劣势:不适合研究性项目
    • 四种执行方式:
    • 新建py文件,命令行直接执行
      • 注意编码问题,能用编辑器修改编码
    • IDLE:兼具交互式和工程式执行
    • VScode:代码编辑器
    • PyCharm:重要 ======================

2. Python基本语法

2.1 注释、语句分类、关键字

2.1.1 注释

  • 定义:即注解,解释。分为单行注释和多行注释

  • 作用:

    1.给代码做出标注,进行解释和说明。方便别人阅读和理解代码
    2.debug的时候,可以通过注解来一行一行查找问题

2.1.1.1 单行注释

以#号开始,#后面的内容就是注解的内容。计算机不会去阅读#后面的内容

2.1.1.2 多行注释

以”’ 或者”“” 将注释内容包裹起来

2.1.1.3 注释的选择原则

单行注释 # 里面可以使用多行注释 ”’ 或者 “”“

多行注释”’ 或者 “”” 里面可以使用单行注释#

多行注释中可以使用另一种多行注释。如:”’ 中可以使用”“” 在”“”中可以使用”’

2.1.2 Python 语句分类

Python语句分为 单行语句 和 代码组(代码块)

单行语句:一行python代码

代码组:特定的语言结构,标志是:和缩进(如if ,while等)

2.1.3 关键字

  • 定义:关键字指系统已经使用的具有特殊功能的保留标识符

  • 查看系统保留关键字的方法:

    import keyword
    print(keyword.kwlist)

3. Python变量及数据类型

3.1 变量

  • 变量的定义:变量就是可以变化的量(在Python中更像是把变量的值贴到值上面,之后使用这个值就直接用贴在它上面的名字即可)

  • 变量赋值:(三种方式)

    方法一:(基本格式)
    变量 = 值
    方法二:(给多个变量赋相同的值)
    变量1 = 变量2 = 变量3 ... = 值
    方法三:(给多个变量赋不同的值)
    变量1,变量2,变量3... = 值1,值2,值3...
  • 获取变量的类型:(两种方法)

    1. type()
    print(type(变量))
    2. isinstance()-------> isinstance(查看的变量,类型)  返回的值是bool True or False
    print(isinstance(4int))
  • 获取变量在内存中的id:

    id()
    print(id(变量))
  • 更改变量的值:(对变量重新赋值即可)

    val = 1
    val = 2
    print(val)
  • 变量的命名规则:

    1. 使用英文,禁止使用中文
    2. 可以使用数字,但是不能用数字开头
    3. 特殊符号只能使用下划线_ 
    4. 区分大小写
    5. 命名必须要有意义
    6. 避免和系统保留的关键字冲突

3.2 数据类型

  1. Number 整型 (包含 :int、float、bool、complex)
  2. String 字符串
  3. List 列表
  4. Tuple 元组
  5. Set 集合
  6. Dict 字典

ps:

* Number中包含: int、float、bool、complex
* 容器数据类型: StringList、Tuple、Set、Dict
* 有序数据类型: StringList、Tuple
* 无序数据类型: Set、Dict

3.2.1 Number类型

3.2.1.1 Number类型:int

  • int整型的声明方式:(十进制、二进制、八进制、十六进制)

    1. 十进制(0-9)
    变量 = 十进制数字
    2. 二进制(0-1)
    变量 = 0b二进制数字
    3. 八进制(0-7)
    变量 = 0o八进制数字
    4. 十六进制(0-9a-f)
    变量 = 0x十六进制数字

3.2.1.2 Number类型:float

  • float浮点型声明方式:(小数和科学记数法)

    1. 小数:
    变量 = 带小数点的数字
    num = 3.14
    2. 科学计数法   e相当于10    
    变量 = 314e-2

3.2.1.3 Number类型:bool

  • bool类型只有两个值:True 和 False (True和False的首字母都要大写!)
  • True:表示肯定的,确定的答案
  • False:表示否定的答案

3.2.1.4 Number类型:complex

  • 复数定义:由实数部分和虚数部分组成,实数部分是实际存在的数字,虚数部分是现实世界中不存在的数字。在计算机中虚数的单位为j。

  • 声明一个复数的方法:

    方法一:
    变量 = a + bj
    方法二:
    变量 = complex(实数 + 虚数)           实数和虚数都只要填入纯数字即可,虚数部分不需要填入单位:j
    如:
    complex1 = complex34)   ==     complex1 = 3 + 4j

3.2.2 String 字符串类型

  • String在所有语言中都是使用最多的数据类型

  • String类型声明方式:(三种)

    方法一:单引号 ''
    变量 = '字符串内容'
    方法二:双引号 " "
    变量 = "字符串内容"
    方法三:三引号 ''' ''' 或者 """  """
    变量 = '''字符串内容'''  或者   变量 = """字符串内容"""
  • String声明方式选择原则:

    1. 单引号中可以使用双引号
    2. 双引号中可以使用单引号
    3. 三引号中可以使用单双引号
  • 转义字符:\

    1. 转义单引号:\'   (使单引号失去原有的特殊意义)
    str1 = '古人说:\'nnb\''
    2. 转义双引号:\"     (使双引号失去原有的特殊意义)
    str1 = "古人说,\"nnb\""
    3. 换行操作符:\n
    str1 = "人之初,\n性本善。"
    4. 缩进操作符:\t
    str1 = "\t人之初,性本善"
    5. 对\自身进行转义:\\
    str1 = '在字符串中输出\\'
    6. 续行符:\
    str1 = '在单行语句\'
            '过长时使用,自动续行'
    7. 原字符串:在字符串前面加上 r 或者 R ,转义字符串中所有的字符
    str1 = r'你好,\n再见\t!'

3.2.3 List 列表类型

  • 列表类型的标志:[ ] 中括号

  • 列表的声明方式:

    变量 = [值1,值2,值3......]
  • 创建一个空列表:

    方法一:  变量 = []
    方法二:  变量 = list()
  • 列表索引值

    正向索引: 0   1   2   3   4
    list1 = [100,200,300,400,500]
    反向索引:-5  -4  -3  -2  -1
  • 通过索引访问和修改列表中特定的值

    列表[index]
    列表[index] = 新的值     可以通过下标来修改列表中的值

3.2.4 Tuple 元组类型

  • 元组类型的标志:,逗号

  • 元组类型的声明方式:

    方法一:
    变量 = (值1,值2,值3....)
    方法二:
    变量 = 值1,值2,值3....
  • 元组索引值

    正向索引    0   1   2   3   4
    tuple1 = (100,200,300,400,500)
    反向索引   -5  -4  -3  -2  -1
  • 通过索引查看元组中的某个值

    元组[index]
    元组中的值不能随意修改

3.2.5 Set 集合类型

  • 集合的标志:无

  • 集合是无序容器,无法通过索引来访问其中的某个值

  • 集合中所有的数据都是唯一的,出现重复的会只保留唯一的其他删除

  • 集合的声明方式:

    变量 = {100,200,300,400,500}
  • 创建空集合:

    变量 = set()

3.2.6 Dict 字典类型

  • 字典的标志:{ }

  • 字典是无序数据,无法通过索引来访问其中的某个值

  • 字典的声明方式:

    变量 = {键:值,键:值,键:值...}
  • 访问和修改字典中的值 :

    字典是无序容器,不能使用索引来访问字典中的值。但是可以通过字典特有的键来访问字典中的值:
    dict[键]
    修改字典中的值:
    dict[键] = 新的值
  • 创建一个空字典:

    变量 = dict()
    dict1 = dict()
    变量 = {}
    dict1 = {}

3.2.7 查看数据类型的方法

3.2.7.1 type()

正常工作的时候不能用,因为效率太低了。工作原理是把目标数据和所有数据类型一一匹配询问,找到同目标数据类型相同的类型。

    result = type(变量名)
    print(result

3.2.7.2 isinstance()

工作效率比较高,把目标变量和指定的类型做比对,如果目标变量和指定类型为相同类型,则返回True;否则返回False

* 方法一,使用isinstance查看单一类型
    isinstance(变量,类型)
    如:
    var = 123
    result = isinstance(var,int)
    print(result)

* 方法二,使用isinstance查看目标变量是否属于两个类型中
    isinstance(变量,(类型一,类型二))
    如:
    var = 123
    result = isinstance(var,(int,str))
    print(result

3.3 数据类型转换

3.3.1 自动数据类型转换

  1. 自动数据类型转换是系统自发的,不需要人工干预的

  2. 自动数据类型转换会从精确度较小的数据类型向精确度较高的数据类型进行转换

  3. 自动数据类型转换多发生在运算或者判断的时候

    如:
    num1 = 25
    num2 = 25.0
    print(num1 + num2)
    又如:
    if 1:
        print('1会自动转化成True')

3.3.2 强制数据类型转换

3.3.2.1 int()

将其他数据类型转换成整型

整型:      无需转换
浮点数:    去掉小数部分,只保留整数部分
布尔值:    True 转换成 1False 转换成 0
复数:      复数无法转换成整型
字符串:    只有纯整数字符串才能转换成int。
列表,元组,集合,字典都不能转换成整型

3.3.2.2 float()

将其他数据类型转换成浮点数

整型:     在整数后面加上.0
浮点数:    无需转换
布尔值:    True 转换成 1.0     False 转换成 0.0
复数:     复数无法转换成浮点数
字符串:    只有纯整数字符串和纯浮点数字符串才能转换成浮点数
列表,元组,集合,字典都不能转换成浮点数

3.3.2.3 bool()

其他类型中,相当于bool中的False的情况

整型:       0
浮点型:     0.0
bool:      False
复数:      0j  或者  0+0j
字符串:    ''(空字符串)
列表:      [] 或者 list() 
元组:      () 或者 tuple()
集合:      set()
字典:      {} 或者 dict()

3.3.2.4 complex()

其他类型转换成复数complex()

整型:      整型+0j
浮点数:    浮点数+0j
布尔值:    True:1+0j    False:0j 或者 0+0j
复数:      无需转换
字符串:    字符串中只有纯整数,纯浮点数或者纯复数才能转换成复数
列表、元组、集合、字典都不能转换成复数

3.3.2.5 str()

其他类型转换成字符串

所有类型都可以转换成字符串,系统会自动给其他类型加上''让它变成字符串
如果要打印出带引号的字符串,可以使用命令repr()
    如: 
    list1 = [1,2,3]
    list1 = str(list1)
    print(repr(list1))

3.3.2.6 list()

其他类型转换成列表

整型、浮点型、复数、布尔值都不能转换成列表
字符串:字符串转换成列表,把字符串中的每个值转换成列表中的每一个值,顺序保持不变
列表: 无需转换
元组: 把元组中的每个值转换成列表中的值,顺序保持变
集合: 把集合转换成列表中的每一个值,顺序随机
字典: 把字典中的键转换成列表中的值,顺序随机

3.3.2.7 tuple()

其他类型转换成元组

整型、浮点数、复数、布尔值都不能转换成元组
字符串:字符串中的每个字符转换成元组中的一个值,顺序不变
列表: 列表中的每一个值转换成元组中的值,顺序不变
元组: 无需转换
集合: 集合中的每个值转换成元组中的每个值,顺序随机
字典: 字典中的每个键转换成元组中的一个值,顺序随机

3.3.2.8 set()

其他类型转换成集合

整型、浮点型、复数、布尔值都不能转换成集合
字符串: 字符串中的每个字符转换成集合中的一个值,顺序随机
列表: 列表中的每个值转换成集合中的一个值,顺序随机
元组: 元组中的每个值转换成集合中的一个值,顺序随机
集合: 无需转换
字典: 字典中的每个键转换成集合中的一个值,顺序随机

3.3.2.9 dict()

其他类型转换成字典

* 整型、浮点型、复数、布尔值都不能转换成字典
* 字符串: 不能转换成字典
* 列表: 只有特定的列表格式可以转换成字典
    1. 二级列表(且第二级容器的长度一样)
    list1 = [[键,值],[键,值],[键,值],[键,值],[键,值]]     or      list1 = [(键,值),(键,值),(键,值),(键,值)]

    2. 一级列表:只含有两个字符的一级列表
    list1 = ['键值','键值','键值','键值']

* 元组: 只有特定的元组格式才可以转换成字典
    1. 二级元组(且第二级容器的长度一样)
    tuple1 = ((键,值),(键,值),(键,值),(键,值))

    2. 一级元组:只含有两个字符的一级元组
    tuple1 = ('键值','键值','键值','键值')

* 集合: 只有特定的集合格式才可以转换成字典
    1. 二级集合(且第二级容器的长度一样)
    set1 = {(键,值),(键,值),(jia),()}

4. Python运算符

  1. 算术运算符
  2. 比较运算符(关系运算符)
  3. 逻辑运算符
  4. 位运算符
  5. 赋值运算符
  6. 成员运算符
  7. 身份运算符
  8. 转义字符

4.1 算术运算符

**      幂运算(最高优先级)
*       乘法运算
/       除法运算
//      取商运算(地板除)
%       取余运算
+       加法运算
-       减法运算

4.2 比较运算符(关系运算符)

比较运算符运算结果为布尔值: True 、False

<=      小于等于
>=      大于等于
<       小于
>       大于
==      等于
!=      不等于

4.3 赋值运算符

变量 = 变量 操作符 值 ——————————-> 变量 操作符= 值

**=     幂运算赋值
*=      乘法赋值
/=      除法赋值
//=     取商赋值
%=      取余赋值
+=      加法赋值
-=      减法赋值
=       普通赋值

4.4 逻辑运算

逻辑运算是布尔值之间的运算

  1. not 逻辑非运算 (逻辑运算中优先级最高)

    真变假,假变真
    not True == False
    not False == True
  2. and 逻辑与运算

    有假则假
    只有当 and 左右的两个条件都满足的时候 and 的结果才是为真
    True and False == False
    True and True == True
    False and False == False
  3. or 逻辑或运算

    有真则真
    当 or 左右两个条件有一个满足,则 or 的结果就是为真
    True or False == True
    False or False == False
    True or True == True
  4. xor 逻辑异或运算

    不同为真,相同为假
    在python中不支持异或操作。
    True xor False == True
    True xor True == False
    False xor False == False

4.5 位运算符

位运算就是在二进制基础上进行的逻辑运算

&       按位与运算
|       按位或运算
~      按位反转
^       按位异或运算
<<      左移          << 1 左移1位,相当于*2
>>      右移          >> 1 右移1位,相当于//2

4.6 成员运算符

检测变量是否在容器类数据中

in :
    变量 in 容器类数据(string,list,tuple,set,dict),检测字典的时候,只检测字典的键
    检测变量是不是在容器中

not in :
    变量 not in 容器类数据
    检测变量是不是不在容器中

4.7 身份运算符

判断两个变量在内存中的地址是否相同。

is:
    检测两个变量是否是同一个值

is not:
    检测两个变量是否不是同一个值
当数值相同的时候,哪些数据类型的id会相同
1. 整数:  -5以上的整数
2. 浮点数: 0以上的浮点数
3. 布尔值: 永远相同
4. 复数:  实数部分为0,虚数部分在0j以上
5. 字符串: 永远相同 

4.8 转移字符

转义字符: 通过某种特定的格式使得字符的意义发生改变,这就是转义字符,常见转义字符如下:

转义字符  作用描述        使用率
\        续行符           *
\\       反斜杠符号(\)     ***
\'       单引号           *****
\"       双引号           *****
\a       响铃
\b       退格(backspace)
\e       转义
\000     空
\n       换行             *****
\v       纵向制表符
\t       横向制表符        *****
\r       回车             *****
\f       换页
\oyy     八进制数,yy代表的字符,例如:\o12代表换行
\xyy     十六进制数,yy代表的字符,例如:\x0a代表换行
\other   其它的字符以普通格式输出

5.流程控制

  1. 流程:

    做事情的顺序就是流程,计算机中的流程就是代码执行的顺序.默认是从上到下
  2. 流程分类:

    1. 顺序结构
    2. 分支结构(单向分支,双向分支,多向分支,巢状结构)
    3. 循环结构(while循环 死循环 for…in循环)

5.1 顺序结构

python默认的代码执行顺序,默认从上到下执行代码

5.2 分支结构

5.2.1 单向分支

基本格式:

if 条件判断:
    条件为真时,执行语句
    ...

如:

num = 10
if num > 9:
    print(num)

5.2.2 双向分支

基本格式:

if 条件判断:
    条件为真的时候执行代码
    ...
else:
    条件为假的时候执行代码
    ...

如:

num = 10
if num > 10:
    print(num)
else:
    print(num,'比10小')

5.2.3 多向分支

基本格式:

if 条件1判断:
    条件1为真的时候执行代码
    ...
elif 条件2判断:
    条件2为真的时候执行代码
    ...
elif 条件3判断:
    条件3为真的时候执行代码
    ...
else:
    条件1,条件2,条件3都不满足执行代码
    ...

如:

day = 1
if day == 1:
    print('黄焖鸡')
elif day == 2:
    print('面条')
elif day == 3:
    print('快餐')
elif day == 4:
    print('汉堡')
else:
    print('不吃了')

5.2.4 巢状分支

基本结构:

if 条件1判断:
    条件1满足执行代码
    if 条件2判断:
        条件2满足执行代码
        if 条件3判断:
            条件1,条件2,条件3都满足执行代码
        else:
            条件3不满足执行代码
    else:
        条件2不满足执行代码
else:
    条件1不满足执行代码

如:

schooldoor = True
buildingdoor = True
classdoor = True


if schooldoor == True:
    print('校门开了,走到教学楼')
    if buildingdoor == True:
        print('教学楼门开了,走到教室')
        if classdoor == True:
            print('教室门开了,走进教室开始学习')
        else:
            print('教室门没开,班长帮忙开个门')
    else:
        print('教学楼门没开,班主任帮忙开个门')
else:
    print('校门没开,大爷帮忙开个门')

5.3 循环结构

5.3.1 while 循环

基本格式:

while 条件判断:
    条件为真时,执行代码
    ....

如: 计算0-100(包含100)所有数之和

num = 0
total = 0
while num <= 100:
    total += num
    num += 1
print(total)

又如: 输出十行十列的星星

i = 0
while i < 10:
    j = 0
    while j < 10:
        print('✨',end= '')
        j += 1

    print('\n',end='')
    i += 1

又如: 使用单循环输出10行10列的星星

i = 0
while i < 100:
    print('✨',end = '')
    if i % 10 == 9:
        print()
    i += 1

又如: 输出十行十列星星,隔行变色

i = 0 
while i < 10:
    j = 0
    while j < 10:
        if i % 2 == 0:
            print('✨',end = '')
        else:
            print('❤️',end = '')
        j += 1

    print()
    i += 1

又如: 使用单循环实现隔行变色

i = 0
while i < 100:
    if (i // 10) % 2 == 0: 
        print('✨',end = '')
    else:
        print('❤️',end = '')
    if i % 10 == 9:
        print()
    i += 1

5.3.2 死循环

基本格式:

while True:
    循环内容
    ... 

如: 判断用户输入的密码是否正确

error = False
passwd = 123

while True:
    userinput = input('请输入密码:')

    # 检查密码格式是否正确
    for each in userinput:
        if each not in '0987654321':
            error = True
            break

    if error == True:
        print('密码格式错误,请重新输入纯数字密码!')
        error = False
        continue
    else:
        if userinput == str(passwd):
            print('密码正确,登录成功!')
            break
        else:
            print('密码错误,请重新输入!')

5.3.3 for … in 循环

基本格式:

for 变量 in 容器:
    循环体
    ...

遍历除字典外的不等长的二级容器(列表,元组,集合)

for 变量1 in 容器:
    for 变量2 in 变量1:
        循环体
        ...

遍历字典中的键和值:

遍历键和值
for key in dict1:
    print(key,dict1[key])
遍历键
for i in xiaoming:
    print(i)

#同时遍历目录和值

for key,value in dict1.items():
    print(key,value)

#同时遍历目录和值
for k,v in games.items():
    print(k,v)

遍历等长的二级容器;

list1 = [
  ['a','b','c'],
  ['d','e','f'],
  ['g','h','i']
]
for x,y,z in list1:
    print(x,y,z)

5.3.4遍历列表

变量 = 0

while 变量 < 4: #4表示列表个数

​ print(列表变量 [变量])

​ 变量= 变量 + 1

5.3.5 break 和 continue

break: 终止循环

如: 输出0-100(包含100)的数字,遇到44则停止循环

i = 0:
while i <= 100:
    if i == 44:
        break
    print(i)
    i += 1

continue: 跳过本次循环,开始下一次循环. 开始下一次循环的同时要进行判断

如: 输出0 -100(包含100)的数字,遇到任何带4的则跳过

i = 0
while i <= 100:
    if i % 10 == 4 or i // 10 == 4:
        i += 1
        continue
    else:
        print(i)
        i += 1

6.函数

  • 定义: 把具有特定功能的代码打包就是函数
  • 作用
    1. 提高代码的复用率
    2. 提高开发效率
    3. 便于程序的维护

6.1 函数声明方式

def 函数名( ) :

​ pass(函数内容)

函数名( ) # 调用函数

6.2 函数名命名规则

  1. 使用英文,禁止使用中文
  2. 可以使用数字,但是不能用数字开头
  3. 所有的符号只能用_下划线
  4. 命名要有意义
  5. 严格区别大小写
  6. 避免和系统保留的关键字重名
  7. 避免和系统保留的函数重名

6.3 函数的参数

6.3.1 形参

函数在定义过程中,( )中的参数就是形参.形参没有实际意义,只是为了占位接收实参的值

6.3.1.1 普通形参

  • 没有实际意义,只是为了占位,等待接收实参对他赋值.
  • 如果定义了形参,形参也没有设置默认值,那么在调用函数的时候如果没有实参就会报错

如:

def hanshu(a,b):
    print(a)
    print(b)
hanshu(1,2)

6.3.1.2 带有默认值的形参

  • 在函数定义的时候如果给了形参默认值,那么就是带有默认值的形参
  • 那么如果调用的时候如果没有传入实参,形参会按默认值进行运算
  • 若调用的时候传入了实参,那么实参的值会覆盖形参的默认值,按实参的值进行运算

如:

def hanshu(a = 1, b = 2):
    print(a)
    print(b)


hanshu()
hanshu(3,5)

6.3.1.3 普通收集形参 * *分拆列表

  • 在不确定有多少实参传入的时候,可以使用普通收集形参: * 变量名
  • 收集到的实参会自动组成一个元组
  • 形参优先级: 普通形参 > 普通收集形参 > 关键字收集形参

如:

def hanshu(*tuple1):
    total = 0
    for each in tuple1:
        total += each
    print(total)

hanshu(1,2,3,4,5,6,7)

6.3.1.3 关键字收集形参 * *分拆字典

  • 关键字收集形参只能收集关键字实参的值
  • 收集到的关键字实参会组成一个字典,关键字作为字典的键,实参的值作为字典的值
  • 形参优先级: 普通形参 > 普通收集形参 > 关键字收集形参

”’
如: 传入人名和年纪,计算总和
def age(**dict1):
total = 0
for key in dict1:
total += dict1[key]
print(total)

age(‘徐凤年’= 22 ,’徐骁’= 55 , ‘徐龙象’= 18)




### 6.3.2 实参

#### 6.3.2.1 普通实参

* 在调用函数的时候,( )中的值就是实参.若没有通过关键字的方式进行传参的就是普通实参
* 实参的优先级: 普通实参 > 关键字实参

如:

def hanshu(a):
print(a)

hanshu(‘哗啦啦’)




#### 6.3.2.2 关键字实参

* 在调用函数的时候,通过关键字=值的方式来进行传参,这就是关键字实参
* 实参的优先级: 普通实参 > 关键字实参

如:

def hanshu(a,b):
print(a)
print(b)

hanshu(a=’关键’,b=’字’)




## 6.4 函数的返回值

* 函数按照有无返回值可以分为两类:

   1. 有返回值的函数 — 含有return , 函数执行之后,会返回一个结果,可以用变量接受
    2. 执行过程的函数 — 没有返回值的函数, 没有return , 函数执行只有不会返回一个结果,用变量接受为 none

* return的作用

1. 为函数的运行返回一个结果
2. 终止函数执行,一旦函数运行到了return,则在return之后的代码将不会运行





## 6.5 函数文档

### 6.5.1 查看函数文档的方法

* 方法一:  help( ) —---------help(函数名)

  如: 

help(print)

help(id)

help(type)

“`

  • 方法二: 函数名. _ _ doc _ _

    如:

    print.__doc__
    
    id.__doc__
    
    type.__doc__

6.5.2 定义函数文档的方法

“`
def 函数名():
”’
功能:
参数:
返回值:
”’

函数内容...

6.6 变量的作用域

6.6.1 全局变量

  1. 在任何区域或者页面都有效的变量
  2. 在全局环境中直接声明的变量就是全局变量
  3. 在局部环境中修改全局变量的值需要使用global关键字
var = '我是全局变量'
def hanshu():
    jubuvar = '我是局部变量'

6.6.2 局部变量

  1. 在特定的局部区域有效的变量就是局部变量
  2. 在函数内部(局部环境中)声明的变量就是局部变量
  3. 在内部函数中修改内部函数外部的非全局变量,需要使用nonlocal关键字

6.6.3 局部变量和全局变量的关系

  1. 在全局环境中不能直接使用局部变量和内部函数,需要闭包之后才能使用
  2. 在局部环境中可以访问全局变量,但是不能修改全局变量的值,需要使用global关键字

6.6.4 global 关键字

  1. 作用一: 使全局变量能进入局部环境

    var = '我是全局变量'
    
    def hanshu():
    global var
    var = '全局变量进入局部环境,修改全局变量'
    
    hanshu()
    print(var)
  2. 作用二: 将局部变量升级为全局变量

    def hanshu():
    global var
    var = '我升级成全局变量'
    
    hanshu()
    print(var)

6.6.5 内部函数

  1. 定义: 在一个函数的内部在定义一个函数,再定义的函数就是内部函数. 内部函数本质上相当于一个局部变量

    def outer():
    def inner():
        print('我是内部函数')
    inner()
    
    outer()
  2. 内部函数的作用域:

    1. 内部函数不能直接在全局环境中使用,需要使用闭包将它带到全局环境中
      1. 在函数内部可以调用内部函数
      2. 在函数内部需要先定义内部函数,之后才能调用

6.6.6 闭包

  1. 定义: 让局部变量和内部函数在函数的外部可以使用即闭包
  2. 作用: 让局部变量和内部函数突破局部作用域

闭包实现方法:

    1. 方法一: 使用global关键字实现闭包
lists = []

def hanshu():
    global lists

    a = '局部变量a'
    b = '局部变量b'

    def inner1():
        print('内部函数inner1')
    def inner2():
        print('内部函数inner2')

    lists = [a,b,inner1,inner2]

hanshu()

num_a = lists[0]
num_b = lists[1]
neibu1 = lists[2]
neibu2 = lists[3]

neibu1()
neibu2()
  1. 方法二: 使用return实现闭包
def hanshu():

    a = '局部变量a'
    b = '局部变量b'

    def inner1():
        print('我是内部函数inner1')
    def inner2():
        print('我是内部函数inner2')

    return [a,b,inner1,inner2]

lists = hanshu()

num_a = lists[0]
num_b = lists[1]
neibu1 = lists[2]
neibu2 = lists[3]

neibu1()
neibu2()
  1. 方法三: 使用return内部函数实现闭包
def hanshu():

    a = '局部变量a'
    b = '局部变量b'

    def inner1():
        print('我是内部函数inner1')
    def inner2():
        print('我是内部函数inner2')

    def bibao():
        return [a,b,inner1,inner2]

    return bibao


result = hanshu()
lists = result()

num_a = lists[0]
num_b = lists[1]
neibu1 = lists[2]
neibu2 = lists[3]

neibu1()
neibu2()

6.6.7 nonlocal 关键字

用于在内部函数中修改内部函数外部的非全局变量的值

通常用于内部函数中使用外部函数的局部变量。

如:

#nonlocal关键字:声明一个变量不是全局变量也不是局部变量(当前函数与另外一个函数之间的变量)  python3以后

#此处的变量才会成为全局变量

#外部函数
def outer():
    #声明变量
    var = 99#对于outer而言局部变量
    #内部函数
    def inner():
        nonlocal var#不是局部变量!
        var += 1
        print(var)

    #调用内部函数
    inner()

#调用函数outer
outer()

6.7 lambda 表达式

  1. 基本格式:

    函数名 = lambda 形参1,形参2,... : (自带return) 函数内容

    如:

    total = lambda no1,no2,no3 : no1 + no2 + no3
    
    result = total(1,2,3)
    print(result)
  2. 带有分支结构的lambda表达式:

    函数名 = lambda 形参1,形参2,... : 条件为真时执行结果 if 条件判断 else 条件为假时执行结果

    如:

    large = lambda no1,no2 : no1 if no1 > no2 else no2
    

    又如:

    large = lambda no1,no2,no3: no1 if no1 > no2 and no1 > no3 else no2 if no2 > no3 else no3

6.8 递归函数

在函数中调用函数自身的函数就叫做递归函数

如:

def digui(num):

    print(num)

    if num > 0:
        digui(num - 1)
    else:
        print('-------------------')

    print(num)

6.9 函数文档

查看函数文档的方法:

help(函数名)
    此方法会直接输出函数文档的内容

函数名.__doc__
    直接输出显示函数文档的内容元字符串(可以使用print(函数名.__doc__)来解决无格式问题)

定义函数文档的方法:

def 函数名(参数):
    '''
    这里编写函数文档
    '''

    这里编写函数的code...

示例:**

#定义函数文档的方式
def funName(**car):
    '''
    这里是函数文档
    本函数功能是...
    要求的参数类型是...
    返回的数据是...
    '''

    print('函数文档的定义方法')

help(funName)
 #查看函数文档

'''注释:
函数文档的作用是对函数进行说明,便于阅读和快速掌握函数的使用,通常函数文档需要具有以下信息:
1.函数的作用
2.函数的参数介绍(需要几个参数,分别是什么类型)
3.函数的返回值(数据和类型)
'''

7. 字符串

7.2 字符串基本操作

  1. 字符串连接操作: +

    string1 = '大风车'
    string2 = '吱呀吱呀转'
    result = string1 + string2 
    print(result)
  2. 字符串复制操作: *

    string1 = '女神'
    result = string1 * 3
    print(result)
  3. 字符串索引操作: [ ]

    string1 = '我是字符串'
    print(string1[4])
    print(string1[-1])
  4. 字符串分片操作: [::]

    分片 [起始位置:结束位置:间隔]     --- 不包含结束位置
    
    string1 = '我是字符串'
    string2 = string1[1:3]
    string3 = string1[::2]

7.2 字符串函数

7.2.1 大小写相关

capitalize( )

使字符串第一个第一个字母大写

string1 = 'i love you'
result = string1.capitalize()
print(result)

title( )

使字符串字母满足标题化格式(所有单词首字母大写)

string1 = 'i love you'
result = string1.title()
print(result)

upper( )

使字符串中的所有字母都大写

string1 = 'who is your dad ?'
result = string1.upper()
print(result)

lower( )

使字符串中所有字母都小写

string1 = 'who is your Dad ? '
result = string1.lower()
print(result)

swapcase( )

将字符串中的大小写互换

string1 = 'I am your Dad !'
result = string1.swapcase()
print(result)

7.2.2 获取长度及出现次数

len( )

len( )为内置函数

获取字符串或其他容器的长度

string1 = '我是字符串'
result = len(string1)
print(result)

count( )

count(指定字符,起始,终止)

获取指定字符在指定范围内出现的次数,若没有出现过,返回 0

string1 = 'the only way to longer the day is to steal time from night!'
result = string1.count('o',2,6)
print(result)

7.2.3 获取索引值

find( )

获取指定字符在字符串中指定范围内第一次出现的索引值. 若没有出现则返回 -1

find(指定字符,起始,终止)

string1 = '8000 words in the world, only the love can kill man'
result = string1.find('a')
print(result)

index( )

获取指定字符在字符串中指定范围内第一次出现的索引值,若没有出现则直接报错

string1 = '8000 words in the world, only the love can kill man'
result = string1.index('a')
print(result)

7.2.4 检测类字符串函数

startswith( )

检测字符串是否以指定字符在指定范围内开头

startswith(指定字符,起始,终止)

string1 = 'you are the sun in the world'
result = string1.startswith('a',4,8)
print(result)

endswith( )

检测字符串是否以指定字符在指定范围内结尾

endswith(指定字符,开始,结束)

string1 = 'you are the sun in the world'
result = string1.endswith('w',-5)
print(result)

istitle( )

检测字符串是否满足标题格式

string1 = 'we all forgot the story of the passtime'
result = string1.istitle()
print(result)

isupper( )

检测字符串是否满足全部大写

string1 = 'WE ARE THE DOTA-ALLSTARS'
result = string1.isupper()
print(result)

islower( )

检测字符串是否满足全部字母小写

string1 = 'we are dota-allstars'
result = string1.islower()
print(result)

isdigit( )

和 isnumeric( ) isdecimal( ) 相同

判断字符串是否全部都是数字

num = '123456'
result = num.isdigit()
print(result)

isalnum( )

判断字符串是否由字母或者其他文字或者数字组成 (不包含符号)

string1 = 'sad is the reason of thinking too much'
result = string1.isalnum()
print(result)

isalpha( )

判断字符串是否由字母或者其他文字组成(不包含符号和数字)

string1 = 'these are only words'
result = string1.isalpha()
print(result)

isspace( )

判断字符串是否由空白字符组成

string1 = '\n\t\r\\ '
result = string1.isspace()
print(result)

7.2.5 切割和拼接

split( )

将字符串按指定字符进行切割,切割之后放入列表内,返回值是列表

split(指定字符)[-1]

[-1]意思是切最后一块,索引

string1 = '我-有一剑-可开天门!'
list1 = string1.split('-')
print(list1)

join( )

用指定字符将列表中的元素拼接成字符串

‘指定字符’.join(列表)

list1 = ['我','有一剑','可开天门']
string2 = '!'.join(list1)
print(string2)

splitlines( )

使用字符串中的换行符号\n来切割字符串

string1 = '天不生李淳罡,\n剑道万古如长夜'
list1 = string1.splitlines()
print(list1)

7.2.6 填充类

zfill( )

指定字符长度,用0从左到右进行填充

string1 = '123'
result = string1.zfill(10)
print(result)

0000000123

center( )

指定字符长度,原字符串居中,使用指定字符填充到指定长度

center(长度,指定字符)

string1 = '呵呵姑娘'
result = string1.center(10,'_')
print(result)

---呵呵姑娘---

ljust( )

指定字符长度,原字符串居左,使用指定字符填充至指定长度

ljust(长度,指定字符)

string1 = '呵呵姑娘'
result = string1.ljust(10,'-')
print(result)

呵呵姑娘------

rjust( )

指定字符长度,原字符串居右,使用指定字符填充至指定长度

rjust(长度,指定字符)

string1 = '呵呵姑娘'
result = string1.rjust(10,'-')
print(result)

------呵呵姑娘

7.2.7 清除字符串类

strip( )

清除字符串左右两边的指定字符

string1 = '___呵呵___'
result = string1.strip('_')
print(result)

呵呵

lstrip( )

清除字符串左边指定的字符

string1 = '___呵呵___'
result = string1.lstrip('_')
print(result)

呵呵___

rstrip( )

清除字符串右边指定的字符

string1 = '___呵呵___'
result = string1.rstrip('_')
print(reuslt)

___呵呵

7.2.8 字符的替换操作

maketrans( )

字典名 = ”.maketrans(所有要替换的字符,新的字符)

制作存有替换映射关系的字典

string1 = '十年修得宋玉树,百年修得徐凤年,千年修得吕洞玄'
dict1 = ''.maketrans('十百千','百千万')

translate( )

字符串.translate(字典名)

将字符串按照存有映射关系的字典进行修改

newstring = string1.translate(dict1)
print(newstring)

百年修得宋玉树,千年修得徐凤年,万年修得吕洞玄

replace()

字符串的替换

格式: 字符串.replace(要替换的字符,替换的新字符)

string1 = '十年修得宋玉树,百年修得徐凤年,千年修得吕洞玄'

dict2 = string1.replace('十年','二十年',)
print(dict2)

7.2.9 format( ) 格式化

format( ) 基本格式:

string1 = '{}在{}看见了{}'
result = string1.format('我','莆田','刘姥姥')
print(result)

我在莆田看见了刘姥姥

format( ) 四种传参方式:

  1. 按位置进行传参
string1 = '{}在{}看见了{}'
result = string1.format('我','莆田','刘姥姥')
print(result)

我在莆田看见了刘姥姥
  1. 按位置标识传参
string1 = '{2}在{1}看见了{0}'
result = string1.format('刘姥姥','莆田','我')
print(result)

我在莆田看见了刘姥姥
  1. 按关键字传参
string1 = '{who}在{where}看见了{what}'
result = string1.format(what='刘姥姥',where='莆田',who='我')
print(result)

我在莆田看见了刘姥姥
  1. 使用容器传参
string1 = '{0[0]}在{0[1]}看见了{0[2]}'
result = string1.format(['我','莆田','刘姥姥'])
print(result)

我在莆田看见了刘姥姥

format( )实现居中 居左 居右

  1. 居中填充 center( ) {:填充物^长度}
string1 = '我喜欢吃{:*^11}你喜欢么'
result = string1.format('小龙虾')
print(result)

我喜欢吃****小龙虾****你喜欢么
  1. 居左填充 ljust( ) {:填充物<长度}
string1 = '我喜欢吃{:*<11}你喜欢么'
result = string1.format('小龙虾')
print(result)

我喜欢吃小龙虾********你喜欢么
  1. 居右填充 rjust( ) {:填充物>长度}
string1 = '我喜欢吃{:*>11}你喜欢么'
result = string1.format('小龙虾')
print(result)

我喜欢吃*******小龙虾你喜欢么

format( ) 实现进制转换

  1. 二进制 {:b}
num = '{}转换成二进制为:{:b}'
result = num.format(10,10)
print(result)
  1. 八进制 {:o}
num = '{}转换成八进制为:{:o}'
result = num.format(10,10)
print(result)
  1. 十进制: {:d}
num = '{}转换成十进制为:{:d}'
result = num.format(10,10)
print(result)
  1. 十六进制: {:x}
num = '{}转换成十六进制为"{:x}'
result = num.format(10,10)
print(result)

8. 内建函数

8.1 类型转换相关

int( ):

​ 将其他类型转换成整型

float( ):

​ 将其他类型转换成浮点型

bool( ):

​ 将其他类型转换成布尔值

complex( ):

​ 将其他类型转换成复数

str( ):

​ 将其他类型转换成字符串

list( ):

​ 将其他类型转换成列表

tuple( ):

​ 将其他类型转换成元组

set( ):

​ 将其他类型转换成集合

dict( ):

​ 将其他类型转换成字典

8.1.2 sum( ) 函数

sum() 方法对系列进行求和计算。

>>> sum([1, 2, 3,], 4)
10
>>> sum((1, 2), 3)
6

8.2 变量相关

type( ):

​ 查看变量的类型

id( ):

​ 查看变量的内存id

print( ):

​ 打印

locals( ):

​ 查看当前环境中的所有变量

8.3 数学相关

  • abs( )

    获取一个数值的绝对值(数据的非负数格式)

num = -99
result = abs(num)
print(result)
  • max( )

    获取序列或者多个参数的最大值

list1 = [1,2,3,4,5,6,7,8,9]
result = max(list1)
print(result)

result = max(1,2,3,4,5,6,7,88,0)
print(result)
  • min( )

    获取序列或者多个参数的最小值

list1 = [1,2,5,6,4,1,345,68,2]
result = min(list1)
print(result)

result = min(1,214,5,6,7235,67)
print(result)
  • round( )

    四舍五入,可以加参数来指定保留几位小数 (整数位,奇数进,偶数不进)

num = 3.1415
result = round(num,3)
print(num)
  • pow( )

    计算指定数字的n次方

result = pow(2,3)   # 2 ** 3
print(result)
  • bin( )

    将数字转换成二进制

result = bin(10)
print(result)
  • oct( )

    将数字转换成八进制

result = oct(10)
print(result)
  • hex( )

    将数字转换成十六进制

result = hex(10)
print(result)

8.4 Ascii码相关

Ascii 就是美国标准信息交换代码

  • chr( )

    将指定的Ascii码转换成对应字符

result = chr(97)
print(result)
  • ord( )

    将指定的字符转换成ascii码

result = ord('a')
print(result)
  • repr()

    原样输出字符串的定义格式,单双引号转义

    a = '我好\n喜欢\t上一个人'
    print(a)
    print(a)
  • eval( )

    将字符串转换成代码

string1 = 'num + 1'
num = 1
num = eval(string1)
print(num)

8.5 Python数学常量

常量 描述
pi 数学常量 pi(圆周率,一般以π来表示)
e 数学常量 e,e即自然常数(自然常数)。

9. 数学模块

在使用数学模块之前需要先导入模块

import math

  • ceil( )

    向上取整

num = 0.1
result = math.ceil(num)
print(result)
  • floor( )

    向下取整

num = 1.9
result = math.floor(num)
print(result)
  • pow( )

    和内置函数功能一样,计算指定值的n次方,返回值是浮点数

result = math.pow(2,3)
print(result)
  • sqrt( )

    开平方根

result = math.sqrt(4)
print(result)
  • fabs( )

    功能和内建函数abs( )功能一样,取绝对值,返回值是浮点数

num = -9
result = fabs(num)
print(result)
  • modf( )

    将指定数字拆分成两部分,一部分为小数部分,一部分为整数部分

num = 12.55
result = math.modf(num)
print(result)
  • copysign( )

    让前面数字的符号和后面数字的符号始终保持一致

result = math.copy(-9,-2)
print(result)
  • fsum( )

    功能和sum( )一样,计算序列的和. 返回值是浮点数

list1 = [1,2,3,4,5,6]
result = math.fabs(list1)
print(result)
  • Pi 和 e
  • pi是圆周率
  • e 是自然数
result = math.pi
print(result)

result = math.e
print(result)

10. 随机数模块

使用随机数模块前需要先载入该模块

import random

  • random( )

    随机获取 0-1 不包含1的随机浮点数

num = random.random()
print(num)
  • randint(a,b )

随获获取指定两数区间整数

num = random.randint()
print(num)
  • shuffle( )

    将一个序列随机打乱,直接改变原序列的顺序

list1 = [1,2,4,5,6,7,89]
random.shuffle(list1)
print(list1)
  • choice( )

    随机从一个序列中取出一个元素

list1 = [1,2,4,5,7,8,5,3]
result = random.choice(list1)
print(result)
  • uniform( )

    随机获取指定范围内的一个浮点数

result = random.uniform(1,100)
print(result)
  • randrange( )

    随机获得指定范围内的整数

result = random.randrange(1,100)
print(result)

11. 列表

11.1 列表基本操作

11.1.1 创建列表

11.1.1.1 创建空列表

list1 = list()

list1 = []

11.1.1.2 创建有数据的列表

list1 = [1,23,4,5]
list2 = [1]

11.1.2 访问列表中的值

列表名[索引值]

list1 = ['徐凤年','姜泥','裴南苇','青鸟']
result = list1[1]
print(result)

11.1.3 修改列表中的值

列表名[索引值] = 新的值

list1[1] = '白狐'
print(list1[1])

11.1.4 删除列表中的值

del 列表名[索引值]

del list1[1]
pirnt(list1)

del 可以删除任何变量

del list1

11.2 列表的序列操作

11.2.1 序列相加 +

list1 = [1,2,3]
list2 = [4,5,6]
list3 = list1 + list2
print(list3)

11.2.2 序列相乘 *

list1 = ['徐凤年']
list2 = list1 * 3
print(list2)

11.2.3 分片 [ : : ]

[起始:终止:间隔] 都不包含终止位置

list1 = [1,2,3,4,5,6,8,9]
result = list1[1:2]
print(result)

result = list1[:4]
print(result)

result = list1[::2]
print(result)

11.2.4 成员检测

in not in

list1 = ['徐凤年','姜泥','王初东','裴南苇']
result = '徐凤年' in list1
print(result)

result = '白狐脸' not in list1
print(result)

11.2.5 len( ) \ max( ) \ min( )

list1 = [1,23,4,5,6,7,8]
result = len(list1)
print(result)

result = max(list1)
print(result)

result = min(list1)
print(result)

11.3 遍历列表

遍历一级列表

list1 = ['徐凤年','姜泥','白狐脸','裴南苇','鱼幼薇','青鸟']
for each in list1
    print(each)


num = 0
while num < len(list1):
    print(list1[num])

遍历等长二级列表

list1 = [
  ['北凉','徐凤年','徐骁'],
  ['西蜀','曹常卿','姜泥'],
  ['离阳','人猫','元本溪']
]
for x,y,z in list1:
    print(x)
    print(y)
    print(z)

遍历不等长的二级列表

list1 = [
  ['北凉','徐凤年'],
  ['曹常卿','姜泥'],
  ['离阳','人猫','元本溪','徐骁']
]

for i in list1:
    for j in i:
        print(j)

11.4 列表推导式

11.4.1 普通格式

list1 = [1,2,3,4,5,6,7,8,9]
list2 = [i * 2 for i in list1]
print(list2)

11.4.2 带有条件的列表推导式

list1 = [1,2,3,4,5,6,7,8]
list2 = [i for i in list1 if i % 2 == 0]
print(list2)

11.4.3 多循环列表推导式

list1 = [1,2,3,4,5,6,7,8]
list2 = [9,10,11,12,13,14]
list3 = [i + j for i in list1 for j in list2]
print(list3)

11.4.4 带条件的多循环列表推导式

list1 = [1,2,3,4,5,6,7,8]
list2 = [9,10,11,12,13,14]
list3 = [i + j for i in list1 for j in list2 if list1.index(i) == list2.index(j)]
print(list3)

11.5 列表函数

  • append( )

    向列表的末尾添加元素

    list1 = [1,2,3,4]
    list1.append(5)
    print(list1)
  • insert( )

    向列表指定索引位置前添加指定元素

    insert(索引,值)

    list1 = [1,2,3,4]
    list1.insert(1,'人')
    print(list1)
  • extend( )

    使用一个列表去扩充另一个列表

    list1 = [1,2,3,4,5,6]
    list2 = [7,8,9,10,11]
    list1.extend(list2)
    print(list1)
  • pop( )

    将列表指定位置的值取出来. 默认取出最后一位,删除操作

    list1 = [1,2,3]
    result = list1.pop(0)
    print(result)
    print(list1)
    
    result = list1.pop()
    print(result)
    print(list1)
  • remove( )

    将列表中的指定元素删除,如果有多个重复的值,默认删除第一个

    remove(值)

    list1 = ['人猫','徐凤年','姜泥']
    list1.remove('人猫')
    print(list1)
  • clear( )

    将列表清空

    list1 = [1,2,3]
    list1.clear()
    print(list1)
    
  • copy( )

    复制列表,复制得到的列表和原列表的内存id不同

    如果我们复制的是一个二维列表,外层列表变动,复制出来的结果不会变,但是二维列表会随之改变,因为在内存中用的是同一个id

    list1 = [1,2,3,4]
    list2 = list1.copy()
    print(list2)
    print(id(list2))
  • count( )

    计算字符串中指定字符出现的次数 不同于字符串的函数count(指定字符,起始,终止)

    list1 = [1,1,1,23,44,24,15,66,3]
    result = list1.count(1)
    print(result)
  • index( )

    获取列表中指定元素出现的索引值

    list1 = ['徐骁','徐凤年','姜泥','裴南苇']
    result = list1.index('徐凤年')
    print(result)
  • reverse( )

    将列表排列顺序颠倒,直接改变原列表

    list1 = [1,2,3,4]
    list1.reverse()
    print(list1)
  • sort( )

    将列表按从小到大的顺序排列. 可用参数key reverse 默认是false,设置为True将是倒序

    list1 = [1,2,3,4,5]
    list1.sort()
    print(list1)

    将列表按从大到小的顺序排列

    list1.sort(reverse=True)
    print(list1)

    将列表按自定义的规则排列

    def func(num):    #一定要有形参
    return num // 10        # 一定要有return
    
    list1.sort(key=func,reverse=True)
    print(list1)

12.元组

12.1 创建元组

12.1.1 创建空元组

方法一: 使用tuple( )

tuple1 = tuple()
print(tuple1,type(tuple1))

方法二:使用( )

tuple1 = ()
print(tuple1,type(tuple1))

12.1.2 创建一个元素的元组

tuple1 = (1,)
print(tuple1,type(tuple1))

tuple1 = 1,
print(tuple1,type(tuple1))

12.1.3 创建多个元素的元组

tuple1 = (1,23,2,4,5)
print(tuple1,type(tuple1))

12.2 元组的基本操作(增删改查)

元组不能直接增加,删除,修改元素,

元组基本操作只支持查看元组内的元素: 元组名[索引]

tuple1 = (1,23,4,5,5,67)
print(tuple1[1])

12.3 元组的序列操作

12.3.1 序列相加

tuple1 = (1,2,3,4)
tuple2 = (5,6,7,8)
result = tuple1 + tuple2
print(result)

12.3.2 序列相乘

tuple1 = (1,2,3)
result = tuple1 * 2
print(result)

12.3.3 分片 [ : : ]

tuple1 = ('徐凤年','徐骁','姜泥','青鸟','王仙之','曹长青','白狐脸儿')
print(tuple1[:2])   
print(tuple1[3:])   
print(tuple1[1:4])
print(tuple1[::2])  # [起始:终止(不包含):间隔]

12.3.4 成员检测

tuple1 = ('徐凤年','徐骁','姜泥','青鸟','王仙之','曹长青','白狐脸儿')
result = '徐凤年'in tuple1
print(result)

result = '啦啦啦' not in tuple1
print(result)

12.4 元组的序列函数

12.4.1 len() , max(), min(), tuple()

tuple1 = ('徐凤年','徐骁','姜泥','青鸟','王仙之','曹长青','白狐脸儿')

length = len(tuple1)
print(length)

tuple2 = (1,23,22,4,5,53,6)
print(max(tuple2))
print(min(tuple2))

list1 = [1,2,3]
tuple3 = tuple(list1)
print(tuple3)

12.5 元组的遍历

12.5.1 遍历普通元组

tuple1 = ('徐凤年','徐骁','姜泥','青鸟','王仙之','曹长青','白狐脸儿')
for i in tuple1:
    print(i)

12.5.2 遍历等长的二级元组

tuple1 = ((1,2),(3,4),(5,6))
for x,y in tuple1:
    print(x,y)

12.5.3 遍历不等长的二级元组

tuple1 = ((1,2),(3,4,5),(6,7,8,9))
for i in tuple1:
    for j in i:
        print(j)

12.5.4 访问多级元组中的值

tuple1 = ((1,2),(3,4,5),(6,7,8,9))
print(tuple1[0][1])

12.6 元组推导式

元组推导式的结果是一个生成器,生成器如果不遍历一遍的话,是不会使用的.

12.6.1 普通元组推导式

tuple1 = (1,2,3,4,5,6)

tuple2 = (i * 10 for i in tuple1)

for each in tuple2:  # 如果不遍历的话,tuple2这个生成器将一直存在但是不做任何操作
    print(each)

12.6.2 带有条件的元组推导式

tuple1 = (1,2,3,4,5,6)

tuple2 = (i * 10 for i in tuple1 if i % 2 == 0)

for each in tuple2:
    print(each)

12.6.3 多循环元组推导式

tuple1 = (1,2,3,4,5)
tuple2 = (10,20,30,40)

tuple3 = (i + j for i in tuple1 for j in tuple2)

for each in tuple3:
    print(each)

12.6.4 带有条件判断的多循环元组推导式

tuple1 = (1,2,3,4)
tuple2 = (5,6,7,8)

tuple3 = (i * j for i in tuple1 for j in tuple2 if tuple1.index(i) == tuple2.index(j))

for each in tuple3:
    print(each)

12.7 元组专用函数

  1. index( ) 查看指定元素在元组中的索引值

    tuple1 = ('华为','小米','大米','三星','iphone')
    
    print(tuple1.index('华为'))
    
    print(tuple1.index('三星'))
  2. count( ) 计算指定元素在元组中出现的次数

    tuple1 = ('华为','华为','三星','三星','iphone')
    
    print(tuple1.count('华为'))
    
    print(tuple1.count('三星'))

13. 字典

13.1 创建字典

13.1.1 创建空字典

方法一: 使用{ }来创建空字典

dict1 = {}
print(dict1,type(dict1))

方法二: 使用 dict( ) 来创建空字典

dict1 = dict()
print(dict1,type(ditc1))

13.1.2 创建多个元素的字典

方法一: 使用 { } 来创建多个元素的字典

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
print(dict1,type(ditc1))

方法二: 使用dict( ) 来创建多个元素的字典

#1.dict(字典)
dict1 = {{'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}}
print(dict1,type(dict1))

#2.dict(等长二级容器)
tuple1 = (('小丽','马丽丽'),('静静','刘文静'),('瑶瑶','王瑶'),('紫薇','孙紫薇'))
dict1 = dict(tuple1)
print(ditc1,type(dict1))

#3.dict(关键字传参)
dict1 = dict(小丽='马丽丽',静静='刘文静',瑶瑶='王瑶',紫薇='孙紫薇')
print(dict1,type(dict1))

#4.dict(zip(键的容器,值的容器))
keys = ('小丽','静静','瑶瑶','紫薇')
values = ('马丽丽','刘文静','王瑶','孙紫薇')
dict1 = dict(zip(keys,values))

13.2 字典的基本操作(增删改查)

13.2.1 字典中直接增加新元素

字典[键] = 值

如果键不存在在字典中,则直接将这个键值对添加到字典中作为新元素

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}

dict1['班长'] = '戴帅林'

print(dict1)

13.2.2 字典中直接删除元素

del 字典[键]

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
del dict1['小丽']
print(dict1)

13.2.3 字典中直接修改元素

变量[键] = 新值

dict1 =  {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
dict1['小丽'] = '马冬梅'

print(dict1)

13.2.4 字典中查看元素的值

变量[键]

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}

print(dict1['小丽'])

13.3 字典的序列操作

序列相加,序列相乘,分片这些序列操作字典都不支持

字典只能进行成员检测(只检测字典中的键)

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
result = '小丽' in dict1
print(result)

reslut = '王贷' not in dict1
print(result)

13.4 字典的序列函数

len()

计算字典中元素的长度

max()

获取字典中最大的键

min()

获取字典中最大的值

dict()

创建空字典或者将其他类型转化字典

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}

length = len(dict1)
print(length)

dict2 = {1:'数字',2:'数字',3:'数字',4:'数字',5:'数字',6:'数字',}
maxnum = max(dict2)
print(maxnum)

minnum = min(dict2)
print(minnum)

13.5 遍历字典

遍历键

for 变量i in 字典:

使用i遍历所有的键,有键就可以通过变量访问其值

遍历键和值

for 变量i,变量j in 字典.items():

使用变量i遍历所有键,通过变量j遍历所有值

13.5.1 遍历一级字典

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}

#方法一:
for i in dict1: 遍历的是键
    print(i , dict1[i])

#方法二:这种方法是同时把字典里面的键值对同时遍历出来
for i,j in dict1.items():
    print(i,j)

#方法三:这种方法是把字典里面的值遍历出来
for i in dict1.values():
    print(i)

13.6 字典推导式

13.6.1 基本字典推导式

变量= {key:value for key,value in 字典.items()}

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}

dict2 = {key:'@'+value for key,value in dict1.items()}

print(dict2)

13.6.2 带有条件的字典推导式

变量= {key:value for key,value in 字典.items() if 条件表达式}

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}

dict2 = {key:value for key,value in dict1.items() if len(key) == len(value)}

print(dict2)

13.6.3 带有循环的字典推导式

变量 = {i+x:j+y for i,j in 字典1.items for x,y in 字典2.items()}

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
dict2 = {'班长':'戴帅林'}

dict3 = {key+i : value+j for key,value in dict1.items() for i,j in dict2.items()}

print(dict3)

13.6.4 带有判断的多循环字典推导式

变量 = {i+x:j+y for i,j in 字典1.items for x,y in 字典2.items() if 条件表达式}

dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
dict2 = {'班长':'戴帅林'}

dict3 = {key+i : value+j for key,value in dict1.items() for i,j in dict2.items() if len(value) == len(j)}

print(dict3)

13.7 字典的专用函数

  1. clear( ) 清空字典

    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    dict1.clear()
    print(dict1)
  2. copy( ) 复制字典

    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    dict2 = dict1.copy()
    print(dict2)
  3. fromkeys( ) 将容器中的值作为键,设定的第二个参数作为所有键的值,创建字典

    list1 = [1,2,3,4,5]
    dict1 = {}.fromkeys(list1,'数字')
    print(dict1)
    
    {1:'数字',2:'数字',3:'数字',4:'数字'}
  4. get( ) 通过键获取字典中的值

    
    # 若键存在,则返回值
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    result = dict1.get('小丽')
    print(result)
    
    
    # 若键不存在,则返回None.
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    result = dict1.get('班长')
    print(result)
    
    
    # 若键不存在,但是设定了返回值.则返回返回值
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    result = dict1.get('班长','不在')
    print(result)
    

  5. items( ) 将字典转换成等长的二级元组

    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    result = dict1.items()
    print(result)
  6. keys( ) 将字典中的键取出来,放进容器中

    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    list1 = dict1.keys()
    print(list1)
  7. values( ) 将字典中的值取出来,放进容器中

    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    list1 = dict1.values()
    print(list2)
  8. pop( ) 删除字典中指定键值对 pop(指定的键,默认值)

    
    # 移除存在的键和值
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    result = dict1.pop('小丽')
    print(dict1,result)
    
    
    # 移除不存在的键,未设置默认值,则报错!!! pop(不存在的键,还tm没设置默认值) 等着报错吧!!!
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    result = dict1.pop('班长')
    print(dict1,result)
    
    
    # 移除不存在的键,设置了默认值 pop(不存在的键,设置了默认值),则返回默认值
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    result = dict1.pop('班长','不在')
    print(dict1,result)
  9. popitem( ) 随机移除出字典中的一个键值对

    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    result = dict1.popitem()
    print(result)
  10. setdefault( ) 向字典中添加元素

    
    # 若要添加的键不存在,则新增进字典中
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    dict1.setdefault('班长','戴帅林')
    print(dict1)
    
    
    # 若要添加的键已经在字典中,则不做任何操作
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    dict1.setdefault('小丽','马丽丽')
    print(dict1)
  11. update( ) 更新字典,直接改变原字典

    
    # update(关键字传参)
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    dict1.update(小丽='马丽丽',静静='刘文静',瑶瑶='大熊太美',紫薇='戏精')
    print(dict1)
    
    
    # update(新的字典)
    
    dict1 = {'小丽':'马丽丽','静静':'刘文静','瑶瑶':'王瑶','紫薇':'孙紫薇'}
    dict1.update({'小丽':'马里奥','静静':'静毛线','瑶瑶':'大熊太美','紫薇':'戏精'})
    print(dict1)

    14.集合

    集合的特征:

    • 集合是无序数据
    • 集合中所有元素都是唯一的,集合自带去重功能
    • 集合中可以包含Number(int,float,bool,complex) , string , tuple 和 冰冻集合

14.1 创建集合

14.1.1 创建空集合

使用set() 来创建空集合

set1 = set() 
print(set1,type(set1))

14.1.2 创建具有多个元素的集合

set1 = {1,2,3,4,5,6}
print(set1,type(set1))

14.2 集合的基本操作(增删改查都不行)

14.3 集合的序列操作

集合只支持成员检测这一个序列操作

14.2.1 成员检测 in not in

set1 = {1,2,3,44,51,6}
result = 1 in set1
print(result)

result = 222 not in set1
print(result)

14.5 集合的序列函数

len() , max() , min() , set()

set1 = {1,2,3,4,5,6}

length = len(set1)
print(length)

maxnum = max(set1)
print(maxnum)

minnum = min(set1)
print(minnum)

list1 = [1,2,3,4,5,6,7]
set1 = set(list1)
print(set1,type(set1))

14.6 遍历集合

14.6.1 遍历一级集合

set1 = {1,23,45,3,7,54}
for each in set1:
    print(each)

14.6.2 遍历二级集合(等长)

set1 = {('徐骁','徐凤年'),('西楚姜皇帝','姜泥'),('谢灵云','白狐脸'),('无名氏','呵呵')}
for x,y in set1:
    print(x,y)

14.6.3 遍历二级集合(不等长)

set1 = {('不才','任然'),('张楚','窦唯','何勇'),('陈粒')}

for i in set1:
    for j in i:
        print(j)

14.7 集合推导式

14.7.1 基本集合推导式

set1 = {1,2,3,4,5,6,7,8}
result = {i*2 for i in set1}
print(result)

14.7.2 带条件判断的集合推导式

set1 = {1,2,3,4,5,6,7,8}
result = {i * 10 for i in set1 if i % 2 == 0}
print(result)

14.7.3 多循环集合推导式

set1 = {'窦唯','Gai','万晓利'}
set2 = {'女儿情','天干物燥','噢,乖'}

result = {i + j for i in set1 for j in set2}
print(result)

14.7.4 带条件判断的多循环集合推导式

set1 = {'窦唯','Gai','万晓利'}
set2 = {'女儿情','天干物燥','噢,乖'}

result = {i + j for i in set1 for j in set2 if len(i) == len(j)}

14.7 集合的函数操作

add( ) 向集合中添加元素

set1 = {'窦唯','Gai','万晓利'}

set1.add('朴树')
print(set1)

pop( ) 从集合中随机取出一个元素

set1 = {'窦唯','Gai','万晓利'}
result = set1.pop()
print(result)

remove( ) 从集合中删除指定元素

set1 = {'窦唯','Gai','万晓利'}

# remove(不存在的元素)   ---  报错
set1.remove('窦唯老婆')

# remove(存在的元素)     --- 正常删除
set1.remove('窦唯')

discard( ) 从集合中删除指定元素

set1 = {'窦唯','Gai','万晓利'}

# discard(不存在的元素)  ---  不做任何操作
set1.discard('窦唯老婆')

# discard(存在的元素)    ---  正常删除
set1.discard('窦唯')

clear( ) 清空集合

set1 = {'窦唯','Gai','万晓利'}

set1.clear() 

print(set1)

copy( ) 复制集合

set1 = {'窦唯','Gai','万晓利'}
set2 = set1.copy()
print(set2,type(set2))

14.8 集合之间运算函数

difference( ) 计算一个集合相对另一个集合的差集

set1 = {'徐凤年','徐骁','李义山'}
set2 = {'徐凤年','姜泥','青鸟'}

result = set1.difference(set2)
print(result)

difference_update( ) 计算一个集合相对另一个集合的差集,并直接改变原集合

set1 = {'徐凤年','徐骁','李义山'}
set2 = {'徐凤年','姜泥','青鸟'}

set1.difference_update(set2)
print(set1)

intersection( ) 计算一个集合和另一个集合的交集

set1 = {'徐凤年','徐骁','李义山'}
set2 = {'徐凤年','姜泥','青鸟'}

result = set1.intersection(set2)
print(result)

intersection_update( ) 计算一个集合和另一个集合的交集,并直接改变原集合

set1 = {'徐凤年','徐骁','李义山'}
set2 = {'徐凤年','姜泥','青鸟'}

set1.intersection_update(set2)
print(set1)

union( ) 计算两个集合的并集

set1 = {'徐凤年','徐骁','李义山'}
set2 = {'徐凤年','姜泥','青鸟'}

result = set1.union(set2)
print(result)

update( ) 计算两个集合的并集,并更新原集合

set1 = {'徐凤年','徐骁','李义山'}
set2 = {'徐凤年','姜泥','青鸟'}

set1.update(set2)
print(set1)

symmetric_difference( ) 计算两个集合的对称差集

set1 = {'徐凤年','徐骁','李义山'}
set2 = {'徐凤年','姜泥','青鸟'}

result = set1.symmetric_difference(set2)
print(result)

symmetric_difference_update( ) 计算两个集合的对称差集并更新原集合

set1 = {'徐凤年','徐骁','李义山'}
set2 = {'徐凤年','姜泥','青鸟'}

set1.symmetric_difference_update(set2)
print(set1)

14.9 集合检测类函数

issuperset( ) 检测一个集合是否是另一个集合的超集

set1 = {'徐凤年','徐骁','李义山','姜泥','青鸟'}
set2 = {'徐凤年','姜泥','青鸟'}

result = set1.issuperset(set2)
print(result)

issubset( ) 检测一个集合是否是另一个集合的子集

set1 = {'徐凤年','徐骁','李义山','姜泥','青鸟'}
set2 = {'徐凤年','姜泥','青鸟'}

result = set2.issubset(set1)
print(result)

isdisjiont( ) 检测两个集合是否没有交集

set1 = {'徐凤年','徐骁','李义山','姜泥','青鸟'}
set2 = {'徐凤年','姜泥','青鸟'}

result = set1.isdisjoint(set2)
print(result)

14.10 冰冻集合

冰冻集合就是一旦创建,不可以在进行任何修改的集合。

  1. 创建空冰冻集合
set1 = frozenset()
print(set1,type(set1))
  1. 创建多个元素的冰冻集合
set1 = frozenset({1,2,3,4,5,6,8,7,9})
print(set1,type(set1))
  1. 遍历冰冻集合
set1 = frozenset({1,2,3,4,5,6,8,7,9})
for i in set1:
    print(i)
  1. 冰冻集合推导式
result = {i+2 for i in set1}
print(result)
  1. 冰冻集合函数
冰冻集合没有专用的函数
但是
冰冻集合可以使用所有不改变原集合的集合函数

15. 文件操作

15.1 文件操作的步骤

  1. 打开文件
  2. 对文件进行操作
  3. 关闭文件
  4. 在Windows 下进行文件操作一定要加 encoding=’utf-8’ 进行转码

15.1.1 文件写入操作

# 1. 使用open()打开指定文件
fp = open('/Users/apple/desktop/01.txt','w')

# 2. 对文件进行写入操作
fp.write('写入操作,输入........')

# 3. 关闭文件
fp.close()

15.1.2 文件读取操作

# 1. 使用open()打开指定文件
fp = open('/Users/apple/desktop/01.txt','r')

# 2. 对文件进行读取操作
result = fp.read()
print(result)

# 3. 关闭文件
fp.close()

15.2 文件操作函数

1. open() 打开或新建文件

变量 = open('文件绝对路径','打开模式')

打开模式:

基础模式:( w,a,x,r )
w:  write   写入模式    若文件不存在,则新建. 若已经存在,打开文件并清空原有内容
a:  append  追加模式    若文件不存在,则新建. 若已经存在,则打开文件,则原有内容基础上添加
x:  xor     异或模式    若文件不存在,则新建. 若已经存在,则报错
r:  read    读取模式    可执行读取文件的相关操作

增强模式( +,b ) 只能和基础模式配合使用 
+:  plus    读写模式    在w,a,x 或者 r 的基础上加+,则实现读写都可的功能
b:  byte    位模式      在位模式下进行读或者写或者读写的操作

组合方式:
w:      若文件不存在,则新建文件等待写入操作. 若文件已存在,则打开文件并清空原内容,之后可以进行写入操作. 
a:      若文件不存在,则新建文件等待写入操作. 若文件已存在,则打开文件并清空原内容,之后可以进行写入操作.
x:      若文件不存在,则新建文件等待写入操作. 若文件已存在,则直接报错!
r:      若文件不存在,则报错! 若文件已存在,则打开文件,并可进行读取相关的操作

w+:     若文件不存在,则新建文件等待写入操作. 若文件已经存在,则打开文件并清空内容,之后可执行写入或读取
r+:     若文件不存在,则报错! 若文件已经存在,则打开文件,之后可执行写入操作和读取操作
x+:     若文件不存在,则新建文件等待写入操作, 若文件已经存在,则报错!
a+:     若文件不存在,则新建文件等待写入操作, 若文件已经存在,则打开原文件,在原文件的基础上可追加或读取

wb:     若文件不存在,则新建文件等待写入操作.若文件已经存在,则打开文件并清空内容.所有写入需要用encode()编码
rb:     若文件不存在,则报错! 若文件已经存在,则打开文件可进行读取操作.所有读取内容要用decode()解码
ab:     若文件不存在,则新建文件等待写入操作,若文件已经存在,则打开文件并追加内容.所有写入需要用encode()编码
xb:     若文件不存在,则新建文件等待写入操作,若文件已经存在,则报错!

wb+:    若文件不存在,则新建文件且可读可写.若文件已存在,清空内容,可读可写.读要用decode()解码.写要用            encode()编码
rb+:    若文件不存在,则报错! 若文件已存在,则打开文件,可读可写.读要用decode()解码.写要用encode()编码
ab+:    若文件不存在,则新建文件且可读可写.若文件已存在,打开原内容,追加内容.读要用decode()解码.写要用           encode()编码
xb+:    若文件不存在,则新建文件且可读可写,若文件已存在,直接报错! 读要用decode()解码.写要用encode()编码
基本模式
    w write 写入模式
        文件不存在则新建文件,文件已存在则打开并且清空文件!指针指向开头
    r read  读取模式
        文件不存在则报错!文件已存在则打开文件,指针指向开头
    x xor   异或模式
        文件不存在则新建文件,文件已存在则报错,指针指向开头
    a append 追加模式
        文件不存在则新建文件,文件已存在则打开文件,指针指向末尾
"""
# 扩展模式(必须有一个基本模式才可以使用扩展模式)
#     + plus  增强模式/plus
#             赋予文件读取和写入的双重权限
#         b  bytes   bytes模式
#             以bytes 模式读取或者写入数据
# b 模式
# bytes 类型:一种特殊的字符串
# 字符串 - 运行(转换)  计算机识别的内容
#  butes 计算机识别的内容(程序员预先完成了转换)
"""
tpp = '晚上去哪里浪啊'
print(tpp,type(tpp))

# 编码操作
tpp1 = tpp.encode()    # 转成计算机能识别的编码
print(tpp1,type(tpp1))

tpp2 =  tpp1.decode()   # 转成人能识别的字符串
print(tpp2,type(tpp2))

如: 使用r+模式打开文件

# 打开文件
fp = open('/Users/apple/desktop/01.txt','r+')   # 若此时01.txt不存在,则直接报错

# 先读取原有内容
content = fp.read()
print(content)

# 写入新内容
fp.write('写入内容')

# 移动指针
fp.seek(0) #单位是字节 0表示移动到开头位置

# 再读取现在的内容
content = fp.read()
print(content)

# 关闭文件
fp.close()

如: a+b模式打开或新建文件

# 打开文件
fp = open('/Users/apple/desktop/01.txt','a+b')

# 追加内容
fp.write('在原有基础上追加内容'.encode())

# 移动指针到开头
fp.seek(0)

# 读取全部内容
content = fp.read().decode()
print(content)

# 关闭文件
fp.close()

2. read() 读取文件内容

  1. 文件.read( ) 默认读取全部文件内容
fp = open('/Users/apple/desktop/01.xtx' ,'r')

content = fp.read()
print(content)

fp.close()
  1. 文件.read(指定字符个数) 读取指定的字符个数
fp = open('/Users/apple/desktop/01.txt','r')

content = fp.read(20)
print(content)

fp.close()

3.write() 写入文件内容

num = open('write.txt','w',encoding='utf-8')

num.write('喂,对面的看过来来')

num.close()

4. readline() 读取一行文件内容

文件.readline( ) 默认读取一行内容

文件.readline(指定字符个数) 默认读取指定字符长度内容,超过一行按一行算,不够一行就不够呗

fp = open('/Users/apple/desktop/01.txt','r')

# 读取一行文件的内容
content = fp.readline()  
print(content)

# 移动指针
fp.seek(0)

# 读取指定字符长度,若不满足一行则只读5个字符,若超过一行,则只读一行字符
content = fp.readline(5) 
print(content)

# 关闭文件
fp.close()

5. readlines() 一次读取多行内容

# 打开文件
fp = open.(''/Users/apple/desktop/01.txt','r')

# 默认读取全部行
content = fp.readlines()
print(content)

# 移动指针
fp.seek(0)

# 读取指定字符长度的行数
content = fp.readlines(20)  # 字符长度若不足一行,则按一行算,若超过一行,则显示下一整行
print(content)

# 关闭文件
fp.close()

6.writelines() 将容器数据写入文件

表示写入很多行,参数可以是list格式

nu = ['少时诵诗书所\n','王微微发热污染\n','水电费为具有天赋带\n','区文明办程序']

o = open('writelines.txt','w',encoding='utf-8')
o.writelines(nu)
o.close()

7. truncate() 文件截取

保留指定的字节长度,其他都删除 单位:字节!!!!

fp = open('/Users/apple/desktop/01.txt'.'r+')

fp.truncate(12)  # 保留指定的字节长度,其他都删除

fp.close()

8. tell() 获取当前打开的文件的指针位置(指针位置以字节为单位)

fp = open('/Users/apple/desktop/01.txt','r')
# 获取指针位置在读取
num = fp.tell()
print(num)

fp.close()

9. seek() 将指针移动指定的字节长度 (一个字是三个字节)

fp = open('/Users/apple/desktop/01.txt','r')

fp.seek(21)

content = fp.read()   # read() 的内容是在指针之后的内容才能读取
print(content)   

fp.close()

10. 自定义函数获取指定行数

# 自定义函数实现读取文件中的指定行数

def myReadLines(path,hang=-1,sep='\n'):  
# path:要打开的文件路径  hang:显示文件内容的行数  sep:当前操作系统中默认的换行符号

    # 打开指定文件
    fp = open(path,'r')

    # 获取文件内所有内容
    content = fp.read()

    # 使用换行符号切割字符串,放入列表lists中
    #若最后一行切完是一个空字符串,则需要分片去掉最后一个 lists = content.split(sep)[0:-1]
    lists = content.split(sep) 

    # 判断用户输入的行数,并确认最终输出的总行数
    maxhang = len(lists)

    if hang < 0 or hang >= maxhang:
        hang = maxhang
    else:
        hang = int(hang)

    result = [i + sep for i in lists[:hang]]  # 用分片来控制最终的列表的长度

    # 如果要用列表的形式直接呈现,直接输入result就可以了
    #print(result)

    # 遍历最终的列表result 输出内容
    for i in result:
        print(i,end='')

myReadLines('/Users/apple/desktop/01.txt',5)

16. os (操作系统)模块

使用os模块之前要先导入

import os

16.1 os模块函数

16.1.1 文件夹类os操作

1. os.listdir()

功能: 获取指定路径文件夹下所有的文件及文件夹的列表

格式: os.listdir(目标文件夹路径)

返回值: 所有文件及文件夹的列表

lists = os.listdir(/Users/apple/desktop)
print(lsits)

2. os.mkdir()

功能: 在指定路径创建空文件夹,如果不指定路径,直接写文件名的话,默认在当前目录下创建一个新文件

格式:os.mkdir(目录路径,0o权限数组) 未设定则按默认权限创建

返回值:创建的文件夹绝对路径,

os.mkdir('/Users/apple/dekstop/a',0o755)

os.mkdir('/Users/apple/desktop/b)

3. os.rmdir()

功能: 删除指定路径的空文件夹

格式: os.rmdir(目录路径)

返回值:None

os.rmdir('/Users/apple/desktop/a')

4. os.makedirs()

功能: 递归创建空文件夹

格式: os.makedirs(目录路径)

返回值: 创建的目录的字符串路径

os.makedirs('/Users/apple/desktop/aaa/bb/c')

5. os.removedirs()

功能: 递归删除空文件夹

格式: os.removedirs(目录路径)

返回值: None

os.removedirs('/Users/apple/desktop/aaa/bb/c')

6. os.getcwd()

功能: 获取当前工作目录

格式: os.getcwd()

返回值:当前工作的目录路径字符串

pathnow = os.getcwd()
print(pathnow)

7.os.chdir()

功能: 修改当前工作目录

格式: os.chdir(目的地路径)

返回值:None

# 改变文件夹,在桌面创建新文件

os.chdir('/Users/apple/desktop')
fp = open('01.txt','w')
print(os.getcwd())
fp.close

16.1.2 通用os操作

1. os.rename( )

功能: 重命名文件夹

格式: os.rename(原文件夹或文件路径,新名文件夹或文件路径)

返回值: None

os.rename('/Users/apple/desktop/01.txt','/Users/apple/desktop/02.txt')

2. os.stat( )

功能: 获取指定文件夹或文件的相关信息(属性)

格式: os.stat(指定文件夹或文件的目录)

返回值: 包含属性信息的元组

result = os.stat('/Users/apple/desktop/01.txt)
print(result)

3. os.getenv()

功能: 获取当前系统的环境变量信息

格式: os.getenv(获取的环境变量名称) ‘PATH’ 要大写

返回值: 字符串

result = os.getenv('PATH')
print(result.split(':'))

4. os.putenv()

功能: 设置环境变量信息

格式: os.putenv(环境变量参数,新增值)

返回值: None

os.putenv('PATH','/')
os.system('mydir')

5. os.system()

功能: 在python中使用系统命令 (慎用)

格式: os.system(系统命令)

返回值: 系统命令返回的结果

os.system('ls')

6. os.environ模块:

用于获取python中的临时变量,相当于在系统中使用export命令

获取环境变量
print(os.environ['PATH'])

#修改环境变量
os.environ['PATH'] += ':/home/conghao'
print(os.environ['PATH'])
os.system('conghao /')

16.1.3 os模块中子模块path

1. os.path.abspath()

功能: 判断指定的路径是不是绝对路径

格式: os.path.abspath(指定路径)

返回值: True: 是绝对路径 False: 不是绝对路径

result = os.path.abspath('/Users/apple/desktop)
print(result)

2. os.path.dirname()

功能: 获取路径中的路径部分

格式: os.path.dirname(指定路径)

返回值: 返回路径部分

dname = os.path.dirname('/Users/apple/desktop')
print(dname)

3. os.path.basename()

功能:获取路径中的文件夹或者文件名称(只要路径的最后一部分)

格式: os.path.basename()

返回值: 返回指定路径的主体部分

bname = os.path.basename('/Users/apple/desktop)
print(bname)

4. os.path.join()

功能: 将两个路径连接起来,合成一个路径

格式: os.path.join(路径1,路径2)

返回值: 合成之后的路径

fullpath = os.path.join('/Users/apple/','desktop')
print(fullpath)

5. os.path.split()

功能: 将指定路径的文件拆分成路径和主体部分,放入元组中

格式: os.path.split(指定绝对路径)

返回值: 元组 (路径部分,主体部分)

path1 = '/Users/apple/desktop/01.txt'
tuple1 = os.path.split(path1)
print(tuple1)

6. os.path.splitext()

功能:将一个文件名切成名字和后缀两个部分

格式: os.path.splitext(指定路径)

返回值: 元组 (名称,扩展名)

path1 = '/Users/apple/desktop/01.txt'
tuple1 = os.path.splitext(path1)
print(tuple1)

7. os.path.getsize()

功能: 获取一个文件的大小

格式: os.path.getsize(指定文件路径)

返回值: 文件大小

path1 = '/Users/apple/desktop/01.txt'
size = os.path.getsize(path1)
print(size)

8. os.path.isdir()

功能: 判断指定路径是不是文件夹

格式: os.path.isdir(指定路径)

返回值: True 是文件夹 False 不是文件夹

result = os.path.isdir('/Users/appple/desktop')
print(result)

9. os.path.isfile()

功能: 判断指定路径是不是文件

格式: os.path.isfile(指定路径)

返回值: True 是文件 False 不是文件

result = os.path.isfile('/Users/apple/desktop/01.txt')
print(result)

功能: 判断指定路径是不是快捷方式

格式: os.path.islink(指定路径)

返回值: True 是链接 False 不是链接

result = os.path.islink('/Users/apple/desktop/01.txt')
print(result)

11. os.path.getctime()

功能: 获取指定路径的文件或者文件夹的创建时间

格式: os.path.getctime(指定路径)

返回值: 时间戳

import  time
creattime = os.path.getctime('/Users/apple/desktop/test/')
print(creattime)

12. os.path.getatime()

功能: 获取指定路径的文件或者文件夹的访问时间

格式: os.path.getatime(指定路径)

返回值: 时间戳

activetime = os.path.getatime('/Users/apple/desktop')
print(activetime)

13. os.path.getmtime()

功能: 获取指定路径文件或者文件夹的修改时间

格式: os.path.getmtime(指定路径)

返回值: 时间戳

modifytime = os.path.getmtime('/Users/apple/desktop/01.txt)
print(modifytime)

14. os.path.exists()

功能: 判断指定路径的文件或者文件夹是否存在

格式: os.path.exists(指定路径)

返回值: True 存在 False 不存在

result = os.path.exists(指定路径)
print(result)

15. os.path.isabs()

功能: 判断指定路径是不是一个绝对路径

格式: os.path.isabs(指定路径)

返回值: True 是绝对路径 False 不是绝对路径

result = os.path.isabs('/Users/apple/desktop/01.txt')
print(result)

16. os.path.samefile()

功能: 判断两个路径指向的是不是同一个文件

格式: os.path.samefile(指定路径1,指定路径2)

返回值: True 是相同文件 False 不是同一个文件

path1 = '../../desktop/01.txt'
path2 = '/Users/apple/desktop/01.txt'
result = os.path.sanmefile(path1,path2)
print(result)

16.1.4 os模块中的值

1. os.curdir

print(os.dir)

当前文件夹符号

用 . 来表示

2. os.pardir

print(os.pardir)

当前文件夹的上一层目录 即父级文件夹

用 .. 表示

3. os.name

print(os.name)

当前系统的内核名称

posix linux 或者 Unix 操作系统
nt Windows 操作系统

4. os.linesep

window \r\n
linux \n
mac \r或者 \n

5.os.sep

print(os.sep)

当前系统的路径分隔符

Linux / Windows \ (Windows 兼容正反斜线)

6. os.extsep

print(os.extsep)

当前系统的文件名和后缀之间的分隔符

win/linux/unix -> .

16.1.5 自定义函数获取文件夹大小

# 自定义函数获取文件夹大小
import os

def get_dir_size(path):
    # 获取指定文件夹的文件信息
    lists = os.listdir(path)

    # 初始化大小计数
    size = 0
    # 通过拼接获取完整路径
    for i in lists:
        fullpath = os.path.join(path,i)

        # 判断路径是不是文件,是文件则获取大小并累加到size.
        if os.path.isfile(fullpath) or os.path.islink(fullpath):
            size += os.path.getsize(fullpath)

        # 判断路径是不是文件夹,如果是文件夹则递归计算大小,累加到size中
        elif os.path.isdir(fullpath):
            size += get_dir_size(fullpath)
    return size

# 调用函数
result = get_dir_size('/Users/apple/desktop/python教材')
print(result)

17. shutil 高级系统模块

使用shutil高级系统模块需要先导入该模块

import shutil

17.1 复制功能函数

17.1.1 文件复制类函数

1. shutil.copy()

功能: 将指定路径的文件复制到另一个路径

格式: shutil.copy(‘原文件路径’,’目标路径’)

返回值: 目标路径

import shutil
shutil.copy('/Users/apple/desktop/01.py','/Users/apple/desktop/test/a.py')

2. shutil.copy2()

功能: 复制指定路径的文件和文件信息到指定另一个路径

格式: shutil.copy2(‘原文件路径’,’目标路径’)

返回值: 目标路径

import shutil
shutil.copy2('/Users/apple/desktop/01.py','/Users/apple/desktop/test/a.py')

3. shutil copyfile()

功能: 复制指定文件的内容到另一个文件中(默认清空另一个文件) 固定r读取 w 写入

格式: shutil.copyfile(‘原文件路径’,’目标路径’)

返回值: 目标文件路径

复制给指定路径内容会覆盖原有的文件内容

import shutil
shutil.copyfile('/Users/apple/desktop/01.txt','/Users/apple/desktop/test/a.txt')

4. shutil copyfileobj()

功能: 复制指定文件的内容到另一个文件中(可选择打开模式)

格式: shutil.copyfileobj(open(‘原文件路径’,’打开模式’),open(‘目标地址’,’打开模式’))

import shutil
shutil.copyfileobj(open('/Users/apple/desktop/01.txt','r'),open('/Users/apple/desktop/test/a.txt','a'))

17.1.2 文件夹复制类函数

1. copytree()

功能: 复制一个文件夹到指定新位置,新文件夹会自动创建

格式: shutil.copy(‘原文件夹路径’,’指定路径’)

import shutil
shutil.copytree('/Users/apple/desktop/test/','/Users/appple/desktop/a/')

2. copymod()

功能: 复制一个文件夹的权限给另一个文件夹(两个必须都存在)

格式: shutil.copymod(‘原文件夹路径’,’指定路径’)

import shutil
shutil.copymod('/Users/apple/desktop/test/','/Users/apple/deskt/a/)

3. copystat()

功能: 复制一个文件夹的相关信息给另一个文件夹(两个都必须存在)

格式: shutil.copystat(‘原文件夹路径’,’目标文件夹路径’)

import shutil
shutil.copystat('/Users/apple/desktop/a','/Users/apple/desktop/test/')

17.1.3 文件夹(非空)递归删除函数

1. rmtree()

功能: 递归删除非空文件夹 (os.removedirs()只能递归删除空文件夹)

格式: shutil.rmtree(‘删除文件夹的路径’)

import shutil
shutil.rmtree('/Users/apple/desktop/test')

17.1.4 文件和文件夹通用函数

1. move()

功能: 剪切,将指定文件剪切到另一个位置

格式: shutil.move(‘原文件路径’,’指定路径’)

import shutil

shutil.move('/Users/apple/desktop/a/01.py','/Users/apple/desktop')

shutil.move('/Users/apple/PycharmProjects','/Users/apple/desktop/')

17.1.5 系统相关函数

1. which()

功能: 查找系统命令所在的文件路径

格式: shutil.which(‘系统命令’)

返回值: 命令所在的系统变量PATH

import shutil
result = shutil.which('ls')
print(result)

2. disk_usage()

功能: 获取指定系统磁盘的使用情况

格式: shutil.disk_usage(‘系统磁盘路径’)

import shutil
result = shutil.disk_usage('/')
print(result)

17.1.6 归档和解档函数

归档:将多个文件合并到一个文件当中,这种操作方式就是归档。

解包:将归档的文件进行释放。

压缩:压缩时将多个文件进行有损或者无损的合并到一个文件当中。

解压缩:就是压缩的反向操作,将压缩文件中的多个文件,释放出来。

1. shutil.make_archive()

功能: 创建一个归档文件,指定归档文件的格式.再将其他文件或文件夹放入归档文件中

格式: shutil.make_archive(‘归档文件路径’,’归档文件格式’,’放入的文件或文件夹路径’)

返回值:归档文件的最终路径

import shutil
shutil.make_archive('/Users/apple/desktop/guidan','zip','/Users/apple/desktop/test')

2. shutil.unpack_archive()

功能: 将归档文件夹中的全部文件解包到指定路径

格式: shutil.unpack_archive(‘归档文件路径’,’输出路径’)

注意:文件夹不存在会新建文件夹

import shutil
shutil.unpack_archive('/Users/apple/desktop/guidan.zip','/Users/apple/desktop/nimabi')

3. shutil.get_archive_formats()

功能: 获取当前系统允许的压缩文件格式

格式:shutil.get_archive_formats()
返回值:列表 [(后缀,解释),(后缀,解释),(后缀,解释)…]

import shutil
result = shutil.get_archive_formats()
print(result)

4. shutil.get_unpack_foramats()

功能: 获取当前系统中允许的解包格式

import shutil
result = shutil.get_unpack_formats()
print(result)

18. zipfile模块-zip压缩

进行压缩操作之前要先导入压缩模块

import zipfile

18.1 zipfile模块常用函数

1. zipfile.ZipFile()

功能: 创建一个压缩文件

格式: zipfile.ZipFile(1.创建压缩文件位置, 2.打开模式, 3.是否压缩, 4.压缩文件是否大于2G)

参数:
1. 创建压缩文件绝对路径
2. 打开模式 
    w : 新建一个压缩文件夹,或者覆盖一个已有的zip文档
    a : 将数据追加到一个现存的zip文档中
    r : 打开一个已有的zip文件
3. 压缩方式:
    zipfile.ZIP_STORED      不存储不进行压缩(默认)
    zipfile.ZIP_DEFLATED    对文件进行压缩
4. 压缩文件是否大于2G
    若创建的压缩文件要大于2G,则将zip64 设为 True
    若创建的压缩文件不需要2G,则默认False

2. zipfile.write()

功能: 将指定文件添加到zip文件中

格式: zipfile.write(要添加的文件,添加后新名字,压缩方式)

参数:
1. 要添加的文件:  
    要写入压缩文件中的添加文件的绝对路径
2. 添加后的新名字:
    在压缩文件中的名字,如果不需要更改则不需要传参即可,
3. 压缩方式:
    压缩方式,若指定则可以单独设定,不指定则按创建zip文件时设定的进行

3. extractall()

功能: 从zip压缩文件中解压缩所有的文件

格式: zipfile.extractall(指定输出路径)

4. extarct()

功能: 从zip压缩文件中取出指定的文件

格式: zipfile.extract(指定文件,指定输出路径)

18.2 压缩文件操作范例

import zipfile

# 打开或者创建一个压缩文件
zp = zipfile.ZipFile('/Users/apple/desktop/01.zip','w',zipfile.ZIP_DEFLATED)

# 向创建好的压缩文件中添加要压缩的文件
zp.write('/Users/apple/desktop/01.txt)
zp.write('/Users/apple/desktop/test.py','hellotest.py')

# 关闭压缩文件
zp.close()

18.3 解压文件操作范例

import zipfile

# 打开压缩文件
zp = zipfile.ZipFile('/Users/apple/desktop/01.zip','r')
# 将需要的指定文件或者全部文件解压缩出来
zp.extract('01.txt','/Users/apple/desktop/aa')
zp.extractall('/Users/apple/desktop/bbb')

# 关闭压缩文件
zp.close()

18.4 zipfile模块其他函数

1. zipfile.namelist()

功能: 获取zip文件中的所有文件列表

格式: zipfile.namelist()

zp = zipfile.ZipFile('/Users/apple/desktop/01.zip','r')

print(zp.namelist())

zp.close()

2. zipfile.infolist()

功能: 获取zip文件中的所有信息列表

格式: zipfile.infolist()

zp = zipfile.ZipFile('/Users/apple/desktop/01.zip','r')

print(zp.infolist())

zp.close()

3. zipfile.getinfo()

功能: 获取zip文件中指定文件的信息

格式: zipfile.getinfo(指定文件)

zp = zipfile.ZipFile('/Users/apple/desktop/01.zip','r')

print(zp.getinfo('test.txt'))

zp.close()

19. tarfile 模块

使用tar模块之前需要先导入模块

import tarfile

19.1 tarfile 模块常用函数

1. tarfile.open()

功能: 创建或者打开压缩文件

格式: tarfile.open(‘创建或者打开的压缩文件名’,’打开模式’)

注意: 打开模式中 使用w则默认不压缩 要压缩的话使用w:gz等压缩格式

2. tarfile.add()

功能: 向压缩文件中添加内容

格式: tarfile.add(‘添加到压缩文件中的文件或文件夹路径’,’可为空新名字’)

3. tarfile.extract()

功能: 将压缩文件中的指定文件解压到指定路径

格式: tarfile.extract(‘指定路径’,’解压目标路径’)

4. tarfile.extractall()

功能: 将压缩文件中的所有文件解压到指定路径

格式: tarfile.extarctall(‘解压目标路径’)

5. tarfile压缩范例

import tarfile
tarfp = tarfile.open('/Users/apple/desktop/01.tar','w:gz')

tarfp.add('/Users/apple/desktop/01.py')
tarfp.add('/Users/apple/desktop/test/')


tarfp.close()

6. tarfile解压范例

import tarfile
tarfp = tarfile.open('/Users/apple/desktop/01.tar','r')

tarfp.extract('01.py','/Users/apple/desktop/')
tarfp.extarctall('/Users/apple/desktop/a/')

tarfp.close()

20. calendar 日历模块

使用日历模块之前需要先导入日历模块

import calendar

20.1 日历模块函数

1. calendar.calendar()

功能: 获取指定年份的日历字符串

格式: calendar.calendar(年份)

    w表示 2个日期之间的间隔字符长度
    l表示  lineheight 设置每行之间的高度 默认是1
    c表示  两个月之间的间隔字符  默认是6
    m表示一行显示几个月
import calendar
result = calendar.calendar(2017,w = 2,l = 1,c = 6,m = 4)
print(result)

2. calendar.month()

功能: 获取指定年月的日历字符串

格式: calendar.month(年份,月份)

import calendar
result = calendar.month(2017,10)
print(result)

3. calendar.monthcalendar()

功能: 指定年份和月份获取一个时间矩阵列表

格式: calendar.monthcalendar(年份,月份)

import calendar
result = calendar.monthcalendar(2017,10)
print(result)

4. calendar.monthrange()

功能: 通过指定的年月,获取该月份第一天是周几,一共多少天

格式: calendar.monthrange(年份,月份)

import calendar
result = calendar.monthrange(2017,10)
print(result)

5. calendar.isleap()

功能: 判断指定年份是不是闰年

格式: calendar.isleap(年份)

import calendar
result = calendar.isleap(2017)
print(result)

6. calendar.leapdays()

功能: 判断两个指定年份之间有多少个闰年

格式: calendar.leapdays(开始年份,结束年份)

import calendar
result = calendar.leapdays(2000,2011)
print(result)

7. calendar.weekday()

功能: 通过指定年月日,计算这一天是周几

格式: calendar.weekday(年份,月份,日期)

注意: 0–6 表示 周一 — 周天

import calendar
result = calendar.weekday(2017,10,13)
print(result)

8. calendar.timegm()

功能: 将时间元组转换成时间戳

格式: calendar.timegm(时间元组)

import calendar
ttp = (2018,1,1,0,0,0,0,0,0)
result = calendar.timegm(ttp)
print(result)

21. time 日历模块

21.1 时间术语解释

21.1.1 UTC时间

UTC时间又称为世界协调时间,特指格林尼治天文台所在的位置的时间,也叫格林尼治时间.
中国的时区是东八区,比世界协调时间快了8个小时

21.1.2 夏令时

夏令时就是通过在夏季将时间人为调快1个小时.

21.1.3 时间元组

ttp = (年,月,日,时,分,秒,周几,第几天,是否夏令时)
年 : 4位数字
月 : 1-12
日 : 1-31
时 : 0-23
分 : 0-59
秒 : 0-59
周几 : 0-6 对应 周一 - 周天
是否不是夏令时: 0是,其他不是

21.2 时间模块的值

1. timezone

功能: 获取UTC和当前时区时间戳的差值 (UTC时间戳 - 当前时区时间戳)

import time 
print(time.timezone)

2. altzone

功能: 在夏令时的情况下,获取UTC时间和当前时区的差值

import time 
print(time.altzone)

3. daylight

功能: 检测是否是夏令时,0 就是 夏令时 非零不是夏令时

import time 
print(time.daylight)

21.3 时间模块的函数

1. time.asctime()

功能: 把时间元组转换成可读字符串

格式: time.asctime(时间元组)

import time 
result = time.asctime((1992,2,1,21,33,44,0,0,0))
print(result)

2. time.localtime()

功能: 获取当前的时间元组

格式一: time.localtime()

​ 返回值: 当前的时间元组

格式二: time.localtime(时间戳)

​ 返回值: 指定时间戳转换成本地时间元组

import time 
result = time.localtime()
print(result)

result = time.localtime(1231424)
print(result)

3. time.gmtime()

功能: 获取当前UTC时间元组

格式一: time.gmtime()

​ 返回值: 当前UTC时间元组

格式二

2018-05-02 23:02:28 xudailong_blog 阅读数 1290

上两篇我们爬了一篇智联招聘的数据,主要是北京地区python开发岗位的数据,数据量不是很大,几千条,这一篇文章我们队智联招聘的数据进行数据处理。

一直以来,我以为的数据处理是已经在python爬虫阶段已经做好了,其实并不是,python爬虫并没有把数据处理这一部分的工作完全给做好,数据处理只是数据挖掘的一小部分,接下来,就是在jupyter notebook上进行数据处理,到中途就卡壳掉一部分,不过,等我弄明白会继续补上的,毕竟学无止境。

## 数据处理部分
"""
1、去重工作地址,获取地址坐标(高德) 
2、去重公司,获取公司情况 
3、工作筛选,由于智联上爬取的工作,好多事工作内容里有python,只用python谢谢脚本啥的,实际标题上找的是java啊,php啊,这样的工作要删掉 
4、剔除数据异常值,过大过小,NA值 
5、工作根据,工作,公司情况,工作内容,技能要求等进行评分,目的是找到适合我的工作

"""

# 导入数据
import pandas as pd
import numpy as np
import pymongo
client = pymongo.MongoClient("localhost",connect=False)
db = client["zhilian"]
table=db['python']

df = pd.DataFrame(list(table.find()))
# 在df中删除mongo里的_id 字段
del df['_id']
# 查看头信息
df.head()
# 查看全部内容
#df
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary
0 北京市朝阳区裕民路12号 中国国际科技会展中心A座10层 大连飞创信息技术有限公司 岗位职责:1、按照有关制度和规范的要求,承担代码的编写工作。对开发任务、需求理解透彻,积极配… https://m.zhaopin.com//jobs/210653218250637/ C++开发工程师 五险一金;年底双薪;绩效奖金;加班补助;交通补助;餐补;采暖补贴;定期体检 1.5万-2万
1 丰台区航丰路一号时代财富天地大厦28层 深圳市八斗才数据有限公司 岗位职责:1、 负责互联网网站产品开发;2、 参与产品设计、架构设计和代码编写;3、 负责问… https://m.zhaopin.com//jobs/cz562550030j000298… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 1万-1.8万
2 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市芒柠科技有限公司 岗位职责:1、维护现有的平台代码。2、参与项目的架构设计,明确负责开发部分的设计需求。3、按… https://m.zhaopin.com//jobs/cz466965980j000547… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助 1万-1.5万
3 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市源极光科技有限公司 技术要求:1、精通Python语言,熟悉Python多线程 socket通信机制;2、精通流… https://m.zhaopin.com//jobs/cz897833860j000551… python工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;年底双薪;带薪年假;弹性工作;员工旅游 1万-1.5万
4 海淀区中关村软件园11号楼大洋大厦 深圳市芒柠科技有限公司 岗位职责:1. 负责云平台应用的开发维护;2. 负责服务器端API的设计与开发。岗位要求:1… https://m.zhaopin.com//jobs/cz730936640j000955… Python开发工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;员工旅游;带薪年假;弹性工作;节日福利 1万-1.5万
5 北京市海淀区苏州街3号大恒科技大厦南座17层 北京乐学创想教育科技有限公司 岗位职责:1、题库全栈开发和维护,包括需求分析、技术改进、后期维护2、构建数据分析模型,对视… https://m.zhaopin.com//jobs/244101282250512/ Python工程师 节日福利;五险一金;餐补;创业公司 1.5万-3万
6 北京市朝阳区来广营中街甲1号朝来科技产业园创远路36号院4-6号楼 北京尚德在线教育科技有限公司 岗位职责:1、负责公司电商平台如天猫微店、京东、苏宁等商城日常的运营管理,包括店铺整体策划、… https://m.zhaopin.com//jobs/424628486272009/ python自动化 创业公司;无试用期;绩效奖金;不加班 1千-2千
7 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 职位职责:1. 基于 Python 的分布式集群管理软件开发2. 基于 Web 的工具软… https://m.zhaopin.com//jobs/567369733250977/ Python实习生 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 8千-1万
8 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 工作方向openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等技术要… https://m.zhaopin.com//jobs/567369733250978/ Python开发实习(接受零基础) 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 8千-1万
9 北京市海淀区上地农大南路88号万霖大厦3层 北京云纵信息技术有限公司 岗位职责:1)负责业务系统运行环境的基础服务管理,系统架构的维护;2)参与基于大数据平台的维… https://m.zhaopin.com//jobs/311289936253904/ linux运维工程师(熟练python) 节日福利;五险一金;绩效奖金;加班补助;交通补助;餐补;带薪年假;健身俱乐部 1.8万-2.8万
10 后沙峪安庆大街巨鸿大厦A座5层 天津狮桥国际物流有限公司 一、岗位职责:1、搭建系统开发环境,完成系统框架和核心代码的实现,负责解决开发过程中的技术问… https://m.zhaopin.com//jobs/670247822251376/ Python软件开发工程师 五险一金;绩效奖金;包住;餐补;通讯补贴;带薪年假 1万-2万
11 北京市海淀区互联网金融中心21层 北京融七牛信息技术有限公司 岗位职责:1. 负责天机风控系统模型在线服务的架构设计、优化和研发工作; 2. 负责线上服务… https://m.zhaopin.com//jobs/435840920250697/ 高级python研发工程师(000650) 五险一金;绩效奖金;餐补;通讯补贴;补充医疗保险;定期体检;节日福利 2.5万-4万
12 北京市朝阳区工体 北京科锐国际人力资源股份有限公司 岗位职责:1. 基于公司CRM系统 的产品研发、以及项目开发;2. 公司内部电商平台开发工作… https://m.zhaopin.com//jobs/263940938259405/ 直聘软件研发(Golang , Python, Ruby) 节日福利;周末双休;五险一金;年底双薪;绩效奖金;年终分红;补充医疗保险;定期体检 1.5万-2万
13 北京市海淀区西北旺东路10号院东区1号楼领创空间2层204A 北京彼速信息技术有限公司 职位要求:1.本科以上学历,计算机相关专业;2.熟悉B/S软件结构;3. 精通C#,熟练掌握… https://m.zhaopin.com//jobs/136473062250465/ C#/Asp.Net高级软件工程师 五险一金 1万-2万
14 北京市东城区和平里东街11号雍和航星园三号楼一层 浙江齐聚科技有限公司北京分公司 1. 负责产品功能性需求的开发、维护。2. 负责优化系统的性能和稳定性3. 能独立完成个人承… https://m.zhaopin.com//jobs/32922521700041200311/ 高级java工程师 2万-3万
15 (中关村)北京市海淀区王庄路1号清华同方科技广场A座17层 北京固鸿科技有限公司 岗位职责:1、负责公司软件系统集成开发;2、按规范编写系统需求、概要设计、详细设计及系统部署… https://m.zhaopin.com//jobs/137279958250759/ Windows C++软件开发工程师 五险一金;年终分红;交通补助;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 1万-2万
16 马尼拉分公司 皇室科技有限公司 只要你有能力,薪资不是问题!只要你有能力,薪资不是问题!任职要求1、计算机及相关专业,国家统… https://m.zhaopin.com//jobs/cz735252640j001365… php工程师/php程序员/php 住房补贴;每年多次调薪;健身俱乐部;包吃;包住;房补;通讯补贴;带薪年假 1.5万-2.5万
17 北京市朝阳区北京市朝阳区广渠路3号竞园图片产业园1号库 Forgame–云游控股集团 岗位职责:1、负责在线娃娃机的管理后台系统的研发2、负责统计后台搭建 3、负责监控后台搭建1… https://m.zhaopin.com//jobs/571816225250634/ python后台研发工程师 2万-3万
18 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 职位职责:1、负责产品的服务端开发;2、负责优化产品的性能,根据产品设计完成高质量的服务端产… https://m.zhaopin.com//jobs/562114535250039/ python开发工程师 [北京] 五险一金;年底双薪;绩效奖金;带薪年假;弹性工作;补充医疗保险;定期体检;员工旅游 1.5万-2万
19 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 岗位职责:1、负责数据后台服务的设计、开发、优化、测试等研发工作;2、负责支撑业务的其他项目… https://m.zhaopin.com//jobs/cz562114530j000297… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 1万-1.5万
20 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、爬虫系统开发和优化;2、文档识别和提取;3、互联网数据采集。专业素质要求:1、… https://m.zhaopin.com//jobs/444406089252927/ python爬虫数据采集实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
21 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1. 参与公司软件产品后台研发和维护工作;2. 参与建筑物联网数据分析算法的设计和… https://m.zhaopin.com//jobs/444406089252925/ Python工程师招实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
22 北京市海淀区西二旗 广州百单网互联网科技有限公司 【岗位职责】1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、… https://m.zhaopin.com//jobs/444406089252924/ Python开发工程师待遇从优 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
23 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/444406089252923/ 后端工程师/Python工程师 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
24 北京市东城区和平里西街51号雍和宫壹中心A4楼3层 游族网络 岗位职责:1、创新项目及公司内部管理系统后台相关服务端的研发和维护;2、网页信息抓取结果的抽… https://m.zhaopin.com//jobs/264844217254121/ Python开发工程师-base北京 1.2万-1.8万
25 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市八斗才数据有限公司 工作职责:1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、效… https://m.zhaopin.com//jobs/562550032250030/ Python开发工程师(北京) 五险一金;补充医疗保险;绩效奖金;定期体检;年底双薪;带薪年假;节日福利;员工旅游 1.5万-2.5万
26 北京市海淀区北三环中路44号院 北京华信智原教育技术有限公司 岗位职责:1.积极参与教学大纲的制定,并按照教学大纲授课;2.通过QQ与学员交流,并耐心给学… https://m.zhaopin.com//jobs/134503487251283/ Python老师 五险一金;年底双薪;带薪年假;员工旅游;高温补贴;节日福利 1.5万-2万
27 昌平区建材城西路育新小区对面金燕龙办公楼传智播客 江苏传智播客教育科技股份有限公司北京分公司 工作职责:按照教学大纲高质量完成日常授课任务; 根据市场需求,改进教学方法和内容,完善教学体… https://m.zhaopin.com//jobs/374740583250235/ python导师J10091 五险一金;交通补助;餐补;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 1.6万-3万
28 北京市海淀区西二旗 广州百单网互联网科技有限公司 工作方向:openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等。技… https://m.zhaopin.com//jobs/444406089252926/ python开发实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
29 北京市海淀区西二旗 北京升凯网络科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/540062934250725/ 后端工程师/Python工程师 五险一金;年底双薪;绩效奖金;餐补;房补;定期体检;员工旅游 4千-6千
4511 北京市朝阳区远洋国际中心A座2306 国信嘉宁数据技术有限公司 岗位职责:1、配合开发人员对公司主营产品的应用部署及环境调优;2、跟进解决系统运维技术问题;… https://m.zhaopin.com//jobs/268720686250316/ Linux系统运维工程师 周末双休;五险一金;绩效奖金;餐补;带薪年假;定期体检 8千-1.5万
4512 五棵松地铁附近 北京海思瑞格科技有限公司 职位描述:1. 通过深度学习方法解决临床问题;2. 搭建基于深度学习框架的时序信号处理和医疗… https://m.zhaopin.com//jobs/30130628000026679212/ 算法工程师(深度学习方向) 创业公司;每年多次调薪;定期体检;节日福利;绩效奖金;餐补;五险一金 1.2万-2.5万
4513 北京市海淀区北三环西路32号恒润国际大厦9层911 北京法宣在线科技有限公司 带薪年假、子女教育金、父母赡养金、节日礼物、扁平管理、定期体检、年度旅游、全勤奖、发展空间大… https://m.zhaopin.com//jobs/56636092500023946611/ AI算法工程师-人人律智能大数据科技公司 创业公司;五险一金;股票期权;带薪年假;弹性工作;节日福利;员工旅游;定期体检 2万-3万
4514 朝阳 北京未来进程信息技术有限公司 要求:1、PC端、移动端都可以测试;2、基本要求:功能测试的能力必须非常好。加分项:1、懂基… https://m.zhaopin.com//jobs/375117787250204/ 软件测试工程师 1万-1.5万
4515 北京朝阳区望京阜通东大街6号方恒国际中心B座507 神州灵云(北京)科技有限公司 岗位职责:一、岗位要求:1、 根据产品需求、特点编写测试计划、测试方案、测试报告;2、 按照… https://m.zhaopin.com//jobs/415933738250011/ 软件测试工程师 五险一金;绩效奖金 6千-1.2万
4516 北京市朝阳区望京利泽中一路中辰大厦3A02 北京泺喜教育科技有限公司 工作职责 :1、根据开发需求,高效完成相关程序的开发、测试;2、在工作或业余时间,完成对未来… https://m.zhaopin.com//jobs/38338392500023634710/ 应用工程师(软件方向) 6千-8千
4517 北京市朝阳区大屯里金泉时代3单元1815 北京禾唐科技有限公司 岗位职责:. 负责卖家云平台前后端技术开发、优化和维护. 积极响应运营团队反馈的问题,提供技… https://m.zhaopin.com//jobs/cz196212610j000307… java开发工程师 1.5万-2.5万
4518 北京市海淀区信息路30号上地大厦5层502室 北京恒济引航科技股份有限公司 工作职责:1、负责软件平台系统架构设计与实现及优化工作;2、负责总体设计和重要技术决策,指导… https://m.zhaopin.com//jobs/41176342400025277013/ 高级系统架构师 五险一金;通讯补贴;定期体检;员工旅游;节日福利;带薪年假;股票期权 1.5万-3万
4519 海淀区腾讯公司 车音智能科技有限公司 【工作职责】:负责金融应用类产品移动终端的版本测试,版本类型包括H5应用、ios/安卓上的A… https://m.zhaopin.com//jobs/52755368000141636501/ 测试工程师(自选股) 周末双休;五险一金;免费班车;员工旅游 8千-1.4万
4520 京市朝阳区朝外北街蓝筹名座D座2单元501 北京奋青榜科技有限公司 岗位职责:1 维护所有数据库稳定运行,关注数据库集群整体运行情况,持续发现和解决潜在的问题;… https://m.zhaopin.com//jobs/334310587250246/ DBA 五险一金;年底双薪;绩效奖金;加班补助;带薪年假;弹性工作;员工旅游;节日福利 1.3万-1.5万
4521 北京市朝阳区朝外大街20号联合大厦506 博易智讯(北京)信息技术有限公司 岗位职责:1、负责数据资源中心建设(大数据及分析)类项目的咨询和涉及工作,完成具体指定的数据… https://m.zhaopin.com//jobs/14231517100025758215/ BI资深售前/资深数据咨询顾问 五险一金;绩效奖金;定期体检;员工旅游;节日福利;不加班;带薪年假 1.5万-2万
4522 北京市海淀区北四环西路9号银谷大厦1504 北京永鼎致远网络科技有限公司 岗位职责:1、基于海量数据,挖掘数据规律并建立分析模型;2、对海量数据进行提炼、分析、归纳用… https://m.zhaopin.com//jobs/38037292500028068015/ 数据挖掘工程师 五险一金;年底双薪;绩效奖金;交通补助;餐补;通讯补贴;补充医疗保险 1.5万-2万
4523 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1 在业务场景下验证产品的功能与性能;2 进行大数据产品的安装部署与测试实施,进行… https://m.zhaopin.com//jobs/326767032250168/ 大数据工程师 五险一金;带薪年假;节日福利;员工旅游;定期体检;补充医疗保险 1万-2万
4524 北京市西城区电研大厦 北京善友正信科技有限公司 工作职责:1、负责数据仓库ETL流程的优化及解决ETL相关技术问题;2、负责大数据分析系统和… https://m.zhaopin.com//jobs/229707532250069/ ETL数据工程师 五险一金;节日福利;带薪年假 8千-1.2万
4525 北京市丰台区国投财富广场 北京虹信万达科技有限公司 岗位职责:1. 研发自动化运维平台,提高运维、开发协作效率,规范操作流程;2. 研发基础服务… https://m.zhaopin.com//jobs/341610437250040/ 自动化运维开发工程师 五险一金;绩效奖金;节日福利 1.2万-1.8万
4526 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1、hadoop,storm,hive,kafka,flume,hbase,ran… https://m.zhaopin.com//jobs/326767032250109/ 运维工程师 五险一金;带薪年假;节日福利;定期体检;员工旅游;补充医疗保险 8千-1.5万
4527 北京市朝阳区安立路60号润枫商务B座24层 玩咖欢聚文化传媒(北京)有限公司 工作职责: 1、负责公司项目中产品的页面交互及功能实现; 2、负责前端新技术研究及公司前端框… https://m.zhaopin.com//jobs/203128481251262/ 前端技术经理 周末双休;五险一金;年底双薪;加班补助;餐补;带薪年假;弹性工作;员工旅游 2万-4万
4528 北京市朝阳区建国路92号世茂大厦B座20层 北京极点触碰科技有限公司 岗位职责:1.参与产品评审,分析产品需求,根据项目需求和测试计划设计和编写测试用例;2.执行… https://m.zhaopin.com//jobs/cz525380730j000367… 测试工程师 五险一金;每年多次调薪;弹性工作;绩效奖金;带薪年假 8千-1.5万
4529 北京市海淀区启明星辰大厦 北京望时高科科技有限公司 此职位为人力外包职位,不接受的请慎重投简历,谢谢!PS:此职位仅招收男性。岗位职责:1.负责… https://m.zhaopin.com//jobs/43216162800038403612/ linux系统工程师 6千-1万
4530 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 任职要求:1)本科以上学历,有2年以上工作经验,至少1年大数据ETL开发经验、熟悉Hadoo… https://m.zhaopin.com//jobs/326767032250120/ 应用开发工程师 五险一金;带薪年假;节日福利;定期体检;补充医疗保险;员工旅游 8千-1.5万
4531 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责1. 从事金融、政府行业大数据项目有关数据ETL处理的设计、实现和优化,涵盖数据采集… https://m.zhaopin.com//jobs/326767032250161/ ETL工程师(项目) 五险一金;弹性工作;定期体检;节日福利;补充医疗保险;带薪年假 8千-1.5万
4532 北京市海淀区西三旗建材城中路12号院26栋 北京荣联科创科技有限公司 岗位职责:1、根据具体项目要求,承担开发任务,按计划完成任务目标;2、根据用户需求按时完成开… https://m.zhaopin.com//jobs/48747592300027909814/ 研发工程师 绩效奖金;全勤奖;交通补助;餐补;定期体检;员工旅游;节日福利;带薪年假 4千-6千
4533 北京市海淀区上地十街辉煌国际大厦 北京近颐科技有限公司 岗位职责:1负责服务集群的设计与搭建配置;2.负责Linux平台系统的安全管理;3.负责服务… https://m.zhaopin.com//jobs/292524636250052/ linux系统工程师 五险一金;交通补助;餐补;通讯补贴 6千-1万
4534 北京市海淀区中关村软件园11号楼 北京精一强远科技有限公司 公司介绍:北京精一强远科技有限公司,致力于高端IT专业产品的专业设计、专业制造业务。公司拥有… https://m.zhaopin.com//jobs/287608631250052/ 软件开发工程师 五险一金;年底双薪;绩效奖金;包吃;通讯补贴;带薪年假;补充医疗保险;定期体检 1万-1.5万
4535 北京市朝阳区双桥Dream2049园区世联文创一层107(东侧) 北京华沁智联科技有限公司 岗位职责1、 负责项目/产品的测试工作,参与产品需求分析,负责测试计划制定,并能预先评估项目… https://m.zhaopin.com//jobs/331013133250043/ 开发测试工程师(白盒) 创业公司;五险一金;绩效奖金;股票期权;餐补;带薪年假;弹性工作;节日福利 1.5万-2.5万
4536 广顺北大街5号院内融创动力科技文化创意产业园B230 北京书生云科技有限公司 https://m.zhaopin.com//jobs/45496253700037561514/ 实施工程师 创业公司;周末双休;五险一金;带薪年假;弹性工作;通讯补贴 8千-1.5万
4537 北京市东城区朝内大街298号 北京国研数通软件技术有限公司 岗位职责:1、负责大数据平台的开发和维护,负责大数据平台持续集成相关工具平台的架构设计与产品… https://m.zhaopin.com//jobs/120900932250257/ 大数据JAVA开发工程师 1万-1.5万
4538 北京市东城区灯市口大街33号国中商业大厦423室 北京树优信息技术有限公司 工作职责: 1 负责或参与流体分析技术服务项目2 负责或参与流体优化技术服务项目3 负… https://m.zhaopin.com//jobs/226257529250059/ 流体力学仿真优化工程师 五险一金;绩效奖金;加班补助;交通补助;房补;带薪年假;员工旅游;节日福利 6千-8千
4539 朝阳区来广营叶青大厦北园308 北京行易道科技有限公司 岗位职责:1、进行高可靠高安全嵌入式软件测试,包含代码测试、功能测试、性能测试、安全性测试等… https://m.zhaopin.com//jobs/22757003700087605207/ 嵌入式软件测试工程师 14薪;健身俱乐部;周末双休;五险一金;餐补;带薪年假;弹性工作;补充医疗保险 8千-1.3万
4540 东城区王府井东街8号 澳门中心B1层funwork 睿医(北京)数据技术有限公司 职位描述:1.根据项目需求,独立完成各类型的临床数据的统计分析工作2.参与产品统计模块的功能… https://m.zhaopin.com//jobs/cz752253770j000214… 医学统计经理 五险一金;股票期权 1.5万-3万

4541 rows × 7 columns

# 2 根据工作名称剔除掉不合适的工作,如php,java等
name_ban = ['linux','php','Linux','PHP','JAVA','java','Java','DBA','运维','web','WEB','实习生','C','C++','培训','R','Golang']

def ban_name(job_name):
    if any(x in job_name for x in ['python',"Python"]):
        pass
    else:
        if any(x in job_name for x in name_ban):
            job_name = np.nan
    return job_name

df['job_name'] = df['job_name'].apply(ban_name)
df.dropna(how='any')
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary
1 丰台区航丰路一号时代财富天地大厦28层 深圳市八斗才数据有限公司 岗位职责:1、 负责互联网网站产品开发;2、 参与产品设计、架构设计和代码编写;3、 负责问… https://m.zhaopin.com//jobs/cz562550030j000298… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 1万-1.8万
2 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市芒柠科技有限公司 岗位职责:1、维护现有的平台代码。2、参与项目的架构设计,明确负责开发部分的设计需求。3、按… https://m.zhaopin.com//jobs/cz466965980j000547… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助 1万-1.5万
3 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市源极光科技有限公司 技术要求:1、精通Python语言,熟悉Python多线程 socket通信机制;2、精通流… https://m.zhaopin.com//jobs/cz897833860j000551… python工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;年底双薪;带薪年假;弹性工作;员工旅游 1万-1.5万
4 海淀区中关村软件园11号楼大洋大厦 深圳市芒柠科技有限公司 岗位职责:1. 负责云平台应用的开发维护;2. 负责服务器端API的设计与开发。岗位要求:1… https://m.zhaopin.com//jobs/cz730936640j000955… Python开发工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;员工旅游;带薪年假;弹性工作;节日福利 1万-1.5万
5 北京市海淀区苏州街3号大恒科技大厦南座17层 北京乐学创想教育科技有限公司 岗位职责:1、题库全栈开发和维护,包括需求分析、技术改进、后期维护2、构建数据分析模型,对视… https://m.zhaopin.com//jobs/244101282250512/ Python工程师 节日福利;五险一金;餐补;创业公司 1.5万-3万
6 北京市朝阳区来广营中街甲1号朝来科技产业园创远路36号院4-6号楼 北京尚德在线教育科技有限公司 岗位职责:1、负责公司电商平台如天猫微店、京东、苏宁等商城日常的运营管理,包括店铺整体策划、… https://m.zhaopin.com//jobs/424628486272009/ python自动化 创业公司;无试用期;绩效奖金;不加班 1千-2千
7 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 职位职责:1. 基于 Python 的分布式集群管理软件开发2. 基于 Web 的工具软… https://m.zhaopin.com//jobs/567369733250977/ Python实习生 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 8千-1万
8 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 工作方向openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等技术要… https://m.zhaopin.com//jobs/567369733250978/ Python开发实习(接受零基础) 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 8千-1万
9 北京市海淀区上地农大南路88号万霖大厦3层 北京云纵信息技术有限公司 岗位职责:1)负责业务系统运行环境的基础服务管理,系统架构的维护;2)参与基于大数据平台的维… https://m.zhaopin.com//jobs/311289936253904/ linux运维工程师(熟练python) 节日福利;五险一金;绩效奖金;加班补助;交通补助;餐补;带薪年假;健身俱乐部 1.8万-2.8万
10 后沙峪安庆大街巨鸿大厦A座5层 天津狮桥国际物流有限公司 一、岗位职责:1、搭建系统开发环境,完成系统框架和核心代码的实现,负责解决开发过程中的技术问… https://m.zhaopin.com//jobs/670247822251376/ Python软件开发工程师 五险一金;绩效奖金;包住;餐补;通讯补贴;带薪年假 1万-2万
11 北京市海淀区互联网金融中心21层 北京融七牛信息技术有限公司 岗位职责:1. 负责天机风控系统模型在线服务的架构设计、优化和研发工作; 2. 负责线上服务… https://m.zhaopin.com//jobs/435840920250697/ 高级python研发工程师(000650) 五险一金;绩效奖金;餐补;通讯补贴;补充医疗保险;定期体检;节日福利 2.5万-4万
12 北京市朝阳区工体 北京科锐国际人力资源股份有限公司 岗位职责:1. 基于公司CRM系统 的产品研发、以及项目开发;2. 公司内部电商平台开发工作… https://m.zhaopin.com//jobs/263940938259405/ 直聘软件研发(Golang , Python, Ruby) 节日福利;周末双休;五险一金;年底双薪;绩效奖金;年终分红;补充医疗保险;定期体检 1.5万-2万
17 北京市朝阳区北京市朝阳区广渠路3号竞园图片产业园1号库 Forgame–云游控股集团 岗位职责:1、负责在线娃娃机的管理后台系统的研发2、负责统计后台搭建 3、负责监控后台搭建1… https://m.zhaopin.com//jobs/571816225250634/ python后台研发工程师 2万-3万
18 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 职位职责:1、负责产品的服务端开发;2、负责优化产品的性能,根据产品设计完成高质量的服务端产… https://m.zhaopin.com//jobs/562114535250039/ python开发工程师 [北京] 五险一金;年底双薪;绩效奖金;带薪年假;弹性工作;补充医疗保险;定期体检;员工旅游 1.5万-2万
19 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 岗位职责:1、负责数据后台服务的设计、开发、优化、测试等研发工作;2、负责支撑业务的其他项目… https://m.zhaopin.com//jobs/cz562114530j000297… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 1万-1.5万
20 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、爬虫系统开发和优化;2、文档识别和提取;3、互联网数据采集。专业素质要求:1、… https://m.zhaopin.com//jobs/444406089252927/ python爬虫数据采集实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
21 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1. 参与公司软件产品后台研发和维护工作;2. 参与建筑物联网数据分析算法的设计和… https://m.zhaopin.com//jobs/444406089252925/ Python工程师招实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
22 北京市海淀区西二旗 广州百单网互联网科技有限公司 【岗位职责】1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、… https://m.zhaopin.com//jobs/444406089252924/ Python开发工程师待遇从优 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
23 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/444406089252923/ 后端工程师/Python工程师 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
24 北京市东城区和平里西街51号雍和宫壹中心A4楼3层 游族网络 岗位职责:1、创新项目及公司内部管理系统后台相关服务端的研发和维护;2、网页信息抓取结果的抽… https://m.zhaopin.com//jobs/264844217254121/ Python开发工程师-base北京 1.2万-1.8万
25 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市八斗才数据有限公司 工作职责:1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、效… https://m.zhaopin.com//jobs/562550032250030/ Python开发工程师(北京) 五险一金;补充医疗保险;绩效奖金;定期体检;年底双薪;带薪年假;节日福利;员工旅游 1.5万-2.5万
26 北京市海淀区北三环中路44号院 北京华信智原教育技术有限公司 岗位职责:1.积极参与教学大纲的制定,并按照教学大纲授课;2.通过QQ与学员交流,并耐心给学… https://m.zhaopin.com//jobs/134503487251283/ Python老师 五险一金;年底双薪;带薪年假;员工旅游;高温补贴;节日福利 1.5万-2万
27 昌平区建材城西路育新小区对面金燕龙办公楼传智播客 江苏传智播客教育科技股份有限公司北京分公司 工作职责:按照教学大纲高质量完成日常授课任务; 根据市场需求,改进教学方法和内容,完善教学体… https://m.zhaopin.com//jobs/374740583250235/ python导师J10091 五险一金;交通补助;餐补;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 1.6万-3万
28 北京市海淀区西二旗 广州百单网互联网科技有限公司 工作方向:openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等。技… https://m.zhaopin.com//jobs/444406089252926/ python开发实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 4千-6千
29 北京市海淀区西二旗 北京升凯网络科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/540062934250725/ 后端工程师/Python工程师 五险一金;年底双薪;绩效奖金;餐补;房补;定期体检;员工旅游 4千-6千
30 公司名称:北京奇虎科技有限公司<br/>公司主页:http://www.360.cn<br/> 北京奇虎科技有限公司 https://m.zhaopin.com//jobs/467717611259614/ Python高级开发工程师 面议
31 北京市海淀区西二旗 北京升凯网络科技有限公司 岗位职责:1. 参与公司软件产品后台研发和维护工作;2. 参与建筑物联网数据分析算法的设计和… https://m.zhaopin.com//jobs/540062934250727/ Python工程师招实习生 五险一金;年底双薪;绩效奖金;餐补;房补;定期体检;员工旅游 4千-6千
32 北京市海淀区银科大厦610 深圳码隆科技有限公司 【公司简介】码隆科技是一家专注于深度学习与计算机视觉技术创新,打造领先视觉智能技术平台的人工… https://m.zhaopin.com//jobs/491469330251549/ Python开发实习生 五险一金;加班补助;带薪年假;节日福利 5千-8千
33 北京市顺义区中粮祥云国际生活区24号楼1102室 北京华卓餐饮连锁股份有限公司 描述:1、对金融数据进行清洗、存储以及维护。2、升级以及维护现有交易系统。3、与团队合作开发… https://m.zhaopin.com//jobs/247759323250502/ Python数据分析师(量化金融) 五险一金;餐补;带薪年假;弹性工作 2万-4万
34 北京市朝阳区安贞桥北安定路39号 长新大厦6层611室 北京好巧国际旅行社有限公司 【岗位职责】 负责在线服务数据平台的设计和实现。主要实现语言为Python,开发环境为… https://m.zhaopin.com//jobs/325958332250063/ Linux C++/Python高级研发工程师 五险一金;股票期权;餐补;带薪年假;弹性工作;节日福利 2.5万-3.5万
4500 北京市朝阳区启阳路金辉大厦16层 北京麦达数字技术服务有限公司 岗位描述:1、探索研究大数据和机器学习在业务层面的应用,尤其是在精准营销及投资标的管理领域的… https://m.zhaopin.com//jobs/cz898420920j000119… 数据分析师 五险一金;交通补助;餐补;带薪年假;弹性工作;节日福利;14薪 3万-5万
4501 北京朝阳富尔大厦(金台夕照站) 中云网安科技(北京)有限公司 职责描述:1、负责测试方案制定、测试工具开发、跟进产品质量驱动研发优化产品2、跟踪测试中发现… https://m.zhaopin.com//jobs/242145589250001/ 测试工程师 五险一金 1万-1.5万
4502 北京市朝阳区霄云路25号乙 智美体育集团 岗位职责:负责搭建体育赛事及全民运动综合运营平台任职要求:1. 熟练使用至少一门编程语言 (… https://m.zhaopin.com//jobs/231576928252103/ 数据挖掘工程师 五险一金;带薪年假;定期体检 1.5万-2.5万
4504 北京市朝阳区光华路9号SOHO二期 广州优家投资管理有限责任公司 岗位职责:1、负责开发公司公寓管理B端产品及用户社交C端产品的前端页面;2、对前端需求进行合… https://m.zhaopin.com//jobs/583428327250239/ 前端开发工程师 五险一金;弹性工作;补充医疗保险;节日福利;房补 1.3万-2.2万
4507 北京市海淀区永泰庄甲一号综合楼建金商厦4层10-11 北京创源微致软件有限公司 任职要求:1. 硕士以上学历,计算机、通信、信息或者相关专业2. 熟悉C语言3. 对图像处理… https://m.zhaopin.com//jobs/530391436250003/ 图像处理工程师 14薪;五险一金;全勤奖;通讯补贴;带薪年假;补充医疗保险;定期体检;节日福利 1万-2万
4508 北京市海淀区清华科技园创业大厦1107A室 北京四三九九信息科技有限公司 岗位职责:1、设计和开发移动端游戏;2、编写高质量代码,参与游戏创意及设计,按照需求实现游戏… https://m.zhaopin.com//jobs/485462128250590/ 游戏开发工程师(2018、2019届毕业生) 五险一金;年底双薪;绩效奖金;全勤奖;包吃;带薪年假;定期体检;员工旅游 1万-2万
4509 北京市海淀区永泰庄甲一号综合楼建金商厦4层10-11 北京创源微致软件有限公司 岗位职责:测试工作量预估。测试计划和测试方案确定。自动化测试框架的搭建和持续更新。测试案例编… https://m.zhaopin.com//jobs/530391436250006/ 测试开发 14薪;五险一金;通讯补贴;带薪年假;补充医疗保险;定期体检;节日福利 1.2万-2.4万
4510 北京市东城区朝阳门内大街银河sohoA座10层 北京精图天下科技发展有限公司 岗位职责:1.对软件配置库进行整体管理;2.负责建库、目录创建及权限分配及回收;3.负责根据… https://m.zhaopin.com//jobs/cz462794580j000414… 配置管理工程师 五险一金;加班补助;带薪年假 1.5万-2.5万
4512 五棵松地铁附近 北京海思瑞格科技有限公司 职位描述:1. 通过深度学习方法解决临床问题;2. 搭建基于深度学习框架的时序信号处理和医疗… https://m.zhaopin.com//jobs/30130628000026679212/ 算法工程师(深度学习方向) 创业公司;每年多次调薪;定期体检;节日福利;绩效奖金;餐补;五险一金 1.2万-2.5万
4513 北京市海淀区北三环西路32号恒润国际大厦9层911 北京法宣在线科技有限公司 带薪年假、子女教育金、父母赡养金、节日礼物、扁平管理、定期体检、年度旅游、全勤奖、发展空间大… https://m.zhaopin.com//jobs/56636092500023946611/ AI算法工程师-人人律智能大数据科技公司 创业公司;五险一金;股票期权;带薪年假;弹性工作;节日福利;员工旅游;定期体检 2万-3万
4514 朝阳 北京未来进程信息技术有限公司 要求:1、PC端、移动端都可以测试;2、基本要求:功能测试的能力必须非常好。加分项:1、懂基… https://m.zhaopin.com//jobs/375117787250204/ 软件测试工程师 1万-1.5万
4515 北京朝阳区望京阜通东大街6号方恒国际中心B座507 神州灵云(北京)科技有限公司 岗位职责:一、岗位要求:1、 根据产品需求、特点编写测试计划、测试方案、测试报告;2、 按照… https://m.zhaopin.com//jobs/415933738250011/ 软件测试工程师 五险一金;绩效奖金 6千-1.2万
4516 北京市朝阳区望京利泽中一路中辰大厦3A02 北京泺喜教育科技有限公司 工作职责 :1、根据开发需求,高效完成相关程序的开发、测试;2、在工作或业余时间,完成对未来… https://m.zhaopin.com//jobs/38338392500023634710/ 应用工程师(软件方向) 6千-8千
4518 北京市海淀区信息路30号上地大厦5层502室 北京恒济引航科技股份有限公司 工作职责:1、负责软件平台系统架构设计与实现及优化工作;2、负责总体设计和重要技术决策,指导… https://m.zhaopin.com//jobs/41176342400025277013/ 高级系统架构师 五险一金;通讯补贴;定期体检;员工旅游;节日福利;带薪年假;股票期权 1.5万-3万
4519 海淀区腾讯公司 车音智能科技有限公司 【工作职责】:负责金融应用类产品移动终端的版本测试,版本类型包括H5应用、ios/安卓上的A… https://m.zhaopin.com//jobs/52755368000141636501/ 测试工程师(自选股) 周末双休;五险一金;免费班车;员工旅游 8千-1.4万
4521 北京市朝阳区朝外大街20号联合大厦506 博易智讯(北京)信息技术有限公司 岗位职责:1、负责数据资源中心建设(大数据及分析)类项目的咨询和涉及工作,完成具体指定的数据… https://m.zhaopin.com//jobs/14231517100025758215/ BI资深售前/资深数据咨询顾问 五险一金;绩效奖金;定期体检;员工旅游;节日福利;不加班;带薪年假 1.5万-2万
4522 北京市海淀区北四环西路9号银谷大厦1504 北京永鼎致远网络科技有限公司 岗位职责:1、基于海量数据,挖掘数据规律并建立分析模型;2、对海量数据进行提炼、分析、归纳用… https://m.zhaopin.com//jobs/38037292500028068015/ 数据挖掘工程师 五险一金;年底双薪;绩效奖金;交通补助;餐补;通讯补贴;补充医疗保险 1.5万-2万
4523 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1 在业务场景下验证产品的功能与性能;2 进行大数据产品的安装部署与测试实施,进行… https://m.zhaopin.com//jobs/326767032250168/ 大数据工程师 五险一金;带薪年假;节日福利;员工旅游;定期体检;补充医疗保险 1万-2万
4524 北京市西城区电研大厦 北京善友正信科技有限公司 工作职责:1、负责数据仓库ETL流程的优化及解决ETL相关技术问题;2、负责大数据分析系统和… https://m.zhaopin.com//jobs/229707532250069/ ETL数据工程师 五险一金;节日福利;带薪年假 8千-1.2万
4527 北京市朝阳区安立路60号润枫商务B座24层 玩咖欢聚文化传媒(北京)有限公司 工作职责: 1、负责公司项目中产品的页面交互及功能实现; 2、负责前端新技术研究及公司前端框… https://m.zhaopin.com//jobs/203128481251262/ 前端技术经理 周末双休;五险一金;年底双薪;加班补助;餐补;带薪年假;弹性工作;员工旅游 2万-4万
4528 北京市朝阳区建国路92号世茂大厦B座20层 北京极点触碰科技有限公司 岗位职责:1.参与产品评审,分析产品需求,根据项目需求和测试计划设计和编写测试用例;2.执行… https://m.zhaopin.com//jobs/cz525380730j000367… 测试工程师 五险一金;每年多次调薪;弹性工作;绩效奖金;带薪年假 8千-1.5万
4530 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 任职要求:1)本科以上学历,有2年以上工作经验,至少1年大数据ETL开发经验、熟悉Hadoo… https://m.zhaopin.com//jobs/326767032250120/ 应用开发工程师 五险一金;带薪年假;节日福利;定期体检;补充医疗保险;员工旅游 8千-1.5万
4531 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责1. 从事金融、政府行业大数据项目有关数据ETL处理的设计、实现和优化,涵盖数据采集… https://m.zhaopin.com//jobs/326767032250161/ ETL工程师(项目) 五险一金;弹性工作;定期体检;节日福利;补充医疗保险;带薪年假 8千-1.5万
4532 北京市海淀区西三旗建材城中路12号院26栋 北京荣联科创科技有限公司 岗位职责:1、根据具体项目要求,承担开发任务,按计划完成任务目标;2、根据用户需求按时完成开… https://m.zhaopin.com//jobs/48747592300027909814/ 研发工程师 绩效奖金;全勤奖;交通补助;餐补;定期体检;员工旅游;节日福利;带薪年假 4千-6千
4534 北京市海淀区中关村软件园11号楼 北京精一强远科技有限公司 公司介绍:北京精一强远科技有限公司,致力于高端IT专业产品的专业设计、专业制造业务。公司拥有… https://m.zhaopin.com//jobs/287608631250052/ 软件开发工程师 五险一金;年底双薪;绩效奖金;包吃;通讯补贴;带薪年假;补充医疗保险;定期体检 1万-1.5万
4535 北京市朝阳区双桥Dream2049园区世联文创一层107(东侧) 北京华沁智联科技有限公司 岗位职责1、 负责项目/产品的测试工作,参与产品需求分析,负责测试计划制定,并能预先评估项目… https://m.zhaopin.com//jobs/331013133250043/ 开发测试工程师(白盒) 创业公司;五险一金;绩效奖金;股票期权;餐补;带薪年假;弹性工作;节日福利 1.5万-2.5万
4536 广顺北大街5号院内融创动力科技文化创意产业园B230 北京书生云科技有限公司 https://m.zhaopin.com//jobs/45496253700037561514/ 实施工程师 创业公司;周末双休;五险一金;带薪年假;弹性工作;通讯补贴 8千-1.5万
4538 北京市东城区灯市口大街33号国中商业大厦423室 北京树优信息技术有限公司 工作职责: 1 负责或参与流体分析技术服务项目2 负责或参与流体优化技术服务项目3 负… https://m.zhaopin.com//jobs/226257529250059/ 流体力学仿真优化工程师 五险一金;绩效奖金;加班补助;交通补助;房补;带薪年假;员工旅游;节日福利 6千-8千
4539 朝阳区来广营叶青大厦北园308 北京行易道科技有限公司 岗位职责:1、进行高可靠高安全嵌入式软件测试,包含代码测试、功能测试、性能测试、安全性测试等… https://m.zhaopin.com//jobs/22757003700087605207/ 嵌入式软件测试工程师 14薪;健身俱乐部;周末双休;五险一金;餐补;带薪年假;弹性工作;补充医疗保险 8千-1.3万
4540 东城区王府井东街8号 澳门中心B1层funwork 睿医(北京)数据技术有限公司 职位描述:1.根据项目需求,独立完成各类型的临床数据的统计分析工作2.参与产品统计模块的功能… https://m.zhaopin.com//jobs/cz752253770j000214… 医学统计经理 五险一金;股票期权 1.5万-3万

3379 rows × 7 columns

# 3 将万转为数字;万x10000  , 千x1000

def get_num_salary(salary):
    s = 0
    if "-" in salary:
        for part in salary.split('-'):
            if '万' in part:
                q = float(part[:-1]) * 10000
            else:
                q = float(part[:-1]) * 1000
            s +=q
        return int(s/2.0)
    else:
        # 返回null
        return np.nan

df['salary'] = df['salary'].apply(get_num_salary)
df.head()
————————————————————————— TypeError Traceback (most recent call last) in () 15 return np.nan 16 —> 17 df[‘salary’] = df[‘salary’].apply(get_num_salary) 18 df.head() c:\users\administrator\appdata\local\programs\python\python35\lib\site-packages\pandas\core\series.py in apply(self, func, convert_dtype, args, **kwds) 2549 else: 2550 values = self.asobject -> 2551 mapped = lib.map_infer(values, f, convert=convert_dtype) 2552 2553 if len(mapped) and isinstance(mapped[0], Series): pandas/_libs/src\inference.pyx in pandas._libs.lib.map_infer() in get_num_salary(salary) 3 def get_num_salary(salary): 4 s = 0 —-> 5 if “-” in salary: 6 for part in salary.split(‘-‘): 7 if ‘万’ in part: TypeError: argument of type ‘float’ is not iterable
# 面议和一千以下的用中位数来代替
df = df.fillna(df.median())
df
.dataframe tbody tr th:only-of-type { vertical-align: middle; } .dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; }
address company job_info job_link job_name job_tags salary
0 北京市朝阳区裕民路12号 中国国际科技会展中心A座10层 大连飞创信息技术有限公司 岗位职责:1、按照有关制度和规范的要求,承担代码的编写工作。对开发任务、需求理解透彻,积极配… https://m.zhaopin.com//jobs/210653218250637/ C++开发工程师 五险一金;年底双薪;绩效奖金;加班补助;交通补助;餐补;采暖补贴;定期体检 17500.0
1 丰台区航丰路一号时代财富天地大厦28层 深圳市八斗才数据有限公司 岗位职责:1、 负责互联网网站产品开发;2、 参与产品设计、架构设计和代码编写;3、 负责问… https://m.zhaopin.com//jobs/cz562550030j000298… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 14000.0
2 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市芒柠科技有限公司 岗位职责:1、维护现有的平台代码。2、参与项目的架构设计,明确负责开发部分的设计需求。3、按… https://m.zhaopin.com//jobs/cz466965980j000547… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;员工旅游;带薪年假;弹性工作;加班补助 12500.0
3 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市源极光科技有限公司 技术要求:1、精通Python语言,熟悉Python多线程 socket通信机制;2、精通流… https://m.zhaopin.com//jobs/cz897833860j000551… python工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;年底双薪;带薪年假;弹性工作;员工旅游 12500.0
4 海淀区中关村软件园11号楼大洋大厦 深圳市芒柠科技有限公司 岗位职责:1. 负责云平台应用的开发维护;2. 负责服务器端API的设计与开发。岗位要求:1… https://m.zhaopin.com//jobs/cz730936640j000955… Python开发工程师(北京) 五险一金;补充医疗保险;定期体检;绩效奖金;员工旅游;带薪年假;弹性工作;节日福利 12500.0
5 北京市海淀区苏州街3号大恒科技大厦南座17层 北京乐学创想教育科技有限公司 岗位职责:1、题库全栈开发和维护,包括需求分析、技术改进、后期维护2、构建数据分析模型,对视… https://m.zhaopin.com//jobs/244101282250512/ Python工程师 节日福利;五险一金;餐补;创业公司 22500.0
6 北京市朝阳区来广营中街甲1号朝来科技产业园创远路36号院4-6号楼 北京尚德在线教育科技有限公司 岗位职责:1、负责公司电商平台如天猫微店、京东、苏宁等商城日常的运营管理,包括店铺整体策划、… https://m.zhaopin.com//jobs/424628486272009/ python自动化 创业公司;无试用期;绩效奖金;不加班 1500.0
7 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 职位职责:1. 基于 Python 的分布式集群管理软件开发2. 基于 Web 的工具软… https://m.zhaopin.com//jobs/567369733250977/ Python实习生 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 9000.0
8 北京市海淀区宝盛北里西区28号天丰利商城4层 北京欣如信科技有限公司 工作方向openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等技术要… https://m.zhaopin.com//jobs/567369733250978/ Python开发实习(接受零基础) 五险一金;年底双薪;绩效奖金;全勤奖;员工旅游;节日福利;不加班 9000.0
9 北京市海淀区上地农大南路88号万霖大厦3层 北京云纵信息技术有限公司 岗位职责:1)负责业务系统运行环境的基础服务管理,系统架构的维护;2)参与基于大数据平台的维… https://m.zhaopin.com//jobs/311289936253904/ linux运维工程师(熟练python) 节日福利;五险一金;绩效奖金;加班补助;交通补助;餐补;带薪年假;健身俱乐部 23000.0
10 后沙峪安庆大街巨鸿大厦A座5层 天津狮桥国际物流有限公司 一、岗位职责:1、搭建系统开发环境,完成系统框架和核心代码的实现,负责解决开发过程中的技术问… https://m.zhaopin.com//jobs/670247822251376/ Python软件开发工程师 五险一金;绩效奖金;包住;餐补;通讯补贴;带薪年假 15000.0
11 北京市海淀区互联网金融中心21层 北京融七牛信息技术有限公司 岗位职责:1. 负责天机风控系统模型在线服务的架构设计、优化和研发工作; 2. 负责线上服务… https://m.zhaopin.com//jobs/435840920250697/ 高级python研发工程师(000650) 五险一金;绩效奖金;餐补;通讯补贴;补充医疗保险;定期体检;节日福利 32500.0
12 北京市朝阳区工体 北京科锐国际人力资源股份有限公司 岗位职责:1. 基于公司CRM系统 的产品研发、以及项目开发;2. 公司内部电商平台开发工作… https://m.zhaopin.com//jobs/263940938259405/ 直聘软件研发(Golang , Python, Ruby) 节日福利;周末双休;五险一金;年底双薪;绩效奖金;年终分红;补充医疗保险;定期体检 17500.0
13 北京市海淀区西北旺东路10号院东区1号楼领创空间2层204A 北京彼速信息技术有限公司 职位要求:1.本科以上学历,计算机相关专业;2.熟悉B/S软件结构;3. 精通C#,熟练掌握… https://m.zhaopin.com//jobs/136473062250465/ C#/Asp.Net高级软件工程师 五险一金 15000.0
14 北京市东城区和平里东街11号雍和航星园三号楼一层 浙江齐聚科技有限公司北京分公司 1. 负责产品功能性需求的开发、维护。2. 负责优化系统的性能和稳定性3. 能独立完成个人承… https://m.zhaopin.com//jobs/32922521700041200311/ 高级java工程师 25000.0
15 (中关村)北京市海淀区王庄路1号清华同方科技广场A座17层 北京固鸿科技有限公司 岗位职责:1、负责公司软件系统集成开发;2、按规范编写系统需求、概要设计、详细设计及系统部署… https://m.zhaopin.com//jobs/137279958250759/ Windows C++软件开发工程师 五险一金;年终分红;交通补助;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 15000.0
16 马尼拉分公司 皇室科技有限公司 只要你有能力,薪资不是问题!只要你有能力,薪资不是问题!任职要求1、计算机及相关专业,国家统… https://m.zhaopin.com//jobs/cz735252640j001365… php工程师/php程序员/php 住房补贴;每年多次调薪;健身俱乐部;包吃;包住;房补;通讯补贴;带薪年假 20000.0
17 北京市朝阳区北京市朝阳区广渠路3号竞园图片产业园1号库 Forgame–云游控股集团 岗位职责:1、负责在线娃娃机的管理后台系统的研发2、负责统计后台搭建 3、负责监控后台搭建1… https://m.zhaopin.com//jobs/571816225250634/ python后台研发工程师 25000.0
18 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 职位职责:1、负责产品的服务端开发;2、负责优化产品的性能,根据产品设计完成高质量的服务端产… https://m.zhaopin.com//jobs/562114535250039/ python开发工程师 [北京] 五险一金;年底双薪;绩效奖金;带薪年假;弹性工作;补充医疗保险;定期体检;员工旅游 17500.0
19 北京市海淀区东北旺西路八号中关村软件园9号楼国际软件大厦 深圳市源极光科技有限公司 岗位职责:1、负责数据后台服务的设计、开发、优化、测试等研发工作;2、负责支撑业务的其他项目… https://m.zhaopin.com//jobs/cz562114530j000297… python开发工程师(北京) 五险一金;年底双薪;绩效奖金;补充医疗保险;定期体检;员工旅游;带薪年假;弹性工作 12500.0
20 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、爬虫系统开发和优化;2、文档识别和提取;3、互联网数据采集。专业素质要求:1、… https://m.zhaopin.com//jobs/444406089252927/ python爬虫数据采集实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
21 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1. 参与公司软件产品后台研发和维护工作;2. 参与建筑物联网数据分析算法的设计和… https://m.zhaopin.com//jobs/444406089252925/ Python工程师招实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
22 北京市海淀区西二旗 广州百单网互联网科技有限公司 【岗位职责】1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、… https://m.zhaopin.com//jobs/444406089252924/ Python开发工程师待遇从优 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
23 北京市海淀区西二旗 广州百单网互联网科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/444406089252923/ 后端工程师/Python工程师 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
24 北京市东城区和平里西街51号雍和宫壹中心A4楼3层 游族网络 岗位职责:1、创新项目及公司内部管理系统后台相关服务端的研发和维护;2、网页信息抓取结果的抽… https://m.zhaopin.com//jobs/264844217254121/ Python开发工程师-base北京 15000.0
25 北京市朝阳区高碑店陈家林9号院华腾世纪总部公园A座3楼 深圳市八斗才数据有限公司 工作职责:1、负责效率工具的后台开发工作,具体包括需求分析、文档撰写、设计编码、测试运维、效… https://m.zhaopin.com//jobs/562550032250030/ Python开发工程师(北京) 五险一金;补充医疗保险;绩效奖金;定期体检;年底双薪;带薪年假;节日福利;员工旅游 20000.0
26 北京市海淀区北三环中路44号院 北京华信智原教育技术有限公司 岗位职责:1.积极参与教学大纲的制定,并按照教学大纲授课;2.通过QQ与学员交流,并耐心给学… https://m.zhaopin.com//jobs/134503487251283/ Python老师 五险一金;年底双薪;带薪年假;员工旅游;高温补贴;节日福利 17500.0
27 昌平区建材城西路育新小区对面金燕龙办公楼传智播客 江苏传智播客教育科技股份有限公司北京分公司 工作职责:按照教学大纲高质量完成日常授课任务; 根据市场需求,改进教学方法和内容,完善教学体… https://m.zhaopin.com//jobs/374740583250235/ python导师J10091 五险一金;交通补助;餐补;带薪年假;补充医疗保险;定期体检;员工旅游;节日福利 23000.0
28 北京市海淀区西二旗 广州百单网互联网科技有限公司 工作方向:openstack、 金融支付云平台、网盘、云存储体系、TCP/IP网关服务等。技… https://m.zhaopin.com//jobs/444406089252926/ python开发实习生 五险一金;绩效奖金;餐补;房补;带薪年假;弹性工作;定期体检;节日福利 5000.0
29 北京市海淀区西二旗 北京升凯网络科技有限公司 岗位职责:1、 根据产品需求,按时完成指定任务的设计与开发;2、 配合其他研发人员完成项目的… https://m.zhaopin.com//jobs/540062934250725/ 后端工程师/Python工程师 五险一金;年底双薪;绩效奖金;餐补;房补;定期体检;员工旅游 5000.0
4511 北京市朝阳区远洋国际中心A座2306 国信嘉宁数据技术有限公司 岗位职责:1、配合开发人员对公司主营产品的应用部署及环境调优;2、跟进解决系统运维技术问题;… https://m.zhaopin.com//jobs/268720686250316/ Linux系统运维工程师 周末双休;五险一金;绩效奖金;餐补;带薪年假;定期体检 11500.0
4512 五棵松地铁附近 北京海思瑞格科技有限公司 职位描述:1. 通过深度学习方法解决临床问题;2. 搭建基于深度学习框架的时序信号处理和医疗… https://m.zhaopin.com//jobs/30130628000026679212/ 算法工程师(深度学习方向) 创业公司;每年多次调薪;定期体检;节日福利;绩效奖金;餐补;五险一金 18500.0
4513 北京市海淀区北三环西路32号恒润国际大厦9层911 北京法宣在线科技有限公司 带薪年假、子女教育金、父母赡养金、节日礼物、扁平管理、定期体检、年度旅游、全勤奖、发展空间大… https://m.zhaopin.com//jobs/56636092500023946611/ AI算法工程师-人人律智能大数据科技公司 创业公司;五险一金;股票期权;带薪年假;弹性工作;节日福利;员工旅游;定期体检 25000.0
4514 朝阳 北京未来进程信息技术有限公司 要求:1、PC端、移动端都可以测试;2、基本要求:功能测试的能力必须非常好。加分项:1、懂基… https://m.zhaopin.com//jobs/375117787250204/ 软件测试工程师 12500.0
4515 北京朝阳区望京阜通东大街6号方恒国际中心B座507 神州灵云(北京)科技有限公司 岗位职责:一、岗位要求:1、 根据产品需求、特点编写测试计划、测试方案、测试报告;2、 按照… https://m.zhaopin.com//jobs/415933738250011/ 软件测试工程师 五险一金;绩效奖金 9000.0
4516 北京市朝阳区望京利泽中一路中辰大厦3A02 北京泺喜教育科技有限公司 工作职责 :1、根据开发需求,高效完成相关程序的开发、测试;2、在工作或业余时间,完成对未来… https://m.zhaopin.com//jobs/38338392500023634710/ 应用工程师(软件方向) 7000.0
4517 北京市朝阳区大屯里金泉时代3单元1815 北京禾唐科技有限公司 岗位职责:. 负责卖家云平台前后端技术开发、优化和维护. 积极响应运营团队反馈的问题,提供技… https://m.zhaopin.com//jobs/cz196212610j000307… java开发工程师 20000.0
4518 北京市海淀区信息路30号上地大厦5层502室 北京恒济引航科技股份有限公司 工作职责:1、负责软件平台系统架构设计与实现及优化工作;2、负责总体设计和重要技术决策,指导… https://m.zhaopin.com//jobs/41176342400025277013/ 高级系统架构师 五险一金;通讯补贴;定期体检;员工旅游;节日福利;带薪年假;股票期权 22500.0
4519 海淀区腾讯公司 车音智能科技有限公司 【工作职责】:负责金融应用类产品移动终端的版本测试,版本类型包括H5应用、ios/安卓上的A… https://m.zhaopin.com//jobs/52755368000141636501/ 测试工程师(自选股) 周末双休;五险一金;免费班车;员工旅游 11000.0
4520 京市朝阳区朝外北街蓝筹名座D座2单元501 北京奋青榜科技有限公司 岗位职责:1 维护所有数据库稳定运行,关注数据库集群整体运行情况,持续发现和解决潜在的问题;… https://m.zhaopin.com//jobs/334310587250246/ DBA 五险一金;年底双薪;绩效奖金;加班补助;带薪年假;弹性工作;员工旅游;节日福利 14000.0
4521 北京市朝阳区朝外大街20号联合大厦506 博易智讯(北京)信息技术有限公司 岗位职责:1、负责数据资源中心建设(大数据及分析)类项目的咨询和涉及工作,完成具体指定的数据… https://m.zhaopin.com//jobs/14231517100025758215/ BI资深售前/资深数据咨询顾问 五险一金;绩效奖金;定期体检;员工旅游;节日福利;不加班;带薪年假 17500.0
4522 北京市海淀区北四环西路9号银谷大厦1504 北京永鼎致远网络科技有限公司 岗位职责:1、基于海量数据,挖掘数据规律并建立分析模型;2、对海量数据进行提炼、分析、归纳用… https://m.zhaopin.com//jobs/38037292500028068015/ 数据挖掘工程师 五险一金;年底双薪;绩效奖金;交通补助;餐补;通讯补贴;补充医疗保险 17500.0
4523 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1 在业务场景下验证产品的功能与性能;2 进行大数据产品的安装部署与测试实施,进行… https://m.zhaopin.com//jobs/326767032250168/ 大数据工程师 五险一金;带薪年假;节日福利;员工旅游;定期体检;补充医疗保险 15000.0
4524 北京市西城区电研大厦 北京善友正信科技有限公司 工作职责:1、负责数据仓库ETL流程的优化及解决ETL相关技术问题;2、负责大数据分析系统和… https://m.zhaopin.com//jobs/229707532250069/ ETL数据工程师 五险一金;节日福利;带薪年假 10000.0
4525 北京市丰台区国投财富广场 北京虹信万达科技有限公司 岗位职责:1. 研发自动化运维平台,提高运维、开发协作效率,规范操作流程;2. 研发基础服务… https://m.zhaopin.com//jobs/341610437250040/ 自动化运维开发工程师 五险一金;绩效奖金;节日福利 15000.0
4526 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责:1、hadoop,storm,hive,kafka,flume,hbase,ran… https://m.zhaopin.com//jobs/326767032250109/ 运维工程师 五险一金;带薪年假;节日福利;定期体检;员工旅游;补充医疗保险 11500.0
4527 北京市朝阳区安立路60号润枫商务B座24层 玩咖欢聚文化传媒(北京)有限公司 工作职责: 1、负责公司项目中产品的页面交互及功能实现; 2、负责前端新技术研究及公司前端框… https://m.zhaopin.com//jobs/203128481251262/ 前端技术经理 周末双休;五险一金;年底双薪;加班补助;餐补;带薪年假;弹性工作;员工旅游 30000.0
4528 北京市朝阳区建国路92号世茂大厦B座20层 北京极点触碰科技有限公司 岗位职责:1.参与产品评审,分析产品需求,根据项目需求和测试计划设计和编写测试用例;2.执行… https://m.zhaopin.com//jobs/cz525380730j000367… 测试工程师 五险一金;每年多次调薪;弹性工作;绩效奖金;带薪年假 11500.0
4529 北京市海淀区启明星辰大厦 北京望时高科科技有限公司 此职位为人力外包职位,不接受的请慎重投简历,谢谢!PS:此职位仅招收男性。岗位职责:1.负责… https://m.zhaopin.com//jobs/43216162800038403612/ linux系统工程师 8000.0
4530 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 任职要求:1)本科以上学历,有2年以上工作经验,至少1年大数据ETL开发经验、熟悉Hadoo… https://m.zhaopin.com//jobs/326767032250120/ 应用开发工程师 五险一金;带薪年假;节日福利;定期体检;补充医疗保险;员工旅游 11500.0
4531 北京市东城区白桥大街15号嘉禾国信大厦9层 北京东方金信科技有限公司 岗位职责1. 从事金融、政府行业大数据项目有关数据ETL处理的设计、实现和优化,涵盖数据采集… https://m.zhaopin.com//jobs/326767032250161/ ETL工程师(项目) 五险一金;弹性工作;定期体检;节日福利;补充医疗保险;带薪年假 11500.0
4532 北京市海淀区西三旗建材城中路12号院26栋 北京荣联科创科技有限公司 岗位职责:1、根据具体项目要求,承担开发任务,按计划完成任务目标;2、根据用户需求按时完成开… https://m.zhaopin.com//jobs/48747592300027909814/ 研发工程师 绩效奖金;全勤奖;交通补助;餐补;定期体检;员工旅游;节日福利;带薪年假 5000.0
4533 北京市海淀区上地十街辉煌国际大厦 北京近颐科技有限公司 岗位职责:1负责服务集群的设计与搭建配置;2.负责Linux平台系统的安全管理;3.负责服务… https://m.zhaopin.com//jobs/292524636250052/ linux系统工程师 五险一金;交通补助;餐补;通讯补贴 8000.0
4534 北京市海淀区中关村软件园11号楼 北京精一强远科技有限公司 公司介绍:北京精一强远科技有限公司,致力于高端IT专业产品的专业设计、专业制造业务。公司拥有… https://m.zhaopin.com//jobs/287608631250052/ 软件开发工程师 五险一金;年底双薪;绩效奖金;包吃;通讯补贴;带薪年假;补充医疗保险;定期体检 12500.0
4535 北京市朝阳区双桥Dream2049园区世联文创一层107(东侧) 北京华沁智联科技有限公司 岗位职责1、 负责项目/产品的测试工作,参与产品需求分析,负责测试计划制定,并能预先评估项目… https://m.zhaopin.com//jobs/331013133250043/ 开发测试工程师(白盒) 创业公司;五险一金;绩效奖金;股票期权;餐补;带薪年假;弹性工作;节日福利 20000.0
4536 广顺北大街5号院内融创动力科技文化创意产业园B230 北京书生云科技有限公司 https://m.zhaopin.com//jobs/45496253700037561514/ 实施工程师 创业公司;周末双休;五险一金;带薪年假;弹性工作;通讯补贴 11500.0
4537 北京市东城区朝内大街298号 北京国研数通软件技术有限公司 岗位职责:1、负责大数据平台的开发和维护,负责大数据平台持续集成相关工具平台的架构设计与产品… https://m.zhaopin.com//jobs/120900932250257/ 大数据JAVA开发工程师 12500.0
4538 北京市东城区灯市口大街33号国中商业大厦423室 北京树优信息技术有限公司 工作职责: 1 负责或参与流体分析技术服务项目2 负责或参与流体优化技术服务项目3 负… https://m.zhaopin.com//jobs/226257529250059/ 流体力学仿真优化工程师 五险一金;绩效奖金;加班补助;交通补助;房补;带薪年假;员工旅游;节日福利 7000.0
4539 朝阳区来广营叶青大厦北园308 北京行易道科技有限公司 岗位职责:1、进行高可靠高安全嵌入式软件测试,包含代码测试、功能测试、性能测试、安全性测试等… https://m.zhaopin.com//jobs/22757003700087605207/ 嵌入式软件测试工程师 14薪;健身俱乐部;周末双休;五险一金;餐补;带薪年假;弹性工作;补充医疗保险 10500.0
4540 东城区王府井东街8号 澳门中心B1层funwork 睿医(北京)数据技术有限公司 职位描述:1.根据项目需求,独立完成各类型的临床数据的统计分析工作2.参与产品统计模块的功能… https://m.zhaopin.com//jobs/cz752253770j000214… 医学统计经理 五险一金;股票期权 22500.0

4541 rows × 7 columns

# 公司名带有奇怪的“  /   公司名清理一下
df['company'] = df['company'].apply(lambda x : x.split("/")[0].strip('"'))

这里是数据处理的进阶部分,暂时做个标记:

```python
# 导入两份数据:导一份公司地址出来,获取方位坐标,一份公司名称出来获取公司相关信息

#df.loc[:,["address","company"]].drop_duplicates().to_csv("address.csv",encoding="utf-8")

#df["company"].drop_duplicates().to_csv("company.csv",encoding="utf-8")
2019-03-05 09:30:47 u010070526 阅读数 2319

前景提要:在线的实时合成TTS技术,巴拉巴拉... 此处省略3千字
市场的TTS平台:讯飞科技百度智能语音开放平台阿里云腾讯云思必驰捷通华声(灵云

TTS的合成简单来说就三大步:
1️⃣创建应用
2️⃣发起请求
3️⃣解析音频数据,合成音频文件

咱们废话不说一个一个来:
一、讯飞,音频届的老大哥
支持多种语言开发,选择适合自己的,我这里选的是WebAPI:

01、创建应用

说明:
  1和3: 是在代码中具体使用到的 鉴权码
  2:表示试用期间的每天使用次数
 4:请求IP要添加白名单,不添加白名单会请求失败
 5:可以选择不同的发音人:(分初级和高级,高级的另收费)

code:

def tts_xunfei(text):
  # API请求地址、API KEY、APP ID等参数,提前填好备用
  api_url = "http://api.xfyun.cn/v1/service/v1/tts"
  API_KEY = "API_KEY"
  APP_ID = "APP_ID"
  OUTPUT_FILE = "讯飞.wav"  # 输出音频的保存路径,请根据自己的情况替换
  TEXT = text

# 构造输出音频配置参数custom_skill.py3
  Param = {"auf": "audio/L16;rate=16000",  # 音频采样率
      "aue": "raw",  # 音频编码,raw(生成wav)或lame(生成mp3)
      "voice_name": "x_xiaoyuan", "speed": "50",  # 语速[0,100]
      "volume": "77",  # 音量[0,100]
      "pitch": "50",  # 音高[0,100]
      "engine_type": "aisound"  # 引擎类型。aisound(普通效果),intp65(中文),intp65_en(英文)
    }
  # 配置参数编码为base64字符串,过程:字典→明文字符串→utf8编码→base64(bytes)→base64字符串
  Param_str = json.dumps(Param)  # 得到明文字符串
  Param_utf8 = Param_str.encode('utf8')  # 得到utf8编码(bytes类型)
  Param_b64 = base64.b64encode(Param_utf8)  # 得到base64编码(bytes类型)
  Param_b64str = Param_b64.decode('utf8')  # 得到base64字符串

  # 构造HTTP请求的头部
  time_now = str(int(time.time()))
  checksum = (API_KEY + time_now + Param_b64str).encode('utf8')
  checksum_md5 = hashlib.md5(checksum).hexdigest()
  header = {"X-Appid": APP_ID, "X-CurTime": time_now, "X-Param": Param_b64str, "X-CheckSum": checksum_md5}

  # 构造HTTP请求Body
  body = {"text": TEXT}
  body_urlencode = urllib.parse.urlencode(body)
  body_utf8 = body_urlencode.encode('utf8')

  # 发送HTTP POST请求
  req = urllib.request.Request(api_url, data=body_utf8, headers=header)
  response = urllib.request.urlopen(req)

  # 读取结果
  response_head = response.headers['Content-Type']
  if (response_head == "audio/mpeg"):
      data = response.read()  # a 'bytes' object
      save_wav(data, OUTPUT_FILE)
  else:
      print(response.read().decode('utf8'))

注意:将上面的APP_ID和API_KEY更换为自己的即可,另外记得添加IP白名单

二、阿里平台
用户鉴权有有效期,到期了要重新获取token

def tts_ali(text):

    # 获取存储的access_token, token_expireTime  两个同时更新
    token_expireTime = 1551513046
    access_token = "9fcdcd2a190f49cb926dc5c2e24043c8"

    # 当前的时间戳 和 token有效期对比,如果过期则重新生成
    local_time = int(time.time())
    if local_time >= token_expireTime:
        # 重新生成并存储
        access_token, token_expireTime = get_token()

    headers = {
        "Content-Type": "application/json;charset=UTF-8",
        "X-NLS-Token":access_token,
        }

    data_info = {
        "appkey":"5dz4RRvAJufMAB6g",
        "text":text,
        "token":access_token,
        "format":"wav",
        "voice":"yina",
        "sample_rate":"16000",  # 音频采样率,默认是16000
        "volume":"50", # 音量,范围是0~100,默认50
        "speech_rate":"45", # 语速,范围是-500~500,默认是0
        "pitch_rate":"0", # 语调,范围是-500~500,默认是0

        # 试听发音人:https://ai.aliyun.com/nls/tts?spm=5176.8142029.388261.47.f8ed6d3e0NhBch
        # 发音人参数:https://help.aliyun.com/document_detail/84435.html?spm=a2c4g.11186623.6.581.69a853d5E4c3vM
        # 推荐:小梦 思悦 小美 伊娜
        }

    data = json.dumps(data_info)

    ret = requests.post(ALI_URL, headers=headers, data=data, timeout=5)
    save_wav(ret.content, "ali2.wav")

提醒:
token的获取我代码里有完整的
另外开发测试期间,开发文档会提供简易的不过期token,方便测试

三、百度
调用方式简单,开发文档里有说明

# 百度
def tts_baidu(text):
    baidu_url = "http://tsn.baidu.com/text2audio?lan=zh&ctp=1&cuid=abcdxxx&tok=24.ed4dfdxxxxxff0af259fc.2592000.1553756573.282335-15631432&tex={}&vol=9&per=0&spd=5&pit=5&aue=6".format(text)

    ret = requests.get(baidu_url, timeout=5)
    save_wav(ret.content, "siyue.wav")

四、腾讯 
正在开发测试阶段,直接舍弃了

五、标贝

# 标贝
def tts_biaobei(text):
    """获取tts语音"""
    tts_url = "http://1.203.80.138:8001/tts?user_id=xxx&domain=1&volume=0&language=zh&speed=5&audiotype=5&text=" + text
    f = requests.get(tts_url)
    voice = f.content
    return voice


六、思必驰

# 思必驰
def tts_dui(text):
    data_dict = {
        "context": {"productId": "productId"},
        "request": {"requestId": "tryRequestId",
        "audio": {"audioType": "WAV", "sampleRate": 16000, "channel": 1, "sampleBytes": 2},
            "tts": {
            "text": text,
            "textType": "text",
            "voiceId": "lili1f_shangwu"}}}
    data = json.dumps(data_dict)

    headers = {
        'content-type': 'application/json',
        'User-Agent': 'Mozilla/5.0 '}

    r = requests.post(DUI_URL, data=data, headers=headers, timeout=5)
    print(r)

    # 写入文件生成音频
    save_wav(r.content, "DUI.wav")

  七、捷通华声(灵云)
   

 # 灵云
def tts_lingyun(text):

    linghyun_URL = "http://api.hcicloud.com:8880/tts/synthtext"
    request_data = "2014-6-18 10:10:11"

    data = request_data + "应用参数"
    md5 = hashlib.md5()
    md5.update(data.encode('utf-8'))  # 注意转码
    res = md5.hexdigest()

    headers = {"x-app-key": "c95d54cf", "x-sdk-version": "3.9", "x-request-date": request_data,
        "x-task-config": "capkey=tts.cloud.xiaokun,audioformat=mp3,speed=2,volume=9.99", "x-session-key": res,
        "x-udid": "101:1234567890"}

    r = requests.post(linghyun_URL, headers=headers,
                  data=text.encode('utf-8'),
                  timeout=5)

    # 获取音频数据
    ret = r.content
    ret = ret[ret.find(b'</ResponseInfo>') + 15:]

    # 写入文件生成音频
    save_wav(bytes(ret), "aasdasd.mp3")

没有python示例代码,返回参数比较变态,解析出音频耗了我大量时间(因为我技术不佳)

使用过程中:百度无人回复,没给报价,思必驰没找到任何公司人员
各平台均有使用,每天限次数,可以开发试听一下,
效果比较个人感觉:
标贝 > 讯飞 > 阿里 > 百度 > 思必驰 > 灵云

音频效果,见公众号文章:回复 TTS 即可

价格比较:
讯飞:

百度:暂时免费  超高量并发另行收费

标贝:16万/年
灵云:2万次/100

Git代码: 公众号后台回复 python_tts 或 tts

点云标注工具

阅读数 3710

Vad for Detection

阅读数 463