精华内容
下载资源
问答
  • 前段时间快要毕业,而我又不想找自己的老本行Java开发了,所以面了很多Python爬虫岗位。因为我在南京上学,所以我一开始只是在南京投了...第一点:Python因为面试的是Python爬虫岗位,面试官大多数会考察面试者的基...

    前段时间快要毕业,而我又不想找自己的老本行Java开发了,所以面了很多Python爬虫岗位。因为我在南京上学,所以我一开始只是在南京投了简历,我一共面试了十几家企业,其中只有一家没有给我发offer,其他企业都愿意给到10K的薪资,不要拿南京的薪资水平和北上深的薪资水平比较,结合面试常问的问题类型说一说我的心得体会。

    第一点:Python

    因为面试的是Python爬虫岗位,面试官大多数会考察面试者的基础的Python知识,包括但不限于:Python2.x与Python3.x的区别

    Python的装饰器

    Python的异步

    Python的一些常用内置库,比如多线程之类的

    第二点:数据结构与算法

    数据结构与算法是对面试者尤其是校招生面试的一个很重要的点,当然小公司不会太在意这些,从目前的招聘情况来看对面试者的数据结构与算法的重视程度与企业的好坏成正比,那些从不问你数据结构的你就要当心他们是否把你当码农用的,当然以上情况不绝对,最终解释权归面试官所有。

    第三点:Python爬虫

    最重要也是最关键的一点当然是你的Python爬虫相关的知识与经验储备,这通常也是面试官考察的重点,包括但不限于:你遇到过的反爬虫的策略有哪些?

    你常用的反反爬虫的方案有哪些?

    你用过多线程和异步吗?除此之外你还用过什么方法来提高爬虫效率?

    有没有做过增量式抓取?

    对Python爬虫框架是否有了解?

    第四点:爬虫相关的项目经验

    爬虫重在实践,除了理论知识之外,面试官也会十分注重爬虫相关的项目:你做过哪些爬虫项目?如果有Github最好

    你认为你做的最好的爬虫项目是哪个?其中解决了什么难题?有什么特别之处?

    以上是我在面试过程中,会碰到的一些技术相关的问题的总结,当然面试中不光是技术这一点,但是对于做技术的,过了技术面基本上就是薪资问题了。

    也许有人问我现在在哪家公司做爬虫开发?很抱歉,最终我放弃了南京的所有机会到了上海做我更喜欢的岗位:数据工程师。

    展开全文
  • Python3 + wxpython写的一个翻译工具 学习日语一直有一个问题,有些时候我们看到一句话,可能大致上能猜出来是什么意思,但是日语汉字却不知道怎么去读。我就有这样的烦恼,极大的降低了我对日语学习的热情。 于是...

    Python3 + wxpython写的一个翻译工具


    学习日语一直有一个问题,有些时候我们看到一句话,可能大致上能猜出来是什么意思,但是日语汉字却不知道怎么去读。我就有这样的烦恼,极大的降低了我对日语学习的热情。
    于是这两天在公司闲暇之余,就想利用网上的api做一个日语汉字翻译假名的一个小工具。

    一开始我想用百度翻译的api,因为百度翻译有一个显示日语假名的按钮可以查看。但是看起来很简单的api,却不知道为什么硬是拿不到翻译结果。回去用百度翻译默认的参数成功了,但是换了个关键字又无法获取。

    其实就算成功了,也不太符合我的要求。因为百度翻译要能显示假名,必须得由某种语言翻译成日语,又不能同时选中日语,从心底里来说,我已经不愿意再多花时间去研究了。

    于是我开始想着用python爬虫去实现,有道翻译,谷歌翻译,都没有显示假名的功能。天无绝人之路,我看到了江沪小D的单词翻译,下边正好显示了假名。
    在这里插入图片描述
    打开文本翻译,虽然没有显示假名的功能,但是后台有我想要的数据,还能选择日语到日语,这真的是让我喜出望外。不说了,开工!
    在这里插入图片描述

    一、分析请求

    python爬虫最重要的是对请求的分析与构造,而刚好沪江小D在这一块却没那么麻烦。只需要写带上一个content参数,外加请求头的cookie就能拿到数据。翻译方向是拼接在访问路径里面的。

    例如:https://dict.hjenglish.com/v10/dict/translation/jp/jp 表示从日语翻译到日语。
    在这里插入图片描述
    注意:cookie一定要有,不然会得到一个非正常访问的信息。
    这里贴出获取响应结果的代码:

    import requests
    base_url = "https://dict.hjenglish.com/v10/dict/translation"
    # 如果在公司需要设置代理,个人使用时不用proxies参数
    proxies = {
         'http': SETTINGS['http_proxy'],
         'https': SETTINGS['https_proxy']
     }
    headers = {
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3756.400 QQBrowser/10.5.4043.400',
            'referer': 'https://dict.hjenglish.com/app/trans',
            'cookie': 'HJ_UID=62ecdcb4-18dd-b89a-39b8-d3ae29f7a945; TRACKSITEMAP=3%2C20%2C23; _SREG_20=www.baidu.com%7C%7Csearch%7Cdomain; _SREF_20=https%3A%2F%2Fwww.baidu.com%2Flink%3Furl%3DhyKgBOkGFQR01SSRmo7VknK4QwVQIldqklx5Rp8DnEZEuuKZKZLW6HA_szdxSEOUebC5lDawvY00P_wQbBhKcMfyRi1L_8i4NtSXXbpSHCkFAVUmErnF8jeIacjvCaWTF9a0YnL9vR3XJSErsWNjIa%26wd%3D%26eqid%3Dd56c85360010ae6b00000003603f21b6; _SREF_3=; _REF=; acw_tc=707c9fc316147644229968942e605090718ce7e184164b887c24be999348a4; HJ_CST=0; HJ_CSST_3=0; HJ_SID=4pdfs7-0aa1-46a9-a81d-52e432e2efd8; HJ_SSID_3=4pdfs7-51bb-42aa-824c-ffa74e82386d; _SREG_3=direct%7C%7Cdirect%7Cdirect; _REG=direct%7C%7Cdirect%7Cdirect'
        }
    session = requests.Session()
    url = f"{base_url}/cn/jp"
    response = ""
    try:
        response = session.post(url, data={
            "content": keyword
        }, proxies=proxies, headers=headers)
    except:
        print('网络连接错误!')
        return None
    if response.status_code != 200:
        trans_result['trans_text'] = 'error!'
        return None
    res_dict = response.json()['data']
    print(res_dict)
    

    在这里插入图片描述
    拿到了数据,大家就可以自由发挥了。我这边展示一下我的成果。

    界面很简单,实现了各国语言之间的翻译,日语的情况下会将带假名和不带假名的结果显示在右边。下面是一个历史翻译记录,会保存在本地,每次打开应用程序自动加载。能获取到语音朗读的情况下,会自动朗读翻译结果。
    在这里插入图片描述
    以上就是本次学习的一个记录,欢迎大家留言探讨。程序已打包,请自行下载:https://download.csdn.net/download/qq_36991535/15561961,需要源码的朋友请私信我。

    本次小工具的开发,只做学习使用。如有侵权,请联系QQ:1593324992,我将及时进行删除。

    展开全文
  • 它经常以类似这样的方式出现在我们的程序里:if __name__ == '__main__':main()今天,我就带大家详细扒一扒这个内置变量的用法,示范一下在你写的 Python 模组里要怎么用到它。这个 __name__ 来做什么的?作为 ...

    原标题:Python 的 __name__ 变量,到底是个什么东西?

    很多Python脚本里见到过__name__变量了吧?它经常是以类似这样的方式出现在我们的程序里:

    if __name__ == '__main__':

    main()

    今天,我就带大家详细扒一扒这个内置变量的用法,示范一下在你写的 Python 模组里要怎么用到它。

    这个 __name__ 拿来做什么的?

    作为 Python 的内置变量,__name__变量(前后各有两个下划线)还是挺特殊的。它是每个 Python 模块必备的属性,但它的值取决于你是如何执行这段代码的。

    在许多情况下,你的代码不可能全部都放在同一个文件里,或者你在这个文件里写的函数,在其他地方也可以用到。为了更高效地重用这些代码,你需要在 Python 程序中导入来自其他文件的代码。

    所以,在__name__ 变量的帮助下,你可以判断出这时代码是被直接运行,还是被导入到其他程序中去了。

    这个 __name__ 变量可能取什么值?

    当你直接执行一段脚本的时候,这段脚本的 __name__变量等于 '__main__',当这段脚本被导入其他程序的时候,__name__ 变量等于脚本本身的名字。

    下面,让我举两个栗子来说明一下:

    f19f441a7fb044688104774763829978.jpeg

    情况 1 - 直接运行脚本

    假设我们有一个name.py,代码如下:

    def myFunction():

    print('变量 __name__ 的值是 ' + __name__)

    def main():

    myFunction()

    if __name__ == '__main__':

    main()

    当你直接执行 name.py 时,流程是这样处理的:

    cc8419d3a4fd4c2591cdc38e103b5e10.png

    在所有其他代码执行之前,__name__变量就被设置为 '__main__' 了。在此之后,通过执行 def 语句,函数 main() 和 myFunction() 的本体被载入。

    接着,因为这个 if 语句后面的表达式为真 true,函数 main() 就被调用了。而 main() 函数又调用了myFunction(),打印出变量的值'__main__'。

    情况 2 - 从其他脚本里导入

    如果你需要在其他脚本里重用这个 myFunction() 函数,比如在 importing.py 里,我们可以将 name.py 作为一个模组导入。

    假设 importing.py 的内容如下:

    import name as ns

    ns.myFunction()

    这时,我们就有了两个不同的作用域:一个是 importing 的,一个是 name 的。让我画个示意图,你就能看出这和之前的区别了:

    d7471a5d12784320b941c189bc4442fd.png

    在 importing.py 里,__name__ 变量就被设置为 '__main__'。当导入 name 的时候,Python 就在本地和环境变量 PATH 指向的路径中寻找对应名称的 .py 文件,找到之后,将会运行导入的文件中的代码。

    但这一次,在导入的时候,它自身的 __name__ 变量就被设置为了 'name',接下来还是一样,函数 main() 和 myFunction() 的本体被载入。然而,这一次 if 语句后面的表达式结果为假 false,所以 main() 函数没有被调用。

    导入完毕之后,回到 importing.py 中。现在 name 模块中的函数定义已经被导入到当前的作用域中,于是我们通过 ns.myFunction() 的方式调用模块中的函数,这个函数返回的是模块内的变量的值 'name'。

    如果你试着在 importing 中打印 __name__ 变量的值,那当你直接执行 importing 的时候,它也会输出 '__main__'。原因在于,这个变量是在 importing 的作用域中的。

    总结

    今天和大家一起讨论了 __name__ 变量在模组中的特性,分析了不同的调用方式对它的值有什么影响。利用这个特性,你既可以在程序中导入模组来使用,也可以直接把模组本身作为程序来运行。返回搜狐,查看更多

    责任编辑:

    展开全文
  • 终归学了点,总要做点什么 先给自己定个小目标: 用Python写一首污污的小情诗 去给你们的女票票表个白吧 不对,程序员怎么会有朋友 当当当,小情诗好了 内联代码片 // A code block var foo = 'bar'; //...

    这是一篇不正经的博文

    疫情在家无事做,网课上了一个月的python,
    就学会了点控制循环语句,这都大二了,未来不可期

    终归是学了点,总要做点什么
    先给自己定个小目标:比方说挣它一个亿

    • 用Python写一首污污的小情诗

    发挥一点小学英语水平

    man is 'boyfriend'      #男生名字
    girl is 'girlfriend'    #女生名字
    
    man and girl
    love()
    
    for kedou in man:
        
        kedou
        swim()
        
    for qiuqiu in girl:
            
        kedou
        find(qiuqiu)
        
    baby = kedou+qiuqiu
    born(baby)
    

    当当当,小情诗写好了 ,这种程度不会被和谐吧

    当然这样是无法运行的,我们得在前面加点东西

    man = 'c'
    girl = 'p'
    kedou =''
    qiuqiu= ''
    
    def born(a):
        print('他们生了一个宝宝:',a)
        return
        
    def love():
        print('男人和女孩相爱')
        return True
        
    def swim():
        print('小蝌蚪游啊游')
        return
        
    def find(a):
        print('小蝌蚪找到了了小球球')
        return
    

    来运行一下

    Python 3.7.7 (tags/v3.7.7:d7c567b08f, Mar 10 2020, 10:41:24) [MSC v.1900 64 bit (AMD64)] on win32
    Type "help", "copyright", "credits" or "license()" for more information.
    >>> 
    ====================== RESTART: D:\dcf\PythonTest\love.py ======================
    男人和女孩相爱
    小蝌蚪游啊游
    小蝌蚪找到了了小球球
    他们生了一个宝宝: cp
    >>> 
    

    运行成功!
    虽然没啥技术水平,但是撩妹还是可以的吧

    拿去给你们的女票票表个白吧
    不对,程序员怎么会有女朋友

    展开全文
  • 虽然每次我都会很认真的解答,但没有系统的举例,实在很难把python的便利性表达出来,所以,今天我就python的用处,系统的一篇文章,等以后有新学员问我,我就可以把这篇文章给他看啦~...
  • PyGame一个Python的库,能够让你更容易的出一个游戏。它提供的功能包括图片处理和声音重放的功能,并且它们能很容易的整合进你的游戏里。去官网点击这里下载适合你的PyGame安装包。我们就打飞机来做个例子1 ....
  • 着地图学Python(00)——学习一门新的编程语言需要重点掌握什么? 作为一名合格的程序员只掌握一门编程语言远远不够的。一门编程语言背后承载的它的设计哲学和它背后的程序设计思想,多学习一门编程语言就多...
  • 今天,我就带大家详细扒一扒这个内置变量的用法,示范一下在你写的 Python 模组里要怎么用到它。 这个 name 来做什么的? 作为 Python 的内置变量,__name__变量(前后各有两个下划线)还是挺特殊的。它每个 Py....
  • 什么python的多线程不能利用多核CPU,但是咱们在代码的时候,多线程的确在并发,而且还比单线程快。 一、python的多线程不能利用多核CPU? 原因: 因为GIL,python只有一个GIL,运行python时,就要到这个锁...
  • python小白必看,函数是什么?函数是什么? 函数是什么? 相当于把一些需要重复使用的程序 语句封装到一个盒子里面。 想用的时候不用重新敲函数里的语句,直接把盒子里的好的代码出来用就可以了,这个过程叫...
  • 什么同样实习生 boss们就是比较偏爱另一个? 因为人家会python! 作为可以秒杀掉excel的必备工具 python赢在哪儿? 01、python,已经取代了excel 在大家的印象里,想进入金融行业或者数据岗位,首先需要精通...
  • python-装饰器是什么

    2020-05-08 15:37:45
    函数对象有个name属性,可以到函数的名字 # 一个给原函数添加日志的Decorator def log(func): def wrapper(*args, **kwds): # 定义执行装饰器的函数,*args, **kwds表示可以输入任意参数 print('即将执行函数...
  • 什么同样实习生boss们就是比较偏爱另一个? 因为人家会python! 作为可以秒杀掉excel的必备工具 python赢在哪儿? 01、excel已经被python取代了 在大家的印象里,想进入金融行业或者数据岗位,首先Excel必须...
  • 他在面试前期做了相当多的准备(机会永远留给有准备的人,这一点值得学习),了很多关于面试真题的相关内容.之前有许多读者会在微信上问我,「自学 Python 后端开发 到什么程度才可以出去找工作?」,由于我本人...
  • 首先要说明一点的python只是一个工具,不代表你学会了这个工具就能找到好工作,就现在比较火的python爬虫工程师来说吧,你精通了java一样可以做爬虫大神,拥有相关的开发经验才真正的加分项!回到问题,针对...
  • 我们看了这个问题还是挺心疼的,于是决定把一个看家的本事出来,让你不用一行代码,花上两天时间学会,只用一个浏览器,就能爬取95%的网站数据。先来说说用爬虫啥,能做什么事儿。爬虫英文名叫WebCrawler...
  • python的模块

    2019-12-08 10:34:52
    一个python使用者共同享有的仓库,这个仓库里放着能实现各种功能的模块,其他所有人如果也需要用到同样的功能,那么他就可以直接从仓库里出来这个模块,直接进行调用。是不是很方便? python中的模块一共分为三...
  • 含蓄表白器 (ps: 学习struct) just used to encode Chinese characters to Hexadecimal string then use XOR to encode again 仅仅支持中文 支持以下场景: ...你的暗恋对象:这是什么呀? 你:钥匙在这:\
  • 问题:为什么python的多线程不能利用多核CPU,但是咱们在代码的时候,多线程的确在并发,而且还比单线程快原因:因为GIL,python只有一个GIL,运行python时,就要到这个锁才能执行,在遇到I/O 操作时会释放这...
  • 他在面试前期做了相当多的准备(机会永远留给有准备的人,这一点值得学习),了很多关于面试真题的相关内容.之前有许多读者会在微信上问我,「自学 Python 后端开发 到什么程度才可以出去找工作?」,由于我本人...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 718
精华内容 287
关键字:

python是拿什么写的

python 订阅