热门好课推荐
猜你喜欢
相关培训 相关博客
  • Python怎么读?如今,Python越来越火,屡次超越Java、C++成为编程语言排行榜第一的语言。可语言学了这么久,这个单词到底怎么读?现在让我们来深入研究一下。我们身边大多数人都叫它“派森”,包括很多IT行业工作者都这么叫。但是如果你关注过国外的Python讲座或会议,会发现其实很多美国人习惯把它叫做“派桑”。那么问题来了,哪种才是正确的读法?下图是词典的解释,原来英音的读法更接近于汉...
    2019-08-19 16:46:42
    阅读量:9758
    评论:11
  • 写这个爬虫的缘由以前用java写过一个爬取学校的教务系统的爬虫https://blog.csdn.net/ygdxt/article/details/81158321,最近痴迷Python爬虫,了解到许多强大的库,想再一次用学校的教务系统做下测试。这一次我首先想到的是新的教务系统,这个难度更大,因为有了验证码识别反爬,由于我是用的tessocr库识别验证码,(具体配置过程可以参考我之前的博客...
    2018-11-28 20:19:15
    阅读量:956
    评论:2
  • 最近在自学Python网络爬虫,想实际练练手,于是选择了学校的教务管理系统,获取课表、成绩、排名和绩点。我用的Python版本是3.6,全部使用标准库,用到的库如下:urllib.requesturllib.parsehttp.cookiejartimere
    2017-08-12 21:43:24
    阅读量:5976
    评论:1
  • 很久木有来写博文啦,发现学校的教务系统很多童鞋都木有修改初始密码,于是博主就想写试用python写一个爬虫小脚本,将木有修改初始密码的童鞋资料扒下来,然后嘿嘿嘿~~~通知他们修改!鉴于写博文时未通知这些受害童鞋们,因此隐去关键信息。首先为初始化方法__init__(self)importurllibimporturllib2importcookielib
    2017-02-24 19:59:30
    阅读量:8208
    评论:0
  • 我们学校的信息门户是必需要登录才能去看的。而且网页模块的排版比较不友好,很多重要信息例如讲座的通知,后勤的断水断电的通知没有办法很方便的及时获知。受到我舍友(手动@杨大潍)的启发,我就开始在期末花了一点时间做了这么一个脚本。
    2016-07-09 16:36:24
    阅读量:2292
    评论:2
  • 情境用Python爬虫爬取学校教务网站上的个人课表,并解析出课表内容进行初步显示思路爬取登录教务网站进入课表页获得改页源码解析需要用到的库有:requests:处理网络请求,下载,获得源码等BeautifulSoup网页解析Image:打开显示验证码(处理验证码的方法很多,我这里用的是人工识别,手工输入)re正则匹配实现...
    2018-09-08 00:31:31
    阅读量:3923
    评论:13
  • 最近对python爬虫比较感兴趣,就开始学习爬虫。今天来记录下阶段性成果。本文对西安邮电大学官网进行爬取,爬取网站上所有新闻内容(自2010年以来,共2461篇新闻稿),并进行简单分析。提醒:阅读本文需要requests库、beautifulsoup库、re库、jieba库、html等必要基础知识。获得官网url:首先我们获得了学校官网url:http://www.xiyou.edu.cn/之后的...
    2018-06-07 11:02:57
    阅读量:1981
    评论:2
  • 1.目标:爬取北京所有的小学名单链接:http://beijing.xuexiaodaquan.com/xiaoxue/pn30.html分析:代码:fromurllib.requestimporturlopenfrombs4importBeautifulSoupforiinrange(30):html=urlopen('http://beijing....
    2019-05-11 15:30:33
    阅读量:64
    评论:0
  • 其实是半年前做的一段小代码,爬取自己的学校教务处网站大概是每个学习爬虫的同学的入门必备吧(心疼一秒教务处)。其实想起来本科的时候有大神做了南理工GPA的网页,其实也就是个爬虫然后做了数据处理(只是我的猜测啦,不是请不要拍我。。),当时的教务处系统还比较简单,也没有验证码的问题,post一个表单就可以模拟登陆。但是!南理工教务处他改版了,还做的很不错(大概招了个不错的前端),加了验证码大概是这次爬虫
    2016-05-15 11:22:29
    阅读量:11471
    评论:3