精华内容
下载资源
问答
  • 知乎是个好地方。虽然近年来,为了吸引更多的用户,知乎的定位与早期略有点偏离。但从内容质量和专业性来说,知乎仍然是国内数一数二的知识型社区。不少同学都是通过知乎发现了我们编程教室,我自己也经常会通过知乎...

    知乎是个好地方。虽然近年来,为了吸引更多的用户,知乎的定位与早期略有点偏离。但从内容质量和专业性来说,知乎仍然是国内数一数二的知识型社区。不少同学都是通过知乎发现了我们编程教室,我自己也经常会通过知乎去寻求一些专业知识的解答和参考。

    之前,为了让大家能更好地挖掘知乎上有价值的信息,我们做了一个索引,把编程入门相关的一些问答和文章做了整理:

    文中曾立下FLAG说之后会整理爬虫、数据分析、机器学习等方面的索引,然而却一拖再拖。好在现在,有同学帮我们做了后续整理,今天就把“爬虫篇”分享给大家。

    注意:由于微信文中不能直接跳转外部链接,因此建议点击文末的“阅读原文”,收藏知乎原文。

    有很多人正在入门Python爬虫,学习Python爬虫。在这个过程中,会遇到很多难题,许多小伙伴都会去寻找答案,但是因为答案的纷繁复杂和种类多样,往往要花上好些时间。

    所以我通过整理知乎上关于Python爬虫的精彩回答文章和教程,制作一篇关于Python爬虫的索引,包括:

    入门指南-教程资源-框架工具-爬虫实例-专栏索引

    大家有什么好的建议和资源也可以留言提出。

    入门指南:

    1.如何入门Python爬虫?—谢科的回答

    https://www.zhihu.com/question/20899988/answer/24923424

    (简介:爬虫怎么工作以及怎么在python实现。)

    2.爬虫基本原理

    https://zhuanlan.zhihu.com/p/35324806

    (简介:给有一些有python基础,但是对爬虫一无所知的人)

    3.Python爬虫入门

    第一讲:Python爬虫|Python爬虫入门(一):基本

    https://zhuanlan.zhihu.com/p/21377121?refer=xmucpp

    第二讲:Python爬虫|Python爬虫入门(二):请求

    https://zhuanlan.zhihu.com/p/21394571

    第三讲:Python爬虫|Python爬虫入门(三):解析

    https://zhuanlan.zhihu.com/p/21442500

    第四讲:Python爬虫|Python爬虫入门(四):储存

    https://zhuanlan.zhihu.com/p/21452812

    (简介:本爬虫系列入门教程假设读者仅有一点点Python基础或者近乎为零的基础。如果是有Python基础的可以跳过一些对于Python基本知识的补充。)

    教程资源:

    书籍:

    1.一份Python爬虫电子书 (路人甲)

    https://zhuanlan.zhihu.com/p/28865834

    (简介:这本书主要内容是Python入门,以及Python爬虫入门和Python爬虫进阶)

    2.问题:求大神们推荐Python入门书籍

    https://www.zhihu.com/question/38801925/answer/184406876

    (简介:Python爬虫方面入门书籍推荐)

    教程:

    系列教程:

    1.Python爬虫学习系列教程

    https://zhuanlan.zhihu.com/p/25949099

    (简介:学习过程中我把一些学习的笔记总结下来,还记录了一些自己实际写的一些小爬虫)

    2.Python爬虫教程(一)使用request+Beautifi

    https://zhuanlan.zhihu.com/p/35493091

    Python爬虫教程(二)使用request+正则re批量下载好听轻音乐网歌曲https://zhuanlan.zhihu.com/p/35528714

    3.python爬虫初探(一):爬虫的基本结构

    https://zhuanlan.zhihu.com/p/32652572

    python爬虫初探(二):URL管理器和下载器

    https://zhuanlan.zhihu.com/p/32673371

    python爬虫初探(三):HTML解析器

    https://zhuanlan.zhihu.com/p/32675668

    python爬虫初探(四):数据存储器

    https://zhuanlan.zhihu.com/p/32697330

    拓展教程:

    1.爬虫万金油,一鹅在手,抓遍全球:goose 简介https://zhuanlan.zhihu.com/p/46595420

    2.这个男人让你的爬虫开发效率提升8倍

    https://zhuanlan.zhihu.com/p/38466193

    3.Python 抓取网页乱码原因分析

    https://zhuanlan.zhihu.com/p/21057822

    4.干了这碗“美丽汤”,网页解析倍儿爽

    https://zhuanlan.zhihu.com/p/58445021

    进阶拓展:

    进阶:

    1.Python爬虫进阶

    https://www.zhihu.com/question/35461941/answer/192693594

    https://www.zhihu.com/question/35461941/answer/72909421

    (简介:爬虫无非分为这几块:分析目标、下载页面、解析页面、存储内容)

    2.“百行代码”实现简单的Python分布式爬虫

    https://zhuanlan.zhihu.com/p/26045460

    (简介:进阶知识)

    拓展:

    1.利用爬虫技术能做到哪些很酷很有用的事情?

    https://www.zhihu.com/question/27621722

    2.Python爬虫学到什么样就可以找工作了https://www.zhihu.com/question/61103114/answer/183926752

    3.从python爬虫,到更爱这个世界

    https://zhuanlan.zhihu.com/p/32711505

    4.Python爬虫和情感分析简介

    https://zhuanlan.zhihu.com/p/20359324

    5.你是如何开始能写Python爬虫?

    https://www.zhihu.com/question/21358581/answer/274132025

    爬虫资源:

    1.一个很“水”的Python爬虫入门代码文件

    https://zhuanlan.zhihu.com/p/22982208

    2.156个Python网络爬虫资源!

    https://zhuanlan.zhihu.com/p/28407245

    3.可能是最全面的75个Python爬虫资源

    https://zhuanlan.zhihu.com/p/27985429

    学习经验:

    1.用Python写爬虫时应该注意的坑?

    https://www.zhihu.com/question/49296232/answer/368313956

    2.Python3网络爬虫学习建议?

    https://www.zhihu.com/question/41277528/answer/95885043

    3.Python爬虫知识点梳理

    https://zhuanlan.zhihu.com/p/29523349

    4.常用的 Python 爬虫技巧

    https://zhuanlan.zhihu.com/p/23088379

    5.如何优化Python爬虫的速度?

    https://www.zhihu.com/question/20145091/answer/618321662

    6.Python爬虫—破解JS加密的Cookie

    https://zhuanlan.zhihu.com/p/25957793

    7.主流网站 Python 爬虫模拟登陆方法汇总

    https://zhuanlan.zhihu.com/p/59733826

    8.三步走,教你定制自己的个性Python爬虫

    https://zhuanlan.zhihu.com/p/23178014

    9.Python爬虫传送post请求要携带哪些参数?https://www.zhihu.com/question/60256922/answer/174211193

    框架工具:

    框架:

    1.Python有哪些常见的、好用的爬虫框架?

    https://www.zhihu.com/question/60280580/answer/617068010

    2.一个极为简洁的Python爬虫框架

    https://zhuanlan.zhihu.com/p/23017812

    3.拥有属于自己的Python爬虫框架--练习编写多线程、协程爬虫框架https://zhuanlan.zhihu.com/p/24469566

    工具:

    1.10个爬虫工程师必备的工具了解一哈

    https://zhuanlan.zhihu.com/p/54855072

    (简介:工欲善其事必先利其器的道理相信大家都懂。)

    2.推荐4个爬虫抓包神器

    https://zhuanlan.zhihu.com/p/61980749

    (简介:今天推荐4个HTTP代理工具通过抓包分析,帮助你还原APP背后的每个请求。)

    3.爬虫必备工具,掌握它就解决了一半的问题

    https://zhuanlan.zhihu.com/p/39340856

    (简介:今天这篇文章不谈任何具体网站的抓取,只来说一个共性的东西:如何通过 Chrome 开发者工具寻找一个网站上特定数据的抓取方式。)

    4.听说你好不容易写了个爬虫,结果没抓几个就被封了?

    https://zhuanlan.zhihu.com/p/28726244

    (简介:实现一个自动获取可用代理 IP 的接口。)

    爬虫实例:

    1.利用python爬取网易云音乐,并把数据存入mysqlhttps://zhuanlan.zhihu.com/p/34354440

    2.python爬取20w表情包之后,从此你就成为了微信斗图届的高手https://zhuanlan.zhihu.com/p/66243518

    3.如何让Python爬虫一天抓取100万张网页

    https://zhuanlan.zhihu.com/p/65508954

    4.Python爬虫告诉你上海房价有多高

    https://zhuanlan.zhihu.com/p/40293278

    5.Python爬虫入门 | 2 爬取豆瓣电影信息

    https://zhuanlan.zhihu.com/p/32037625

    6.Python爬虫一步步抓取房产信息

    https://zhuanlan.zhihu.com/p/25713752

    7.我用Python又爬虫了拉钩招聘,给你们看看2019市场行情https://zhuanlan.zhihu.com/p/65081383

    8.爬虫爬了下知乎上的神回复,已笑趴~

    https://zhuanlan.zhihu.com/p/46132179

    9.一键下载:将知乎专栏导出成电子书

    https://zhuanlan.zhihu.com/p/44918640

    10.如何用Python抓抖音上的小姐姐

    https://zhuanlan.zhihu.com/p/46396868

    11.【招聘数据分析】Python就业前景如何

    https://zhuanlan.zhihu.com/p/35027220

    专栏索引:

    Python爬虫索引:

    1.如何入门爬虫(路人甲)

    https://zhuanlan.zhihu.com/p/21479334

    (简介:一个知乎大神整理的关于Python爬虫的索引,内容详细全面,结构完整。对于新手和正在学习的小伙伴是非常有帮助的。)

    2.从零开始写Python爬虫(Ehco)

    https://zhuanlan.zhihu.com/p/26673214

    (简介:提供了实用的方法和建议)

    3.自学入门 Python 优质中文资源索引

    https://zhuanlan.zhihu.com/p/49798116

    (简介:自学入门Python的整理,有关于Python爬虫的索引)

    Python爬虫号推荐:

    1.蚍蜉撼大树

    https://www.zhihu.com/people/handashu/posts/posts_by_votes

    (简介:Python爬虫之旅系列)

    2.州的先生

    https://www.zhihu.com/people/zmister/posts/posts_by_votes?page=2

    (简介:python爬虫实战入门系列)

    3.学习python的正确姿势

    https://www.zhihu.com/people/xue-xi-pythonde-zheng-que-zi-shi-92/posts/posts_by_votes

    (简介:Python爬虫实战系列)

    4.不吃夹生饭

    https://www.zhihu.com/people/bu-chi-jia-sheng-fan/posts

    (简介:反反爬虫系列)

    爬虫项目索引:

    1.资源整理|32个Python爬虫项目让你一次吃到撑

    https://zhuanlan.zhihu.com/p/27938007

    (简介:32个爬虫项目)

    2.GitHub上有哪些优秀的Python爬虫项目?

    https://www.zhihu.com/question/58151047/answer/640461600

    (简介:GitHub上优秀的Python爬虫项目)

    3.23个Python爬虫开源项目代码,包含微信淘宝,豆瓣知乎,微博等

    https://zhuanlan.zhihu.com/p/58851666

    展开全文
  • Python 是军刀型的开源工具,被广泛应用于Web 开发、爬虫、数据清洗、自然语言...今天带来这本《Python编程:从入门到实践》大概是最好的入门,这本书对于零基础真的太太太友好了。Python编程:从入门到实践译者:...

    Python 是军刀型的开源工具,被广泛应用于Web 开发、爬虫、数据清洗、自然语言处理、机器学习和人工智能等方面,而且Python 的语法简洁易读,这让许多编程入门者不再望而却步,因此Python 在最近几年非常受欢迎,各行各业的技术人员都开始使用Python。今天带来这本《Python编程:从入门到实践》大概是最好的入门书,这本书对于零基础真的太太太友好了。

    Python编程:从入门到实践

    译者:袁国忠

    作者:Eric Matthes

    Amazon编程入门类榜首图书,国内 Python 入门第一书

    同时使用Python 2.7 和Python 3.5 讲解,全面、详细、深入浅出

    从基本概念到完整项目开发,帮助零基础读者迅速掌握Python编程,开发实际项目

    全书分两部分:第一部分介绍用Python编程所必须了解的基本概念,包括matplotlib、NumPy和Pygal等强大的Python库和工具介绍,以及列表、字典、if语句、类、文件与异常、代码测试等内容;第二部分将理论付诸实践,讲解如何开发三个项目,包括简单的Python 2D游戏开发,如何利用数据生成交互式的信息图,以及创建和定制简单的Web应用,并帮读者解决常见编程问题和困惑。

    2016年出版的书,豆瓣评分高达8.6,基于 Python3.5 同时也兼顾 Python2.7 ,作者推荐的编辑器 Geany 我没用过,不好做评论,不过个人推荐使用 Pycharm 或者 Sublime。

    书中涵盖的内容是比较精简的,没有艰深晦涩的概念,最重要的是每个小结都附带有”动手试一试”环节,学编程最佳的方式就是多动手、多动脑。

    很多初学者看完书之后不知道下一步怎么办,快速提高编程能力的最佳途径就是做项目,而这本书巧妙地安排了三个实践项目,一个游戏、一个Web和一个数据可视化项目,如果你跟着教程把项目做下来,相信你的编程功底绝对会上升一个层次。

    作者还专门安排了一个章节是讲单元测试,会写单元测试是初级程序员进阶到高级程序员的必备技能。

    展开全文
  • 在人工智能和数据分析的带领之下,推动了互联网市场的发展,也推动了python语言的发展,让它成为了市场上炙手可热的编程语言。而python具有入门简单、就业范围广泛、薪资水平高诸多优势,越来越多的人都想要通过培训...

    在人工智能和数据分析的带领之下,推动了互联网市场的发展,也推动了python语言的发展,让它成为了市场上炙手可热的编程语言。

    而python具有入门简单、就业范围广泛、薪资水平高诸多优势,越来越多的人都想要通过培训的方式加入python领域中,但是在入门前这些核心你都了解吗?下面老男孩it教育小编就为大家详细解决一下吧。

    1、现在学习python,选择python2还是python3好?

    首先大家要明白,升级之后的python2和python3是不兼容的,而且python2.x版本已经明确的指出,从明年1月份开始就不提供修复以及更新的工作。所以说为了更好适应市场发展,大家已经慢慢从python2转向python3版本上,选择学习python的话,直接学习python3就可以了,不过还是很有必要了解一下彼此之间的区别是什么。

    2、python编辑器选择哪个比较合适?

    python编辑器以pycharm为主流,当然也有其他的编辑器,种类有很多。不过从实际开发的角度来说,编辑器其实只是一个简单的工具而已,具体选择根据个人习惯来决定就可以了,不过涉及到未来工作方面,个人建议还是以pycharm为主要比较好。

    3、学习python可以看书籍学习吗?

    每个人的情况不同,自然选择的学习方法方式有差异的,有人喜欢看书籍有人喜欢看视频,其实python相关书籍有很多,不过核心知识讲解是存在很大差异的。都需要进行实战来验证理论基础,书籍对于python学习来说,好比一个学习大纲一样。

    4、初学者、零基础可以选择学习python吗?

    可以学习的,对于初学者、零基础人员来说,入门编程语言还是挺困难的,不过相对于python要比其他语言简单很多,非常适合初学者学习。真的对python感兴趣,想要快速掌握这门课程,建议可以到老男孩教育官网了解一下。

    展开全文
  • 内容比较长,更多内容参见原文2018最佳人工智能数据采集(爬虫)工具下载​china-testing.github.ioPython网络数据采集,https://github.com/Apress/practical-web-scraping-for-data-science 星级 低于100This book...

    内容比较长,更多内容参见原文2018最佳人工智能数据采集(爬虫)工具书下载​china-testing.github.iov2-53e75ee932b5c1c79bf35fc9a21d3117_120x160.jpg

    Python网络数据采集 />

    />

    />

    , />

    https://github.com/Apress/practical-web-scraping-for-data-science 星级 低于100

    This book provides a complete and modern guide to web scraping, using Python as the programming language, without glossing over important details or best practices. Written with a data science audience in mind, the book explores both scraping and the larger context of web technologies in which it operates, to ensure full understanding. The authors recommend web scraping as a powerful tool for any data scientist’s arsenal, as many data science projects start by obtaining an appropriate data set.

    Starting with a brief overview on scraping and real-life use cases, the authors explore the core concepts of HTTP, HTML, and CSS to provide a solid foundation. Along with a quick Python primer, they cover Selenium for JavaScript-heavy sites, and web crawling in detail. The book finishes with a recap of best practices and a collection of examples that bring together everything you've learned and illustrate various data science use cases.

    用Python写网络爬虫 第2版 />

    《用Python写网络爬虫(第 2版》讲解了如何使用Python来编写网络爬虫程序,内容包括网络爬虫简介,从页面中抓取数据的3种方法,提取缓存中的数据,使用多个线程和进程进行并发抓取,抓取动态页面中的内容,与表单进行交互,处理页面中的验证码问题,以及使用Scarpy和Portia进行数据抓取,并在最后介绍了使用本书讲解的数据抓取技术对几个真实的网站进行抓取的实例,旨在帮助读者活学活用书中介绍的技术。

    《用Python写网络爬虫(第 2版》适合有一定Python编程经验而且对爬虫技术感兴趣的读者阅读。 />

    展开全文
  • 100+ 经典技术书籍推荐列表(中文) https://github.com/jobbole/awesome-programming-books 知乎网友提醒补充: 1、wowebook:可以下载电子书籍(英文) http://www.wowebook.org/ 2、QDFuns:里面也能下载一些书籍...
  • 他们各自有哪些值得推荐的翻译作品? http://www.zhihu.com/question/20037600 谁翻译了莫言的小说? http://www.zhihu.com/question/20526504 译者已经译完图书,但无版权,如何联系出版社? ...
  • 下面给大家介绍6本有关爬书:更多Python书籍推荐,可以参考这篇文《想学python看哪些》1.Python网络爬虫实战本书从Python基础开始,逐步过渡到网络爬虫,贴近实际,根据不合需求选取不合的爬虫,有针对性地讲解了...
  • 推荐一些python学习资源第一段初级,掌握Python的语法和常用库的使用这里首先推雪锋在网上的书籍,这是Python2.7的,这本书适合于重头开始一直读完,作为一个开发人员,除了基本的语法,这本书里面提到了一些其他的...
  • Python 是军刀型的开源工具,被广泛应用于Web 开发、爬虫、数据清洗、自然语言...今天带来这本《Python编程:从入门到实践》大概是最好的入门,这本书对于零基础真的太太太友好了。Python编程:从入门到实践译者:...
  • 推荐一些python学习资源第一段初级,掌握Python的语法和常用库的使用这里首先推雪锋在网上的书籍,这是Python2.7的,这本书适合于重头开始一直读完,作为一个开发人员,除了基本的语法,这本书里面提到了一些其他的...
  • 推荐一些python学习资源第一段初级,掌握Python的语法和常用库的使用这里首先推雪锋在网上的书籍,这是Python2.7的,这本书适合于重头开始一直读完,作为一个开发人员,除了基本的语法,这本书里面提到了一些其他的...
  • Python 是军刀型的开源工具,被广泛应用于Web 开发、爬虫、数据清洗、自然语言...今天带来这本《Python编程:从入门到实践》大概是最好的入门,这本书对于零基础真的太太太友好了。Python编程:从入门到实践译者:...
  • 推荐一些python学习资源第一段初级,掌握Python的语法和常用库的使用这里首先推雪锋在网上的书籍,这是Python2.7的,这本书适合于重头开始一直读完,作为一个开发人员,除了基本的语法,这本书里面提到了一些其他的...

空空如也

空空如也

1 2 3 4 5 ... 7
收藏数 126
精华内容 50
关键字:

python书推荐知乎

python 订阅