精华内容
下载资源
问答
  • 爬虫软件

    2019-05-22 10:16:54
    它的优点同时也在一定程度上成了它的缺点,因为它是一个面向开发者的爬虫开发系统,提供了丰富的开发功能,网站看起来非常的偏技术非常专业,尽管官方也提供了云爬虫市场这样的现成爬虫产品,并且开放给广大爬虫...

    一、八爪鱼采集器

    八爪鱼采集器分为简易采集和自定义采集,简易采集器内置主流数据源,无需配置,一键采集;而自定义采集可以自由配置,灵活契合所有业务场景。

    简介:八爪鱼采集器是一款可视化采集器,内置采集模板,支持各种网页数据采集。

    优点:支持自定义模式,可视化采集操作,容易上手;

             支持简易采集模式,提供官方采集模板,支持云采集操作;

             支持防屏蔽措施,例如代理IP切换和验证码服务;

             支持多种数据格式导出。

    缺点:功能使用门槛较高,本地采集时很多功能受限,而云采集收费较高;

             采集速度较慢,很多操作都要卡一下,云端采集说10倍提速但是并不明显;

             只支持Windows版本,不支持其他操作系统。

    是否免费:号称免费,但是实际上导出数据需要积分,可以做任务攒积分,但是正常情况下基本都需要购买积分。

     

    简易采集:

    二、后羿采集器

    官网:http://www.houyicaiji.com/

    简介:后羿采集器是由前谷歌搜索技术团队基于人工智能技术研发的新一代网页采集软件,该软件功能强大,操作极其简单。

    优点:支持智能采集模式,输入网址就能智能识别采集对象,无需配置采集规则,操作非常简单;

             支持流程图模式,可视化操作流程,能够通过简单的操作生成各种复杂的采集规则;

             支持防屏蔽措施,例如代理IP切换等;

             支持多种数据格式导出;

             支持定时采集和自动化发布,发布接口丰富;

             支持Windows、Mac和Linux版本。

    缺点:软件推出时间不长,部分功能还在继续完善,暂不支持云采集功能

    是否免费:完全免费,采集数据和手动导出采集结果都没有任何限制,不需要积分。

     三、火车头采集器

    官网:http://www.locoy.com/

    简介:火车采集器是一款网页数据抓取、处理、分析,挖掘软件。可以灵活迅速地抓取网页上散乱分布的信息,并通过强大的处理功能准确挖掘出所需数据。

    优点:国内老牌的采集器,经过多年的积累,具有丰富的采集功能;

             采集速度比较快,接口比较齐全,支持PHP和C#插件扩展;

             支持多种数据格式导出,可以进行数据替换等处理。

    缺点:越是年头长的产品越容易陷入自己的固有经验中,火车头也难以摆脱这问题。

             虽说功能丰富,但是功能都堆砌在那里,用户体验不好,让人不知道从何下手;

             学会了的人会觉得功能强大,但是对于新手而言有一定使用门槛,不学习一段时间很难上手,零基础上手基本不可能。

             只支持Windows版本,不支持其他操作系统;

    是否免费:号称免费,但是实际上免费功能限制很多,只能导出单个txt或html文件,基本上可以说是不免费的。 

    四、神箭手云爬虫

    官网:https://www.shenjian.io/

    简介:神箭手云是一个大数据应用开发平台,为开发者提供成套的数据采集、数据分析和机器学习开发工具,为企业提供专业化的数据抓取、数据实时监控和数据分析服务。 

    优点:功能强大,涉及云爬虫、API、机器学习、数据清洗、数据出售、数据订制和私有化部署等;

             纯云端运行,跨系统操作无压力,隐私保护,可隐藏用户IP。

             提供云爬虫市场,零基础使用者可直接调用开发好的爬虫,开发者基于官方的云端开发环境开发并上传出售自己的爬虫程序;         

             领先的反爬技术,例如直接接入代理IP和自动登录验证码识别等,全程自动化无需人工参与; 

             丰富的发布接口,采集结果以丰富表格化形式展现; 

    缺点:它的优点同时也在一定程度上成了它的缺点,因为它是一个面向开发者的爬虫开发系统,提供了丰富的开发功能,网站看起来非常的偏技术非常专业,尽管官方也提供了云爬虫市场这样的现成爬虫产品,并且开放给广大爬虫开发者,从而让爬虫市场的内容更加丰富,但是对于零技术基础的用户而言并不是那么容易理解,所以有一定的使用门槛。

    是否免费:免费用户无采集功能和导出限制,无需积分。

    具备开发能力的用户可以自行开发爬虫,达到免费效果,没有开发能力的用户需要从爬虫市场寻找是否有免费的爬虫。

    展开全文
  • 爬虫软件代码

    2018-12-17 11:31:45
    爬虫软件获取某房地产公司网页页面数据存入数据库,分析页面自动生成页面另外给代码。
  • python爬虫软件

    2019-01-03 12:51:43
    这个软件是我无聊时写的一款爬虫软件,可以爬去无水印的照片(御姐,美女,校花,萝莉,帅哥,型男等等),可以批量保存,无限爬去哦。喜欢的可以下载看看,声明,这软件是python编写的,我测试只能在win10系统运行...
  • 多可爬虫软件

    2014-07-07 13:16:53
    就是个爬虫软件,就是一个好用的爬虫软件!还没用过
  • jsoup爬虫软件技术

    2016-12-16 09:54:19
    jsoup爬虫软件技术开发。
  • 爬虫软件使用

    2019-03-11 20:45:00
    八爪鱼爬虫软件使用

    八爪鱼爬虫软件使用

    展开全文
  • 爬虫软件学习

    2019-03-11 20:49:35
    爬虫软件分为云爬虫和采集器。 云爬虫包括神箭手云爬虫,是在网页上使用的一款软件,方便使用,不占内存; 采集器包括后裔,火车头,八爪鱼采集器,使用得先下载软件。 ...

    爬虫软件分为云爬虫和采集器。
    云爬虫包括神箭手云爬虫,是在网页上使用的一款软件,方便使用,不占内存;
    采集器包括后裔,火车头,八爪鱼采集器,使用得先下载软件。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

    展开全文
  • 八爪鱼爬虫软件

    2019-03-11 21:07:37
    前市面上常见的爬虫软件一般可以划分为云爬虫和采集器两种: 所谓云爬虫就是无需下载安装软件,直接在网页上创建爬虫并在网站服务器运行,享用网站提供的带宽和24小时服务; 采集器一般就是要下载安装在本机,然后...

    前市面上常见的爬虫软件一般可以划分为云爬虫和采集器两种:

    所谓云爬虫就是无需下载安装软件,直接在网页上创建爬虫并在网站服务器运行,享用网站提供的带宽和24小时服务;

    采集器一般就是要下载安装在本机,然后在本机创建爬虫,使用的是自己的带宽,受限于自己的电脑是否关机。

    当然,以上不包括自己开发的爬虫工具和爬虫框架之类的。

     

    神箭手云爬虫

    简介:神箭手云是一个大数据应用开发平台,为开发者提供成套的数据采集、数据分析和机器学习开发工具,为企业提供专业化的数据抓取、数据实时监控和数据分析服务。 

    优点:功能强大,涉及云爬虫、API、机器学习、数据清洗、数据出售、数据订制和私有化部署等;

             纯云端运行,跨系统操作无压力,隐私保护,可隐藏用户IP。

             提供云爬虫市场,零基础使用者可直接调用开发好的爬虫,开发者基于官方的云端开发环境开发并上传出售自己的爬虫程序;         

             领先的反爬技术,例如直接接入代理IP和自动登录验证码识别等,全程自动化无需人工参与; 

             丰富的发布接口,采集结果以丰富表格化形式展现; 

    缺点:它的优点同时也在一定程度上成了它的缺点,因为它是一个面向开发者的爬虫开发系统,提供了丰富的开发功能,网站看起来非常的偏技术非常专业,尽管官方也提供了云爬虫市场这样的现成爬虫产品,并且开放给广大爬虫开发者,从而让爬虫市场的内容更加丰富,但是对于零技术基础的用户而言并不是那么容易理解,所以有一定的使用门槛。

    是否免费:免费用户无采集功能和导出限制,无需积分。

    具备开发能力的用户可以自行开发爬虫,达到免费效果,没有开发能力的用户需要从爬虫市场寻找是否有免费的爬虫。

     

    火车头采集器:

    简介:火车采集器是一款网页数据抓取、处理、分析,挖掘软件。可以灵活迅速地抓取网页上散乱分布的信息,并通过强大的处理功能准确挖掘出所需数据。

    优点:国内老牌的采集器,经过多年的积累,具有丰富的采集功能;

             采集速度比较快,接口比较齐全,支持PHP和C#插件扩展;

             支持多种数据格式导出,可以进行数据替换等处理。

    缺点:越是年头长的产品越容易陷入自己的固有经验中,火车头也难以摆脱这问题。

             虽说功能丰富,但是功能都堆砌在那里,用户体验不好,让人不知道从何下手;

             学会了的人会觉得功能强大,但是对于新手而言有一定使用门槛,不学习一段时间很难上手,零基础上手基本不可能。

             只支持Windows版本,不支持其他操作系统;

    是否免费:号称免费,但是实际上免费功能限制很多,只能导出单个txt或html文件,基本上可以说是不免费的。

     

    后羿采集器:

    简介:后羿采集器是由前谷歌搜索技术团队基于人工智能技术研发的新一代网页采集软件,该软件功能强大,操作极其简单。

    优点:支持智能采集模式,输入网址就能智能识别采集对象,无需配置采集规则,操作非常简单;

             支持流程图模式,可视化操作流程,能够通过简单的操作生成各种复杂的采集规则;

             支持防屏蔽措施,例如代理IP切换等;

             支持多种数据格式导出;

             支持定时采集和自动化发布,发布接口丰富;

             支持Windows、Mac和Linux版本。

    缺点:软件推出时间不长,部分功能还在继续完善,暂不支持云采集功能

    是否免费:完全免费,采集数据和手动导出采集结果都没有任何限制,不需要积分。

     

     

    八爪鱼采集器

    简介:八爪鱼采集器是一款可视化采集器,内置采集模板,支持各种网页数据采集。

    优点:支持自定义模式,可视化采集操作,容易上手;

             支持简易采集模式,提供官方采集模板,支持云采集操作;

             支持防屏蔽措施,例如代理IP切换和验证码服务;

             支持多种数据格式导出。

    缺点:功能使用门槛较高,本地采集时很多功能受限,而云采集收费较高;

             采集速度较慢,很多操作都要卡一下,云端采集说10倍提速但是并不明显;

             只支持Windows版本,不支持其他操作系统。

    是否免费:号称免费,但是实际上导出数据需要积分,可以做任务攒积分,但是正常情况下基本都需要购买积分。

    1、主页分为简易采集和自定义采集

    2、使用简易采集

    3、选择中国知网进行信息采集

     

    4、输入查询的词条

    5、运行任务,启用本地采集

    6、信息采集中

    7、信息采集完成,按照自己的需求进行信息的处理

    8、信息采集完成的词条显示

     

    展开全文
  • 爬虫软件八爪鱼

    千次阅读 2019-03-11 21:02:51
    @爬虫软件八爪鱼 采集到的网页数据 采集之后导出的数据
  • 常见的爬虫软件

    万次阅读 2019-05-20 17:04:18
    前市面上常见的爬虫软件一般可以划分为云爬虫和采集器两种: 所谓云爬虫就是无需下载安装软件,直接在网页上创建爬虫并在网站服务器运行,享用网站提供的带宽和24小时服务; 采集器一般就是要下载安装在本机,然后在...
  • 开源爬虫软件汇总

    2019-09-29 12:51:11
    世界上已经成型的爬虫软件多达上百种,本文对较为知名及常见的开源爬虫软件进行梳理,按开发语言进行汇总,如下表所示。虽然搜索引擎也有爬虫,但本次我汇总的只是爬虫软件,而非大型、复杂的搜索引擎,因为很多兄弟...
  • 这里推荐一些33款开源爬虫软件给大家。爬虫,即网络爬虫,是一种自动获取网页内容的程序。是搜索引擎的重要组成部分,因此搜索引擎优化很大程度上就是针对爬虫而做出的优化。网络爬虫是一个自动提取网页的程序,它为...
  • 爬虫软件介绍?大数据抓取软件?什么是Python爬虫?Python爬虫又叫网络爬虫关于Python爬虫,我们需要知道的有:1. Python基础语法2. HTML页面的内容抓取(数据抓取)3. HTML页面的数据提取(数据清洗)4. Scrapy框架以及...
  • 爬虫软件 自动获取网站源码 将整个网站拉去到本地,可直接变成本地静态网站
  • 爬虫软件的使用

    2019-03-11 20:51:38
    一、软件的下载安装 二、软件界面介绍 三、软件的使用截图 效果截图一 效果截图二 四、爬虫软件的意义
  • 蓝天采集器是一款免费的数据采集发布爬虫软件,采用php+mysql开发,可部署在云服务器,几乎能采集所有类型的网页,无缝对接各类CMS建站程序,免登录实时发布数据,全自动无需人工干预!是大数据、云时代网站数据自动...
  • 爬虫批量原创文章采集 先看案例: 5118的收录与关键词截图 爱站收录与关键词截图 站长之家收录与关键词截图 ...1、根据客户提供的关键词放到爬虫软件清洗,然后根据客户的关键词采集长尾词(关键词) 2
  • ForeSpider爬虫工具软件使用教程 使用ForeSpider爬虫软件批量采集企业信息公示系统.zip
  • 小型网络爬虫软件

    2011-12-14 21:27:02
    这是一款小型的爬虫软件,非常好用。初级编程者可以用来分析。
  • 网络爬虫爬虫软件

    2012-04-21 15:33:01
    需要加载一个字典文件,此字典文件在爬虫程序中要求放在此目录结构下: c:\dictionary\dictionary.txt,词典默认认为是按照词语长到短的顺序排列的 2、此爬虫程序爬到的网页内容存储到数据库中,运用的是SQL Server ...
  • 怎么开发爬虫软件

    2019-07-18 15:43:07
    怎么开发爬虫软件? ...
  • Pholcus(幽灵蛛)是一款纯Go语言编写的支持分布式的高并发、重量级爬虫软件,定位于互联网数据采集,为具备一定Go或JS编程基础的人提供一个只需关注规则定制的功能强大的爬虫工具。 它支持单机、服务端、客户端三种...
  • 后羿爬虫软件

    2019-02-24 21:26:05
    当需要进行网络上资料收集的时候,可以使用该工具进行网上资料爬虫,操作简单方便。
  • Pholcus(幽灵蛛)是一款纯Go语言编写的支持分布式的高并发、重量级爬虫软件,定位于互联网数据采集,为具备一定Go或JS编程基础的人提供一个只需关注规则定制的功能强大的爬虫工具。 它支持单机、服务端、客户端三种...
  • 爬虫软件的介绍

    2018-08-20 15:12:12
    易数云爬虫软件的平台,有一些小伙伴问起,简单介绍下。 是一款可视化的0编程的软件,有PC版,有WEB服务器版。 操作简便,个人觉得比较好的是他们比较专业的客服与技术人员。 可以比较快速的解决跟处理需求。 ...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 5,317
精华内容 2,126
关键字:

爬虫软件

爬虫 订阅