搜索引擎 订阅
所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。 [1] 展开全文
所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出制定信息反馈给用户的一门检索技术。搜索引擎依托于多种技术,如网络爬虫技术、检索排序技术、网页处理技术、大数据处理技术、自然语言处理技术等,为信息检索用户提供快速、高相关性的信息服务。搜索引擎技术的核心模块一般包括爬虫、索引、检索和排序等,同时可添加其他一系列辅助模块,以为用户创造更好的网络使用环境。 [1]
信息
关键技术
网络爬虫、大数据处理、数据挖掘等
作    用
信息获取
分    类
全文索引、目录索引等
中文名
搜索引擎
代    表
百度、谷歌等
外文名
search engine
搜索引擎定义
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上采集信息,在对信息进行组织和处理后,为用户提供检索服务,将检索的相关信息展示给用户的系统。搜索引擎是工作于互联网上的一门检索技术,它旨在提高人们获取搜集信息的速度,为人们提供更好的网络使用环境。从功能和原理上搜索引擎大致被分为全文搜索引擎、元搜索引擎、垂直搜索引擎和目录搜索引擎等四大类。 [2]  搜索引擎发展到今天,基础架构和算法在技术上都已经基本成型和成熟。搜索引擎已经发展成为根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 [3] 
收起全文
精华内容
参与话题
问答
  • 在线识图搜索引擎

    万次阅读 2017-07-30 17:18:06
    Google 图片 https://images.google.com.hk/?gws_rd=cr 百度识图, “鉴”你所见 image.baidu.com/ TinEye Reverse Image Search 专业识图搜索引擎 搜狗图片-上网从搜狗开始10个识图网站

    知识就是力量。

    1. 定义

    2012 年 5 月, 搜索引擎巨头谷歌在其搜索页面首次引入“知识图谱”:用户除了得到搜索网页链接外,还将得到与查询有关的更加智能化的答案

    从杂乱的网页到结构化的实体知识,搜索引擎利用知识图谱能够为用户提供更具条理的信息,甚至顺着知识图谱可以探索更深入、广泛和完整的知识体系,让用户发现他们意想不到的知识

    谷歌高级副总裁艾米特·辛格博士一语道破知识图谱的重要意义就在于:“构成这个世界的是实体,而非字符串(things,not strings)”。

    2. 知识提取的主要技术

    • 实体连接(entity linking)
    展开全文
  • <template> <div class="hello"> <el-input v-model="title" placeholder="请输入内容"></el-input> <ul> <li v-for="item in result">... 作者: {{item.item.autho
    <template>
      <div class="hello">
        <el-input v-model="title" placeholder="请输入内容"></el-input>
        <ul>
          <li v-for="item in result">
            标题: {{item.item.title}}
            <br />
            作者: {{item.item.author.firstName}}
            <br />
            分数: {{item.score}}
          </li>
        </ul>
      </div>
    </template>
    
    <script>
    // 1. 引入Fuse
    import Fuse from "fuse.js";
    export default {
      data() {
        return {
          title: "",
          fuse: null,
          result: [],
          books: [
            {
              title: "Java虚拟机",
              author: {
                firstName: "王浩",
                lastName: "wanghao"
              }
            },
            {
              title: "人工智能",
              author: {
                firstName: "侯建军",
                lastName: "marquis"
              }
            }
          ]
        };
      },
      created() {
        // 2. 初始化
        this.init();
      },
      watch: {
        // 要变量名一致
        title(newName, oldName) {
          // 新值
          console.log(newName);
          // 旧值
          console.log(oldName);
          // 3. 搜索内容
          this.result = this.fuse.search(newName);
          console.log(this.result);
        }
      },
      methods: {
        // 初始化
        init() {
          var options = {
            shouldSort: true, // 是否按分数对结果列表排序
            includeScore: true, //  是否应将分数包含在结果集中。0分表示完全匹配,1分表示完全不匹配。
            threshold: 0.6, // 匹配算法阈值。阈值为0.0需要完全匹配(字母和位置),阈值为1.0将匹配任何内容。
            /**
             * 确定匹配与模糊位置(由位置指定)的距离。一个精确的字母匹配,即距离模糊位置很远的字符将被视为完全不匹配。
             *  距离为0要求匹配位于指定的准确位置,距离为1000则要求完全匹配位于使用阈值0.8找到的位置的800个字符以内。
             */
            location: 0, // 确定文本中预期找到的模式的大致位置。
            distance: 100,
            maxPatternLength: 32, // 模式的最大长度
            minMatchCharLength: 1, // 模式的最小字符长度
            // 搜索标题与作者名
            keys: ["title", "author.firstName"]
          };
          // 设置数据与参数
          this.fuse = new Fuse(this.books, options);
        }
      }
    };
    </script>
    
    
    
    展开全文
  • 各大磁力种子搜索引擎对比

    万次阅读 2018-12-04 10:45:55
    现在磁力种子搜索引擎质量参差不齐,现在就重点整理几个常用的种子搜索站,做个对比分析 1.屌丝搜-最懂屌丝的BT搜索引擎(www.diaosisou.com) 号称最懂屌丝的BT搜索引擎,确实名副其实,屌丝搜索功能强大。其种子...

    现在磁力种子搜索引擎质量参差不齐,现在就重点整理几个常用的种子搜索站,做个对比分析
    1.屌丝搜-最懂屌丝的BT搜索引擎(www.diaosisou.com)
    号称最懂屌丝的BT搜索引擎,确实名副其实,屌丝搜索功能强大。其种子资源强大丰富而又有简介的界面风格,无广告弹窗,支持在线云点播,总体来说,屌丝搜确实是良心站点。该磁力站在短时间内获得了极高的人气,在国内有着良好的口碑,被称为种子搜索神器网页版和万能种子搜索器。除了能搜索种子电影资源外,该站点也整合了网盘搜索功能,是一个很大的亮点。推荐指数5颗星。访问请戳点击打开链接
    2.手撕包菜(www.shousibaocai.com)
    手撕包菜是较为完全的整合了bt资源的站点,不提供在线播放功能。资源质量也比较高。最新资源的收录情况不如屌丝搜,比如,用最新电影“一个人的武林”作为测试,手撕包菜才有两页资源,而屌丝搜有多大6页资源,且大多都能下载。推荐指数4颗星。访问请戳点击打开链接
    3.torrentkitty
    torrentkitty,俗称种猫,是国外的磁力搜索站。在国外口碑不错,搜索英文种子等有较大优势,但对中文资源支持一般,中文种子资源往往更新不及时,有较多弹窗广告前段时间被墙了,现在更换了个域名,访问稍慢,但也能够访问。推荐指数4颗星 访问请戳:点击打开链接
    4.btbook
    也是一个不错的磁力搜索站,资源更新相对稳定,该站点整合磁力搜索 网盘搜索 和基于谷歌的搜索,搜索的磁力资源大多可以下载,建站时间也较早,资源稳定无广告,又一良心站。推荐指数:5星 访问请戳:点击打开链接
    5.BtDigg
    BtDigg国外磁力站点。以优质且收录快速而出名。其对应的浏览器插件也是相当给力,对资源本身的描述也是较为详细。但近段时间国内访问不了。推荐指数:4颗星。访问请戳 点击打开链接
    --------------------- 
    转载自:https://blog.csdn.net/lizhengnanhua/article/details/41531579 

     

     

     

    展开全文
  • 搜索引擎

    万次阅读 2017-09-06 12:00:45
    Baiduspider常见问题解答什么是BaiduspiderBaiduspider是百度搜索引擎的一个自动程序,它的作用是访问互联网上的网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站上的网页。Baiduspider的user-agent是...

    Baiduspider常见问题解答

    什么是Baiduspider

    Baiduspider是百度搜索引擎的一个自动程序,它的作用是访问互联网上的网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站上的网页。

    Baiduspider的user-agent是什么?

    百度各个产品使用不同的user-agent:

    产品名称 对应user-agent
    网页搜索 Baiduspider
    移动搜索 Baiduspider
    图片搜索 Baiduspider-image
    视频搜索 Baiduspider-video
    新闻搜索 Baiduspider-news
    百度搜藏 Baiduspider-favo
    百度联盟 Baiduspider-cpro
    商务搜索 Baiduspider-ads

    如何区分PC与移动网页搜索的UA

    PC搜索完整UA:

    Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    移动搜索完整UA:

    Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,like Gecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)

    pc ua:通过关键词Baiduspider/2.0来确定是pc ua

    移动ua:通过关键词android和mobile确定是来自移动端抓取访问,Baiduspider/2.0 确定为百度爬虫。

    Baiduspider对一个网站服务器造成的访问压力如何?

    为了达到对目标资源较好的检索效果,Baiduspider需要对您的网站保持一定量的抓取。我们尽量不给网站带来不合理的负担,并会根据服务器承受能力,网站质量,网站更新等综合因素来进行调整。如果您觉得baiduspider的访问行为有任何不合理的情况,您可以反馈至反馈中心。

    为什么Baiduspider不停的抓取我的网站?

    对于您网站上新产生的或者持续更新的页面,Baiduspider会持续抓取。此外,您也可以检查网站访问日志中Baiduspider的访问是否正常,以防止有人恶意冒充Baiduspider来频繁抓取您的网站。 如果您发现Baiduspider非正常抓取您的网站,请通过投诉平台反馈给我们,并请尽量给出Baiduspider对贵站的访问日志,以便于我们跟踪处理。

    如何判断是否冒充Baiduspider的抓取?

    建议您使用DNS反查方式来确定抓取来源的ip是否属于百度,根据平台不同验证方法不同,如linux/windows/os三种平台下的验证方法分别如下:

    1.在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 .baidu.com 或 .baidu.jp 的格式命名,非 .baidu.com 或 .baidu.jp 即为冒充。

    $ host 123.125.66.120
    120.66.125.123.in-addr.arpa domain name pointer
    baiduspider-123-125-66-120.crawl.baidu.com.
    
    host 119.63.195.254
    254.195.63.119.in-addr.arpa domain name pointer
    BaiduMobaider-119-63-195-254.crawl.baidu.jp.

    2.在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 .baidu.com 或 .baidu.jp 的格式命名,非 .baidu.com 或 .baidu.jp 即为冒充。

    3.在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 .baidu.com 或 .baidu.jp 的格式命名,非 .baidu.com 或 .baidu.jp 即为冒充。

    我不想我的网站被Baiduspider访问,我该怎么做?

    Baiduspider遵守互联网robots协议。您可以利用robots.txt文件完全禁止Baiduspider访问您的网站,或者禁止Baiduspider访问您网站上的部分文件。 注意:禁止Baiduspider访问您的网站,将使您的网站上的网页,在百度搜索引擎以及所有百度提供搜索引擎服务的搜索引擎中无法被搜索到。关于robots.txt的写作方法,请参看我们的介绍:robots.txt写作方法

    您可以根据各产品不同的user-agent设置不同的抓取规则,如果您想完全禁止百度所有的产品收录,可以直接对Baiduspider设置禁止抓取。

    以下robots实现禁止所有来自百度的抓取:

    User-agent: Baiduspider Disallow: /

    以下robots实现禁止所有来自百度的抓取但允许图片搜索抓取/image/目录:

    User-agent: Baiduspider Disallow: /
    
    User-agent: Baiduspider-image Allow: /image/

    请注意:Baiduspider-cpro抓取的网页并不会建入索引,只是执行与客户约定的操作,所以不遵守robots协议,如果Baiduspider-cpro给您造成了困扰,请联系union1@baidu.com。 Baiduspider-ads抓取的网页并不会建入索引,只是执行与客户约定的操作,所以不遵守robots协议,如果Baiduspider-ads给您造成了困扰,请联系您的客户服务专员。

    为什么我的网站已经加了robots.txt,还能在百度搜索出来?

    因为搜索引擎索引数据库的更新需要时间。虽然Baiduspider已经停止访问您网站上的网页,但百度搜索引擎数据库中已经建立的网页索引信息,可能需要数月时间才会清除。另外也请检查您的robots配置是否正确。
    如果您的拒绝被收录需求非常急迫,也可以通过投诉平台反馈请求处理。

    我希望我的网站内容被百度索引但不被保存快照,我该怎么做?

    Baiduspider遵守互联网meta robots协议。您可以利用网页meta的设置,使百度显示只对该网页建索引,但并不在搜索结果中显示该网页的快照。
    和robots的更新一样,因为搜索引擎索引数据库的更新需要时间,所以虽然您已经在网页中通过meta禁止了百度在搜索结果中显示该网页的快照,但百度搜索引擎数据库中如果已经建立了网页索引信息,可能需要二至四周才会在线上生效。

    Baiduspider抓取造成的带宽堵塞?

    Baiduspider的正常抓取并不会造成您网站的带宽堵塞,造成此现象可能是由于有人冒充Baiduspider恶意抓取。如果您发现有名为Baiduspider的agent抓取并且造成带宽堵塞,请尽快和我们联系。您可以将信息反馈至投诉平台,如果能够提供您网站该时段的访问日志将更加有利于我们的分析。


    一般情况下,大多数网站创建者或管理员都会在网站的根目录放置一个名为robots.txt的文本文件,用来控制自己的网站哪些目录允许SE搜索引擎[1] 爬行并收录,哪些目录禁止搜索引擎收录,Disallow,正是robots.txt文件中设置禁止搜索引擎收录哪些目录的一个词语。

    例子:
    允许所有SE(搜索引擎)收录本站:robots.txt为空就可以,什么都不要写。
    禁止所有SE(搜索引擎)收录网站的某些目录:

    User-agent: *
    Disallow: /目录名1/
    Disallow: /目录名2/
    Disallow: /目录名3/

    禁止某个SE(搜索引擎)收录本站,例如禁止百度:

    User-agent: Baiduspider
    Disallow: /

    禁止所有SE(搜索引擎)收录本站:

    User-agent: *
    Disallow: /

    它的用途是告诉上一子集,确定某个对象用的。

    什么是robots.txt

    robots.txt是一个纯文本txt文件,用在网站服务器上。它是搜索引擎访问网站的时候要查看的第一个文件,robots.txt文件告诉搜索引擎在服务器上什么文件是可以被查看的,哪些网页可以收录,哪些不允许收录,对与seo优化而言,放置一个robots.txt是对搜索引擎友好的表现,robots.txt必须放置在一个站点的根目录下,且文件名必须全部小写。

    robots.txt作用

    robots.txt主要作用是保障网络安全与网站隐私,搜索引擎遵循robots.txt协议。通过根目录中创建的纯文本文件robots.txt,网站就可以声明哪些页面不想被搜索引擎爬行并收录,每个网站都可以自主控制网站是否愿意被搜索引擎收录,或者指定搜索引擎只收录指定的内容。当搜索引擎访问某个站点时,它会首先检查该站点根目录下是否存在robots.txt,如果该文件不存在,那么爬虫就沿着链接抓取,如果存在,爬虫就会按照该文件中的内容来确定访问的范围。

    robots.txt文件的格式

    User-agent:_____ 空白处为定义搜索引擎的类型;
    Crawl-delay:_____ 空白处为定义抓取延迟;
    Disallow:_____ 空白处为定义禁止搜索引擎收录的地址;
    Allow:_____ 空白处为定义允许搜索引擎收录的地址;

    360搜索对Robots协议的支持

    360搜索支持Robots协议的主要命令,以下为具体说明:

    user-agent

    360搜索支持user-agent命令,包括使用通配符的user-agent命令。360搜索各产品的爬虫user-agent为:

    • 网页搜索 360Spider
    • 网页搜索 HaoSouSpider

    360搜索将优先使用HaoSouSpider来访问站点,如果遇到UA识别无法下载页面,会再用 360spider抓取,蜘蛛IP不更改。

    • 图片搜索 360Spider-Image

    • 视频搜索 360Spider-Video

    Allow

    站长可通过Allow命令指定建议收录的文件、目录 。

    Disallow

    站长可通过Disallow命令指定不建议收录的文件、目录。

    360搜索对Robots协议的扩展

    360搜索根据站长们的反馈,会陆续推出扩展的Robots协议命令。这些命令将能帮助站长们提高和360搜索爬虫沟通的效率,减少站长们维护Robots协议文件的技术成本。

    360搜索首个扩展命令是:indexpage,站长们可以使用此命令告知360搜索哪些网页经常更新。360搜索会根据站长的指示以及自己的算法,智能调整爬虫抓取频率,实现对您网站新内容的更高频率抓取。

    在命令中可以使用*、$等通配符。

    示例:

    使用通配符的

    Indexpage: http://bbs.360safe.com/forum-*-1.html$
    
    Indexpage: http://ent.sina.com.cn/*/roll.html

    不用通配符的:

    Indexpage: http://roll.tech.sina.com.cn/internet_all/index.shtml
    
    Indexpage: http://roll.tech.sina.com.cn/it/index.shtml
    
    Indexpage: http://roll.tech.sina.com.cn/tele/index.shtml
    
    Indexpage: http://roll.tech.sina.com.cn/discovery/index.shtml
    
    Indexpage: http://roll.tech.sina.com.cn/elec/index.shtml

    对Robots协议的善意使用

    Robots协议是一个搜索引擎和网站之间的善意协议,我们鼓励站长们也以善意的方式使用这一协议,尽量提供准确的信息,除非有充足理由,不使用Robots协议屏蔽某些特定搜索引擎爬虫。

    360搜索愿和站长们一起,共建一个更健康、公平、透明的搜索引擎生态系统。

    展开全文
  • 99%的人不知道搜索引擎的6个技巧

    万次阅读 多人点赞 2019-11-27 00:55:22
    加“星标★”,每天11.50,好文必达 全文约900字,预计阅读时间1分钟 ...搜索引擎一般都会有一些高级的搜索技巧,掌握这些技巧之后就可以过滤掉一些不想要的噪音,迅速找带自己想要的信息,只是很少...
  • 爬虫搜索,简单的搜索引擎,java爬虫,搜索引擎例子,爬虫demo,java实现互联网内容抓取,搜索引擎大揭密.java爬虫程序。web搜索。爬虫程序。sigar搜索,定时搜索互联网内容信息。
  • 2019搜索BT种子搜索引擎推荐大全

    万次阅读 2019-11-29 13:34:13
    原文链接:... 有时候换一个地方想找最新电影或者动漫,浏览器收藏的网址,想要查看还要去下载这个浏览器才行,这样就比较麻烦,看见简书可以记录,先搜集几个方便以后用,有需求...
  • python 手把手教你基于搜索引擎实现文章查重

    万次阅读 多人点赞 2020-09-13 22:18:19
    本文使用搜索引擎结果作为文章库,再与本地或互联网上数据做相似度对比,实现文章查重;由于查重的实现过程与一般情况下的微博情感分析实现流程相似,从而轻易的扩展出情感分析功能(下一篇将在此篇代码的基础上完成...
  • 几款磁力搜索引擎,找资料更方便

    万次阅读 2018-02-28 17:37:00
    一款强大的磁力搜索引擎网站,这款网站包含有7万多个磁力链接,提供提供网盘形式和磁力形式的储存,有很多你想要的东西。如果是音频和视频的话支持在线观看。 Bt977 磁力搜索引擎,支持网盘播放,磁力下载。 ...
  • Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是当前流行的企业级搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。 elasticSearch 的使用...
  • 大数据平台下的各种搜索引擎的API

    万次阅读 2019-03-02 17:49:42
    首先,我做了一个网站,这个网站是基于电视剧、电影、app、图片、...用户可以通过首页的所有链接和搜索框进行分类检索。 具体的api如下: (1)查询百度云网盘的数据api https://ljxwtl.cn/getSearchPagingBaiduY...
  • 搜索引擎资源

    千次阅读 2017-03-27 11:08:08
    转自:http://blog.csdn.net/hguisu/article/details/8024799  http://blog.csdn.net/hguisu/article/details/7995703 1. 开源项目 1.Lucene全文检索系统  http://lucene.apache.org和 ...
  • 搜索引擎目录

    千次阅读 2005-12-11 16:43:00
    ----------------------------------------------------------------〖著名目录类搜索引擎〗〖美国、加拿大地区英文搜索引擎〗〖英国等地区搜索引擎〗〖德国搜索引擎〗〖意大利搜索引擎〗〖俄罗
  • 开源搜索引擎 种子搜索 很久以前,互联网很小,只有几个人可以将它们编入索引,这些人收集了所有网站的名称和位置,并按页面或印刷书籍中的主题列出了它们。 随着万维网网络的发展,“网络响动”惯例得到了发展,在...
  • 百度网盘搜索引擎

    千次阅读 2016-10-17 16:31:20
    百度网盘搜索百度网盘搜索是国内老牌的百度网盘搜索引擎,也是百度网盘,百度云盘搜索。百度网盘搜索是基于百度云搜索,最大的百度网盘资源搜索中心,千万级数据量,让您一网打尽所有的百度网盘资源....
  • 搜索引擎技术之概要预览

    万次阅读 多人点赞 2011-09-27 20:04:45
    搜索引擎技术之概要预览前言 近些天在学校静心复习功课与梳理思路(找工作的事情暂缓),趁闲暇之际,常看有关搜索引擎相关技术类的文章,接触到不少此前未曾触碰到的诸多概念与技术,如爬虫,网页抓取,分词,索引...
  • 搜索引擎百度已死

    万次阅读 多人点赞 2019-01-23 11:06:11
    最近半年使用过百度的朋友,可能会注意到一个现象:你在第一页看到的搜索结果,基本上有一半以上会指向百度自家产品,尤其频繁出现的是“百家号”。   百家号是百度的自媒体平台,刚推出的时候曾经主打过优质作者...
  • 使用Python实现简单的搜索引擎,完整源码

    万次阅读 多人点赞 2019-03-03 18:03:48
    版权声明:转载请注明出处!...结合本学期《信息检索与搜索引擎技术》课程教学内容,利用网络爬虫技术、文档倒排索引技术、向量空间模型技术、检索排序技术,编写一个搜索引擎系统,系统能够实现根据...
  • Solr搜索引擎原理

    万次阅读 2017-06-14 15:03:22
    场景:小时候我们都使用过新华字典,妈妈叫你翻开第38页,找到“坑爹”...这种搜索方法叫做顺序扫描法。对于少量的数据,使用顺序扫描是够用的。但是妈妈叫你查出坑爹的“坑”字在哪一页时,你要是从第一页的第一
  • 搜索引擎的原理

    千次阅读 2010-01-07 16:05:00
    一、 搜索引擎蜘蛛搜索引擎蜘蛛(spider),可简称为蜘蛛,本意为搜索引擎机器人(robot),称为蜘蛛的原因是将互联网比喻成蜘蛛网,将机器人比喻成了在网上爬行的蜘蛛,是搜索引擎自动抓取网页的程序。搜索引擎蜘蛛...
  • 搜索引擎收录大全

    千次阅读 2015-08-05 20:36:37
    非原版:九尾搜索(原谷粉搜搜):http://www.gfsoso.com/易搜索: https://s.ets.cc/Glgoo:http://www.glgoo.com/蝴蝶:http://www.xiexingwen.com/Googleout:https://www.out1000.com/天外天:http://
  • 了解搜索引擎技术

    千次阅读 2010-06-09 14:53:00
    关于搜素引擎搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。 全文搜索引擎是...
  • 四大搜索引擎对比

    千次阅读 2008-05-08 17:35:00
    四大搜索引擎对比 公司/项数/搜索引擎 google yahoo baidu microsoft google 2,300,000,0
  • 搜索引擎的未来

    千次阅读 2004-11-19 17:58:00
    最近msn推出了 http://beta.search.msn.com 搜索引擎试用后发现和google的还是区别很大的,最突出的区别是搜索结果相关性很高,不像google搜索的东西太多,需要看很久才能找到自己想要的东西。以前总用google的...
  • 35个资源搜索引擎

    万次阅读 2018-10-29 23:07:42
    凌风云 https://www.lingfengyun.com/(不免费) 盘多多 http://www.panduoduo.net/ 盘搜搜 http://www.pansoso.com/ 搜百度盘 http://www.sobaidupan.com/ 百度网盘之家 http://wowenda.com/(推荐) ...
  • 这个博客用于记录我的计算机学习的路途,本文用于记录Python百度搜索爬虫编写过程。 第一步 本程序所用的python库 1,requests 用于GET网页返回的信息,这个库比较重要。可以用来模拟浏览器的GET和POST,伪装...

空空如也

1 2 3 4 5 ... 20
收藏数 95,335
精华内容 38,134
关键字:

搜索引擎