精华内容
下载资源
问答
  • 搜索引擎是什么? 是指根据一定的策略,运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后为用户提供检索服务,将用户检索相关的信息展示给用户的系统。 搜索引擎的优化就是SEO优化。 搜索引擎...

    搜索引擎是什么?

    是指根据一定的策略,运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后为用户提供检索服务,将用户检索相关的信息展示给用户的系统。

    搜索引擎的优化就是SEO优化

    搜索引擎的组成:

    搜索引擎是由四部组成:

    • 搜索器:是在互联网中漫游,发现和搜索信息
    • 索引器:理解索引器搜索的信息,从中抽取索引表,生成文档库。
    • 检索器 :是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价  
    • 用户接口:是输入用户查询,显示查询结果,提供用户相关性反馈机制。

    搜索引擎分类:

    全文索引:从网站上提取信息建立网页数据库的概念。

    一共有两种:

    定期搜索:由网站派出蜘蛛爬虫来收取信息,一旦发现新的网站,蜘蛛爬虫就会搜录你的网站网址的信息。

    提交网站搜索:用户网站主动向搜索引擎提交网址,由引擎定向的向你的网站派出蜘蛛爬虫。

    目录索引:目录索引就像目录一样,需要手工选取你想要的内容,

    元搜索引擎:接受用户查询请求后,同时在多个搜索引擎上搜索,并将结果返回给用户。

    垂直引擎:专注于特定的搜索领域和搜索需求。

    集合式搜索引擎:与元搜索相类似,但是不是从多个搜索引擎上搜索,而是由用户提供若干个搜索引擎中选择。

    门户搜索引擎:提供了搜索服务,但自身既没有分类目录页没有网页数据库,器结果完全来自于其他搜索引擎。

    免费链接列表:简单地滚动链接条目,少部分有简单的分类。

    搜索引擎有哪些? 

    PS:搜索引擎也就是我们做的网页的搜索栏,把我们想要搜索的内容放到搜索框里,不是我们想要的就进行过滤,把我们想要的东西展现在我们的面前,这样是不是就明白搜索引擎是什么了。

    也就是我常用的就是百度,360,谷歌

    看看你都用过什么搜索引擎:百度,谷歌,Bing(去Bing一下:有国内版本和国外版本),维基百科(我没登上去),亚马逊(我想你是知道亚马逊是做什么的),最后一个我也不知道。

    百度:

    PS:我所用的搜索方式就是小白搜索方式还有其他的搜索方式,上边有一个数字,就是搜索得到的数据,显示在第一页得到搜索结果就是排名。

    展开全文
  • 常见的百度云搜索引擎入口合集

    万次阅读 2018-05-11 17:37:39
    百度云是百度面向大众...答案便是使用百度云搜索引擎,百度云搜索引擎和我们常见搜索引擎道理是一样的,只不过百度云搜索引擎只抓取百度云里面的文件!下面给大家推荐几个常见的百度云搜索引擎入口: 1、网盘搜...
    百度云是百度面向大众推出的一款云产品,我们可以将自己的视频、照片、文档等数据存放在百度云里面,而且还可以进行分享。

        随着百度云的用户越来越多,百度云里面的资源也越来越多,怎么样才能快速找到自己需要的百度云资源呢?答案便是使用百度云搜索引擎,百度云搜索引擎和我们常见的搜索引擎道理是一样的,只不过百度云搜索引擎只抓取百度云里面的文件!下面给大家推荐几个常见的百度云搜索引擎入口:

        1、网盘搜索引擎(http://so.baiduyun.me/)


        2、网盘搜(http://www.wangpansou.cn/)


        3、搜盘盘(http://www.sopanpan.com/)


        4、盘搜(http://www.pansou.com/)

         
        5、天天网盘搜索(http://www.daysou.com/)

         
    展开全文
  • 常见搜索引擎蜘蛛大全

    千次阅读 2010-07-01 17:56:26
     国外搜索引擎  gigablast.com----Gigabot  http://www.gigablast.com/spider.html  国外搜索引擎  webalta.net----WebAlta  http://www.webalta.net/ru/about_webmaster.html  国内的一个实验室...

           百度 baidu.com----Baiduspider

      http://www.baidu.com/search/spider.htm

      谷歌 google.com----Googlebot

      http://www.google.com/bot.html 中文版请打开以下页面

      http://www.google.cn/support/webmasters/bin/topic.py?topic=8843

      雅虎 yahoo.com----Yahoo

      http://misc.yahoo.com.cn/help.html 打开后跳转到以下页面

      http://help.cn.yahoo.com/property.html?product=websearch

      有道 yodao.com----YodaoBot

      http://www.yodao.com/help/webmaster/spider/

      搜搜 soso.com----Sosospider/Sosoimagespider(网页蜘蛛/图片蜘蛛)

      http://help.soso.com/webspider.htm

      http://help.soso.com/soso-image-spider.htm

      搜狗 sogou.com----sogou

      http://www.sogou.com/docs/help/webmasters.htm#07

      微软 msn.com----msnbot

      http://search.msn.com/msnbot.htm 打开后跳转到以下页面

      http://help.live.com/help.aspx?mkt=zh-cn&project=wl_webmasters

      以下是几只收获(抓取页面)不劳动(不来流量)的蜘蛛 可以考虑禁了它们爬行 省空间流量

      国外搜索引擎

      gigablast.com----Gigabot

      http://www.gigablast.com/spider.html

      国外搜索引擎

      webalta.net----WebAlta

      http://www.webalta.net/ru/about_webmaster.html

      国内的一个实验室的

      apex.sjtu.edu.cn

    展开全文
  • [搜索引擎友好之路]是我准备写的一本书,现在大部分网站都丰富的内容,但是他们为了得到流量去尝试那些搜索引擎作弊方法,往往是一时得到好处,最后被搜索引擎屏蔽。我们倡导的与搜索引擎友好的优化方式就是试图更...
     [搜索引擎友好之路]是我准备写的一本书,现在大部分网站都有丰富的内容,但是他们为了得到流量去尝试那些搜索引擎作弊方法,往往是一时得到好处,最后被搜索引擎屏蔽。我们倡导的与搜索引擎友好的优化方式就是试图更好的展现你的内容,达到网站和搜索引擎共赢的局面。下面的问题是一次去给客户做培训后,客户提出的问题和我们的回答。

    1、程序生成很多的静态内容链接自己,算不算作弊?

    一个行为算不算作弊,主要是度的问题。生成很多垃圾的静态内容(采集来的,胡乱生成的),只要达到一定的量,一般是会被判定为内容重复或者作弊的,可能会 被降低权重或者删除索引。实际上我们知道现在很多网站自己的内容很丰富,把自己的内容展现好了,就会带来很多好处,不需要去胡乱采集。

    2、flash对网站收录的影响

    flash本身没有任何不好的影响。而常见的错误的行为是对flash的滥用。
    比如,整站全部用flash,设计者或者唯界面论者可能会这么做。其实这样并不好,第一是速度往往会很慢,而且有可能会长时间等待;第二是干扰用户习惯, 很多人打着提高用户感受的旗号去滥用flash,那样做出来的作品,如果说欣赏或者只是试用往往还不错,长期使用用户往往忍受不了;第三是整站所有的内容 无法被搜索引擎收录。
    还有很常见的滥用是内容页面很丰富,但是首页只有一个flash而没有任何文本链接可以帮助用户进入下一级页面。这类问题往往出现在一些大公司的网站中。 虽然确实很美观,但是问题也很多。第一也是速度,网民多数没有耐心,看到一个长长的loading条就会迅速离开;第二,如果用户不安装flash插件, 就无法看到首页,从而无法进入本无需flash的内容页;第三,搜索引擎无法穿过首页去访问后面的页面。所以我们会发现很多公司的网站pagerank很 高,但是内容页面完全没有pagerank。所以在搜索引擎搜索产品名字,往往是第三方的网站排在前面。这类网站最好在下端放一个二级栏目的导航条,至少 也要放一个“点击这里跳过flash直接进入内容”的链接。

    3、no script有用么?

    当然有用。现在很多网站喜欢用Javascript特殊效果或者Ajax,这本身没并不是问题。但是,如果用Javascript来显示网站的导航,就有 两个问题,第一,对于不打开Javascript的用户,他们无法进入网站的内部;第二,搜索引擎往往无法收录Javascript展现的链接。no script可以解决这个问题。包含在 noscript标记内的代码会在不打开Javascript的用户的浏览器上面展现,搜索引擎也可以从中获取导航信息。
    但是,最好的选择还是,导航本身使用标准HTML代码,导航的特殊效果用css和Javascript实现。以后我们会有专门的文章阐述Ajax网站如何进行搜索引擎优化。

    4、更新频率应该多高才适合?

    更新频率理论上当然是越快越好,但是并不推荐没有内容胡乱更新。现在大部分网站的内容都很丰富,更新频率已经足够了。

    5、js生成的更新,能不能被收录?

    跟Javascript有关的问题,答案其实都一样,用Javascript生成的链接,大部分搜索引擎的爬虫不会去抓取,自然也就不会被收录了。

    6、不愿和外部网站交换链接会有什么影响?

    不愿意交换链接自然对Pagerank有不好的影响。但是如果你的内容确实好,自然会有用户主动链接你的页面,这样你的PageRank自然会得到提高。

    7、抓外站新闻对SEO有用么?

    用处不大,抓外站新闻得到的内容实际上都是所谓的重复内容,价值并不高。

    8、和外站交换链接,放什么位置重要么?

    重要,当然是Pagerank越高的页面越好,位置越前越好。

    9、大型网站会给其他网站做链接么?要多少钱?

    交换链接一般是双赢,所以只要你的网站质量达到一定水平,交换链接并不难。一般不要钱,要钱的反而需要警惕,这是搜索引擎禁止的行为。

    10、在网站中,同一级的页面,是PageRank越高,抓取频率越高么?

    对,Pagerank、整站信用级别和页面更新频率共同影响抓取频率,所以Pagerank越高抓取频率越高。

    11、Robot.txt对SEO有什么影响?

    Robot.txt很有价值,但是一般被站长低估和误解。很多人认为只有防止搜索引擎技术抓取的时候才有用。但是实际上正确使用Robot.txt对 SEO很有好处,比如重复内容用不同形式表现是经常需要的,而这种情况很容易被搜索引擎判定为重复内容堆砌。正确利用Robot可以引导搜索引擎只收录首 选内容这样就不会有作弊嫌疑了。(参见:google网站管理员blog的文章“巧妙地处理内容重复”)
    除了处理重复外,Yahoo允许你在Robot.txt文件里面用Crawl-delay:参数设定抓取频率(参看:如何控制Yahoo! Slurp蜘蛛的抓取频度)。Sitemap协议支持你在Robot.txt文件里填写Sitemap参数(参看:Specifying the Sitemap location in your robots.txt file)。

    12、二级域名能有多大的好处?

    好处不大,如果用户喜欢的话,就用吧。

    13、用户页面的url,用文字还是数字好?

    如果用户名不允许中文,那么文字比较好,虽然汉字也可以用在url中,但是总是有些浏览器的支持不够好。如果用户名允许中文,就用数字吧。基本上这不是一个很重要的选择,虽然搜索引擎技术也会把url里面的文字当作可被查询的内容。

    14、flash meta data对SEO有何影响?

    未来可能很重要,但是现在应该还没有多少搜索引擎支持这项技术。

    15、爬虫有没有关于Ajax的抓取计划?

    Googlebot也就是Google的标准蜘蛛,是不支持Javascript的。但是Mediapartners-Google也就是Google Adsense的爬虫,实际上是支持Javascript的。这也就是说技术层面考虑支持Javascript并不是一个问题。但是限于效率和任务优先级 的考虑,Google暂时还没打算让标准蜘蛛Googlebot支持Javascript。
    百度的爬虫支持一部分Javascript,但是由于技术和效率的限制,相信百度也不能抓取100%的Javascript内容。

    16、在js代码中放url有用么?

    答案显而易见,没用。
    展开全文
  • 搜索引擎

    万次阅读 2017-09-06 12:00:45
    Baiduspider常见问题解答什么是BaiduspiderBaiduspider是百度搜索引擎的一个自动程序,它的作用是访问互联网上的网页,建立索引数据库,使用户能在百度搜索引擎中搜索到您网站上的网页。Baiduspider的user-agent是...
  • ElasticSearch搜索引擎常见面试题总结

    千次阅读 2021-04-10 22:12:52
    Elasticsearch 是基于 Lucene 的 Restful 的分布式实时全文搜索引擎,每个字段都被索引并可被搜索,可以快速存储、搜索、分析海量的数据。 全文检索是指对每一个词建立一个索引,指明该词在文章中出现的次数和位置...
  • 1、网页使用框架:框架内的内容通常不在搜索引擎抓取的范围之内。  2、图片太多,文本太少。  3、提交页面转向另一网站:搜索引擎可能完全跳过这个页面。  4、提交太过频繁:一个月内提交2次以上,很多搜索引擎就...
  • Lucene的开发语言是Java,也是Java家族中最为出名的一个开源搜索引擎,在Java世界中已经是标准的全文检索程序,它提供了完整的查询引擎和索引引擎,没有中文分词引擎,需要自己去实现,因此用Lucene去做一个搜素引擎...
  • 几种常见搜索引擎检索模型

    万次阅读 2016-05-14 10:24:57
    布尔模型苹果 AND 公司:表示搜索既包含“苹果”,又包含“公司”这两个词的文档。 苹果 OR 公司:表示搜索包含“苹果”,或包含“公司”这两个词中任意一个的文档。 特点:简单粗暴向量空间模型把文档被分词后的...
  • 搜索引擎介绍

    千次阅读 2017-02-06 11:41:51
    自从1994年问世以来,搜索引擎逐渐成为了人们获取Internet信息资源的主要方式,相关搜索引擎网站也逐渐成为Web用户使用Internet时的首选访问站点之一,另外搜索引擎和实时通讯、电子邮件等服务已经成为当今各大门户...
  • /// lucene.net:全文检索的工具包,不是应用,只是个类库,完成了全文检索的功能 /// 就是把数据拆分—存起来—查询时—拆分—匹配—结果 /// .../// lucene是全文搜索必备的,是大型系统必备的 ///
  • 搜索引擎的原理

    千次阅读 2010-01-07 16:05:00
    一、 搜索引擎蜘蛛搜索引擎蜘蛛(spider),可简称为蜘蛛,本意为搜索引擎机器人(robot),称为蜘蛛的原因是将互联网比喻成蜘蛛网,将机器人比喻成了在网上爬行的蜘蛛,是搜索引擎自动抓取网页的程序。搜索引擎蜘蛛...
  • 了解搜索引擎技术

    千次阅读 2010-06-09 14:53:00
    全文搜索引擎是名副其实的搜索引擎,国外代表Google,国内则著名的百度搜索。它们从互联网提取各个网站的信息(以网页文字为主),建立起数据库,并能检索与用户查询条件相匹配的记录,按一定的排列顺序返回结果...
  • 最近一直在研究sphinx的工作机制,在[搜索引擎]Sphinx的介绍和原理探索简单地介绍了其工作原理之后,还有很多问题没有弄懂,比如底层的数据结构和算法,于是更进一步地从数据结构层面了解其工作原理。在网上搜了很...
  • SEO搜索引擎优化 | hexo

    千次阅读 2018-05-08 10:18:54
    SEO (Search Engine Optimization),即搜索引擎优化。对网站做SEO优化,有利于提高搜索引擎的收录速度及网页排名。 这里主要是对网上常见的hexo的SEO方法进行整理。 在SEO之前,我们得先让搜索引擎收录我们的站点...
  • 浅论如何优化搜索引擎排名机制

    千次阅读 2018-12-09 00:28:39
    由于近期在开发一个网页搜索应用,因此需要对搜索引擎的排序算法进行一定的了解和研究,又因为课程需要写一篇关于网络技术的论文,因此选用此题,对常见搜索引擎排序算法进行一点简要的分析,并且结合实际应用谈一谈...
  • 搜索引擎选择: Elasticsearch与Solr

    千次阅读 2018-07-24 17:55:26
    搜索引擎选型调研文档 Elasticsearch简介* Elasticsearch是一个实时的分布式搜索和分析引擎。它可以帮助你用前所未有的速度去处理大规模数据。 它可以用于全文搜索,结构化搜索以及分析,当然你也可以将这三者...
  • 搜索引擎概述(全)

    千次阅读 2019-10-24 11:16:12
    搜索引擎概述: 1.1 搜索引擎的概念: 搜索引擎是指根据一定的策略,运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户提供检索服务的系统 从使用者的角度看,搜索...
  • 搜索引擎优化(SEO) 基础常识

    千次阅读 2020-02-17 22:24:03
    搜索引擎优化(SEO) 基础常识 前言 在移动互联网迅猛发展的今天,各种APP、小程序满天飞,针对网页的搜索引擎优化(SEO)对于现今的企业来说已经不是头等重要的事情了。但是如果公司的SEO做得好的话,确实可以节约...
  • 搜索引擎优化

    千次阅读 2007-10-09 18:00:00
    SEO 概述搜索引擎(Search Engine)它是一个根据站点内容,将各种站点分门别类的网站。每个引擎的工作原理都不同,的是按META值来分,的是根据页面内容,的按页面标题,还有的将这些方法综合运用。搜索引擎通过...
  • 百度搜索引擎工作原理

    万次阅读 2019-01-13 16:52:00
      关于百度以及其它搜索引擎的工作原理,其实大家已经讨论过很多,但随着科技的进步、互联网业的发展,各家搜索引擎都发生着巨大的变化,并且这些变化都是飞快的。我们设计这个章节的目的,除了从官方的角度发出...
  • 搜索引擎构建索引,其目的是能更快速的提取与用户查询相关的文档信息,假设搜索引擎已经建立好了索引,如何根据倒排索引来相应用户的查询呢? 目前两种查询机制: 一次一文档 一次一单词 跳跃指针(这种是...
  • 搜索引擎和知识图谱那些事

    万次阅读 2017-09-15 17:41:25
    搜索引擎和知识图谱那些事 分类: 知识图谱(14) 版权声明:本文为博主原创文章,转载请注明CSDN博客源地址!共同学习,一起进步~ 目录(?)[+] 这是一篇基础性文章,主要介绍搜索引擎和知识图谱的一些原理...
  • 物联网搜索引擎

    千次阅读 2017-02-13 22:23:59
    物联网搜索引擎shoudan.io点击打开链接
  • 本章主要讲的是搜索引擎的优化,包括提高搜索效率(云存储、缓存机制)、提高搜索质量(网页去重、用户搜索意图识别、网页反作弊)及搜索的发展方向。这三个方面是在网页抓取&搜索排序的基础上发展起来的。
  • 搜索引擎谈一场亲密的恋爱

    千次阅读 2013-06-09 15:49:52
    做SEO就等于与搜索引擎谈恋爱,我们既不能...接下来就让广州SEO刘宇凡为大家深度解释哪些做法会令搜索引擎讨厌? 一、搜索引擎不喜欢你的网站经常改版 很多站长在建站初期都没有定位好,导致后期网站经常改版,
  • 搜索引擎资源

    千次阅读 2017-03-27 11:08:08
     Compass是在Lucence上实现的开源搜索引擎架构,提供更加简洁的搜索引擎API. 增加了索引事务处理的支持,能够更方便地与数据库等食物处理应用进行整合。更新时更加简单、更加高效,无需删除原文档。资源与搜索引擎...
  • 搜索引擎反作弊之内容作弊

    万次阅读 2012-03-24 08:53:04
    本文节选自《这就是搜索引擎:核心技术详解》第八章  网页反作弊是目前所有商业搜索引擎需要解决的重要难点,出于商业利益驱使,很多网站站长会针对搜索引擎排名进行分析,并采取一些手段来提高网站排名,...

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 135,141
精华内容 54,056
关键字:

常见的搜索引擎有哪些