精华内容
下载资源
问答
  • 垂直搜索引擎

    2016-08-26 16:50:00
    垂直搜索引擎 垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索是相对...

    1,

    垂直搜索引擎

    垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。垂直搜索是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。

    2,

    http://baike.baidu.com/view/7491.htm

    3,

    展开全文
  • 垂直搜索引擎

    2008-10-17 15:10:00
    垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”...
    来源:http://www.blogjava.net/zhouxing/archive/2007/12/14/167864.html


    垂直搜索引擎
    垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。

    垂直搜索引擎能否赢得市场?

    垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页,而是范围极为缩小、极具针对性的具体信息。因此,特定行业的用户更加青睐垂直搜索引擎,是垂直搜索引擎的长期、稳定的群体。

    搜索引擎的出现,整合了众多网站信息,恰恰起到了信息导航的作用。通用搜索引擎就如同互联网第一次出现的门户网站一样,大量的信息整合导航,极快的查询,将所有网站上的信息整理在一个平台上供网民使用,于是信息的价值第一次普遍的被众多商家认可,迅速成为互联网中最有价值的领域。互联网的低谷由此演变为第二次高峰。大家熟知的搜索引擎Google、百度、雅虎等是通用搜索引擎现如今的杰出代,他们为互联网的发展做出了重要的贡献。然而,搜索引擎行业也不是一家公司就可以独撑天下的,从百度的上市、yahoo中国的并购一系列动作表明,如今的搜索引擎大战如同门户网站初期的竞争一样激烈。相信,通用搜索引擎在经历过一段时间的角逐后,也将会继续维持几大服务商各自分控一部分市场的局面。

    垂直搜索引擎概念的提出,就是针对性的为某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。可以简单的说成是搜索引擎领域的行业化分工。众多专业性网站、行业网站独立服务于互联网的成功,恰恰证明了互联网的格局应该是多方面的。通用搜索引擎的性质,决定了其不能满足特殊领域、特殊人群的精准化信息需求服务。市场需求多元化决定了搜索引擎的服务模式必将出现细分,针对不同行业提供更加精确的行业服务模式。可以说通用搜索引擎的发展为垂直搜索引擎的出现提供了良好的市场空间,势必将出现垂直搜索引擎在互联网中占据部分市场的趋势,也是搜索引擎行业细分化的必然趋势。

    1、垂直搜索引擎不是什么?

    垂直搜索不只是类google的行业通用搜索。以房产行业为例,如果我们按照google抓取网页的方式,来建造一个房产行业google的做法,是行不通的。技术壁垒不用解释,就算我们借助nutch,lucene等搜索技术来做,我们也无法提供差异化的服务,而没有差异化的产品在互联网赢家通吃的规则下是无法生存的,就是不要简单地模仿,而要想办法形成互补。

    垂直搜索和目前的google,baidu等通用搜索从定位,内容,用户,市场策略等都是不同的。所以垂直搜索不只是简单的行业google。

    用户使用google,baidu等通用搜索引擎的方式是通过关键字的方式实现的,是语义上的搜索,返回的结果倾向于知识成果,比如文章,论文,新闻等;垂直搜索也是提供关键字来进行搜索的,但被放到了一个行业知识的上下文中,返回的结果更倾向于信息,消息,条目等。对买房的人讲,他希望找的房子供求信息和文章,新闻等不同。这个特性是他们各自的的技术特点决定的。打个比方,如果google搜索引擎是一个正金字塔型,那么垂直搜索引擎就是个倒金字塔型,两者是互补的。

    2、垂直搜索是什么?

    我认为:垂直搜索的本质是对垂直门户信息提供方式的一次简化性的整合。

    搜索领域有句明言:就是用户无法描述道他要找什么,除非让他看到想找的东西,这个过程有点像找对象,碰运气是用户搜索行为的最大的特征。而垂直搜索引擎就是提高为用户提供更好的运气。

    垂直搜索是服务于某项功能的,比如:用户搜索租房,买房信息就是一种垂直搜索。对信息的再加工处理是非常关键的,不管是结构化的数据,还是非结构化的数据。

    3、垂直搜索的内容来源:

    A门户网站自身的资源

    B以开放接口方式让行业用户提供的资源

    C普通用户发布的资源

    D抓取行业用户的资源

    4、进入垂直搜索的门槛在那里?

    在互联网上说门槛,就是比资源。垂直搜索也是这样,能否提供全面权威的行业信息,能否拥有行业资源是垂直搜索引擎发展的门槛。换句化说,垂直门户是垂直搜索血统最近的父亲。作为房产行业的搜房网就是一个垂直门户,在房产领域没有谁比我们更清楚什么是垂直搜索了。

    垂直搜索的难点不是技术,而是用户参与门户网站行为的创新和垂直门户网站对产业上下游信息资源的整合。

    5、垂直搜索的特点:

    (1)、搜索是一个产业商业联盟的平台,一个集成产业链的上下游公司的搜索门户。

    (2)、垂直搜索的表现方式和google,baidu的表现方式不同,结构化的搜索和非结构化搜索并用。

    (3)、从广告模式上 提供了除 google adsense 和 百度竞价排名广告 之外的另一种可能。

    6、垂直搜索引擎的三个特点:

    (1)、垂直搜索引擎抓取的数据来源于垂直搜索引擎关注的行业站点:

    比如:找工作的搜索引擎 www.deepdo.com 的数据来源于:www.51job.com, www.zhaoping.com, www.chinahr.com 等等;

    股票搜索引擎 www.macd.cn 的数据来源于: www.jrj.com.cn, www.gutx.com 等股票站点;

    (2)、垂直搜索引擎抓取的数据倾向于结构化数据和元数据:

    比如:我们找工作关注的:

    职位信息: 软件工程师;

    公司名称,行业名称:软件公司,外包行业等;

    地点:北京,海淀;

    (3)、垂直搜索引擎的搜索行为是基于结构化数据和元数据的结构化搜索:

    比如: 找:海淀 软件工程师 的工作等。

    7、垂直搜索引擎站点的8条准则:

    1、选择一个好的垂直搜索方向。俗话说男怕选错行,这一点对于搜索引擎来说也是一样的,除了选择的这个行业有垂直搜索的大量需求外,这个行业的数据属性最好不要和

    Yahoo,Google等通用搜索的的抓取方向重叠。

    目前热门的垂直搜索行业有:购物,旅游,汽车,工作,房产,交友等行业。搜索引擎对动态url数据不敏感也是众所周知的,这些可以作为垂直搜索引擎的切入点;

    2、评价所选垂直搜索行业的网站、垂直搜索内容、行业构成等情况:

    我们都知道垂直搜索引擎并不提供内容来源,它的数据依赖爬虫搜集,并做了深度加工而来的。因此考虑垂直搜索引擎的所处的大环境和定位至关重要。

    3、深入分析垂直搜索引擎的索引数据特点:

    垂直搜索引擎的索引数据过于结构化,那么进入的门槛比较低,行业竞争会形成一窝蜂的局面;如果搜索数据特点是非结构化的,抓取,分析这样的数据很困难,进入壁

    垒太高,很可能出师未杰身先死。

    4、垂直搜索引擎的索引数据倾向于结构化数据和元数据,这个特点是区别于yahoo,google等通用搜索引擎的,这是垂直搜索引擎的立足点。而垂直搜索引擎是根植于某一个行业 ,因此行业知识,行业专家这些也是通用搜索引擎不具备的。也就是说进入垂直搜索是有门槛的。

    5、垂直搜索引擎的搜索结果要覆盖整个行业,搜索相关性要高于通用搜索引擎,贴近用户搜索意图,搜索结果要及时。

    6、垂直搜索引擎的web 2.0 需求:

    垂直搜索引擎的搜索数据由于带有结构化的天性,相对于通用搜索引擎的全文索引而言,更显的少而精。因此,设计的时候要提供收集用户数据的接口,同时提供tag,积

    分等机制,使搜索结果更加“垂直”。

    7、垂直搜索引擎的目标是帮助用户解决问题,而不只是向通用搜索引擎一样发现信息:

    这一点是垂直搜索引擎的终极目标。 在做垂直搜索引擎的时候你需要考虑:什么问题是这个行业内的特殊性问题,什么问题是一般性问题。keso多次提到google的目标是

    让用户尽快离开google,而垂直搜索引擎应该粘住用户。一般来说,使用垂直搜索引擎的用户都是和用户的利益需求密切相关的。所谓利益需求是我自己独创的,大意是和用户工作密切相关,生活中必不可少的需求,而求有持续性。比如:学生找论文,业主找装修信息等等这样的需求。因此粘住用户,让用户有反馈的途径是一个关键部分。

    8、垂直搜索引擎的社区化特征:

    这一条和第9条是相关的。

    俗话说物以类聚,人以群分,垂直搜索引擎定位于一个行业,服务于一群特定需求的人群,这个特点决定了垂直搜索的社区化行为。人们利用垂直搜索引擎解决问题,分享回馈。现在做网站都讲求社区化,所以垂直搜索引擎本质上还是:对垂直门户信息提供方式的一次简化性的整合。
    展开全文
  • 垂直搜索引擎研究 pdf

    2011-05-17 12:33:49
    垂直搜索引擎研究垂直搜索引擎研究垂直搜索引擎研究垂直搜索引擎研究
  • 垂直搜索引擎系统

    2016-01-12 15:47:54
    DDH垂直搜索引擎系统是一个Java实现的垂直搜索引擎系统,是一套整合了Nutch/UCI/SOLR的网络信息整合系统。借助DDH你可以快速构建多领域的垂直搜索引擎系统。目前DDH整合了Nutch2.2.1+UCI1.0+SOLR4。
  • 垂直搜索引擎的选型;网页库级垂直搜索引擎技术(二)如何做好一个垂直搜索引擎;信息抽取的资料文档
  • 什么是垂直搜索引擎? 搜索引擎的出现,整合了互联网上众多的网页资源,并提供信息导航和信息查询服务, 使信息的价值得到了网民和厂商的普遍认可。但是,搜索引擎的发展格局是多方面的,市场 需求的多元化也导致了...
  • 垂直搜索引擎的研究与设计.pdf垂直搜索引擎的研究与设计.pdf垂直搜索引擎的研究与设计.pdf垂直搜索引擎的研究与设计.pdf
  • 什么是垂直搜索引擎

    2016-11-08 13:00:38
    垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行...垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数

    转载自:http://blog.csdn.net/kaiyang45/article/details/49174333

    垂直搜索是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。

    垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取,也就是将网页的非结构化数据抽取成特定的结构化信息数据,好比网页搜索是以网页为最小单位,基于视觉的网页块分析是以网页块为最小单位,而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库,进行进一步的加工处理,如:去重、分类等,最后分词、索引再以搜索的方式满足用户的需求。

      整个过程中,数据由非结构化数据抽取成结构化数据,经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。

        垂直搜索引擎的应用方向很多,比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。

        举个例子来说明会更容易理解,比如购物搜索引擎,整体流程大致如下:抓取网页后,对网页商品信息进行抽取,抽取出商品名称、价格、简介……甚至可以进一步将笔记本简介细分成“品牌、型号、CPU、内存、硬盘、显示屏、……”然后对信息进行清洗、去重、分类、分析比较、数据挖掘,最后通过分词索引提供用户搜索、通过分析挖掘提供市场行情报告。

       垂直搜索引擎大体上需要以下技术

        1.Spider

        2.网页结构化信息抽取技术或元数据采集技术

        3.分词、索引

        4.其他信息处理技术

       垂直搜索引擎的技术评估应从以下几点来判断

        1.全面性

        2.更新性

        3.准确性

        4.功能性

      
    垂直搜索的进入门槛很低,但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的,绝对不要想像着招几个人就可以搞定垂直搜索的全部技术,作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。

    转载的其他相关文章:

    1、垂直搜索引擎不是什么?

    垂直搜索不只是类google的行业通用搜索。以房产行业为例,如果我们按照google抓取网页的方式,来建造一个房产行业google的做法,是行不通的。技术壁垒不用解释,就算我们借助nutch,lucene等搜索技术来做,我们也无法提供差异化的服务,而没有差异化的产品在互联网赢家通吃的规则下是无法生存的,就是不要简单地模仿,而要想办法形成互补。

    垂直搜索和目前的google,baidu等通用搜索从定位,内容,用户,市场策略等都是不同的。所以垂直搜索不只是简单的行业google。

    用户使用google,baidu等通用搜索引擎的方式是通过关键字的方式实现的,是语义上的搜索,返回的结果倾向于知识成果,比如文章,论文,新闻等;垂直搜索也是提供关键字来进行搜索的,但被放到了一个行业知识的上下文中,返回的结果更倾向于信息,消息,条目等。对买房的人讲,他希望找的房子供求信息和文章,新闻等不同。这个特性是他们各自的的技术特点决定的。打个比方,如果google搜索引擎是一个正金字塔型,那么垂直搜索引擎就是个倒金字塔型,两者是互补的。

    2、垂直搜索是什么?

    我认为:垂直搜索的本质是对垂直门户信息提供方式的一次简化性的整合。

    搜索领域有句明言:就是用户无法描述道他要找什么,除非让他看到想找的东西,这个过程有点像找对象,碰运气是用户搜索行为的最大的特征。而垂直搜索引擎就是提高为用户提供更好的运气。

    垂直搜索是服务于某项功能的,比如:用户搜索租房,买房信息就是一种垂直搜索。对信息的再加工处理是非常关键的,不管是结构化的数据,还是非结构化的数据。

    3、垂直搜索的内容来源:

    A门户网站自身的资源

    B以开放接口方式让行业用户提供的资源

    C普通用户发布的资源

    D抓取行业用户的资源

    微软亚洲研究院负责搜索的一名技术专家说:75%的内容通用搜索引擎搜索不出来。这里面包含2层含义:

    (1)网站结构不合理,网页对搜索引擎不友好;

    (2)由于信息在互联网是海量的,非结构化的信息需要经过结构化的梳理后才能更好的展现。 如果梳理者能提供搜索,那样会更好。而垂直门户网站就是行业信息最好的梳理者。 
    垂直搜索引擎提供的主要内容不应该局限于普通的网页索引,而且包括商业信息的加工,结构化的信息。

    4、进入垂直搜索的门槛在那里?

    在互联网上说门槛,就是比资源。垂直搜索也是这样,能否提供全面权威的行业信息,能否拥有行业资源是垂直搜索引擎发展的门槛。换句化说,垂直门户是垂直搜索血统最近的父亲。作为房产行业的搜房网就是一个垂直门户,在房产领域没有谁比我们更清楚什么是垂直搜索了。

    垂直搜索的难点不是技术,而是用户参与门户网站行为的创新和垂直门户网站对产业上下游信息资源的整合。

    5、垂直搜索的特点:

    (1)、搜索是一个产业商业联盟的平台,一个集成产业链的上下游公司的搜索门户。

    (2)、垂直搜索的表现方式和google,baidu的表现方式不同,结构化的搜索和非结构化搜索并用。

    (3)、从广告模式上 提供了除 google adsense 和 百度竞价排名广告 之外的另一种可能。

    6、垂直搜索引擎的三个特点:


    (1)、垂直搜索引擎抓取的数据来源于垂直搜索引擎关注的行业站点:

    比如:找工作的搜索引擎 www.deepdo.com 的数据来源于:www.51job.com , www.zhaoping.com 
    www.chinahr.com 等等;

    股票搜索引擎 www.macd.cn 的数据来源于: www.jrj.com.cn , www.gutx.com 
    等股票站点;

    (2)、垂直搜索引擎抓取的数据倾向于结构化数据和元数据:

    比如:我们找工作关注的:

    职位信息: 软件工程师;

    公司名称,行业名称:软件公司,外包行业等;

    地点:北京,海淀;

    (3)、垂直搜索引擎的搜索行为是基于结构化数据和元数据的结构化搜索:

    比如: 找:海淀 软件工程师 的工作等。

    7、垂直搜索引擎站点的8条准则:

    1、选择一个好的垂直搜索方向。俗话说男怕选错行,这一点对于搜索引擎来说也是一样的,除了选择的这个行业有垂直搜索的大量需求外,这个行业的数据属性最好不要和


    Yahoo,Google等通用搜索的的抓取方向重叠。

    目前热门的垂直搜索行业有:购物,旅游,汽车,工作,房产,交友等行业。搜索引擎对动态url数据不敏感也是众所周知的,这些可以作为垂直搜索引擎的切入点;

    2、评价所选垂直搜索行业的网站、垂直搜索内容、行业构成等情况:

    我们都知道垂直搜索引擎并不提供内容来源,它的数据依赖爬虫搜集,并做了深度加工而来的。因此考虑垂直搜索引擎的所处的大环境和定位至关重要。

    3、深入分析垂直搜索引擎的索引数据特点:

    垂直搜索引擎的索引数据过于结构化,那么进入的门槛比较低,行业竞争会形成一窝蜂的局面;如果搜索数据特点是非结构化的,抓取,分析这样的数据很困难,进入壁垒太高,很可能出师未杰身先死。

    4、垂直搜索引擎的索引数据倾向于结构化数据和元数据,这个特点是区别于yahoo,google等通用搜索引擎的,这是垂直搜索引擎的立足点。而垂直搜索引擎是根植于某一个行业 
    ,因此行业知识,行业专家这些也是通用搜索引擎不具备的。也就是说进入垂直搜索是有门槛的。

    5、垂直搜索引擎的搜索结果要覆盖整个行业,搜索相关性要高于通用搜索引擎,贴近用户搜索意图,搜索结果要及时。

    6、垂直搜索引擎的web 2.0 需求:

    垂直搜索引擎的搜索数据由于带有结构化的天性,相对于通用搜索引擎的全文索引而言,更显的少而精。因此,设计的时候要提供收集用户数据的接口,同时提供tag,积分等机制,使搜索结果更加“垂直”。

    7、垂直搜索引擎的目标是帮助用户解决问题,而不只是向通用搜索引擎一样发现信息:

    这一点是垂直搜索引擎的终极目标。在做垂直搜索引擎的时候你需要考虑:什么问题是这个行业内的特殊性问题,什么问题是一般性问题。keso多次提到google的目标是让用户尽快离开 google,而垂直搜索引擎应该粘住用户。一般来说,使用垂直搜索引擎的用户都是和用户的利益需求密切相关的。所谓利益需求是我自己独创的,大意是和用户工作密切相关,生活中必不可少的需求,而求有持续性。比如:学生找论文,业主找装修信息等等这样的需求。因此粘住用户,让用户有反馈的途径是一个关键部分。

    8、垂直搜索引擎的社区化特征:

    这一条和第9条是相关的。

    俗话说物以类聚,人以群分,垂直搜索引擎定位于一个行业,服务于一群特定需求的人群,这个特点决定了垂直搜索的社区化行为。人们利用垂直搜索引擎解决问题,分享回馈。现在做网站都讲求社区化,所以垂直搜索引擎本质上还是:对垂直门户信息提供方式的一次简化性的整合。

    搜索市场细分 Google、百度面临挑战

    百度上市后,搜索市场一下子热了起来。越来越多的企业围绕着搜索市场作起了文章。而且,在搜索大战的同时,一些企业也抛出了一些惊人言论。近日,记者从专业做人脉交际的联络家(www.linkist.com)技术总监冉征处了解到,联络家正在加紧研发人脉相关领域的专业垂直

    搜索引擎系统,比如工作招聘信息搜索引擎等,预计将在2005年底推出,联络家之所以涉足专业垂直搜索引擎领域,是看到未来垂直专业搜索引擎市场的巨大商机,他认为未来搜索市场将进一步细分,象Google、百度等主张大而全的全球式搜索引擎将会面临垂直专业搜索引擎更大的竞争与挑战,他们的市场分额将会被逐渐瓜分,专业的行业性垂直搜索将受到网民的青睐。

      那么缘何能得出如此结论呢?冉先生解释,CNNIC第十四次互联网调查显示,搜索以71.9%的绝对优势成为用户从互联网上获得信息的主要方式。几乎在全球所有的调查中,搜索引擎都是互联网上使用程度仅次于电子邮箱的服务,搜索引擎服务能成为最受欢迎的服务是因为他解决了用户在浩瀚的互联网海量快速定位信息屏颈问题,在海量的网页里找信息按照传统方式需要用户一个网站一个网站一级目录一级目录下找,要耗费大量的精力和时间,几乎是不可能实现的任务。但互联网的信息量呈爆炸趋势增长,几年前全球式搜索引擎收录的网页量只有几千万页,而现在已经达到几十亿页,数量增加带来的是搜索服务的品质下降,查询的结果集就是海量的,经常是几十万笔的资料,结果里存在大量的重复信息和垃圾信息,用户越来越难迅速的找到符合的信息,现在经常使用搜索引擎可以感觉到很难在短时间内准确的筛选出需要的内容,而垂直搜索引擎针对专业特定的领域或行业的内容做了专业和深入的分析挖掘,精细分类,过滤筛选等,信息定位更精准,因此在此垂直领域或行业提供的搜索服务势必更好更强,更为用户所欢迎。

    比如,对于一个网民来说如果有对特定的领域或行业的信息需求的时候,如果一个是专业的垂直搜索能做到精确锁定内容,但内容量偏小,而另一个是能检索出大量内容,但搜索到的内容一大部分都是“垃圾”并且很难找到符合的信息,这样的话,你会选择哪个呢,就如用户想购买一个商品,他是会去专门的比价购物搜索引擎上找还是会去Google上找,如果你想找一份工作,是会去专门的工作搜索引擎上找还是会去百度上找?答案很明显,更多的用户会舍弃后者,即使前者品牌小名声小,但结果往往是最令网民看重的。

      冉先生还象记者举了个简单的例子,联络家LINKIST一直做人脉交际圈的拓展,也就是现在炙手可热的SNS网站,SNS网站的目的就是要建立一个庞大的人脉圈,参与其中的人都能通过站内人脉的搜索引擎找到自己想找的人,可以找工作、搜罗人才、寻找合作商机。联络家LINKIST短短几个月的时间已经聚敛起了近7万多位高级商务人士。有了一定的用户基础做铺垫,联络家LINKIST目前大力开发人脉专业领域的垂直搜索引擎,如工作搜索引擎的人脉搜索引擎,而这比以往的“贴简历、翻招聘信息”的机械作法要灵活的多。

      而且,能做出这样的预测显然并不是空穴来风。据记者了解,现在搜索市场大量的的垂直专业搜索引擎的诞生如雨后春笋般,如比价购物搜索引擎,工作搜索引擎,博客搜索引擎等等,占了百度几乎一半以上的流量的MP3搜索,其实也可以说是专业的搜索MP3的垂直搜索引擎,许多垂直门户也纷纷推出了自己的搜索引擎系统。

      记者获悉,之前刚从

    网易内容总监职位上辞职后创业的李学凌也作起了针对博客内容的搜索引擎,这也表露出,垂直搜索引擎的市场正在孕育过程中,既是机会又存在着挑战,其赢利模式也已经在Google、百度等身上得到了验证。而且,很多风险投资(VC)对搜索的概念已经认可并下了赌注。

      那么,象Google、百度能会不会通过“补课”挤掉这部分专用搜索市场呢?冉先生对记者表示,Google、百度注定了走的是大而全的粗犷路线,而专用的垂直搜索引擎则不同,需要对做内容的深度挖掘,做精细的分类,构建专业领域的知识库体系等等,而这些都是Google、百度等无法做到的,他们根本就没有精力做这些,也不可能针对每个行业领域都能做透,“术业有专攻”就是这个道理。

      就象门户网站与专业垂直的行业性网站可以共存一样,网民也有不同的胃口,有的仅仅是简单模糊的信息就已经满足了,而一些寻找精确内容的网民则更青睐于专业引擎,比如你打算换一份工作,以前去人才招聘网站贴简历往往都尿杳无音信,现在,就可以去联络家LINKIST试试,还能跟同行的朋友交换下最新的行业信息,探讨下行业发展趋势。而且,以后联络家LINKIST推出人脉引擎后,只需轻轻点击便能收获颇丰。
      有专家预测,未来,专业的垂直搜索将掀起一轮热潮,而且,垂直搜索引擎不会是一个简单的文本框、一个按纽就走遍天下了,更需要专业的信息辅助和配套的增值内容的支持,也就是对相关内容的二次“加工”。而这恰恰是Google、百度类所不能提供的。相信,届时很多VC的眼球会聚焦于此,而Google、百度又将面临怎样的挑战呢?我们只能拭目以待了。

    要了解垂直搜索引擎,就要同大家熟知的横向搜索引擎即通用搜索引擎来做对比。目前互联网领域主要的搜索引擎服务商如yahoo、百度、google 等,为用户提供的都是横向的海量信息搜索。他们可以满足大量信息的横向搜索、提供,但很难兼顾搜索的准确度与相关度的质量。通用搜索引擎的价值在于在做大量的信息导航,对于信息需求相对集中、分类更加详细的行业客户缺乏导向。垂直搜索引擎的产生正是有效的解决了以上通用搜索引擎无法满足的市场需求。

    垂直搜索指搜索引擎为用户提供的并不是上百甚至上千万相关网页,而是范围极为缩小、极具针对性的具体信息。换言之,搜索引擎收集的是市场空间中某一“市场利基”的数据,如工作、旅游、高端房地产等。这样的信息不但更加易于为用户所消化,而且也更有深度。

    Google、雅虎、MSN这几大搜索引擎巨头主宰着互联网搜索市场,全球大多数网民 都是通过这几大搜索引擎查找自己所需的信息的。但在查找一些具体信息时,这几大搜索引擎的表现却并不尽如人意。有时候用户得到的是往往是和他们的查询本意 
    风马牛不相及的结果。对拉近用户及其所需信息之间的距离的需求催生并促进了搜索行业的利基发展。垂直搜索引擎瞄准的正是搜索市场中的不同利基市场。

    利基是Niche这一英文名词的译称,利基市场指市场中通常为大企业忽略的某些细分市场;而利基市场战略则指企业通过专业化经营来占领这些市场,从 
    而最大限度的获取收益所采取的策略。实施利基战略的重要意义在于:进行市场利基的公司事实上已经充分了解了目标顾客群,因而能够比其他公司更好、更完善地 
    满足消费者的需求。并且,市场利基者可以依据其所提供的附加价值收取更多的利润额。总之,市场利基者获得的是“高边际收益”,而密集市场营销者获得的只是“高总量收益”。

    分析家认为:利基搜索市场和强大的在线广告市场之间有着密切的联系。管理者可以象Google和雅虎那样利用搜索结果页面运作广告,即在搜索结果页面上提供一定的定向文本广告。这种广告策略已被视作搜索行业的一个盈利渠道。

    对于垂直搜索引擎来说,由于数据源得到了详细划分,使得对这些数据进行操作,并将其通过简单易用、消费方便的方式表现出来变成可能。此外,以往的两种网络广告“每千次展示成本”和“每点击付费(CPC)”这两种广告方式上存在着效率低下,广告费用风险高的问题,这也正是垂直搜索被看好的一个主要原因。垂直搜索能够提供更为集中的受众群体,从而提高搜索引擎广告的宣传能力。同时,垂直搜索也能够有效推动新的广告商机的发展――我们姑且称之为“每行动成本”。这种广告方式不限广告投放量,按照广告投放的实际效果,即按潜在客户回应行动计费。

    展开全文
  • 浅谈垂直搜索引擎技术

    千次阅读 2016-05-13 11:34:36
    在搜索引擎成为web2.0发展的一道风景线的今天,为信息查找提供更有时效性、针对性、准确性的垂直搜索引擎越来越受到网络用户的青睐。本论文以垂直搜索为主题,介绍搜索引擎的发展及其现状,对比通用搜索引擎和垂直...

             在搜索引擎成为web2.0发展的一道风景线的今天,为信息查找提供更有时效性、针对性、准确性的垂直搜索引擎越来越受到网络用户的青睐。本论文以垂直搜索为主题,介绍搜索引擎的发展及其现状,对比通用搜索引擎和垂直搜索引擎的优缺点,论述了垂直搜索引擎技术及其发展潜力。 

             Internet的发展,给人类社会带来了翻天覆地的变化,将人类文明推向一个新的高度的同时,也给人类提供了无限的商机。它的到来,使信息技术成为当今世界各国发展的主题。Internet的普及,网民的数量的猛增,web资源的指数般增加,激励着人们探索新的突破。以服务大众出名的通用搜索引擎为我们指引了方向。它们为无数的网民提供了从无底的web中寻找资源,然而,随着Internet的发展,通用搜索引擎有时很难在庞大的信息库中搜索到准确的信息。它的缺陷,给垂直搜索引擎提供发展的空间,以及无限的潜力。垂直搜索的出现,便是对通用搜索引擎的补充,未来的时间里,它将与通用搜索引擎相辅相成,服务人类的同时,共享新的金矿。

    一、什么是搜索引擎

            所谓搜索引擎,是指在Internet下,网站根据用户输入的查询条件(关键字),自动从web资源里提取出与用户输入条件相关的信息的一类网站。搜索引擎以一定的策略在互联网中搜集、发现信息,对信息进行理解、提取、组织和处理,并为用户提供检索服务,从而达到信息导航的目的

            随着Google(谷歌)、baidu(百度)等搜索引擎在Internet上的经营的成功,越来越多的IT企业开始进军搜索市场,经过IT精英们的不断开拓新领域,创造新价值。搜索引擎从广义上可以将其划分为通用搜索引擎和垂直搜索引擎。

    二、通用搜索引擎与垂直搜索引擎的对比

            随着网络的发展,它一方面让我们更容易的获取到信息,另一方面,信息的爆炸发展,也彻头彻尾地将我们陷入了无边无际的信息海洋之中。在如此海量的信息页面之前,我们想要找到自己需要的信息简直就是大海捞针。搜索引擎的横空出世让我们有了探索信息海洋的指南针。

    1、通用搜索引擎的最大优点是,实现全文搜索,检索到的信息量大,信息覆盖范围广,同时引擎更新信息速度快。根据辩证的思想,最大优点下,也隐藏着最大的缺点,目                前Internet上搜索引擎可索引到的网页数量已超过110亿页,由于通用搜索引擎搜索范围的广,导致搜索的匹配度低,命中率低,层次结构不清洗,而且重复连接较多,查询结果信息量大,用户很难在海量的链接结果中找到想要的信息。

    2、垂直搜索引擎是针对某一个特定行业的专业搜索引擎, 是通用搜索引擎的细分和延伸, 是对网页库中的某类专门的信息进行一次整合, 定向分字段抽取出需要的数据进行处理后          再以某种形式返回给用户。垂直搜索引擎是相对通用搜索引擎的信息量大、查询不准确、深度不够等提出来的新的搜索引擎服务模式,通过针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是专、精、深,且具有行业色彩,相比较通用搜索引擎的海量信息无序化,垂直搜索引擎则显得更加专注、具体和深入。

       三、垂直搜索引擎的原理及组成

             搜索引擎的主要由搜索器、索引器、检索器组成。基本原理和主要功能组件方面,垂直搜索引擎与通用搜索引擎基本相同。两者主要的区别在于Spider爬行范围和网页信息处理深度两方面。通用搜索引擎Spider爬行的范围是面向几乎所有网页,而垂直搜索只爬行跟主题相关的网页。因此,垂直搜索引擎能够比通用搜索引擎更快速的找到相关主题的信息。

             搜索器(Spider):也称网络蜘蛛、网络机器人等,是搜索引擎的灵魂。它根据特定算法负责抓取网页,从抓取到的网页里采集信息,对信息进行分词,分词根据词语的特殊属性选择分词算法,并将信息与其关联的URL保存进服务器数据库。搜索器必须保证及时的发现新网页,定时的重新采集已有网页信息更新保存数据库数据。

             索引器(Indexer):根据搜索器,即网络蜘蛛采集后经过分词等处理后产生的关键字(keyword),建立从关键字到网页URL(统一资源定位器)的关系索引倒排文档,即建立索引数据库。检索器的功能是根据用户输入的查询词,在索引数据库中进行查询词与索引数据库的匹配算法,然后将查询结果按相关程度排序并输出到浏览器上。

             除了考虑核心的技术外,虚拟主机用高效的算法外,必须在用户体验上下功夫如结构化的显示搜索到的结果。比如,Google所使用的Ajax(异步JavaScript)技术,用户输入查询时能够自动提示,还有Google查询后显示的数据,界面上字体等要比Baidu细致一个档次。这些细节的原因,某种程度关系到搜索引擎在市场的占有额。

       四、垂直搜索引擎的相关技术

       1、页面解析与页面显示排序

             网页地址都是用URLUniformResource Locator统一资源定位器)来表示,获取网页信息,必须找到URL,读取该URL页面的HTML、特定标签,高级的搜索引擎还能对JavaScript语句进行解析。这是因为许多网站直接用JavaScript构建出来,而且随着Ajax技术的流行,很多信息包含在JavaScript标签里,为了提高采集信息的准确率,提高搜索引擎的竞争力,搜索引擎必须提供JavaScript解析器。

             页面排序是针对根据用户关键字,查询到的网页列表,采用何种策略将网页列表显示在用户面前,使用户最想知道的结果显示在最前面页数发生的概率最大。主要的算法有:PageRank算法、HITS算法。在排序上,有些搜索引擎(如百度),则加入收费这一方式,使排序成为搜索引擎的一大盈利模式。

    2、数据存储及分布式技术

            尽管垂直搜索引擎保存的网页数量相对通用垂直搜索引擎小很多,但是,作为一个优秀的商业垂直搜索引擎,必须在提高性能的同时减低成本,提升竞争力。可以采用数据压缩的技术对数据进行压缩存储,采用数据库技术,如索引等提高数据读取速度,可以采用分布式技术,通过多台服务器相互合作,以提高数据采集和更新速度。

    3、网络蜘蛛的爬行策略

             网络蜘蛛(RobotSpider)的搜索策略是指当网络蜘蛛搜索到一个文档之后,下一步应该转移到哪一个文档的方法问题。目前比较常见的搜索策略有以下几种策略:(1IP地址搜索策略。(2)深度优先搜索策略。(3)广度优先搜索策略。(4)深度-广度结合搜索策略。

    4、中文分词技术

      在Web应用中,文本处理的速度往往是性能的关键,快速分词具有很大的现实意义。Web文本分词是Web信息处理的基础,如信息检索、摘要形成、网页过滤等都需要对Web文本进行分词处理。Web文本的正文主要是由英文和中文构成,由于英文的单词与单词之间有空格,所以不存在分词问题。而中文的每一句中词与词之间是没有空格的,因而必须采用某种技术将其分开。

      分词的方法很多,基本上分为两类:第一类是基于字符串的匹配:将汉字串与一个机器词典中的词条进行匹配,若在词典中找到某个字符串,则匹配成功。主要有正向最大匹配法、逆向最大匹配法、最少切分等方法。第二类是基于统计的方法:从概率角度出发,单字出现在词汇中联合概率是比较大的,因此当相邻的字越常出现,则越有可能是一个词。基于上述引,对处理的材料进行分析,得到相应的单字出现的概率,然后对相邻的字出现概率进行统计,若远大于单字出现的概率之和,则可能成为一个词。实际应用中,统计分词方法都是与字典结合着来使用的,这样既发挥匹配分词的切分速度快、效率高的特点,对利用了无词典结合上下文识别生词,并能消除歧义等优点。

    五、垂直搜索引擎的发展空间

             “确解用户之意,切返用户之需用户无法描述道他要找什么,除非让他看到想找的东西,这是消费者(网络使用者)对搜索引擎提出的更高要求。以尽可能多的收集到与专业相关的信息为主要目标的垂直搜索引擎,比通用垂直搜索引擎在Internet上更加贴切消费者的要求。专业化的集中特定领域的垂直搜索引擎有效地弥补了综合性搜索引擎对专门领域及特定主题信息覆盖率过低的问题。市场需求的多元化,决定着搜索引擎服务的多元化;通用搜索引擎开拓市场上的成功,为垂直搜索引擎的市场战略提供了宝贵的借鉴经验,垂直搜索引擎的特点,决定着它在Internet上占有一席之地,必将成为搜索行业的一大力量。
    展开全文
  • Deep+Web垂直搜索引擎设计与实现.pdfDeep+Web垂直搜索引擎设计与实现.pdfDeep+Web垂直搜索引擎设计与实现.pdfDeep+Web垂直搜索引擎设计与实现.pdf
  • 垂直搜索引擎网络爬虫的研究与实现.pdf垂直搜索引擎网络爬虫的研究与实现.pdf垂直搜索引擎网络爬虫的研究与实现.pdf垂直搜索引擎网络爬虫的研究与实现.pdf
  • 基于Java的垂直搜索引擎的设计与实现.pdf基于Java的垂直搜索引擎的设计与实现.pdf基于Java的垂直搜索引擎的设计与实现.pdf基于Java的垂直搜索引擎的设计与实现.pdf
  • 垂直搜索引擎大观

    千次阅读 2010-07-24 00:31:00
    垂直搜索引擎大观
  • 垂直搜索引擎目录

    2010-04-23 10:54:42
    购物垂直搜索引擎 垂直搜索和通用搜索的区别  垂直搜索引擎是针对某一个行业的专业搜索引擎,是搜索引擎的细分和延伸,是对网页库中的某类专门的信息进行一次整合,定向分字段抽取出需要的数据进行处理后...
  • 垂直搜索引擎的选型[原创]http://FullSearch.Com 中文全文检索网 2006-3-16 10:21:01 sigz 关键词:垂直搜索引擎
  • 垂直搜索引擎总结

    2010-08-11 10:31:02
    什么是垂直搜索引擎? 垂直搜索引擎是针对某一行业的搜索引擎,是搜索引擎的细化和延伸,是对网页库中的某类信息进行一次整合,定向分字段抽取出所需要的数据,再进行二次处理和索引,最后根据用户提交的请求,返回...
  • 如何做好一个垂直搜索引擎[原创]http://FullSearch.Com 中文全文检索网 2006-3-3 8:00:41 sigz 关键词:垂直搜索技术 垂直搜索 垂直搜索引擎
  • 垂直搜索引擎 nutch

    千次阅读 2008-11-05 22:08:00
    垂直搜索引擎能否赢得市场? 垂直搜索引擎为用户提供的并不是上百甚至上千万相关网页,而是范围极为缩小、极具针对性的具体信息。因此,特定行业的用户更加青睐垂直搜索引擎,是垂直搜索引擎的长期、稳定的群体。 ...
  • 1.何为垂直搜索引擎所谓垂直搜索引擎(Vertical Search Engine),是针对某一特定领域、某一特定人群或某一特定需求提供的有一定价值的信息和相关服务。其特点就是“专、精、深”,且具有行业色彩。它是与通用搜索...
  • 奥搜垂直搜索引擎 v6.0标准版 奥搜垂直搜索引擎 v6.0标准版
  • 构建垂直搜索引擎 本课程带领大家实现一个简单的垂直搜索引擎网站,使用nodejs、python、elasticsearch实现的。

空空如也

空空如也

1 2 3 4 5 ... 20
收藏数 40,067
精华内容 16,026
关键字:

垂直搜索引擎