技术含量在于
1.如果根据需求,过往经验,存在困难,可用代码,从无到有构思,想象,或是搭建一个系统。做到快速的,有预见的,可扩展的,好维护的。
2.如何把宏伟的计划变成分先分后的简单任务,包括用修真的态度营造真实的需求。如何用常见简单代码和习惯方式从本质上解决问题。
3.如何把思路走出来的系统,需求改出来的系统,变成若干领域概念,最终把需求实现抽象化,概念化,精简化。
中国谷歌模仿酷讯推出生活搜索,一度吸引了媒体和用户对于所谓“垂直搜索”的关注。有观者认为,在百度、中国谷歌和雅虎通吃将近九成的网络搜索份额之后,搜索市场的迟到者或许可以在“垂直搜索”中分到一杯羹。
然而,由于定义的模糊,垂直搜索在不同人那里指称着不同的事物,许多搜索行业的外行,甚至可以向风险资本家冒充自己搞的是“垂直搜索”,和百度不是一路,但“钱景”十分光明。
笔者认为,除了目前搜索技术的限制、可以按照信息媒体类型进行垂直的划分之外,其他的垂直搜索不是要么是和搜索本意背道而驰,要么就根本不是搜索。
何谓搜索?搜索就是从海量的互联网信息中寻找到自己需要的内容,其两个特点一是信息海量,二是信息非结构化,即这些信息都以网页、语音、图片等各种离散形式存在,还不是保存在许多IT业者所梦想的XML文件中。
由于图像、视频识别技术远未成熟,音频的文本化尚未普及(技术已经存在),今天的搜索引擎不得不分为网页搜索、视频搜索、音乐、图片搜索等类型。在OpenV等的技术之下,视频中的音频信息可以转换为可以搜索的文本,那么视频只不过是网页搜索中的一种。举例说,如果您想知道一种婴儿用药的注意事项,如果一个专家刚好在央视2套的一个节目中进行了详细的解答,这个视频不也是您所希望看到的呢?
媒体类型的分类是不得以而为之,而其他按照网页内容进行的搜索分类则是画蛇添足,纯属添乱。搜索就是要搜几十亿张网页的海量信息,如果按照“论坛”、“百科”、“博客”等人为类别把五十亿张网页分为五类、十类,然后推出五个、十个搜索产品、让用户点击五次、十次,则完全是背道而驰、浪费用户时间的行为。
由此看来,按照内容进行划分的所谓“垂直搜索”是一个非常误导的概念,降低了搜索效率,祸害无穷。
今天,还有一种所谓的“搜索”也被贴上了“垂直搜索”的标签,最典型的是火车票和机票。在笔者看来,这些业务根本就不是搜索,而只是检索。判断依据就是所查询的信息是不是海量,信息是不是结构化。
火车车次,航班班次(含折扣价)的数据是有限的,而且发生变动的频率也就是一年一两次,其信息量远远未到可供“搜索”的地步。从国内网站来看,提供火车票、机票搜索的网站不计其数,其差别不是检索技术的高低,而是数据库更新是不是及时。
从技术角度来看,在获得权威数据库之后,开发一个基于SQL语句的WEB查询功能只需要几个工作日的时间,和布林佩奇和李彦宏做的搜索可谓天壤之别。当然,一个SQL开发高手想到百度谋得一职也是幻想。
技术开发十分简单的本质原因,是因为机票车票这些信息都是结构化的,检索过程可以依赖现有技术,而不用自行开发极度复杂的HTML文本搜索技术。
诸如火车票机票的专业查询还有很多,比如医学方面的病历查询,警方所用的在逃犯检索,以及网上零售网站的商品检索。这些都不是现代意义上的搜索引擎,称之为“垂直搜索”可能是想沾点搜索引擎的“时髦”。
综上所述,在目前这一代的搜索技术之下,我们暂且按照信息媒体的类型来对搜索分类,这种分类谈不上所谓的“垂直化”。而许多号称“垂直搜索”的服务其实是毫无技术含量的“检索”。
需要强调的是,搜索的目标是用复杂的算法和分布式计算技术从海量非结构化信息中找出用户最想要的东西。迟来的搜索业者如果对于“算法”和“计算”没有自信,就干脆不要把海量信息的分门别类当成自己的事业,美国Google和中国百度的进步迟早会让这种低技术含量的工作变成无用功。
//p评论:
说白了。baidu,google,yahoo都算上。如果假设把它们搜集的网页数量缩小1亿倍。也就是说。我们可以假设它只给10篇网页作了搜索的话。我们可以得出一个结论:这些所谓的搜索,只是给网页编制了一个倒索引而已。通俗的讲,就是给字典作了一个拼音部首索引。一点也没什么神秘。神秘的是:数据量,存储量,成本,技术难度,无可借鉴性。还有就是商业形式的成功已否。酷讯如果超过baidu呐,那也不是不可能。
这涉及到一个信息的切块问题。平面和垂直本是现实存在的事物逻辑。我们没必要认定google是搜索。我检索1000个网站就不是搜索。
原文的作者对行业,对技术,对架构缺乏必要的了解。===============原文======================
中国谷歌模仿酷讯推出生活搜索,一度吸引了媒体和用户对于所谓“垂直搜索”的关注。有观者认为,在百度、中国谷歌和雅虎通吃将近九成的网络搜索份额之后,搜索市场的迟到者或许可以在“垂直搜索”中分到一杯羹。
然而,由于定义的模糊,垂直搜索在不同人那里指称着不同的事物,许多搜索行业的外行,甚至可以向风险资本家冒充自己搞的是“垂直搜索”,和百度不是一路,但“钱景”十分光明。
笔者认为,除了目前搜索技术的限制、可以按照信息媒体类型进行垂直的划分之外,其他的垂直搜索不是要么是和搜索本意背道而驰,要么就根本不是搜索。
何谓搜索?搜索就是从海量的互联网信息中寻找到自己需要的内容,其两个特点一是信息海量,二是信息非结构化,即这些信息都以网页、语音、图片等各种离散形式存在,还不是保存在许多IT业者所梦想的XML文件中。
由于图像、视频识别技术远未成熟,音频的文本化尚未普及(技术已经存在),今天的搜索引擎不得不分为网页搜索、视频搜索、音乐、图片搜索等类型。在OpenV等的技术之下,视频中的音频信息可以转换为可以搜索的文本,那么视频只不过是网页搜索中的一种。举例说,如果您想知道一种婴儿用药的注意事项,如果一个专家刚好在央视2套的一个节目中进行了详细的解答,这个视频不也是您所希望看到的呢?
媒体类型的分类是不得以而为之,而其他按照网页内容进行的搜索分类则是画蛇添足,纯属添乱。搜索就是要搜几十亿张网页的海量信息,如果按照“论坛”、“百科”、“博客”等人为类别把五十亿张网页分为五类、十类,然后推出五个、十个搜索产品、让用户点击五次、十次,则完全是背道而驰、浪费用户时间的行为。
由此看来,按照内容进行划分的所谓“垂直搜索”是一个非常误导的概念,降低了搜索效率,祸害无穷。
今天,还有一种所谓的“搜索”也被贴上了“垂直搜索”的标签,最典型的是火车票和机票。在笔者看来,这些业务根本就不是搜索,而只是检索。判断依据就是所查询的信息是不是海量,信息是不是结构化。
火车车次,航班班次(含折扣价)的数据是有限的,而且发生变动的频率也就是一年一两次,其信息量远远未到可供“搜索”的地步。从国内网站来看,提供火车票、机票搜索的网站不计其数,其差别不是检索技术的高低,而是数据库更新是不是及时。
从技术角度来看,在获得权威数据库之后,开发一个基于SQL语句的WEB查询功能只需要几个工作日的时间,和布林佩奇和李彦宏做的搜索可谓天壤之别。当然,一个SQL开发高手想到百度谋得一职也是幻想。
技术开发十分简单的本质原因,是因为机票车票这些信息都是结构化的,检索过程可以依赖现有技术,而不用自行开发极度复杂的HTML文本搜索技术。
诸如火车票机票的专业查询还有很多,比如医学方面的病历查询,警方所用的在逃犯检索,以及网上零售网站的商品检索。这些都不是现代意义上的搜索引擎,称之为“垂直搜索”可能是想沾点搜索引擎的“时髦”。
综上所述,在目前这一代的搜索技术之下,我们暂且按照信息媒体的类型来对搜索分类,这种分类谈不上所谓的“垂直化”。而许多号称“垂直搜索”的服务其实是毫无技术含量的“检索”。
需要强调的是,搜索的目标是用复杂的算法和分布式计算技术从海量非结构化信息中找出用户最想要的东西。迟来的搜索业者如果对于“算法”和“计算”没有自信,就干脆不要把海量信息的分门别类当成自己的事业,美国Google和中国百度的进步迟早会让这种低技术含量的工作变成无用功。
网游服务是什么,说成云是客户端索取相关数据,站在这个角度来说有什么技术含量呢?跟客户端读本地文件一样都是读取数据而已。从客户端到服务器,到数据库,到n多个服务器,这里的技术含量是,对于客户端来说只是获取数据而已,如果忽略如何获取的问题?云的概念是忽略掉如何获取的问题提供给客户端相关的数据。即使客户可以闭上眼睛不去想这个问题,作为实现的技术员是绝对绕不开这个问题。客户端通往数据的路有很多,这里的技术已经不在是有或没有路的问题,而是走那条路的问题。假设我们有5种连接服务器的方式,有5种访问数据库的方式,那么我们有25种方式,你会说把这个25种方式都实现比较下效率不就知道了吗?这25种方式每做一个方案需要1年那么共需要25年?那么无论是第一年获取了最快的还是最后一年得到了最快的,结果都将在25年后得到。因为不做完最后一个方案永远不知道这25个方案哪个是最快的,技术的价值就在如何从25个方案中推算出最快的或较快的,不必等到25年后得到答案。
技术含量在于
1.如果根据需求,过往经验,存在困难,可用代码,从无到有构思,想象,或是搭建一个系统。做到快速的,有预见的,可扩展的,好维护的。
2.如何把宏伟的计划变成分先分后的简单任务,包括用修真的态度营造真实的需求。如何用常见简单代码和习惯方式从本质上解决问题。
3.如何把思路走出来的系统,需求改出来的系统,变成若干领域概念,最终把需求实现抽象化,概念化,精简化。
转载于:https://www.cnblogs.com/baozhu/p/8895529.html