精华内容
下载资源
问答
  • 然而,由于定义模糊,垂直搜索在不同人那里指称着不同事物,许多搜索行业外行,甚至可以向风险资本家冒充自己搞是“垂直搜索”,和百度不是一路,但“钱景”十分光明。 笔者认为,除了目前搜索

    中国谷歌模仿酷讯推出生活搜索,一度吸引了媒体和用户对于所谓“垂直搜索”的关注。有观者认为,在百度、中国谷歌和雅虎通吃将近九成的网络搜索份额之后,搜索市场的迟到者或许可以在“垂直搜索”中分到一杯羹。

      然而,由于定义的模糊,垂直搜索在不同人那里指称着不同的事物,许多搜索行业的外行,甚至可以向风险资本家冒充自己搞的是“垂直搜索”,和百度不是一路,但“钱景”十分光明。

      笔者认为,除了目前搜索技术的限制、可以按照信息媒体类型进行垂直的划分之外,其他的垂直搜索不是要么是和搜索本意背道而驰,要么就根本不是搜索。

      何谓搜索?搜索就是从海量的互联网信息中寻找到自己需要的内容,其两个特点一是信息海量,二是信息非结构化,即这些信息都以网页、语音、图片等各种离散形式存在,还不是保存在许多IT业者所梦想的XML文件中。

      由于图像、视频识别技术远未成熟,音频的文本化尚未普及(技术已经存在),今天的搜索引擎不得不分为网页搜索、视频搜索、音乐、图片搜索等类型。在OpenV等的技术之下,视频中的音频信息可以转换为可以搜索的文本,那么视频只不过是网页搜索中的一种。举例说,如果您想知道一种婴儿用药的注意事项,如果一个专家刚好在央视2套的一个节目中进行了详细的解答,这个视频不也是您所希望看到的呢?

      媒体类型的分类是不得以而为之,而其他按照网页内容进行的搜索分类则是画蛇添足,纯属添乱。搜索就是要搜几十亿张网页的海量信息,如果按照“论坛”、“百科”、“博客”等人为类别把五十亿张网页分为五类、十类,然后推出五个、十个搜索产品、让用户点击五次、十次,则完全是背道而驰、浪费用户时间的行为。

      由此看来,按照内容进行划分的所谓“垂直搜索”是一个非常误导的概念,降低了搜索效率,祸害无穷。

      今天,还有一种所谓的“搜索”也被贴上了“垂直搜索”的标签,最典型的是火车票机票。在笔者看来,这些业务根本就不是搜索,而只是检索。判断依据就是所查询的信息是不是海量,信息是不是结构化。

      火车车次,航班班次(含折扣价)的数据是有限的,而且发生变动的频率也就是一年一两次,其信息量远远未到可供“搜索”的地步。从国内网站来看,提供火车票、机票搜索的网站不计其数,其差别不是检索技术的高低,而是数据库更新是不是及时。

      从技术角度来看,在获得权威数据库之后,开发一个基于SQL语句的WEB查询功能只需要几个工作日的时间,和布林佩奇和李彦宏做的搜索可谓天壤之别。当然,一个SQL开发高手想到百度谋得一职也是幻想。

      技术开发十分简单的本质原因,是因为机票车票这些信息都是结构化的,检索过程可以依赖现有技术,而不用自行开发极度复杂的HTML文本搜索技术。

      诸如火车票机票的专业查询还有很多,比如医学方面的病历查询,警方所用的在逃犯检索,以及网上零售网站的商品检索。这些都不是现代意义上的搜索引擎,称之为“垂直搜索”可能是想沾点搜索引擎的“时髦”。

      综上所述,在目前这一代的搜索技术之下,我们暂且按照信息媒体的类型来对搜索分类,这种分类谈不上所谓的“垂直化”。而许多号称“垂直搜索”的服务其实是毫无技术含量的“检索”。

      需要强调的是,搜索的目标是用复杂的算法和分布式计算技术从海量非结构化信息中找出用户最想要的东西。迟来的搜索业者如果对于“算法”和“计算”没有自信,就干脆不要把海量信息的分门别类当成自己的事业,美国Google和中国百度的进步迟早会让这种低技术含量的工作变成无用功。 

    展开全文
  • 如果假设把它们搜集网页数量缩小1亿倍。也就是说。我们可以假设它只给10篇网页作了搜索话。我们可以得出一个结论:这些所谓搜索,只是给网页编制了一个倒索引而已。通俗讲,就是给字典作了一个拼音部首索引...

    //p评论:

    说白了。baidu,google,yahoo都算上。如果假设把它们搜集的网页数量缩小1亿倍。也就是说。我们可以假设它只给10篇网页作了搜索的话。我们可以得出一个结论:这些所谓的搜索,只是给网页编制了一个倒索引而已。通俗的讲,就是给字典作了一个拼音部首索引。一点也没什么神秘。神秘的是:数据量,存储量,成本,技术难度,无可借鉴性。还有就是商业形式的成功已否。酷讯如果超过baidu呐,那也不是不可能。
    这涉及到一个信息的切块问题。平面和垂直本是现实存在的事物逻辑。我们没必要认定google是搜索。我检索1000个网站就不是搜索。
    原文的作者对行业,对技术,对架构缺乏必要的了解。

    ===============原文======================

    中国谷歌模仿酷讯推出生活搜索,一度吸引了媒体和用户对于所谓“垂直搜索”的关注。有观者认为,在百度、中国谷歌和雅虎通吃将近九成的网络搜索份额之后,搜索市场的迟到者或许可以在“垂直搜索”中分到一杯羹。

      然而,由于定义的模糊,垂直搜索在不同人那里指称着不同的事物,许多搜索行业的外行,甚至可以向风险资本家冒充自己搞的是“垂直搜索”,和百度不是一路,但“钱景”十分光明。

      笔者认为,除了目前搜索技术的限制、可以按照信息媒体类型进行垂直的划分之外,其他的垂直搜索不是要么是和搜索本意背道而驰,要么就根本不是搜索。

      何谓搜索?搜索就是从海量的互联网信息中寻找到自己需要的内容,其两个特点一是信息海量,二是信息非结构化,即这些信息都以网页、语音、图片等各种离散形式存在,还不是保存在许多IT业者所梦想的XML文件中。

      由于图像、视频识别技术远未成熟,音频的文本化尚未普及(技术已经存在),今天的搜索引擎不得不分为网页搜索、视频搜索、音乐、图片搜索等类型。在OpenV等的技术之下,视频中的音频信息可以转换为可以搜索的文本,那么视频只不过是网页搜索中的一种。举例说,如果您想知道一种婴儿用药的注意事项,如果一个专家刚好在央视2套的一个节目中进行了详细的解答,这个视频不也是您所希望看到的呢?

      媒体类型的分类是不得以而为之,而其他按照网页内容进行的搜索分类则是画蛇添足,纯属添乱。搜索就是要搜几十亿张网页的海量信息,如果按照“论坛”、“百科”、“博客”等人为类别把五十亿张网页分为五类、十类,然后推出五个、十个搜索产品、让用户点击五次、十次,则完全是背道而驰、浪费用户时间的行为。

      由此看来,按照内容进行划分的所谓“垂直搜索”是一个非常误导的概念,降低了搜索效率,祸害无穷。

      今天,还有一种所谓的“搜索”也被贴上了“垂直搜索”的标签,最典型的是火车票和机票。在笔者看来,这些业务根本就不是搜索,而只是检索。判断依据就是所查询的信息是不是海量,信息是不是结构化。

      火车车次,航班班次(含折扣价)的数据是有限的,而且发生变动的频率也就是一年一两次,其信息量远远未到可供“搜索”的地步。从国内网站来看,提供火车票、机票搜索的网站不计其数,其差别不是检索技术的高低,而是数据库更新是不是及时。

      从技术角度来看,在获得权威数据库之后,开发一个基于SQL语句的WEB查询功能只需要几个工作日的时间,和布林佩奇和李彦宏做的搜索可谓天壤之别。当然,一个SQL开发高手想到百度谋得一职也是幻想。

      技术开发十分简单的本质原因,是因为机票车票这些信息都是结构化的,检索过程可以依赖现有技术,而不用自行开发极度复杂的HTML文本搜索技术。

      诸如火车票机票的专业查询还有很多,比如医学方面的病历查询,警方所用的在逃犯检索,以及网上零售网站的商品检索。这些都不是现代意义上的搜索引擎,称之为“垂直搜索”可能是想沾点搜索引擎的“时髦”。

      综上所述,在目前这一代的搜索技术之下,我们暂且按照信息媒体的类型来对搜索分类,这种分类谈不上所谓的“垂直化”。而许多号称“垂直搜索”的服务其实是毫无技术含量的“检索”。

      需要强调的是,搜索的目标是用复杂的算法和分布式计算技术从海量非结构化信息中找出用户最想要的东西。迟来的搜索业者如果对于“算法”和“计算”没有自信,就干脆不要把海量信息的分门别类当成自己的事业,美国Google和中国百度的进步迟早会让这种低技术含量的工作变成无用功。 

    展开全文
  • 这是一个演示项目,目的是展示动态盐渍相对于静态盐渍背后的概念验证。 许多开发人员错误地使用除用户密码之外的相同盐来创建新哈希。 不幸的是,攻击者也可以通过执行相同的操作轻松地预先计算出静态盐。 通过创建...
  • 云技术含量的问题

    2011-01-12 10:24:00
    的概念是忽略掉如何获取的问题提供给客户端相关的数据。即使客户可以闭上眼睛不去想这个问题,作为实现的技术员是绝对绕不开这个问题。客户端通往数据的路有很多,这里的技术已经不在是有或没有路的问题,而是走那...

    网游服务是什么,说成云是客户端索取相关数据,站在这个角度来说有什么技术含量呢?跟客户端读本地文件一样都是读取数据而已。从客户端到服务器,到数据库,到n多个服务器,这里的技术含量是,对于客户端来说只是获取数据而已,如果忽略如何获取的问题?云的概念是忽略掉如何获取的问题提供给客户端相关的数据。即使客户可以闭上眼睛不去想这个问题,作为实现的技术员是绝对绕不开这个问题。客户端通往数据的路有很多,这里的技术已经不在是有或没有路的问题,而是走那条路的问题。假设我们有5种连接服务器的方式,有5种访问数据库的方式,那么我们有25种方式,你会说把这个25种方式都实现比较下效率不就知道了吗?这25种方式每做一个方案需要1年那么共需要25年?那么无论是第一年获取了最快的还是最后一年得到了最快的,结果都将在25年后得到。因为不做完最后一个方案永远不知道这25个方案哪个是最快的,技术的价值就在如何从25个方案中推算出最快的或较快的,不必等到25年后得到答案。

    展开全文
  • 技术含量

    2018-04-21 01:04:00
    技术含量在于1.如果根据需求,过往经验,存在困难,可用代码,从无到有构思,想象...3.如何把思路走出来系统,需求改出来系统,变成若干领域概念,最终把需求实现抽象化,概念化,精简化。 转载于:https://www....

    技术含量在于

    1.如果根据需求,过往经验,存在困难,可用代码,从无到有构思,想象,或是搭建一个系统。做到快速的,有预见的,可扩展的,好维护的。

    2.如何把宏伟的计划变成分先分后的简单任务,包括用修真的态度营造真实的需求。如何用常见简单代码和习惯方式从本质上解决问题。

    3.如何把思路走出来的系统,需求改出来的系统,变成若干领域概念,最终把需求实现抽象化,概念化,精简化。 

    转载于:https://www.cnblogs.com/baozhu/p/8895529.html

    展开全文
  • 对现有的行业规程、规范及技术标准中关于"煤层残存瓦斯含量"的定义、测定与计算方法存在的歧义与不统一、不规范的问题进行了分析,指出随着矿井煤炭的开采与瓦斯的抽采,煤层残存瓦斯含量是一个动态的概念,应该按照...
  • 关于css颜色相关概念: 色调:很接近大众口中所说颜色。 饱和度:是指颜色中灰色的含量; 亮度:是指颜色中灰色的含量。 对比度:前景色与背景色之间差异。 Web安全色:不需要担心颜色在不同硬件环境,操作...
  • OLED “页”的概念

    2020-05-13 11:41:53
    我用#CSDN#这个app发现了有技术含量的博客,小伙伴们求同去《STM32学习笔记—OLED页寻址方式》, 一起来围观吧 https://blog.csdn.net/wanghualei_bull/article/details/82154031
  • 为进一步研究拉丁方与幻方之间的关系,在完美幻方的基础上,提出均衡完美幻方的概念,证明了均衡完美幻方与正交完美拉丁方对是一一对应的,同时发现了基于Zn的n阶完美拉丁方与正则群的联系。还从完美拉丁方的缺陷...
  • 根据传统难筛粒含量的基本概念,对比分析了GB/T 15716-2005《煤用筛分设备工艺性能评定方法》中,用临近粒度物含量作为工艺效果评定指标的不妥之处;以精煤泥弧形筛使用和不使用击打器的对比试验案例,对两者之间的差异...
  • (一)统计学中几个基本概念1.总体:根据研究目的确定、同质全部研究对象(严格地讲,是某项观察值集合)被称作总体。如研究2008年中国60岁以上老人血清总胆固醇含量,测定值全部构成了一个总体。2.样本:...
  • 辐射定标: 1、定义(Radiometric Calibration)是计算地物光谱反射率或光谱...反射率法:在卫星过顶时同步测量地面目标反射率因子和大气光学参量(如大气光学厚度、大气柱水汽含量等)然后利用大气辐射传输模...
  • 岩浆岩种类很多,主要根据SiO2的含量将岩浆岩分为超基性岩、基性岩、中性岩和酸性岩四大类;按岩浆产出状态(或冷凝深度)可分为侵入岩和喷出岩,侵入岩又可分为深成侵入岩(简称深成岩)和浅成侵入岩(简称...
  • 在实际工作中,除了最有技术含量的建模以外, 还有些事情没啥技术,但是也必 不可少, 俗称脏活。 而像输入的数据的整理, 非法数据的剔除都属于这一类脏活。 一个输入数据, 通常被数字化以后, 会被存放在计算机的...
  • 应当指出的是,确定高海拔综合体和海拔的主要标准之一是高海拔标准及其内部含量的数量和质量变化,同时考虑了在此条件下形成的侵蚀剥蚀低地和山地景观系统的状况。地球实际物质-能量流的影响,首先是重力能量的影响...
  • 变异同质~性质相同。是指基本条件相同变异~同质事物之间差异。是指不同个体在相同条件下,对外界环境因素反应不同总体Population:根据研究目的所确定同质观察单位全体;...样本含量Sample...
  • 神经网络训练时常见的概念问题

    千次阅读 2017-03-09 11:58:43
    (1)batchsize:一个批次样本含量。在深度学习中,即每次训练在训练集中取 batchsize 个样本训练; (2)iteration:1个iteration等于使用batchsize个样本训练一次; (3)epoch:1个epoch等于使用训练集中全部...
  • 软件测试核心概念

    2020-11-25 15:34:31
    软件测试 什么是软件 软件=程序+数据库+文档+服务 软件测试的定义 软件测试是使用人工和自动手段来运行或测试某个系统的工程,其目的在于检验...软件缺陷的概念 软件测试员认为软件难以理解 软件未达到需求规格说明书
  • Weblogo基础概念

    千次阅读 2019-06-28 14:22:48
    H称为信息熵,代表信息的含量。 公式: H = -∑(Pilog2(Pi)) 单位: 比特 例如:一段序列 ATCG PA = 0.25 PT = 0.25 PC = 0.25 PG = 0.25 H = -∑(PAlog2(PA ) +PTlog2(PT )+PClog2(PC)+PG*log2(PG))= 2 H越大,...
  • oracle asm 概念

    2013-11-20 17:23:00
    在oracle 10g 这个版本之前,管理一个大型数据库成千上万数据文件对数据库管理员来说是一个既无技术含量又十分枯燥工作,并且要求数据库管理员掌握系统lvm相关知识,做好磁盘规划,lv条带化等相关知识。...
  • XSS盲打基本概念

    2018-04-02 16:28:25
    感觉XSS盲打属于比较无赖。。。做不好自己伪装还可能被定位。简单来说,盲打就是在一切可能...这种属于没什么技术含量,甚至可以脚本自动化完成事情。Web安全低门槛和入门时高成就感着实吸引了不少人。...
  • 计算智能论文基于计算智能创新概念设计研究及应用 中文摘要随着社会经济飞速发展和科学技术不断进步,产品制造业水平得到了前所未有发展,产品技术含量也越来越高目前市场上产品功能齐全种类繁多,产品风格...
  • 据江苏公共·新闻频道《新闻360》报道:平时...】记者发现,不少市民会选购“全麦面包”,但是对“全麦面包”中的“全麦”成分并没有明确的概念。专家介绍,“全麦面包”中的“全麦”是指“全麦粉”,它和“小麦粉”...
  • 音视频相关“含量

    2010-10-26 17:50:09
    第一部分:基本概念讲解 媒体:是表示,传输,存储信息载体,常人们见到文字、声音、图像、图形等都是表示信息媒体。 多媒体: 是声音、动画、文字、图像和录像等各种媒体组合,以图文并茂,生动活泼...
  • 很有帮助,属于基础块了,虽然我也会一点后端开发,但是没整套东西学,技术含量还是差一些,所以现在补上,算是扫盲了,这部分写得内容不会很官方,都是很通俗语言来描述相关概念! 网络通信涉及内容 网络: 将...
  • 由Apache组织中开发维护,基于项目对象模型的概念,maven可以根据一个中心信息来管理项目的构建,文档和报告; 为何需要maven 在日常开发工作中,开发者需要自行管理项目依赖,频繁的编译,清理,测试,打包,发布等等…虽然...
  • 进入朗沃学习也是快有一周时间了,起初来这里,就是把... 其实毕业已经快有两年时间了,之前也是做过两份工作,这两份工作一是和自己专业完全没关系,二来工作本身也是没有什么太大技术含量,所以都是简单...
  • 2.比特币每一笔交易价值含量是不一样,当区块容量不够用时候,应该优先保证价值高交易进块,但是这样会造成一个后果,就是小额支付会被赶出系统,这样真个比特币网络就变成了一个清算系统。从长远来看,...
  • 这篇日志没有什么技术含量,只是总结几个基本概念。在软件分析中,我们经常会遇到流敏感(flow-sensitive),路径敏感(path-sensitive)和上下文敏感(context-sensitive),这几个概念都主要出现在Data Flow ...

空空如也

空空如也

1 2 3 4 5 ... 14
收藏数 276
精华内容 110
关键字:

含量的概念