热门好课推荐
猜你喜欢
相关培训 相关博客
  • 1、项目介绍1.1项目需求分析1.2技术可行性分析1.2.1建立并实现搜索引擎功能1.2.2比较文档之间的相似度1.2.3对下载的文档,利用K-Means聚类算法进行聚类1.3项目环境介绍1.3.1运行环境1.3.2第三方工具包1.3.3数据来源2、项目实现2.1建立索引2.1.1新建文件工具类2.1.2对中英文预处理文...
    2018-07-01 01:48:19
    阅读量:507
    评论:1
  • ------本文是学习算法的笔记,《数据结构与算法之美》,极客时间的课程------像百度、Google这样的搜索引擎,在我们平时工作中学习中,几乎天天遇到。如果我们把搜索引擎当作一个互联网产品的话,那它跟社交、电商这些类型的产品相比,有一个非常大的区别,那就是,它是一个技术驱动的产品。所谓技术驱动是指,搜索引擎实现起来,技术难度非常大,技术的好坏直接决定了这个产品的核心竞争力今天借助搜索...
    2019-06-11 17:04:40
    阅读量:218
    评论:0
  • 毕业狗一枚,即将步入职场。仅以此系列,记录毕业设计中遇到的问题和解决的具体思路,重点不是完整的代码,而是得到完整代码的思考过程。所以只会贴出部分代码,勿怪。专业是电子商务,除了万恶的经管大类课程,技术方面学的是JavaEE,大二自学Android。大三下,有计算机学弟找我一起稿一个校自主研究基金的项目,就是垂直搜索引擎。大四签约后,一直在研究搜索引擎(垂直神马的,我也只能做到数据来源是垂直的,要实
    2015-06-19 16:26:21
    阅读量:3134
    评论:0
  • 原文链接:http://www.facesjoy.cn/article/2019/10/21/12.html一、实验目的了解中文分词意义掌握中文分词的基本方法二、实验环境Win1064位JDK8.0三、实验设计(一)分词策略目前较为成熟的中文分词方法主要有:1.基于词表的分词算...
    2019-10-21 11:33:43
    阅读量:5
    评论:0
  •   ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTfulweb接口。Elasticsearch是用Java开发的,并作为Apache许可条款下的开放源码发布,是第二最流行的企业搜索引擎。设计用于云计算中,能够达到实时搜索,稳定,可靠,快速,安装使用方便。起步1.安装jdk  由于elasticsearc...
    2018-05-30 23:29:47
    阅读量:4879
    评论:0
  • 搜索引擎课程大作业,老师给了几百份带标签的文档,用来做搜索引擎的查询内容,最后查了半天资料决定用python做。基本上就是预处理(去标签)——分词构建索引——查询三个部分。预处理比较简单,把文档的HTML标签去除,不过这里遇到个坑,那就是这些文档里面由好几种编码格式,所以只能解码后重新用utf-8编码,否则会出现乱码,然后为每一个文档建立目录文件(方便查询之后溯源),分词的话就是用jieba包将新...
    2018-04-25 20:59:56
    阅读量:4089
    评论:2
  • 全新的CADENAS零部件数据资源平台为用户查找全球制造商目录中的数百万个三维CAD和BIM模型提供了众多独特的搜索功能。现代社会,搜索引擎通常是用户搜索信息最重要的应用工具。而传统的搜索引擎往往由于搜索结果过于笼统而无法满足工程师和规划人员在零部件搜索方面的需求,其原因就在于,常见的搜索引擎并不是专为技术领域而研发的。CADENAS推出了具有划时代意义的可视性搜索引擎3Dfind.it。...
    2019-08-13 16:01:21
    阅读量:22
    评论:0
  • 大数据方向学习路径基础课程大数据的java基础大数据的linux基础大数据的网络基础python网络程序开发大数据的统计学基础大数据的矩阵计算基础Scala语言入门大数据的C++基础深入JVM内核–原理、诊断与优化深入理解Linux内核大数据平台架构方向搜索引擎构建与爬虫技术高并发大数据平台架构设计Hadoop方向Hadoop数据分析平台...
    2018-08-31 15:45:27
    阅读量:655
    评论:0
  • 大数据技术的诞生大数据早就不是什么新鲜词了,已经存在十几年了。最早要从google的三篇论文说起了,分别是分布式文件系统GFS、大数据分布式计算框架MapReduce以及NoSql数据库BigTable,正是这三篇论文奠定了大数据的基础。Google是做搜索引擎的,有大量的数据需要存储和计算,那个时代更多的是在提高单机性能来解决问题,而Google的思路是部署一个大规模的集群服务器,通过分布式...
    2019-06-24 11:35:27
    阅读量:464
    评论:0