精华内容
参与话题
问答
  • 信息检索系统原理

    2013-07-28 19:48:20
    信息检索系统原理PPT,主要用于介绍检索系统的一些基本原理
  • 在本课程中,我们将研究基于文本和基于Web的信息检索系统的理论,设计和实现,包括检查现代搜索和数据挖掘应用程序核心的Web和社交媒体挖掘算法和技术。到学期结束时,您将能够:定义和解释与信息存储和检索相关的...
  • 文章信息检索系统

    2011-11-23 10:48:35
    可以检索数据库里的文章,用java做的.花了一周的时间
  • 随着地理信息数据获取技术日渐完善,地理信息数据在遥感领域应用的不断深入,人们对海量地理...论文分析并探讨了Vue在地理信息检索系统应用的可行性及实现方法,并证明了Vue的优势可在地理信息检索系统得到有效的利用。
  • 利用Lucene接口编写简单的信息检索系统,实现对本地目录建立索引和搜索功能。代码包含两个JSP页面,放入tomcat的webapp目录中即可在浏览器中运行程序。选择文档路径时如若涉及浏览器权限问题,可直接输入。
  • 信息检索系统的相关知识 信息检索系统
  • 智能新闻信息检索系统的设计与实现.pdf智能新闻信息检索系统的设计与实现.pdf智能新闻信息检索系统的设计与实现.pdf智能新闻信息检索系统的设计与实现.pdf
  • PeerIS:基于Peer-to-Peer的信息检索系统,周傲英,凌波,本文介绍了对等计算(Peer-to-Peer,简称P2P)的特征、潜在优势和应用范围,指出了当前P2P数据共享系统存在仅支持弱语义(甚至缺乏语义)和�
  • 使用XML当数据库,JSP做显示层的图书馆信息检索系统
  • 简易的信息检索系统

    2013-06-08 22:42:00
    设计并实现一个简易的信息检索系统,构成搜索引擎的核心模块。该系统读取一组英文文本 文件,为该组文件创建反向索引(请参考“补充知识”部分),并借助创建好的反向索引实 现对文件内容的快速查询。 基本功能...
    项目概览: 本项目为 C++部分的课程考试题,需个人独立完成。 设计并实现一个简易的信息检索系统,构成搜索引擎的核心模块。该系统读取一组英文文本 文件,为该组文件创建反向索引(请参考“补充知识”部分),并借助创建好的反向索引实 现对文件内容的快速查询。 基本功能(必需): 1. 系统能够为一个文本文件集合创建反向索引。 2. 系统能够根据单个词语搜索相应的文件(例如“movie”、“good”)。 3. 系统提供基于命令行的用户交互界面,具体功能包括:  让用户指定需索引的文件目录(该目录包含需索引的全部文本文件);  让用户输入搜索内容;  显示搜索到的文件名(一个或多个)。   高级功能(可选): 1. 系统支持组合查询语句,该语句包含两个或多个以“OR”或“AND”连接的单词(例 如 “movie” AND “good”、“movie” OR “TV”)。系统无需支持同时包含“AND”和“OR” 的查询语句,例如(“good” OR “bad”) AND “movie”。 2. 系统支持短语(包含两个或多个单词)查询,例如“good movie”。 3. 系统能够对搜索到的文件与查询语句之间的关联度进行分析与排序,并按照关联度排序 (降序)显示搜索到的文件。 4. 系统能够支持一些更高级的用户交互功能(例如:系统在显示搜索结果时除了显示文件 名外,还显示文件内容,并将被查询的词汇以特殊的方式标出)。 5. 系统能够让用户指定一个需排除的词汇列表,这些词汇在创建反向索引时不被检索。 6. 其他能够提升索引与搜索质量的功能。
    展开全文
  • 基于概念云与本体的信息检索系统(IRSCCO)的设计与实现,任瑞娟,濮德敏,基于本体的语义检索是提高信息系统检索精确度的有效途径之一。概念云是云模型在信息领域的应用,是本体中的概念按照一定算法在页
  • 详细地描述了使用语义Web技术实现智能信息检索的思想和工作流程,提出了一个基于本体的信息检索系统的框架,并以一个地理信息领域的应用为例分析了该检索系统的实现技术。
  • 一个基于概念格的小型信息检索系统,彭韬,陈光,互联网上信息爆炸式的增长,使得传统的搜索引擎很难让用户精准且快速地定位信息。文中提出一种基于概念格的方法,将检索结果更好
  • 多媒体信息检索系统设计1

    千次阅读 2004-07-06 22:12:00
    软件工程的项目终于正式开始了,现在做的任务是系统设计,主要是搞清楚这个信息检索系统整个体系结构,并不要求作具体的检索算法。下面是初步的设计图。

    软件工程的项目终于正式开始了,现在做的任务是系统设计,主要是搞清楚这个信息检索系统整个体系结构,并不要求作具体的检索算法。下面是初步的设计图。

    展开全文
  • 基于Maemo平台的图书馆信息检索系统的设计与实现,徐冬,,图书馆是人们获取信息的一个非常重要的渠道,但是在浩瀚的书海中寻找到自己需要的文献资料并不是一件容易的事。传统的方式是通过
  • 介绍了信息Agent进行个性化信息检索的基本技术及发展趋势;给出了MAS体系结构并分析了它的优点;描述了如何在Multi-Agent系统Calvin中实现个性化信息检索。
  • 基于GIS数据库信息的面向某一行业的信息检索系统的设计与实现,林祥涛,彭泳,本文在分析当前的信息检索系统优缺点和GIS数据库信息特点的基础上,利用GIS数据库信息分类明确的优势,提出了一种面向某个行业的信
  • 一种基于海量数据的智能信息检索系统实现,一种基于海量数据的智能信息检索系统实现,
  • 信息检索系统——VSM算法实现

    千次阅读 2020-07-05 00:55:32
    匹配文档样例 查询样例 匹配结果样例 python–源码如下 import math from tqdm import tqdm df_dict={} global docs_num #一个全局变量,保留全部文档数 ...def doc_pl(doc): #求出文档中的词频数,及总词数,用于tf...

    匹配文档样例

    在这里插入图片描述

    查询样例

    在这里插入图片描述匹配结果样例

    在这里插入图片描述

    python–源码如下

    import math
    from tqdm import tqdm
    
    df_dict={}
    global docs_num      #一个全局变量,保留全部文档数
    docs_num=0
    
    def doc_pl(doc):     #求出文档中的词频数,及总词数,用于tf-idf的计算
        word_list=doc.split()
        num=0
        word_pl={}
        for word in word_list[1:]:
            word_pl[word]=word_pl.get(word,0)+1
            num+=1
        for word in word_pl.keys():
            df_dict[word]=df_dict.get(word,0)+1
        return (word_pl,num)
    
    def tf_idf(doc,flag):          #求tf-idf的值
        global docs_num
        word_tfidf={}
        for word in doc[0].keys():
            tf=doc[0][word]/doc[1]                              #tf---某词在文章出现的次数/总词数
            if flag==1:
                idf = math.log((docs_num / (df_dict[word]+1)))  #idf---log(文档总数/包含该词文档数+1)
                #idf=(docs_num/df_dict[word])**2
                #idf=(1/df_dict[word])**1.8
            else:                                               #对于一个问询的的tf-idf情形
                idf=1
            word_tfidf[word]=tf*idf
        return word_tfidf
    
    def simolarity(doc1,doc2):       #求文档相似度
        zi=0
        mu1=0
        mu2=0
        for word in doc1.keys():
            if doc2.get(word,0)!=0:
                zi+=doc1[word]*doc2[word]
        for word in doc1.values():
            mu1+=word**2
        for word in doc2.values():
            mu2+=word**2
        return zi/((mu2**0.5)*(mu1**0.5))
    
    def vsm(dlist,que):             #利用夹角余弦(Cosine)计算距离
        global docs_num
        docs_num=0                  #查询前清零总文档书
        doc_pl_list=[]              #各个文档的词频,及此文档总词数
        tfidf_list=[]               #各个文档中词的tf-idf字典
        sim_list=[]                 #各文档与查询的相似度
        for doc in dlist:
            doc.strip()
            doc_pl_list.append(doc_pl(doc))                                                #对于list的每一个元素为一个元组,元组中第0号元素为包含文档中词频率的字典,第二个元素为该文档的总词数
            docs_num+=1
        for pl in doc_pl_list:
            tfidf_list.append(tf_idf(pl,1))                                                #每一个文档中包含其所有词的tf-idf的字典构成的list
    
        docs_num=1
        tfidf_que=tf_idf(doc_pl(que),0)                                                    #一个查询的所有词的tf-idf字典
        for i in range(len(tfidf_list)):
            sim_list.append([simolarity(tfidf_que,tfidf_list[i]),dlist[i].split()[0]])     #各文档与查询的余弦相似度
        return sorted(sim_list,key=lambda x:(-x[0]))                                       #使各文档按余弦相似度由高到低排序
    
    docs = open(r"C:\Users\CYY\Desktop\documents.txt",encoding='utf-8')
    doc_list = docs.readlines()
    docs.close()
    
    query = open(r"C:\Users\CYY\Desktop\q100.txt", encoding='utf-8')            #问询的文档
    query_list = query.readlines()
    query.close()
    
    Result = open(r"C:\Users\CYY\Desktop\result.txt", 'w',encoding='utf-8')     #写入结果的文档
    
    que_dict=dict()
    for i in tqdm(range(100)):                                #查询的数目
        df_dict = {}
        result = vsm(doc_list, query_list[i])
        Docs = []
        Docs.append(query_list[i].split()[0])
        k = 0
        for doc in result:                                    #去重
            if doc[1] not in Docs:
                Docs.append(doc[1])
                k += 1
            if k == 10:                                       #单次查询匹配的文档数
                break
        que_dict[i] = Docs
    
    for i in range(100):                                       #将一百个问询的前十个最匹配的文档写入
        Result.write(que_dict[i][0])
        Result.write("\t")
        for j in range(10):
            Result.write(que_dict[i][j+1])
            Result.write(' ')
        Result.write('\n')
    Result.close()
    
    
    
    
    
    
    
    
    
    
    
    
    
    展开全文
  • 基于内容的视频信息检索系统

    千次阅读 2014-12-23 15:27:56
    基于内容的视频信息检索系统 汪志强 (江西财经大学信息管理学院 09信息管理与信息系统2班) 摘 要: 本文从基于内容的视频信息检索技术的发展历史出发,对基于内容的视频检索系统的技术要点及主要的功能模块...
  • 读《信息检索系统导论》

    千次阅读 2008-11-26 15:51:00
    读《信息检索系统导论》 随着因特网的日益普及,它已经渗透到我们生活的各个角落,改变着我们的生活方式和思维方式。搜索引擎作为人们使用因特网的重要入口,引起人们广泛的重视和关注。尤其是以谷歌和百度为代表的...
  • 信息组织与检索 知识点整理 ...2.信息检索系统结构和功能模块 3.信息组织(信息采集,信息描述,信息标引,信息存储) 有点像知识点,事实上就是知识点,能举例的已经举例了,我尽力了。。 (会有粉丝吗呜呜呜

空空如也

1 2 3 4 5 ... 20
收藏数 5,699
精华内容 2,279
关键字:

信息检索系统