精华内容
下载资源
问答
  • 如在西北师范大学图书馆后侧设置了一处以校园文化为主题的校园小环境——学思园,本着“环境育人、空间育人”的设计理念,采取现代、简约、艺术的表现形式以期对学生的思想观念产生影响。此环境中一雕塑为主体,...
  • php高级开发教程说明

    2008-11-27 11:39:22
    这个循环也许用不了1 0 0行代码,但是一个优化循环选择设计一个优化算法很容易耗费一 整天时间,这个小小循环也许是设计阶段最庞大部分,但另一方面,你可以在不到一天 时间内策划好数千行代码。 ...
  • 从报告、论文中选取出来用表示全文主题内容信息单词或术语;关键词自动抽取是依靠计算机从文档中选择出反映主题内容词 停用词 在信息检索中,节省存储空间和提高搜索效率,在处理自然语言数据...

    1、引言

    1-1、编写目的

       明确设计,供项目管理者阅读。

    1-2、定义

    缩写、术语

    解 释

    关键词

    从报告、论文中选取出来用以表示全文主题内容信息的单词或术语;关键词自动抽取是依靠计算机从文档中选择出反映主题内容的词

    停用词

    在信息检索中,为节省存储空间和提高搜索效率,在处理自然语言数据(或文本)之前或之后会自动过滤掉某些字或词

    标签

    一种互联网内容组织方式,是相关性很强的关键字,它帮助人们轻松的描述和分类内容,以便于检索和分享

    元数据 (meta data)

    描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。

    数据库实体

    数据库管理系统中的不同管理对象

     

    1-3、参考资料

      1、http://shiyanjun.cn/archives/548.html

      2、http://www.ruanyifeng.com/blog/2013/03/tf-idf.html

      3、http://xwrwc.blog.163.com/blog/static/46320003201010634132451/

      4、http://www.cnblogs.com/kissdodog/archive/2013/02/28/2937900.html

      5、http://zhoufoxcn.blog.51cto.com/792419/280320

      6、http://zhoufoxcn.blog.51cto.com/792419/280580

      7、http://zhoufoxcn.blog.51cto.com/792419/281956

      8、http://zhoufoxcn.blog.51cto.com/792419/283021

      9、http://developer.baidu.com/wiki/index.php?title=%E5%B8%AE%E5%8A%A9%E6%96%87%E6%A1%A3%E9%A6%96%E9%A1%B5/%E7%99%BE%E5%BA%A6%E7%BF%BB%E8%AF%91/%E7%BF%BB%E8%AF%91API

     

     

    2、总体设计

    2-1、需求

    1. 定义在线问答网站的内容结构,找出其中涉及的实体及它们之间的关系;
    2. 能够支持增量式的将输入的新数据,按照定义好的内容结构合并到已有的内容中(重复内容怎么处理,更新内容怎么处理,用户上传内容怎么处理);
    3. 支持标签;
    4. 支持关键词翻译;
    5. 有一个界面来跟踪和报告数据处理的进度。

    2-1-1、定义内容结构,得到实体关系,建立数据库

    • 输入:无
    • 输出:无

    2-1-2、数据库连接

    • 输入:serverIp(服务器地址),dbName(数据库名称),string user(用户),password(用户密码)
    • 输出:无

    2-1-3、插入新数据

    • 输入:PageTitle、Author、postdate、link、<tag,文本>组
    • 输出:插入数据库

    2-1-4、去重、去噪

    • 输入:未经过处理的rawdata
    • 输出:去掉html标签等噪声数据的文本,去掉非utf-8编码的文本

    2-1-5、分词

    • 输入:文本数据、分词器(默认用PanGu分词器)
    • 输出:用该分词器处理得到的分词数据

    2-1-6、关键词抽取

    • 输入:数据库中的分词后的数据
    • 输出:通过TF-IDF方法得到关键词

    2-1-7、翻译

    • 输入:数据库中的文本数据
    • 输出:实现中英对照

    2-1-8、最终数据展示

    • 输入:Ttile、Author、Postdate、满足前面条件下的标签
    • 输出:满足前面所有要求的文本数据

    2-1-9、跟踪报告数据处理进度

    • 输入:无
    • 输出:显示数据处理的进度

    2-2、软件结构

     

    程序

    功能

    输入

    输出

    数据库连接

    连接数据库

    serverIp(服务器地址),dbName(数据库名称),string user(用户),password(用户密码)

    插入数据

    向数据库中增加数据

        PageTitle、Author、postdate、link、<tag,文本>组

    去重、去噪

    去除噪声数据、非utf-8文本

    原始数据

    去噪后数据

    分词

    对去噪数据进行分词

    去噪后数据

    分词数据

    关键词抽取

    得到文本的关键词

    数据库中分词数据

    若干个关键词

    翻译

    进行文本中英对照

    文本数据

    中英对照的文本数据

    最终数据展示

    对得到的最终数据进行功能展示

    数据库中相应数据

    展示数据库中数据

    跟踪报告处理数据进度

    一个界面来跟踪和报告数据处理的进度

    选择的文本数据(可有很多个)

    输出现在正在处理得数据以及处理得进度

     

    2-2-1、模块汇总表

    关键词抽取子系统

    模块名称

    功能简述

    去噪、去重

    去除噪声数据、非utf-8文本

    分词

    对去噪数据进行分词

    关键词抽取

    抽取出数据的关键词

    翻译子系统

    模块名称

    功能简述

    中英互译

    对文本进行翻译对照

    UI展示子系统

    模块名称

    功能简述

    处理单个数据界面

    对数据进行插入、去噪、分词、提取关键词、中英对照、最终结果显示

     

    处理多个文件界面

    跟踪和报告数据处理的进度界面

    转载于:https://www.cnblogs.com/cheneygroup/p/4932900.html

    展开全文
  • 作者站在普通网页设计人员角度,用平实生动语言,向您讲述XML方方面面,帮助你拨开XML神秘面纱,快速步入XML新领域。 • 第一章:XML快速入门 • 一. 什么是XML? • 二. XML是新概念吗? • 三. 使用...
  • LINGO软件学习

    2009-08-08 22:36:50
    集是LINGO建模语言基础,是程序设计最强有力基本构件。借助于集,能够用一个单一、长、简明复合公式表示一系列相似约束,从而可以快速方便地表达规模较大模型。 2.2 什么是集 集是一群相联系对象,...
  • 软件验证与确认计划必须描述所采用的软件验证和确认方法(例如评审、检查、分析、演示或测试等),用来难软件需求规格说明书中的需求是否已由软件设计说明书描述的设计实现;软件设计说明书表达的设计是否已由编码...
  •  对软件而言,逆向工程归结起来就是拿一个既没有源代码又没有准确文献资料的现成程序,尝试恢复出它的设计和实现细节。在某些情况下,可以找到程序的源代码,但是找不到最初的开发人员了。本书所讨论的就是通常所说...
  • 面向对象的开发方法包括面向对象的分析、面向对象的设计和面向对象的程序设计。( √) 7. 软件危机的主要表现是软件的需求量迅速增加,软件价格上升。(×) 8. 软件工具的作用是为了延长软件产品的寿命。(×) 9. ...
  • Reversing:逆向工程揭密

    热门讨论 2010-06-21 17:00:47
    对软件而言,逆向工程归结起来就是拿一个既没有源代码又没有准确文献资料的现成程序,尝试恢复出它的设计和实现细节。在某些情况下,可以找到程序的源代码,但是找不到最初的开发人员了。本书所讨论的就是通常所说的...
  • 国家电网水平考试题

    2012-11-09 11:41:39
    (1)创建新文档、录入以下文字内容,并KS_姓名.DOC名保存文档(说明:文件名KS_姓名.DOC中姓名考生真实姓名)。  近日,美国俄勒冈州立大学工程师们在改善微生物燃料电池性能方面取得突破。他们研制...
  • 首先是最初的方案,然后经历各种程序逻辑,将方案不断改革更恰当的设计。通过整个过程的学习,大家可体会到使设计思想逐渐变得清晰起来的一种途径。 (17) 第17章 项目 本章包括了一系列项目,它们要么本书前面...
  • asp.net知识库

    2015-06-18 08:45:45
    NET2.0系列介绍(一).NET 2.0 中Web 应用程序主题的切换 ASP.NET 2.0 中Web 应用程序主题的切换 2.0正式版中callback的一些变化+使用示例(ASP.NET 2.0) Server Side ViewState 在服务器端存贮ViewState (ASP.NET...
  • 随着移动设备和宽屏浏览器的普及,单一的设计不能满足Web页面的设计需求,此时CSS3的Media Query新特性中出现了一个新的布局概念——Responsive。本章中大家将体会到Media Query与Responsive布局的强大功能。 第15...
  • 它是一个程序设计原则的自然结果,即把应用程序设计成一组彼此通信小片段是比设计成单个庞大程序更好方法。从历史上看,应用程序设计方式按如下顺序渐次出现:  1.完成全部工作单个庞大程序。整个程序...
  •  本书“动手写”指导思想,只要是跟“动手写”操作系统有关的知识,都作为介绍对象加以讨论,所以,从开发环境的搭建,到保护模式,再到IBMPC中有关芯片的知识,最后到操作系统本身的设计实现,都能在本文中...
  •  本书“动手写”指导思想,只要是跟“动手写”操作系统有关的知识,都作为介绍对象加以讨论,所以,从开发环境的搭建,到保护模式,再到IBMPC中有关芯片的知识,最后到操作系统本身的设计实现,都能在本文中...
  • 本书超级畅销书《大话设计模式》作者程杰潜心三年推出扛鼎之作!一个计算机教师教学场景,讲解数据结构和相关算法知识。通篇一种趣味方式来叙述,大量引用了各种各样生活知识来类比,并充分运用图形...
  • 本书超级畅销书《大话设计模式》作者程杰潜心三年推出扛鼎之作!一个计算机教师教学场景,讲解数据结构和相关算法知识。通篇一种趣味方式来叙述,大量引用了各种各样生活知识来类比,并充分运用图形...
  • 作者对数据库的性能优化有独到的见解,颇擅长于海量数据数据库的设计管理及优化工作。 目录 封面 -17 扉页 -16 版权 -15 序 -14 前言 -12 致谢 -5 目录 -4 第1章 引起数据库性能问题的因素 1 1.1 软件设计对数据库...
  •  Oracle 10g基础,对Oracle RAC进行了全面介绍和分析。  按照“发现问题→解决问题→实践与理论相结合”方式进行介绍  首先对现实问题进行分析,然后提供合适解决方案,最后自然地引出Oracle中理论...
  • 大话数据结构

    2019-01-10 16:35:22
    现实中,人与人之间关系就非常复杂,比如我认识朋友,可能他们之间也互相认识,这就不是简单一对一、一对多关系了,那就是我们今天要研究的主题——图。 7.2.1各种图定义 214 7.2.2图顶点与边间关系 217 ...
  • 大话数据结构 程杰

    2018-09-01 10:06:43
    现实中,人与人之间关系就非常复杂,比如我认识朋友,可能他们之间也互相认识,这就不是简单一对一、一对多关系了,那就是我们今天要研究的主题——图。 7.2.1各种图定义 214 7.2.2图顶点与边间关系 217 ...
  • 21 2.5.1 输入输出 21 2.5.2 有穷性 21 2.5.3 确定性 21 2.5.4 可行性 21 2.6 算法设计的要求 22 求100个人高考成绩平均分与求全省所有考生成绩平均分在占用时间和内存存储上有非常大差异,我们自然追求高效率...
  • 大话数据结构-程杰

    2014-07-13 23:45:52
    现实中,人与人之间关系就非常复杂,比如我认识朋友,可能他们之间也互相认识,这就不是简单一对一、一对多关系了,那就是我们今天要研究的主题--图。 7.2.1 各种图定义 214 7.2.2 图顶点与边间关系 217...
  • 解决方案的设计应该包括公司希望防止最坏情况的方案。 4.1 可接受的数据丢失量 所有企业都不希望在故障之后丢失任何数据。虽然不丢失数据是可能的,但由于可能需要的复杂性和费用(尤其是如果所防止的故障级别非常...
  • Oracle_Database_11g完全参考手册.part1/3

    热门讨论 2012-08-18 17:29:13
    4.10 人性化和优秀的设计 4.10.1 理解应用程序的任务 4.10.2 任务概要 4.11 理解数据 4.11.1 原子数据模型 4.11.2 原子业务模型 4.11.3 业务模型 4.11.4 数据项 4.11.5 查询和报告 4.12 关于对象名称的规范化 4.12.1...
  • 会计理论考试题

    2012-03-07 21:04:40
    6.为了最佳方式、最少重复,多种应用服务,把数据集中起来一定组织方式存在计算机外存储器中,就构成 __D___ 。 A、FoxBASE B、DOS C、数据库管理系统 D、数据库 7.用紧急启动盘(ESD)启动计算机后,屏幕...
  • 柏拉图学派具有这样概念,即 数学客体是抽象,远离日常感性经验:几何图形理想化,区别于客体实际图样和形状;数字不与具体客体计算相混淆。它们存在和本性 出现了特殊哲学挑战:如何做到 数学...

空空如也

空空如也

1 2
收藏数 30
精华内容 12
关键字:

以自然为主题的设计说明