精华内容
下载资源
问答
  • 行内元素 作用:点缀网页,填充内容 特性: 1) 与其他行内元素共享一行空间 2) 默认宽高由内容决定 3) 不能为其指定宽和高 4) 行内元素中不可以嵌套块...常见的块级元素:p margin-top/margin-bottom form table/.
    1. 行内元素
      作用:点缀网页,填充内容
      特性:
      1) 与其他行内元素共享一行空间
      2) 默认宽高由内容决定
      3) 不能为其指定宽和高
      4) 行内元素中不可以嵌套块元素,但块元素中可以嵌套行内元素
      常见的行内元素有: span img a input th td em b i strong u
      2.块级元素
      作用: 一般用于页面结构的搭建
      特性:
      1)宽度是100%
      2)高度是由内容决定的
      3)占用一整行
      常见的块级元素有:p margin-top/margin-bottom form table/thead/tbody/tr /caption boby div* h1~h6:margin/font-size/font-weight ul ol li
      块级元素、行内元素的嵌套关系:

    块级元素里可以包含
    行内元素元素

    行内元素不可以

    包含

    块级元素

    块级元素视情况,

    可以包含
    块级
    元素
    展开全文
  • 网站结构类型有哪些

    千次阅读 2014-01-15 22:23:09
    线性结构是组织网页的基本结构,复杂的结构也可以看成是由线性结构组成。  2、二维表结构  一些网站会采用二维表结构,企业网站比较常见。这种结构允许用户横向、纵向地浏览信息。它就好象一个二维表,如看...

      1、线性结构

      一般网站都属于线性结构,它是以某种顺序组织的,可以是时间顺序,也可以是逻辑甚至是字母顺序。通过这些顺序呈线性地链接。如一般的索引就采用线性结构。线性结构是组织网页的基本结构,复杂的结构也可以看成是由线性结构组成的。

      2、二维表结构

      一些网站会采用二维表结构,企业网站比较常见。这种结构允许用户横向、纵向地浏览信息。它就好象一个二维表,如看课表一样。

      3、等级结构

      等级结构由一条等级主线构成索引,每一个等级点又由一条线性结构构成。如网站导航等就是这种结构。在构造等级之前,你必须完全彻底的理解你的网站内容,避免线性组织不严的错误,不方便浏览者。

      4、网状结构

      这是最复杂的组织结构,它完全没有限制,网页组织自由链接。这种结构允许访问者从一个信息栏目跳到另一个栏目去,其目的就是充分利用网络资源和充分享受超级链接。整个互联网就是一个超级大的“网”状结构。

    展开全文
  • 今天我们一起了解一下什么是爬虫,java爬虫框架有哪些。 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常称为网页追逐者),是一种按照一定规则,自动地抓取万维网信息程序或者脚本。另外一些...

    随着互联网的发展,编程程序语言也开始被越来越多的人所掌握,与此同时,java语言是使用范围最广的编程语言。今天我们一起了解一下什么是爬虫,java爬虫框架有哪些。

    网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

    网络爬虫按照系统结构和实现技术,大致可以分为以下四种类型:通用网络爬虫、聚焦网络爬虫、增量式网络爬虫、深层网络爬虫。实际的网络爬虫系统通常是几种爬虫技术相结合实现的。

    简单来讲,爬虫就是一个探测机器,它的基本操作就是模拟人的行为去各个网站溜达,点点按钮,查查数据,或者把看到的信息背回来。每一个爬虫都是你的“分身”,就像孙悟空一样,可以变出一堆猴子,当孙悟空饿了的时候,这些猴子可以出去找吃的,找到吃的以后,把吃的拿回来给孙悟空一样的道理。

    目前流行的java爬虫框架有WebCollector、WebMagic、Nutch、YayCrawler、Spiderman等。

    一、WebCollector是一个无须配置、便于二次开发的JAVA爬虫框架(内核),它提供精简的的API,只需少量代码即可实现一个功能强大的爬虫。支持分布式爬取。

    二、webmagic的是一个无须配置、便于二次开发的爬虫框架,它提供简单灵活的API,只需少量代码即可实现一个爬虫。

    三、Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。

    四、YayCrawler是一个基于WebMagic开发的分布式通用爬虫框架,开发语言是Java。

    五、Spiderman是一个基于微内核+插件式架构的网络蜘蛛,它的目标是通过简单的方法就能将复杂的目标网页信息抓取并解析为自己所需要的业务数据。

    六、Gecco是一款用java语言开发的轻量化的易用的网络爬虫。Gecco框架有优秀的可扩展性,框架基于开闭原则进行设计,对修改关闭、对扩展开放。

    以上就是我们今天介绍的爬虫及java爬虫框架相关的内容。

    展开全文
  • 常见Dom操作有哪些

    2018-04-16 10:46:52
    1.背景介绍DOM是Document Object Model(文档...在网页上,组织页面(或文档)对象被组织在一个树形结构中,用来表示文档中对象标准模型就称为DOM。Document Object Model历史可以追溯至1990年代后期微软与Net...
     1.背景介绍


    DOM是Document Object Model(文档对象模型 )的缩写。


    文档对象模型(Document Object Model,简称DOM),是W3C组织推荐的处理可扩展标志语言的标准编程接口。在网页上,组织页面(或文档)的对象被组织在一个树形结构中,用来表示文档中对象的标准模型就称为DOM。Document Object Model的历史可以追溯至1990年代后期微软与Netscape的“浏览器大战”,双方为了在JavaScript与JScript一决生死,于是大规模的赋予浏览器强大的功能。微软在网页技术上加入了不少专属事物,既有VBScript、ActiveX、以及微软自家的DHTML格式等,使不少网页使用非微软平台及浏览器无法正常显示。DOM即是当时蕴酿出来的杰作。Dom技术使得用户页面可以动态地变化,如可以动态地显示或隐藏一个元素,改变它们的属性,增加一个元素等,Dom技术使得页面的交互性大大地增强。


    2.知识剖析


    什么是DOM节点?

    HTML文档中的所有内容都是节点;
    整个文档是一个文档节点;
    每个HTML元素是元素节点;
    HTML元素内的文本是文本节点;
    HTML元素内的文本是文本节点;
    注释是注释节点。

    常见的DOM操作

    查找节点;新建节点;添加新节点;删除节点;修改节点


    查找结点

    以id的方式查找:document.getElementById

    以class名称方式查找:document.getElementsByClassName

    以标签名称的方式查找:document.getElementsByTagName

    新建节点
    document.createElement('元素名');新建一个元素节点
    document.createAttribute('属性名');新建一个属性节点
    document.createTextNode('文本内容');新建一项文本节点

    添加新节点
    element.setAttribute(attributeName, attributeValue );给元素增加指定属性,并设定属性值
    element.setAttributeNode(attributeName );给元素增加属性节点

    删除节点
    parentNode.removeChild(existingChild );删除已有的子节点,返回值为删除节点
    DOM需要清楚你需要删除的元素,以及它的父元素。找到希望删除的子元素,然后使用其parentNode属性来找到父元素:

    3.常见问题


    4.解决方案


    5.编码实战


    6.扩展思考

    修改节点
    parentNode.replaceChild(newChild, existingChild );用新节点替换父节点中已有的子节点


    7.参考文献

    常见dom树操作

    js中的DOM操作汇总 - 很好玩 - 博客园

    Javascript的DOM操作 - 你真的了解吗? - CSDN博客

    w3school在线教程/菜鸟教程


    8.更多讨论



    问题一

    JavaScript和HTML DOM的区别与联系?

    答:

    区别:

    1、javascript

    JavaScript 是流行的浏览器脚本语言。容易使用。

    JavaScript 被网页用来改进设计、验证表单、检测浏览器、创建cookies等应用。

    2、HTML DOM

    HTML DOM 是 W3C 标准(是 HTML 文档对象模型的英文缩写,Document Object Model for HTML)。

    HTML DOM 定义了用于 HTML 的一系列标准的对象,以及访问和处理 HTML 文档的标准方法。

    通过 DOM,可以访问所有的 HTML 元素,连同它们所包含的文本和属性。可以对其中的内容进行修改和删除,同时也可以创建新的元素。
    HTML DOM 独立于平台和编程语言。它可被任何编程语言诸如 Java、JavaScript 和 VBScript 使用。

    联系:

          1、通过 JavaScript,可以重构整个 HTML 文档。可以添加、移除、改变或重排页面上的项目。要改变页面的某个东西,JavaScript 就需要获得对 HTML 文档中所有元素进行访问的入口。这个入口,连同对 HTML 元素进行添加、移动、改变或移除的方法和属性,都是通过文档对象模型来获得的(DOM)。
          2、Javascript主要是利用HTML DOM去获得、改变、创建HTML元素,从而达到美化页面、操作页面元素的目标。因此,在Javascript中最常见的就是各种各样的HTML DOM元素以及它们各自的属性。除了这些DOM元素外,Javascript有自己的对象,例如数组。

          3、可以认为Javascript主要是操纵HTML DOM。两者是不一样的。 Javascript是语言,DOM是可以在各种语言中(不仅js,php也有的)动态修改文档的模型。


    问题二
    DOM有什么优点和缺点?

    答:
          DOM的优势主要表现在:易用性强,使用DOM时,将把所有的XML文档信息都存于内存中,并且遍历简单,支持XPath,增强了易用性。

           DOM的缺点主要表现在:效率低,解析速度慢,内存占用量过高,对于大文件来说几乎不可能使用。另外效率低还表现在大量的消耗时间,因为使用DOM进行解析时,将为文档的每个element、attribute、processing-instrUCtion和comment都创建一个对象,这样在DOM机制中所运用的大量对象的创建和销毁无疑会影响其效率。


    问题三

    核心DOM和html DOM的区别是什么?

    答:

    核心DOM适合操作节点,如创建,删除,查找等。HTML DOM适合操作属性,如读取或修改属性的值。


    PPT

    视频

    展开全文
  • 网络爬虫又称为网络蜘蛛,是一段计算机程序,它从互联网上按照一定逻辑和算法抓取和下载...网络爬虫抓取策略很多种,按照系统结构和实现技术,大致可以分为以下几种:通用网络爬虫(General Purpose Web Crawl
  • 好程序员分享CSS标签的分类、及显示模式,标签的类型(显示模式) HTML标签一般分为块标签和行内标签...常见的块元素~、、、、、等,其中 标签是最典型的块元素。特点:(重要) 1、独占父亲一行,宽度默认是容器的10...
  • 常见的块元素~、、、、、等,其中标签是最典型的块元素。块级元素的特点:总是从新行开始高度,行高、外边距以及内边距都可以控制。宽度默认是容器的100%可以容纳行内元素和其他块元素。2.行内元素(inline-level)...
  • HTML CSS常见的面试题

    2020-06-09 21:13:05
    1 知道的网页制作会用到的图片格式有哪些 png-8 png-24 gif jpeg svg Webp(重点) webp是谷歌开发的一种旨在加载图片加载速度的图片格式,图片压缩体积大小只有jpeg的三分之二,并能节省大量的服务器带宽资源和数据...

空空如也

空空如也

1 2 3 4 5 ... 8
收藏数 146
精华内容 58
关键字:

常见的网页结构有哪些