url_urllib - CSDN
url 订阅
统一资源定位系统(uniform resource locator;URL)是因特网的万维网服务程序上用于指定信息位置的表示方法。它最初是由蒂姆·伯纳斯·李发明用来作为万维网的地址。现在它已经被万维网联盟编制为互联网标准RFC1738。 展开全文
统一资源定位系统(uniform resource locator;URL)是因特网的万维网服务程序上用于指定信息位置的表示方法。它最初是由蒂姆·伯纳斯·李发明用来作为万维网的地址。现在它已经被万维网联盟编制为互联网标准RFC1738。
信息
外文名
uniform resource locator;URL
中文名
统一资源定位系统
统一资源定位系统基本介绍
因特网上的可用资源可以用简单字符串来表示,该文档就是描述了这种字符串的语法和语义。而这些字符串则被称为:“统一资源定位器”(URL)。这篇说明源于万维网全球信息主动组织(World Wide Web global informationinitiative)介绍的概念。RFC1630《通用资源标志符》描述了一些对象数据,他们自1990年起就开始使用这些对象数据。这篇URL说明符合《因特网资源定位符的功能需求(Functional Requirements for Internet Resource Locators)》中说明的需求。这篇文档是由工程任务组织(IETF)的URI工作小组写的 [1]  。
收起全文
精华内容
参与话题
  • URL

    千次阅读 多人点赞 2020-06-07 22:15:04
    URL URL指的是统一资源定位符(Uniform Resource Locator)。 URL无非就是一个给定的独特资源在Web上的地址。理论上说,每个有效的URL都指向一个独特的资源。这个资源可以是一个HTML页面,一个CSS文档,一幅图像,...

    URL

       URL指的是统一资源定位符(Uniform Resource Locator)。
       URL无非就是一个给定的独特资源在Web上的地址。理论上说,每个有效的URL都指向一个独特的资源。这个资源可以是一个HTML页面,一个CSS文档,一幅图像,等等。而在实际中,有一些例外,最常见的情况就是URL指向了不存在的或是被移动过的资源。由于通过URL呈现的资源和URL本身由Web服务器处理,因此web服务器的拥有者需要认真地维护资源以及与它关联的URL。
       作为一个小白,看到这个高级的专业词汇时,我是懵的,经过各方面搜索后,终于有了一点点认识,不容易!!
       我浅显的把它理解为——网址(个人理解)
       示例:http://www.example.com:80/path/to/myfile.html?key1=value1&key2=value2#SomewhereInTheDocument
       下面来分析一下它的几个部分:
       1、http:// ——HTTP协议(超文本转移协议),当然也可以是其他协议。
       2、www.baidu.com ——域名,表明在访问哪个服务器,当然也可以用IP地址代替。
       3、:80 —— 端口,用于访问Web服务器上的资源的技术“门”。
       4、/path/to/myfile.html —— 网络服务器上资源的路径。
       5、?key1=value1&key2=value2 —— 提供给网络服务器的额外参数。这些参数用&分隔开。
       6、#SomewhereInTheDocument —— 资源本身的另一部分的锚点,锚点像一个迅速定位器一样,可以在网页中设置标记,然后创建链接,创建的链接可以使我们迅速访问到指定位置(想到了书签~~)
    
    展开全文
  • URL(Uniform Resource Locator,统一资源定位器),URL用于互联网上的文档或者其他资源进行寻址。一个完整的网址,例如:http://www.crazyit.org/index.jsp/index.php,遵守如下语法规则:scheme://host.domain:port/...

    URL(Uniform Resource Locator,统一资源定位器),URL用于互联网上的文档或者其他资源进行寻址。

    一个完整的网址,例如:http://www.crazyit.org/index.jsp/index.php,遵守如下语法规则:

    scheme://host.domain:port/path/filename

    关于URL地址的解释 :

    • scheme:指定因特网服务的类型。最流行的类型是HTTP。
    • domain:指定因特网域名,比如:crazyit.org、fkjava.org等。
    • host:指定此域中的主机。如果被省略,HTTP的默认主机是www。
    • port:指定主机的端口号。端口号通常可以被省略,HTTP服务的默认端口号是80。
    • path:指定远程服务器上的路径,该路径也可以被省略,省略该路径则默认被定位到网站的根目录。
    • filename:指定远程文档的名称。如果省略该文件名,通常会定位到index.html、index.htm等文件,或定位到WEB服务器设置的其他文件。

    下表显示了URL最流行的scheme以及对应的资源。

    scheme对应资源
    file访问本地磁盘上的文件
    ftp访问远程FTP服务器上的文件
    http访问WWW服务器上的文件
    news访问新闻组上的文件
    telnet访问Telnet连接
    gopher访问远程Gopher服务器上的文件
    例如以下几个链接:
    1. <a href="news:yeeku.html">HTML Newgroup</a>,该链接将会产生一个访问新闻组资源的超链接。
    2. <a href="ftp://www.crazyit.org/tomact.rar">下载 Tomact</a>,该链接将会产生一个指向FTP资源的链接。
    3. <a href="mailto:sujin@163.com">写信给我</a>,该链接会产生一个邮件链接,点击链接将会开始发送电子邮件。

    ---------------------如果大家喜欢我的博客,可以点击左上角的关注哦。

    展开全文
  • HTTP协议——URL

    万次阅读 多人点赞 2018-06-07 11:50:06
    URL 是一种 URI,它标识一个互联网资源,并指定对其进行操作或获取该资源的方法。可能通过对主要访问手段的描述,也可能通过网络“位置”进行标识。 大部分URL遵循一种标准格式,该格式包含三个部分: 第一部分:...

            URL 是一种 URI,它标识一个互联网资源,并指定对其进行操作或获取该资源的方法。可能通过对主要访问手段的描述,也可能通过网络“位置”进行标识。

            大部分URL遵循一种标准格式,该格式包含三个部分:
            第一部分:方案,方案告知Web客户端怎样访问资源
            第二部分:服务器的位置,告知Web客户端资源位于何处。

            第三部分:指定服务器上某个资源,说明了请求的是服务器上的哪个特定的资源。

    1、URL格式

    大多数URL协的语法都建立在下面9个部分构成的通用格式上:
    <scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
    其中最重要的3个部分是:方案(scheme)、主机(host)和路径(path)

    2、URL组成部分介绍

    组件

    描述

    默认值

    方案

    访问服务器以获取资源时要使用哪种协议

    用户

    某些方案访问资源时需要的用户名

    匿名

    密码

    用户名后面可能要包含的密码,中间由冒号分隔

    <E-mail 地址>

    主机

    资源宿主服务器的主机名或点分IP地址

    端口

    资源宿主服务器正在监听的端口号。很多方案都有默认端口号

    每个方案特有

    路径

    服务器上资源的本定名,由斜杠将其与前面的URL组件分隔开来。路径组件的语法是与服务器和方案有关。

    参数

    某些方案会用这个组件来指定输入参数。参数为名/值对。URL中可以包含多个参数字段,它们相互之间以与路径的其余部分之间用分号(;)分隔。

    查询

    某些方案会用这个组件传递参数以激活因公程序。查询组件的内容没有通用格式。用字符”?”将其与URL的其余部分分隔开来。

    片段

    一小片或者一部分资源的名字。引用对象时,不会将frag字段传送给服务器。这个字段是在客户端内部使用的。通过字符”#”将其与URL的其余部分分隔开来。

     方案
            规定如何访问指定资源的主要标识符,它会告诉负责解析URL的应用程序应该使用搞什么协议。
            方案组件必须以一个字母符号开始,由第一个“:”符号将其与URL其余部分分隔开来。(方案名大小写不敏感)

    主机和端口
            URL的主机和端口组件告诉应用程序要从哪台机器装在资源,以及在哪台机器的什么地方可以找到对目标资源进行访问的服务器。
            主机组件标识了往上能访问资源的宿主机器。可用主机名或者IP地址来表示主机名。
    端口组件标识了服务器正在监听的网络端口。

    用户名和密码
            很多服务器要求输入用户名和密码才会允许用户访问数据,如FTP。

    如果某个应用程序使用的URL协议要求输入用户名密码,但用户没有提供,通常会插入一个默认的用户名和密码。如ftp://ftp.prep.ai.mit.edu/pub/gnu,指定了一个用户名anonymous,与主机组合在一起,看起来像一个email地址一样;字符“@”将用户名和密码组件与其他部分分隔开来ftp://anonymous:my_password@ftp://ftp.prep.ai.mit.edu/pub/gnu指定了用户名和密码,两者之间由字符“:”隔开。


    路径
            URL的路径组件说明了资源位于服务器的什么地方。路径通常很像一个分级的文件系统路径。路径是服务器定位资源所需的信息,可以用“/”将http URL中的路径组件划分为一些路径段(path segment),每个路径段都有自己的参数字段。

    参数
            对很多协议来说,只有简单的主机名和到达对象路径的是不够的,除了端口和用户名密码,还需要更多的内容才可以访问有些负责解析URL的应用程序需要协议参数才能工作;否则服务器不会提供服务,或者提供错误的服务,比如ftp协议有两种传输方式:二进制和文本。如果用文本形式传送二进制图片,结果很难预料有多糟糕参数组件是URL中的名值队列表,由“/”将其与其他部分分隔开,比如ftp://ftp.prep.ai.mit.edu/pub/gnu;type=d 参数为type=d,其中参数名为type,值为d

    查询字符串
            在我们发送请求时,很多的资源,比如数据库服务,都可以通过查询来缩小请求资源的类型范围,例如
    http://www.joes-hardware.com/inventoty-check.cgi?itcm-12731 问号(?)右边的内容就是这个URL的查询组件。URL的查询组件和标识网关资源的URL路径组件一起被发送给网关资源。可以将网关当做访问其他应用程序的访问点

    片段
            有些资源类型,比如HTML,除了资源级意外,还可以进一步划分,比如一个带有章节的大型文本文档,资源的URL会指向整个文档,但理想情况,可以指向资源中的章节为了方便引用,URL允许使用片段(frag)组件来表示资源内的一个片段,片段挂在URL右边,最前面有一个字符“#”,比如:http://www.joes-hardware.comtools.html#drills 这个例子中,片段引用了joes-hardwareweb服务器上页面/tools.html中的一个部分,这部分名字叫drills。

     

    3、URL快捷方式

            Web客户端可以理解并使用几种URL快捷方式。相对URL是在某资源内部指定一个资源的便捷略所方式。很多浏览器支持自动拓展,用户输入URL的关键部分,然后由浏览器将其余部分填充。

    3.1相对URL

    URL有绝对URL和相对URL两种方式。绝对URL里包含有访问资源所需的全部信息;相对URL是不完整的,要从相对URL中获取访问资源所需的全部信息,就必须相对另一个被称为基础的URL进行解析。相对URL是URL的一种便捷缩略记法。
    例如在http://www.joes-hardware.com/tools.html的html文档中,包含一个URL ./hammers.html的超链接,这个URL看似不完整,但实际是合法的相对URL。这个URL是相对于它所在的文档的URL来进行解析的。
    使用缩略形式的相对URL语法,HTML的编写就可以省略URL中的方案、主机等组件。这些组件都可以从他们所属资源的基础URL推算出来。
    下图说明了如何从基础URL中推导出缺失的组件信息


    相对URL只是URL的片段或一小部分,处理URL的应用程序需要在相对和决定URL之间进行转换。相对URL为了保持一组资源(HTML页面)的便捷性提供了一种便捷方式,如果使用相对URL,可以在搬移一组文档时,仍保持链接的有效性;因为相对URL是相对于新基础进行解释的,类似于在其他服务器提供镜像内容等功能。

    基础URL

            转换处理的第一步就是找到基础URL,基础URL是作为相对URL的参考点使用的。基础URL可以来自以下几个地方:
    (1)、在字眼中显示提供:有些资源会显示地指定基础URL。
    (2)、封装资源的基础URL:在一个没有显示指定基础URL的资源中发现了一个相对URL,则可以将它所属资源的URL作为基础。
    (3)、没有基础URL:如果没有基础URL,则证明这个相对URL是一个不完整的或者损坏了的URL。

    解析相对引用

            解析:要将相对URL转换为一个决定URL,需要将相对URL和决定URL划分成组件段,这样,实际上只是在解析URL,但这种做法会将其划分为一个个组件,可以称之为解析/分解URL。
    将基础和相对URL划分成组件,可以下用下图的算法来完成转换


    这个算法将一个相对URL转换成了其绝对模式,之后,就可以用其引用资源。

    自动拓展URL

            很多浏览器会在用户提交URL/输入URL时尝试自动扩展URL,这样为用户提供便捷,用户不需要输入完整的URL,浏览器自动扩展
            自动扩展特性有以下2种方式:
    (1)、主机名扩展:在主机名扩展中,只要有些小提示,浏览器通常就可以在没有帮助的情况下,将你输入的主机名扩展为完整的主机名。
    (2)、历史扩展:将以前用户访问过的URL记录储存起来,当用户输入URL时将其与历史记录中的URL前缀进行匹配,并提供一些完整的选项供用户选择PS:与代理一起使用时,URL自动扩展的行为可能有所不同,后面详细解释

    4、URL字符集

            URL是可移植的:因为URL要统一地命名因特网上的所有资源,而不同的协议在传输数据时都会使用不同的机制,因此URL可以通过任意因特网协议安全地传输是很重要的。
            URL是可读的:因此,即使不可见、不可打印的字符能够穿越邮件程序,从而成为可移植的,也不能在URL中使用。
            URL是完整的:有时候人们会希望URL中包含除通用的安全字母表之外的二进制数据或字符。因此需要一种转移机制,能够将不安全的字符编码为安全字符,再进行传输。

    URL字符集

            很多计算机应用程序使用的是US-ASCII字符集,使用7位二进制来表示英文大机子提供的大多数按键和少数用于文本格式和硬件通知的不可打印控制字符。US-ASCII可移植性很好,但是不支持数百种非罗马语言中常见的变体字符。
            因此引入了转义序列集,通过转义序列,就可以用US-ASCII字符集的有限自己对任意自复制或数据进行编码了,这样实现了可移植性和完整性。

    编码机制

        为了避开安全字符集带来的限制,人们设计了“转义”表示法来表示不安全字符,其中包含一个百分号(%),后面跟2个表示字符ASCII码的十六进制数。例如,~符号转义成%7E,%符号转义成%25,=符号转义成%3D。

    字符限制

        在URL中,有几个字符被保留下来,有特殊意义,不建议使用。如果要用于保留用途以外的场景时,要在URL中对其进行编码。

    字符

    保留/受限

    %

    保留作为编码字符的转义标志

    /

    保留作为路径组件中分隔路径段的定界符

    .

    保留在路径组件中使用

    ..

    保留在路径组件中使用

    #

    保留作为分段定界符使用

    ?

    保留作为查询字符串定界符使用

    ;

    保留作为参数定界符使用

    :

    保留作为方案、用户/口令,以及主机/端口组件的定界符使用

    $,+

    保留

    @&=

    在某些方案的上下文中有特殊的含义,保留

    {}|\^~[]’ <>”

    由于各种传输Agent代理,比如各种网关的不安全处理,使用受限不安全;这些字符在URL范围之外通常是有意义的,所以应该对其进行编码。

    0x00-0x1F,0x7F

    受限,这些十六进制范围内的字符都在US-ASCII字符集的不可打印区间内。

    >0x7F

    受限,十六进制值在此范围内的字符都不在US-ASCII字符集的7二进制位范围内。


    展开全文
  • 什么是URL

    千次阅读 多人点赞 2019-04-27 03:34:15
    URL(Uniform Resource Locator)的意思是统一资源定位符,是用于完整地描述Internet上网页和其他资源的地址的一种标识方法,也被称为"网址"。 tip:在Internet上所有资源都有一个独一无二的URL地址,我们可以通过在字...

    URL(Uniform Resource Locator)的意思是统一资源定位符,是用于完整地描述Internet上网页和其他资源的地址的一种标识方法,也被称为"网址"。
    tip:在Internet上所有资源都有一个独一无二的URL地址,我们可以通过在字蓝旗地址栏中输入URL实现对资源的访问。

    URL的组成

    我们以百度的域名为例子:http://www.baidu.com:80/
    1.协议部分
    这里使用的HTTP协议,即超文本传输协议,该协议支持简单的请求和响应会话,对于Web服务器,最常用的是HTTP协议.
    tip:除了HTTP协议以外,还有File、Ftp协议等
    2.服务器域名或IP地址部分
    在前面讲解B/S架构时,曾经说过Web应用是运行于Web服务器端的,而IP地址指的就是服务器在网络中的地址,不过现在基本所有的网站所使用的都是由dns域名系统所分配的域名。
    3.端口号
    端口是服务器用于内外部通信的通道,当用户访问服务器时必须从要求的端口访问才能正常打开网页。
    举例:有人去你家里做客,一般只能通过正门进入,后门、窗户、烟囱等都是不允许的。
    tip:我们正常访问网站不需要填写域名是因为浏览器默认访问端口为80端口,而大部分网站都默认开启80端口,所以直接就可以访问
    例:http://www.baidu.com:80可以被打开,而http://www.baidu.com:123456不可以被打开。
    4.路径
    一般网页的所有资源不会只保存在同一级目录中,举例:
    http://www.w3school.com.cn/cssref/css_selectors.ASP
    在这个链接中,www.w3school.com.cn是根目录,之后的cssref就是子目录了。

    最后总结一下,URL由协议、域名或IP、端口号、路径组成。

    目录指引

    JSP+Servlet——由浅入深及问题总结

    最后更新于2019年4月27日
    原创不易,如果该文章对你有所帮助,望左上角点击关注~如有任何技术相关问题,可通过评论联系我讨论,我会在力所能及只能进行相应回复以及开单章解决该问题.

    该文章如有任何错误请在评论中指出,感激不尽,转载请附出处!
    个人博客首页:https://blog.csdn.net/yjrguxing ——您的每个关注和评论都对我意义重大

    展开全文
  • 一个完整的URL包括的内容(转载)

    千次阅读 2018-05-07 11:51:13
    一个完整的URL地址包含什么假设这是一个url地址http://localhost:8080/a/b/c?a=1&amp;b=2#abc,里面包含的部分:protocol: 'http:',//协议host: 'localhost:8080',port: '8080',//端口hostname: 'localhost',...
  • #,井号:表示网页中的一个位置,被称之为锚点,常用于某个网页间不同位置的跳转,简单的说就是在一个网页中,URL 不变的情况下,通过添加“#buy”的字符在 URL 最后可以跳转到当前网页中已经定义好的锚点(id=”buy...
  • URL中“#” “?” &“”号的作用

    万次阅读 2018-09-16 23:28:56
    一、URL特殊符号解析 URL无法显示某些特殊符号,这个时候就要使用编码了。编码的格式为:一个百分号,后面跟对应字符的ASCII(16进制)码值。例如,空格的编码值是”%20“。  URL中易出现的特殊字符: 特殊含义...
  • HTTP简介 HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。 HTTP是一个基于TCP/IP通信协议来传递数据(HTML ... ...
  • URL中的#、?、&解释

    万次阅读 多人点赞 2018-10-30 10:03:22
    目录 一、#说明 二、?说明 三、&amp;说明 一、#说明 1、#的涵义  #代表网页中的一个位置。...浏览器读取这个URL后,会自动将print位置滚动至可视区域。 为网页位置指定标识符,有两个方法。一是使...
  • URL详解

    千次阅读 2017-04-05 20:08:32
    一:URL举例 就以下面这个URL为例,介绍下普通URL的各部分组成 http://www.aspxfans.com:8080/news/index.asp?boardID=5&ID=24618&page=1#name 从上面的URL可以看出,一个完整的URL包括以下几部分: 1....
  • 有时候想自动将预制添加到场景中,但是又不想破坏预制的链接关系,这时候可以使用PrefabUtility类进行操作。 1、使用AssetDatabase.GetAssetPath获取预制路径 foreach (Object obj in Selection.objects) { ...
  • HttpClient 请求 URL字符集转码问题

    万次阅读 2019-10-24 14:21:05
    问题是这样的,我用eclipse发送httpclient请求如下没有问题,但是在idea中就返回400,为毛呢???excuse me? package com.vol.timingTasks; import org.apache.http.HttpEntity; import org.apache....
  • URI和URL的区别比较与理解

    万次阅读 多人点赞 2020-06-11 15:55:53
    一、URI <1>什么是URI URI,通一资源标志符(Uniform Resource Identifier, URI),表示的是web上每一种可用的资源,如 HTML文档、图像、视频片段、程序等都由一个URI进行定位的。 <......
  • URL和URI(一)URL

    千次阅读 2018-09-27 15:47:24
    URL类 public URL(String url) throws MalformedURLException public URL(String protocol, String host, int port, String file) throws MalformedURLException public URL(String protocol, String host, ...
  • Failed to configure a DataSource: 'url' attribute is not specified and no embedded datasource could be configured. 翻译就是:无法配置DataSource:未指定'url'属性,也无法配置嵌入数据源。 很明显,...
  • JDBC连接ORACLE的三种URL格式

    万次阅读 多人点赞 2020-07-25 22:35:17
    使用jdbc连接oracle时url有三种格式格式一: Oracle JDBC Thin using an SID: jdbc:oracle:thin:@host:port:SID Example: jdbc:oracle:thin:@localhost:1521:orcl 这种格式是最简单也是用得最多的 你的oracle的...
  • 一、网络爬虫的定义 网络爬虫,即Web Spider,是一个很形象的名字。 把互联网比喻成一个蜘蛛网,那么Spider就是在网上爬来爬去的蜘蛛。 网络蜘蛛是通过网页的链接地址来寻找网页的。 从网站某一个页面(通常是首页)...
  • 在爬取boss直聘时出现这种错误,于是搜索了网上很多文章,总结如下: ... import requests requests.adapters.DEFAULT_RETRIES = 5 # 增加重连次数 s = requests.session() ...s.get(url) # 你需要的网址 2....
  • URL 代表一个统一资源定位符,它是指向互联网“资源”的指针。资源可以是简单的文件或目录,也可以是对更为复杂的对象的引用,也就是我们常说的域名、浏览器访问地址。 在Java中就是使用URL访问网络资源,获取...
  • URL原理、URL编码、URL特殊字符

    万次阅读 2018-09-26 10:35:09
    From: http://blog.csdn.net/chenlycly/article/details/51820727 From: http://blog.csdn.net/zmx729618/article/details/51381655 From: ...   HTML URL 编码参考手册:htt...
1 2 3 4 5 ... 20
收藏数 3,663,156
精华内容 1,465,262
关键字:

url