精华内容
下载资源
问答
  • URL网址规范化是什么?

    2018-07-23 20:35:14
    当我们在做网站建设的时候,经常有小伙伴会问:网站的URL展现形态真的很重要吗? 蝙蝠侠IT认为:这个问题真的很重要,它主要涉及网站的抓取、收录、排名,因此当你试图...言外之意,就是不要让网站,拥有过多的网站...
    当我们在做网站建设的时候,经常有小伙伴会问:网站的URL展现形态真的很重要吗?

    蝙蝠侠IT认为:这个问题真的很重要,它主要涉及网站的抓取、收录、排名,因此当你试图建立一个新网站的时候,我们有必要针对URL结构设计多加注意!

    ea9fd164e8e8b2e9df840a25486f4269cb40fcb8

    那么,网站建设,站内URL配置,我们需要注意什么呢?

    1、保持目录层级简单

    言外之意,就是不要让网站,拥有过多的网站目录,确保URL地址不要过长,简单举例:

    不建议:/seo/2018/07/23/100.html

    推荐:/seo/100.html或者是/seo/20180723_100.html

    2、URL字母必须小写

    针对不同的服务器,比如:Linux,针对网址中的大小写区别,会被识别成多个URL地址,影响了内容的与网址一一对应的唯一性,这并不友好,会产生大量重复内容,影响特定关键词排名。

    3、URL不一定包含关键词

    很多SEO小伙伴,经常使用URL包含目标关键词的拼音或者英文,实际上这种策略对SEO排名的影响,并没有明显的效果。

    特别是一些包含汉语拼音的目录,造成URL网址特别长,不利于搜索引擎索引排名。

    4、URL形态

    对应URL的形态,我们通常在静态、伪静态、动态之间选择,可以明确的说这三种URL形态都适用于现在的搜索引擎的抓取,只不过针对站点个别情况,我们会有倾向性的推荐:

    数据总量相对较小的网站,我们推荐静态URL。

    数据量相对较大的站点,我们推荐伪静态URL,避免使用动态页面,产生不必要的参数,从而造成重复内容或死链接。

    5、URL中斜杠的使用

    我们需要先明确一个问题,斜杠的使用,针对搜索引擎的识别,以及对页面质量评级是有一定影响的,举例:

    domain/seo/link这相当于一个独立页面。

    domain/seo/link/这相当于一个独立的目录。

    6、如何处理问题URL

    • 确保网址统一化

    如果是伪静态,那么确保所有页面都是伪静态,出现动态页面被收录后,你可能需要利用301重定向将其跳转到伪静态对应的页面。

    • URL大量动态参数

    如果你的页面产生大量的动态参数,你需要在Robots.txt文件中,屏蔽相关动态参数,如果产生过多的死循环,造成蜘蛛陷阱,那么你有必要,将其提交死链接,生成404页面。

    • SessionID的使用

    尽量避免在URL中使用SessionID,如果非常有必要的话,那么尽量采用cookies

    总结:对于网站建设而言,URL相当于是一个网站的流量通道,它合理的指引蜘蛛爬行,同时有效的针对用户进行流量分发,因此,十分重要,值得关注!
    展开全文
  • 作者 | 阮一峰1、概述URL 是“统一资源定位符”(Uniform Resource Locator)的首字母缩写,中文译为“网址”,表示各种资源的互联网地址。下面就是一个典型的 URL。https://www.example.com/path/index.html所谓资源...

    948ffe5bf8fd8a83c3120f3f9ddb01fd.png

    作者 | 阮一峰

    1、概述

    URL 是“统一资源定位符”(Uniform Resource Locator)的首字母缩写,中文译为“网址”,表示各种资源的互联网地址。下面就是一个典型的 URL。
    https://www.example.com/path/index.html
    所谓资源,可以简单理解成各种可以通过互联网访问的文件,比如网页、图像、音频、视频、JavaScript 脚本等等。只有知道了它们的 URL,才可能在互联网上获取它们。只要资源可以互联网访问,它就必然有对应的 URL。一个 URL 对应一个资源,但是同一个资源可能对应多个 URL。URL 是互联网的基础。互联网之所以“互联”,就是因为网页可以通过“链接”(link),包含其他 URL。用户只要点击,就可以从一个 URL 跳转到另一个 URL,前往不同的网站。2、网址的组成部分URL 由多个部分组成。为了讲解,下面是一个比较复杂的 URL。
    https://www.example.com:80/path/to/myfile.html?key1=value1&key2=value2#anchor
    我们看看,这个 URL 的各个部分。2.1、协议协议(scheme)是浏览器请求服务器资源的方法,上例是https://的部分,表示使用 HTTPS 协议。互联网支持多种协议,必须指明网址使用哪一种协议,默认是 HTTP 协议。也就是说,如果省略协议,直接在浏览器地址栏输入www.example.com,那么浏览器默认会访问http://www.example.com。HTTPS 是 HTTP 的加密版本,出于安全考虑,越来越多的网站使用这个协议。HTTP 和 HTTPS 的协议名称后面,紧跟着一个冒号和两个斜杠(://)。其他协议不一定如此,邮件地址协议mailto:的协议名后面只有一个冒号,比如mailto:foo@example.com2.2、主机主机(host)是资源所在的网站名或服务器的名字,又称为域名。上例的主机是www.example.com有些主机没有域名,只有 IP 地址,比如192.168.2.15。这种情况常常出现在局域网。2.3、端口同一个域名下面可能同时包含多个网站,它们之间通过端口(port)区分。“端口”就是一个整数,可以简单理解成,访问者告诉服务器,想要访问哪一个网站。默认端口是80,如果省略了这个参数,服务器就会返回80端口的网站。端口紧跟在域名后面,两者之间使用冒号分隔,比如www.example.com:802.4、路径路径(path)是资源在网站的位置。比如,/path/index.html这个路径,指向网站的/path子目录下面的网页文件index.html互联网的早期,路径是真实存在的物理位置。现在由于服务器可以模拟这些位置,所以路径只是虚拟位置。路径可能只包含目录,不包含文件名,比如/foo/,甚至结尾的斜杠都可以省略。这时,服务器通常会默认跳转到该目录里面的index.html文件(即等同于请求/foo/index.html),但也可能有其他的处理(比如列出目录里面的所有文件),这取决于服务器的设置。一般来说,访问www.example.com这个网址,很可能返回的是网页文件www.example.com/index.html2.5、查询参数查询参数(parameter)是提供给服务器的额外信息。参数的位置是在路径后面,两者之间使用?分隔,上例是?key1=value1&key2=value2查询参数可以有一组或多组。每组参数都是键值对(key-value pair)的形式,同时具有键名(key)和键值(value),它们之间使用等号(=)连接。比如,key1=value就是一个键值对,key1是键名,value1是键值。多组参数之间使用&连接,比如key1=value1&key2=value22.6、锚点锚点(anchor)是网页内部的定位点,使用#加上锚点名称,放在网址的最后,比如#anchor。浏览器加载页面以后,会自动滚动到锚点所在的位置。锚点名称通过网页元素的id属性命名,详见《元素的属性》一章。3、URL 字符URL 的各个组成部分,只能使用以下这些字符。
    • 26个英语字母(包括大写和小写)

    • 10个阿拉伯数字

    • 连词号(-)

    • 句点(.)

    • 下划线(_)

    此外,还有18个字符属于 URL 的保留字符,只能在给定的位置出现。比如,查询参数的开头是问号(?),也就是说,问号只能出现查询参数的开头,出现在其他位置就是非法的,会导致网址解析错误。网址的其他部分如果要使用这些保留字符,必须使用它们的转义形式。URL 字符转义的方法是,在这些字符的十六进制 ASCII 码前面加上百分号(%)。下面是这18个字符及其转义形式。
    • !:%21

    • #:%23

    • $:%24

    • &:%26

    • ':%27

    • (:%28

    • ):%29

    • *:%2A

    • +:%2B

    • ,:%2C

    • /:%2F

    • ::%3A

    • ;:%3B

    • =:%3D

    • ?:%3F

    • @:%40

    • [:%5B

    • ]:%5D

    举例来说,有一个网页的 URL 是foo?bar.html,即文件里面包含一个问号,那么需要写成foo%3Fbar.htmlURL 的合法字符,其实也可以采用这种转义方法,但是不建议使用。比如,字母a的十六进制 ASCII 码是61,转义形式后就是%61。因此,www.apple.com又可以写成www.%61pple.com,浏览器一样识别。值得注意的是,空格的转义形式是%20。对于那些包含空格的文件名,这个转义是必须的。既不属于合法字符、也不属于保留字符的其他字符(比如汉字),理论上不需要手动转义,可以直接写在 URL 里面,比如www.example.com/中国.html,浏览器会自动将它们转义,发给服务器。转义方法是使用这些字符的十六进制 UTF-8 编码,每两位算作一组,然后每组头部添加百分号(%)。举例来说,汉字的 UTF-8 十六进制编码是e4b8ad,每两个字符一组,URL 转义后就为%e4%b8%ad。也就是说,URL 里面凡是有汉字的地方,都要写成%e4%b8%ad。因此,访问www.example.com/中国.html这个网址,需要写成下面的样子。
    www.example.com/%e4%b8%ad%e5%9b%bd.html
    上面代码中,的转义形式是%e4%b8%ad%e5%9b%bd4、绝对 URL 和相对 URLURL 分成两种:绝对 URL 和相对 URL。绝对 URL 指的是,只靠 URL 本身就能确定资源的位置。这意味着,URL 必须带有资源的完整信息,包含协议、主机、路径等部分。前面的例子都是绝对 URL。相对 URL 指的是,URL 不包含资源位置的全部信息,必须结合当前网页的位置,才能定位资源。比如,当前网页的 URL 是https://www.example.com/path/index.html,该网页上面有一个资源,URL 指向a.html,这个就是相对 URL。因为只知道a.html,并不能定位资源。浏览器假定,a.html与当前网址在同一个子目录下面,从而得到绝对 URL https://www.example.com/path/a.html相对 URL 如果以斜杠(/)开头,就表示网站的根目录。否则,必须以当前目录为起点,推算资源的位置。比如,相对 URL /foo/bar.html表示网站根目录的子目录foofoo/bar.html表示在当前目录的foo子目录。URL 还可以使用两个特殊简写,表示特定位置。
    • .:表示当前目录,比如./a.html(当前目录下的a.html文件)

    • ..:表示上级目录,比如../a.html(上级目录下的a.html文件)

    这两种简写可以多个连用,比如../../表示上两级目录。绝对 URL 也可以使用这两个简写,比如www.example.com/./index.html等同于www.example.com/index.html,这时.相当于根目录的当前目录,即根目录本身。

    5、

    标签指定网页内部的所有相对 URL 的计算基准。整张网页只能有一个标签,而且只能放在里面。它是单独使用的标签,没有闭合标签,下面是一个例子。
    标签的href属性给出计算的基准网址,target属性给出如何打开链接的说明(参见《链接》一章)。已知计算基准是https://www.example.com/files/,那么相对 URL foo.html,就可以转成绝对 URL https://www.example.com/files/foo.html注意,标签必须至少具有href属性或target属性之一。阮一峰老师的图书

    18861126a949edfdc153ab83a993a577.png

    cdded768f801ab8ebc5f41cc8e7a6264.png

    展开全文
  • 将您缩短的URL弹出在线杂志,期刊,电子书中……您就这么命名,就是这么简单。 您甚至可以将缩短的URL插入QR码; 生成的代码要简单得多,不需要那么高的dpi即可进行打印。 我们引起您的注意了吗? 如果您想了解更多...
  • URL的全称是Uniform Resoure Locator,翻译过来就是“统一资源定位符”,在SEO中我们基本就可以说是“网址”。对于搜索引擎来说,URL相当于是它的导航,所以它能否为搜索引擎提供便利是至关重要的。今天我们就来说说...

    46b3c1b5d357cee5c8c8afe219607948.png

    URL的全称是Uniform Resoure Locator,翻译过来就是“统一资源定位符”,在SEO中我们基本就可以说是“网址”。对于搜索引擎来说,URL相当于是它的导航,所以它能否为搜索引擎提供便利是至关重要的。今天我们就来说说什么样的URL才算是友好的(能为SEO优化提供帮助的)。

    首先,不同类型网站的SEO友好URL都不相同。在本文中,我们将讨论这其中的差异。强烈建议您在设置URL结构考虑以下基本规则。

    SEO友好URL的基本规则-成都云思禾网络运营

    无论您拥有哪种类型的网站,都有一些适用于所有网站的基本规则。

    • 如果是英文网站。请记住您的URL应该集中,去除功能词(例如“ a”,“ of”,“ the”等)的URL。在99%的情况下,这些词不会给您的URL带来任何价值。如果可能的话,还要去除动词的URL。您的URL中不需要使用诸如“是”或“具有”之类的词来明确该页面的含义。

    • 如果是中文网站。切记URL中不要出现中文,因为中文需要转码,转码后的URL就是搜索引擎不太喜欢的长网址。中文网站的URL应该采用拼音缩写或英文,但不能过长。

    • URL的长度实际上并不是一个因素。我们建议您尽量缩短网址。并不是说搜索引擎不喜欢冗长的URL,而是较短的URL最有可能成为重点,更能让搜索引擎记住。

    • 长度不是什么大问题:搜索引擎会展示他们认为对该访客重要的内容。请记住,元标题和描述的最大截距为512像素,URL也是如此。

    • 如果URL采用英文,请不要使用下划线,因为这些下划线会把单词连接在一起并使它们合二为一。短划线是优选的。

    以上这些是SEO友好URL的基本规则,但SEO友好URL的规则会因网站类型而变化。选择您的网站类型以跳至适用于您网站的规则:

    • 公司网站

    • 网上商店

    • 博客或新闻网站

    公司网站的SEO友好URL-成都云思禾网络运营

    如果您的网站上拥有有关您的公司和服务的信息,并且基本上就是这些信息,那么无论您拥有多少页面,我们都会使用尽可能短的URL。

    • http://example.com/contact/

    • http://example.com/about-us/

    网上商店的SEO友好URL-成都云思禾网络运营

    如果您的网站是在线商店,则有两种处理方法:

    • http://example.com/product-name/

    • http://example.com/category-name/product-name/

    一些内容管理系统会同时创建两种URL。在这种情况下,请使用rel ="canonical"指向您要在搜索引擎中显示的那个。

    问题仍然存在,究竟要使用哪种URL结构呢?一般情况下,SEO友好的URL也应该对您的访客有用。如果您的商店中包含的产品类别比较多,那么请在您的URL中也包含这些类别。这样,您的URL将提醒访问者在您网站上的所处位置:

    • http://example.com/birds/crane

    • http://example.com/equipment/crane

    明白了吗?自行决定您的类别是否添加到产品的URL中。一般来说,URL最好包含类别,因为类别和产品密切相关。

    博客或新闻网站的SEO友好URL-成都云思禾网络运营

    如果您的网站是博客或新闻网站,则可以使用多种方法来构造URL。让我们分别研究这些:

    • http://example.com/post-id/

    • 如果您的网站整体上具有很强的连贯性,则可以考虑只关注文章本身,以创建SEO友好的URL。

    • http://example.com/category-name/post-id/

    • 如果您的网站是新闻网站,并且您正在撰写不同的主题,则添加主题(例如,作为类别名称)将使页面的内容更加清晰。

    • http://example.com/yyyy/mm/dd/post-id/

    • 如果您的网站包含每日新闻,并且该新闻与日期有关,请确保在URL中也包含该日期。如果有人在寻找有关Apple产品的最新新闻,则该页面上的日期是否与今年的iPhone有关,URL中的日期将已经显示。我们的建议:仅在日期重要时才使用URL中的日期。

    总结

    没有一种方法可以创建最佳的SEO友好URL。这取决于您的网站类型,特别是对于博客或新闻网站,有多种选择。关键就是是使您的URL保持唯一、简短、清晰即可。

    展开全文
  • URL网址,电话号码,电子邮件地址及所有链接地址的正则表达式匹配   文章开始把我喜欢的这句话送个大家:这个世界上还有什么比自己写的代码运行在一亿人的电脑上更酷的事情吗,如果有那就是让这个数字再扩大十倍 ...

                   URL网址,电话号码,电子邮件地址及所有链接地址的正则表达式匹配

     

    文章开始把我喜欢的这句话送个大家:这个世界上还有什么比自己写的代码运行在一亿人的电脑上更酷的事情吗,如果有那就是让这个数字再扩大十倍

    1.匹配.com或.cn后缀的URL网址

    pattern="[a-zA-Z]+://[^\s]*[.com|.cn]"

    [^\s]:表示不能有空格

    2.匹配电话号码

    pattern="\d{4}-\d{7}|\d{3}-\d{8}"

    电话号码可能区号为三位或四位,所以用  |  连接,区号和后面数字之间用  -   连接

    3.匹配电子邮件

    pattern="\w+([.+-]\w+)*@\w+([.-]\w+)*\.\w+([.-]\w+)*"

    \w表示匹配任意字母数字下划线

    注意中间部位为    \.   即代表  .  这一转义字符而非正则表达式中的  .   (匹配出换行符外的任意字符)。

    4.链接地址

    pattern= '(https?://[^\s)";]+\.(\w|/)*)'

    s?  即可能有s可能没有s

    /[^\s)";]   即不能是空白字符 “以及;

     

    加油吧,程序员 !

    展开全文
  • 这几天发外链遇到个问题,就是URL中加斜杠和不加斜杠是一回事吗,交换友链的时候也碰到过,一位博主强调要在网址后面加个斜杠,福建seo博客百思不解,就去百度上搜索资料,发现也有很多人有这个疑问,还看到一篇百度...
  • 那么当你在浏览器中键入一行网址后究竟发生了什么?我们下面一起捋一捋。 图解 具体分析 DNS解析 所谓解析就是把方便人类记忆的域名翻译成计算机的ip地址。比如输入的url是www.baidu.com,首先在本地域名服务器中...
  • URL初次理解

    2019-03-03 20:13:14
    Uniform Resource Locaters翻译过来就是统一资源定位器。 比如常用的www.taobao.com是URL吗?并不,这个是大家日常说的网址,网站名 那URL是什么呢,语法来看是这样的scheme://host.domain:port/path/filename ...
  • url结构和解析

    2019-11-14 23:13:05
    Uniform Resource Locaters翻译过来就是统一资源定位器。 比如常用的www.taobao.com是URL吗?并不,这个是大家日常说的网址,网站名 那URL是什么呢,语法来看是这样的scheme://host.domain:port/path/filename 翻译...
  • 精益网址 Firefox插件(实际上是一个网络扩展程序),用于删除恶意的URL参数,例如Google Analytics(分析)的utm参数。 注意 如果您想查看此插件的当前版本,请... 精益URL就是您想要的! 如何从源代码安装它? 火狐
  • 我们可爱的的相对路径一顶是同学们最常使用的,但是,浏览器在处理相对路径时,是以浏览器上接受的url地址为基础进行计算的,也就是说,如果当前的地址为folder/1.aspx,那么,很显然,./section/2.aspx这个页面,...
  • 在浏览器里输入网址或者点击链接,网页打开了……这是我们上网时再普通不过的一幕,但是如此简单的表象背后,却隐藏着无比复杂的技术流程。想涨涨知识吗?往下看吧。 一个HTTP请求的过程 为了简化我们先从一个HTTP...
  • 对于网页上的音频文件会根据网页都有唯一的URL(统一资源定位符,也就是网址)进行定位爬虫,那你知道如何使用python爬虫自动下载网页音频文件吗?本文小编就带领大家进行自动下载网页音频文件的爬虫实战练习。一、...
  • encart老鸟们都知道, 当你修改zencart 分类名称... 这个就是seo模板存在的网址重复问题,下面是解决方案: 第一步: 商店设置-搜索引擎优化-打开自动跳转吗?,设置为 true (这一步非常重要) 第二步: 打开文件/incl
  • 想必不少小伙伴面试过程中,会遇到「当键入网址后,到网页显示,其间发生了什么」的面试题。...简单的网络模型01 孤单小弟 —— HTTP浏览器做的第一步工作是解析 URL首先浏览器做的第一步工作就是要对 URL 进行解...
  • 程序猿的日常解压

    2020-11-23 23:36:40
    1.申请网址 “小李,我们街道的网站做好了吗”; “主任,网站建好了,需要申请网址网址是什么”; 主任打开百度查了下说,“url”; 小李说,好的; 于是:http://url.gov.cn 2.程序员爱情观 爱情就是死循环,一旦...
  • 下面两行代码: # 发送请CSS布局HTML小编今天和大家分享,得到服务器给我们的响应 response = urlliburllib.request.urlopen 就是打开url网址的操作,参数可以是一个url,也可以是一个request对...
  • 这个软件只是帮你提交URL到百度(也就是引蜘蛛过来爬行) 收录与不收录还要看你站内的结果,文章的原创度等等多方面的因素的。 软件的使用说明:首选把要提交的网址写到待提交网址文档中(格式安装里面的一样就...
  • 有些找过工作面试的朋友(特别是爬虫的岗位)应该常常被问到,...我们经常使用浏览器上网,在想要查询某些网站的时候,我们都会在浏览器的地址栏中输入一段字符串,也就是我们常说的「网址」,其实我们说的这个「网址...
  • 有些找过工作面试的朋友(特别是爬虫的岗位)应该常常被问到...我们经常使用浏览器上网,在想要查询某些网站的时候,我们都会在浏览器的地址栏中输入一段字符串,也就是我们常说的「网址」,其实我们说的这个「网址...
  • Enter键的时候触发,可是分析结果永远都是空的,已经测试过了分析的程序没有问题,那问题是不是就是出在了初始化URL的时候是null,虽然按enter时url可以被成功赋值,但程序自己已经执行完了,要怎么解决呢?...
  • 攻防世界-web新手区

    2020-10-15 19:16:05
    法一:在url网址)前段加上view-source:即可,构造 法二:只需要知道查看源码的快捷键是Ctrl+U即可 get_post 题目描述:X老师告诉小宁同学HTTP通常使用两种请求方法,你知道是哪两种吗? 很简单,就是用post跟...
  • ViewTweets-crx插件

    2021-03-08 23:01:01
    查看包含有效Chrome选项卡网址的推文。... 轻松查看包含有效Chrome选项卡...您可以审核这个Github回购代码(这就是为什么我公开)。 请通过Twitter发送任何问题/反馈/错误/感激之情 - @ julianweisser 支持语言:English
  • 通常情况下我们从Git上clone代码时通常有两种形式第一种就是(HTTPS)第二种就是(SSH) ... ... 那么这两种路径有什么不一样的吗。...1.前者是HTTPS url 不需要git环境,直接用浏览器网址打开。但是用户每次通过git提交的时
  • CORS跨域请求 同源地址: ...如果两个域名不同,解析后的IP相同,这也是非同源,所以这里就是一个很大的坑 跨域请求: 当浏览器发起请求时,如果源请求页面地址和被请求地址不是同源地址,那么这个
  • 下面,我们先来讲一讲简单地模拟登陆,这次模拟登录的网站是英语课本随行课堂《视听说教程3》上的听力训练网址:外教社课程中心工具如下:IDE:pycharm python3.6OS:window10抓包分析首先我们看一下 url get到的...
  • 最近一直在使用firefox浏览器(版本:57.0.1(64位)),同步书签特别方便,但是最近发现当访问的一个不存在的网址时,连接失败页面竟然有广告!firefox不是号称没有广告吗? 分析 F12查看一下广告页面源代码,发现...
  • 上次我们教大家如何使用...先来设置两个url地址,第一个用于第一次访问,这样可以获得网站服务器发来的cookie,第二个网址是用于登陆的地址 引入两个模块,cookielib和urllib2 接着,我们安装一个cook

空空如也

空空如也

1 2 3
收藏数 55
精华内容 22
关键字:

url就是网址吗