一般地,URL和URI比较难以区分。接下来,本文以区分URL和URI为引子,详细介绍URL的用法,JavaScript重文·也许你该知道浏览器输入 URL 后发生了什么?
与URI区别
URI是Uniform Resource Identifier的缩写,称为统一资源标识符。URI是一个通用的概念,由两个主要的子集URL和URN构成,URL是通过描述资源的位置来标识资源的,而URN则是通过名字来识别资源的,与它们当前所处位置无关
URL是Uniform Resource Locator的缩写,称为统一资源定位符。URL正是使用web浏览器等访问web页面时需要输入的网页地址
URL是一种强有力的工具。但URL并不完美。它表示的是实际的地址,而不是准确的名字。这种方案的缺点在于如果资源被移走了,URL也就不再有效了。那时,它就无法对对象进行定位了
如果有了对象的准确名称,则不论其位于何处都可以找到这个对象。就像人一样,只要给定了资源的名称和其他一些情况,无论资源移到何处,都能够追踪到它。为了应对这个问题,因特网工程任务组(Internet Engineering Task Force, IETF) 已经对URN的新标准做了一段时间的研究了。无论对象搬移到什么地方,URN都能为对象提供一个稳定的名称
但是,从URL转换成URN是一项巨大的工程,支持URN需要进行很多改动——标准主体的一致性,对各种HTTP应用程序的修改等。所以,还要等待更合适的时机才能进行这种转换
URL语法URL语法建立在由下面9部分构成的通用格式上。其中,URL最重要的3个部分是方案(scheme)、主机(host)和路径(path)
<scheme>://<user>:<password>@<host>:<port>/<path>:<params>?<query>#<frag>
【方案】
方案实际上是规定如何访问指定资源的主要标识符,它会告诉负责解析URL的应用程序应该使用什么协议
方案组件必须以一个字母符号开始,由第一个“:”符号将其与URL的其余部分分隔开来。方案名是大小写无关的,因此URL“http://www.hardware.com”和“HTTP://www.hardware.com” 是等价的
常见的方案如下
1、HTTP
HTTP是一种超文本传输协议方案,除了没有用户名和密码之外,与通用的URL格式相符。如果省略了端口,就默认为80
基本格式:
http://<host>:<port>/<path>?<query>#<frag>
示例:
http://www.hardware.com/index.htmlhttp://www.hardware.com:80/index.html
2、https
方案https与方案http是一对。唯一的区别在于方案https使用了网景的SSL, SSL为HTTP连接提供了端到端的加密机制。其语法与HTTP的语法相同,默认端口为443
基本格式:
https://<host>:<port>/<path>?<query>#<frag>
示例:
https://www.hardware.com/secure.html
3、Mailto
Mailto URL指向的是E-mail地址。由于E-mail的行为与其他方案都有所不同(它并不指向任何可以直接访问的对象),所以mailto URL的格式与标准URL的格式也有所不同
示例:
mailto:joe@hardware.com
4、FTP
文件传输协议URL可以用来从FTP服务器上下载或向其上传文件,并获取FTP服务器上的目录结构内容的列表
在Web和URL出现之前,FTP就已经存在了。Web应用程序将FTP作为一种数据访问方案使用
基本格式:
ftp://<user>:<password>@<host>:<port>/<path>;<params>
示例:
ftp://anonymous:joe@hardware.com@prep.ai.mit.edu:21/pub/gnu/
5、rtsp,rtspu
RTSP URL是可以通过实时流传输协议(Real Time Streaming Protocol)解析的音/视频媒体资源的标识符
方案rtspu中的u表示它是使用UDP协议来获取资源的
基本格式:
rtsp://<user>:<password>@<host>:<port>/<path>rtspu://<user>:<password>@<host>:<port>/<path>
示例:
rtsp://www.hardware.com:554/interview/cto_video
6、file
方案file表示一台指定主机(通过本地磁盘、网络文件系统或其他一些文件共享系统)上可直接访问的文件。各字段都遵循通用格式。如果省略了主机名,就默认为正在使用URL的本地主机
基本格式:
file ://<host>/<path>
示例:
file://OFFICE-FS/policies/casual-fridays.doc
7、telnet
方案telnet用于访问交互式业务。它表示的不是对象自身,而是可通过telnet协议访问的交互式应用程序(资源)
基本格式:
telnet://<user>:<password>@<host>:<port>/
示例:
telnet://slurp:webhound@joes-hardware.com:23/
[注意]除了以上常见的7种方案之外,如果要查看全部的URI方案列表,请移步至https://www.w3.org/Addressing/schemes.html
【主机和端口】
要想在因特网上找到资源,应用程序要知道是哪台机器装载了资源,以及在那台机器的什么地方可以找到能对目标资源进行访问的服务器。URL的主机和端口组件提供了这两组信息
主机组件标识了因特网上能够访问资源的宿主机器。可以用上述主机名(www.hardware.com)或者IP地址来表示主机名
[注意]IP地址可以是192.168.1.1这类IPv4地址名,还可以是[0:0:0:0:0:0:0:1]这样用括号括起来的IPv6地址名
比如,下面两个URL就指向同一个资源——第一个URL通过主机名,第二个通过IP地址指向服务器:
http://www.hardware.com:80/index.html http://161.58.228.45:80/index.html
端口组件标识了服务器正在监听的网络端口。对下层使用了TCP协议的HTTP来说,默认端口号为80
【用户名和密码】
很多服务器都要求输入用户名和密码才会允许用户访问数据。FTP服务器就是这样一个常见的实例
ftp://ftp.prep.ai.mit.edu/pub/gnuftp://anonymous@ftp.prep.ai.mit.edu/pub/gnuftp://anonymous:my_passwd@ftp.prep.ai.mit.edu/pub/gnu http://joe:joespasswd@www.joes-hardware.com/sales_info.txt
第一个例子没有用户或密码组件,只有标准的方案、主机和路径。如果某应用程序使用的URL方案要求输入用户名和密码,比如FTP,但用户没有提供,它通常会插入一个默认的用户名和密码。比如,如果向浏览器提供一个FTP URL,但没有指定用户名和密码,它就会插入anonymous(匿名用户)作为你的用户名,并发送一个默认的密码(IE会发送IEUser)
第二个例子显示了一个指定为anonymous的用户名。这个用户名与主机组件组合在一起,看起来就像E-mail地址一样。字符将用户和密码组件与URL的其余部分分隔开来
在第三个例子中,指定了用户名(anonymous)和密码(my_passwd),两者之间由字符“:”分隔
【路径】
URL的路径组件说明了资源位于服务器的什么地方。路径通常很像一个分级的文件系统路径
http://www.hardware.com:80/seasonal/index-fall.html
这个URL中的路径为/seasonal/index-fall.html,很像UNIX文件系统中的文件系统路径。路径是服务器定位资源时所需的信息。可以用字符“/”将HTTP URL的路径组件划分成一些路径段(path segment),每个路径段都有自己的参数(param)组件
【参数】
对很多方案来说,只有简单的主机名和到达对象的路径是不够的。除了服务器正在监听的端口,以及是否能够通过用户名和密码访问资源外,很多协议都还需要更多的信息才能工作
负责解析URL的应用程序需要这些协议参数来访问资源。否则,另一端的服务器可能就不会为请求提供服务,或者更糟糕的是,提供错误的服务。比如,像FTP这样的协议,有两种传输模式:二进制和文本形式。肯定不希望以文本形式来传送二进制图片,这样的话,二进制图片可能会变得一团糟
为了向应用程序提供它们所需的输入参数,以便正确地与服务器进行交互,URL中有一个参数组件。这个组件就是URL中的名值对列表,由字符“;”将其与URL的其余部分(以及各名值对)分隔开来。它们为应用程序提供了访问资源所需的所有附加信息。比如:
ftp://prep.ai.mit.edu/pub/gnu;type=d
在这个例子中,有一个参数type=d,参数名为type,值为d
如前所述,HTTP URL的路径组件可以分成若干路径段。每段都可以有自己的参数。比如:
http://www.hardware.com/hammers;sale=false/index.html;graphics=true
这个例子就有两个路径段,hammers和index.html。hammers路径段有参数sale,其值为false。index.html段有参数graphics,其值为true
【查询字符串】
很多资源,比如数据库服务,都是可以通过提问题或进行査询来缩小所请求资源类型范围的。假设数据库中维护着一个未售货物的清单,并可以对淸单进行査询,以判断产品是否有货,那就可以用下列URL来査询Web数据库网关,看看编号为12731、颜色为blue、尺寸为large的条目是否有货:
http://www.hardware.com/inventory-check.cgi?item=12731&color=blue&size=large
这个URL的大部分都与我们见过的其他URL类似。只有问号(?)右边的内容是新出现的。这部分被称为查询(query)组件。URL的査询组件和标识网关资源的URL路径组件一起被发送给网关资源
除了有些不合规则的字符需要特别处理之外,对査询组件的格式没什么要求。按照常规,很多网关都希望査询字符串以一系列“名/值”对的形式出现,名值对之间用字符“&”分隔
【片段】
有些资源类型,比如HTML,除了资源级之外,还可以做进一步的划分。比如,对一个带有章节的大型文本文档来说,资源的URL会指向整个文本文档,但理想的情况是,能够指定资源中的那些章节
为了引用部分资源或资源的一个片段,URL支持使用片段(frag)组件来表示一个资源内部的片段。比如,URL可以指向HTML文档中一个特定的图片或小节
片段挂在URL的右手边,最前面有一个字符“#”。比如:
http://www.hardware.com/tools.html#drills
在这个例子中,片段drills引用了Web服务器上页面/tools.html中的一个部分。这部分的名字叫做drills
HTTP服务器通常只处理整个对象,而不是对象的片段,客户端不能将片段传送给服务器。浏览器从服务器获得了整个资源之后,会根据片段来显示感兴趣的那部分资源
字符
URL的设计者们认识到有时人们可能会希望URL中包含除通用的安全字母表之外的二进制数据或字符。因此,需要有一种转义机制,能够将不安全的字符编码为安全字符,再进行传输
人们设计了一种编码机制,用来在URL中表示各种不安全的字符。这种编码机制就是通过一种“转义”表示法来表示不安全字符的,这种转义表示法包含一个百分号(%),后面跟着两个表示字符ASCII码的十六进制数
下面是一些例子
在URL中,有几个字符被保留起来,有着特殊的含义。有些字符不在定义的US- ASCII可打印字符集中。还有些字符会与某些因特网网关和协议产生混淆,因此不赞成使用
下面列出了保留及受限的字符
常见的三种编码方法
【encodeURI()】
encodeURI()函数把字符串作为URI进行编码,实际上enchodeURI()函数只把参数中的空格编码为 ,其余特殊字符均不会转换
encodeURI()的不编码字符有82个:
! # $ & ' ( ) * , - . / : ; = ? @ _ ~ 0-9 a-z A-Z
使用方式
//'http://www.w3school.com.cn<br />'console.log(encodeURI("http://www.w3school.com.cn") "<br />")//'http://www.w3school.com.cn/My first/'console.log(encodeURI("http://www.w3school.com.cn/My first/"))//',/?:@&= $#'console.log(encodeURI(",/?:@&= $#"))
[注意]encodeURI()可以编码中文
//'测试'console.log(encodeURI('测试'));
【decodeURI()】
decodeURI()函数可对encodeURI()函数编码过的URI进行解码。实际上,decodeURI()仅仅会把 转换为空格显示
//"http://www.w3school.com.cn/My first/"console.log(decodeURI("http://www.w3school.com.cn/My first/"));
【encodeURIComponent()】
encodeURIComponent()函数可把字符串作为URI组件进行编码。该方法主要对;/?:@&= $,#等这些用于分隔URI组件的字符以及中文进行编码
encodeURIComponent不编码字符有71个:
!, ',(,),*,-,.,_,~,0-9,a-z,A-Z
由于此方法对:/都进行了编码,所以不能用它来对网址进行编码,而适合对URI中的参数进行编码
[注意]encodeURIComponent()可以编码中文
var uri = "http://www.wrox.com/illegal value.htm#start";//'http://www.wrox.com/illegal value.htm#start'console.log(encodeURIComponent(uri));//'测试'console.log(encodeURIComponent('测试'));
【decodeURIComponent()】
decodeURIComponent()函数可对encodeURIComponent()函数编码的URI进行解码
var uri = 'http://www.wrox.com/illegal value.htm#start';//'http://www.wrox.com/illegal value.htm#start'console.log(decodeURIComponent(uri));
【escape()】
escape()函数对字符串进行编码,将字符的unicode编码转化为16进制序列
ES3中反对escape()的使用,并建议用encodeURI和encodeURIComponent代替,不过escape()依然被广泛的用于cookie的编码,因为escape()恰好编码了cookie中的非法字符并且对路径中常出现的“/”不进行编码
escape()的不编码字符有69个:
* - . / @ _ 0-9 a-z A-Z
[注意]escape()可以编码中文
var uri = "http://www.wrox.com/illegal value.htm#start";//'http://www.wrox.com/illegal value.htm#start'console.log(escape(uri));//%u6D4B%u8BD5console.log(escape('测试'));
【unescape()】
unescape()函数用于对escape()函数编码的URI进行解码
//http://www.wrox.com/illegal value.htm#startconsole.log(unescape('http://www.wrox.com/illegal value.htm#start'));//'测试'console.log(unescape('%u6D4B%u8BD5'));
链接文章:
https://www.cnblogs.com/xiaohuochai/p/6144157.html
https://www.cnblogs.com/xiaohuochai/p/6144157.html
https://developer.mozilla.org/zh-CN/docs/Learn/Common_questions/What_is_a_URL
网络前端小技巧(前端要知道的网络知识六)
2024-11-05 07:11:48 作者:所以在乎你 网址:https://m.xinb2b.cn/life/wfs529673.html
- 什么是词牌名有哪些(词牌是指)
- 2024-11-06词牌是指词牌:就是词的格式的名称词的格式和律诗的格式不同:律诗只有四种格式,而词则总共有一千多个格式(这些格式称为词谱)词牌有以下几种:(1)本来是乐曲的名称如《菩萨蛮》、《西江月》、《风入松》、《蝶恋花》等。
- 韩国的纸币谁印制的(韩国面额50000元纸币发行十周年)
- 2024-11-06韩国面额50000元纸币发行十周年一位韩国银行职员展示面额5万元的纸币(韩国《东亚日报》)海外网6月19日电据韩国KBS新闻19日报道,韩国央行日前表示,10年前开始发行的5万韩元(约合人民币290元)面额纸币已产生相当大的效应5万韩。
- 梦幻西游手游物理潜能果选择哪个(梦幻西游手游潜能果玩法全解析)
- 2024-11-06梦幻西游手游潜能果玩法全解析作为《梦幻西游》手游特色玩法之一,卡级系统让玩家能够与众多同级别玩伴一起,享受决战华山、比武大会和X9联赛等PVP竞技活动的乐趣!但因卡级积累下来的许多经验又该何去何从呢?现在,《梦幻西游》手游推出全。
- 让甲方爸爸称赞的项目定位和策划分析,原来是这么做的(让甲方爸爸称赞的项目定位和策划分析)
- 2024-11-06让甲方爸爸称赞的项目定位和策划分析建筑设计行业本身就高标准严要求,要求建筑师对很多方面的知识都要更加敏感,对于建筑师来说,加班、熬夜、改图已是常事,每天忙忙忙的同时,还要听取甲方的各种意见,哪还有精力做好设计但你除了要有过硬的技术和坚。
- 饭圈文化的白与黑(普天同庆饭圈文化)
- 2024-11-06普天同庆饭圈文化最近开会,圈又安如鸡了不过自己安静了不代表不被人cue:代表直接把自己的提案对准了圈并且点名狙了“饭圈文化”别说,代表对“饭圈文化”还真是挺有了解的以为开会讨论的都是大问题,没想到真有代表关注咱圈的事。
- 送梳子的含义是什么(送梳子的寓意)
- 2024-11-06送梳子的寓意送给长辈,寓意着让他们梳走三千烦恼丝,少为儿女操点心,让他们越来越年轻,梳头发也是一个按摩的过程,可以让他们身心更加放松,身体更加健康,也代表着儿女对父母的孝心送爱人和男女朋友,代表着白头到老的意思,。
- 手机的指纹锁和密码锁能解开吗(这个习惯让你手机指纹锁轻松被破解)
- 2024-11-06这个习惯让你手机指纹锁轻松被破解目前大部分智能手机的解锁方式都可以用指纹来解锁,甚至Iphone8都可以实现面部扫描来解锁感觉好酷炫啊!就好像拥有这指纹解锁这项功能以后,自己距离高科技又进了一步,感觉自己走在科技的前沿,马上就可以与。
- 此夜曲中闻折枝的下一句是什么(此夜曲中闻折枝的出处)
- 2024-11-06此夜曲中闻折枝的出处此夜曲中闻折枝的下一句是何人不起故园情出自李白的《春夜洛城闻笛》,原文:谁家玉笛暗飞声,散入春风满洛城此夜曲中闻折柳,何人不起故园情白话译文:是谁家的庭院,飞出幽隐的玉笛声?融入春风中,飘满洛阳古城客。
- 如何打好精准的脱贫攻坚战(这一仗我们必须赢)
- 2024-11-06这一仗我们必须赢“全面建成小康社会,标志性的指标是农村贫困人口全部脱贫、贫困县全部摘帽”3月5日,参加内蒙古代表团审议时指出,要采取更加有力的举措、更加精细的工作,瞄准贫困人口集中的乡(苏木)村(嘎查),重点解决好产。
- 世界公认十大古刀(世界上公认的三大名刀之一)
- 2024-11-06世界上公认的三大名刀之一世界上公认的三大名刀——大马士革钢刀、日本武士刀、马来克力士剑狭义上的大马士革刀是使用古印度南部地区的乌兹钢锭制造,因原材料殆尽,不复往昔峥嵘,但其锋利、美观、韧性以及不易生锈特性仍超过其他刀具凡几马。
- 火影忍者忍者大师为什么登录不了(游戏怎么样)
- 2024-11-06游戏怎么样如果不是你手机的问题的话,那么就是客户端的问题了,可能是官方后台,估计更新《火影忍者》官方正版授权手游——《火影忍者-忍者大师》强势来袭!漫画的连载已完结,羁绊仍持续!火の意志,由你继承!游戏完美再现。
- 怎么才能保护肝脏(专家支招如何保护肝脏)
- 2024-11-06专家支招如何保护肝脏2月27日,香港知名喜剧演员吴孟达因肝癌在香港病逝不少人感慨“再也看不到他和周星驰合体”“青春真的结束了”……在大家悲痛的时候,被很多人称为“无声癌症”的肝癌再次引起关注记者采访陕西省中医医院养生体检。