编码解码是什么?URL 如何编码解码?
2021-01-13 15:33:49  来源: 互联网  
1
听新闻

编码解码是什么?

编码是信息从一种形式或格式转换为另一种形式的过程,也称为计算机编程语言的代码简称编码。用预先规定的方法将文字、数字或其它对象编成数码,或将信息、数据转换成规定的电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛使用。编码是信息从一种形式或格式转换为另一种形式的过程。解码,是编码的逆过程。

解码是一种用特定方法,把数码还原成它所代表的内容或将电脉冲信号、光信号、无线电波等转换成它所代表的信息、数据等的过程。解码是受传者将接受到的符号或代码还原为信息的过程,与编码过程相对应。

URL 如何编码解码?为什么要编码?

为什么要编码?

URL 只能使用 ASCII 字符集来通过因特网进行发送。也就是说URL只能使用英文字母、阿拉伯数字和某些标点符号,不能使用其他文字和符号。

这意味着如果URL存在汉字,就必须编码后使用。

image.png

如上图所示,在浏览器中的 URL 所展现的样式包含有中文字符,但将这行 URL 复制粘贴时会发现,实际上的内容和你所看到的是不一样的。所以说 URL 编码只是针对非英文字母、阿拉伯数字和某些标点符号起作用的。

那么 URL 是如何编码的呢??

URL 编码的原则就是使用安全的字符(没有特殊用途或者特殊意义的可打印字符)去表示那些不安全的字符。

首先需要把该字符的 ASCII 的值表示为两个16进制的数字,然后在其前面放置转义字符("%"),置入 URL 中的相应位置。(对于非 ASCII 字符, 需要转换为 UTF-8 字节序, 然后每个字节按照上述方式表示.)

例如说我们有这样一条 URL :www.hahaha.com/你好?a=1&b=2,我们如何可以把它合法的在因特网中传播呢??

使用 encodeURIComponent(str) 这个方法来将 utf-8 的字符编码为合法的 URL 。

上面的那条网址合法的传输形式为 window.encodeURIComponent('www.hahaha.com/你好?a=1&b=2') 。

image.png

想要解码的时候只需要使用decodeURIComponent(str)这个方法就可以解码你所得到的URL 。

image.png

JavaScript提供四个URL的编码/解码方法。

除了以上两种,还有decodeURI()解码和encodeURI()编码,区别是:

encodeURI方法不会对下列字符编码

ASCII字母

数字

~!@#$&*()=:/,;?+'

encodeURIComponent方法不会对下列字符编码

ASCII字母

数字

~!*()'

所以encodeURIComponent比encodeURI编码的范围更大。

实际例子来说,encodeURIComponent会把 http:// 编码成 http%3A%2F%2F 而encodeURI却不会。

扩展资料:

GB编码标准中,比较常用的是GB2312和GBK两种,GB2312是GBK的一个子集,GB2312编码范围是 0xA1A1 - 0xFEFE ,如果纯粹的 GB2312编码,处理起来是十分简单的,但处理GBK字符集时有些小的提示,先说说GBK编码的标准吧:

GBK 采用双字节表示,总体编码范围为 8140-FEFE,首字节在 81-FE 之间,尾字节在 40-FE 之间,剔除 xx7F 一条线。总计 23940 个码位,共收入 21886 个汉字和图形符号,其中汉字(包括部首和构件)21003 个,图形符号 883 个

责编: