PHP: chr和pack、unpack那些事

时间 2019-11-13

标签 php chr pack unpack 那些栏目 PHP 繁體版

原文原文链接

PHP是一门很灵活的语言。正由于它太灵活了，甚至有些怪异，因此你们对它的评价褒贬不一。其实我想说的是，任何一门语言都有它自身的哲学，有它存在的出发点。PHP为Web而生，它以快速上手、快速开发而著称，因此它也常被冠以简单、新手用的语言等标签。我倒不这么认为，所谓选对的工具去作对的事，没有包打天下的语言。而至于说其简单，却也未必。javascript

引子

我以前有篇文详细介绍过pack和unpack：PHP: 深刻pack/unpack ，若是有不明白的地方，建议再回过头去看多几遍。如今应该可以写出如下代码：php

<?php
echo pack("C", 97) . "\n";

$ php -f test.php
a

可是，为何会输出'a'呢？虽然咱们知道字符'a'的ASCII码就是97，可是pack方法返回的是二进制字符串，为何不是输出一段二进制而是'a'？为了确认pack方法返回的是一段二进制字符串，这里我对官方的pack的描述截了个图：
html

确实如此，pack返回包含二进制字符串的数据，接下来详细进行分析。前端

程序是如何显示字符的

这里所说的'程序'，实际上是个宏观的概念。java

对于在控制台中执行脚本(这里是指PHP做为cli脚原本执行)，脚本的输出会写入标准输出(stdin)或标准错误(stderr)，固然也有可能会重定向到某个文件描述符。拿标准输出来讲，暂且忽略它是行缓冲、全缓冲或者是无缓冲。脚本进程执行完毕后若是有输出则会在控制台上输出字符串。那这里的控制台就是所说的'程序'。
shell

对于Web来讲(这里是指PHP做为Web的服务器端语言)，程序执行完后会将结果响应给浏览器或其它UserAgent，为了方便描述，这里统一称为UserAgent。这里的UserAgent就是所说的'程序'。数据库

固然还有其它状况，好比在GUI窗口中的输出，编辑器打开一个文件等等，这都涉及到如何显示字符串的问题。windows

在控制台中执行

控制台经过shell命令来执行脚本，它会fork一个子进程，以后经过exec替换子进程的地址空间，由于这个子进程不是会话首进程，因此它能够关联到控制终端。脚本输出执行完毕后退出，回到控制台。来看下面的例子：浏览器

<?php
$str = '回';
echo $str . "\n";

$ php -f test.php
回

test.php是UTF-8编码的文件，个人Linux系统的Locales是zh_CN.UTF-8。服务器

$ locale
LANG=zh_CN.UTF-8
LANGUAGE=
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="zh_CN.UTF-8"
LC_NAME="zh_CN.UTF-8"
LC_ADDRESS="zh_CN.UTF-8"
LC_TELEPHONE="zh_CN.UTF-8"
LC_MEASUREMENT="zh_CN.UTF-8"
LC_IDENTIFICATION="zh_CN.UTF-8"
LC_ALL=

回到刚才的代码，test.php是UTF-8编码的文件，汉字'回'是三个字节表示的UTF8字符(若是不明白，能够看个人另外一篇文章：JavaScript: 详解Base64编码和解码)，因此test.php文件的内容保存在硬盘上的数据就是4个字节('\n'是ASCII字符，用1个字节表示)。test.php执行输出时，将这4个字节发送到标准输出，以后被冲洗(这里忽略掉被flush的时机)，由控制台来显示。回想一下Linux系统上的locale设置，很显然是采用UTF8的机制来显示字符，因此前三个字节被当成一个UTF8字符，它被组合在一块儿转成Unicode码而后查表，再显示出来。

<?php
$str = '回';
echo $str . "\n";
echo $str{0} . $str{1} . $str{2} . "\n";

$ php -f test.php
回
回

能够看到，不论是整个字符输出，仍是三个字节连在一块儿输出，结果是同样的。咱们接下来看看不一样平台上同一个字符的Unicode编码和UTF-8编码是否同样：

PHP测试：

<?php
$str = '回';
$bin = pack("C3", ord($str{0}), ord($str{1}), ord($str{2}));
$hex = strtoupper(bin2hex($bin));
echo "UTF-8编码: " . $hex . "\n";
/**
* 1110xxxx 10xxxxxx 10xxxxxx
*/
$byte1 = ord($str{0});
$byte2 = ord($str{1});
$byte3 = ord($str{2});
$c1    = (($byte1 & 0x0F) << 4) | (($byte2 & 0x3F) >> 2);
$c2    = (($byte2 & 0x03) << 6) | ($byte3 & 0x3F);
$dec   = (($c1 & 0x00FF) << 8) | $c2;
echo "Unicode编码: " . $dec . "\n";

$ php -f test.php
UTF-8编码: E59B9E
Unicode编码: 22238

JavaScript测试：

<script type="text/javascript">
/**
* UTF16和UTF8转换对照表
* U+00000000 – U+0000007F 	0xxxxxxx
* U+00000080 – U+000007FF 	110xxxxx 10xxxxxx
* U+00000800 – U+0000FFFF 	1110xxxx 10xxxxxx 10xxxxxx
* U+00010000 – U+001FFFFF 	11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
* U+00200000 – U+03FFFFFF 	111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
* U+04000000 – U+7FFFFFFF 	1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
*/
var code = ('回').charCodeAt(0);
// 1110xxxx
var byte1 = 0xE0 | ((code >> 12) & 0x0F);
// 10xxxxxx
var byte2 = 0x80 | ((code >> 6) & 0x3F);
// 10xxxxxx
var byte3 = 0x80 | (code & 0x3F);

console.group('Test chr: ');
console.log("UTF-8编码:", byte1.toString(16).toUpperCase() + '' + byte2.toString(16).toUpperCase() + '' + byte3.toString(16).toUpperCase());
console.log("Unicode编码: ", code);
console.groupEnd();
</script>

咱们看到输出是同样的。

做为Web的服务器端语言执行

此次无非是由刚才的控制台执行变成了UserAgent，其实道理仍是同样的。服务器端PHP脚本输出会经过HTTP的响应返回给UserAgent，那么UserAgent就要对它进行显示。固然，这里还有点例外。数据是经过网络做为字节流发送回UserAgent，一般UserAgent有几种方式来判断字节流是属于什么编码(或许还涉及到压缩，但这里将不考虑这个因素)。

服务器端能够经过响应头部来告诉UserAgent应该用什么编码来处理这些数据，好比：

<?php
header("Content-Type: text/html; charset=utf8");

或者是HTML页面中的<meta />标签，好比：

<meta charset="utf-8" />

可是万一这两种方式都没有提供，那也只能靠猜了。事实也确实如此，据我所知，Firefox就是这么作的，而且将代码开源了：universalchardet 。可是这种方式并不能百分之百正确检测，因此偶尔会访问到乱码的页面。

编辑器打开一个文件

在windows上用notepad新建文本文件另存为时有几种编码选项：ANSI, Unicode, Unicode BigEndian, UTF-8。

在其它编辑器中选项更多，包括有BOM和无BOM的。BOM是文件头的前几个字节，经过BOM，处理它的程序就知道这个文件是采用什么编码，而且是什么字节序。然而在PHP中，历来都没有将BOM考虑进去，因此PHP解释器去执行一个PHP文件时，不会忽略前几个BOM字节，这就致使了问题。通常的问题在于发送cookie前，BOM被输出了。因此如今通常推荐无BOM的文件。

无BOM有时候也是会有问题的，由于这须要处理它的程序去检测它是什么编码。检测的方式通常是扫描文件，而后根据不一样编码的规则来判断二进制。这里举一个出现问题的例子。在windows上新建一个文本文件并保存为ANSI编码，而后在文件中输入'联通'，如图所示：

保存好后关闭test.txt文件，而后再双击打开，如图所示：

咱们看到显示的是乱码，具体咱们能够分析一下产生乱码的缘由。用Editplus新建一个ANSI文件，输入'联通'，而后切换到十六进制查看方式，以下图所示：

对应的十六进制是：C1 AA CD A8，转成二进制后以下：

11000001 10101010 11001101 10101000

接着咱们来看下UTF-8的转换表：

U+00000000 – U+0000007F 	0xxxxxxx
U+00000080 – U+000007FF 	110xxxxx 10xxxxxx
U+00000800 – U+0000FFFF 	1110xxxx 10xxxxxx 10xxxxxx
U+00010000 – U+001FFFFF 	11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
U+00200000 – U+03FFFFFF 	111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx
U+04000000 – U+7FFFFFFF 	1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx

很显然都被看成了二字节的UTF-8字符，拿GBK的编码去UTF-8的码表里查，您说能查到吗？

总结

如今咱们已经知道了不论是什么编码的数据，老是一个字节一个字的存储，而且在存储时会进行相应的编码转换。好比汉字'回'的GBK编码和UTF-8编码的字节数和编码值都不同，因此在将GBK的文件另存为UTF-8时必然会存在转换，反之也是同样的。而在读取时若是有BOM就按BOM规定的编码来处理，不然要进行编码检测后再处理。

再说pack

以前讲了这么多编码方面的问题，其实就是为了让你们更好的理解接下来要讲的。pack能够将ASCII进行打包而后输出(事实上就是将一个多字节变成多个单字节，以后能够经过unpack转换回来)，这个咱们已经知道了。可是方式有不少种，原理是同样的。咱们来详细分析。对pack/unpack不太熟悉的仍是建议去翻看我以前的一篇文章：PHP: 深刻pack/unpack 。由于本人的机器是小端序的，因此本文只考虑小端序。大端序是同样的方式，只不过字节序不同罢了，能够先判断本机的字节序再处理。

<?php
echo pack("C", 0x61) . "\n";
echo pack("S", 0x6161) . "\n";
echo pack("L", 0x61616161) . "\n";
echo pack("L", 0x9E9BE561) . "\n";
echo chr(0xE5) . chr(0x9B) . chr(0x9E) . "\n";
echo pack("H6", "E59B9E") . "\n";

$ php -f test.php
a
aa
aaaa
a回
回
回

咱们一句句的来分析，首先是：

echo pack("C", 0x61) . "\n";
echo pack("S", 0x6161) . "\n";
echo pack("L", 0x61616161) . "\n";

这三句代码很简单，C是无符号字节，S是2个无符号字节，L是4个无符号字节，因此输出也没什么疑问。不管几个字节，都是ASCII码，0x61的二进制的高位为0，因此能正确显示。

echo pack("L", 0x9E9BE561) . "\n";

咱们或许还记得汉字'回'的UTF-8编码为：0xE59B9E，L是按主机字节序打包的，而个人机器是小端序，因此0x9E9BE561打包后就变为：0x61E59B9E。0x61是字符'a'的ASCII码，然后面的三个字节程序经过判断0xE5就能知道这是一个三字节的UTF-8字符，所以这三个字节会转成Unicode码去查表，而后显示。

echo chr(0xE5) . chr(0x9B) . chr(0x9E) . "\n";

chr是返回ASCII码所代码的字符，它其实不只仅是转换单字节的字符，对于多字节一样适用。它会根据刚才所说的规则将三个UTF-8字节转成Unicode码而后去查表。

echo pack("H6", "E59B9E") . "\n";

对于H格式字符，它和h的区别就是前者是高四位在前，后者是低四位在前，但它们都是以半字节为单位读取的，而且以十六进制的方式。您应该看到我在用H进行打包时传的是字符串"E59B9E"，若是传的是0xE59B9E就不对了，这样的话先会转成十进制15047582，而后在前面加上0x变成十六进制0x15047582。

所谓按半字节读取实际上是这样的，好比0x47，先转成十进制71，而后变成十六进制的0x71。按半字节读取必然会丢弃4位，而后要补0。读取了0x7，对H来讲，它是高位，那么在低位补0变成0x70。对于h来讲，它是低位，那么在高位补0变成0x07。

再说unpack

unpack是pack的逆函数，固然unpack有本身的语法，但这不是重点，由于这些只是表象。

unpack其实只是将多个字节压缩成一个字节。好比0x12和0x34这两个字节若是要组成一个双字节，则可使用unpack的S格式化字符来实现，代码以下：

<?php
$data = unpack("S", pack("H*", "3412"));
print_r($data);
echo '0x' . dechex($data[1]) . "\n";

$ php -f test.php
Array
(
    [1] => 4660
)
0x1234

由于是小端序，因此要写成"3421"。其实还能够用位运算的方式来实现。这个时候就不须要考虑字节序了，由于字节序只是存储时才须要考虑的问题，对于输出来讲，是按照咱们天然的方式：

<?php
print "0x" . dechex((0x12 << 8) | 0x34) . "\n";

$ php -f test.php
0x1234

再说chr

PHP官方文档上所描述的chr方法的原型参数是一个int型，虽然形参名为ascii，但不要被骗了。如图所示：

chr确实是能够接收一个int类型的参数，而不只仅是一个ASCII码。还记得以前所作的测试吗？经过chr方法将三个UTF-8的字节组合在一块儿。很显然UTF-8的每一个字节都大于127，由于最高位都是1。

不过提及来chr方法仍是比较傻的，好比有以下代码：

<?php
echo chr(0xE5) . chr(0x9B) . chr(0x9E) . "\n";
echo chr(0xE59B9E) . "\n";

$ php -f test.php
回
?

chr方法彻底没有考虑将0xE59B9E拆成三个字节来组合，因此最终是乱码。

再说ord

ord接受一个string类型的参数，它用于返回参数的ASCII码。以下图所示：

虽然它只返回ASCII码，但它的参数却不限定。好比您能够传递单字节或多字节。举例以下：

<?php
echo ord("a") . "\n";
echo ord("回") . "\n";
echo 0xE5 . "\n";

$ php -f test.php
97
229
229

传入汉字'回'，它会自动截取第一个字节，而后返回它的十进制表示。

实现本身的pack/unpack

理解了原理，其实本身去实现也就是那么回事。本文以格式化字符L为例，L是无符号32位整型，它是按主机字节序来打包的。因此咱们要先判断机器的字节序。

<?php
function IsBigEndian()
{
	$bin = pack("L", 0x12345678);
	$hex = bin2hex($bin);
	if (ord(pack("H2", $hex)) === 0x78)
	{
		return FALSE;
	}

	return TRUE;
}

if (IsBigEndian())
{
	echo "大端序";
}
else
{
	echo "小端序";
}

echo "\n";

$ php -f test.php
小端序

代码很是简单，由于PHP不能直接操做内存，因此借助于pack来实现。L格式化字符表示主机字节序，若是机器是小端序，则0x12345678经过L打包后会变成4个字节而且字节序是：0x78, 0x56, 0x34, 0x12，若是是大端序则是：0x12, 0x34, 0x56, 0x78。而后经过H2格式化字符获取2个高4位(即一个高位字节)，若是是0x78那就是小端序，不然就是大端序。

接下来是my_pack方法的实现，仅仅实现了L格式化字符，代码以下：

<?php
// 判断字节序
function IsBigEndian()
{
	$bin = pack("L", 0x12345678);
	$hex = bin2hex($bin);
	if (ord(pack("H2", $hex)) === 0x78)
	{
		return FALSE;
	}

	return TRUE;
}

// 自定义打包方法
function my_pack($num)
{
	$bin     = "";
	$padding = 0;

	if ($num >= 0x00 && $num <= 0xFF)
	{
		// 补3个字节
		$padding = str_repeat(chr(0), 3);

		if (IsBigEndian())
		{
			// 大端序
			$bin = $padding . chr($num);
		}
		else
		{
			// 小端序
			$bin = chr($num) . $padding;
		}
	}
	else if ($num > 0xFF && $num <= 0xFFFF)
	{
		// 补2个字节
		$padding = str_repeat(chr(0), 2);
		$byte3   = ($num >> 8) & 0xFF;
		$byte4   = $num & 0xFF;
		
		if (IsBigEndian())
		{
			// 大端序
			$bin = $padding . chr($byte3) . chr($byte4);
		}
		else
		{
			// 小端序
			$bin = chr($byte4) . chr($byte3) . $padding;
		}
	}
	else if ($num > 0xFFFF && $num <= 0x7FFFFF)
	{
		// 补1个字节
		$padding = chr(0);
		$byte2   = ($num >> 16) & 0xFF;
		$byte3   = ($num >> 8) & 0xFF;
		$byte4   = $num & 0xFF;

		if (IsBigEndian())
		{
			// 大端序
			$bin = $padding . chr($byte2) . chr($byte3) . chr($byte4);
		}
		else
		{
			// 小端序
			$bin = chr($byte4) . chr($byte3) . chr($byte2) . $padding;
		}
	}
	else
	{
		$byte1 = ($num >> 24) & 0xFF;
		$byte2 = ($num >> 16) & 0xFF;
		$byte3 = ($num >> 8) & 0xFF;
		$byte4 = $num & 0xFF;

		if (IsBigEndian())
		{
			// 大端序
			$bin = chr($byte1) . chr($byte2) . chr($byte3) . chr($byte4);
		}
		else
		{
			// 小端序
			$bin = chr($byte4) . chr($byte3) . chr($byte2) . chr($byte1);
		}
	}

	return $bin;
}

$bin = my_pack(0x12);
print_r(unpack("L", $bin));
$bin = pack("L", 0x12);
print_r(unpack("L", $bin));

$bin = my_pack(0x1234);
print_r(unpack("L", $bin));
$bin = pack("L", 0x1234);
print_r(unpack("L", $bin));

$bin = my_pack(0x123456);
print_r(unpack("L", $bin));
$bin = pack("L", 0x123456);
print_r(unpack("L", $bin));

$bin = my_pack(0x12345678);
print_r(unpack("L", $bin));
$bin = pack("L", 0x12345678);
print_r(unpack("L", $bin));

$ php -f test.php
Array
(
    [1] => 18
)
Array
(
    [1] => 18
)
Array
(
    [1] => 4660
)
Array
(
    [1] => 4660
)
Array
(
    [1] => 1193046
)
Array
(
    [1] => 1193046
)
Array
(
    [1] => 305419896
)
Array
(
    [1] => 305419896
)

测试中调用pack和my_pack的结果是同样的。unpack的实现就是pack的逆操做，只需把pack的结果的每个字节取到它的ASCII码(能够经过ord方法来获得)，而后将4个字节根据高低位次序(这还要根据大小端)经过位运算变成一个4字节的整数，其它格式化字符也是相似如此实现。接下来仅仅实现格式化字符L的unpack版本，代码以下：

<?php
// 判断字节序
function IsBigEndian()
{
	$bin = pack("L", 0x12345678);
	$hex = bin2hex($bin);
	if (ord(pack("H2", $hex)) === 0x78)
	{
		return FALSE;
	}

	return TRUE;
}

// 自定义打包方法
function my_pack($num)
{
	$bin     = "";
	$padding = 0;

	if ($num >= 0x00 && $num <= 0xFF)
	{
		// 补3个字节
		$padding = str_repeat(chr(0), 3);

		if (IsBigEndian())
		{
			// 大端序
			$bin = $padding . chr($num);
		}
		else
		{
			// 小端序
			$bin = chr($num) . $padding;
		}
	}
	else if ($num > 0xFF && $num <= 0xFFFF)
	{
		// 补2个字节
		$padding = str_repeat(chr(0), 2);
		$byte3   = ($num >> 8) & 0xFF;
		$byte4   = $num & 0xFF;
		
		if (IsBigEndian())
		{
			// 大端序
			$bin = $padding . chr($byte3) . chr($byte4);
		}
		else
		{
			// 小端序
			$bin = chr($byte4) . chr($byte3) . $padding;
		}
	}
	else if ($num > 0xFFFF && $num <= 0x7FFFFF)
	{
		// 补1个字节
		$padding = chr(0);
		$byte2   = ($num >> 16) & 0xFF;
		$byte3   = ($num >> 8) & 0xFF;
		$byte4   = $num & 0xFF;

		if (IsBigEndian())
		{
			// 大端序
			$bin = $padding . chr($byte2) . chr($byte3) . chr($byte4);
		}
		else
		{
			// 小端序
			$bin = chr($byte4) . chr($byte3) . chr($byte2) . $padding;
		}
	}
	else
	{
		$byte1 = ($num >> 24) & 0xFF;
		$byte2 = ($num >> 16) & 0xFF;
		$byte3 = ($num >> 8) & 0xFF;
		$byte4 = $num & 0xFF;

		if (IsBigEndian())
		{
			// 大端序
			$bin = chr($byte1) . chr($byte2) . chr($byte3) . chr($byte4);
		}
		else
		{
			// 小端序
			$bin = chr($byte4) . chr($byte3) . chr($byte2) . chr($byte1);
		}
	}

	return $bin;
}

// 自定义解包方法
function my_unpack($bin)
{
	$byte1 = ord($bin{0});
	$byte2 = ord($bin{1});
	$byte3 = ord($bin{2});
	$byte4 = ord($bin{3});

	if (IsBigEndian())
	{
		// 大端序
		$num = ($byte1  << 24) | ($byte2 << 16) | ($byte3 << 8) | $byte4;
	}
	else
	{
		// 小端序
		$num = ($byte4  << 24) | ($byte3 << 16) | ($byte2 << 8) | $byte1;
	}

	return array($num);
}

$bin = my_pack(0x12);
print_r(unpack("L", $bin));
print_r(my_unpack($bin));
$bin = pack("L", 0x12);
print_r(unpack("L", $bin));
print_r(my_unpack($bin));

$bin = my_pack(0x1234);
print_r(unpack("L", $bin));
print_r(my_unpack($bin));
$bin = pack("L", 0x1234);
print_r(unpack("L", $bin));
print_r(my_unpack($bin));

$bin = my_pack(0x123456);
print_r(unpack("L", $bin));
print_r(my_unpack($bin));
$bin = pack("L", 0x123456);
print_r(unpack("L", $bin));
print_r(my_unpack($bin));

$bin = my_pack(0x12345678);
print_r(unpack("L", $bin));
print_r(my_unpack($bin));
$bin = pack("L", 0x12345678);
print_r(unpack("L", $bin));
print_r(my_unpack($bin));

$ php -f test.php
Array
(
    [1] => 18
)
Array
(
    [0] => 18
)
Array
(
    [1] => 18
)
Array
(
    [0] => 18
)
Array
(
    [1] => 4660
)
Array
(
    [0] => 4660
)
Array
(
    [1] => 4660
)
Array
(
    [0] => 4660
)
Array
(
    [1] => 1193046
)
Array
(
    [0] => 1193046
)
Array
(
    [1] => 1193046
)
Array
(
    [0] => 1193046
)
Array
(
    [1] => 305419896
)
Array
(
    [0] => 305419896
)
Array
(
    [1] => 305419896
)
Array
(
    [0] => 305419896
)

知道了原理，实现起来就一点也不难，无非就是要注意字节序的问题。

关于ISO 8859-1编码

ISO 8859-1又称 Latin-1 或西欧语言。是国际标准化组织内ISO/IEC 8859的第一个8位字符集。它以ASCII为基础，在空置的0xA0-0xFF的范围内，加入96个字母及符号，藉以供使用附加符号的拉丁字母语言使用。

从定义可知，Latin-1编码是单字节编码，向下兼容 ASCII ，其编码范围是0x00~0xFF。0x00~0x7F之间彻底和ASCII码一致，0x80~0x9F之间是控制字符，0xA0~0xFF之间是文字符号。

ISO-8859-1收录的字符除ASCII收录的字符外，还包括西欧语言、希腊语、泰语、阿拉伯语、希伯来语对应的文字符号。欧元符号出现的比较晚，没有被收录在ISO-8859-1当中。

由于ISO-8859-1编码范围使用了单字节内的全部空间，在支持ISO-8859-1的系统中传输和存储其余任何编码的字节流都不会被抛弃。换言之，把其余任何编码的字节流看成ISO-8859-1编码看待都没有问题。这是个很重要的特性，MySQL数据库默认编码是Latin-1就是利用了这个特性。ASCII编码是一个7位的容器，ISO-8859-1编码是一个8位的容器。

结束语

pack/unpack在实际工做中用得很是多，由于不少公司用PHP作前端，经过TCP调用接口，这就须要用到pack/unpack来打包和解包。但愿本文能对你们有帮助。