Perl引用入门

时间 2019-11-06

标签 perl 引用入门栏目 Perl 繁體版

原文原文链接

在perl中只有3种基本的数据结构：标量、数组、hash。变量能够是数值，能够是字符串。正则表达式

这三种基本数据结构的数据存储方式以下：算法

可是，仅仅由这3种基本结构，就能够构造出更复杂的数据结构，例如hash中用数组作value，数组中用hash作元素。数组

可是，perl对于底层的一些数据存储，不少时候对这些数据是直接拷贝存储的。而有些时候是不必去拷贝数据的，经过引用，能够避免拷贝操做，哪里须要数据，用数据对象的引用便可，也就是插一个"指针"的事。数据结构

如何表示数组和hash的引用

引用就像是指针，对一个引用进行输出，在字符串上下文将返回它指向的目标数据的类型和内存地址，在数值上下文将返回地址空间。例如，数组的引用和hash的引用，以下图。函数

上图中，将数组@name的引用赋值给了一个名为$arr_ref的标量，将hash@member的引用赋值给了一个名为$hash_ref的标量。注意，引用都是标量。ui

引用的方式很简单，只需在 数组的@符号、hash的%符号以前加上反斜线\ 。例如\@name就表示这是名称为name的数组的引用，\%member就表示这是名称为member的hash的引用。操作系统

例如：scala

@name=qw(longshuai xiaofang wugui tuner);
%member=(
    longshuai => "18012345678",
    xiaofang  => "17012345678",
    wugui     => "16012345678",
    tuner     => "15012345678"
);

$arr_ref=\@name;      # 将数组的引用赋值给一个标量
$hash_ref=\%member;   # 将hash的引用赋值给一个标量

print "$arr_ref","\n";   # 输出：ARRAY(0x18a5fa0)
print "$hash_ref","\n";  # 输出：HASH(0x18a6060)

因为引用被看成一个标量，因此能使用标量的地方，就能使用引用。例如，将一个数组的引用放进hash中：3d

@name=qw(longshuai xiaofang wugui tuner);
$arr_ref=\@name;

%member=(
    longshuai => "18012345678",
    xiaofang  => "17012345678",
    wugui     => "16012345678",
    tuner     => $arr_ref
);

print "$member{'tuner'}","\n";   # 输出数组的引用：ARRAY(0x13d7fa0)

除数组、hash以外的引用

除数组、hash有引用，标量、函数也有引用，并且还不止这些，好比文件句柄引用、正则表达式引用等。指针

目前，暂时只需了解标量、数组、hash、函数的引用方式便可，分别为：

\$x    # 引用 scalar
    \@y    # 引用 array
    \%z    # 引用 hash
    \&f    # 引用 function

标量引用的一个技巧

下面建立一个指向$foo1值的引用$ref_foo1，也就是说$ref_foo1和foo1是等价的，要引用这个变量的值，须要使用$$ref_foo1或$foo1。

my $ref_foo1 = \$foo1;

例如：

my $foo1="xyz";
my $ref_foo1 = \$foo1;
print "$$ref_foo1\n";

常常会看到下面一种代码格式：

my $ref_foo2 = \my $foo2;

等号右边\my $foo2表示先建立一个用my修饰的变量$foo2(由于未赋值，因此初始化为undef)，再建立一个指向它的引用$ref_foo2。和上面的示例相比，它只是多了一个临时建立变量的功能，由于my的优先级高于\，它等价于\(my $foo2)。

上面的语句还能够赋值：

my $ref_foo2 = \(my $foo2="abcd");
print "$$ref_foo2\n";

引用计数器和引用做用域

能够为同一段数据对象建立多个引用，因为每一个引用都指向同一段数据对象，因此相同数据对象的引用是彻底一致的。

因为引用在数值上下文返回引用对象的地址空间，因此能够用比较操做符==来比较引用，固然，使用eq来比较也彻底能够：

@name=qw(longshuai xiaofang wugui tuner);
$arr_ref=\@name;
$arr_ref1=\@name;
$arr_ref2=$arr_ref;

print "ref equals\n" if $arr_ref == \@name;            # true
print "ref equal ref1\n" if $arr_ref == $arr_ref1;     # true
print "ref1 equal ref2\n" if $arr_ref1 == $arr_ref2;   # true

在perl中，对每段数据的引用都会维护一个引用计数器：

最初建立数据对象时，赋值给初始化数组、hash，引用数为1
之后每次引用、赋值引用、拷贝引用等操做都会对引用数加1
将其赋值为undef，则显式取消引用关系，引用数减1
引用有做用域，当离开做用域时，该做用域内的引用都将取消(可看做是赋值型的标量，当定义my时，超出边界就失效)
只要引用计数器还未减小为0，用于存储数据对象所占用的内存就不会释放。当引用计数为0时，perl将回收这段内存空间，但不会交还给操做系统，perl再须要的时候会重用这段内存空间存储新数据，而无需从新向操做系统申请开辟新内存

这和硬连接相似，每建立一个硬连接，硬连接数量就加1，每删除一个硬连接，硬连接数量就减1。

#!/usr/bin/perl
use 5.010;

@names=qw(longshuai xiaofang wugui tuner);   # ref counter = 1

$arr_ref1=\@names;     # ref counter = 2
$arr_ref2=$arr_ref1;   # ref counter = 3
$arr_ref3=\@names;     # ref counter = 4
$arr_ref2=undef;       # ref counter = 3
@names=undef;          # ref counter = 2

say "arr: @names";       # 输出：arr:
say "ref1: $arr_ref1";   # 输出：ARRAY(0x55befad8f0a0)
say "ref2: $arr_ref2";   # 输出：ref2:
say "ref3: $arr_ref3";   # 输出：ARRAY(0x55befad8f0a0)

若是使用my或local这样做用域关键词去定义引用，当引用超出对应边界后，就会失效，引用计数器就会对应减1。固然，若是不定义为my或local，则超出边界也不会失效。

#!/usr/bin/perl
use 5.010;

@names=qw(longshuai xiaofang wugui tuner);   # ref counter = 1

$arr_ref1=\@names;     # ref counter = 2
{
    my $arr_ref2=$arr_ref1;   # ref counter = 3
    my $arr_ref3=\@names;     # ref counter = 4
}      # ref counter = 2

say "ref1: $arr_ref1";
say "ref2: $arr_ref2";   # arr_ref2已经失效
say "arr: @names";
say "ref3: $arr_ref3";   # arr_ref3已经失效

有一点须要注意，就是将引用做为子程序(函数)的参数时，它首先将引用赋值给@_特殊变量，这时引用计数会加1，当退出子程序时，@_将失效，引用计数器将减1。

&mysub(\@names);    # 直接将引用赋值给@_
&mysub($arr_ref);   # 拷贝引用，@_也将引用数据对象

引用计数管理内存的优势和缺点

perl采用引用计数的方式回收内存空间。引用计数管理内存的方式已经存在了好久，和GC(Garbage collection)垃圾回收机制是同一年(1960年)被研究出来的。不管是哪一种内存管理机制，都有优势，也都有缺点。

对于引用计数管理方式而言，它最大的优势在于：

即刻回收：只要数据对象的引用计数器为0了，就会马上被回收
暂停时长很短：由于回收速度时无需遍历内存，因此负责回收的工做效率很高

使用引用计数管理内存最大的缺点在于：

由于要频繁增、减计数，负责增、减的工做压力很是大
没法回收循环引用(引用环路问题，见下文)

相比于引用计数管理内存的方式，GC回收机制都是在内存不够后，遍历整个内存来回收的，因此有延迟性和低效性(有好几种改进的GC，都各有优缺点，但原始的GC算法就是如此)。

其实不管是引用计数仍是GC，都对它们各自的缺点有各类改进，但修补缺陷的同时，也会损伤它们的优势，因此不一样语言针对不一样适用场景，老是采用不一样的折衷手段。

回到引用计数的一个缺点问题上：没法回收循环引用问题。所谓循环引用，是指A引用B的对象，B又引用A的对象。例如：

@name1=qw(longshuai wugui);
@name2=qw(xiaofang tuner);
push @name1,\@name2;
push @name2,\@name1;

验证下：

#!/usr/bin/perl
use 5.010;
@name1=qw(longshuai wugui);
@name2=qw(xiaofang tuner);

say "name1_1: ",\@name1;      # ARRAY(0xNAME1)
say "name2_1: ",\@name2;      # ARRAY(0xNAME2)

push @name1,\@name2;
push @name2,\@name1;

say "name1_2: @name1";      # ARRAY(0xNAME2)
say "name2_2: @name2";      # ARRAY(0xNAME1)

以下图所示：

这样的引用环路，使得@name1和@name2对应的数据对象的引用，不管如何也没法减小到0。

这样会致使一个重大问题：内存泄漏(memory leak)。随着泄漏愈来愈多，内存终有被耗尽的时刻。也许真正写成内存泄漏的代码比较少，但不少时候构建复杂的数据结构时，无心中可能就会出现引用环路问题。

要避免引用环路，可使用perl的另外一种引用行为：弱引用(weak)。或者，在退出引用做用域以前，打破引用环路。例如：

{
    @name1=qw(longshuai wugui);
    @name2=qw(xiaofang tuner);
    push @name1,\@name2;
    push @name2,\@name1;
    ......
    # 退出做用域以前，在引用的内部清空引用数据
    @name1=();
    @name2=();
}

这样，在退出做用域后，@name1=qw(longshuai wugui (这段空))，同理@name2。如此一来，@name1和@name2又变回了最初状态，都只有一个引用，且没有了循环引用。

固然，上面是直接清空初始引用的，若是push进去的是引用变量，则清空引用变量便可。

{
    @name1=qw(longshuai wugui);
    @name2=qw(xiaofang tuner);
    $name1_ref=\@name1;
    $name2_ref=\@name2;
    
    push @name1,$name1;  # 使用引用变量，而非初始的数组名引用
    push @name2,$name2;
    ......
    # 退出做用域以前，在引用的内部清空引用数据
    $name1=undef;
    $name2=undef;
}

要检查是否出现内存泄漏问题，可使用Test::Memory::Cycle模块。

最后，perl目前尚未其它垃圾回收机制(garbage collection)，也许在将来的版本中可能会引入新的gc管理方式来替代引用计数的管理方式。

1. Perl引用入门
2. perl 入门1
3. Perl入门
4. perl入门
5. Perl 入门 1
6. Perl DBI 入门
7. Perl引用
8. Perl--引用
9. perl 引用
10. perl 引用（一）
更多相关文章...
• Memcached入门教程 - NoSQL教程
• SQLite - Perl - SQLite教程
• YAML 入门教程
• Java Agent入门实战（一）-Instrumentation介绍与使用