主要参考(全部权利归原文做者全部):html
*http://www.cnblogs.com/endsock/archive/2011/12/09/2281519.htmlnode
*http://blog.163.com/ninja_wk/blog/static/989155620084280154811/web
*http://www.chinaunix.net/jh/4/16110.htmlapi
1、TC原理 网络
Linux操做系统中的流量控制器TC(Traffic Control)用于Linux内核的流量控制,主要是经过在输出端口处创建一个队列来实现流量控制。session
接收包从输入接口进来后,通过流量限制丢弃不符合规定的数据包,由输入多路分配器进行判断选择:dom
*若是接收包的目的主机是本主机,那么将该包送给上层处理,不然须要进行转发,将接收包交到转发块(Forwarding Block)处理。spa
*转发块同时也接收本主机上层(TCP、UDP等)产生的包,经过查看路由表,决定所处理包的下一跳。操作系统
*而后,对包进行排列以便将它们送到输出接口。.net
通常只能限制网卡发送的数据包,不能限制网卡接收的数据包,因此能够经过改变发送次序靠控制传输速率。Linux流量控制主要是在输出接口排列时进行处理和实现的。
2、TC规则
2.一、流量控制方式
流量控制包括如下几种方式:
*SHAPING(限制)
——当流量被限制,它的传输速率就被控制在某个值如下。限制值能够大大小于有效带宽,这样能够平滑突发数据流量,使网络更为稳定。shaping(限制)只适用于向外的流量。
*SCHEDULING(调度)
——经过调度数据包的传输,能够在带宽范围内,按照优先级分配带宽。SCHEDULING(调度)也只适于向外的流量。
*POLICING(策略)
——SHAPING用于处理向外的流量,而POLICIING(策略)用于处理接收到的数据。
*DROPPING(丢弃)
——若是流量超过某个设定的带宽,就丢弃数据包,不论是向内仍是向外。
2.二、流量控制处理对象
流量的处理由三种对象控制,它们是:
*qdisc(排队规则)
*class(类别)
*filter(过滤器)
*QDISC(排队规则)
——QDisc(排队规则)是queueing discipline的简写,它是理解流量控制(traffic control)的基础。不管什么时候,内核若是须要经过某个网络接口发送数据包,它都须要按照为这个接口配置的qdisc(排队规则)把数据包加入队列。而后,内核会尽量多地从qdisc里面取出数据包,把它们交给网络适配器驱动模块。最简单的QDisc是pfifo它不对进入的数据包作任何的处理,数据包采用先入先出的方式经过队列。不过,它会保存网络接口一时没法处理的数据包。
QDISC的类别以下:
(1)、CLASSLESS QDisc(不可分类QDisc)
1>无类别QDISC包括:
[p|b]fifo
使用最简单的qdisc,纯粹的先进先出。只有一个参数:limit,用来设置队列的长度,pfifo是以数据包的个数为单位;bfifo是以字节数为单位。
pfifo_fast
在编译内核时,若是打开了高级路由器(Advanced Router)编译选项,pfifo_fast就是系统的标准QDISC。它的队列包括三个波段(band)。在每一个波段里面,使用先进先出规则。而三个波段(band)的优先级也不相同,band 0的优先级最高,band 2的最低。若是band里面有数据包,系统就不会处理band 1里面的数据包,band 1和band 2之间也是同样。数据包是按照服务类型(Type of Service,TOS)被分配多三个波段(band)里面的。
red
red是Random Early Detection(随机早期探测)的简写。若是使用这种QDISC,当带宽的占用接近于规定的带宽时,系统会随机地丢弃一些数据包。它很是适合高带宽应用。
sfq
sfq是Stochastic Fairness Queueing的简写。它按照会话(session--对应于每一个TCP链接或者UDP流)为流量进行排序,而后循环发送每一个会话的数据包。
tbf
tbf是Token Bucket Filter的简写,适合于把流速下降到某个值。
2>不可分类QDisc的配置
若是没有可分类QDisc,不可分类QDisc只能附属于设备的根。它们的用法以下:
tc qdisc add dev DEV root QDISC QDISC-PARAMETERS
要删除一个不可分类QDisc,须要使用以下命令:
tc qdisc del dev DEV root
一个网络接口上若是没有设置QDisc,pfifo_fast就做为缺省的QDisc。
(2)、CLASSFUL QDISC(分类QDisc)
可分类的QDisc包括:
CBQ
CBQ是Class Based Queueing(基于类别排队)的缩写。它实现了一个丰富的链接共享类别结构,既有限制(shaping)带宽的能力,也具备带宽优先级管理的能力。带宽限制是经过计算链接的空闲时间完成的。空闲时间的计算标准是数据包离队事件的频率和下层链接(数据链路层)的带宽。
HTB
HTB是Hierarchy Token Bucket的缩写。经过在实践基础上的改进,它实现了一个丰富的链接共享类别体系。使用HTB能够很容易地保证每一个类别的带宽,虽然它也容许特定的类能够突破带宽上限,占用别的类的带宽。HTB能够经过TBF(Token Bucket Filter)实现带宽限制,也可以划分类别的优先级。
PRIO
PRIO QDisc不能限制带宽,由于属于不一样类别的数据包是顺序离队的。使用PRIO QDisc能够很容易对流量进行优先级管理,只有属于高优先级类别的数据包所有发送完毕,才会发送属于低优先级类别的数据包。为了方便管理,须要使用iptables或者ipchains处理数据包的服务类型(Type Of Service,ToS)。
*CLASS(类)
——某些QDisc(排队规则)能够包含一些类别,不一样的类别中能够包含更深刻的QDisc(排队规则),经过这些细分的QDisc还能够为进入的队列的数据包排队。经过设置各类类别数据包的离队次序,QDisc能够为设置网络数据流量的优先级。
*FILTER(过滤器)
——Filter(过滤器)用于为数据包分类,决定它们按照何种QDisc进入队列。不管什么时候数据包进入一个划分子类的类别中,都须要进行分类。分类的方法能够有多种,使用fileter(过滤器)就是其中之一。使用filter(过滤器)分类时,内核会调用附属于这个类(class)的全部过滤器,直到返回一个判决。若是没有判决返回,就做进一步的处理,而处理方式和QDISC有关。须要注意的是,filter(过滤器)是在QDisc内部,它们不能做为主体。
2.三、操做原理
类(Class)组成一个树,每一个类都只有一个父类,而一个类能够有多个子类。某些QDisc(例如:CBQ和HTB)容许在运行时动态添加类,而其它的QDisc(例如:PRIO)不容许动态创建类。容许动态添加类的QDisc能够有零个或者多个子类,由它们为数据包排队。此外,每一个类都有一个叶子QDisc,默认状况下,这个叶子QDisc使用pfifo的方式排队,咱们也可使用其它类型的QDisc代替这个默认的QDisc。并且,这个叶子叶子QDisc有能够分类,不过每一个子类只能有一个叶子QDisc。 当一个数据包进入一个分类QDisc,它会被纳入某个子类。
咱们可使用如下三种方式为数据包归类,不过不是全部的QDisc都可以使用这三种方式:
*tc过滤器(tc filter)
——若是过滤器附属于一个类,相关的指令就会对它们进行查询。过滤器可以匹配数据包头全部的域,也能够匹配由ipchains或者iptables作的标记。
*服务类型(Type of Service)
——某些QDisc有基于服务类型(Type of Service,ToS)的内置的规则为数据包分类。
*skb->priority
——用户空间的应用程序可使用SO_PRIORITY选项在skb->priority域设置一个类的ID。
树的每一个节点均可以有本身的过滤器,可是高层的过滤器也能够直接用于其子类。
若是数据包没有被成功归类,就会被排到这个类的叶子QDisc的队中。相关细节在各个QDisc的手册页中。
2.四、命名规则
全部的QDisc、类和过滤器都有ID。ID能够手工设置,也能够有内核自动分配。ID由一个主序列号和一个从序列号组成,两个数字用一个冒号分开。
*QDISC
——一个QDisc会被分配一个主序列号,叫作句柄(handle),而后把从序列号做为类的命名空间。句柄采用象10:同样的表达方式。习惯上,须要为有子类的QDisc显式地分配一个句柄。
*类(CLASS)
——在同一个QDisc里面的类分享这个QDisc的主序列号,可是每一个类都有本身的从序列号,叫作类识别符(classid)。类识别符只与父QDisc有关,和父类无关。类的命名习惯和QDisc的相同。
*过滤器(FILTER)
——过滤器的ID有三部分,只有在对过滤器进行散列组织才会用到。详情请参考tc-filters手册页。
2.五、单位
tc命令的全部参数均可以使用浮点数,可能会涉及到如下计数单位。
1》带宽或者流速单位:
kbps 千字节/秒
mbps 兆字节/秒
kbit KBits/秒
mbit MBits/秒
bps或者一个无单位数字 字节数/秒
2》数据的数量单位:
kb或者k 千字节
mb或者m 兆字节
mbit 兆bit
kbit 千bit
b或者一个无单位数字 字节数
3》时间的计量单位:
s、sec或者secs 秒
ms、msec或者msecs 分钟
us、usec、usecs或者一个无单位数字 微秒
3、TC命令
tc可使用如下命令对QDisc、类和过滤器进行操做:
*add
——在一个节点里加入一个QDisc、类或者过滤器。添加时,须要传递一个祖先做为参数,传递参数时既可使用ID也能够直接传递设备的根。若是要创建一个QDisc或者过滤器,可使用句柄(handle)来命名;若是要创建一个类,可使用类识别符(classid)来命名。
*remove
——删除有某个句柄(handle)指定的QDisc,根QDisc(root)也能够删除。被删除QDisc上的全部子类以及附属于各个类的过滤器都会被自动删除。
*change
——以替代的方式修改某些条目。除了句柄(handle)和祖先不能修改之外,change命令的语法和add命令相同。换句话说,change命令不能必定节点的位置。
*replace
——对一个现有节点进行近于原子操做的删除/添加。若是节点不存在,这个命令就会创建节点。
*link
——只适用于DQisc,替代一个现有的节点。
4、具体操做
Linux流量控制主要分为创建队列、创建分类和创建过滤器三个方面。
4.一、基本实现步骤为:
(1) 针对网络物理设备(如以太网卡eth0)绑定一个队列QDisc;
(2) 在该队列上创建分类class;
(3) 为每一分类创建一个基于路由的过滤器filter;
(4) 最后与过滤器相配合,创建特定的路由表。
4.二、环境模拟实例:
流量控制器上的以太网卡(eth0) 的IP地址为192.168.1.66,在其上创建一个CBQ队列。假设包的平均大小为1000字节,包间隔发送单元的大小为8字节,可接收冲突的发送最长包数目为20字节。
假若有三种类型的流量须要控制:
1) 是发往主机1的,其IP地址为192.168.1.24。其流量带宽控制在8Mbit,优先级为2;
2) 是发往主机2的,其IP地址为192.168.1.30。其流量带宽控制在1Mbit,优先级为1;
3) 是发往子网1的,其子网号为192.168.1.0,子网掩码为255.255.255.0。流量带宽控制在1Mbit,优先级为6。
1. 创建队列
通常状况下,针对一个网卡只需创建一个队列。
将一个cbq队列绑定到网络物理设备eth0上,其编号为1:0;网络物理设备eth0的实际带宽为10 Mbit,包的平均大小为1000字节;包间隔发送单元的大小为8字节,最小传输包大小为64字节。
·#tc qdisc add dev eth0 root handle 1: cbq bandwidth 10Mbit avpkt 1000 cell 8 mpu 64
2. 创建分类
分类创建在队列之上。
通常状况下,针对一个队列需创建一个根分类,而后再在其上创建子分类。对于分类,按其分类的编号顺序起做用,编号小的优先;一旦符合某个分类匹配规则,经过该分类发送数据包,则其后的分类再也不起做用。
1) 建立根分类1:1;分配带宽为10Mbit,优先级别为8。
·#tc class add dev eth0 parent 1:0 classid 1:1 cbq bandwidth 10Mbit rate 10Mbit maxburst 20 allot 1514 prio 8 avpkt 1000 cell 8 weight 1Mbit
该队列的最大可用带宽为10Mbit,实际分配的带宽为10Mbit,可接收冲突的发送最长包数目为20字节;最大传输单元加MAC头的大小为1514字节,优先级别为8,包的平均大小为1000字节,包间隔发送单元的大小为8字节,相应于实际带宽的加权速率为1Mbit。
2)建立分类1:2,其父分类为1:1,分配带宽为8Mbit,优先级别为2。
·#tc class add dev eth0 parent 1:1 classid 1:2 cbq bandwidth 10Mbit rate 8Mbit maxburst 20 allot 1514 prio 2 avpkt 1000 cell 8 weight 800Kbit split 1:0 bounded
该队列的最大可用带宽为10Mbit,实际分配的带宽为 8Mbit,可接收冲突的发送最长包数目为20字节;最大传输单元加MAC头的大小为1514字节,优先级别为1,包的平均大小为1000字节,包间隔发送单元的大小为8字节,相应于实际带宽的加权速率为800Kbit,分类的分离点为1:0,且不可借用未使用带宽。
3)建立分类1:3,其父分类为1:1,分配带宽为1Mbit,优先级别为1。
·#tc class add dev eth0 parent 1:1 classid 1:3 cbq bandwidth 10Mbit rate 1Mbit maxburst 20 allot 1514 prio 1 avpkt 1000 cell 8 weight 100Kbit split 1:0
该队列的最大可用带宽为10Mbit,实际分配的带宽为 1Mbit,可接收冲突的发送最长包数目为20字节;最大传输单元加MAC头的大小为1514字节,优先级别为2,包的平均大小为1000字节,包间隔发送单元的大小为8字节,相应于实际带宽的加权速率为100Kbit,分类的分离点为1:0。
4)建立分类1:4,其父分类为1:1,分配带宽为1Mbit,优先级别为6。
·#tc class add dev eth0 parent 1:1 classid 1:4 cbq bandwidth 10Mbit rate 1Mbit maxburst 20 allot 1514 prio 6 avpkt 1000 cell 8 weight 100Kbit split 1:0
该队列的最大可用带宽为10Mbit,实际分配的带宽为1Mbit,可接收冲突的发送最长包数目为20字节;最大传输单元加MAC头的大小为1514字节,优先级别为6,包的平均大小为1000字节,包间隔发送单元的大小为8字节,相应于实际带宽的加权速率为100Kbit,分类的分离点为1:0。
4.3. 创建过滤器
过滤器主要服务于分类。
通常只需针对根分类提供一个过滤器,而后为每一个子分类提供路由映射。
1) 应用路由分类器到cbq队列的根,父分类编号为1:0;过滤协议为ip,优先级别为100,过滤器为基于路由表。
·#tc filter add dev eth0 parent 1:0 protocol ip prio 100 route
2) 创建路由映射分类1:2, 1:3, 1:4
·#tc filter add dev eth0 parent 1:0 protocol ip prio 100 route to 2 flowid 1:2
·#tc filter add dev eth0 parent 1:0 protocol ip prio 100 route to 3 flowid 1:3
·#tc filter add dev eth0 parent 1:0 protocol ip prio 100 route to 4 flowid 1:4
4.4.创建路由
该路由是与前面所创建的路由映射一一对应。
1) 发往主机192.168.1.24的数据包经过分类2转发(分类2的速率8Mbit)
·#ip route add 192.168.1.24 dev eth0 via 192.168.1.66 realm 2
2) 发往主机192.168.1.30的数据包经过分类3转发(分类3的速率1Mbit)
·#ip route add 192.168.1.30 dev eth0 via 192.168.1.66 realm 3
3)发往子网192.168.1.0/24的数据包经过分类4转发(分类4的速率1Mbit)
·#ip route add 192.168.1.0/24 dev eth0 via 192.168.1.66 realm 4
注:通常对于流量控制器所直接链接的网段建议使用IP主机地址流量控制限制,不要使用子网流量控制限制。如必定须要对直连子网使用子网流量控制限制,则在创建该子网的路由映射前,需将原先由系统创建的路由删除,才可完成相应步骤。
4.5. 监视
主要包括对现有队列、分类、过滤器和路由的情况进行监视。
1)显示队列的情况
简单显示指定设备(这里为eth0)的队列情况
·#tc qdisc ls dev eth0
qdisc cbq 1: rate 10Mbit (bounded,isolated) prio no-transmit
详细显示指定设备(这里为eth0)的队列情况
·#tc -s qdisc ls dev eth0
这里主要显示了经过该队列发送了13232个数据包,数据流量为7646731个字节,丢弃的包数目为0,超过速率限制的包数目为0。
2)显示分类的情况
简单显示指定设备(这里为eth0)的分类情况
·#tc class ls dev eth0
详细显示指定设备(这里为eth0)的分类情况
·#tc -s class ls dev eth0
这里主要显示了经过不一样分类发送的数据包,数据流量,丢弃的包数目,超过速率限制的包数目等等。其中根分类(class cbq 1:0)的情况应与队列的情况相似。
例如,分类class cbq 1:4发送了8076个数据包,数据流量为5552879个字节,丢弃的包数目为0,超过速率限制的包数目为0。
显示过滤器的情况
·#tc -s filter ls dev eth0
这里flowid 1:2表明分类class cbq 1:2,to 2表明经过路由2发送。
显示现有路由的情况
·#ip route
如上所示,结尾包含有realm的显示行是起做用的路由过滤器。
5、实例脚本
5.1 tc限速
# !/bin/sh
touch /var/lock/subsys/local
echo 1 > /proc/sys/net/ipv4/ip_forward (激活转发)
route add default gw 10.0.0.0 (这是加入电信网关,若是你已设了不用这条)
DOWNLOAD=640Kbit (640/8 =80K ,我这里限制下载最高速度只能80K)
UPLOAD=640Kbit (640/8 =80K,上传速度也限制在80K)
INET=192.168.0. (设置网段,根据你的状况填)
IPS=1 (这个意思是从192.168.0.1开始)
IPE=200 (我这设置是从IP为192.168.0.1-200这个网段限速,根据自已的须要改)
ServerIP=253 (网关IP)
IDEV=eth0
ODEV=eth1
/sbin/tc qdisc del dev $IDEV root handle 10:
/sbin/tc qdisc del dev $ODEV root handle 20:
/sbin/tc qdisc add dev $IDEV root handle 10: cbq bandwidth 100Mbit avpkt 1000
/sbin/tc qdisc add dev $ODEV root handle 20: cbq bandwidth 1Mbit avpkt 1000
/sbin/tc class add dev $IDEV parent 10:0 classid 10:1 cbq bandwidth 100Mbit rate 100Mbit allot 1514 weight 1Mbit prio 8 maxburst 20 avpkt 1000
/sbin/tc class add dev $ODEV parent 20:0 classid 20:1 cbq bandwidth 1Mbit rate 1Mbit allot 1514 weitht 10Kbit prio 8 maxburst 20 avpkt 1000
COUNTER=$IPS
while [ $COUNTER -le $IPE ]
do
/sbin/tc class add dev $IDEV parent 10:1 classid 10:1$COUNTER cbq banwidth 100Mbit rate
$DOWNLOAD allot 1514 weight 20Kbit prio 5 maxburst 20 avpkt 1000 bounded
/sbin/tc qdisc add dev $IDEV parent 10:1$COUNTER sfq quantum 1514b perturb15
/sbin/tc filter add dev $IDEV parent 10:0 protocol ip prio 100 u32 match ipdst $INET$COUNTER flowid 10:1$COUNTER
COUNTER=` expr $COUNTER + 1 `
done
iptables -t nat -A POSTROUTING -o eth1 -s 192.168.0.0/24 -J MASQUERADE
5.2 模型
#!/bin/sh
tc qdisc del dev eth7 root &> /dev/null
tc qdisc del dev eth8 root &> /dev/null
#Add qdisc
tc qdisc add dev eth7 root handle 10: htb default 9998
tc qdisc add dev eth8 root handle 10: htb default 9998
#Add htb root node
tc class add dev eth7 parent 10: classid 10:9999 htb rate 1000000kbit ceil 1000000kbit
tc class add dev eth8 parent 10: classid 10:9999 htb rate 1000000kbit ceil 1000000kbit
#Add htb fake default node here
tc class add dev eth7 parent 10:9999 classid 10:9998 htb rate 1000000kbit ceil 1000000kbit
tc class add dev eth8 parent 10:9999 classid 10:9998 htb rate 1000000kbit ceil 1000000kbit
#Add rule node
tc class add dev eth7 parent 10:9999 classid 10:3 htb rate 1kbit ceil 50kbit
tc filter add dev eth7 parent 10: protocol ip handle 3 fw classid 10:3
tc class add dev eth8 parent 10:9999 classid 10:3 htb rate 1kbit ceil 50kbit
tc filter add dev eth8 parent 10: protocol ip handle 3 fw classid 10:3
#Add htb real default node here
tc class change dev eth7 classid 10:9998 htb rate 1kbit ceil 1000000kbit
tc class change dev eth8 classid 10:9998 htb rate 1kbit ceil 1000000kbit