vxlan理论基础算法
一、 vxlan优点;
1)、解决VLAN Tag域只有12比特的限制,经过24比特的VNI能够支持多达16M的VXLAN段的网络隔离,对用户进行隔离和标识再也不受到限制,可知足海量租户。
2)、除VXLAN网络边缘设备,网络中的其余设备不须要识别虚拟机的MAC地址,减轻了设备的MAC地址学习压力,提高了设备性能。
3)、采用MAC in UDP封装来延伸二层网络,实现了物理网络和虚拟网络解耦。服务器
二、 vxlan基本概念;
1)、Underlay网络和Overlay网络:
将已有的物理网络做为Underlay网络,在其上构建出虚拟的二层或三层网络,即Overlay网络。(即:创建VXLAN隧道的基础网络称为Underlay网络,VXLAN隧道所承载的业务网络称为Overlay网络。)
Overlay网络经过封装技术、利用Underlay网络提供的三层转发路径,实现租户报文在不一样站点间传递。对于租户来讲,Underlay网络是透明的,只能感知到Overlay网络。网络
2)、NVE(Network Virtualization Edge):
网络虚拟边缘节点NVE,实现网络虚拟化功能的网络实体。报文通过NVE封装转换后,NVE间就可基于三层基础网络创建二层虚拟化网络。
注:设备和服务器上的虚拟交换机VSwitch均可以做为NVE。分布式
3)、VTEP(VXLAN Tunnel Endpoints):
VTEP是VXLAN隧道端点,封装在NVE中,用于VXLAN报文的封装和解封装。
VTEP与物理网络相连,分配有物理网络的IP地址,该地址与虚拟网络无关。
VXLAN报文中源IP地址为本节点的VTEP地址,VXLAN报文中目的IP地址为对端节点的VTEP地址,一对VTEP地址就对应着一个VXLAN隧道。ide
4)、VNI(VXLAN Network Identifier):
网络标识,相似VLAN ID,用于区分VXLAN段,不一样VXLAN段的虚拟机不能直接二层相互通讯。性能
5)、BD(Bridge Domain):
VXLAN网络中转发数据报文的二层广播域。
在VXLAN网络中,将VNI以1:1方式映射到广播域BD,BD成为VXLAN网络转发数据报文的实体。学习
6)、VBDIF接口:
基于BD建立的三层逻辑接口。
经过VBDIF接口配置IP地址可实现不一样网段的VXLAN间,及VXLAN和非VXLAN的通讯,也可实现二层网络接入三层网络。ui
7)、VAP(Virtual Access Point):
虚拟接入点VAP,即VXLAN业务接入点,能够是二层子接口或VLAN。blog
8)、网关(Gateway):
和VLAN相似,不一样VNI之间的VXLAN,及VXLAN和非VXLAN之间不能直接相互通讯。为了使VXLAN之间,以及VXLAN和非VXLAN之间可以进行通讯,VXLAN引入了VXLAN网关。
Vxlan网关分类:
a、二层网关:用于解决租户接入VXLAN虚拟网络的问题,也可用于同一VXLAN虚拟网络的子网通讯。
b、三层网关:用于VXLAN虚拟网络的跨子网通讯以及外部网络的访问。接口
三、 vxlna报文格式;
1)、VXLAN header:
a、VXLAN Flags:8比特,取值为00001000。
b、VNI:VXLAN网络标识,24比特,用于区分VXLAN段。
c、Reserved:24比特和8比特,必须设置为0。
2)、Outer UDP header:
a、DestPort:目的UDP端口号是4789。
b、Source Port:源端口号是内层报文经过哈希算法计算后的值。
3)、Outer IP header:
a、IP SA:源IP地址是VXLAN隧道本端VTEP的IP地址。
b、IP DA:目的IP地址是VXLAN隧道远端VTEP的IP地址。
4)、Outer Ethernet header:
a、MAC DA:在发送报文的虚拟机所属VTEP上根据目的VTEP地址查找路由表,路由表中下一跳IP地址对应的MAC地址。
b、MAC SA:发送报文的虚拟机所属VTEP的MAC地址。
c、802.1Q Tag:可选字段,该字段为报文中携带的VLAN Tag。
d、Ethernet Type:以太报文类型。
四、 vxlan三层网关部署方式;
1)、集中式网关部署:
优势:对跨子网流量进行集中管理,网关的部署和管理比较简单。
缺点:转发路径不是最优、ARP表项规格瓶颈。
2)分布式网关部署:
VXLAN分布式网关是指在典型的“Spine-Leaf”组网结构下,将Leaf节点做为VXLAN隧道端点VTEP,每一个Leaf节点均可做为VXLAN三层网关,Spine节点不感知VXLAN隧道,只做为VXLAN报文的转发节点。
Vxlan分布式网关特色:
a、同一个Leaf节点既能够作VXLAN二层网关,也能够作VXLAN三层网关,部署灵活。
b、Leaf节点只须要学习自身链接服务器的ARP表项,而没必要像集中三层网关同样,须要学习全部服务器的ARP表项,解决了集中式三层网关带来的ARP表项瓶颈问题,网络规模扩展能力强。
五、 E×××基本原理;
E×××(Ethernet Virtual Private Network)是一种用于二层网络互联的×××技术。
E×××经过扩展BGP协议新定义了几种BGP E×××路由,这些BGP E×××路由能够用于传递VTEP地址和主机信息,E×××应用于VXLAN网络中,可使VTEP发现和主机信息学习从数据平面转移到控制平面。
六、 BGP E×××路由
1)、Type2路由——MAC/IP路由:
Route Distinguisher:该字段为E×××实例下设置的RD(Route Distinguisher)值。
Ethernet Segment Identifier:该字段为当前设备与对端链接定义的惟一标识。
Ethernet Tag ID:该字段为当前设备上实际配置的VLAN ID。
MAC Address Length:该字段为此路由携带的主机MAC地址的长度。
MAC Address:该字段为此路由携带的主机MAC地址。
IP Address Length:该字段为此路由携带的主机IP地址的掩码长度。
IP Address:该字段为此路由携带的主机IP地址。
MPLS Label1:该字段为此路由携带的二层VNI。
MPLS Label2:该字段为此路由携带的三层VNI。
Type2路由在vxlan控制平面中的做用:
一、主机MAC地址通告:
要实现同子网主机的二层互访,两端VTEP须要相互学习主机MAC。做为BGP E×××对等体的VTEP之间经过交换MAC/IP路由,能够相互通告已经获取到的主机MAC。其中,MAC Address Length和MAC Address字段为主机MAC地址。
二、主机ARP通告:
MAC/IP路由能够同时携带主机MAC地址+主机IP地址,所以该路由能够用来在VTEP之间传递主机ARP表项,实现主机ARP通告。
三、主机IP路由通告:
在分布式网关场景中,要实现跨子网主机的三层互访,两端VTEP(做为三层网关)须要互相学习主机IP路由。做为BGP E×××对等体的VTEP之间经过交换MAC/IP路由,能够相互通告已经获取到的主机IP路由。其中,IP Address Length和IP Address字段为主机IP路由的目的地址,同时MPLS Label2字段必须携带三层VNI。此时的MAC/IP路由也称为IRB(Integrated Routing and Bridge)类型路由。
注:ARP类型路由携带的有效信息有:主机MAC地址+主机IP地址+二层VNI;IRB类型路由携带的有效信息有:主机MAC地址+主机IP地址+二层VNI+三层VNI。所以,IRB类型路由包含着ARP类型路由,不只能够用于主机IP路由通告,也能用于主机ARP通告。
2)、Type3路由——Inclusive Multicast路由:
由前缀和PMSI属性组成,各字段解释以下:
Route Distinguisher:该字段为E×××实例下设置的RD(Route Distinguisher)值。
Ethernet Tag ID:该字段为当前设备上的VLAN ID。在此路由中为全0。
IP Address Length:该字段为此路由携带的本端VTEP IP地址的掩码长度。
Originating Router's IP Address:该字段为此路由携带的本端VTEP IP地址。
Flags:该字段为标志位,标识当前隧道是否须要叶子节点信息。在vxlan场景中,该字段没有实际意义。
Tunnel Type:该字段为此路由携带的隧道类型。
MPLS Label:该字段为此路由携带的二层VNI。
Tunnel Identifier:该字段为此路由携带的隧道信息。目前,在VXLAN场景中,该字段也是本端VTEP IP地址。
该类型路由在VXLAN控制平面中主要用于VTEP的自动发现和VXLAN隧道的动态创建。做为BGP E×××对等体的VTEP,经过Inclusive Multicast路由互相传递二层VNI和VTEP IP地址信息。其中,Originating Router's IP Address字段为本端VTEP IP地址,MPLS Label字段为二层VNI。若是对端VTEP IP地址是三层路由可达的,则创建一条到对端的VXLAN隧道。同时,若是对端VNI与本端相同,则建立一个头端复制表,用于后续BUM报文转发。
3)、Type5路由——IP前缀路由:
Route Distinguisher:该字段为E×××实例下设置的RD(Route Distinguisher)值。
Ethernet Segment Identifier:该字段为当前设备与对端链接定义的惟一标识。
Ethernet Tag ID:该字段为当前设备上实际配置的VLAN ID。
IP Prefix Length:该字段为此路由携带的IP前缀掩码长度。
IP Prefix:该字段为此路由携带的IP前缀。
GW IP Address:该字段为默认网关地址。该字段在VXLAN场景中没有实际意义。
MPLS Label:该字段为此路由携带的三层VNI。
该类型路由的IP Prefix Length和IP Prefix字段既能够携带主机IP地址,也能够携带网段地址:
一、当携带主机IP地址时,该类型路由在VXLAN控制平面中的做用与IRB类型路由是同样的,主要用于分布式网关场景中的主机IP路由通告。
二、当携带网段地址时,经过传递该类型路由,能够实现VXLAN网络中的主机访问外部网络。