Controller Plane
Toward Highly Available and Scalable Software Defined Networks for Service Providers
- IEEE Communications Magazine
- 2017
- 综述类,讨论了控制器做为一个故障点的问题。控制器之间的同步机制以及主备控制器的切换;
Response Time and Availability Study of RAFT Consensus in Distributed SDN Control Plane
- IEEE Transactions on Network and Service Management
- 2018
- 问题:单控制器不可靠;
而且,对于强一致性的分布式协议(RAFT),提交每一个请求(选举备用控制器等)前须要集群中每一个成员确认,可能花费大量时间(这与集群大小,网络延迟相关),而不少网络服务是时延敏感的;
- 方法:基于RAFT,提出一种快速恢复的过程;
Heuristic Approaches to the Controller Placement Problem in Large Scale SDN Networks
- IEEE Transactions on Network and Service Management
- 2015
- 问题:一个网络中知足可用性和快速恢复的最少控制器数量;
在大多数场景中,不少条件没法同时知足;
大规模网络或动态网络中,底层资源变化频繁,没法快速找到最佳的恢复方法;
- 方法:提供工具集,考虑各类条件优先的状况下的分布式控制器放置;
在大规模网络或动态网络中,提供启发式算法来尽快地找到备用控制器;
In-band control, queuing, and failure recovery functionalities for openflow
- IEEE Network
- 2016
- 问题:带内的OpenFLow网络中的故障会致使服务的中断,而这种网络的故障恢复还没被考虑;
- 方法:利用BFD和队列方式来进行带内OpenFlow的快速恢复;
An Efficient Algorithm for Constructing Controller Trees in SDN
- IEEE Global Communications Conference
- 2017
- 问题:以控制器为根的树形SDN网络拓扑中,当一个父节点宕机时,其子树的交换机会失去与控制器的链接;
- 方法:根据交换机到控制器的距离和非树内边来构造树形拓扑;
Capacity-aware and Delay-guaranteed Resilient Controller Placement for Software-Defined WANs
- IEEE Transactions on Network and Service Management
- 2018
- 解决:控制器放置问题(CCP),针对广域网中的控制器数量和放置方面来提升网络的弹性;
- 方法:对CCP进行建模,考虑了单个控制器节点宕机时的恢复状况,将备用控制器的选举从CCP问题独立出来,以达到更好的灵活性;
Beehive: Simple distributed programming in software-defined networks
- Symposium on Software Defined Networking
- 2016
- 问题:分布式控制器对于网络编程不友好;
大部分控制器使用额外的数据库形成时延及其余的问题;
- 方法:实现一种对编程友好的分布式控制器架构,提供key-value存储,消息队列,故障恢复和实时检测等功能;并为编程人员提供了友好的API;
Ravana: controller fault-tolerance in software-defined networking
- ACM SIGCOMM Symposium on Software Defined Networking Research
- 2015
- 问题:主备控制器切换时,因为状态(控制器和交换机)的不一致致使网络行为不一致;
- 方法:将网络事件的处理过程看作一个事务处理,发送故障是根据log进行处理;
使用两段备份协议来备份状态;
FASIC: A Fast-Recovery, Adaptively Spanning In-Band Control Plane in Software-Defined Network
- IEEE Global Communications Conference
- 2017
- 问题:在带内的SDN网络中,因为数据流量和控制流量共享相同的物理链接和设备,数据流的增大可能会致使控制流量丢失或者延迟;
方法:设计一种带内SDN网络的控制平面,包括自治的控制平面初始化、流量感知来避免控制流量阻塞及快速恢复;快速恢复方面:下发部分的控制逻辑到交换机,容许交换机在控制器不可达时寻找新的控制器;
Primary-Backup Controller Mapping for Byzantine Fault Tolerance in Software Defined Networks
- IEEE Global Communications Conference
- 2017
- 问题:解决拜占庭将军故障恢复问题须要的大量控制器,而且交换机须要同时给多个控制器发送消息;
- 方法:减小每一个交换机的备用控制器的数量,并容许多个交换机共享备用的控制器;同时,在交换机与控制器链接方面,考虑控制器的负债和OF的时延;
欢迎关注本站公众号,获取更多信息