随着京东云业务的飞速发展,其须要管理的物理机、虚机以及各种容器已经达到了数十万之巨,在如此数量如此庞大资源机如何管理的课题面前,京东云意识到必须开发本身的高效、安全、稳定的资源机管理系统,为京东云乃至整个京东集团各项业务的发展提供坚实可靠的后盾,“门神”系统在这种状况下应运而生,并在通过屡次京东61八、11.11等诸多重大活动的检验后,变得愈发成熟稳定。
“门神”顾名思义,就是守护整个京东资源机云安全的守护神,是京东云平台自主研发的一套基于服务树角色受权的线上机器运维平台,该平台支持认证登陆、系统运维和安全审计,能够对京东云平台全部的主机进行统一的访问控制、操做历史记录等,是符合4A的专业运维审计系统,构建统1、高效、安全运维通道,保障云端运维工做遵循法律法规要求、下降人为安全风险,提升运维效率。前端
为了适应京东云业务快速发展、所需管理的物理机、虚机和容器数量指数级增长的现状,知足公司安全认证、高效运维、操做审计、职权管控的要求,门神设计初期就制定了以下目标:shell
门神系统涉及诸多技术,其中核心技术点包括:数据库
从门神整体架构图能够看出,门神的数据源是京东云自研的核心数据模块(服务树模块),全部用户和资源机信息都是从服务树模块获取并保存到数据库和kerberos中的,并经过脚本实时同步服务树中变化的数据,从而保证数据会实时的同步到门神系统。门神主要模块包括relay、kerberos、relay-server、doorgod-api和须要安装到资源机的客户端dg-client,下文介绍结合核心模块的设计和实现。api
门神用户操做界面通过开发团队反复打磨,简单易用,人机交互天然流畅,主界面为受权给用户的资源机信息,右边部分展现快捷键信息和登陆历史信息,下方是用户输入区,用户能够经过以下方式登陆资源机:安全
a、输入主界面index number选择资源机登陆;网络
b、直接输入ip登陆;架构
c、输入应用名称或者ip进行模糊匹配,选择具体资源机登陆;并发
d、输入右侧历史记录的index number登陆(以“!”开始)。运维
recorder进行tty劫持,从而实现录屏功能,用户全部的操做都会被记录下来,经过syslog发送到kafka集群,最终被ES集群消费和存储,做为用户提供操做审计查询的数据源。ssh
经过云翼能够按照目的ip、操做类型、关键字(支持精确匹配和模糊匹配)、时间进行查询操做日志,从而实现用户操做全程审计;门神还支持用户操做回放功能,能更加清楚的对用户操做进行审计。
门神系统为京东云软件开发、测试、运维人员提供了统一的运维入口,只须要记住一个密码就能登陆全部受权主机,并自由的在受权主机之间穿梭,这极大的减轻了软件工程师们的工做负担,提高了工做效率。同时,又为运维安全提供了技术实现方面的保障,将审计工做贯彻到整个运维流程全过程当中,切实保证了线上机器的运维安全。
当前,门神已经成为京东云线上机器运维的主要平台,成功为京东61八、11.11等诸多重大活动提供运维支持保障,成为助力京东云快速、高质量发展的重要力量之一。门神团队正在开发门神系统的控制台产品-堡垒机,该产品将以开源版本和商业版本两种方式发布,请各位读者朋友多提宝贵意见。
点击“阅读”了解京东云翼产品!
欢迎点击“京东云”了解更多精彩内容