源码安全:悬在大厂头上的达摩克利斯之剑

本文首发于 CODING 官方微信公众号——
《源码安全:悬在大厂头上的达摩克利斯之剑》

E1Q6aQ.png

“ Please help us!!!”html

从 B 站源码泄露开始到 GitHub 最终删除代码的两小时,大概是今年 B 站最煎熬的时刻,以致于他在向 Github 求助删除的 DMCA 邮件中,在 Please help us 后写下了三个醒目的感叹号。git

注:DMCA 即数字千年版权法(Digital Millennium Copyright Act),是美国制定的一项旨在保护版权的法律。它包括禁止分发受版权保护的材料和规避版权保护监管的规定。

B 站代码泄漏虽然不是国内第一次代码泄漏事件,倒是第一次因代码泄漏上热搜的话题。程序员

去年在阿里云的代码托管平台上,也发生了企业代码泄漏事件。因为界面上的功能歧义,上百家企业在建立项目的时候误选择 “internal” ,将企业项目代码进行了“平台公开”。同年八月份华住集团旗下酒店 5 亿条公民我的信息被曝泄露。针对这次泄漏的缘由,相关科技组织分析是因为一位程序员(疑似华住程序员)曾在 GitHub 上传了一个名为 CMS 项目,项目的配置文件代码里包含了华住敏感的服务器及数据库信息,被黑客利用攻击致使泄露。github

除了上述状况以外,一些新入门的同窗尚未意识到源代码属于商业机密,将公司代码拷贝到我的电脑后,出于共享学习的心态传到了公共平台;或者是离职的同窗在离开公司时没有带走一片云彩,却带走了源代码。总之,企业核心源代码被“开源”的现象家常便饭。web

E1QRGn.png

GitHub 2017~2018 年的 DMCA 删除通知数量

很多企业都有本身的代码防泄漏机制,好比核心代码权限控制、内外网隔离、保密协议等等措施,但代码泄漏的现象依然在发生。并且影响严重的代码泄漏事件很多都是由第三方发现的,等企业着手处理时已形成很多损失。接下来咱们要探讨的就是如何把代码泄漏的危害降到最低,咱们列出常见的实践,以及在主流代码托管平台上发现侵权的仓库后能够怎么作,以供读者参考。算法

注重编程规范

对于企业来讲,除了保障业务快速交付外,信息安全也是重中之重。特别是在信息及其敏感的行业,例如金融、公安、通信、军工等。很多公司都有很是严格的编程规范,例如:数据库

  1. 不容许将敏感信息硬编码在代码中,敏感信息一般包括用户帐户、密码、电话号码、数据库密码、服务器远程登陆密码等等。若是确实须要在代码里的配置文件当中存储敏感信息,建议也不要明文存储。
  2. 当代码涉及到加解密算法时,密钥不容许所有硬编码在代码中。同时加解密算法要选择强度足够的、业界承认的算法,密钥也要支持按期更换。

E1Q2Ps.jpg

相似上述的编码规范可经过源码安全扫描工具对版本进行增量扫描,避免人工检视的低效率。有一些团队不肯意花时间在这些并不直接或者并不当即产生价值的事务上,但咱们建议在安全和进度之间,研发团队须要找到一个平衡。编程

创建监控机制

越早发现泄漏代码,越容易控制源代码传播范围。经过定时扫描代码托管网站上的新增公开项目,查看是否存在可能涉及本公司项目源码的仓库。如何经过自动化扫描监控公开项目有以下几种方式:安全

  • 现有的关键字扫描开源工具,市面上提供了很多工具帮助企业去实时监控公开网站上是否存在设定的关键字相关的,好比仓库名称、仓库描述、仓库文件名称等等。
  • 根据代码托管网站的公开 API 来开发扫描工具。好比 GitHub 对公开仓库提供的 Search 接口。

E1QrqS.jpg

  • 经过爬虫拉取代码托管网站上合法公开的信息。因为一些现有工具存在限制或者不符合代码监控的需求,开发者也可考虑自行编写数据获取程序来进行监控,按照必定的搜索排序算法获取数据,天天定时识别可能涉及泄漏的关键记录后发送邮件告警。

及时申诉

提早了解主流代码托管平台对于侵权代码的处理策略可让企业快速采起措施删除侵权仓库,把即将泛滥的 Fork 扼杀在摇篮里。服务器

  • GitHub 的 DMCA 策略

GitHub 有两种方式:版权全部者要求删除内容的删除通知程序;用户在内容被错误取下时从新启用内容的反通知程序。对于要求删除仓库的通知,GitHub 的处理流程:

  1. 若是通知声明代码仓库中部份内容涉嫌侵权,GitHub 会联系建立存储库的用户,并给他们 24 小时来删除或修改通知中指定的内容。若是仓库拥有者因为节假日、垃圾邮箱的缘由错过通知邮件,那么还有惟一一次额外的24小时来修改。
  2. 若是 DMCA 通知声称存储库的所有内容都存在侵权。那么 GitHub 会迅速禁用整个存储库。就像 B 站此次的泄漏,就几乎没有整改时间窗直接被禁用。
  • CODING 996 贴心守护

CODING 不提供公开代码的功能,旧版我的版中能够经过分享连接的方式邀请外部人员查看代码仓库,同时该外链不支持检索。点击便可体验 CODING 代码安全保护。
若您在分享连接当中发现到侵权的内容时,可经过热线联系咱们 24 小时的运营人员(support@coding.net),告知侵权状况,咱们会通知仓库拥有者进行确认及整改。咱们也建议我的开发者在分享代码仓库前要慎重,保管好分享外链。

  • 在 Bitbucket 上报告版权违规行为

Atlassian 对云产品或网站(包括 Bitbucket )上进行侵犯版权的活动也提供了对应政策。若是用户通知网站上的数据或内容侵犯了本身的版权,按照政策当中要求的列表将侵权信息通知给 Atlassian 版权代理人,Atlassian 会按照 DMCA 从服务中删除涉及侵权的数据或内容。

严肃对待开源

1997 年的春天,包含 Eric Raymond,Tim O'Reilly 在内的自由软件社团第一次提出了“Open Source(开源软件)”这个术语。从那时起支持“开源软件”与支持“专有商用软件”已成为了软件行业的两大阵营。支持“开源软件”的阵营以一个科研的角度对待源代码,他们坚信为了促进计算机科学的进一步发展,源代码是必须被共享和发布的科学知识。另外一方则站在工业界的角度,认为企业必须对商业秘密守口如瓶。不管开源运动最终走向何方,从目前来看就算使用开源软件也不意味着源代码就能够随意共享,开发者必须严格按照开源软件协议使用。

重视本身的代码版权,同时也尊重他人的代码版权。咱们但愿企业被“开源”的现象会愈来愈少,同时也但愿意外的源码泄漏不会成为企业的致命一击。

注:
Eric Raymond,著名的程序员,开源软件运动的表明人物之一。主持开发了开源软件── Fetchmail 。同时也是 NTERCAL 编程语言的主要创做者之一,曾经为 EMACS 编辑器做出贡献。
Tim O'Reilly,O'Reilly Media 出版公司的创始人,也是非会议的鼻祖 Foo Camp 的发起人。他是自由软件和开源软件运动的强力支持者,“ web 2.0 ”一词为他所独创。

参考
https://help.github.com/en/ar...
https://www.atlassian.com/leg...
https://baijiahao.baidu.com/s...
http://cloud.idcquan.com/yzx/...
《开源软件文集:开源革命之声》做者: Chris DiBona / Sam Ockman / Mark Stone 

更多内容,欢迎关注——
E1lsQx.jpg

相关文章
相关标签/搜索