来自 科技 2020-04-08 15:09 的文章

天灾还是人祸?互联网大厂的低级错误何时休

随着互联网的普及,人们对互联网的依赖度越来越高。这就表明了越是互联网大厂,对社会的影响就越来越大。天灾还是人祸?互联网大厂的低级错误何时休

前段事件微盟运维删库,对公司和客户造成了巨大的损失,股价大跌,市值约蒸发了近20亿港元,还有更要命的是后续客户对其Saas业务的信心会有很大的顾虑。这个影响的波及面可能不是很大,但是下面这个对用户和企业名牌的影响是非常大的。

网易邮箱现重大失误,导致大量用户无法使用,特别是苹果用户。


天灾还是人祸?互联网大厂的低级错误何时休

其实故障在2020年2月20日就出现了,主要原因是因为服务器证书快要到期了,得更新。在弹窗中苹果标注不能验证「appleimap.163.com」的身份,简单来说就是这个域名的 HTTPS 证书无法被信任。

然而要命的是,网易邮件团队居然没有发现是证书的原因,到了3月20日那天才想起来,网易邮箱及部分网易产品使用的通配符数字证书的到期时间是 2020年3月20日 周五晚上八点整。


天灾还是人祸?互联网大厂的低级错误何时休

而打脸的是,这个还是网易邮箱团队根据用户反馈的信息去更新的证书。大家看到这里是不是觉得有点意思了,一个互联网大厂,工作流程都相对比较严谨,邮箱业务也做了这么多年(网易邮箱可以说是国内邮箱领域第一梯队的了);居然出现这么低级的错误,这不由让人深思。

1、网易这些年来的主营业务是游戏,邮箱这块是不是由于营收什么原因,在内部得不到重视了。

2、网易内部管理或许没有外界想象的这么好。

3、这是不是人为故意的?

4、这么大个厂没有自行开发一个自动化的证书检查工具么?

5、随着协同办公软件的崛起,未来邮箱业务会不会变成鸡肋(其实已经比较鸡肋了)。

6、如果邮箱业务退出历史舞台,替代它的产品是什么形态呢?

其实除了网易,就在今年微软也出现过类似情况,导致旗下teams通讯工具在全球出现不可用的情况。

天灾还是人祸?互联网大厂的低级错误何时休

我们来看看其他科技公司都出过哪些乌龙事件。


2020年2月, FCoin(币圈)宣布销毁团队拥有的7亿枚FT,然后,然后就得到通知FCoin停服维护,虽然没说明原因,外界猜测大概率是内讧删库跑路。2019年,苹果公司错用美元结算工资,工资翻7倍,员工表示不敢用。2019年,Google+下线。谷歌自己也承认,“90%的谷歌+用户会话都不到5秒就结束了。因为谷歌发现了一个漏洞,开发者可以公开用户的私人信息,安全漏洞发生了。这是比较大的漏洞了。2019年,游戏公司螃蟹网络公告称,公司一款游戏在上线测试当天,遭后端主程序员锁死服务器不交接工作。最终导致耗时两年、耗资600万的项目失败。2018年,顺丰一位高级工程师在升级系统数据库时,不慎将RUSS数据库删除,导致了大约10小时顺丰线上发车功能无法使用。2018年,英特尔,当时有消息披露,供应给个人电脑、笔记本电脑、服务器、手机和其他设备的芯片存在安全缺陷,多年来一直无人注意。据报道,针对这些缺陷的修复将导致系统的性能下降高达30%。这些代号为“熔断”(Meltdown)和“幽灵”(Spectre)的漏洞,可能被用来从易受攻击的计算机中提取敏感信息。这么多年来一直都有,没法解决。2018年,Facebook Bug改变了1400万用户的隐私设置,暴露了私人照片,并且Facebook让亚马逊(Amazon)等公司绕开了它的隐私规定。

其他的就不多列举了,总之证书过期、删库、升级BUG、隐私BUG、硬件不可修复BUG在科技领域是数不胜数,或许很多漏洞是早期没有发现,一旦用户数到了一定量级才体现,或许很多乌龙就是人为的,还有就是不管你做如何完善,新的BUG也会一直伴随,就像幽灵一样。这也警醒了我们科技公司,或许在这些事件面前,他们会对这些行为制定更优的解决方案或者是提醒机制,愿天下没有BUG,这会跟世界和平一样难于实现。

那么未来有没有一种技术能够实现呢?我想是可以做得更好,而是不能够完全杜绝。

1、技术是不断革新的,不管软件还是硬件。在革新的过程中,功能越来越强大,覆盖面越来越广泛,因为技术的新,那么很多问题也是曾经没有出现过的。

2、利用AI进行故障和BUG的模拟,这个可以做,但是首先要确保AI本身就没有BUG,想必目前一些科技企业已经在这块有所建树。

3、很多故障的模拟和复现是需要在一定的环境下,有些可能还不是那么容易复现,需要花费大量人力和物力/

4、量子计算技术或许未来会在这方面做出巨大的贡献,但是也不能做到天衣无缝。

5、科技本身就是一把双刃剑,有攻就有防,有来自内部的也有来自外部的。

写在最后,基于物理层面的故障预测性维护比较容易实现,而基于信息层面的故障预测性维护系统相对要复杂很多,特别是基于互联网和物联网层面的,随着未来物联网技术的普及,会出现越来越多的漏洞,为了在领域成为常青树,如何有效规避和解决这些故障和BUG是科技企业的必修课。