天灾还是人祸?互联网大厂的低级错误何时休
随着互联网的普及,人们对互联网的依赖度越来越高。这就表明了越是互联网大厂,对社会的影响就越来越大。
前段事件微盟运维删库,对公司和客户造成了巨大的损失,股价大跌,市值约蒸发了近20亿港元,还有更要命的是后续客户对其Saas业务的信心会有很大的顾虑。这个影响的波及面可能不是很大,但是下面这个对用户和企业名牌的影响是非常大的。
网易邮箱现重大失误,导致大量用户无法使用,特别是苹果用户。其实故障在2020年2月20日就出现了,主要原因是因为服务器证书快要到期了,得更新。在弹窗中苹果标注不能验证「appleimap.163.com」的身份,简单来说就是这个域名的 HTTPS 证书无法被信任。
然而要命的是,网易邮件团队居然没有发现是证书的原因,到了3月20日那天才想起来,网易邮箱及部分网易产品使用的通配符数字证书的到期时间是 2020年3月20日 周五晚上八点整。
而打脸的是,这个还是网易邮箱团队根据用户反馈的信息去更新的证书。大家看到这里是不是觉得有点意思了,一个互联网大厂,工作流程都相对比较严谨,邮箱业务也做了这么多年(网易邮箱可以说是国内邮箱领域第一梯队的了);居然出现这么低级的错误,这不由让人深思。
1、网易这些年来的主营业务是游戏,邮箱这块是不是由于营收什么原因,在内部得不到重视了。
2、网易内部管理或许没有外界想象的这么好。
3、这是不是人为故意的?
4、这么大个厂没有自行开发一个自动化的证书检查工具么?
5、随着协同办公软件的崛起,未来邮箱业务会不会变成鸡肋(其实已经比较鸡肋了)。
6、如果邮箱业务退出历史舞台,替代它的产品是什么形态呢?
其实除了网易,就在今年微软也出现过类似情况,导致旗下teams通讯工具在全球出现不可用的情况。
我们来看看其他科技公司都出过哪些乌龙事件。其他的就不多列举了,总之证书过期、删库、升级BUG、隐私BUG、硬件不可修复BUG在科技领域是数不胜数,或许很多漏洞是早期没有发现,一旦用户数到了一定量级才体现,或许很多乌龙就是人为的,还有就是不管你做如何完善,新的BUG也会一直伴随,就像幽灵一样。这也警醒了我们科技公司,或许在这些事件面前,他们会对这些行为制定更优的解决方案或者是提醒机制,愿天下没有BUG,这会跟世界和平一样难于实现。
那么未来有没有一种技术能够实现呢?我想是可以做得更好,而是不能够完全杜绝。1、技术是不断革新的,不管软件还是硬件。在革新的过程中,功能越来越强大,覆盖面越来越广泛,因为技术的新,那么很多问题也是曾经没有出现过的。
2、利用AI进行故障和BUG的模拟,这个可以做,但是首先要确保AI本身就没有BUG,想必目前一些科技企业已经在这块有所建树。
3、很多故障的模拟和复现是需要在一定的环境下,有些可能还不是那么容易复现,需要花费大量人力和物力/
4、量子计算技术或许未来会在这方面做出巨大的贡献,但是也不能做到天衣无缝。
5、科技本身就是一把双刃剑,有攻就有防,有来自内部的也有来自外部的。
写在最后,基于物理层面的故障预测性维护比较容易实现,而基于信息层面的故障预测性维护系统相对要复杂很多,特别是基于互联网和物联网层面的,随着未来物联网技术的普及,会出现越来越多的漏洞,为了在领域成为常青树,如何有效规避和解决这些故障和BUG是科技企业的必修课。