浙江省杭州市滨江区长河街道滨安路1190号3幢智汇领地科技园A区A楼11层1101室 19791158143 unruffled@att.net

项目展示

微软怎么会让 CrowdStrike 的崩溃发生呢? 媒体

2025-05-13

CrowdStrike IT灾难的责任及其影响

关键要点

CrowdStrike因为其更新的质量检查失误,导致全球85百万台Windows电脑无法启动,面临广泛批评。微软在核准关键系统更新时的失误让人震惊,外界质疑其管理系统的效率和责任。企业需要在软件更新中承担更多责任,尤其是在面对潜在安全漏洞时。

CrowdStrike背负着全球IT灾难的终极责任,这场发生在7月19日的事件使全球85百万台Windows计算机失败启动。CrowdStrike的显著失误于其未经过适当质量审查的软件更新,令人震惊。针对其失职,CrowdStrike遭受了大量批评,这些指责是当之无愧的。

但事情还有另一个,甚至更令人不安的方面。

微软怎么会允许这种情况发生?它怎么能允许未经适当测试的内核级别更新?

微软怎么会让 CrowdStrike 的崩溃发生呢? 媒体

在1990年代,我的工作是对Windows驱动程序进行质量检测,涵盖了图形、视频和3D硬件。我非常热爱这项工作,这需要大量时间来测试、重复测试以及向工程师解释问题所在。然后进入新一轮的测试,反复进行。

经过数月的努力,当驱动程序的错误列表缩小到微不足道时,便会进行最后一轮微软的审核。

微软不会仅仅相信我说驱动程序不会崩溃Windows。我们必须将软件通过微软的质量检测流程,然后提交给微软进行最终审核。

并非所有软件都需要这最后的测试环节只是那些访问Windows低级别功能的软件。

微软的开发工具赋予工程师不同级别的操作系统访问权限,从用户界面功能如对话框到更低级别的系统内核。如果开发人员只想编写桌面应用程序如文字处理软件、照片编辑器、天气应用等而仅访问更高一级的功能,他们可以不用获得微软的批准。

由于这种分层体系,开发Windows桌面应用程序一直很安全。如果代码有漏洞,程序可能崩溃,但不会对计算机造成致命影响。最糟糕的情况是用户只需重启计算机。

这种开放模式对微软的成功至关重要。允许任何人开发和发布桌面应用程序,同时保障操作系统的安全,帮助微软成为全球最大的成功软件公司。

这种成功的背后,是微软文化中对内部开发、维护和质量的重视。

有人可能会争辩,微软现在无法测试每一个低级别的软件,因为软件是在线分发而不是通过软盘。安全问题也变得至关重要,或许再也无法在部署更新以防止漏洞被利用之前等待微软的质量审核。

clash verge 下载

我不同意这一观点。对于Windows内核更新而言,负责任的软件公司应等待。

大型软件客户企业还应该雇佣合格的安全专业人员,他们在面对可利用的漏洞时不会慌乱。这样,他们可以为可能的攻击做好准备,并在补丁准备好之前进行网络防御。

难道等几天总比祈祷某个第三方供应商不会造成所有机器瘫痪要强吗?是否更合理的是如果公司有一个一万节点的网络,而不是某个第三方软件供应商,最终对其正常运行负责?

但如果有大量供应商希望编写内核级代码,微软不可能对所有人都进行测试,对吗?实际上,微软曾经能做到,至今仍然可以。

首先,大型软件公司可以购买开发者合作伙伴关系的不同级别,以获得优先进入微软质量检查的机会。其次,微软也可以创建,或许已经创建了一系列的自动化质量测试套件,能够快速提供初步可部署确认。

让我们设想一个假设场景:

Acme Cybersecurity发现其最新发布存在一个错误。DevSecOps团队迅速着手修复,并承诺在明天结束前提供解决方案。Acme通知其客户蓝天航空,这家公司雇有安全专业人员,他们可以在等待补丁时监控潜在威胁。

Acme解释说,即便修复完成,他们仍需等待微软的确认。Acme向微软支付了高额的年费,成为“紧密合作伙伴”,因此其软件的变更优先处理,质量测试将在三个工作日内完成。

同时,Acme将其最新代码提交给微软进行自动质量测试。这一过程耗时一天,审核