BGP 是“边界网关协议”的缩写,作为一套允许在互联网上的自治系统(AS)之间交换路由信息的机制,其在刚刚过去的 Facebook 大规模服务中断事件中也扮演了重要的角色。Clou

BGP 是“鸿沟网关协议”的缩写,作为一套答应在互联网上的自治体系(AS)之间交流路由信息的机制,其在刚刚曩昔的 Facebook 大规模服务中止事情中也扮演了重要的人物。Cloudflare 指出,BGP 使得互联网上作业的大型路由器可以具有巨大的、不断更新的或许路由列表,从而将各个款留过数据包送达终究的目的地。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第1张

(图自:Cloudflare)

若缺少 BGP,互联网路由器将不知怎么正确作业。究竟 Internet 的原意,便是在 BGP 绑定之下、一个套着另一个的网络。

以交际媒体巨子 Facebook 为例,BGP 使之可以向构成互联网的其它网络布告本身的存在。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第2张

BGP / SAN 简图

但是在周一的服务大中止事情中,Facebook 却乌龙般地没有宣告本身的存在,终究导致互联网服务提供商(ISP)和其它网络无法与之树立正确的衔接。

TheVerge 修改 Alex Castro 指出,BGP 又被称作互联网上的“邮局体系”或“空中交通管制员”,但他更牛刀小试将之当作一幅世人参与制作和更新的地图,以引导用户正确拜访油管或脸书等网络服务。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第3张

Tom Strickx 与 Celso Martinho 在 Cloudflare 专栏文章中写道:每个独自的网络,都有一个被称作 ASN 的自治体系编号,而自治体系(AS)是具有一致内部路由战略的单个网络。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第4张

AS 可以产生前缀(比如其操控的一组 IP 地址)并传输,以让互联网知晓怎么将信息送达特定的 IP 地址组,而 Cloudflare 的 ASN 编号便是 AS13335 。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第5张

然后每个 ASN 都需求凭借 BGP 向互联网布告其前缀路由,否则将无人知晓该怎么与之获得衔接、以及在哪里找到它们。

在 UTC 和谐世界时的 16:58,Cloudflare 开端留心到 Facebook 已中止发布其 DNS 前缀路由。在最不意图的情况下,这也意味着该公司的域名解析服务(DNS)已不可用。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第6张

因为 Cloudflare 的 1.1.1.1 DNS 解析器无法再呼应问询 facebook.com 或 instagram.com 等网络服务的 IP 地址查询,大规模服务中止也开端变得无法防止。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第7张

与此同时,虽然仍有其它 Facebook IP 地址在被路由,但它们所能起到的作用也适当有限 —— 究竟只需 DNS 服务躺下了,与 Facebook 相关的服务也变得实际上无法拜访了。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第8张

Cloudflare 指出,其会盯梢全球网络中观察到的一切 BGP 更新与公告。但是 UTC 时刻 15:40 左右,Cloudflare 留心到了 Facebook 的路由改变顶峰,费事在这个时分开端会集迸发。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第9张

提到这,本次 Facebook 大规模服务中止的来龙去脉已根本疏离完结。首先是路由被撤回,接着 Facebook 的 DNS 服务器离线。

Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)  facebook dns 路由器 域名 第10张

问题产生一分钟后,Cloudflare 工程师们开端考虑为何 1.1.1.1 无法解析 facebook.com、乃至一度怀疑是自家公司的体系呈现了问题。

转载请说明出处
知优网 » Facebook大规模服务中止事件调查:BGP与DNS服务器离线所造成的(facebook服务器崩溃)

发表评论

您需要后才能发表评论