Ontem (4), o mundo inteiro ficou sem usar o Facebook, o WhatsApp e o Instagram devido a uma queda nos servidores do Facebook.
Oficialmente, segundo o Facebook, a queda global foi causada por uma mudança nas configurações de rede da empresa, acrescentando não ter encontrado evidências que apontam a riscos nos dados dos usuários durante a queda.
Leia também: Mark Zuckerberg perde quase US$ 7 bi com apagão do Facebook, WhatsApp e Instagram
Os engenheiros do Facebook descobriram que as alterações na configuração dos roteadores, que coordenam o tráfego de rede entre os data centers da empresa, foram o cerne do problema.
“Esse rompimento no tráfego da rede gerou um efeito cascata na forma como nossos data centers se comunicam, causando, portanto, uma queda nos nossos serviços”, afirmou o Facebook, ontem à noite, em um post no blog oficial da empresa.
O problema ocorreu nos servidores principais do Facebook, mas, o efeito cascata, como disse a própria empresa, acarretou as quedas do WhatsApp, do Messenger e do Instagram.
No entanto, o Facebook não explica de forma elaborada como se deu a queda, afirmando apenas ter afetado, também, “alguns dos sistemas e ferramentas internas utilizados nas operações diárias”. O que, ainda segundo o Facebook, impediu que o problema fosse resolvido rapidamente.
Por outro lado, especialistas e a imprensa norte-americana já lançaram materiais detalhando as possíveis causas do problema.
DNS do Facebook causa queda em WhatsApp e Instagram
Como dito acima, o Facebook cita a causa do problema como apenas “uma mudança nas configurações de rede da empresa”.
Contudo, de acordo com o jornal Bloomberg, a queda do Facebook, WhatsApp e Instagram, ocorreu, provavelmente, por um problema relacionado ao Sistema de Nome de Domínios da empresa, o DNS.
O DNS é a ferramenta que converte um domínio web, como facebook.com, em um endereço de protocolo de internet, ou IP.
Quando ocorre um erro de DNS, navegadores ou aplicativos não conseguem mais navegar pelos serviços (outros apps) do Facebook.
Portanto, além das principais plataformas do Facebook ficarem fora do ar, as ferramentas internas da empresa, incluindo o sistema de email próprio, também caíram.
Com isso, funcionários do Facebook não puderam entrar na sede da empresa, na Califórnia, pois era preciso de um login do Facebook, que estava fora do ar. Talvez seja isso que impediu resolver o problema de uma maneira mais rápida.
BGP
As origens do problema do Facebook aparentam estar no BGP, ou Border Gateway Protocol. O BGP é um protocolo desenvolvido para o intercâmbio de roteamento e acessibilidade de informação (RI) entre sistemas autônomos na Internet.
Além disso, o BGP é um protocolo que toma decisões com base em caminhos e configurações de rede feitas por um administrador.
Com isso, o BGP determina qual é melhor dentre os caminhos disponíveis para a transferência de dados.
Segundo um tweet de John Graham-Cumming, CTO do Cloudflare, registros públicos mostram que um grande número de mudanças foram feitas nos routes. Routes são comando utilizado para visualizar e manipular a tabela de roteamento do BGP do Facebook.
https://twitter.com/jgrahamc/status/1445134781570764800
O Facebook não comentou sobre essas mudanças e nem o motivo por trás delas.
Em contrapartida, o CEO da Cloudfare, Matthew Prince, afirmou, também no Twitter, que os registros públicos mostraram que esses routes estavam sendo reeditados.
Segundo Prince, possivelmente, isso indica que o serviço está em um caminho para ser restaurado.