Amazon volta a ter falha em aplicativos; reclamações sobem em vários países

De acordo com a companhia, os serviços do DynamoDB (banco de dados), SQS (assistente de voz) e Amazon Connect (serviço na nuvem) estão com pane e não há previsão para retorno

Por FolhaPress
Às

Amazon volta a ter falha em aplicativos; reclamações sobem em vários países

Foto: Bruno Peres/Agência Brasil

FERNANDO NARAZAKI 

Os serviços de nuvem da Amazon voltaram a apresentar falha na manhã desta segunda-feira. O anúncio foi feito pela empresa em seu site às 11h14 (horário de Brasília). Três horas antes, a AWS (Amazon Web Services) havia informado que tinha corrigido o problema que afetou mais de 500 sites em vários países, incluindo o Brasil, desde as 3h30 desta segunda.

De acordo com a companhia, os serviços do DynamoDB (banco de dados), SQS (assistente de voz) e Amazon Connect (serviço na nuvem) estão com pane e não há previsão para retorno.

No site Downdetector (site que monitora problemas de funcionamento), as reclamações dos usuários voltaram a subir por volta das 10h20 em vários países como Brasil, EUA, Argentina, Colômbia, Canadá e México.

"Continuamos investigando a causa dos problemas de conectividade de rede que estão afetando os serviços da AWS... Continuamos investigando e identificando soluções", disse a AWS.

A pane que começou na madrugada causou instabilidade em diversos aplicativos e programas em todo o mundo, que impactaram Fortnite, Snapchat e serviços corporativos e da própria Amazon como o PrimeVideo e a Alexa.

A AWS relatou um problema operacional que afetou múltiplos serviços em Virgínia do Norte, nos EUA, um dos seus principais data centers globais. Segundo a companhia, cerca de 500 empresas hospedados na nuvem da Amazon sofreram um apagão, em vários países. No Brasil, sites e apps como Mercado Livre e PicPay tiveram falha

A mesma central de data centers em Virgínia do Norte foi a que causou as novas falhas a partir das 10h20 desta segunda, segundo a AWS. Usuários da Alexa eram informados do problema ao tentar acessar o serviço. "Desculpa, houve um erro", respondia a assistente de voz.

Em nota, o Mercado Livre e o Mercado Pago reconhecem que houve uma instabilidade em seus aplicativos. "Nossos times trabalharam rapidamente para restabelecer o sistema, que já opera normalmente", afirma o comunicado à imprensa.

O PicPay afirma que seus "serviços estão mais lentos que o comum". "Como outras instituições financeiras e de entretenimento, o PicPay foi afetado pela instabilidade global nos serviços da AWS. Os serviços estão mais lentos que o comum. As empresas já estão trabalhando em conjunto para resolver o problema o mais rapidamente possível", diz, em nota oficial.

Os usuários começaram a relatar problemas por volta das 3h30 (horário de Brasília) desta segunda. Às 7h35, a AWS informou que a "maioria das operações de serviços" voltou a funcionar, pediu aos usuários que limpassem o cache e reiniciassem os serviços impactados, mas alertou que falhas "pontuais" ainda estavam ocorrendo.

Às 9h48, a empresa divulgou que havia corrigido outro sistema que caiu, mas que alguns serviços ainda poderiam apresentar lentidão e que a AWS trabalhava para diminuir a fila de solicitações. Parte das empresas afetadas também disseram que os serviços foram restabelecidos. Mas, às 11h14, a AWS relatou a nova falha.

"Confirmamos erros significativos de API (quando os aplicativos não conseguem se conectar com o servidor) e problemas de conectividade em diversos serviços na região leste dos EUA. Estamos investigando e forneceremos mais atualizações", disse a AWS.

A interrupção da AWS é a primeira grande perturbação da internet desde o mau funcionamento da CrowdStrike no ano passado, que paralisou sistemas tecnológicos em hospitais, bancos e aeroportos globalmente.

Entre os serviços impactados da computação em nuvem estavam empresas de diferentes ramos como jogos populares como Fortnite e Roblox, a rede social Snapchat, a corretora de criptomoedas americana Coinbase, o mecanismo de busca de inteligência artificial Perplexity, os serviços de dados do London Stock Exchange Group, o site de venda de ingressos do time inglês de futebol Tottenham e o app de transporte Lyft.

No Downdetector, usuários reclamaram da AWS em vários países pelo mundo e também reportaram problemas nos sites que têm os seus serviços veiculados à companhia.
A Ookla, proprietária do Downdetector, disse que mais de 4 milhões de usuários relataram problemas devido ao incidente.

A AWS é líder global em serviços de computação em nuvem e fornece armazenamento de dados e outros serviços digitais para empresas, governos e indivíduos. Interrupções em seus servidores podem causar falhas em sites e plataformas que dependem de sua infraestrutura em nuvem. A AWS supera os rivais do Google e da Microsoft.

A unidade de nuvem é um importante gerador de lucro para a gigante do comércio eletrônico, que investe dezenas de bilhões de dólares na expansão de data centers para treinar e implementar aplicativos com inteligência artificial.

O QUE OCORREU
Os primeiros relatos de falhas começaram por volta das 3h30 (de Brasília). Às 4h11, a AWS informou que investigava "aumento nas taxas de erro e latências" e que trabalhava para o restabelecimento.

Às 5h26, a companhia relatou que o erro impedia que os usuários abrissem ou atualizassem notificações de falhas junto ao suporte da AWS. Cerca de 30 minutos depois, a companhia relatou que a origem seria o servidor na Vírginia do Norte, nos EUA. Às 6h22, a AWS instruiu os usuários a reiniciar os serviços, que já estavam voltando a funcionar.

Em novo comunicado, divulgado às 7h35, a AWS disse que a "maioria das operações de serviços" voltou a funcionar e pediu os usuários que limpassem o cache e reiniciassem os serviços impactados. Porém, a empresa alertou que "falhas pontuais" ainda poderiam ocorrer, apesar de o problema que gerou o DNS (quando o servidor não responde ao pedido do usuário) ter sido corrigido.

"Serviços da AWS que dependem de SQS Lambda como atualização de políticas corporativas também podem estar apresentando lentidão", afirmou a AWS, em comunicado às 8h48. Cerca de 20 minutos depois, a empresa divulgou que o SQS Lambda fora corrigido e que trabalhava para o restabelecimento de outro sistema que apresentou falha.

Junade Ali, engenheiro de software, especialista cibernético e membro da Instituição de Engenharia e Tecnologia, disse que o problema parecia estar em um dos sistemas de rede que a AWS usa para controlar um produto de banco de dados.

"Como esse problema geralmente pode ser resolvido de forma centralizada... a menos que haja outros problemas identificados, ele deverá ser mitigado nas próximas horas", afirmou Ali.

A partir das 10h20, as reclamações sobre AWS e outros sites impactados pela manhã (como Mercado Livre, Mercado Pago, Alexa e outros) voltaram a ter alta no Downdetector. Às 11h14, a AWS confirmou a nova falha e não informou uma previsão para regularização.

CLIENTES IMPACTADOS
Alguns dos jogos mais populares do mundo como Fortnite, Roblox, Clash Royale e Clash of Clans ficaram fora do ar, assim como as plataformas financeiras Venmo, do Paypal, e Chime.

O CEO da Perplexity, Aravind Srinivas, postou na rede social X (antigo Twitter) e disse que o site trabalhava para resolver a falha. "O Perplexity está fora do ar no momento. A causa raiz é um problema da AWS. Estamos trabalhando para resolvê-lo", disse, durante a madrugada.

Rival da Uber, o aplicativo de transportes Lyft também estava fora do ar para milhares de usuários nos EUA. A presidente do aplicativo de mensagens Signal, Meredith Whittaker, confirmou no X que a plataforma da empresa também foi afetada pela interrupção da AWS.

Na Inglaterra, o Lloyd Bank, o Bank of Scotland, os provedores de serviços de telecomunicações Vodafone e BT, e o site de venda de ingressos do time de futebol Tottenham ficaram fora do ar devido à instabilidade na AWS, assim como foi relatado problemas pela autoridade tributária, de pagamentos e alfandegária britânica HMRC.

Ainda na manhã de segunda, empresas como Coinbase, Perplexity, Fortnite e HMRC afirmaram que os serviços foram retomados.

O problema destaca o quão interconectados os serviços digitais cotidianos se tornaram e o quanto eles dependem agora de um pequeno número de provedores globais de nuvem, com uma falha causando estragos nos negócios e na vida cotidiana, disseram especialistas e acadêmicos.

"O principal motivo para esse problema é que todas essas grandes empresas dependem de apenas um serviço", comentou Nishanth Sastry, Diretor de Pesquisa do Departamento de Ciência da Computação da Universidade de Surrey.

Comentários

Os comentários são de responsabilidade exclusiva de seus autores e não representam a opinião deste site. Se achar algo que viole os termos de uso, denuncie:redacao@fbcomunicacao.com.br
*Os comentários podem levar até 1 minutos para serem exibidos

Faça seu comentário