Rápidamente dice que un solo cliente desencadenó un error detrás de la interrupción masiva de Internet

Un apagón de Internet que noqueado algunos de los sitios web más grandes del mundo el martes se debieron en última instancia a que un solo cliente actualizó su configuración, el proveedor de infraestructura Fastly ha revelado.

Un error en el código de Fastly introducido a mediados de mayo permaneció inactivo hasta el martes por la mañana., según Nick Rockwell, el jefe de ingeniería e infraestructura de la empresa. Cuando el cliente sin nombre actualizó su configuración, desencadenó la falla, que finalmente derribó 85% de la red de la empresa.

"En mayo 12, comenzamos una implementación de software que introdujo un error que podría ser provocado por una configuración específica del cliente en circunstancias específicas,"Rockwell dijo. "Principios de junio 8, un cliente impulsó un cambio de configuración válido que incluía las circunstancias específicas que desencadenaron el error, que causó 85% de nuestra red para devolver errores.

"Detectamos la interrupción en un minuto, luego identificó y aisló la causa, y deshabilitó la configuración. Dentro 49 minutos, 95% de nuestra red funcionaba con normalidad ".

Rockwell agregado: "Aunque hubo condiciones específicas que desencadenaron esta interrupción, deberíamos haberlo anticipado. Brindamos servicios de misión crítica, y tratamos cualquier acción que pueda causar problemas de servicio con la máxima sensibilidad y prioridad.. Pedimos disculpas a nuestros clientes y a quienes dependen de ellos por la interrupción y agradecemos sinceramente a la comunidad por su apoyo ".

La red de distribución de contenido (CDN) operado por Fastly es uno de los más grandes en Internet, junto con redes similares operadas por Akamai, Cloudflare y CloudFront de Amazon. Todos operan con el mismo principio: que Internet es más rápido y más estable si los usuarios pueden conectarse a servidores físicamente cercanos a ellos, optimizado para manejar mucho tráfico.

En tiempos tipicos, al hacerlo, no solo se reducen los tiempos de carga, sino que también se permite a los operadores de CDN, con experiencia en el funcionamiento de la infraestructura de Internet, asumir la carga de manejar las amenazas a la seguridad, picos de tráfico inesperados, y facturas de alto ancho de banda. Pero la interrupción destacó los riesgos asociados con una concentración de infraestructura crítica de Internet en manos de unas pocas empresas.

Contraintuitivamente, la interrupción y la recuperación llevaron a un aumento en el precio de las acciones de Fastly, que estaba arriba 12% en el transcurso del martes. El aumento puede deberse a que la empresa había demostrado un plan de respuesta a incidentes eficaz, o simplemente porque la interrupción había servido para que los inversores fueran más conscientes de la escala del negocio de Fastly y el tamaño de su base de clientes.

Los efectos no habrán sido tan optimistas para los clientes de Fastly. Solo en Amazon, por ejemplo, la interrupción podría haber perdido a la empresa 32 millones de dólares en ventas, según un cálculo de la agencia SEO Reboot.

"Aunque parece que no estuvieron abajo por mucho tiempo, el impacto que habría tenido será enorme, especialmente en sitios de comercio electrónico,"Dijo Naomi Aharony, el director gerente de la agencia. “Con nuestra investigación, estimamos que Amazon podría haber perdido $6,803 cada segundo estaba abajo, está claro que se querrá hacer una investigación para averiguar qué sucedió ".

Pocos clientes de Fastly pudieron cambiar a un sistema de respaldo a tiempo para recuperarse de la interrupción, en parte porque hacerlo generalmente se considera de mayor riesgo que simplemente esperar a que el proveedor solucione los problemas. Por ejemplo, según documentos públicos, gov.uk tiene un contrato de respaldo con Amazon para proporcionar servicios CDN, pero requiere una intervención manual para realizar el cambio.

los comentarios están cerrados.