Era el final de la semana laboral nuevamente; ¿qué puede salir mal? Por supuesto, Outlook había fallado unas horas antes en la semana y Twitter perdió el control de algún gran nombre cuentas, pero nada más puede salir mal? ¿Girar a la derecha? Incorrecto. Las cosas malas vienen de tres en tres. A partir del viernes por la tarde, Flama de nube, la red principal de entrega de contenido (CDN) y el servicio del Sistema de nombres de dominio (DNS), sufrieron interrupciones importantes de DNS y decenas de millones de usuarios descubrieron que sus servicios de Internet fallaron.

Ups

Hubo preocupación en el momento en que Internet en sí estaba bajo ataque. El verdadero problema era mucho más mundano. El soporte técnico de Cloudflare informó:

“Esta tarde vimos un mal funcionamiento en algunas partes de nuestra red. Este no fue el resultado de un ataque. Parece que un enrutador en nuestra red troncal global anunció rutas incorrectas y provocó que algunas partes de la red no estuvieran disponibles. Ahora hemos abordado la causa y los sistemas de vigilancia para la estabilidad. »

Como, dije, oops.

Hay un viejo dicho en los círculos de administración de red que dice que cuando algo sale mal en la red, «siempre es DNS». En este caso, eso es exactamente correcto. Fue DNS.

Específicamente, los sitios que usan el alojamiento DNS de Cloudflare y cualquiera que use el servicio de resolución DNS 1.1.1.1 gratuito de Cloudflare fueron retirados de Internet durante aproximadamente media hora. El CTO de Cloudflare, John Graham-Cumming, explicó en una publicación de blog:

La interrupción se produjo porque nuestro equipo de ingeniería de redes, mientras trabajaba en un problema no relacionado con un segmento desde la columna vertebral de Newark a Chicago, actualizó la configuración de un enrutador en Atlanta para reducir la congestión. Esta configuración contenía un error que hizo que todo el tráfico se enviara a Atlanta a través de nuestra columna vertebral. Esto superó rápidamente el enrutador de Atlanta y provocó el fallo de las ubicaciones de red Cloudflare conectadas a la red troncal.

El error consistió en una sola línea de código de configuración, pero eso fue más que suficiente. En lugar de eliminar las rutas de Atlanta desde la columna vertebral, un pequeño cambio comenzó a filtrar todo Protocolo de puerta de enlace fronterizo (BGP) rutas a la columna vertebral. BGP es el protocolo de puerta de enlace externo estandarizado que se usa para intercambiar enrutamiento y alcanzar información entre el nivel más alto de Internet sistemas autónomos (AS). Los usuarios promedio nunca tienen que lidiar con esto.

Sin embargo, los mortales comunes siempre trabajamos con DNS, incluso si no somos conscientes de ello. DNS es el libro de auriculares de Internet. Cada vez que escribe o hace clic en un enlace web legible para humanos (como zdnet.com), su navegador web llama a un solucionador DNS para resolver la dirección de Protocolo de Internet (IP) correspondiente.

Sin embargo, DNS no es solo para navegadores. Cuando se ejecuta en Internet (holgura, correo electrónico, lo que sea), DNS funciona detrás de escena para garantizar que todas las solicitudes de solicitud se conecten a las fuentes de Internet adecuadas. Ya sea un sitio web, un enlace de correo electrónico o un sitio FTP, tiene una dirección IPv4 o el equivalente de la dirección IPv6, y el 13 servidores raíz maestros DNS síguelos a todos. Estos servidores DNS autorizados contienen las direcciones de cada dispositivo conectado a Internet en el mundo. El DNS es esencial. Sin ella, no hay internet. Período de tiempo.

Y si el DNS falla, especialmente a un nivel alto, el resultado, como vimos la semana pasada, es una interrupción casi completa del trabajo. Afortunadamente, tales errores son raros.

Historias relacionadas:



Source link