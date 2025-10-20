Desastre digital: la gran caída de Amazon Web Services en Virginia afecta a miles de empresas de Internet

Hoy tenemos otro desastre digital: la gran caída de Amazon Web Services en Virginia afecta a miles de empresas de Internet que operan con los servicios cloud de Amzon.

Esta mañana del lunes 20 de octubre de 2025, una importante interrupción de servicio en la región de US‑East‑1 (Virginia – EEUU) de Amazon Web Services (AWS) paralizó buena parte del funcionamiento digital a escala global.

El fallo se detectó aproximadamente a primera hora de la mañana (hora de EE.UU.) y se extendió por varias horas antes de que la situación comenzara a normalizarse.

Esto no ha sido una novedad el 22 diciembre del 2021 hubo una gran interrupción en la región US-EAST-1 de AWS afectó a numerosos servicios y sitios web coincidiendo con la Lotería de Navidad uno de los días de mayor tráfico en internet en España, aunque no fue un incendio aunque es lo que se dijeron inicialmente a los medios. Este fallo causó problemas de conectividad a servicios como Hulu, Asana, Epic, y la propia tienda online de Amazon. Se debió a un evento automático que escaló los servidores de la red principal, provocando congestión interna y afectando al sistema DNS. Pero luego hubo servidores que sus discos duros dejarón de funcionar por apagón fortuito, por lo que no llegamos a saber que era de cierto. Incluyeron plataformas de streaming, aplicaciones de productividad, juegos y hasta servicios internos de empresas. La recuperación completa tardó cerca de ocho horas en resolverse.

¿Qué ha ocurrido con AWS hoy?

Según los comunicados de AWS y los primeros análisis independientes, el incidente comenzó con un aumento inusual de tasas de error y latencias en múltiples servicios dentro de la región US-East-1, ligada especialmente al servicio de bases de datos gestionadas DynamoDB. La empresa indicó que estaba investigando “error rates and latencies for multiple AWS services in the US East-coast region”.

Por su parte, especialistas en infraestructura comprobaron que el epicentro del problema estaba realmente en Northern Virginia, donde AWS concentra una parte muy significativa de su capacidad mundial.

Se están viendo numerosos reportes de usuarios sobre los errores en la conectividad y entre los servicios afectados se encuentran: Bizum, Amazon, Alexa, PrimeVideo, Perplexity, Canva, Duolingo, Zoom, Tinder o Strava. También en redes sociales como Snapchat y videojuegos como Fortnite, Clash Royale o Roblox entre las miles de empresas afectadas.

¿Cuánto duró y cómo se recuperó?

A las 05:27 h (ET) AWS informó que comenzaba a observar “significant signs of recovery”.

A las 06:03 h (ET) la empresa comunicó que “recovery across most of the affected AWS Services” había sido lograda.

Más adelante, AWS afirmó que los “global services and features that rely on US-EAST-1 have also recovered”.

Aunque la mayor parte de los servicios volvieron a estar operativos, algunos clientes siguieron reportando ciertos retrasos o anomalías (como peticiones lentas o errores puntuales) mientras la infraestructura terminaba de estabilizarse.

¿Quiénes se vieron afectados?

La interrupción afectó una amplia gama de actores, tanto del ámbito tecnológico como financiero, de comunicaciones, público y privado. Entre los principales casos identificados:

Aplicaciones populares: Bizum,Snapchat, Signal, Duolingo, la plataforma de inteligencia artificial Perplexity AI, entre otras.

Servicios de juegos: Fortnite, Roblox, Clash Royale, etc.

Plataformas financieras y de pago: Coinbase, Robinhood, Venmo.

Instituciones del Reino Unido: HM Revenue & Customs (HMRC), Lloyds Bank, Bank of Scotland.

Dentro de Amazon: Servicios propios como Alexa, Prime Video y Ring también registraron incidencias.

Snapchat: La popular plataforma de mensajería y multimedia sufrió interrupciones atribuibles al fallo en AWS.

Fortnite: El conocido videojuego online también registró problemas durante la caída de la nube de AWS.

Coinbase: La plataforma de intercambio de criptomonedas figura entre los servicios financieros impactados.

Lloyds Banking Group (Reino Unido): Incluyendo marcas como Lloyds, Bank of Scotland, con problemas en accesos online.

HM Revenue & Customs (HMRC, Reino Unido): El organismo fiscal británico confirmó interrupciones en su servicio web a causa del problema en AWS.

Epic Games & su plataforma de juego (Epic Games Store): Registraron incidencias en el entorno de juego online.

Signal: La aplicación de mensajería segura también fue listada entre los servicios que tuvieron fallos.

Slack: Herramienta de colaboración en equipo que experimentó problemas durante la interrupción.

Duolingo: App de aprendizaje de idiomas que también vio su funcionamiento interrumpido.

Amazon.com Inc. / sus servicios internos: Algunos servicios propios de Amazon (por ejemplo relacionados con AWS, Alexa, etc.) resultaron afectados.

En resumen, los efectos se sintieron en múltiples sectores, lo que demuestra la elevada interdependencia de servicios externos con la infraestructura de AWS ya que Internet esta muy conectado a través de APIS..

¿Por qué una región de Virginia?

La región US-East-1 de AWS, situada en Northern Virginia, es desde hace años una de las piezas centrales de la red global de Amazon. Está situada en lo que se conoce como el “Data Center Alley” del norte de Virginia (zona de Ashburn, Loudoun County, etc.).

Según uno de los informes, AWS ha invertido más de 35 000 millones de dólares en la última década para construir infraestructura de centros de datos en Northern Virginia. El estudio destaca que esta zona alberga “the single largest concentration of corporate data-center infrastructure on earth”.

Además, se estima que más del 70% del tráfico de internet de EE.UU. pasa por esa región de Virginia. Esto convierte a US-East-1 en un nodo crítico para múltiples servicios globales.

¿Qué significado tiene para AWS y para el mercado cloud?

Tamaño y magnitud de AWS

La cuota de mercado de AWS a nivel global ronda el 30% del total de infraestructura de nube en 2025.

En su trimestre más reciente, AWS obtuvo unos ingresos de 30.9 mil millones de dólares , lo que le da una run-rate anual de más de 123 mil millones de dólares .

En inversión de capital, AWS (y Amazon en su conjunto) destina cantidades colosales: “capex … for the year set to exceed $118 billion”.

El CPD de Aamnzon en Virginia son tres edificios con un superficie cercana a las 200.00 sqrft.

No hay una única cifra que describa el «tamaño» total del centro de datos, pero se estima que solo en 2014, los centros de datos de Amazon en Virginia albergaban entre 50.000 y 80.000 servidores. Alberga el 10% del tráfico de Internet mundial.

Amazon cuenta con más de 175 centros de datos en todo el mundo

Estos datos evidencian que AWS es no solo un proveedor técnico, sino un pilar de la infraestructura digital mundial.

Por qué la caída genera alarma

Que esta región concreta tenga un fallo tan amplio significa varias cosas:

Concentración de riesgo: A pesar de que la nube se basa en redundancias y múltiples zonas de disponibilidad, regiones extremadamente densas como US-East-1 pueden actuar como “single point of pain” cuando hay una falla mayor. Repercusión global: Si una única región de un proveedor grande sufre, los efectos se propagan rápidamente. Como se ha visto hoy, el impacto abarcó desde apps de ocio hasta servicios de estado y finanzas. Efecto dominó entre empresas: Muchas compañías externalizan gran parte de su TI (almacenamiento, computación, bases de datos) a AWS. Una interrupción de la plataforma afecta múltiples clientes a la vez, amplificando el impacto. Visibilidad de la dependencia digital: Este episodio pone de manifiesto lo dependientes que somos del “cloud” y de unos pocos grandes proveedores. También abre el debate sobre la necesidad de estrategias de resiliencia, multi-nube o contingencia.

Impactos estimados y lectura estratégica

Aunque AWS aún no ha publicado una factura oficial del coste para los clientes, podemos inferir varias lecciones:

Las empresas afectadas tendrán pérdidas: desde ventas perdidas, hasta interrupciones de operaciones internas o de atención al cliente.

Para muchas start-ups y operadores medianos, la caída puede haber supuesto daño reputacional y, en algunos casos, pérdida de confianza de sus clientes.

Los departamentos de TI ya están revisando sus arquitecturas para preguntarse: ¿Qué pasa si la región principal falla? ¿Estamos preparados para saltar a otra zona? ¿Tenemos backups y redundancias reales?

Los reguladores y responsables públicos también lo toman nota: cuando un servicio crítico (como HMRC en el Reino Unido) se ve afectado, se reabre el debate de la gobernanza, seguridad y soberanía de datos.

Para AWS, este tipo de fallos aunque no frecuentes son peligrosos: más que el número de fallos, lo que importa es la magnitud, visibilidad y recordatorio de que incluso “la nube” no es infalible.

Cronología de los hechos (vista resumida)

Hora aprox. (ET) Evento ~ 03:00 a 04:00 Inicio estimado de los problemas en la región US-East-1. 05:27 AWS indica “significant signs of recovery”. 06:03 AWS dice que “most requests” ya estaban funcionando. Más tarde por la mañana Declaración de recuperación global de servicios que dependían de US-East-1.

¿Qué pueden aprender las empresas?

Evaluar seriamente la dependencia crítica que tienen de un proveedor o una región específica.

Implementar arquitecturas de recuperación ante desastre (“disaster recovery”) que incluyan regiones alternativas o incluso proveedores alternativos.

Probar y revisar periódicamente los planes de continuidad: ¿qué sucede si una zona falla? ¿Cuánto tardamos en cambiar? ¿Qué servicios se detienen?

Invertir en monitorización y alertas no sólo del proveedor, sino del propio negocio: ¿cómo sabemos que estamos “sobrenivelados” y que tenemos un fallo que afecta al cliente final?

Cuestionar la empresa: si tu infraestructura está 100% en una región de AWS, ¿por qué? ¿Cuál es el coste/complejidad de diversificar?

El gran fallo de AWS en la región de Virginia esta mañana nos recuerda que incluso los gigantes del cloud pueden fallar y que cuando lo hacen, el impacto es global e inmediato. La dependencia masiva de la nube, la concentración de infraestructura en ciertas zonas geográficas y la interconexión de servicios hacen que un problema técnico aparentemente localizado pueda propagarse y derribar ecosistemas digitales enteros. Para las empresas, el mensaje es claro: la nube no es garantía de invulnerabilidad y es indispensable preparar planes de resiliencia reales.

Para AWS, esta interrupción es un aviso sobre el precio que puede tener cuando una región clave presenta fallos. Aunque los servicios se restablecieron rápidamente, la confianza no se repara tan fácilmente como un servidor reiniciado. En la era del cloud, la fiabilidad lo es todo.