Wprowadzenie – co właściwie padło?
18 listopada 2025 r. Internet globalnie „zadrżał”.
Obserwowano masowe problemy z dostępem do stron i aplikacji, w tym:
- ChatGPT
- X (Twitter)
- Canva
- platformy bankowe (zależne od CDN/DNS Cloudflare)
- usługi SaaS
- wiele sklepów internetowych
- serwisy korzystające z Cloudflare DNS
W Polsce internauci zgłaszali problemy praktycznie wszędzie — strony ładowały się w nieskończoność, pojawiały się błędy 522 / 503 / 504, a część aplikacji przestawała odpowiadać całkowicie.
Przyczyną była globalna awaria Cloudflare, największego dostawcy CDN, DNS i edge security na świecie, obsługującego ok. 20% całego globalnego ruchu internetowego.
Co się stało? – ustalone fakty
Według doniesień mediów i komunikatów Cloudflare:
- około 11:20 UTC nastąpił nagły, nietypowy skok ruchu („spike in unusual traffic”),
- obciążyło to mechanizmy routingowe jednej z warstw Cloudflare,
- spowodowało to degradację usług pośredniczących, w tym proxy, CDN i DNS,
- efektem były globalne błędy i problemy z ładowaniem stron.
Źródła wskazują, że problem nie był typowym DDoS-em, ale wyglądał na kombinację błędu konfiguracyjnego i przeciążenia sieciowego.
Cloudflare potwierdziło, że przyczyna była „network-level”, co sugeruje m.in.:
- problem w systemie anycast (rozgłaszanie tej samej usługi z wielu centrów danych),
- błędne propagowanie tras BGP,
- błąd w jednej z usług obsługujących wewnętrzną komunikację Cloudflare,
- przeciążenie punktów wymiany ruchu.
Dlaczego posypała się tak duża część Internetu?
Cloudflare to nie tylko CDN.
Ich infrastruktura obejmuje:
- DNS (często traktowany jako podstawowy DNS firm)
- WAF i firewall
- proxy reverse
- optymalizację ruchu i cache
- load balancing
- zarządzanie certyfikatami TLS
- routing edge → origin
Jeśli AWS padnie — padną serwisy hostowane w AWS.
Jeśli Cloudflare padnie — padnie cały Internet docierający do serwisów chronionych przez Cloudflare.
To klasyczny punkt krytyczny infrastruktury globalnej.
Skutki awarii
Dla użytkowników
- brak dostępu do popularnych serwisów,
- zacinanie się aplikacji mobilnych,
- błędy logowania i ładowania zasobów,
- przestoje w płatnościach i usługach.
Dla firm
- brak dostępności stron i sklepów,
- utrata transakcji oraz klientów,
- spadek reputacji,
- część procesów backendowych również przestała działać (API, webhooki).
Dla administratorów
- masowe alerty monitoringowe,
- brak możliwości przełączenia ruchu, jeśli infrastruktura była ściśle zależna od Cloudflare,
- błędy edge-networku pomimo działającego originu.
Jak Cloudflare zareagowało?
Cloudflare w ciągu kilkunastu minut:
- potwierdziło incydent na status.cloudflare.com,
- zaczęło łagodzić przeciążenia w swoich węzłach,
- oświadczyło, że problem dotyczy „sekcji jednej z usług sieciowych”,
- ostrzegło, że mogą występować „zwiększone błędy”.
Awaria trwała stosunkowo krótko, ale jej skutki były odczuwalne godzinami.
Dlaczego takie awarie będą się powtarzać?
Bo Internet jest dziś mocno scentralizowany.
Proste fakty:
- 1 firma obsługuje 20% ruchu
- 1 firma (Google) obsługuje połowę DNS na świecie
- Amazon AWS i Microsoft Azure obsługują setki tysięcy aplikacji
- Facebook/Meta trzyma największe platformy społecznościowe
- Routery BGP na świecie nie mają mechanizmów bezpieczeństwa z XXI wieku
Zwykły błąd lub przeciążenie jednego z elementów powoduje globalny efekt domina.
Jak się chronić przed skutkami takich awarii?
Dla firm i właścicieli stron:
- Nie opieraj się tylko na jednym dostawcy → np. redundantny DNS (Cloudflare + inny).
- Posiadaj origin dostępny bezpośrednio (bez przymusu przechodzenia przez proxy).
- Monitoruj stan dostawców – status pages i alerty.
- Korzystaj z fallback CDN, jeśli to możliwe.
- Miej plan komunikacji z klientami na czas awarii.
Dla klientów końcowych:
- Bądź świadomy, że problemy „w Twoim banku/sklepie” mogą wynikać z awarii globalnych.
- Nie podejmuj nerwowych działań, jeśli awaria dotyczy logowania lub przelewów — to nie musi być atak.
Garść ciekawostek
- Cloudflare obsługuje ponad 300 centrów danych na świecie — awaria jednej warstwy mogła dotknąć wszystkie.
- Poprzednie duże awarie Cloudflare wynikały z:
- błędnej aktualizacji WAF,
- błędnych reguł BGP,
- problemów z edge routingiem.
- W 2021 Cloudflare przyznał, że 5–10 minut błędnej konfiguracji wystarczyło do globalnego outage.
- Awarie Cloudflare częściej obnażają problemy architektury Internetu niż samej firmy.
Podsumowanie
Dzisiejszy incydent pokazuje jedną ważną rzecz:
Internet nie jest tak zdecentralizowany, jak nam się wydaje.
Jeśli jeden z największych graczy infrastrukturalnych ma problem — dotyka to:
- małe firmy
- ogromne korporacje
- aplikacje mobilne
- komunikatory
- sklepy
- platformy płatnicze
Dla właścicieli biznesów to jasny sygnał, by budować architekturę odporną na awarie dostawców, a nie tylko szybką i tanią.
