जब Amazon Web Services (AWS) ने 20 अक्टूबर 2025 को अपना सबसे बड़ा ग्लोबल आउटेज दर्ज किया, तो Adam Selipsky, कंपनी के सीईओ ने तुरंत स्थिति को ‘क्रिटिकल’ कहा। सुबह लगभग 7:50 ए.एम. ईस्टर्न टाइम (US‑East‑1, उत्तरी वर्जीनिया) से शुरू हुआ यह व्यवधान 3 घंटे तक चलता रहा, जबकि DynamoDB के DNS रिज़ॉल्यूशन में गड़बड़ी के कारण सर्वर अनुरोधों में भारी देरी आई। परिणामस्वरूप स्नैपचैट, प्राइम वीडियो, रेडिट, कॉइनबेस जैसे सैकड़ों लोकप्रिय ऐप्स ने काम करना बंद कर दिया।
US‑East‑1, जो उत्तरी वर्जीनिया के वर्जीनिया टेक कॉम्प्लेक्स में स्थित एक प्रमुख डेटा हब है, AWS की सबसे जगी‑भरी रीजन रह चुकी है। इस रीजन को अक्सर ‘इस्ट कोस्ट का दिल’ कहा जाता है क्योंकि यहाँ से अधिकांश अमेरिकी‑ईस्ट कोस्ट यूज़र ट्रैफ़िक रूट किया जाता है। विशेषज्ञों का मानना है कि कई कंपनियों की मल्टी‑रीजन रणनीति के बावजूद, लागत‑प्रभावशीलता और लेटेंसी के चलते US‑East‑1 पर निर्भरता बहुत अधिक है, जिससे एकल बिंदु‑विफलता (single point of failure) का जोखिम बढ़ता है।
डायनामोडीबी API के DNS में त्रुटि के कारण, कई क्लाउड‑बेस्ड सेवाओं में अनुरोध ‘थ्रॉटल्ड’ हो गए। Snapchat ने अपने स्टोरी फ़ीचर को 2 घंटे तक बंद कर दिया, जबकि Prime Video पर स्ट्रीमिंग में लगातार बफ़रिंग और प्ले‑बैक फेल्योर की शिकायतें बढ़ीं। Reddit, Coinbase और Signal ने अपनी आधिकारिक ट्विटर (X) खातों पर समस्याओं की पुष्टि की। यहां तक कि United Airlines की बुकिंग सिस्टम और यूके की कई सरकारी वेबसाइटें भी पहुंच से बाहर हो गईं। Downdetector ने पीक पर लगभग 50,000 रिपोर्ट एकत्र किए, जिनमें 2,000 से अधिक अमेरिकी यूज़र्स ने असफल लॉग‑इन की शिकायत की।
आउटेज के शुरुआती घंटों में, कई कंपनियों ने अपने कस्टमर सपोर्ट टिकेट्स में ‘AWS outage’ को कारण बताया। Reddit ने कहा, “हमारी आर्किटेक्चर ने इस इवेंट को संभालने में बाधा देखी, लेकिन हम मूल कारण को समझने के लिए AWS के साथ मिलकर काम कर रहे हैं।” Coinbase ने एक संक्षिप्त बयान जारी किया: “हम वर्तमान में AWS की DNS समस्या के कारण आंशिक रूप से प्रभावित हैं; सेवा जल्द ही पुनर्स्थापित होगी।” दूसरी तरफ, Slack ने बताया कि उनके कई एंटरप्राइज़ कस्टमर ने “upstream provider” की वजह से लेटेंसी देखी, लेकिन मुख्य फ़ंक्शन्स काम कर रहे थे।
वित्तीय क्षेत्र में, Robinhood और Lyft जैसे राइड‑शेयरिंग ऐप्स के ट्रांसैक्शन प्रोसेसिंग में देरी के कारण ट्रेडिंग थ्रॉटलिंग और बुकिंग कन्फ़र्मेशन में बाधा आई। मार्केट एनालिस्टों के मुताबिक, केवल भारत में ही इस आउटेज से संभावित तौर पर $1.2 बिलियन का एंटरप्राइज़-स्तर पर नुकसान हुआ। सोशल मीडिया पर उपयोगकर्ताओं ने “AWS का डॉग एरर पेज” देख कर हँसी-मजाक किया, लेकिन कई लोग एपीआई कॉल फेल्यर के कारण अपने काम में बिलकुल अटका रहे।
इंसाइडर्स का कहना है कि कंपनियों को अब ‘멀्टि‑रीजन रे‑डंडेंट’ आर्किटेक्चर अपनाने की सख़्त जरूरत है। एक क्लाउड रणनीति सलाहकार ने बताया, “भविष्य में, जॉब‑क्रिटिकल ऐप्स को कम से कम दो अलग‑अलग रीजन में डिप्लॉय करना चाहिए, और DNS फ़ेल्यर को कम करने के लिए एज़‑रूटिंग जैसी तकनीकों को इंटीग्रेट करना चाहिए।” AWS ने भी इस बात को दोहराते हुए कहा कि वे ‘रेट्रॉस्पेक्टिव पोस्ट‑मॉर्टेम’ जारी करेंगे और “सिंगल पॉइंट फ़ेल्यर को कम करने के लिए अधिक रेज़िलिएंट नेटवर्ग रूटिंग” पर काम करेंगे।
सारांश में, 20 अक्टूबर को US‑East‑1 में DNS गड़बड़ी ने दुनियाभर में 30‑से‑अधिक प्रमुख सेवाओं को प्रभावित किया। AWS आउटेज 2025Northern Virginia, USA का मुख्य कारण DynamoDB API के DNS रिज़ॉल्यूशन में त्रुटि माना गया, जबकि साइबर‑आक्रमण की कोई संकेत नहीं मिला। इस घटना ने क्लाउड‑डिपेंडेंसी की नाज़ुकता को फिर से उजागर किया और रेज़िलिएंस और मल्टी‑रीजन स्ट्रैटेजी की आवश्यकता पर जोर दिया।
हाँ, मूल गड़बड़ी उत्तरी वर्जीनिया के US‑East‑1 डेटा सेंटर में हुई DNS समस्या के कारण थी, लेकिन इस रीजन पर निर्भर कई ग्लोबल सेवाएँ भी प्रभावित हुईं।
दोनों को असर पड़ा, पर वित्तीय और ई‑कॉमर्स प्लेटफ़ॉर्म ने तुरंत लेन‑देन में बाधा देखी, जबकि आम उपयोगकर्ताओं ने स्ट्रीमिंग और सोशल ऐप्स में लोडिंग समस्याएँ नोटिस कीं।
AWS ने कहा कि DNS रिज़ॉल्यूशन त्रुटि पूरी तरह से ठीक हो गई है, लेकिन बैकट्रैक प्रोसेसिंग के कारण कुछ सेवाओं में देर‑से‑देर अनुरोधों की थ्रॉटलिंग अभी भी चल रही है।
विशेषज्ञ सलाह देते हैं कि मल्टी‑रीजन डिप्लॉयमेंट, एज़‑रूटिंग, और DNS फ़ेलओवर मैकेनिज़्म को मजबूत किया जाए, जिससे एक रीजन में गड़बड़ी पूरे इकोसिस्टम को न थोपे।
अभी तक कोई आधिकारिक मुकदमा या नियामक जांच की घोषणा नहीं हुई है, लेकिन कई यूज़र और बिज़नेस पार्टनर संभावित कॉम्पेन्सेशन क्लेम की तैयारी कर रहे हैं।
© 2025. सर्वाधिकार सुरक्षित|
BALAJI G
AWS की इस बार की विफलता दर्शाती है कि कंपनियों ने बहु‑रीजन डिज़ाइन को नज़रअंदाज़ किया है। एक ही रीजन पर इतना निर्भर रहना नैतिक लापरवाही नहीं है। इस तरह के आउटेज छोटे स्टार्ट‑अप्स को भी गंभीर वित्तीय नुकसान पहुँचा सकते हैं।
एक बार फिर दिख गया कि क्लाउड जुगाड़ केवल लागत बचत का बहाना नहीं होना चाहिए।
Manoj Sekhani
भाई ज़्यादा टेंशन मत ले, ए़डब्ल्यूएस भी इंसान है, कभी‑कभी गड़बड़ हो ही जाती है। पर लाइफ में बैकअप प्लान तो होना चाहिए न।