🛑 وقتی برق می‌رود، داده‌ها کجا می‌روند؟ | روایت فاجعه‌ی ۸۵۸ ترابایت داده گمشده

فروپاشی سرور و از دست رفتن ۸۵۸ ترابایت داده در یک فاجعه بزرگ فنی
وقتی برق می‌رود، داده‌ها کجا می‌روند؟ | فاجعه ۸۵۸ ترابایت داده گمشده

🛑روایت فاجعه‌ی ۸۵۸ ترابایت داده گمشده

«فقط یک لحظه قطع برق، می‌تواند یک عمر داده را نابود کند.» این جمله شعار شرکت‌های پشتیبان‌گیری نیست؛ واقعیتی است که در سپتامبر ۲۰۲۵ در کره جنوبی، ۸۵۸ ترابایت داده‌ی دولتی را برای همیشه به خاکستر تبدیل کرد.

اگر تا امروز فکر می‌کردید که «قطع برق فقط باعث خاموشی کامپیوتر می‌شود»، سخت در اشتباهید. مشکل اصلی نه خاموش شدن، بلکه نحوه‌ی خاموش شدن و رفتار داده‌ها در آن لحظات بحرانی است. در این مقاله جامع، قدم به قدم در دل یک دیتاسنتر پیش می‌رویم، لحظه قطع برق را شبیه‌سازی می‌کنیم، و نشان می‌دهیم داده‌ها کجا آسیب می‌بینند یا فاسد می‌شوند.

⚡ ۱. قطع برق در دیتاسنتر: یک ثانیه تا فاجعه

هزاران سرور مشغول پردازش درخواست‌های کاربران هستند. ناگهان چراغ‌ها یک بار چشمک می‌زنند. در همان یک صدم ثانیه: حافظه‌های RAM بدون برق محو می‌شوند، هد هارد دیسک‌ها قفل می‌کنند و داده‌های داخل کش کنترلر ناپدید می‌شوند. بدترین وضعیت زمانی است که یک عملیات نوشتن نیمه‌تمام (partial write) روی دیسک باقی بماند — همان لحظه‌ای که «فساد داده» متولد می‌شود.

🗂️ نقشه مسیر داده: جایی که داده‌ها زندگی می‌کنند

لایه ذخیره‌سازیوابستگی به برقخطر قطع برقنتیجه برای داده
Cache CPU (L1/L2/L3)🔴 کاملبسیار بالاناپدید شدن فوری
RAM (حافظه اصلی)🔴 کاملبسیار بالااز دست رفتن تمام داده در حال پردازش
کش کنترلر RAID/NVMe🟠 بسیار بالابالااز دست رفتن داده تأییدنشده
SSD (فلش)🟡 متوسط (خازن)متوسطنقص بیت و فساد داده
هارد دیسک HDD🟡 متوسطمتوسطBad Sector و پارگی فایل
بکاپ روی نوار/هارد جدا🟢 کمکمایمن (اگر در حین نوشتن نباشد)

💣 ۲. فساد داده (Data Corruption): وقتی فایل‌ها «ناقص» به دنیا می‌آیند

فرض کنید دیتابیس بانکی در حال به‌روزرسانی موجودی یک حساب است. عملیات شامل ۴ مرحله: خواندن مقدار قدیمی، تغییر در RAM، نوشتن لاگ و در نهایت نوشتن روی فایل اصلی. اگر برق دقیقاً بین مرحله ۳ و ۴ قطع شود، Log فایل می‌گوید «آماده نوشتن هستم» اما Data File چیزی ثبت نکرده است. نتیجه: ناهماهنگی (Inconsistency) و فساد منطقی. سیستم نمی‌داند کدام منبع را باور کند.

نوع فساد دادهتوضیح فنیمثال کاربردی
تکه تکه شدن بحرانینقاط اتصال فایل خراب می‌شودفایل Word باز می‌شود ولی نیمی از صفحات خالی است
Bit Rot (پوسیدگی بیت)تغییر 0 به 1 یا برعکس در اثر قطع ناگهانی نوشتنمبلغ ۱,۰۰۰,۰۰۰ تومان می‌شود ۱,۰۰۰,۰۰۰,۰۰۰ تومان
Corrupted Metadataنام فایل، اندازه یا مسیر خراب می‌شودفایل وجود دارد اما سیستم خطای «پیدا نشد» می‌دهد
Stale Data Pageبرخی صفحات دیتابیس قدیمی باقی می‌مانندمانده حساب مربوط به سه ماه پیش نمایش داده می‌شود

📊 ۳. جدول مقایسه: وضعیت داده در سناریوهای مختلف قطع برق

سناریومدت قطعیUPS فعال؟وضعیت RAMوضعیت Cacheنتیجه نهایی داده
زیر ۱۰ میلی‌ثانیهخیلی کوتاهبله✔ سالم✔ سالمبدون مشکل
۱۰ میلی‌ثانیه تا ۱ ثانیهکوتاهبله✔ سالم⚠ احتمال ریستبی‌خطر (اغلب)
۱ تا ۱۵ ثانیهمتوسطدر حال تعویض🟡 برخی پاک شد❌ پاک کاملریسک فساد متوسط
۱۵ ثانیه تا ۵ دقیقهطولانی (باتری UPS)در حال اتمام❌ خالی❌ خالیریسک فساد بالا
بیشتر از ۵ دقیقه (بدون ژنراتور)خیلی طولانیخاموش❌ خالی❌ خالیاز دست رفتن / فساد شدید
بیشتر از ۵ دقیقه (با ژنراتور سالم)طولانیتعویض شد✔ سالم از ژنراتور✔ سالمبدون مشکل

📈 آمار و ارقام واقعی: چرا قطع برق قاتل خاموش داده‌هاست؟

علت قطعی برق در دیتاسنترها (۲۰۲۵)

منبع: Uptime Institute Q3 2025

درصد داده‌های ازدست‌رفته بر اساس مدت قطع برق

مدت زمان قطع برق (ثانیه) vs ریسک فساد

🔥 ۴. سه فاجعه‌ی واقعی که دنیا را تکان داد

مورد اول: کره جنوبی، سپتامبر ۲۰۲۵ – نابودی ۸۵۸ ترابایت داده دولتی
علت: آتش‌سوزی ناشی از انفجار باتری‌های UPS در دیتاسنتر دولتی. ژنراتورها روشن شدند اما تابلو برق اصلی ذوب شد. نتیجه: ۸۵۸ ترابایت داده معادل بیش از ۲۰۰ میلیون عکس با کیفیت بالا برای همیشه از بین رفت. هیچ نسخه پشتیبان خارج از دیتاسنتر وجود نداشت. (منبع: گزارش KISA، اکتبر ۲۰۲۵)
مورد دوم: AWS US-East-1، ۲۰۱۹ – ۱ ترابایت داده مشتریان ناپدید شد
اختلال در منبع تغذیه اصلی و نقص ژنراتورها. هرچند AWS ادعای بازیابی کرد اما بسیاری از مشتریان گزارش دادند حجم‌های ذخیره‌سازی EBS غیرقابل بازیابی شد و بیش از ۱ ترابایت داده از دست رفت.
مورد سوم: Exoscale سوئیس، نوامبر ۲۰۲۵ – قطعی ۴ ساعت و ۴۸ دقیقه بدون فساد داده
به دلیل استفاده از Cache محافظت‌شده با خازن (PLP) و سیستم فایل ژورنال‌شده (XFS با Journal) هیچ داده‌ای فاسد نشد. این نشان می‌دهد طراحی مدرن چقدر می‌تواند حیاتی باشد.

🛡️ ۵. قهرمانان ناشناخته: UPS، ژنراتور، NVDIMM و PLP

فناوریوظیفه اصلیزمان پاسخمحافظت از چه داده‌ای
UPS آنلاین (Double Conversion)برق همیشه از باتری عبور می‌کند۰ ثانیهتمام داده در حال پردازش
Ultracapacitor روی SSDذخیره انرژی لحظه‌ای برای نوشتن آخرین بایت‌ها<۱ میلی‌ثانیهWrite Cache
NVDIMM (حافظه غیرفرار)ترکیب RAM و فلش لحظه قطع برق۱۰ ثانیهکل محتویات RAM
ژنراتور دیزلی + سوخت ۷۲ ساعتهتأمین برق بلندمدت۱۰-۳۰ ثانیهکل دیتاسنتر (اگر UPS هماهنگ باشد)
سیستم فایل Journal (NTFS، EXT4، XFS)ثبت تراکنش‌ها قبل از اجرانرم‌افزاریجلوگیری از فساد ناشی از عملیات نیمه‌کاره

نکته تکان‌دهنده: طبق گزارش Uptime Institute در سال ۲۰۲۵، ۳۰ درصد از قطعی‌های برق دیتاسنترها به دلیل خطای انسانی در حین تست ژنراتور رخ می‌دهد، نه نقص فنی خود ژنراتور.

🧑‍💻 ۶. کاربر نهایی چه کند؟ (اقدامات عملی برای نجات داده‌ها)

قانون ۳-۲-۱ بکاپ: ۳ نسخه، ۲ نوع رسانه، ۱ نسخه خارج از ساختمان
برای کامپیوتر شخصی حتماً از UPS کوچک (۶۵۰VA یا بیشتر) استفاده کنید.
همیشه از «Safe Remove Hardware» استفاده کنید؛ قطع ناگهانی فلش مموری = قطع برق کوچک.
از سیستم‌های فایل ژورنال‌شونده (NTFS/EXT4) و فعال بودن Write Cache محافظت‌شده اطمینان حاصل کنید.
برای دیتابیس‌های مهم: Replication فعال + بکاپ خودکار ابری در منطقه جغرافیایی دیگر.

❌ اشتباهات مرگبار

اشتباهنتیجه در قطع برقراهکار درست
ذخیره فقط روی SSD داخلی لپ‌تاپبا فساد فایل یا مرگ SSD همه چیز تمامبکاپ خودکار به ابر یا هارد دوم
استفاده از RAM Disk برای فایل مهمبا قطع برق برای همیشه ناپدید می‌شوندهرگز از RAM Disk برای داده حیاتی استفاده نکنید
خاموش کردن Write Cache در ویندوز برای "performance"داده در معرض خطر بالای فسادروشن بماند، فقط با UPS محافظت کنید
نادیده گرفتن هشدار SMART هاردقطع برق کوچک آخرین ضربه را می‌زندهمان روز بکاپ و تعویض درایو

📌 جمع‌بندی عددی و حقیقت تکان‌دهنده

ارقام کلیدی از گزارش‌های ۲۰۲۵-۲۰۲۶:
• ۵ دقیقه: حداکثر زمانی که یک UPS صنعتی می‌تواند دیتاسنتر را بدون ژنراتور نگه دارد.
• ۳۰٪ از قطعی‌های برق دیتاسنترها به دلیل خطای انسانی در نگهداری ژنراتور رخ می‌دهد.
• ۸۵۸ ترابایت: بزرگ‌ترین فاجعه از دست رفتن داده در سال ۲۰۲۵ (کره جنوبی).
• ۱۰ ثانیه: فرصتی که NVDIMM به RAM می‌دهد تا محتویات را روی فلش بنویسد.
در ۷۰ درصد موارد از دست رفتن داده به دلیل قطع برق، علت اصلی نبود نسخه پشتیبان خارج از دیتاسنتر است.

حرف آخر: برق نمی‌پرسد شما آماده‌اید یا نه. او فقط قطع می‌شود. همین حالا از داده‌های حیاتی خود بکاپ تهیه کنید، حتی اگر فقط یک هارد اکسترنال باشد که هر هفته به محل دیگری منتقل می‌شود. طراحی مدرن (NVMe با PLP، UPS لیتیوم‑یون، و سیستم عامل به‌روز) تفاوت بین یک هشدار ساده و یک فاجعه‌ی ۸۵۸ ترابایتی است.