A Facebook rendszeresen leállítja saját adatközpontjait

Doclernet
Doclernet

Igen merész módszert választott arra a Facebook, hogy tesztelje rendszerei működését. A cég adatközpont-csapata rendszeresen komplett oldalakat kapcsol le, hogy lássa, hogyan reagálnak rendszerei és rájöjjön milyen új fejlesztésekre van szükség a hatékonyabb működés érdekében.

Ennek a stressztesztnek az ötlete a Sandy Hurrikán pusztítása után született, amikor 2012-ben a vihar letarolta az Egyesült Államok keleti partját, számos adatközpont huzamosabb leállását is okozva.

Bár a Facebook két keleti parti adatközpontja átvészelte a vihart, a cégnél mégis erősen gondolkodni kezdtek azon, mi történne, ha egy hasonló méretű csapás miatt adatközpontok vagy teljes régiók válnának elérhetetlenné.

Éppen ezért létrehozták a cégen belül a Vihar Projekt nevű csoportot, de a rendszeres tesztek idején a teljes mérnöki részleg és más alkalmazottak is együtt dolgoznak a problémán.

Mindez roppant nehéz feladat, hiszen egyetlen Facebook adatközpont másodpercenként több tucat terabyte adatforgalmat bonyolít le, miközben szoftverek ezreit futtatja párhuzamosan.

Bár a Facebook felhasználók semmit nem vesznek észre ezekből a leállásokból, a cég mérnökei rengeteget tanulnak belőlük, elsősorban a terheléselosztás és az adatforgalom-menedzsment területén.

Tanulságos volt az is a tesztek során, hogy mennyivel tovább tart visszakapcsolni egy adatközpontot, mint leállítani. Pont, ahogy a gyerekek is hamar rájönnek, hogy szétszerelni sokkal könnyebb a játékokat, mint utána megint működőképesre összerakni őket.

A tesztelések nyomán a Facebook kifejlesztett egy automatikus runbookot, ami minden lépést tartalmaz egy adatközpont le- és visszakapcsolásához.

A csapat minden gyakorlat során méri mennyi idő alatt tudták elvégezni a szükséges műveleteket és folyamatosan keresik a fejlesztési lehetőségeket, hogy ezt az időt egyre lejjebb és lejjebb tudják szorítani.

Szerencsére Magyarországot aligha fenyegetik hurrikán méretű viharok vagy nagy erejű földrengések, de mindemellett a DoclerNet nagy erőfeszítéseket fejt ki annak érdekében, hogy szerverei folyamatosan ügyfelei rendelkezésére tudjanak állni.