Evo kako smo mi resili, prvo cu opisati hardware pa onda Wat If situacije:
1. Serveri
Serveri su podeljeni u 3 grupe, S.A.P, farma terminal servera i obicni serveri. Prve 2 grupe su znacajne za funkcionisanje firme, treca grupa i nije toliko vazna pa o njoj necu ni pisati.
1.1 Terminal Serveri
Hardware : dual processor, dve dualhead NIC, RAID-1, redundant power supply, 1.5 GB RAM. Serveri rade sa MS Terminal Serverom i NLB-om. Ima 10 servera sto je over-kill ali ako jedan ili dva servera ispadnu iz mreze korisnici nece osetiti.
1.2 S.A.P Serveri
DataBase i App1 server su identicni: Dual Processor, 4 GB RAM, 18,2 GB SCSI 15k RAID-1 za OS, 18,2 GB SCSI 15k RAID-1 za SWAP, 36 GB SCSI 15k RAID-5 za Software, 2 hot stand-by 18 SCSI HDD's i 2 FC SCSI adapter. Serveri imaju 2 dual head NIC + jedan obican NIC adapter koji sluzi za controlu izmedju servera. Oba servera su povezana sa FC-30 kabinetom gde su diskovi za database. FC-30 ima 2 adaptera tako da ako jedan prestane da radi automatski se prebacuje na drugi.
Ostali App. serveri su Dual Processor, 2 GB RAM, 18,2 GB SCSI 15k RAID-1 za OS, 18,2 GB SCSI 15k RAID-1 za SWAP, 36 GB SCSI 15k RAID-5 za Software, 2 hot stand-by 18 SCSI HDD's.
2. LAN/WAN
U glavnoj poslovnici se nalaze kao srce mreze dva CISCO 4006 switch-a, svi serveri su povezani na oba (zato imaju dualhead mrezne karte). Veza sa poslovnicama je uspostavljena preko Frame Relay-a i Micro talasne antene do POP-a kao back-up. Poslovnice su povezane sa FR-om i ISDN-2 lijijom izmedju sebe.
3. Backup
Backup za database se vrsi pomocu 2 Ultriuima 220 u RAID-1 konfiguraciji, Full Back-up svako vece i transactional backup svakih 10 minuta na HDD. Jedna traka se cuva u vatrostalnom sefu (9 sati moze da izdrzi 1000 C i pad sa 4 metra visine bez gubtka podataka na trakama) a druga se salje kurirom u CEC.
Posto se software na serverima retko menja, samo se u tim prilikama pravi backup i image. Svaki serevr ima svoj DLT unit i Image na kojem je NT + Arcserve, tako da prilikom vracanja podataka ne treba prvo instalirati NT i ARCServe, skracuje vreme za jedno 2 sata.
4. Ostali hardware
UPS-ovi normalno, svaki server je povezan na 2 UPS-a, i generator za citavu zgradu. Protivpozarni sistem je na bazi aerosola (VODA!!!!!), to je IBM-ov sistem ne mogu da se setim vise imena, ima prednost nad gasom zato sto se prilikom gasenja pozara ne mora napustiti prostorija. Posle je potrebno samo suvom krpom obrisati servere.
Wat if...
1. Nestanak struje
UPS-ovi preuzimaju prvih 5 minuta nestanka struje a onda generator.
2. Database server prestaje sa radom
Ako DB server prestane sa radom, App1 server se restartuje (CLUSTERING), prestaje da radi kao APP's i preuzima ulogu DB servera.
3. App server 2-??? prestaje sa radom
Nista, korisnici koji si koriste database preko tog servera moraju ponovo da se konektuju i nastavljaju sa radom.
4. Terminal server prestaje sa radom
Isto kao i kod App servera, ponovo se konektuju i nastavljaju sa radom.
5. Bilo koji od HDD prestaje sa radom
Svi serveri imaju ili RAID-1 ili RAID-5 tako da nastavljaju normalno sa radom, jedino sto je taj server nesto sporiji, zato sto mora da prebaci podatke na stand-by HDD.
6. WAN
Sam Frame Relay ne moze da se prekine, jedino sta moze da se prekine je veza do prvog POP-a (pokidaju kabel), ako se to desi onda se veza prebacuje na microtalasnu antenu. Poslovnice imaju ISDN backup mada ako se prekine kabel onda su prekinute sve veze, posto u poslovnicama radi po 10 ljudi nije tako strasno.
7. Pozar
Ako je lokalni onda se gasi aerosolom, ako citava zgrada izgori onda stupa plan za katastrofe, a o tome drugi put.
I na kraju...
Jedina slaba tacka je FC-30, ako se on pokvari onda mora da se ceka (call to repair contract 4 sata stupa na snagu), tako da je down time negde oko 8 sati. Inace citavo resenje je kostalo negde oko 1.000.000 DM.... neko ce reci mnogo novaca ali,
- oko 300 korisnika je zavisno od sistema (oni koji rade i oni koji ne rade sa kompjuterom), gazdu kosta svaki covek oko 100 DM, ako sistem ne radi on gubi po satu 30.000 DM. Ne govorim o gubitku poslovanja, to jos treba dodati.
- osiguranje za firmu je oko 40% jeftinije ako im pokazes da imas ovakav plan (u osiguranje je uracunato i da u slucaju pozara gubis poslovne partnere).
- lakse je dobiti ISO-9002
Horror, and moral terror are your friends.