Bilo da ste izgradili sopstveni data centar ili ste se odlučili za cloud varijantu, jedno je sigurno: sve što može da krene naopako, krenuće naopako! Ipak, postoji pouzdan način za sprečavanje moguće havarije i prekida u radu: konstantno nadgledanje sistema, koje omogućava pravovremenu reakciju.

Sve ste uradili kako treba. Uložili ste vreme i sredstva u projektovanje i izgradnju data centra, vodili ste računa da sve bude redundantno i po najboljim preporukama. Da biste obezbedili visokoraspoložive servise potrebno je da imate visokoraspoloživu infrastrukturu, a ona se sastoji od klastera servera, redundantnih kontrolera na storidž sistemima, stekovane mrežne opreme, odvojenih grana za napajanje, UPS sistema, generatora… Takođe, ne smemo zaboraviti ni redundantne internet konekcije, koje po pravilu moraju biti od različitih internet provajdera. Drugi pristup je da vaše poslovanje i podatke poverite jednom od cloud provajdera, koji će onda biti odgovoran za dostupnost servisa i moraće da ispuni dogovoreni SLA (Service Level Agreement). Da li je to dovoljno? Nažalost, u mnogo slučajeva pokazalo se da nije.

Bilo da ste izgradili svoj data centar, obezbedili disaster recovery lokaciju koja može da preuzme poslovanje u slučaju havarije na primarnom sajtu ili ste se odlučili za cloud varijantu, jedno je sigurno: na Marfijev zakon uvek možete računati! Kao što zakon kaže: Sve što može da krene naopako, krenuće naopako. Protiv ove pojave možemo se boriti konstantnim nadgledanjem sistema i pravovremenim reakcijama.

U slučaju da je vaš sistem pod stalnim nadzorom, u velikom broju slučajeva možete da sprečite prekid u radu ili da umnogome ublažite posledice neke havarije. Pod stalnim nadzorom ne podrazumevamo pasivno obaveštavanje administratora o problemu koji je nastao (npr. slanje elektronske poruke u slučaju otkazivanja neke komponente), već monitorig centar koji radi 24/7 sa obučenim inženjerima koji mogu da preduzmu potrebne akcije kako bi održali sistem stabilnim. Postavlja se pitanje: zašto nije dovoljno da vas administratori obaveste o problemu i da pristupe rešavanju? Odgovor je jednostavan: za reakciju su nekada presudni minuti. Ovo se posebno odnosi na cloud provajdere, koji da bi ispunili visok SLA i izbegli plaćanje kazni ili raskid ugovora moraju da pravovremeno reaguju. Još jedna situacija koja se u praksi često dešava jeste da u slučaju problema upravo e-mail servis ne bude dostupan, tako da vas ne može ni obavestiti o nastaloj situaciji.

Postavka monitoring centra

Vratimo se na monitoring centar. Kao i u prethodnom slučaju, i ovde morate da donesete odluku: ili ćete napraviti svoj monitoring centar sa svim potrebnim komponentama ili ćete nadzor svog sistema prepustiti nekoj kompaniji. Većini kompanija potrebno je da imaju ljude koji poznaju sistem i poslovanje kompanije koje nadziru, i u tom slučaju će mnogo brže ustanoviti u čemu je problem i kako ga najefikasnije rešiti. COMING je prepoznao ovu potrebu i pre par meseci započeo projekat uspostavljanja novog monitoring centra, izgrađenog po najnovijim standardima. Ovaj monitoring centar pravi se prvenstveno za potrebe cloud infrastrukture, kao i za interne potrebe COMING-a i Quantum Automarketa.

Tipična postavka monitoring centra sastoji se od velikog video-zida i radnih stolova sa radnim stanicama ispred njega. Radna mesta namenjena su za dežurne inženjere, koji aktivno prate parametre sistema u realnom vremenu. Video-zid je centralna tačka monitoring centra i od esencijalnog značaja je da on bude kvalitetno izrađen i da svojim dimenzijama zadovoljava potrebe prikaza svih relevantnih informacija odjednom. U današnje vreme video-zid se najčešće sastoji od više televizora HD ili 4K rezolucije. Jedan od uslova koje televizor treba da ispuni je nepostojanje spoljnih ivica, tj. okvira oko ekrana. Ovo je veoma važno zbog same funkcije video-zida, da na više ekrana prikazuje jedan uvećan sadržaj i da se mogu praviti proizvoljne dimenzije sadržaja koji se prikazuju. Druga važna stvar u vezi sa televizorima jeste da budu namenjeni za neprekidan rad. Ovo znači da kućne varijante ne dolaze u obzir, iz dva razloga. Prvi razlog je mnogo kraći životni vek televizora koji radi 24/7, a nije predviđen za to, a drugi je oštećenje ekrana zbog prikaza nepomičnih delova slike (ranije veoma izraženo kod plazma televizora). Imajući ovo u vidu, ozbiljniji proizvođači imaju posebne serije koje su namenjene upravo ovakvim uslovima, što za posledicu ima i osetno veću cenu po uređaju. U slučaju COMING monitoring centra odlučili smo se za matricu 3×3 Samsung televizora koja zauzima ceo jedan zid.

Dolazimo do sledećeg problema, a to je prikaz sadržaja na ekranima. Najjednostavnije rešenje je da jedan ili dva televizora budu prikačeni na jedan računar, ali to nije optimalno i ne dozvoljava dinamičnu promenu prikaza sadržaja. Rešenje koje je COMING primenio, u saradnji sa svojim partnerom iz Izraela, jeste softver Userful. Ovo rešenje podrazumeva da je na svaki televizor sa zadnje strane priključen tanki klijent, koji je do televizora povezan HDMI kablom, a na upravljački server preko mreže gigabitnom konekcijom. Ovo nam omogućuje da sa jedne web konzole upravljamo celim video-zidom i definišemo šta želimo da se prikazuje na kojim ekranima ili delovima ekrana.

Pomoću konzole možemo definisati i rotaciju video-sadržaja u određenom vremenskom intervalu, tako da ceo video-zid dobija na dinamici, a vi možete prikazati više sadržaja bez intervencije dežurnih inženjera.

Upravljanje nadzorom

Kada smo ispunili sve uslove za udoban prikaz slike u našem monitoring centru, dolazimo do najbitnije stavke, a to je sadržaj. Sam sadržaj ekrana mora biti strogo definisan i prilagođen potrebama svakog sistema posebno. Neki od najčešćih su zauzeće linkova i stanje mrežnih uređaja na lokaciji, zauzeće kompjuterskih resursa (CPU, RAM memorija), zauzeće diskova i kašnjenje storidž sistema, temperatura komponenata, ambijentalna temperatura DC-a, video-nadzor DC-a itd. Jedan od ekrana može biti dedikovan i tiketing sistemu, gde bi se pratilo stanje i broj otvorenih zahteva. Broj televizora brzo postaje nedovoljan da prikaže sve potrebne informacije, zato pomenuta rotacija dolazi do izražaja.

Kao što možemo videti iz osnovnih zahteva jednog monitoring centra, ne postoji jedan softver koji bi mogao da prikuplja ove informacije. Pored sveg hardvera i softvera za upravljanje video-zidom, potrebno je nabaviti i namenski softver koji može prikupiti i po potrebi logovati informacije. Jedan od najpoznatijih proizvoda na tržištu je Paessler PRTG, veoma moćan alat koji vam dozvoljava prikupljanje i prikaz velikog broja informacija sa sistema. Samo licenciranje PRTG-a vrši se po broju senzora, a omogućena je i besplatna verzija do 100 senzora.

S obzirom da je COMING VMware partner i da je naša infrastruktura zasnovana na vSphere platformi, imamo mogućnost da iskoristimo neke od alata koji nam daju detaljan prikaz sistema. U pitanju je par proizvoda iz vRealize grupe, kao što su vRealize Network Insight, vRealize Operation Manager i vRealize Log Insight. Pored prikaza u realnom vremenu i definisanja alarma u sistemu, važna komponenta je prikupljanje logova, koji vam mogu pomoći da rešite problem i ustanovite njegov uzrok. Dobra praksa pokazala je da pored svega navedenog treba razmišljati i o rezervnoj varijanti obeštavanja o problemima. U tom slučaju se većina monitoring sistema oslanja na GSM SMS gateway, koji će uz pomoć skripti proveravati najkritičnije servise (e-mail servis, temperatura, internet link) i potpuno drugom tehnologijom obaveštavati inženjere o statusu.

I pored svega navedenog, u većini slučajeva postoji „dobitna kombinacija“, koja, iako neverovatna, može oboriti ceo sistem ili njegov deo, jer gospodin Marfi nikada ne spava. Uz implementaciju 24/7 monitoring sistema ni mi ne spavamo, a onda borba postaje mnogo ravnopravnija.

Nebojša Lončarević , COMING

0 %s Comments

Prosledi komentar

Vaša adresa e-pošte neće biti objavljena.

Najnoviji

Novi-NetApp-proizvodi

Novi NetApp proizvodi

Da li su vam već poznati novi NetApp sistemi C-serije, sa QLC Flash tipom ...
Veštačka-inteligencija-u-našim-rukama

Veštačka inteligencija u

Broj oblasti u kojima se eksperimentiše sa različitim dostignućima veštačke ...
Azure-Active-Directory--postaje-Entra-ID

Azure Active Directory

Azure Active Directory je sada Entra ID. I premda većina korisnika ovu promenu ...
Transformacija-tehničkog-duga--pomoću-DevOps-tehnologija

Transformacija tehničkog duga

Najveću opasnost za organizacije ne predstavlja samo postojanje tehničkog duga, ...