HCI REŠENJE U JP SRBIJAGAS: VMWARE VSAN U SLUŽBI POSLOVNE AGILNOSTI

Kada se odlučite za verziju VMware vSAN klastera koja vam odgovara, hibridnu ili all-flash, potrebno je izabrati odgovarajući hardver, a mesto odakle se počinje je VMware Compatibility Guide portal.

Prelaskom na vSAN Srbijagas je dobio sistem koji je neuporedivo brži i pouzdaniji od prethodnog, a VMware okruženje se pokazalo kao izuzetno jednostavno za administriranje i izvršavanje svakodnevnih aktivnosti.

Efekte unapređenja sistema primetili su posebno DB administratori i programeri koji rade na razvoju aplikacija – upiti nad bazom se sada izvršavaju 20 puta brže.

O VMware vSAN HCI rešenju smo već pisali i nema IT stručnjaka koji do sada nije čuo za pojam hiperkonvergentne infrastrukture. U istom maniru, i tekst pred vama bavi se osnovama arhitekture i funkcionisanja HCI rešenja u izvedbi kompanije VMware, a ovaj put u fokusu je analiza unapređenja infrastrukture u JP Srbijagas, uz osvrt na benefite koje im je prelazak na HCI rešenje doneo.

Neke od odlika HCI rešenja su: odsustvo tradicionalnih storidž sistema u konfiguraciji, veoma brza mrežna konekcija između nodova (servera), visoka raspoloživost i performanse, performanse i performanse… Šalu na stranu, visoke performanse omogućene su upotrebom lokalnih SSD diskova sa velikim brojem upisa/čitanja, upotrebom SSD keš bafera i backbone mrežom koja je za produkcioni sistem minimalno 10 Gb/s.

Kada govorimo o VMware vSAN klasteru, na početku je potrebno odlučiti se za jednu od dve opcije – hibridni vSAN ili all-flash vSAN. Iz samog imena može se zaključiti da razlika leži u tipovima diskova koje ćete koristiti, kao i licenci koju morate da kupite. Dok hibridni vSAN zahteva standardnu licencu, all-flash funkcionalnosti se otključavaju tek sa advanced licencom. Naravno, advanced licenca je dosta skuplja od standardne, ali se sa njom dobijaju deduplikacija i kompresija na nivou vSan datastore-a.

Kada se odlučite za verziju koja vam odgovara, potrebno je izabrati odgovarajući hardver. U ovom slučaju mesto odakle se počinje je VMware Compatibility Guide portal, na kome možete da vidite koji hardver je sertifikovan za rad pod VMware vSAN-om. Najlakša opcija je izabrati vSAN ready node jednog od dvadesetak vendora, jer je to hardver koji je već unapred testiran i sertifikovan od strane kompanije VMware. U slučaju da vam ta opcija ne odgovara ili već imate hardver koji želite da iskoristite, detaljnije pogledajte komponente koje želite da stavite u server. Tada se pažnja obraća na CPU, disk kontroler (poželjno je da bude što „gluplji“ i brži, jer vSAN upravlja diskovima) i naravno diskove. U obe varijante vSAN-a diskovi se dele na dve grupe, cache tier i capacity tier. Na listi se nalaze diskovi vendora po PN-u i potrebno je izabrati i nabaviti upravo te diskove. Od njih se prave grupe diskova, od kojih svaka mora imati minimalno jedan cache disk i maksimalno sedam capacity diskova.

Treba napomenuti da je minimalni broj hostova/nodova za vSAN tri, mada se za potrebe testiranja može podići i kao dvonodni klaster. Kada ispunite sve ove uslove, pošto je vSAN deo ESXi vSphere kernela, potrebno je da omogućite vSAN opciju i napravite grupe od raspoloživih diskova. Ovo su osnovni detalji konfiguracije vSphere okruženja.

Analiza stanja i odabir optimalnog rešenja

Kako je to urađeno u kompaniji Srbijagas? Nakon inicijalnog pregleda, u saradnji sa korisnikom sagledana je trenutna situacija i stanje infrastrukture, zaključeno je da se cela produkcija izvršava na relativno starim Fujitsu blade serverima i Fujitsu storidžu, koji su povezani ­4 Gb/s FC vezom. Hipervizor je Microsoft Hyper-V 2012 i napravljen je klaster od pet nodova.
Nakon razgovora sa korisnikom o planovima za zanavljanje i unapređenje infrastrukture, došlo se do zanimljivih informacija. Na toj infrastrukturi izvršavalo se blizu sto virtuelnih mašina, od kojih su neke bile database serveri. Inženjeri iz Srbijagasa konstatovali su da neki servisi rade usporeno, kao i da upiti nad bazama oduzimaju dosta vremena. Zaključak je bio da je storidž sistem usko grlo i da njegove performanse jednostavno nisu dovoljne za narasle potrebe kompanije. Predlog je bio kupovina novog all-flash storidž sistema i zanavljanje servera. Bio je to ključni momenat jer smo saznali da Srbijagas već poseduje određeni broj novijih Dell servera, namenjenih udaljenim lokacijama. Posle pregleda konfiguracije samog hardvera ustanovljeno je da serveri poseduju veliki broj diskova (SAS, SATA i par SSD diskova), kao i 10 Gb/s mrežne kartice. Ideja o vSAN klasteru od šest servera polako se formirala.

Daljim pregledom ustanovljeno je da Srbijagas poseduje i jedan Cisco Nexus svič koji ima 10G i 40G portove, čime bi bila obezbeđena i backbone konektivnost, doduše neredundantna (planirana je kupovina dva nova sviča). Pošto je korisnik imao većinu neophodnih komponenata za vSAN klaster odustalo se od nabavke novog storidž sistema. Odlučeno je da se kupe licence za VMware vSAN. Posle kratke tehničke prezentacije o prednostima ovakvog rešenja doneta je odluka da se izvrši analiza troškova formiranja vSAN klastera, kako bi oni bili upoređeni sa cenom nabavke novih servera i storidža.

Tokom razmatranja troškova za neophodne licence, uz pomoć inženjera iz Srbijagasa otkrili smo da kompanija već ima neke neiskorišćene licence koje su im isporučene uz hardver za drugi projekat. Nakon provere na VMware portalu ispostavilo se da korisnik poseduje vSphere Enterprise Plus i vSAN Standard licence za četiri dvoprocesorska servera (ukupno po osam licenci za oba proizvoda). Nakon toga nije se dovodilo u pitanje koje će rešenje biti primenjeno, već je jednoglasno usvojeno: „Idemo na vSAN!“

Realizacija projekta i testiranje performansi

Ubrzo se otpočelo sa instalacijom i podizanjem VMware okruženja, uz planiranje migracije postojećih servisa i virtuelnih mašina. Uz sitne tehničke probleme koji su se usput pojavili („prepametan“ RAID kontroler koji smo morali da „zaglupimo“ i boot kartica za ESXi), sama instalacija prošla je očekivano dobro. Odlučeno je da se koristi verzija vSphere 6.7U2, koja je u tom trenutku bila pretposlednja dostupna verzija. Nakon par dana rada dobijen je funkcionalan vSAN klaster od šest Dell PowerEdge servera i hibridni vSAN datastore od 144 TB prostora.

U cilju provere performansi sistema pristupilo se podizanju testnih mašina i detaljnom testiranju. Za merenje performansi diskova korišćen je alat HCIBench, dostupan na VMware fling portalu. Dobijeni su prilično ubedljivi rezultati. Za ovaj test potreban je i download dodatne worker komponente, koju treba preuzeti sa sajta kompanije Oracle.

Nakon višednevnog testiranja sa različitim konfiguracijama zaključeno je da ovaj sistem može da isporuči oko 120.000 IOPS-a u najtežim uslovima eksploatacije, a da taj broj prelazi i 200.000 ako je veličina bloka preko 4K. Dobijeni rezultat bio je neuporedivo bolji u odnosu na prethodno stanje. Bili su to prvi opipljivi rezultati rada. Međutim, sintetički testovi su jedno, a realno opterećenje nešto sasvim drugo.

Nakon detaljnog planiranja migracije odlučeno je da nekih pedesetak mašina bude prebačeno sa Hyper-V infrastrukture na novi klaster i da se virtuelizuje par fizičkih servera. Za ovaj posao korišćen je VMware vCenter converter, pomoću kojeg je bez problema izvršena većina konverzija i prebacivanja. Na žalost, neke servere nije bilo moguće konvertovati ovim programom – to su uglavnom bile neke verzije Linux-a (tu spada i e-mail server od 5 TB), pa su korišćeni i drugi alati (npr. SolarWind v2v i p2v) i posle toga su menjani parametri diskova UUID, GRUB itd. Većina operacija obavljana je nakon radnog vremena i tokom noći, kako bi korisnici bili u mogućnosti da tokom dana neometano rade.

Važno je naglasiti par stvari na koje treba obratiti pažnju ukoliko se odlučite za konverziju. Kako biste dobili maksimalnu brzinu prenosa putem mreže obavezno treba ugasiti SSL enkripciju u XML fajlu vCenter converter worker-a. Razlika je ogromna: od 1-2 Mb/s sa uključenom enkripcijom do 60-70 Mb/s bez enkripcije. Mašine koji imaju OEM particiju na hard disku neće moći iz prve da se konvertuju; postoji VMware KB koji treba primeniti i izvršiti rekonfiguraciju (ne ponovnu konverziju). Linux je veoma osetljiv na promenu diskova i particija, pa je najbolje da se konvertuje ceo disk, takav kakav jeste, bez optimizacije praznog prostora, razdvajanja particija na posebne diskove i sl.

Postignuti rezultati

Nakon što su sve mašine uspešno prebačene na novi sistem, razlika je zaista bila očigledna. Ono što su korisnici primetili i pohvalili je to da su svi serveri na kojima rade „prodisali“ i da imaju osećaj kao da rade na mašinama koje su na SSD-u. Kolege inženjeri naveli su kao primer otvaranje AV web konzole Kaspersky, koje je ranije trajalo i do jednog minuta, a sada je gotovo trenutno. Najveće efekte unapređenja primetili su DB administratori i programeri koji razvijaju aplikacije. Naime, sada se upiti nad bazom izvršavaju za 20 puta kraće vreme. Već smo pomenuli da su sintetički testovi jedno, a realno opterećenje nešto drugo: u ovom slučaju realno opterećenje dalo je čak i bolje rezultate od suvih sintetičkih testova, koji jednostavno pokušavaju da što više opterete sistem.

Po uspešnom završetku projekta, glavni utisci i zaključci IT inženjera iz Srbijagasa bili su: da su dobili sistem koji je daleko brži i pouzdaniji od onog koji su prethodno imali, da se nikada ne bi vratili na tradicionalni server-storidž sistem i da se VMware okruženje pokazalo kao izuzetno jednostavno za administriranje i izvršavanje svakodnevnih aktivnosti. Ovo je odličan primer kako se u situaciji kada su kompanija i njen IT otvoreni za unapređenje i proširenje znanja i veština „neke stvari jednostavno poklope“ i na kraju svi budu više nego zadovoljni.

Nebojša Lončarević
COMING

0 %s Comments

Prosledi komentar

Vaša adresa e-pošte neće biti objavljena.

Najnoviji

Novi-NetApp-proizvodi

Novi NetApp proizvodi

Da li su vam već poznati novi NetApp sistemi C-serije, sa QLC Flash tipom ...
Veštačka-inteligencija-u-našim-rukama

Veštačka inteligencija u

Broj oblasti u kojima se eksperimentiše sa različitim dostignućima veštačke ...
Azure-Active-Directory--postaje-Entra-ID

Azure Active Directory

Azure Active Directory je sada Entra ID. I premda većina korisnika ovu promenu ...
Transformacija-tehničkog-duga--pomoću-DevOps-tehnologija

Transformacija tehničkog duga

Najveću opasnost za organizacije ne predstavlja samo postojanje tehničkog duga, ...