AI demokratizacija na talasu malih i otvorenih modela

Aktuelno - 19 | Bezbednost | Business&IT | Business&IT-br.19 | Veštačka inteligencija

AI demokratizacija na talasu malih i otvorenih modela

Evolucija malih i otvorenih modela otvara nove mogućnosti za kompanije svih industrija da koriste veštačku inteligenciju na načine koji su ranije bili dostupni samo tehnološkim gigantima

Sem Altman, izvršni direktor kompanije OpenAI, koja je sa ChatGPT-om pokrenula AI lavinu, izjavio je pre oko dve godine da startapi koji imaju 10 miliona dolara finansiranja protiv njih nemaju nikakve šanse (tačan izraz koji je upotrebio je „totally hopeless“ – potpuno beznadežno). I ako bismo se vratili u tu 2023, videli bismo da ponudom AI servisa dominira mali broj ogromnih kompanija, baš onako kako Altmanu i njegovoj konkurenciji i odgovara. Skočimo sada na 27. januar 2025, dan kada su indeksi američke berze pali za nekoliko procenata, a NVIDIA, dominantni proizvođač GPU čipova koji se masovno koriste za AI primene, izgubila 600 milijardi dolara vrednosti kompanije. Razlog? Jedan kineski startap, za koji do tada praktično niko nije čuo i objava njihovog DeepSeek-R1 AI modela, koji je pokazao performanse uporedive sa najboljim AI servisima, a navodno je istreniran za manje od 6 miliona dolara. Iako ne prikazuje kompletnu investiciju u razvoj (koja se verovatno meri i milijardama), ova brojka je dosta efektna, posebno imajući u vidu Altmanovu izjavu s početka članka. Koliki god da je tačan trošak, DeepSeek je pokazao da se inovacijama u načinu treniranja modela mogu dramatično smanjiti troškovi razvoja, pa samim tim i cena AI usluga ka krajnjim korisnicima i praktično niotkuda uzeo deo kolača na tržištu kojim su do tada dominirale pretežno kompanije iz SAD. Ali DeepSeek je otišao i korak dalje – svoj model nije ponudio samo kao plaćeni servis, već ga je učinio otvorenim i dostupnim svima za preuzimanje i korišćenje. Otvoreni AI Da bismo razumeli značaj ove objave, potrebno je prvo objasniti razliku između otvorenih i zatvorenih AI modela. Kod klasičnog softvera otvorenost podrazumeva mogućnost pristupa izvornom kodu i njegovog korišćenja (sa ili bez ograničenja). Kod ovih modela ne postoji jasan pandan izvornom kodu, pa su stvari nešto komplikovanije. Otvoreni model kao minimum podrazumeva dostupnost za preuzimanje njegovih treniranih parametara (weights), što omogućava da se model dalje prilagođava i pokreće u lokalu. Ovo su tzv. open-weights modeli i većina otvorenih modela (pa i DeepSeek) spada u ovu grupu. S druge strane, puristi open source pokreta otvorenost definišu kao dostupnost, ne samo parametara već i podataka, metodologije i koda korišćenih za treniranje, što bi bilo kome (naravno, sa dovoljno hardvera na raspolaganju) omogućilo da model istrenira od nule i postigne iste rezultate u radu. Ovakvih primera nema mnogo, pa većina aktuelnih mehanizama za unapređivanje gotovih AI modela ne podrazumeva manipulaciju trening procesom i podacima, već se fokusira na metode koje su primenjive i na open-weights modele. Pre DeepSeeka, najmoćniji, tzv. „state of the art“ (SOTA) modeli bili su zatvorene crne kutije, korisnicima dostupne samo kroz plaćene pretplate. U trenutku kada je ponuda otvorenih modela bila ograničena na relativno mali broj manjih modela, DeepSeek je javnosti na korišćenje dao model koji je po svojim performansama bio blizak komercijalnim AI servisima. To je ponovo skrenulo pažnju na otvorene modele i posredno dovelo do toga da se ovog leta čak i OpenAI priseti da sadrži „open“ u svom imenu i prvi put posle šest godina objavi otvoreni model. U ponudi otvorenih modela su, sa jedne strane, zastupljene zapadne kompanije, kao što su Microsoft, IBM, Google i francuski Mistral AI, koje javno objavljuju uglavnom manje modele (Meta je jedan izuzetak koji potvrđuje pravilo). Nasuprot njima, tu su kineske kompanije koje objavljuju modele raznih veličina. Među njima ima više startapa, javnosti ne toliko poznatih, poput Moonshot AIja i MiniMaxa, ali i renomiranih igrača kao što je Alibaba, čiji je Qwen3 u trenutku pisanja teksta vodeći otvoreni model po performansama.

Uticaj objave DeepSeek-R1 modela na cene akcija 27. januara 2025. (Izvor: DrWealth)

Performanse otvorenih i zatvorenih modela na MMLU testu (Izvor: https://x.com/ maximelabonne

Performanse otvorenihi zatvorenih modela na MMLU testu
(Izvor: https://x.com/maximelabonne)

Da li je veće uvek i bolje?

Fokusirani pristup malih modela često rezultuje boljim performansama na specijalizovanim zadacima u poređenju sa korišćenjem većih modela opšte namene

Već smo se par puta u tekstu dotakli pojma veličine modela, pa je dobar trenutak da ga i objasnimo. Veličina modela obično se izražava brojem njegovih parametara – numeričkih vrednosti koje model podešava pri treniranju i koji kasnije određuju kako će model procesirati ulazne podatke da bi generisao odgovor. Po veličini, modeli se mogu podeliti na male, srednje i velike. Ne postoje precizne granice i opšte prihvaćena definicija, ali za potrebe ovog članka pod malim modelima (SLM – Small Language Model) podrazumevamo one koji imaju do 10 B (milijardi) parametara, dok su veliki (LLM – Large Language Model) oni sa više od 100 B parametara. Veličina modela direktno je povezana sa hardverskim resursima potrebnim za njihovo izvršavanje: što više parametara i što je veća preciznost kojom su definisani, to je potrebno i više GPU memorije. Najmanji modeli se sa zadovoljavajućim performansama mogu pokrenuti i na kućnim računarima, čak i bez dedikovane grafike, dok su za srednje i velike modele potrebni snažni višeserverski klasteri i high-end grafički čipovi. Primera radi, procena je da GPT-4 ima oko 1,8 T (biliona) parametara. S druge strane, otvoreni modeli se obično objavljuju u više edicija, koje pokrivaju širok spektar veličina i primena. Tako je pomenuti Qwen3 dostupan u izdanjima od 0,6 B do 480 B parametara i u tri edicije: Thinking (kompleksniji zadaci i istraživanje), Instruct (optimizovan za najbolje performanse i jednostavnije zadatke) i Coder (razvoj softvera). Interesovanje za male modele raste na talasu primena u edge i IoT okruženjima, gde se obrada vrši lokalno, na uređajima vrlo ograničenih resursa, kao i agentskog AI-ja, sledećeg koraka u evoluciji AI sistema koji su u stanju da Interesovanje za male modele raste na talasu primena u edge i IoT okruženjima, gde se obrada vrši lokalno, na uređajima vrlo ograničenih resursa Fokusirani pristup malih modela često rezultuje boljim performansama na specijalizovanim zadacima u poređenju sa korišćenjem većih modela opšte namene Performanse otvorenih i zatvorenih modela na MMLU testu (Izvor: https://x.com/ maximelabonne) 15 samostalno vrše planiranje, donose odluke i koriste alate kako bi ispunili zadati cilj, npr. refaktor softverskog koda ili planiranje puta i rezervacija smeštaja. U mnogim primenama mali modeli predstavljaju kompaktniju i efikasniju alternativu LLM-ovima, nudeći dobre performanse za specifične namene, uz nisku potrošnju resursa. Razlika između malih i velikih modela može se objasniti i na primeru poređenja velike fabrike sa specijalizovanom radionicom. LLM fabrika može da proizvede ogroman spektar različitih proizvoda i da se nosi sa složenim, višefaznim proizvodnim procesima, ali zahteva značajnu infrastrukturu, energiju i održavanje. SLM radionica, iako ograničena po mogućnostima, može da proizvede kvalitetne specijalizovane proizvode sa mnogo nižim troškovima, ali i da se brzo prilagodi različitim zadacima.

Modeli za široke MaaSe

Kod MaaS-a do izražaja dolaze prednosti koje otvoreni modeli pružaju organizacijama u odnosu na zatvorene: predvidljivost troškova, bezbednost i fleksibilnost

Dostupnost kvalitetnih otvorenih modela raznih veličina promenila je fokus enterprise organizacija sa problematike razvoja i treniranja sopstvenih modela na prilagođavanje i izvršavanje otvorenih modela i njihovu integraciju u svoje procese i aplikacije. Cilj organizacija postaje ostvarenje Models-as-a-Service (MaaS) koncepta – pružanja AI modela kao deljene usluge korisnicima i aplikacijama u organizaciji. Jedna od ideja MaaS-a je da kompanijama omogući interno korišćenje tipičnih AI obrazaca, poput RAG-a, agenata i koding asistenata, bez potrebe da treniraju sopstvene modele ili koriste komercijalne AI servise. Umesto toga, mogu koristiti otvorene modele, u originalnoj formi ili dodatno fino podešene i prilagođene specifičnoj nameni. Platformski timovi ove modele ostatku organizacije daju na raspolaganje preko API-ja, tipično kompatibilnog sa OpenAI API specifikacijom. MaaS slagalica ima više delova: od modela, preko AI platforme, integrativnih komponenata (npr. rešenja za API Management, Single Sign-On i sl.) i aplikacija kao konzumenata. AI platforma, sa jedne strane, treba da omogući prilagođavanje i optimizaciju modela, a sa druge njihov efikasni inferencing – fazu izvršavanja modela, kada on analizira primljene inpute i generiše odgovore na bazi naučenog. Defakto standard u ovom domenu je vLLM, open source projekat koji je originalno razvijen na Univerzitetu Kalifornije u Berkliju, a danas pokreće razne enterprise AI platforme, poput OpenShift AI-ja. VLLM poseduje više inference optimizacija sa ciljem izvlačenja maksimuma iz hardvera na raspolaganju, podršku za različite hardverske GPU i TPU akceleratore, OpenAI kompatibilan API, a moguće ga je pokrenuti na različitim infrastrukturama, od Linux servera do Kubernetesa.

Modeli za široke MaaSe

Elementi Models-as-a-Service koncepta (Izvor: Red Hat, AI at scale, without the price tag: Why enterprises are turning to Models-as-a-Service

AI demokratizacija

Kod MaaS-a do izražaja dolaze prednosti koje otvoreni modeli pružaju organizacijama u odnosu na zatvorene. Prva je predvidljivost troškova, jer kompanije nisu izložene promenama cena API-ja i ograničenjima upotrebe komercijalnih servisa. Sledeća je bezbednost, jer osetljivi podaci ne moraju napuštati infrastrukturu organizacije. Tu je zatim i fleksibilnost – model se može modifikovati i optimizovati za specifične primene, što nije izvodljivo sa zatvorenim alternativama. Mali modeli pokazali su se kao pragmatičan izbor za enterprise primene, koje često ne zahtevaju punu širinu znanja i mogućnosti koje veliki modeli pružaju. Tako četbot za korisničku podršku treba da poseduje duboko znanje o proizvodima i procesima jedne kompanije, ali ne mora da piše poeziju ili rešava složene matematičke probleme. Fokusirani pristup malih modela često rezultuje boljim performansama na specijalizovanim zadacima u poređenju sa korišćenjem većih modela opšte namene. Zajednica koja se oformila oko otvorenih modela stvorila je ozbiljne ekosisteme alata, fine-tuned modela i znanja koji kompanijama značajno spuštaju prag za ulazak u AI sferu. Organizacije često mogu da pronađu modele već optimizovane za svoje specifične slučajeve korišćenja ili industrijske vertikale. Jedan od primera je i Red Hat AI skladište modela (https://huggingface.co/RedHatAI), koje sadrži više optimizovanih i validiranih otvorenih modela, spremnih za preuzimanje i pokretanje pomoću vLLM-a. Evolucija malih i otvorenih modela otvara nove mogućnosti za kompanije svih industrija da koriste AI na načine koji su ranije bili dostupni samo tehnološkim gigantima. Ova AI demokratizacija predstavlja fundamentalnu promenu od AI kao servisa kontrolisanog od strane nekoliko velikih igrača ka AI kao široko dostupnoj tehnologiji, kojom organizacije mogu da upravljaju i prilagođavaju sopstvenim potrebama i vrednostima.

Autor: Nebojša Ilić, COMING