Određivanje razvojnih potreba lidera u HPC-u za buduće okruženje koji bi ubrzalo HPC i AI

0
81
odredjivanje-razvojnih-potreba-lidera-u-hpc-u-za-buduce-okruzenje-koji-bi-ubrzalo-hpc-i-ai

Visokoperformantno računarstvo (HPC) igra ključnu ulogu u napretku naučnih istraživanja decenijama. Koristi veoma velike skupove podataka i složene modele koji oponašaju fizički svet. Sve više napreduje mogućnost da se snaga i mogućnosti HPC-a dopunjuju veštačkom inteligencijom (AI), kako bi se ubrzali inovacije i postigli brži rezultati.

Imao/la sam priliku da razgovaram sa Radhikom Rao, višom direktoricom upravljanja podacima o grafičkim procesorima u centrima podataka u Intelu, kako bi smo razgovarali o ovoj transformaciji AI-a i njenom uticaju na HPC pejzaž.

U poslednjoj godini smo svedoci eksplozivnog rasta upotrebe AI-a u svim industrijama. U HPC-u smo dostigli trenutak ključan za konvergenciju pravog HPC-a i AI-ja. O tome smo pričali već dugo vreme, ali sada to zaista vidimo. AI pomaže u unapređivanju modela i kodova iz fizike, meteorologije, proizvodnje i mnogih drugih oblasti.

Ono što čini ovu konvergenciju tako važnom sada je to što je AI postao mainstream zahvaljujući popularnosti i širokoj primeni ChatGPT-a (veći jezički modeli) i generativne AI. Ovaj trend čini važnim posmatrati HPC i AI kao konvergentni prostor koji pokreće napredak nauke.

Lideri HPC-a trebaju razmotriti evoluirane zahteve prilikom donošenja odluke o ulaganju u okruženja sledeće generacije za ubrzavanje HPC i AI. Tradicionalno, tereti HPC-a imali su veoma specifičan odnos između CPU-a i GPU-a i računske profile. U poslednjih nekoliko godina, ovi modeli su se promenili i postali mnogo dinamičniji sa povećanim zahtevima za računanjem i skaliranjem. Kao rezultat toga, postala je bitna fleksibilnost arhitekture kako bi se pokretali ovi podaci-intenzivni tereti preko heterogenih okruženja, kao i potreba za povećanom širinom i kapacitetom memorije. Takođe treba razmotriti zahteve održivosti u vezi sa snabdevanjem energijom i uticajem na životnu sredinu. Prilikom izgradnje velikih klastera koji rešavaju probleme kao što je klimatske promene i održivost, ne želite biti deo problema. Moramo razmotriti otisak održivosti centra za podatke i nove tehnološke investicije kako bismo osigurali da ne stvaraju negativan uticaj na životnu sredinu.

Introvizacija Intela se proširila kako bi se obuhvatila ovu konvergenciju HPC-a i AI-ja. CPU-i, a posebno tehnologije Intel x86 procesora iz Intela, već decenijama su temelj HPC sistema. Sada vidimo moćne AI mogućnosti koje se ugrađuju u svaki aspekt računanja, uključujući i HPC prostor. CPU-a Intela se sada dopunjuje raznim integrisanim i diskretnim ubrzivačima i GPU-ima. Na primer, ugrađene napredne matrice (AMX) koje su ugrađene u 4. generaciji Intel Xeon Scalable procesora pružaju 10 puta veću izvođenje i obuku. Intel podatkovni centar GPU Max Series donosi do 2 puta veći performans na HPC i AI teretima u odnosu na konkurenciju. Nedavni rezultati MLPerf AI inferencije ističu da je Intel Gaudi4 akcelerator jedina alternativa na tržištu za posvećene AI računske potrebe. Intel je takođe jedini snabdjevač koji je podneo rezultate javnog CPU testiranja na 4. generaciji Intel Xeon i Intel Xeon Max seriji sa softverom ekosistema standarda industrije za duboko učenje.

Naša ponuda podržana je kompletnim skupom razvojnih alata za AI i HPC softver. Razvojni programeri su tradicionalno bili prinuđeni da koriste vlasnički softver za kodiranje i pokretanje AI i HPC modela koji su specifični za svaku platformu. Sa novim nizom softvera otvorenog koda, poput Intel oneAPI toolkit-a, programeri sada imaju slobodu izbora. Oni mogu programirati jednom, a zatim pokrenuti kod na različitom hardveru, čak promeniti različite kombinacije hardvera tokom vremena kako bi odgovarali potrebama određenog tereta. Model programiranja oneAPI podržava potpuni hardverski portfelj Intela, kao i rešenja konkurencije.

Činjenica da se HPC i AI konvergiraju u jedan sistem napredne naučne istraživanja je ključna. Jedan od primera je rad koji obavljamo sa superkompjuterom Aurora Exascale na Argonne Leadership Computing Facility (ALCF), objektom za korisničke kapacitete na Argonne Nacionalnom laboratoriji koji podržava Ministarstvo energetike SAD-a. Aurora, koja je zasnovana na potpunim Intel Max serijama CPU-a i GPU-a, će istraživačima pružiti visoku brzinu računanja i sposobnosti veštačke inteligencije koje nisu trenutno moguće. Intel i Argonne Nacionalni laboratorij su prethodno ove godine objavili specifikacije i napore vezane za Auroru (sa partnerima) kako bi doveli moć generativne AI i velikih jezičkih modela (LLM) na polje nauke i društvo.

Pored Aurore, puno se radi na spajanju HPC i AI. Imamo nekoliko softverskih partnera koji koriste oneAPI na Intel hardveru kako bi uveli AI u mnoge specifične primene za HPC. Jedan primer je Ansys, koji kombinuje snagu Intel Max serija GPU-a i 4. generaciju Intel Xeon procesora kako bi dodao AI mogućnosti u svoje aplikacije. Takođe smo duboko uključeni u AI i HPC softverski ekosistem, optimizacija popularnih alata za razvoj kao što su Pytorch i Tensorflow.

Kada dodajete AI sposobnosti u HPC okruženje, poslednja stvar koju neko želi je da snosi dodatne troškove ili iskusi kašnjenja zbog kompleksnog kodiranja koji mora biti prebačen sa jednog modela programiranja na drugi. Intel je uložio značajna sredstva kako bi razvio hardver i softver neophodne za pokretanje, skaliranje i zaštitu investicija u modernim HPC centrima. Konvergencija HPC-a i AI-a čini još važnijim usvajanje otvorenih standarda, poput oneAPI-ja, kako bi istraživači mogli da se usredsrede na brže i preciznije dostavljanje naučnih otkrića.

Jedan od najnovijih načina na koji mogu se izgraditi, testirati i optimizirati AI i HPC aplikacija jeste na nedavno pokrenutom Intel Developer Cloud-u. Intel Developer Cloud pruža programerima pristup najnovijim Intel HPC i AI tehnologijama, uključujući Intel Gaudi4 procesore.

Read More