Kínai kutatók egy olyan nagy teljesítményű algoritmust fejlesztettek, amely képes összetett tervezési problémákat megoldani az általános GPU-k esetében. Az algoritmus 800-szorosára növeli az Nvidia GPU teljesítményét a tudományos számítástechnikában
A fejlesztést a moszkvai Lomonoszov Egyetem és a kínai Institute of Technology által létrehozott sencseni MSU-BIT egyetem kutatócsapata végezte. Az új algoritmus növeli a peridinamikai számítási hatékonyságot. Ez a csúcstechnológia a különböző fizikai problémák, mint a repedések, a sérülések és az egyéb törések vizsgálatában és azok megoldásában segít. Ezáltal új lehetőségeket nyit meg az összetett mechanikai problémák megoldásában számos iparágban, így az űr- és a katonai technológiákban, valamint az olyan, széles körben elérhető chipek esetében, amelyek olcsók és nem esnek az amerikai szankciók hatálya alá.
Miért fontos az elért áttörés?
A peridinamika (PD) döntő szerepet játszik az anyagtörés és -károsodás elemzésében. A repülőgépiparban a gép anyagán a különböző hatásokra bekövetkező repedések terjedésének modellezésére használják. A cél az, hogy pontosabb biztonsági előrejelzéseket tudjanak készíteni a repülőgép-szerkezetek számára. A civil tervezésben ugyanilyen célra használják hidak vagy épületek esetében – például a szeizmikus rengések okozta sérülések folyamat-előrejelzése esetén, amellyel a földrengésbiztos tervezést tudják fejleszteni.
A PD-t a katonai felszerelések korszerűsítésénél is alkalmazzák. A ballisztikai és robbanóanyag-kutatásban például a nagy erejű ütközés esetén bekövetkező repedési és anyagtörési folyamatokat képesek modellezni vele.
A peridinamika előnyösnek bizonyult az anyagkárosodások modellezésében, de a számítási komplexitás miatt nem volt gazdaságos nagyobb szimulációkban használni, többek között a nagy memóriahasználat és a lassú feldolgozási sebesség miatt.
E kihívások megoldására Jang Jang egyetemi docens az Nvidia CUDA programozási technológiáját használta fel a PD-General keretrendszerének létrehozásához. A chip egyedi felépítésének alapos elemzésével csapata a feladathoz optimalizálta az algoritmusok tervezését és a memóriakezelést, ami figyelemre méltó teljesítménynövekedést eredményezett. Kutatásukat a Chinese Journal of Computational Mechanics című folyóiratban tették közzé januárban.
Az ilyen hatékony számítási képességek lehetővé teszik a kutatók számára, hogy pár órára – vagy akár percekre – csökkentsék az egyébként napokig is eltartó számolási műveletek idejét. Mindezt egy átlagos, otthoni felhasználású GPU használatával, ami jelentős haladás a PD-kutatásban”
– írta Jang.
800-szor hatékonyabb, mint a hagyományos algoritmusok
A PD-General keretrendszer a hagyományos szériához képest 800-szor gyorsabb egy átlagos Nvidia GeForce RTX 4070 modellel. Az algoritmus a széles körben használt OpenMP programokkal összehasonlítva is 100-szoros sebességnövekedést mutatott. A több millió részecskét tartalmazó szimulációkban a PD-General mindössze öt perc alatt 4 ezer iterációs lépést tud elvégezni. A kétdimenziós, egytengelyű húzó-szakító vizsgálatoknál – amelyeket a legnagyobb számítási léptékűnek tartanak – a keretrendszer 69,85 millió iterációt dolgozott fel kevesebb mint két perc alatt.
Az iteráció jelentése fokozatos közelítés, méghozzá valamilyen eljárás egyre pontosabb értéket adó többszöri ismételgetésével.
Az OpenMP az Open Multi-Processing rövidítése. Ez egy direktívaalapú alkalmazásprogramozási felület (API) párhuzamos programok fejlesztéséhez megosztott memóriastruktúrákban. Az OpenMP API számos platformon támogatja a megosztott memóriájú párhuzamos programozást C/C++ és Fortran nyelven.
A szakítóvizsgálatokról bővebben itt lehet olvasni.
A GPU-hardverek folyamatos fejlesztésével a PD-General keretrendszer a jövőben még nagyobb számítási hatékonyságot eredményezhet, ami tovább növeli az összetettebb mechanikai problémák megoldásának és a számítási mechanika alkalmazási területeinek a bővítési lehetőségeit.
(Forrás: South China Morning Post)
Kapcsolódó:
Címlapfotó: Dreamstime