Ahhoz, hogy felgyorsuljanak a gyógyszeripari fejlesztések, érdemes bevetni a mesterséges intelligenciát, azonban egyes cégek gyakran visszatartják az adatokat, ezzel gátolva a technológiát.
A mesterséges intelligencia által nyújtott új lehetőségek idővel átalakíthatják a gyógyszerfejlesztést, ha sikerül javítani a biológiai és a kémiai adatok minőségét és mennyiségét. David Pardoe, a hamburgi Evotec vállalat vegyésze elmondta, hogy bár a ritka betegségek száma körülbelül hétezer, a modern orvostudomány 100 éve alatt ezek közül eddig csak mintegy 500-ra találtak gyógymódot.
Hozzátette, hogy a gyógyszerkutatás nemcsak rendkívül bonyolult folyamat, de túl sokáig is tart és túl drága. Elméletben azonban a mesterséges intelligencia mindezeket a problémákat orvosolhatja.
Az MI képes lehet modellezni egy gyógyszerjelölt molekula 3D-s geometriáját és atomi szerkezetét, valamint azt is, hogy az miként illeszkedik a kiszemelt fehérjébe. A terveket ezután úgy módosíthatják, hogy a potenciális gyógyszer hatékonyabb legyen, de egy algoritmus akár teljesen új célpontokat is azonosíthat. Emellett MI figyelembe veheti a gyógyszerek és célpontjaik közötti kölcsönhatások hátterét, vagyis a beteg szervezetének komplex biológiai környezetét.
A gyógyszer-innovációs folyamatot fellendítő rendszerek fejlesztésének a kulcsa a sok jó minőségű adat, és bár jó néhány ilyen áll rendelkezésre, nem biztos, hogy mind jó minőségű.
Az adatok egységesítése elengedhetetlen
A laboratóriumok gyakran eltérő módszereket, reagenseket és berendezéseket alkalmaznak, így az adatok között minimális eltérések is előfordulhatnak. Eric Durand, a párizsi Owkin AI biotechnológiai vállalat adattudományi igazgatója szerint nem lehet egyszerűen összevetni két különböző laboratórium által előállított adatkészletet, és azokat előzetes feldolgozás nélkül együtt elemezni. Ez azonban gyengíti sok olyan nagy, nyilvános adatbázis hasznosságát, amelyeket még az MI-forradalom előtt hoztak létre.
Egyes szakértők úgy vélik, hogy a mesterséges intelligencia számára szükséges rendezett adatok előállításának a legjobb módja az lenne, ha előre rögzítenék a kísérletek elvégzésének és dokumentálásának szabályait, vagyis létrehoznának egyfajta szabványt. A betegségek és a gének neveit például már a kezdetektől egységesíteni lehetne, illetve a kutatási protokollokat előzetesen össze kellene hangolni. Jó példa erre a 2016-ban indult Human Cell Atlas globális projekt, amely már emberek millióinak sejtjeit térképezte fel szigorúan sztenderdizált módon. Ez konzisztens adatokat eredményez, amelyek ideális alapot biztosítanak az MI-algoritmusok számára a lehetséges gyógyszercélpontok azonosításához.
Egy másik probléma, hogy az akadémiai kutatók számára gyakran nem előny, ha beszámolnak egy kísérlet sikertelenségéről – erre gyakran nem is kerül sor, és ez különösen problémás az MI alkalmazása szempontjából, hiszen a tudományos publikációkból származó, algoritmusokba betáplált adatok torz és idealizált képet festenek a biológiai folyamatról. Mivel jóval több adat áll rendelkezésre azokról az ígéretes vegyületekről, amelyek állatkísérletek során nem mutattak toxikus hatást, mint a sikertelen próbálkozásokról, egy gyógyszerfelfedezésre szánt MI-modell nagyrészt nélkülözni fogja a kudarcokból származó igen értékes információkat.
Az iparági adatok és a szakértelem megosztása különösen fontos
A gyógyszercégek nagy mennyiségű adatot őriznek, köztük az előbb említett sikertelen eredményeket is, és igyekeznek azokat olyan formában egységesíteni, ami ideális az MI-modellek számára. Ezeknek az adatoknak azonban csak kis része kerül nyilvánosságra. Becslések szerint szerint a nyitottabb gyógyszeripari cégek is csupán az adataik 15-30 százalékát teszik közzé, de a klinikai vizsgálatok esetében is legfeljebb 50 százalékos ez az arány.
A gyógyszeripari vállalatok jól tudják, hogy milyen értékesek az általuk birtokolt adatok. Vas Narasimhan, a bázeli Novartis vezérigazgatója már 2018-ban úgy fogalmazott, hogy a cég nemcsak gyógyszeripari, hanem adattudományi vállalat is, mivel az MI-t aktívan beépíti a gyógyszerkutatásba. De mivel ezek az adatok kulcsfontosságúak az MI-alapú kutatásokhoz, és versenyelőnyt jelentenek, a legtöbb cég nem szívesen osztja meg azokat sem az akadémiai szférával, sem más vállalatokkal.
Többet kihozni a meglévő adatokból
Néhány kutató szerint a mesterséges intelligencia alkalmazásának nehézségei a gyógyszerkutatásban részben az adatok mennyiségével és azok hatékonyabb feldolgozásával áthidalhatók lennének. „Ha elegendő adat áll rendelkezésre, az MI képes lesz általános következtetéseket levonni” – mondta Alex Zhavoronkov, a bostoni székhelyű, mesterséges intelligenciára épülő biotechnológiai vállalat, az Insilico Medicine alapítója és vezérigazgatója.
Az Insilico Medicine összekapcsolja az amerikai kormány milliárddolláros kutatási támogatásainak eredményeként született adatokat az egyéb tudományos publikációkkal, klinikai vizsgálatokkal, szabadalmakkal, valamint genetikai és kémiai adatbázisokkal. „A modern MI-eszközök lehetővé teszik, hogy visszakövessük az innovációt egészen a kutatási támogatásig” – magyarázta Zhavoronkov.
Ezután az összegyűjtött adatokat tovább elemzik. Az Insilicónál ez például azt jelenti, hogy az algoritmusok pontszámokat rendelnek bizonyos eredményekhez, segítve azok súlyozását és megbízhatóságának értékelését. „Van egy eszközünk, amely figyelembe veszi a cikket publikáló tudós hitelességét – mondta Zhavoronkov. – Ha valaki korábban hamis adatokat közölt, akkor nagyobb eséllyel újra téves információkat fog megjelentetni.” Az Insilico még a részvényárfolyamok alakulását is figyeli a klinikai vizsgálatok bejelentése után. Ha az árfolyam hirtelen zuhan, abból arra következtetnek, hogy a vizsgálati eredmények valószínűleg kedvezőtlenek voltak – függetlenül attól, hogy mit állít az adott vállalat.
Az Insilico fejlesztései már gyakorlati eredményeket is hoztak: 2019 végén az MI-alapú gyógyszerkutatási platformjuk, a PandaOmics felfedezett egy új célpontot a fibrotikus betegségek – vagyis a túlzott hegszövetképződés – kezelésére. Ezt követően a Chemistry42 nevű generatív MI-modelljük segítségével olyan vegyületeket kerestek, amelyek képesek blokkolni ezt a célpontot. Az algoritmus hatalmas adatbázisokból – például a manuálisan szerkesztett kémiai adathalmazból, a ChEMBL-ből – tanulmányozza a meglévő molekulákat, felismeri a kémiai szerkezetek közötti mintázatokat, és képes új, potenciálisan hatékony gyógyszereket tervezni.
Kapcsolódó: