Koneoppimisella lääkeaineiden nopeaa virtuaaliseulontaa
Aika seulonnassa lyheni yli 90 prosenttia.
Itä-Suomen yliopisto, Orion ja Tieteen tietotekniikan keskus CSC ovat toteuttaneet yhden maailman suurimmista lääkeaineiden virtuaaliseulontakokeista. Seulonnassa käsiteltiin kaikkiaan 1,56 miljardia yhdistettä. Koneoppimisen avulla virtuaaliseulonta voitiin toteuttaa yli 90 prosenttia lyhyemmässä ajassa (Sivula T ym. J Chem Inf Model 1.9.2023 ).
Uusien lääkemolekyylien löytämiseksi tutkijat käyttävät usein tietokoneavusteista seulontaa. Viime vuosina tietokannat ovat kasvaneet niin nopeasti, ettei tietokoneiden seulontanopeus ole pysynyt perässä. Etsittäessä vaikka vain yhteen lääkekohteeseen sopivia molekyylejä miljardeja yhdisteitä sisältävistä tietokannoista seulonta voi kestää useita kuukausia tai jopa vuosia. Siksi nopeampia lähestymistapoja tarvitaan kiireellisesti.
Tutkimuksen lähtökohtana oli havainto, että perinteisellä seulonnalla 1,56 miljardin yhdisteen -käsittelyyn kului aikaa noin puoli vuotta, kun käytettiin CSC:n Mahti- ja Puhti-supertietokoneita. Tässä perinteisessä seulonnassa molekyylejä ”telakoitiin” kohdeproteiinin sitoutumisalueelle ja kustakin telakoinnista laskettiin pisteytys, joka kuvasi kyseisen yhdisteen sopivuutta sitoutumisalueeseen. Tutkimuksen ensimmäisen vaiheen tuloksena oli siis kaikille 1,56 miljardille molekyylille laskettu telakointi ja sitä vastaava pisteytysarvo.
– Tulosten perusteella koneoppimisella pystytään luotettavasti ja toistettavasti löytämään lähes kaikki perinteisellä telakoinnilla tunnistettavista yhdisteistä, mutta merkittävästi nopeammassa ajassa, sanoo tutkijatohtori Ina Pöhner Itä-Suomen yliopistosta tiedotteessa.