• 04.09.20, 07:00

Arvuti õpib mõistma meie terviseandmeid

Tehisintellektile on meditsiinis pandud suur lootus. Eestis tegutsetakse mitmel rindel: paralleelselt geeniandmete rakendatavaks muutmisega käib töö tervise infosüsteemi kaasajastamiseks, et inimeste terviseandmed oleksid arvutile mõistetavamad.
TalTechi Infotehnoloogia teaduskonna professor radioloog Peeter Ross.
  • TalTechi Infotehnoloogia teaduskonna professor radioloog Peeter Ross. Foto: Raul Mee
Tehisintellektil võiks olla tervishoius erinevaid rakendusi, usuvad teadlased. Esile on toodud tehisintellekti võimekust mahukate andmete töötlemisel, sh ravimiarenduses, kirurgias kasutatavate robotite osavust või ka näiteks arvutite paremust pildituvastuses. Radioloogia on üks neist valdkondadest, kus räägitakse tehisintellekti edulugudest. Ent TalTechi Infotehnoloogia teaduskonna professor radioloog Peeter Ross tunnistab, et on tehisintellekti meditsiinis rakendamise osas muutunud skeptiliseks.
Ta leiab, et ootused on olnud liialt suured ning ajal, mil kõrgematel korrustel juba töö käib, on vundament alles kindlustamata. Nii kogeb ta arstitöös sageli, et patsiendi haigusloost on puudu elementaarne info, mistõttu ei saa otsuseid teha ei inimene ega ka arvuti.
Ross oli 12 aastat tagasi seotud tervise infosüsteemi (TIS) välja töötamisega ja osaleb ka ettevalmistustes, mida tehakse praegu TIS uuendamiseks. Ta tõdeb, et TISi üles ehitades alahinnati andmete struktureerimise ja standardiseerimise vajadust, mis on aga eelduseks, et tehisintellekt saaks inimmõistusele appi tulla.
“Arvutit, vaatamata kõikidele näidetele selle kohta, et see on valmis ise õppima, õpetab ikkagi inimene. Selleks tuleb see, mida õpetatakse, panna numbritesse, sest arvuti ei saa muust aru kui nullidest ja ühtedest,” selgitab Ross. Seega on vaja kokku leppida, et nii kaebuseid, leide kui ka diagnoose kodeeritaks ühtmoodi. Selleni jõudmine pole Rossi sõnul sugugi kerge.
Pealegi on asju, mida arst saab edasi anda üksnes vabatekstina. Seni aga arvutid vabatekstis esitatud andmeid kasutada ei saa, kuna ei mõista konteksti.
Ross toob näiteks hiljuti kasutusele võetud perearstide otsustustoe, kus süsteem väitis arstile, et patsiendil on Lyme´i tõbi. Kui hakati lähemalt uurima, mille alusel arvuti seda väidab, siis selgus, et patsiendi haigusloosse oli kümmekond aastat tagasi märgitud puukborrelioosi võimalikkus küsimärgiga, ent laboratoorset kinnitust ei olnud.
Teises näites andis arvuti perearstile aga soovituse kutsuda kontrolli hüpertensiooni patsient, kellele arvuti andmeil ei olnud juba üle aasta vererõhku mõõdetud. Tegelikkuses oli seda tehtud paar nädalat tagasi, ent sel korral ei leidnud tehisintellekt seda teavet vabatekstist üles.
Häid näiteid on ka võtta
Positiivsena toob Ross esile ravimite koostoimete registri, mis kasutab väga lihtsaid kodeeritud andmeid ning mille töökvaliteet on Rossi sõnul “super”.
Lootustandev on ka TISist andmeid saava koroonaäpi HOIA allalaadimiste arv, seda tõmmati esimeste päevadega kümnetesse tuhandetesse telefonidesse. Suuremaid tõrkeid pole rakenduse käivitamine kaasa toonud.
Et otsustustoed saaks hakata arstidele ja õdedele sama head nõu andma, tuleb samm-sammult liikuda selles suunas, et andmeid aina enam struktureerida.
Töö selles suunas käib. Tänavu juunis moodustati uue põlvkonna tervise infosüsteemi (upTIS) projekti juhtrühm, kes hakkab vedama TIS kaasajastamist. Võtmesõnaks on seejuures andmekvaliteet ja selle parandamine, ütleb Taavi Annus, sotsiaalministeeriumi nutika arengu toetamise osakonna nõunik.
Masina jaoks on vaja struktureerida
TISi üks kaasajastamise eesmärke on just erinevate otsustustugede jaoks eelduste loomine. “Soovime, et nii riigil kui ka erasektori arendajatel oleks uute lahenduste loomisel kvaliteetsed terviseandmed, mis on võimalikult suurel määral masinmõistetavad,” selgitab Annus. Ta täiendab, et masinmõistetavuse vaatest oleks ideaalne, kui kogu tekst oleks struktureeritud ja kodeeritud. Samas tuleb meeles pidada, et süsteem teenindab reaalset kliinilist protsessi ning see peab sobituma tervishoiuspetsialistide töövoogu.
Nii tõdeb ka Annus, et lõpuni pole võimalik kõiki andmevälju struktureerida ning paratamatult jääb teatud osakaal vabatekstile. “Süsteem, mis panustab liigselt struktureeritud ja kodeeritud andmestiku kogumisse, muudab tervishoiuteenuse dokumenteerimise protsessi ajamahukamaks ja keerukamaks,” selgitab ta. Seetõttu soovitakse koostöös erialaspetsialistidega leida optimaalne tasakaal kodeerimise ja vabateksti vahel ning tagada, et oluliste andmestike puhul oleks andmed masinmõistetavad.
Suuremad muutused 2023. aastal
Andmete masinmõistetavuse kasvatamiseks on kavas juurutada enam rahvusvahelisi terminoloogiaid ja töötada välja efektiivsemaid lahendusi andmete kvaliteedi kontrollimiseks, et enamik andmestikus esinevatest võimalikest vigadest saaksid parandatud juba enne tervise infosüsteemi jõudmist.
Annuse sõnul on TISiga seotud teenustest esimesed planeeritud valmima järgmise aasta lõpus, aga suuremad muudatused loodetakse teha 2023. aasta lõpuks.
Aasta 2023 on ka projekti “Personaalmeditsiini rakendamine Eestis” lõpptähtaeg. Geeniinfo tervishoiusüsteemis kättesaadavaks ja töödeldavaks muutmine viib arsti ja arvuti koostöö inimese terviseandmetega eeldatavasti veel tase kõrgemale kui võimaldavad praegu kliinilise töö käigus kogutavad andmed.
Hetkel on käimas kaks kliinilist juhtprojekti, mis Tervise Arengu Instituudi personaalmeditsiini projekti juht Helen Lepa sõnul on esimesteks olulisteks sammudeks personaalmeditsiini rakendamisel. Projektid, mis tegelevad rinnavähi ja südame-veresoonkonnahaiguste riskide avastamise ja sekkumismeetmete mõjususe hindamisega, pakuvad kaks võimalikku teaduslikult tõestatud kasutusviisi personaalmeditsiinis koos teenusmudeliga nende rakendamiseks tervishoius. Nendele teenustele lisaks on kavas kättesaadavaks muuta farmakogeneetiline lahendus ehk geeniinfost lähtuv personaalsete soovituste andmine ravimi väljakirjutamisel.
“Kui projektid lõpevad oodatavate tulemustega, s.t on loodud valmidus geeniinfot turvaliselt ja usaldusväärselt Eesti tervishoiusüsteemis kasutada ning tervishoiutöötajad on saanud lisakoolitust, on võimalik hakata personaalmeditsiini lähenemist Eesti tervishoius uute teenuste läbi laiendama,” ütleb Lepa.
Professor Peeter Ross märgib, et kuigi ta on skeptiline tehisintellektile seatud suurejooneliste ootuste täitumise osas, ei kahtle ta selles, et hästi struktureeritud andmeid töödeldes saab arvuti arstile appi tulla ja tööd lihtsustada: “Arvutit on kindlasti ja üha rohkem vaja. Paljud teadusartiklid ütlevad, et arst, kes arvutit ei oska kasutada, on tulevikus kaotaja.”
Mis on tehisintellekt?
Jaak Vilo, Tartu Ülikooli bioinformaatika professor
Tehisintellekt on viimasel ajal moesõna, mis kirjeldab peaaegu igasugust andmete analüüsi või arvutavat arvutiprogrammi. Mina kitsendaks tehisintellekti mõiste arvuti sellisele kasutusele, kus arvuti teeb järeldusi või otsuseid, kasutades selleks masinõpet, reeglite rakendamist, statistilist analüüsi, optimeerimist, planeerimist. Mahukate andmete analüüsis on paratamatult vaja kasutada arvuteid, et otsida mingeid signaale ja töödelda andmeid, millest inimese tööaeg üle ei käiks.
Masin on inimesest täpsem
Möödunud aasta lõpus läks Ida-Tallinna Keskhaigla esimesena Eestis üle digitaalsete mikropreparaatide igapäevasele analüüsile.
ITK patoloogiakeskuse juhataja Eero Semjonov.
  • ITK patoloogiakeskuse juhataja Eero Semjonov. Foto: Meeli Küttim
“Tehisintellekti tulekuga meie eriala töö muutub,” ütleb ITK patoloogiakeskuse juhataja Eero Semjonov. Ta kinnitab, et uus analüüsimeetod võimaldab kiiremaid ja täpsemaid diagnoose ning vähendab subjektiivsust. “Tänapäeva mõistes on patoloogia lihtne pildituvastamine: inimsilm on subjektiivne ega saa masina vastu. Masin on täpne, kiretu ja sõltumatu ning suudab sama tulemust lõputult korrata, kuid leiu tõlgendamine ja raviarstile vajaliku info edastamine on patoloogi ülesanne,” selgitab Semjonov.
Samas rõhutab ta, et arvuti ja tehnoloogia ei asenda patoloogi, vaid aitab kasutada kogu patoloogide olemasolevat potentsiaali.
Lisaväärtusena tuleb juurde suurenenud koostöö inimeste vahel: sama preparaati saavad korraga vaadata paljud patoloogid, toimuvad digitaalsed konsultatsioonid ja konsiiliumid. Semjonov on kindel, et peagi tekib Eestis digipatoloogia võrgustik.
Tehisintellekt võiks aidata tundma õppida koroonaviirust
Kogu maailmas pannakse tehisintellektile suuri ootusi koroonaviiruse uurimisel, ent takistuseks võib saada andmete kvaliteet ja võrreldavus.
Juuni alguses kirjutas ajakiri Nature teadlaste püüetest välja arendada tehisintellekt, mis analüüsiks COVID-19 teemal ilmunud teadusartikleid, mida tolleks ajaks oli maailmas ilmunud juba üle 28 000: kaugelt liiga palju selleks, et ükski teadlane suudaks need läbi töötada. Artiklis tõdetakse, et programm on alles välja töötamisel ning selle kasulikkus vajab veel tõestamist.
Tartu Ülikooli bioinformaatika professor Jaak Vilo, kes osales kevadel töögrupis, mis arvutas koroonaviiruse võimaliku kulgemise Eesti mudeleid, usub, et uue viiruse tundma õppimisel võiks andmeanalüüsist, masinõppest ja modelleerimisest abi olla, ent toob välja ka olulise kitsaskoha: “Üks globaalne takistus on kindlasti andmete kogumine võrreldavalt.”
Eri riikides tekkivad terviseandmed on koostatud eri keeltes, sageli kasutades erinevat kodeerimist, raviasutused koostavad andmeid eri infosüsteemides ja omavahel sageli erinevate protsesside tulemusel.
Sellegipoolest on Vilo seisukohal, et on hädavajalik andmeid omavahel võrrelda. Nii tehaksegi praegu ettevalmistusi terviseandmete rahvusvahelises koostöös analüüsimiseks ning selles osalevad ka Tartu Ülikooli teadlased. Projekti EHDEN eesmärk on jõuda Euroopas 100 miljoni patsiendi andmete viimisele OMOP (Observational Medical Outcomes Partnership) kujule.
“Lühidalt öeldes on eesmärk pakkuda välja üks andmebaasi mudel, millele iga organisatsioon või andmete valdaja saaks teisendada oma andmed, et need oleks paremini analüüsitavad ja vahetult võrreldavad,” selgitab Vilo.
Nii saab jagada sama tarkvara ja tehtavaid uuringuprotokolle. Andmete omanik vastutab enda andmete eest, kuid osaleb rahvusvahelises koostöös, rakendades samu analüüse. Analüüside lõpptulemused ja päringute koondstatistika ei sisalda siis enam privaatseid andmeid ning koondtabelid saab omavahel kokku tuua. Nii saab läbi viia sadu miljoneid patsiente hõlmavaid uuringuid.
Loe intervjuud Jaak Viloga täismahus SIIT.

Seotud lood

Hetkel kuum

Liitu uudiskirjaga

Telli uudiskiri ning saad oma postkasti päeva olulisemad uudised.

Tagasi Meditsiiniuudised esilehele