Hei! Verkkopalvelussamme käytetään evästeitä ja muita vastaavia työkaluja. Lisäksi seuraamme kävijäliikennettä anonyymisti. Voit sallia välttämättömät evästeet, tietyt evästeet tai kaikki evästeet. Lue lisää tietosuojaselosteestamme
Etusivu > Kaikki artikkelit > Medaffconin koneoppimisalgoritmi mukautuu erilaisiin tutkimustarpeisiin
Medaffconin koneoppimisalgoritmi mukautuu erilaisiin tutkimustarpeisiin
Koneoppimisalgoritmi kehitettiin alun perin poimimaan tupakointitietoja potilasteksteistä, jotta voitiin analysoida tupakoinnin vaikutuksia leikkauksen jälkeisiin komplikaatioihin. Nykyään sitä hyödynnetään myös keuhkosyöpätutkimuksessa.
Medaffcon hyödynsi algoritmia ensin tutkimuksessa, johon osallistui puoli miljoonaa Helsingin yliopistollisessa sairaalassa (HUS) leikattua potilasta. Tupakoinnin tunnistaminen potilastiedoista saattaa kuulostaa yksinkertaiselta, mutta käytännössä se ei ole sitä. Tupakointiin liittyvät tiedot eivät ole strukturoituja, vaan ne on kirjattu vapaana tekstinä laajoihin potilasasiakirjoihin. Haasteena on: miten tupakointitilanne voidaan tehokkaasti poimia valtavasta tekstimäärästä?
Medaffcon ja tutkimusryhmä kehittivät koneoppimiseen perustuvan luokittelijan, joka auttaa tietojen analysoinnissa. Mallin kouluttamiseksi kliiniset asiantuntijat luokittelivat manuaalisesti yhteensä 20 000 tupakointiin liittyvää lausetta. Kaksi kliinistä asiantuntijaa suoritti tämän tehtävän yhdessä päivässä Medaffconin esikäsittelytekniikoiden ja erikoistyökalujen tukemana. Tämän jälkeen analysoitiin ja luokiteltiin yhteensä puoli miljoonaa tupakointiin liittyvää lausetta koneoppimisalgoritmin avulla.
Olivia Hölsän mukaan skaalautuvuus edellyttää, että algoritmi koulutetaan riittävän suurella ja monipuolisella populaatiolla.
”Kehittämämme algoritmi perustuu suureen ja edustavaan potilaskohorttiin, johon kuuluu monenlaisia potilaita.”
Hölsä kertoo, että tästä syystä Medaffconin koneoppimismalli on riittävän vankka analysoimaan sekä suuria potilaspopulaatioita että tarkempia potilaiden alaryhmiä.
”Koneoppimisessa on ratkaisevan tärkeää varmistaa, että harjoitustiedot on johdonmukaisesti merkitty ja verrattavissa todelliseen dataan, jolle malli on tarkoitettu, jotta malli voi tulkita oikein ja poimia asiaankuuluvaa tietoa kliinisestä dokumentaatiosta.”
Hölsä sanoo, että olisi myös mielenkiintoista verrata tietylle potilasryhmälle kehitettyjä koneoppimismalleja eri yliopistosairaaloissa Suomessa, jotta voitaisiin arvioida, kuinka skaalautuvia mallit ovat eri alueilla.
Kun koneoppimismallia skaalataan erilaisiin tutkimustarpeisiin, on tärkeää varmistaa joustavuus ja välttää sen liiallinen sovittaminen yhteen tiettyyn käyttötarkoitukseen.
”Esimerkiksi tupakoinnin osalta on otettava huomioon, että tupakointitilanne voi muuttua ajan myötä. Henkilö voi olla tupakoitsija, mutta lopettaa myöhemmin tupakoinnin. Siksi malliin pitäisi pystyä sisällyttämään ajalliset rajoitukset.”
Laaja asiantuntemus RWE-tutkimuksessa
Laadukkaat tiedot ovat olennaisen tärkeitä tehokkaan koneoppimismallin kehittämiseksi. Medaffconilla on laaja kokemus Real-World Evidence (RWE) -tutkimuksista. Tämän ansiosta sen asiantuntijat tuntevat luotettavat tietolähteet ja osaavat ottaa huomioon kriittiset tekijät tiedonkeruun aikana.
”Ymmärrämme, missä tiedot on dokumentoitu ja mitä tietoja on saatavilla. Tiedämme, mitä kysymyksiä kliinikoilta kannattaa kysyä tietojen syöttämisestä, ja osaamme määritellä tarvittavat tiedot tiedonkeruuta varten.”
Hölsä korostaa, että on tärkeää tunnistaa tietojen rajoitukset. Kiinnostavat tiedot voivat olla tallennettuna esimerkiksi eri terveydenhuoltojärjestelmissä, kuten tietyt laboratoriokokeet, jotka tehdään perusterveydenhuollossa eikä erikoissairaanhoidossa. Tämä on otettava huomioon jo varhaisessa vaiheessa tutkimuksen suunnittelua, mukaan lukien tiedonkeruuta koskevat määrittelyt, ja sitä on tarkasteltava edelleen mallin kehittämisen aikana.
Tupakointistatuksen lisäksi muita hoitoon liittyviä kriittisiä tekijöitä, kuten syövän etenemistä ja etäpesäkkeitä, dokumentoidaan edelleen rakenteettomasti. Hölsän mukaan koneoppimista voitaisiin käyttää tehokkaasti näiden tietojen analysoimiseen ja arvokkaiden oivallusten poimimiseen.
Olivia aloitti Medaffconilla diplomityöntekijänä kesällä 2021 ja viimeistelee bioinformatiikan ja digitaalisen terveydenhuollon opintoja Aalto-yliopistossa. Ennen Medaffconille siirtymistä hän on toiminut opetus- ja kurssiassistenttina yliopistolla opintojen ohessa. Hän ymmärtää hyvin monimutkaisiakin asiakokonaisuuksia, on oma-aloitteinen, ja hänellä on analyyttinen ja ratkaisukeskeinen työskentelyote.
Alassa häntä kiehtoo sosiaali- ja terveydenhuollon tuottaman monipuolisen tiedon tuominen yhteen ja sen analysointi päätöksenteon tueksi sotepalvelujen kehittämisessä sekä resurssien järkevässä kohdentamisessa.
Iiro aloitti Medaffconilla tilastotieteen asiantuntijatehtävissä maaliskuussa 2017. Ennen tätä hän on toiminut neljä vuotta tutkimusassistenttina akateemisessa tutkimusryhmässä analysoiden kliinistä ja geneettistä potilasdataa. Koulutukseltaan Iiro on bioinformaatioteknologian diplomi-insinööri.
Iiron vahvuuksiin kuuluu tilastotieteen ja data-analyysin vahva tuntemus ja hands-on kokemus sensitiivisen potilasdatan kanssa työskentelystä, sekä poikkitieteellinen kommunikaatio eri alan asiantuntijoiden välillä. Alalla Iiroa kiinnostaa erityisesti teknologian murroksen avaamat suuret datamäärät ja se, kuinka tästä datasta saatavaa tietoa voidaan potentiaalisesti hyödyntää konkreettisten johtopäätösten tekoon, niin sairauksien luonteen ymmärtämiseksi kuin lääketeollisuuden tavoitteiden ja potilaiden hoidon edistämiseksi.
”Koneoppiminen ja tekoälypohjaiset työkalut mullistavat terveydenhuoltoa nyt ja tulevaisuudessa, mutta näitäkin tärkeämpää on saattaa jo olemassa oleva terveysdata tehokkaaseen käyttöön terveyden edistämiseksi.”