Att använda sig av syntetiska data är en metod som gör det möjligt att forska på stora mängder patientdata, utan att inkräkta på patienternas integritet. Syntetiska data är utformade så att de efterliknar verkliga data, men är frikopplade från verkliga individer.
Syntetiska patientresor ger forskningen nya verktyg
Artificiell intelligens Kan patientens vårddata användas inom forskningen, utan att man samtidigt inkräktar på den personliga integriteten? I en nyligen publicerad studie har forskare visat hur detta är möjligt.
Någonting är fel
Läs vidare – starta din prenumeration
Det gör det möjligt att dela informationen mellan vårdgivare, akademiker och privata intressenter, utan att känslig eller personligt identifierbar information läcker ut.
Förutsäger komplexa händelser
Men vårdens data är komplexa. Går det verkligen att efterlikna data i patientjournaler där variationer i patientresor i stort sett är oändliga?
Det är frågan som Erik Brandt, chefsanalytiker på Shaarpec och hans kollegor utforskat i en studie nyligen publicerad i Nature Digital Medicine.
Genom att kombinera två metoder för artificiell intelligens i en algoritm, har teamet utvecklat en modell som skapar syntetiska patientresor som troget efterliknar de komplexa och i det närmaste oändliga utfall som den verkliga vårddatan ger upphov till.
– Artikeln i Nature Digital Medicine bevisar vår hypotes om att vi löst problemet med de oändliga variationerna av originaldata som finns i till exempel patientjournaler, säger Erik Brandt.
Modell för syntetiska patientresor
Men hur går det då till? Förenklat beskrivet så har Erik Brandt och hans medförfattare kombinerat två metoder för artificiell intelligens i en algoritm. Först har de genererat en tidslinje över patientens besök med så kallade återkopplade artificiella neuronnät.
I nästa steg används ett annat, separat, neuronnät som lär sig generera den stora mängd utfall som kan uppstå vid varje enskilt patientbesök. Det som händer vid det första patientbesöket följer med och påverkar vad som händer vid nästa besök samtidigt som icke-kausala samband, till exempel åkommor som helt saknar beröringspunkter, inte följer med i beräkningarna.
Den vetenskapliga artikeln slår fast att att modellen kan lära sig hur patientresans struktur ser ut och därmed skapa syntetisk data som efterliknar originaldatan på olika sätt, utan att avslöja patienternas identitet.
Träna på verklig data
Eldprovet blir att träna nya AI-modeller på syntetiska data som blir lika högkvalitativa som om de tränats på originaldata.
– Nu har vi vetenskapligt bevisat att man kan ta vår modell, ta den till en region eller sjukhus och syntetisera och träna data från patientjournaler på plats. Det känns stort och kan i förlängningen möjliggöra bättre behandlingar och effektivare vård, säger Erik Brandt.