Kunstig intelligens kan forudsige begivenheder i menneskers liv

onsdag 24 jan 24
|

Kontakt

Sune Lehmann
Professor
DTU Compute
45 25 39 04

Podcast

  • Generative chatbots som ChatGPT kan udlede en masse følsomme oplysninger om os, selv ud fra fuldstændig hverdagsagtige samtaler.
  • Hør mere om Sune Lehmann's forskning i podcasten ’Blinde Vinkler’, der er produceret af Ingeniørforeningen IDA og IT-Branchen.

Forskningsprojektet

Forskningsprojektet ’Using Sequences of Life-events to Predict Human Lives’ er baseret på arbedsmarkedsdata og data fra Landspatientregisteret og Danmarks statistik. Datasættet inkluderer alle 6 mio. danskere og rummer oplysninger om indkomst, løn, stipendium, jobtype, branche, sociale ydelser osv. Sundhedsdatasættet indeholder registreringer om besøg hos sundhedspersonale eller på hospitaler, samt diagnose, patienttype og hastegrad. Datasættet spænder fra 2008 til 2020, men i flere af analyserne fokuserer forskerne på perioden 2008-2016 og en aldersbegrænset delmængde af personer.
Kunstig intelligens kan analysere registerdata om menneskers bopæl, uddannelse, indkomst, sundhed og arbejdsforhold og forudsige livsbegivenheder med høj præcision.

Publiceret på dtu.dk - tekst Peter Aagaard Brixen.

Kunstig intelligens, AI, der er udviklet til at behandle sprog, kan udnyttes til at forudsige begivenheder i menneskers liv. Et forskningsprojekt fra DTU, Københavns Universitet, ITU, og Northeastern University i USA viser, at hvis man indlæser store mængder data fra menneskers liv og træner såkaldte ’transformermodeller’, der lige som ChatGPT anvendes til at håndtere sprog, så kan de med høj præcision ordne data systematisk og forudsige, hvad der kommer til at ske i et menneskes liv og ligefrem anslå dødstidspunktet.


I en ny, videnskabelig artikel ’Using Sequences of Life-events to Predict Human Lives’, der er udgivet i Nature Computational Science, har forskerne analyseret 6 mio. danskeres sundhedsdata og deres tilknytning til arbejdsmarkedet i modellen life2vec. Efter modellen er trænet, det vil sige, har lært mønstrene i data, i en indledende fase, så har den vist sig at kunne udkonkurrere andre avancerede neurale netværk (se faktaboks) og med høj præcision forudsige udfald som personlighed og dødstidspunkt.

”Vi har forsøgt at bruge modellen til at besvare et fundamentalt spørgsmål: i hvilket omfang kan vi på baggrund af forhold og begivenheder i din fortid forudsige noget, der sker i din fremtid? Videnskabeligt set er det spændende for os, ikke så meget selve forudsigelsen, men de dataprocesser, der gør modellen i stand til at give så præcise svar,” siger professor på DTU Sune Lehmann, der er hovedforfatter på artiklen.

Forudsigelser om dødstidspunkt

De forudsigelser forskerne har fået fra Life2vec har været svar på generelle spørgsmål som: 'død inden for de fire år’? Når forskerne analyserer modellens svar, så er resultaterne i overensstemmelse med resultater, der er kendt fra socialvidenskaberne, f.eks. at personer, der sidder i en lederstilling eller har en høj indkomst har større sandsynlighed for at overleve, mens det at være mand, faglært eller have en mental diagnose er forbundet med en større risiko for at dø.

Life2vec opdeler alle data i et stort system af såkaldte vektorer, en slags kasser baseret på algoritmer, som sorterer de forskellige data. Modellen finder selv ud af, hvor data om fødselstidspunkt, skolegang, uddannelse, løn, bolig og sundhed skal placeres.

”Det spændende er at betragte menneskelivet som en lang sekvens af begivenheder, på samme måde som en sætning i et sprog består af en række ord. Det er normalt den type opgaver, man anvender transformermodeller i AI til, men i vores forsøg bruger vi dem til at analysere det, vi kalder livssekvenser, det vil sige begivenheder, der er sket i et menneskeliv,” siger Sune Lehmann.

Rejser etiske spørgsmål


Forskerne bag artiklen peger på, at life2vec-modellen rejser etiske spørgsmål om beskyttelse af personfølsomme data og privatliv, og spørgsmål om, hvilken rolle bias i data spiller. Disse udfordringer skal forstås dybere, før modellen kan anvendes til f.eks. at vurdere enkeltpersoners risiko for at blive ramt af en sygdom eller andre livsbegivenheder, hvor det er muligt at forebygge.

”Modellen åbner for positive og negative perspektiver, som det er vigtigt at vi diskuterer og at der bliver taget politisk stilling til. Lignende teknologier til at forudsige livsbegivenheder og menneskers adfærd anvendes allerede i dag i tech-virksomheder, som f.eks. ved tracking af vores adfærd på sociale netværk profilerer os ekstremt nøjagtigt, og bruger de profileringer til at forudsige vores adfærd og til at påvirke os. Den diskussion skal ud i den demokratiske samtale, så vi tager stilling til, hvor teknologien fører os hen, og om det er en udvikling, vi ønsker,” siger Sune Lehmann.

Næste skridt i forskningen bliver ifølge forskerne at inkorporere andre typer information som tekst og billeder eller information om vores sociale forbindelser. Denne anvendelse af data åbner for et helt nyt samspil mellem social- og sundhedsvidenskab.

Neurale netværk og transformermodel

Et neuralt netværk er en computermodel, der er inspireret af hjernen og nervesystemet hos mennesker og dyr. Der er mange forskellige typer af neurale netværk (f.eks. transformermodeller).Ligesom hjernen er et neuralt netværk opbygget af (kunstige) neuroner. Disse neuroner er forbundet og kan sende signaler til hinanden. Hvert neuron modtager input fra andre neuroner og beregner derefter et output, som sendes videre til andre neuroner.Et neuralt netværk kan lære at løse opgaver ved at træne på store mængder data. Neurale netværk er afhængige af træningsdata for at lære og forbedre deres nøjagtighed over tid. Men når først disse læringsalgoritmer er finjusteret til nøjagtighed, er de kraftfulde værktøjer inden for datalogi og kunstig intelligens, der giver os mulighed for at klassificere og gruppere data med høj hastighed. Et af de mest kendte neurale netværk er Googles søgealgoritme. Læs mere i Den Store Danske

Transformermodel

En transformermodel er en type AI, deep learning data-arkitektur, der bruges til at lære om sprog og andre opgaver. Modellernes kan trænes til at forstå og generere sprog. Transformermodellen er designet til at være hurtigere og mere effektiv end tidligere modeller, og den bruges ofte til at træne store sprogmodeller på store datasæt.

Nyheder og filtrering

Få besked om fremtidige nyheder, der matcher din filtrering.