Livreddende system for sikker deling av biomedisinske data

Livreddende system for sikker deling av biomedisinske data

20.12.2017
Før: Forskere brukte usikre medier, som USB-stasjoner eller CD-er i rekommanderte postsendinger, når de skulle utveksle sensitive biomedisinske data om folks helse mellom institusjoner eller over landegrenser. Nå: Forskerne kan utveksle data med stor hastighet – og redde flere liv – via en sikker nordisk datadelingstjeneste.

Flere hundre nordiske forskningsmiljøer og -prosjekter benytter allerede datadelings-systemene som er utviklet med støtte fra det nordiske prosjektet Tryggve, som har hentet sitt navn fra det gamle, nordiske ordet «trygg». Oppfølgeren Tryggve2 er allerede i gang og skal gjøre fremskrittene enda større.

Tryggve er spesialtilpasset for biomedisinsk forskning – som ofte bare blir kalt medisinsk forskning – og som handler om å finne årsakene til sykdom, diagnostisere sykdommer, og helst kurere dem. Et særtrekk ved moderne biomedisinsk forskning er at forskere vanligvis trenger å samle inn store mengder data fra store befolkningsgrupper, for å avdekke både årsakene til sykdommen og mulige botemidler.

Disse dataene er sensitive fordi de inneholder informasjon om helsen til enkeltpersoner, og bruken av dem er strengt regulert av nasjonale og internasjonale bestemmelser om personvern. Forskere har tidligere måttet bruke mye tid på å navigere gjennom kompliserte juridiske farvann, før de kunne få tillatelse til å samle inn eller dele data – eller få tilgang til allerede eksisterende datasett.

Innledet i 2013

Tryggve ble innledet i 2013 med et møte for stakeholders – interessenter – på flyplassen Arlanda utenfor Stockholm. Fire år senere tilbyr prosjektet en sikker metode for overføring av data mellom forskere i ulike institusjoner og på tvers av landegrenser.

– Overføringen er kryptert, og det blir ikke generert midlertidige kopier underveis. De fleste brukerne får tilgang til et sikkert datamiljø ved logge seg på en ekstern desktop-løsning, omtrent som om de skulle logge seg inn i en nettbank, forklarer NeICs seniorrådgiver Joel Hedlund.

Hedlund er Tryggves prosjekteier og ekspert på bioinformatikk-applikasjoner ved Universitetet i Linköpings National Supercomputer Centre. Han samarbeider tett med Tryggves prosjektleder Antti Pursula, ved Finlands CSC - IT Center for Science.

Beskytter mot feil

Den eksterne desktop-løsningen gir forskerne tilgang til biomedisinske data, men i tillegg tilbyr Tryggve både referansedata og programvare. Dessuten får samarbeidende forskere tilgang til en delt datamaskin der de kan lagre og analysere sine data.

– Forskerne får i utgangspunktet bare tilgang til egne data, men den juridisk ansvarlige for et forskningsprosjekt kan også delegere tillatelse til å bruke andre data. Dermed kan du enkelt legge data inn i systemet, men du kan ikke kopiere data og ta dem ut ved en feil. Det eneste Tryggve ikke kan beskytte deg mot er at noen tar et bilde av skjermen din, sier Hedlund.

Tiden er kostbar når liv står på spill

Svineinfluensaepidemien som rammet de nordiske landene i 2009 illustrerer hvor viktig det er med høy fart i databehandlingen og -delingen når det gjelder biomedisinsk forskning. Helsemyndighetene i Danmark bestemte seg tidlig for å anbefale offentlig vaksinering fordi de regnet med at epidemien kom til å eskalere. Etter hvert kom det rapporter om spontanaborter blant gravide kvinner som var blitt vaksinert og da bestemte myndighetene seg for å starte et forskningsprosjekt.

Biomedisinske forskere i de nordiske landene har tidligere opplevd at det kunne ta måneder eller år å få tilgang til dataene de trenger i slike tilfeller, hovedsakelig fordi dataene er fordelt mellom flere forskergrupper på ulike institusjoner. Men danskene hadde allerede samlet de aktuelle helsedataene hos den nasjonale Sundhedsdatastyrelsen, og dermed kunne forskerne få tilgang til dataene de trengte så snart prosjektet var godkjent av en etisk komité.

– Dette førte til at forskerne fant ut, i løpet av bare noen få uker, at de vaksinerte mødrene faktisk hadde færre spontanaborter enn de uvaksinerte mødrene. Derfor var det trygt å videreføre vaksinasjonsprogrammet. Det var selvfølgelig veldig viktig å få fastslått dette mens influensaepidemien fortsatt pågikk, påpeker Hedlund.

Redder flere liv fortere

NordForsk og NeIC etablerte Tryggve-prosjektet sammen med de nordiske nodene i Den europeiske forskningsinfrastrukturen for livsvitenskap-informatikk (ELIXIR), Den europeiske infrastrukturen for biobanker og molekylærforskning (BBMRI) og infrastrukturorganisasjonen Euro-Bioimaging.

– Vi mente alle at et sikkert system for datadeling ville hjelpe biomedisinske forskere i Norden i deres bestrebelser for å redde flere liv. Og jeg tror virkelig at vi har hjulpet forskerne, for vi har gjort det mulig å utføre biomedisinsk forskning raskere enn før, uten å gå på kompromiss med de viktige juridiske og etiske perspektivene, sier Hedlund

Tidligere kunne det hende at forskere som ikke kjente de strenge juridiske og etiske kravene godt nok kunne utveksle sensitive helsedata med andre samarbeidspartnere ved å sende ukrypterte CD-er eller minnepinner i posten. Til og med rekommanderte postforsendelser kan komme på avveie, og dermed var det risiko for at sensitive persondata kunne havne i hendene på folk som hadde uærlige hensikter.

– Vi har demonstrert at sensitive data nå kan deles og behandles på tvers av de nordiske grensene via sikre tjenester i «skyen». Dette er et viktig fremskritt på grunn av de juridiske, etiske og tekniske komplikasjonene som tidligere var til hinder for grenseoverskridende bruk av sensitive data. Tryggve-prosjektet har også vist at programvare-porteføljer kan utveksles via sikre datasystemer, mener Hedlund.

Tryggve var opprinnelig et treårig prosjekt som skulle utvikle en nordisk plattform for samarbeid om sensitive data. Joel Hedlund og Antti Pursula begynte i 2016 å planlegge etterfølger-prosjektet Tryggve2, hvor ambisjonen var en oppskalering som skulle kunne anvendes av flere brukere.

– Tryggve2 har perspektiver langt utover de nordiske landene. Prosjektet er finansiert av NeIC og ELIXIR, og det endelige målet er å utvikle et system som kan brukes i alle europeiske land og kanskje enda bredere, forklarer Joel Hedlund.

Persontilpasset medisin og sjeldne sykdommer

Internasjonalt samarbeid er spesielt gunstig når det gjelder persontilpasset medisin og forskning på sjeldne sykdommer.

– De nordiske landene er ganske små hver for seg, og forskere kan ikke studere sjeldne sykdommer i små land fordi de trenger mange tilfeller for å identifisere sykdommenes årsaker og søke etter botemidler. Men hvis de nordiske landene samler sine ressurser, er vi plutselig på størrelse med et stort europeisk land. Og hvis vi samler ressursene som finnes i hele Europa, kan den biomedisinske forskningen i vår verdensdel få et globalt gjennomslag samtidig som vi opprettholder de høye etiske standarder som gir oss europeere et konkurransefortrinn, sier Hedlund.

– Tryggve2 skal omfatte alt som NeIC handler om: Nordisk infrastruktursamarbeid, god dialog mellom ulike interessenter, deling av ressurser og kompetanse, og en sikker langsiktig finansiering. I tillegg hjelper vi forskere som ønsker å bekjempe sykdommer og redde menneskeliv, oppsummerer han.


Utvikler databanken som kan gjøre biobankene enda mer verdifulle

De nordiske humane biobankene har stor verdi for forskere som prøver å finne en kur mot sykdommer som kreft, diabetes, hjerte- og karsykdommer osv. Tenk deg om forskerne kunne analysere ferdige datasett istedenfor biologiske prøver fra biobankene: Det ville spare dem for tid og penger, og gjøre biobankene enda mer verdifulle for folkehelsa.

Landene i Norden har et stort antall biobanker med biologiske prøver fra både friske mennesker og personer som lider av ulike sykdommer. Forskningsgrupper tar kontinuerlig ut deler av disse prøvene, for å analysere dem og finne nye sammenhenger mellom sykdommer og genetiske eller miljømessige faktorer. Men de fleste biologiske prøvene i biobankene er små, og hvert eneste «uttak» reduserer innholdet i en biobank.

Gir bort prøver, får tilbake data

Bartlomiej Wilkowski er IT-leder ved Danmarks Nationale Biobank (DNB) ved Statens Serum Institut (SSI). Han er også medlem av et SSI-team som utforsker en ny idé som kan spare forskerne for mye tid og penger.

– Ideen er at biobanker ikke bare skal gi fra seg biologiske prøver: De skal også ta imot og lagre dataene som forskerne genererer når de analyserer prøvene. Dette vil tjene til å styrke forskningen generelt, fordi de samme dataene i de fleste tilfeller kan brukes av andre forskere til andre formål i fremtiden, forklarer Wilkowski.

– Tenk deg at en forskergruppe vil sekvensere eller genotype en gruppe prøver for å studere et bestemt problem. Dataene fra slike studier kan i de fleste tilfeller også brukes til å studere mange andre problemer. Neste gang en forskningsgruppe ber om den samme typen prøver, for å genotype eller sekvensere dem til et annet prosjekt, kan vi gi dem ferdige data i stedet for biologisk materiale, legger han til.

Utvikler en pilot

Bartlomiej Wilkowski jobber nå med å utvikle en pilot for en slik databank, sammen med NeICs Joel Hedlund og andre partnere. Databanken skal være direkte knyttet til en biobank, slik at det er enkelt å se hvordan konkrete prøver er blitt studert tidligere.

– Vi planlegger at piloten skal installeres på Computerome – Den danske nasjonale supercomputeren for livsvitenskap – på en slik måte at andre nordiske biobanker senere kan kopiere oppsettet. Målet er å utvikle en felles plattform for forskere i Norden, sier Wilkowski.

Wilkowski ser også for seg at det etablerte samarbeidet med de lokale EGA-gruppene, som drives av Den europeiske forskningsinfrastrukturen for livsvitenskap-informatikk (ELIXIR), skal føre til at den nordiske plattformen senere kan kobles til databaser over hele Europa. EGA er forkortelsen for European Genome-Phenome Archive.

– Den fremtidige løsningen vil trolig ikke gå ut på at databankene eksporterer data. Det er en sikrere løsning å gi forskerne en konto som gir dem tilgang til et personlig «arbeidsrom» hvor de kan utføre alle nødvendige beregninger på en superdatamaskin, mener han.

Vil fremme biomedisinsk forskning

Men det er mange problemer som må løses, både når det gjelder teknologi og organisasjon, før denne ideen kan bli virkelighet.

– De biologiske prøvene kan brukes til å generere mange ulike typer data, og vi må være sikre på at dataene lagres på en slik måte at de senere kan brukes av så mange forskere som mulig. Dette kommer ikke til å bli lett, og der ligger en av grunnene til at vi trenger hjelp fra infrastruktureksperter i NeIC og deres nasjonale partnere, sier Wilkowski.

– Jeg håper og tror at denne ideen kan bidra til å fremme den biomedisinske forskningen i Norden. Fordelen for forskere er at den planlagte databasen kan redusere behovet for tidkrevende prosedyrer og analyser av biologiske prøver. Samtidig skal vi gi dem en sikker måte for håndtering av sensitive persondata, konkluderer Bartlomiej Wilkowski.

Tekst: Bjarne Røsjø
Foto: Terje Heiestad.

Nyhetsbrev

Hold deg oppdatert på nyheter om våre aktiviteter og utlysninger gjennom vårt nyhetsbrev på e-post.

Abonnér her