Ja det är inte alls säkert att vi är så anonyma som vi kan tro.

För med hög sannolikhet kunde forskarna identifiera personer, som utlovats vara anonyma och som enligt nya EU-förordningen GDPR, ska vara just det.

David Lindahl, säkerhetsexpert inom IT på Totalförsvarets forskningsinstitut – FOI, förklarar mer.

– Väldigt många företag i dag, tjänar pengar på att samla in data och sälja informationen vidare. Till detta så kommer alla forskningsenkäter och liknande där vi har en enorm datainsamling. Och det här gör att man kan sälja datan vidare, om man har anonymiserat den, enligt vissa kriterier, säger han och fortsätter:

– Problemet är att forskarna här visar på ett sätt att snabbt avanonymisera de som medverkar i informationen.

I digitala sammanhang där information om oss samlas in, men där vi alltså sedan ska vara anonymiserade, så har forskare nu, med hjälp av datorprogram, med hög sannolikhet kunnat identifiera just anonymiserade personer.

När information om oss i dag samlas in, till exempel när vi använder Facebook, eller medverkar i en digital enkät, så tas i dag en rad åtgärder till för att denna information ska hålla oss anonyma, innan informationen kan föras vidare till andra företag – eller myndigheter.

Det kan bland annat handla om att ta bort namn och mailadresser. Och att aldrig ge ut mer än en del av all insamlad information.

Men dessa metoder visar sig nu alltså vara otillräckliga, menar forskarna i studien.

De använde ett datorprogram som, genom att träna med så kallad maskininlärning, till slut kunde visa hur sannolikt det var att enskilda individer, som var anonymiserade, verkligen medverkat i vissa sammanhang. Detta genom att använda kombinationer av olika parametrar som till exempel ålder, kön och civilstånd.

Forskarna tittade på data från flera olika databaser i bland annat USA och Frankrike.

Experter som Vetenskapsradion pratat med, menar att det egentligen inte är ett nytt problem med att teknik kan avanonymisera data, men att det nya är hur pass lite information som behövs för att personer ska kunna identifieras. Och att flera av de metoder man trott var effektiva nu måste omvärderas

David Lindahl på FOI förklarar varför detta kan vara känsligt.

– I Sverige så lever vi i ett väldigt fritt land, men om du är dissident i ett land och din stat kan identifiera dig så kan du få väldiga problem. Om du har sexuella avikelser eller andra hemligheter så kan det vara oerhört känsligt, säger han.

Referens: Rocher et al. "Estimating the success of re-identifications in incomplete datasets using generative models". Nature Communications, 2019. Doi.org/10.1038/s41467-019-10933-3.