Niebezpieczne związki: jak rodzina i znajomi podają dalej nasze sekrety

Chyba każdy z nas zastanawiał się kiedyś nad pochodzeniem swojej rodziny. Tworzenie drzewa genealogicznego może być bardzo ekscytujące, jednak może też wiązać się z różnymi zaskakującymi zwrotami akcji.

Nowoczesne technologie coraz częściej przyczyniają się do upubliczniania naszych tajemnic. Czasami odbywa się to w ramach masowych wycieków danych osobowych, które skutkują pojawieniem się w internecie prywatnych (a nawet intymnych) zdjęć i wiadomości.

Pomińmy niezliczone dokumenty każdego obywatela przechowywane w rządowych bazach danych czy strukturach komercyjnych — w zamian załóżmy naiwnie, że dane te są odpowiednio chronione przed ciekawskimi oczami (chociaż wszyscy wiemy, że tak nie jest). Zapomnijmy także o tym, że gubimy dyski flash i atakują nas hakerze. Weźmiemy pod uwagę tylko to, co użytkownicy przesyłają do internetu.

Rozwiązanie może wydawać się proste — jeśli coś jest prywatne, nie publikujemy tego. Jednak ludzie nie mają całkowitej kontroli nad wszystkimi swoimi danymi prywatnymi; wrażliwe informacje na ich temat mogą udostępniać znajomi czy osoby z rodziny, a czasami dzieje się to bez zgody samych zainteresowanych.

Geny dostępne publicznie

Informacja, która staje się publiczna, może być bardzo osobista. Na przykład w internecie może pojawić się kod DNA bez Twojej wiedzy. Na popularności zyskują ostatnio usługi online związane z genetyką i genealogią, takie jak 23andMe, Ancestry.com, GEDmatch czy MyHeritage (nawiasem mówiąc, serwis MyHeritage doświadczył ostatnio wycieku, jednak to temat na oddzielny post). Użytkownicy dobrowolnie udostępniają tym usługom próbkę materiału (ślinę lub wydzielinę z wewnętrznej części policzka), na podstawie których określa się w laboratorium ich profil genetyczny. Może on zostać wykorzystany na przykład do sprawdzenia pochodzenia danej osoby lub ustalenia predyspozycji genetycznych w odniesieniu do określonych chorób.

O poufności nie ma mowy. Usługi genealogiczne działają poprzez dopasowywanie utworzonego profilu z tymi, które już znajdują się w bazie danych (w przeciwnym razie członkowie rodziny nie zostaliby odnalezieni). Jednak działa to też w drugą stronę: w ten sposób użytkownicy dobrowolnie ujawniają informacje na swój temat, aby krewni, którzy również korzystają z tej usługi, także mogli ich odnaleźć. Jest tu jednak jeden niuans: klienci takich usług jednocześnie publikują informacje genealogiczne na temat członków swojej rodziny, którzy mają takie same geny. A krewni ci mogą nie chcieć, aby ktoś miał możliwość odnalezienia ich, a zwłaszcza na podstawie ich kodu DNA.

Korzyści usług genealogicznych są niezaprzeczalne; dzięki nim odnalazło się wiele całych rodzin. Jednak nie można zapominać, że publicznie dostępne bazy genów mogą zostać użyte do niewłaściwych celów.

Braterska miłość

Na pierwszy rzut oka problem przechowywania informacji genetycznych w publicznych bazach danych może nie wzbudzać zdziwienia, bo trudno jest wyobrazić sobie konsekwencje praktyczne tej sytuacji. Jednak prawda jest taka, że usługi genealogiczne i próbki biometriału (kawałek skóry, paznokci, włosów, krwi, śliny itp.) mogą, w określonych okolicznościach, pomóc w zidentyfikowaniu osoby bez posiadania jej zdjęcia.

Rzeczywisty wymiar zagrożenia pokazało badanie opublikowane w październiku na łamach dziennika Science. Jeden z autorów, Yaniv Erlich, doskonale zna tajniki tej branży; pracuje w organizacji MyHeritage, która świadczy usługi analizy DNA i tworzenia drzewa genealogicznego rodzin.

Według badania aż 15 milionów osób (do tej pory) wykonało test genetyczny i utworzyło swój profil poprzez formularz elektroniczny (inne dane wskazują, że sama firma MyHeritage ma ponad 92 mln użytkowników). W samych Stanach Zjednoczonych badacze przewidzieli, że publicznie dostępne dane genetyczne wkrótce umożliwią zidentyfikowanie dowolnego Amerykanina europejskiego pochodzenia (którzy stanowią duży odsetek tych, którzy do chwili obecnej zostali poddani testowi) na postawie kodu DNA. Warto tu dodać, że nie ma różnicy, czy test zainicjowała dana osoba, czy jej ciekawy wyników krewny.

Jak pisze magazyn Nature, aby pokazać, jak łatwa jest identyfikacja na podstawie kodu DNA, zespół Erlicha użył profilu genetycznego członka projektu badawczego w dziedzinie genomu, umieścił go w bazie danych usługi GEDmatch i w ciągu 24 godzin uzyskał imię i nazwisko właściciela próbki DNA.

Metoda ta okazała się również być przydatna dla organów prawnych, które dzięki internetowym usługom genealogicznym rozwiązały kilka spraw śmiertelnych.

Jak łańcuch DNA zdemaskował przestępcę

Minionej wiosny, po 44 latach bezowocnych poszukiwań aresztowano 72-latka podejrzanego o popełnienie serii morderstw, gwałtów i rozbojów. Został on odnaleziony na podstawie informacji genealogicznych dostępnych w internecie.

Analiza laboratoryjna biomateriału znalezionego w miejscu zbrodni utworzyła profil genetyczny, który spełniał wymogi publicznych serwisów genealogicznych. Szpiedzy podszywający się pod zwykłych użytkowników uruchomili plik w bazie GEDmatch i utworzyli listę prawdopodobnych krewnych przestępcy.

Wszystkie odnalezione osoby — a było ich kilkanaście — były raczej dalekimi krewnymi (nie bliżej niż kuzynostwo 2 stopnia). Innymi słowy, na początku XIX wieku ludzie ci mieli takie samo pochodzenie jak przestępca. Jak opisał dziennik The Washington Post, pięciu genealogów posiadających dostęp do archiwów spisu ludności, nekrologów gazetowych i innych danych wykorzystało je do prześledzenia krewnych tych przodków, stopniowo wypełniając puste miejsca w drzewie genealogicznym.

W efekcie powstał ogromny krąg odległych, choć żyjących krewnych sprawcy. Odrzucając tych, którzy nie pasowali do kryterium wieku czy płci, śledczy ostatecznie wytypowali podejrzanego. Grupa detektywów śledziła go, gdy trzymał przedmiot z własną próbką DNA, a następnie porównała ją z materiałem znalezionym na miejscu zbrodni wiele lat wcześniej. Okazało się, że kod DNA w obu próbkach był taki sam, a 72-letni Joseph James DeAngelo został aresztowany.

Sprawa ta zwróciła uwagę na największą zaletę dostępnych publicznie w internecie usług genealogicznych: można ją zestawiać z bazami danych DNA organów ścigania. Ta druga baza przechowuje informacje tylko o przestępcach, tymczasem pierwsza pełna jest zwykłych użytkowników, którzy zarzucają na swoich krewnych wirtualną sieć.

Wyobraź sobie, że jakaś osoba nie jest poszukiwana z mocy prawa, ale przez grupę przestępczą — może jako przypadkowy świadek czy potencjalna ofiara. Usługi te są publicznie dostępne, więc może z nich korzystać każdy. I to wcale nie jest takie dobre.

Uciążliwe oznaczenia

Wyszukiwanie na podstawie kodu DNA przy użyciu publicznych serwisów jest jeszcze stosunkowo niszowe. Znajomi i krewni, którzy nie mają złych intencji, mogą nieumyślnie ujawnić Twoje miejsce pobytu przestępcom, organom ścigania i reszcie światu poprzez tak często stosowane oznaczanie zdjęć, filmów i postów w mediach społecznościowych.

Tagi te mogą przyczyniać się do powstawania niezręcznych sytuacji. Przypuśćmy, że nieostrożny technik laboratoryjny postanowił przesłać zdjęcia z imprezy dla pracowników i oznaczył na nich każdego, w tym wybitnego profesora. Zdjęcia te natychmiast pojawiają się automatycznie również na stronie profesora, podważając jego autorytet w oczach studentów.

Bezmyślnie opublikowany post może równie dobrze prowadzić do zwolnienia lub ściągnąć na oznaczoną osobę inne kłopoty. Przy okazji warto podkreślić, że wszelkie informacje udostępnione w sieciach społecznościowych mogą łatwo tworzyć brakujące ogniwo podczas opisanego wyżej wyszukiwania przy użyciu publicznych baz danych usług genealogicznych.

Jak skonfigurować oznaczanie

Sieci społecznościowe umożliwiają użytkownikom kontrolowanie sytuacji, w których są oznaczani i wspominani. Na przykład Facebook umożliwia usuwanie oznaczeń ze zdjęć opublikowanych przez innych i ograniczenie kręgu osób, które mogą oznaczyć Cię lub wyświetlać materiały, na których ktoś nas oznaczył. Użytkownicy Facebooka mogą ukryć zdjęcia, które przesłali, przed znajomymi oznaczonych osób.

Co ciekawe, Facebook nie tylko zachęca użytkowników do oznaczania znajomych poprzez podpowiedzi generowane przez technologię rozpoznawania twarzy (funkcję tę można wyłączyć w ustawieniach konta), ale także pomaga im w kontrolowaniu prywatności: sieć społecznościowa wysyła powiadomienie, jeśli wspomniana technologia zidentyfikuje Cię na zdjęciu kogoś innego.

W przypadku serwisu Instagram sytuacja wygląda tak: w swoich zdjęciach i filmach oznaczyć Cię mogą wszyscy oprócz tych, których sami zablokowaliśmy. Inaczej mówiąc, sieć ta umożliwia zdecydowanie, czy zdjęcia, na których Cię oznaczono, mają pojawić się na Twoim profilu automatycznie, czy tylko po akceptacji. Możesz również określić, kto może widzieć te posty na Twoim profilu.

Pomimo faktu, że funkcje te oferują częściową kontrolę na tym, gdzie i kiedy pojawia się Twój wizerunek, sytuacja ta stwarza wiele zagrożeń. Nawet jeśli zablokujesz osoby oznaczające Cię na zdjęciach, Twoje imię (i łącze do strony) nadal mogą zostać wspomniane w opisie czy komentarzu do zdjęcia. Oznacza to, że zdjęcie nadal będzie z Tobą powiązane, a śledzenie takich wycieków jest niemal niemożliwe.

Przypadki z życia wzięte

Twoje sekrety mogą ujawniać nie tylko znajomi i członkowie rodziny. Mogą to robić na przykład same technologie poprzez system rekomendacji.

Na przykład algorytm serwisu Facebook bardzo aktywnie wyszukuje potencjalnych znajomych, czasami podpowiadając kolegów z danej grupy czy społeczności (szkoły, uczelni, organizacji). Ponadto proces wyboru znajomych wykorzystuje informacje kontaktowe użytkowników przesłane do Facebooka z urządzeń mobilnych. Jednak Facebook nie ujawnia wszystkich kryteriów, wg których jego algorytm wybiera potencjalnych znajomych, a czasami to naprawdę zaskakujące, skąd wie o Twojej sieci znajomości.

Jak to się ma w odniesieniu do prywatności? Oto przykład. Zdarzyło się kiedyś, że system ten podpowiedział wspólną znajomość pacjentom pewnego psychiatry — jeden z nich zorientował się, co mają ze sobą wspólnego. Dane związane ze zdrowiem, a szczególnie psychiatrią, należą do najbardziej wrażliwych. Nie wszyscy dobrowolnie zgodziliby się na to, aby były przechowywane przez media społecznościowe.

Podobne przypadki zostały wskazane w wezwaniu Facebooka przez amerykański komitet senatu na przesłuchanie w kwietniu 2018 r. w sprawie prywatności użytkowników serwisu Facebook. W swojej odpowiedzi firma nie skomentowała przypadków wyświetlania pacjentów jako potencjalnych znajomych i poinformowała jedynie, że ich algorytm sugerowania znajomych korzysta ze wspomnianych wyżej źródeł informacji.

Co dalej?

Internet już dziś przechowuje znacznie więcej informacji związanych z naszymi społecznościami czy biologią, niż możemy sobie wyobrazić. Sytuacji tej nie możemy całkowicie kontrolować z jednego powodu: nie wiemy o tym zbyt wiele. Bardzo prawdopodobne jest, że wraz z postępem nowych technologii pojęcie „danych prywatnych” przejdzie do historii — nasza tożsamość prawdziwa i internetowa są coraz bardziej ze sobą powiązane, a każda tajemnica w internecie wcześniej czy później stanie się przestarzała.

Jednak problem prywatności w internecie coraz częściej jest omawiany w rządach na całym świecie, więc być może nadal możemy znaleźć sposób, aby ochronić się przed wścibskimi osobami.

WannaCry jeszcze nie zginął

Podczas tworzenia najnowszego raportu opisującego ewolucję zagrożeń IT nasi eksperci natknęli się na ciekawe statystyki. Okazało się, że w trzecim kwartale 2018 roku użytkowników atakowało zapomniane zagrożenie WannaCry.

Porady