23/01/2014

Co robi analityk zawartości, czyli kiedy oglądanie pornografii w pracy jest dozwolone

Porady

W pełni rozumiem Twoje zaintrygowanie tytułem tego posta, dlatego na wstępie szczerze oświadczam: będzie o porno, ale nie jest to jedyna tematyka mojej krótkiej opowieści. A odnosząc się do drugiej kwestii poruszonej w nagłówku – w Kaspersky Lab oficjalna nazwa mojego stanowiska brzmi jak najbardziej poważnie i odpowiedzialnie: analityk zawartości.

content

Ujmując to w najprostszy sposób – głównym zadaniem na tym stanowisku jest stworzenie przefiltrowanych i pogrupowanych baz danych, które z kolei są wykorzystywane w naszych produktach. Wspomniane filtry mają zastosowanie w naszych rozwiązaniach zarówna dla końcowych, indywidualnych odbiorców, jak i klientów biznesowych. Kontrola rodzicielska jest modułem odpowiedzialnym za filtrowanie zawartości dla tej pierwszej grupy, natomiast Kontrola punktów końcowych jest rozwiązaniem przeznaczonym dla tej drugiej. Dzięki narzędziom jakie oferuje Kontrola rodzicielska, można zabezpieczyć dostęp do niestosownych treści na stronach internetowych. Jednakże, aby ta zapora mogła skutecznie funkcjonować, niezbędne jest, aby firma zajmująca się bezpieczeństwem na bieżąco analizowała strony WWW, badając ich zawartość i przypisując im odpowiednie kategorie. I właśnie w tym miejscu pojawia się już wcześniej wspomniane zagadnienie baz danych.

Głównym zadaniem analityka jest nauczenie robotów poprawnej kategoryzacji zawartości stron w internecie

Obecnie manualna segregacja stron w bazach danych jest już niemożliwa: według Google obecny zbiór stron internetowych obejmuje już około 15 miliardów witryn. Dlatego też,  główna część skanowana jest przez roboty. Analizują one zawartość internetu  z wykorzystaniem chmury Kaspersky Security Network i bieżąco dostarczają opinie o każdej stronie. Zgromadzone w ten sposób informacje są wykorzystywane w naszych rozwiązaniach ochrony mobilnej (np. Safe Browser dla systemu iOS), jak również do całej reszty naszych produktów – wzmacniając wydajność i skuteczność filtrowania zawartości. Głównym zadaniem analityka jest nauczenie robotów poprawnej kategoryzacji zawartości stron w internecie. Urządzenia te powinny ocenić kluczowe słowa, ich kombinacje oraz grafiki zawarte na stronie i podjąć decyzję, do jakiej kategorii można zakwalifikować wybraną stronę. Jeżeli kod źródłowy witryny zawiera takie hasła jak „oglądaj porno online” albo „darmowe porno”, ogromną liczbę obrazów w cielistych barwach i temu podobne, robot zakwalifikuję stronę do kategorii „Pornografia i erotyka” opierając się na założonych wcześniej kryteriach.

Jednym z obowiązków analityków zawartości, jest cykliczne przeglądanie stron zaliczonych jako „nieprzyzwoite treści”, przez co w branży żartobliwie nazywamy ich „analitykami porno”. Oczywiście warto w tym miejscy podkreślić, że oprócz serwisów dla dorosłych, istnieją jeszcze inne kategorie stron z którymi pracujemy, włączając w to strony o podwyższonym ryzyku, dotyczące takich zagadnień jak:

  • narkotyki,
  • przemoc i okrucieństwo,
  • broń,
  • hazard,
  • wulgarny język, przekleństwa.

Z założenia, wszystkie wyżej wymienione kategorie są automatycznie blokowane i ograniczone uprawieniami Administratora podczas aktywnego działania Kontroli rodzicielskiej czy Kontroli punktów końcowych.

Niektórzy z Was mogą pomyśleć: oglądanie pornografii w  pracy … to musi być fajna robota! W realnym świecie jednak to zajęcie już nie wygląda tak kolorowo. Po pierwsze treści tego typu są bardzo zróżnicowane – nie wszyscy są w stanie przeglądać niektóre fetysze, zoofilię czy brutalną pornografię. Po drugie trzeba być wyjątkowo odpornym psychicznie, przyjąć postawę „zdrowego cynika” oraz być przygotowanym na zmierzenie się różnymi emocjami towarzyszącymi oglądaniu stron z kategorii „Przemoc i okrucieństwo”. Powyższe cechy są koniecznym wymogiem stawianym kandydatom na stanowisko analityka zawartości już na pierwszych etapach rekrutacji.

Ale to jeszcze nie wszystkie istotne informacje odnośnie naszej pracy … Bardzo ciężko jest opisać cały proces naszej profesji i wszelkie dziwactwa związane ze szczegółowym poszukiwaniem najgorszych treści w internecie. Jednak mogę przyjąć poniższy schemat dnia za typowy dla mojego stanowiska:

Poranne sprawdzanie poczty e-mail.

  • Ta czynność pozwala mi „wskoczyć” w odpowiedni nastrój do pracy i oszacować liczbę zadań na dany dzień.

Poranne zebranie.

  • Codziennie, o 11:00, nasz zespół zbiera się w sali konferencyjnej, omawia zrealizowaną pracę z dnia poprzedniego oraz ustala zakres działań na bieżący dzień. Jest to integralny etap pracy każdego z nas, niezbędny do utrzymania dyscypliny i gwarantujący przejrzystość naszej współpracy jako zespołu.

Przerwa na kawę.

  • Ok, praca jest najważniejsza … ale czym byłby poranek bez filiżanki świeżej kawy?

Zapytania użytkowników.

  • Każdego dnia, nasz dział pomocy technicznej odpowiada na dziesiątki zapytań użytkowników dotyczących nieprawidłowego blokowania stron internetowych przez moduły filtrujące ich zawartość. Tego typu zgłoszenia są kierowane do naszego zespołu analitycznego, który bada poszczególne przypadki i bezpośrednio odpowiada użytkownikom. Kolejną kwestią, którą się zajmujemy są wszelkie awarie związane z działaniem funkcji Anti-Banner w naszych produktach. Przeważnie każde zgłoszenie zajmuje nam do 3 dni roboczych, jednak mamy niepisaną zasadę – im szybciej, tym lepiej.

Praca nad kategoriami zawartości.

  • Najważniejszym zadaniem analityka zawartości jest tworzenie nowych kategorii i aktualizacja tych już istniejących. Obecnie obsługujemy 15 kategorii pracując w 7 językach. Dlatego też, kolejną istotną umiejętnością dla kandydata na stanowisko analityka zawartości jest biegła znajomość drugiego języka – oczywiście po angielskim. W związku z tym chętnie widzimy w naszych szeregach ludzi z dyplomem filologii lub lingwistyki, oraz co oczywiste na tej posadzie, z analitycznym umysłem. Idealny kandydat powinien być wszechstronnie uzdolnionym człowiekiem – umysłem ścisłym i humanistycznym zarazem, co jest rzadko spotykane.

Testy w czasie rzeczywistym.

  • Roboty kategoryzujące strony posługują się bazami danych stworzonymi i wspieranymi przez analityków. Przed wprowadzeniem ich do powszechnego użytku , oczywistym jest przeprowadzenie szeregu testów sprawdzających działanie baz danych. Najważniejszym z nich jest pilotażowy test na prawdziwych, najpopularniejszych stronach. Trwa on cały dzień. Lista najpopularniejszych światowych witryn jest tworzona każdego dnia rano i te strony, który nie były wcześniej przez nas testowane, zostają przekazywane do analizy i kategoryzacji. Uporządkowane i zdiagnozowane strony są ręcznie dodawane do bieżących testów. Następnym etapem jest weryfikacja, czy diagnozy analityków i robotów zgadzają się. Z racji tego, że zawartość stron dynamicznie się zmienia, musimy konsekwentnie i nieustannie przeprowadzać na nich testy. Z reguły wykonujemy trzy serie w ciągu dnia: rano, popołudniu i wieczorem.

Nauka.

  • Pracownicy naszego działu są powszechnie znanymi i cenionym ekspertami z dziedziny ochrony dzieci przed nieodpowiednimi treściami w internecie: publikują artykuły, piszą na blogach, są zapraszani do wywiadów jako specjaliści oraz występują jako prelegenci na licznych konferencjach.
  • Pomimo, niezliczonej ilości przeprowadzonych wywiadów i wykładów oraz napisanych artykułów, problem ochrony dzieci przed „mroczną” stroną internetu jest nadal gorącym tematem.

Zdajemy sobie sprawę, że jest milion sposobów na radzenie sobie ze źródłem niepoprawnych treści. Nasza Kontrola rodzicielska oraz Kontrola punktów końcowych nie jest „cudownym lekiem na całe zło”, jednak  robimy wszystko, co w naszej mocy, aby chronić naszych użytkowników, traktując ich jak członków swojej rodziny bądź przyjaciół. W tym celu zapewniamy im najlepsze, niezbędne narzędzia do obrony przed niestosowną zawartością internetu.