La giornata di lavoro tipica del Content Analyst

20 Gen 2014

Presso Kaspersky Lab, colui che si occupa della verifica dei contenuti viene denominato content analyst (analista di contenuti). In poche parole, il compito del content analyst è creare database che filtrino i contenuti, utilizzati poi dai nostri prodotti. I filtri sono inclusi nelle nostre soluzioni di sicurezza sia per utenti privati, che per aziende. Il modulo responsabile del filtro dei contenuti si chiama Parental Control, per il  primo gruppo di utenti, e Web Control, per il secondo gruppo. Usando gli strumenti implementati per Parental Control, i genitori potranno restringere l’accesso di bambini e ragazzi a siti web inappropriati. Per fare in modo che questo avvenga, l’azienda produttrice del software di sicurezza deve conoscere quale categoria è la più appropriata per ogni sito e capire quale  tipo di contenuto vi viene immagazzinato. E qui entra in gioco il nostro database.

Il lavoro del content analystA quanto pare, non è possibile compilare manualmente il database: secondo Google, oggi Internet contiene circa 15 miliardi di pagine Web. Ecco perché la maggior parte delle ricerche viene fatta da robot. Loro analizzano i contenuti Internet usando il nostro servizio cloud Kaspersky Security Network e, automaticamente, emettono un verdetto su ciascun sito Web. I verdetti vengono caricati sul cloud e usati dalle nostre soluzioni di sicurezza mobili (incluso Safe Browser per iOS) e naturalmente dal resto dei nostri prodotti che li usano per dare più potenza ai componenti di filtro dei contenuti. Il compito dell’analista è insegnare ai robot a classificare correttamente i contenuti Web, mentre quello del robot consiste nel valutare le keyword e le combinazioni di parole di una determinata pagina Web, dati e immagini, e decidere se il contenuto del sito rientra in una determinata categoria oppure no. Se il codice del sito Web contiene alcune combinazioni come, per esempio, “guarda porno online”, “porno gratis” o un numero elevato di immagini dai colori sfavillanti, il robot dovrebbe classificare la risorsa come “Pornografia e contenuti erotici”, in base ai criteri.

Il compito dell’analista è insegnare ai robot a classificare correttamente i contenuti di Internet.

In quanto parte integrante delle loro responsabilità lavorative, gli analisti web devono ogni tanto guardare i “contenuti inappropriati”. Le categorie su cui lavoriamo sono molte e alcune sono particolarlmente pericolose o scioccanti:

  • Droghe;
  • Crudeltà e violenza;
  • Armi;
  • Gioco d’azzardo;
  • Linguaggio osceno.

Generalmente, quando Parental o Web Control sono attivi, le categorie sopra menzionate sono contrassegnate di default dall’amministratore di sistema come “ristrette” .

Uno

Guardare questo genere di contenuti non è affatto piacevole, soprattutto quando entra a far parte della routine di lavoro. In primo luogo perché i contenuti possono variare molto, e non tutti si sentirebbero a loro agio osservando scene esplicite. In secondo luogo, la persona che si occuperà di questo compito deve essere psicologicamente preparata, in grado di controllare le emozioni e con un pizzico di cinismo per non lasciarsi coinvolgere dalla categoria “crudeltà e violenza”. Queste caratteristiche sono esplicitamente indicate nei requisiti dell’offerta di lavoro e vengono nuovamente indicate ad ogni candidato fin dalle prime fasi del colloquio di lavoro.

Tuttavia il nostro lavoro non finisce qui. È difficile descrivere il processo di lavoro e tutte le peculiarità della ricerca dei contenuti negativi su Internet, ma, in generale, la giornata di lavoro tipica si potrebbe riassumere così:

Controllo delle email mattutino

  • Secondo me, questa fase aiuta a entrare nello stato mentale lavorativo e a intuire la carica lavorativa della giornata e i compiti che ci aspettano.

Riunione sul lavoro svolto

  • Ogni giorno alle 11.00 il nostro team si riunisce nella sala riunioni per discutere di tutto quello che è stato fatto il giorno precedente e sui punti importanti della giornata. È parte integrante del processo di lavoro; aiuta a mantenere disciplina e trasparenza, soprattutto quando si lavora in gruppo.

Pausa caffé

  • Il lavoro è importante, certo, ma chi potrebbe lavorare senza un buon caffé!
Due

Segnalazioni degli utenti

  • Ogni giorno il nostro servizio di assistenza tecnica ha a che fare con decine di segnalazioni relative a contenuti che vengono bloccati incorrettamente dai moduli di filtraggio contenuti. Tali richieste vengono passate al nostro team di analisi contenuti che si prende cura di ogni segnalazione, le analizza e envia un feedback all’utente. Inoltre, si occupiamo anche del malfunzionamente del modulo Anti-Banner. Generalmente, ogni richiesta richiede tre giorni di lavoro. Tuttavia, come sempre, prima è meglio è.

Lavoro sulle categorie di contenuti

  • La maggior parte del lavoro del content analyst consiste nel creare nuove categorie e implementare quelle esistenti. Ora supportiamo 15 categorie in 7 lingue; ragion per cui il criterio più importante per poter fare domanda per un posto come web content analyst è un alto livello in una seconda lingua straniera oltra all’inglese. Per questo motivo accettiamo volentieri candidati con laurea in lettere e linguistica e naturalmente con ottime capacità di analisi. In poche parole, il candidato ideale dovrebbe essere una persona formata sia in lingue e materie umanistiche che in matematica, il che è non è certamente comune.

Live test

  • Quando viene classificato il contenuto, il programma bot usa i database creati e implementati dai content analyst. Ovviamente, prima della release, il database viene sottoposto ad un numero molto elevato di test. Il più importante è il live test, un test che simula la vita reale. Questo test viene effettuato giornalmente. Ogni mattina viene creata una lista con i principali siti web; quei siti che non sono stati inclusi nella nostra lista per il test, verrano inviati ai nostri analisti affinché li classifichino. Gli analisti consegnano il loro verdetto sui nuovi siti web e aggiornano il test manualmente. Questo viene fatto per assicurarsi che le categorie assegnate al sito web dai bot corrispondano al verdetto dell’analista. Dato che il contenuto del sito web può cambiare, dobbiamo lavorare costantemente sui test. In linea di massima, realizziamo il test tre volte al giorno, mattina, pomeriggio e sera.
Manga

Formazione

  • Gli analisti del nostro dipartimento sono esperti nella salvaguardia dei bambini e ragazzi dai contenuti inappropriati su Internet: scrivono articoli, pubblicano post su blog, vengono intervistati e invitati a dare conferenze sull’argomento.
  • Nonostante ciò, al di là del numero di articoli scritti, delle conferenze date o delle interviste rilasciate sulla materia, la protezione dei più piccoli dai contenuti pericolosi del Web rimane un tema caldo.

Senza dubbio, esistono mille modi per trovare risorse con contenuti espliciti. Parental e Web Control non rappresentano la soluzione definitiva, ma noi di Kaspersky Lab facciamo del nostro meglio per proteggere utenti, famiglie e colleghi di lavoro da contenuti inappropriati che circolano in rete, mettendo a disposizione utili strumenti per organizzare una linea di difesa.