Lamphone: un nuovo tipo di “intercettazione visiva”

Una lampadina è l’unica attrezzatura specialistica necessaria a Lamphone per intercettare una conversazione in una stanza insonorizzata.

Non molto tempo fa abbiamo scritto di metodi che Mordechai Guri e i suoi colleghi della Ben-Gurion University hanno ideato per estrarre informazioni da un dispositivo che non solo non è connesso a Internet, ma è anche fisicamente isolato dalla rete. Alla conferenza Black Hat USA 2020, un altro ricercatore dell’Università di Ben-Gurion ha presentato una relazione su un argomento affine. Ben Nassi ha parlato di un metodo di intercettazione visiva che lui e i suoi colleghi chiamano Lamphone.

Di seguito parleremo di come funziona Lamphone, ma iniziamo con una breve digressione storica sull’argomento.

Come è possibile “vedere” il suono?

Una tecnologia ben nota per la registrazione a distanza del suono con i cosiddetti metodi visivi è il microfono laser. Questa tecnica è piuttosto semplice.

Le persone che intercettano una conversazione dirigono un raggio laser che opera nel campo degli infrarossi (cioè invisibile all’occhio umano) su una superficie adatta (in genere il vetro di una finestra) nella stanza in cui si sta svolgendo la conversazione. Il raggio si riflette sulla superficie e colpisce il ricevitore. Le onde sonore creano vibrazioni sulla superficie dell’oggetto, che a loro volta modificano il comportamento del raggio laser riflesso. Il ricevitore registra i cambiamenti, che alla fine vengono convertiti in una registrazione sonora della conversazione.

La tecnologia è in uso fin dall’epoca della Guerra Fredda, ed è apparsa in molti film di spionaggio. Probabilmente l’avete vista rappresentata in uno di essi. Diverse aziende producono dispositivi pronti all’uso per le intercettazioni laser, e il loro raggio d’azione dichiarato si estende fino a 500 o anche 1.000 metri. Per coloro che sono preoccupati di essere il bersaglio delle intercettazioni laser, tuttavia, ecco due buone notizie: uno, i microfoni laser sono molto costosi; e due, i produttori vendono microfoni laser solo ad agenzie governative (o così sostengono).

Tuttavia, secondo Nassi, la natura attiva dei microfoni laser è un grave inconveniente. Perché questa forma di intercettazione funzioni, è necessario “illuminare” una superficie con un raggio laser, e questo significa che un rilevatore IR può scoprirlo.

Alcuni anni fa, un gruppo di ricercatori del Massachusetts Institute of Technology ha proposto un metodo alternativo di “registrazione visiva” completamente passivo. La loro idea era in gran parte la stessa: le onde sonore creano vibrazioni sulla superficie di un oggetto. Le vibrazioni, naturalmente, possono essere registrate.

Per registrarle, i ricercatori hanno utilizzato una telecamera ad alta velocità a diverse migliaia di fotogrammi al secondo. Confrontando i fotogrammi della telecamera (con l’aiuto di un computer), sono stati in grado di replicare il suono dalla sequenza di fotogrammi video.

Questo metodo ha però anche un inconveniente, ed è un grosso problema. La quantità di risorse di calcolo necessarie per convertire l’enorme quantità di informazioni visive dalla telecamera ad alta velocità in suono è stata straordinaria. Anche utilizzando una workstation estremamente potente, i ricercatori del MIT hanno avuto bisogno di 2-3 ore per analizzare una registrazione video di 5 secondi, quindi l’approccio non è chiaramente un buon metodo per cogliere le conversazioni al volo.

Come funziona Lamphone

Nassi e i suoi colleghi hanno ideato una nuova tecnica di “intercettazione visiva” che chiamano Lamphone. L’idea principale del metodo è quella di utilizzare una lampadina (da cui il nome della tecnica) come oggetto dal quale si possono catturare le vibrazioni causate dal suono.

Una lampadina non è solo un oggetto molto ordinario, ma è anche un oggetto luminoso. Pertanto, chi usa le vibrazioni di una lampadina non ha bisogno di sprecare risorse di calcolo per analizzare cambiamenti estremamente sottili nell’immagine. Tutto ciò che deve fare è dirigere un potente telescopio verso la lampadina. Il telescopio dirige il flusso di luce dalla lampadina ad un sensore elettro-ottico.

La lampadina non emette la luce in diverse direzioni in modo perfettamente uniforme (è interessante notare che la disuniformità varia anche tra i diversi tipi di lampadine, essendo abbastanza alta per le lampadine a incandescenza e a LED, ma molto più bassa per quelle fluorescenti). Questa irregolarità fa sì che le vibrazioni della lampadina (causate dalle onde sonore) alterino leggermente l’intensità del flusso luminoso che il sensore elettro-ottico cattura. E questi cambiamenti sono sufficientemente percettibili per la registrazione. Avendo registrato i cambiamenti e fatto una serie di semplici trasformazioni, i ricercatori sono stati in grado di ripristinare il suono dalla “registrazione della luce” risultante.

Per testare il loro metodo, i ricercatori hanno installato un dispositivo di ascolto su un ponte pedonale a 25 metri dalla finestra della sala prove, in cui il suono veniva riprodotto attraverso un altoparlante. Puntando un telescopio su una lampadina nella stanza, i ricercatori sono stati in grado di registrare le variazioni di luce e di convertirle in una registrazione del suono.

Le registrazioni risultanti si sono rivelate abbastanza comprensibili. Per esempio, Shazam ha identificato con successo le canzoni di prova “Let It Be” dei Beatles e “Clocks” dei Coldplay, e il servizio di riconoscimento vocale di Google ha correttamente trascritto le parole di Donald Trump da uno dei suoi discorsi della campagna.

Lamphone rappresenta una minaccia concreta?

Nassi e i suoi colleghi sono riusciti a sviluppare un metodo veramente funzionale di “intercettazione visiva”. Ancora più importante, il metodo è completamente passivo e quindi non può essere registrato da nessun rilevatore.

Si noti inoltre che, a differenza del metodo sperimentato dai ricercatori del MIT, i calcoli per la decodifica delle registrazioni al Lamphone sono estremamente semplici. Poiché l’elaborazione non richiede grandi risorse di calcolo, Lamphone può essere utilizzato in tempo reale.

Tuttavia, Nassi ammette che durante l’esperimento, il suono nella sala prove è stato riprodotto ad un volume molto alto. Pertanto, per il momento, i risultati dell’esperimento possono essere principalmente di interesse teorico. D’altra parte, non bisogna sottovalutare la semplicità dei metodi usati per convertire la “registrazione leggera” in suono. La tecnica potrebbe eventualmente essere ulteriormente affinata utilizzando algoritmi di apprendimento automatico, ad esempio, che eccellono in questo tipo di compiti.

A questo punto, i ricercatori valutano l’attuale fattibilità dell’applicazione pratica di questa tecnica non come estremamente difficile o facile, ma come una via di mezzo. Tuttavia, essi prevedono che il metodo possa diventare più concreto, se si è in grado di applicare sofisticati algoritmi di conversione delle letture del sensore elettro-ottico in registrazioni sonore.

Consigli