Η ερευνητική ομάδα, με επικεφαλής τον Επίκουρο Καθηγητή Jun Han από το NUS Computer Science, δήλωσε ότι ο LidarPhone, ο αισθητήρας που επιτρέπει στο ρομπότ να περιηγείται στο σπίτι με ασφάλεια, μπορεί να επανατοποθετηθεί σε ένα μικρόφωνο που βασίζεται σε λέιζερ για να παρακολουθεί τις ιδιωτικές συνομιλίες.
"Ο πολλαπλασιασμός των έξυπνων συσκευών - συμπεριλαμβανομένων των έξυπνων ηχείων και των έξυπνων φωτογραφικών μηχανών ασφαλείας - έχει αυξήσει τους δρόμους για τους χάκερ να παρακολουθούν τις προσωπικές μας στιγμές", δήλωσε ο Σριράμ Σάμι, φοιτητής διδακτορικού που συνεργάζεται με τον Jun Han, επίκουρο καθηγητή στο NUS Computer Science.
Ο Σάμι συνέχισε: "Η μέθοδος μας δείχνει ότι είναι πλέον δυνατό να συλλέξουμε ευαίσθητα δεδομένα μόνο χρησιμοποιώντας κάτι τόσο αβλαβές όσο μια ηλεκτρική σκούπα τύπου οικιακού ρομπότ. Η δουλειά μας καταδεικνύει την επείγουσα ανάγκη εξεύρεσης πρακτικών λύσεων για την αποτροπή τέτοιων κακόβουλων επιθέσεων."
Όπως εξηγείται από την ερευνητική ομάδα, μια κοινή ηλεκτρική σκούπα ρομπότ μπορεί να κατασκοπεύσει τις πιο ιδιωτικές συνομιλίες σας ως εξής: Ο πυρήνας της μεθόδου LidarPhone είναι ο αισθητήρας Lidar, μια συσκευή που εκτοξεύει ένα αόρατο λέιζερ σάρωσης και δημιουργεί έναν χάρτη του περιβάλλοντος χώρου του. Αντικατοπτρίζοντας τα λέιζερ από κοινά αντικείμενα, όπως ένα κάδο απορριμμάτων ή μια τσάντα που βρίσκεται κοντά στο ηχείο του υπολογιστή ή στη γραμμή ήχου της τηλεόρασης, ο εισβολέας θα μπορούσε να λάβει πληροφορίες για τον αρχικό ήχο που έκανε τις επιφάνειες των αντικειμένων να δονείται. Χρησιμοποιώντας τους εφαρμοσμένους αλγόριθμους επεξεργασίας σήματος και πληροφορίας, η ομιλία θα μπορούσε να ανακτηθεί από τα δεδομένα ήχου και θα μπορούσαν ενδεχομένως να ληφθούν ευαίσθητες πληροφορίες.
Στα πειράματά τους, οι ερευνητές χρησιμοποίησαν μια κοινή ηλεκτρική σκούπα ρομπότ με δύο πηγές ήχου. Το ένα ήταν η φωνή ενός ατόμου που διαβάζει από ένα ηχείο υπολογιστή, ενώ η άλλη πηγή ήταν μουσικά κλιπ από τηλεοπτικές εκπομπές που παίζονται μέσω τηλεοπτικής γραμμής ήχου.
Η ομάδα συνέλεξε περισσότερες από 19 ώρες ηχογραφημένων αρχείων ήχου. Το σύστημα μπόρεσε να εντοπίσει τα ψηφία που εκφωνούνται δυνατά, τα οποία θα μπορούσαν να αποτελούν τους αριθμούς πιστωτικής κάρτας ή τραπεζικού λογαριασμού του θύματος. Μουσικά κλιπ από τηλεοπτικές εκπομπές θα μπορούσαν ενδεχομένως να αποκαλύψουν τις προτιμήσεις θέασης του θύματος ή τον πολιτικό του προσανατολισμό.