Подслушивают ли нас голосовые помощники?

В обсуждениях на Reddit пользователь ReshKayden объяснил понятным языком принцип работы голосового помощника Echo от Amazon. На вопрос «если голосовые помощники запускают прослушивание только после того, как вы скажете «Окей, Google», то как они узнают, что вы сказали «Окей, Google»?» он написал:

«Не могу комментировать про устройства Google, но у меня есть несколько друзей, которые работают в подразделении Alexa в Amazon, и большая часть работы устройств Alexa / Echo является общедоступной, особенно если вы являетесь разработчиком приложений или занимаетесь проектами «умных домов». Поэтому я действительно не раскрываю никаких крупных секретов здесь.

У устройств Echo есть два основных режима обработки звука. Первый связан с небольшим микропроцессором, подключенным к микрофону, который содержит только 50 — 60 кб встроенной памяти. Его единственная цель — слушать пробуждающее слово: «Алекса» или «Эхо». Для этого он не делает никакой реальной обработки языка, он только слушает разные комбинации слогов. Вот почему Echo и подобные устройства не могут быть запрограммированы на произвольные слова.

Как только чип услышит «слово пробуждения», он активирует основной чип ARM, в котором работает урезанная версия Linux. Этот процесс запуска занимает чуть меньше секунды, в течение которого микропрограммный чип имеет едва достаточное количество памяти для того, чтобы записать в буфер то, что вы говорите, если вы сразу начнете говорить после пробуждения без паузы. Как только чип ARM включается, загорается синее кольцо сверху и начинается запись. Чип прошивки добавляет свой кусок записи из буфера в начало записи. Только основной чип ARM и ОС имеют доступ к сетевому интерфейсу и могут посылать информацию на сервер.

Цель второго этапа — определить, что услышанное является законченным вопросом или предложением. Amazon не хочет обрабатывать фоновый шум — это будет пустой тратой пропускной способности и ресурсов сети. Для этого есть рудиментарный шаг обработки естественного языка, сделанный локально, чтобы определить, когда вы сказали реальное предложение и перестали говорить. Он также обрабатывает очень простые «локальные» команды, которые не требуют обработки сервера, например, «Alexa stop». Только после локальной обработки полное предложение отправляется на реальные серверы AWS для обработки.

Физически невозможно, чтобы устройство постоянно тайно слушало владельца, так как микрофон, сетевой контроллер, основной чип, синее светодиодное кольцо и основной чип ARM просто не подключены для этого, с точки зрения электропитания. Если вам интересно подтвердить что-либо из вышеперечисленного, попробуйте отключить домашний интернет и немного поиграть с Alexa. Вы увидите, что она понимает, что что-то пошло не так только на последнем этапе, когда она пытается отправить локально обработанное предложение на сервер.

Что касается рассказов о «мистических» совпадениях в рекламных предложениях, возникающих якобы из-за того, что вы говорили в присутствии Alexa – это просто показывает, насколько точными профилями покупателей обладают рекламодатели в настоящее время. Они могут отслеживать все, что вы делали, через все устройства, которые у вас есть, а затем делать просвещенные догадки о том, что вам, вероятно, интересно, поэтому им даже не нужно подслушивать за вами в вашем доме.»

Такое объяснение безусловно не исключает возможность быть подслушанным, однако оно дает понять, что значительно проще установить отдельный подслушивающий микрофон, чем переделывать устройство голосового помощника. Поэтому в следующий раз, когда зайдет спор о том слушают ли нас постоянно, скиньте этот пост, чтобы отмести часть сомнений.

«Если у вас паранойя — это не значит, что за вами не следят» 😉

Оригинальный текст на Reddit

Загрузка ...
The Robot
Adblock
detector