Google Duplex позвонит вместо вас

На конференции Google I/O в Маунтин-Вью (Калифорния) генеральный директор Google Сундар Пичаи показал, как смартфон позвонил вместо него в парикмахерскую и записал его на стрижку. Обновлённый Google Assistant сам договорился на удобное время в указанный интервал. Затем он автоматически создал напоминание в календаре и уведомил об этом хозяина.

Наверняка вы заметили, что всё больше диалогов между живыми людьми напоминают общение машин. Особенно это заметно в индустрии услуг, где придерживаются единых стандартов качества обслуживания.

Стремясь их соблюдать, к вам всюду обращаются с типовым приветствием и беседуют по жёстко заданному алгоритму. Как бы вы ни говорили, что бы ни спрашивали – в ответ получите лишь шаблонные формулировки. В Google подумали, что с такой беседой ИИ справится лучше живого человека. Она его хотя бы не раздражает.

На протяжении многих лет Google развивала системы распознавания естественного языка и преобразования текста в речь. Благодаря глубокому машинному обучению, их синтез породил принципиально новые возможности. Теперь голосовые звонки бота практически невозможно отличить от совершаемых людьми – настолько точно он копирует мельчайшие особенности произношения.

https://youtu.be/bd1mEm2Fy08?t=42

Обновлённый Google Assistant проявляет гибкость общения. В упомянутой демонстрации бот не просто сделал звонок и проговорил типовую фразу через Google Text-to-Speech. Он проанализировал ответы и на ходу согласовал другой тайм-слот, когда на изначально запрошенное время не оказалось записи. Также он чётко ответил на уточняющие вопросы и убедительно интонировал, создавая эмоциональную окраску беседы.

В первом примере Google Assistant производил впечатление секретарши (что недалеко от истины) и даже использовал особенности голосового общения, до недавнего времени считавшиеся чисто человеческими. Например, в ответ на просьбу подождать, он говорил «угу» (mmm-hmm), а собственные паузы заполнял протяжным «ээээ» (errrr), давая понять, что думает над ответом.

Такие речевые шаблоны применяются в экспериментальной технологии Google Duplex, которую использует Google Assistant, чтобы облегчить голосовые коммуникации в реальной жизни. В следующем примере он делает звонок в ресторан и просит забронировать столик, а дальше разговор принимает неожиданный оборот. Ему не отказывают и не просят выбрать другое время. Вместо этого администратор переспрашивает, а затем сообщает, что бронирование не требуется, если придут четверо.

https://youtu.be/bd1mEm2Fy08?t=166

Бот справился и с этой задачей, в отличие от человека. Администратор не расслышала указанную дату (седьмое число) и подумала, что придёт семь человек. Бот поправил её и уточнил, что будет компания из четырёх человек. Затем он спросил, как долго приходится ожидать свободных мест в указанное время (18:00). Получив ответ, что вечером в будни обычно мало посетителей, и можно просто зайти вчетвером без предварительного бронирования, он чисто по-человечески произнёс: «Oh, I gotcha. Thanks.» и завершил разговор.

Сундар Пичаи пояснил, что технология Google Duplex, вероятно, будет востребована примерно у 60% малых предприятий в США, поскольку они еще не имеют системы онлайн-бронирования. Также бот может обзванивать компании, чтобы уточнять часы работы, а затем сделать эту информацию доступной в Интернете с помощью Google Maps и других справочных сервисов.

Источник: theguardian.com

Загрузка ...
The Robot
Adblock
detector