iPhoneの「Hey Siri」やAndroidの「OK Google」などの音声認識技術、Amazon Alexa、Google Homeなどのスマートスピーカーの登場で、私たちが音声でウェブにつながれるようになって数年が経ちます。
音声インターフェイスが登場するまでは、デバイスごとのボタンやリモコン、スクリーンで操作をする必要がありましたが、これからは音声操作に対応したデバイスがますます普及し、生活をより便利で豊かなものにしていくでしょう。
一方で、「音声はデータである」という事実を、きちんと認識する必要があります。
音声インターフェイスを提供する企業が、ユーザーの音声データをどのように取り扱うのかを、私たちは生活者として注視していかなければなりません。
GAFAMの音声データの取り扱い
2019年、特にこの半年間で、ブルームバーグ、ガーディアン、バイスニュース、ベルギーのニュースチャンネルVRTなどの報道各社は、GAFAM(Google、Amazon、Facebook、Apple、Microsoft)のすべてが、音声アシスタントが録音した音声データを請負業者の人間が使用していることを明らかにしてきました。
こういった報道を受けて、GAFAMは音声データの取り扱いに関する声明の発表や方針の変更などで対応してきましたが、それぞれ異なることに注意が必要です。
各社の事情と方針を見てみましょう(2019年11月時点)。
- Google Homeに搭載したGoogle Assistantによって録音された音声データが内部のレビュアーの手によって数千件漏洩していた(2019年7月、ベルギーの公共放送局による報道)。
- AIアシスタントのGoogle Assistantがリリースされたのは2016年のことで、リリースした当初から録音されている音声が人間によって聞かれていることが問題視されていた。それが2019年4月のAmazonの報道と相まって社会的な問題として再び再注目される形になった。
- Google Assistantの音声技術を構築するプロセスにおいて言語の専門家が音声データをレビューすることは不可欠であるものの、次の対策を講ずることを示した。
- 音声データはユーザーアカウントに関連づけられず、データも長期間保存されない。また、音声データはデフォルトでは保存されず、テキストに書き起こされる音声は全体のうちのわずか0.2%であり、ユーザーは自身の音声データの管理ができるため、保存を止めることも可能だとしている。
Amazon
- Echoに搭載したAIアシスタント(Alexa)を改良するため、Echoが録音した音声データを聞く数千人のスタッフを雇用している。2019年4月のブルームバーグの報道から社会的に問題視されるようになった。
- Alexa音声レビューチームでは、各レビュアーがシフトごとにおよそ1,000件の音声ファイルをチェックする。音声は文字に書き起こされ、注釈が加えられる。
- 他の会社の取り扱いと違っていた点は、Amazonの音声データの取り扱いにおいてはAmazon利用者のアカウント情報と紐づいていたことにあった。
- Echoのユーザーは、自身の録音が開発目的で利用されることを拒否できる。
- FacebookにはSiriやAlexaのような音声アシスタントはないが、Facebook Messengerでのユーザー同士の音声チャットの録音データが外部委託業者に渡っていた(2019年8月、ブルームバーグによる報道)。
- Facebook Messengerでユーザーが音声チャットを書き起こす設定にしている場合、AIが正しく書き起こしているかを確認するために、音声データの一部を人間が聞いていたとコメントしている。
- その後、人間によるレビューは停止すると述べているが、2018年10月から米国のみで発売されているFacebookのスマートデバイス「Portal」の音声入力コマンド「Hey Portal」は人間による文字起こしがなされていることが発覚している。
- 音声データの取り扱いについて、Facebookから明確なポリシーは示されていない。
- ケンブリッジ・アナリティカのスキャンダルに端を発して、Facebookは長年プライバシー保護に取り組んできていること、GDPRへの対応準備の姿勢を示していることから、音声データの取り扱いについてもそのうちポリシーが示される可能性がある。
Apple
- 2019年8月に音声データの漏洩問題が発覚。Siriが収集した音声データを外部委託業者(300人を超える契約社員)が聞いていたことが内部告発された。Appleは音声を第三者が実際に聞く可能性があることを、プライバシーポリシーの中で述べていなかった(詳しくは、Siriの盗聴問題に関するこちらの記事を参照)。
- 8月29日に「Siriのプライバシー 保護機能を強化」を発表。デフォルトで録音音声を保持しないこと、Siriの機能向上という目的のためにユーザーの許可を得る形にすること、Appleの従業員のみによる対応に限ることとした。
Microsoft
- 2019年4月19日に発表したプライパシーポリシーでは、Microsoftの保有するSkypeやCortanaのサービスを通じて録音された音声データを、人間が聞くことを許容する状態にしていた。
- その後、プライバシー保護のためにポリシーを数回更新。音声データをサービス改善のために利用する場合は、匿名化した上で行うとした。
まとめ
音声データの流出や漏洩、企業内の人間による同意のないレビューの発覚などが相次いでいることもあり、各社はプライバシー保護の方向で動いています。
各社の取り組みは、プライバシー保護に関する着実な進歩といえますが、Google、Amazon、Appleなどは依然として音声を技術開発のために人間が聞くことを許容し、ユーザーの自主的な設定変更(オプトアウト)に任せており、プライバシーやセキュリティに関する不安は払拭されないままです。他社の対応も決して充分とはいえず、匿名化処理について明確に触れているのはMicrosoftのみです。
参考までに、Microsoftが2019年4月に公表した調査によれば、80%のユーザーが音声アシスタントに満足しているものの、
- データの安全性に不安 52%
- 積極的に音声を聞いたり録音したりすること 41%
- データを利用(流用)してほしくない 36%
- データのプライバシーに不安 31%
- データがどのように使われるのかわからない24%
- 音声アシスタントを開発している企業を信用できない 14%
- その他 2%
という懸念が示されています。
このような消費者の声に対して、GAFAM各社がどのように真摯に対応するのか。
音声技術(ボイステック)の健全な発展のために、GAFAMをはじめとするテクノロジー企業の動きに、私たち消費者が注目し続けることが大切です。