私たちが普段、何気なく発している声。
その声がある日、重要な証拠となり、あなた自身や他者を救い、真実を導き出すカギになるシーンがあります。「防犯カメラがない」「目撃者もいない」。そんな状況でも、録音された声が証拠として採用され、事件解決に結びつくケースもあるのです。
合成音声など音声に関するテクノロジーが進化する中で、テレビドラマなどでよく耳にする「声紋鑑定(声紋分析)」がどのような仕組みで、どれほどの信憑性を持つのかが気になったことはありませんか?
今回は、声紋鑑定の歴史と技術進化を振り返り、現代における「声の証拠」の確実性に迫ります。
声紋鑑定の始まり
声紋鑑定の歴史は、1960年代のアメリカからはじまります。
脅迫電話などの事件が横行する中、当時のFBIは「声の特徴」に注目し、鑑定技術の開発が進められました。
声紋とは声を波形やスペクトル(周波数の分布)として可視化したもので、指紋のように個人によって異なることから「声紋」と呼ばれています。初期の声紋鑑定は、録音された音声のスペクトログラム(音声の周波数分析図)を目視で比較し、話者の特定を試みる方法でした。
しかし、当時の技術では音質が悪く、さらに雑音が混じっていたりすると正確性に欠け、証拠として採用されることは限定的でした。1973年にはアメリカ科学アカデミー(National Academy of Sciences)が「声紋鑑定は証拠として信頼性に欠ける」との見解を示し、一時は司法現場での活用が停滞した時期もあります。
参考:National Research Council, 1973
音声解析技術の進化と再評価
声紋鑑定が再び注目されるようになったのは、1990年代以降。
デジタル技術の飛躍的な進化により、コンピュータによる音声解析が可能となり、従来よりもはるかに高精度に声の特徴を数値化し比較できるようになりました。
現在では、音素(子音・母音)の発声パターン、周波数、話速、抑揚、間の取り方など、複合的なデータをもとに、話者の識別が行われます。さらに、人工知能(AI)を活用した音声認識システムが開発されており、従来のような声の波形の「目視確認」とは異なる、いっそう客観的で再現性の高い解析が可能となっています。
日本における声紋鑑定の導入と課題
日本でも、声紋鑑定は刑事事件の捜査や裁判で徐々に活用されるようになっています。2000年代以降には、脅迫電話や詐欺事件で音声証拠が重要な役割を果たした事例が報告されています。
警察庁科学警察研究所は、音声個人識別技術の研究を継続的に進めており、「連絡」や「爆弾」といった短い単語レベルの発声からも個人識別ができるような最新の声紋鑑定技術を活用した実証実験も行われています。
しかし、日本では依然として声紋鑑定の「絶対的証拠性」については慎重な姿勢が取られており、音声のみで犯人を断定するケースは少数です。背景には、録音環境の差、音質劣化、話者の意図的な声色変更など、現実的なハードルがあるからです。そのため、多くの場合、音声証拠は「補強証拠」として他の証拠と組み合わせて活用されています。
合成音声の登場と、声紋鑑定の新たな課題
AI技術の発展により、声紋鑑定の精度が高まる一方で、新たな懸念も浮上しています。それが「合成音声(ボイスクローニング)」による偽装の可能性です。
近年では、実在の人物の声を数十秒〜数分録音するだけで、本人そっくりの音声をAIが自動生成できるようになっています。実際、著名人の声を無断で模倣した偽動画がSNSで拡散されるなど、社会的な問題としても耳目を集めています。
このような合成音声は、「聞いた印象」では本物と区別がつかないほど精巧です。そのため、犯罪捜査や裁判で音声が証拠として提出された際、「その音声が本物か」「誰が話しているのか」に加えて、「人間の声か、合成音声か」を判別する必要が出てきています。
実際、法科学の現場では、合成音声に対応するための音響分析技術の開発が進んでいます。人間の声は、喉の振動や呼吸の乱れ、自然な間合いなど、人間特有の微細な揺らぎが存在します。これに対し、合成音声は基本的に「滑らかすぎる」あるいは「不自然な揺らぎを持つ」といった特徴があり、周波数や波形の解析によって判別可能とされています。
警察庁科学警察研究所や大学などの研究機関でも、合成音声を識別するアルゴリズムの研究が進んでおり、法的証拠としての音声の信頼性を担保する技術基盤が整いつつあります。東京大学の研究チームは、合成音声のスペクトル特徴を機械学習で識別するモデルを開発しており、一定の精度での識別が可能になっていると報告されています。
参考:東京大学・猿渡・齋藤研究室 研究資料「音声合成・変換その2」(PDF)
とはいえ、AI合成音声の生成技術も日進月歩で進化しており、イタチごっこのような状況が続いています。今後は、声紋鑑定の信頼性を担保するためにも、「録音の真正性」や「音声の出所」を立証するための技術や法制度の整備がますます重要となるでしょう。
記録を続けることで、残る証拠に
AI技術の発展により、声紋鑑定は今後ますます高精度化し、身近な技術になると予想されます。特に、録音アプリや文字起こしツールを活用することで、より簡単に「声の記録」を残すことが可能になっています。
たとえば、私たちVoista Media編集部も開発に関わるiOS向けAI録音アプリ「Voistand」では、バックグラウンドで録音でき、クラウドでデータが保存されるため、スマホの容量は気にせずに長時間録音が可能です。さらに、いつ録音されたかはカレンダーUIで振り返りやすく、場所も位置情報から自動で記録されます。また、リアルタイムに文字起こしができるため証拠保全の観点でも有効です。
特にハラスメントやDVといった、「いつ起こるかわからない」「証言が一方的になりやすい」という状況を考えると、いつも手元にあるスマートフォンでの録音が、自分を守る手段としておすすめです。
声そのものは発するとすぐに消えてしまうものですが、録音し記録し続けることで、日記のように「残る証拠」として活用できます。これからは、誰もが簡単に自分の身を守る「声の盾」を持つ時代になるのかもしれません。
まとめ
声紋鑑定は、かつては「不確かな証拠」とされていましたが、技術の進歩によって信頼性が高まり、今や犯罪捜査や自己防衛の現場で重要な役割を果たしています。
録音技術の進化と、私たち一人ひとりのリスク管理意識が結びつけば、「声」はただの音ではなく、大切な「証拠」として私たちを守ってくれるでしょう。
もしもの時に備え、日常の中で自分の声を記録する習慣を持つこと。それが、新しい自己防衛の第一歩になるのかもしれません。