テックコラム

業界トレンドニュース

コネクティッドソリューションズ社、世界最高水準の音声×顔認証技術を開発

パナソニック株式会社テクノロジー本部と社内分社のコネクティッドソリューションズ社(以下、CNS社)は、アメリカの大学研究グループと共同研究したマルチモーダル認証技術を開発しました。

複数の技術を組み合わせた話者識別技術

話者識別技術は、発声者が誰であるかを識別する技術ですが、従来の技術では周囲環境による騒音や音声のゆがみ・反響などの影響で正しい識別ができなくなるという問題がありました。

2019年からアメリカの大学と共同研究で性能改善に取り組み開発されたこの技術は、アメリカの大学研究グループ開発のディープラーニングx-vectorシステムと言語識別アルゴリズムに、CNS社開発のtransformerを含む複数の話者識別ニューラルネットワークを組み合わせることにより、性能が大幅に改善されました。

話者識別技術概要

話者識別技術マルチモーダル認証(顔×声)

より高い精度につながるマルチモーダル認証技術

音声は、電話や動画など収録された時の状況により異なる特徴があります。それらも今回開発された技術により、アメリカ国立標準技術研究所のベースラインモデルに比べ3.7倍の話者識別精度を上げることに成功しています。

音声×顔認証のマルチモーダル認証技術として顔が分かる状況での本人認証はもちろん、顔が隠れているような状況でも個人認証の精度が向上し世界最高水準と実証されました。

今後は指紋認証技術などと組み合わせることによって、より安心・安全な「非接触マルチモーダル認証ソリューションサービス」の創出などが期待されます。

(画像はプレスリリースより)

この記事をシェアする

  • Twitter
  • Facebook
  • linkedin
今すぐ資料ダウンロード