本記事では、自社の顧客対応窓口への音声認識システム導入を検討したい方向けに、「音声認識とは何か」という概要に加えてコンタクトセンター業界が抱える課題や音声認識システムを導入することで実現できること、導入メリットなどについてわかりやすく解説しています。
「音声認識」とは
音声認識(Speech to Text)とは人工知能(AI)によって音声をテキストデータに変換する技術のことです。入力された音声データを音響モデルや言語モデル、発音辞書を使って判別し、文字化します。
スマホでGoogleの音声アシスタントを起動して「OKグーグル、〇〇探して」と言うと適切な検索結果が返ってくるのは、音声認識技術を利用しているからです。スマホがユーザーの発話をサーバーへアップロードし、音声認識でテキスト化し、自然言語処理を行って意味や内容を理解しています。音声で操作するスマートスピーカーもおおむね同じ仕組みです。
音声認識技術は、雑音が少ない高品質の音声であれば90%以上の認識精度で人間と同様の聞き取りが可能だと言われています。実用化も進んでおり、ビジネスの場では会議の議事録作成やシステムへの音声入力などで利用されています。
コンタクトセンター業界における現状
この音声認識技術の活用が進んでいるのがコンタクトセンター業界です。コンタクトセンターとは、従来電話で顧客と連絡を取っていたコールセンターが、チャットやメールなど電話以外の連絡手段を持ったことから呼ばれるようになった名称です。
ここではまずコンタクトセンターが直面している現状と課題について解説します。
応対品質の管理
コンタクトセンターのオペレーターは属人的な業務のため、どうしても担当者によって応対品質にばらつきが出やすくなります。基本のマニュアルはありますが、話し方や案内する内容などはオペレーターによって異なります。中には間違った案内をしてしまったり不適切な表現をしてしまったりすることもあります。
以前は応対内容が当事者以外に知られることはそれほどありませんでした。けれども、最近ではTwitterに代表されるSNSの普及に伴って、不適切な対応や不親切な振る舞いはすぐにインターネット上で拡散してしまうようになっています。これはさらなるクレームに繋がる可能性になるだけでなく、「〇〇(企業名)の担当者が嫌な対応をした」など担当者の対応がそのまま企業・ブランドのイメージを棄損するリスクにも繋がります。そのため、オペレーターごとの応対のばらつきを少なくして安定した応対品質を保つことが課題になります。
オペレーター不足
今や人手不足は社会的な問題になっていますが、コンタクトセンター業界ではそれが特に顕著です。非正規雇用が多く給与水準もそれほど高くないといった待遇面に起因する採用難だけでなく、ストレスが多い職場のため採用後の離職率が高い、若い世代の電話離れによる業務への不人気などの要因も背景にあります。
さらにオペレーターは採用後に一定期間の研修を受講するのが一般的ですが、コスト削減や人手不足のために研修が不足した状態で実務に入るオペレーターも少なくありません。スキル不足から応対がうまくできずにストレスになり、それがまた離職に繋がるという悪循環も起きています。そのため、採用を増やすことが難しい場合は離職率を下げるなど、人材を確保することが課題になります。
「顧客の声」の分析が困難
大量のデータを分類・分析するデータマイニングは、企業にとって現状把握や改善を行う手法として重要度を増しています。
顧客の声を直接拾うコンタクトセンターが蓄積するデータは、「生の声」として非常に有用です。しかし従来のコンタクトセンターでは、応対後にオペレーターが履歴を手入力していることもありました。そのため、担当者によって書き方や表現が異なったり、主観を交えてしまったりするという問題が発生しているのです。そのほかにも時間がなくて簡略化してしまうため内容も分量もばらばらで、分析時に使用しにくいデータになる、分析しても判断がしにくい、といった状況も生み出しています。そのため、書き方にルールを設けるなど分析を行いやすい形式で履歴を保存することが課題になります。
音声認識システムを導入する前に検討すべきこと
音声認識システムを選ぶ際には「導入して自社のどんな課題を解決したいのか」という目的を明確にすることが最重要ですが、それ以外にもいくつか検討すべきことがあります。
音声認識の精度
録音品質が高い状態での音声認識精度は80~95%と言われ、人間と同程度の高さとなります。しかし雑音などが含まれたり聞き取りにくい発声だったりすると、それだけ精度が低下します。そのため良い品質で録音できる環境づくり、はっきりとした話し方の徹底などを検討する必要があります。
データ分析機能
今やコンタクトセンターにおいて全件録音を採用する企業も多く、それらデータを活用しようという動きが進んでいます。音声をテキスト化することでビッグデータ分析用やAIの学習用としての活用が期待できます。しかし、何に活用するかが明確でないと、ゴールが見えず、目に見える成果を上げることは困難になります。顧客満足度を高めたい、オペレーターの品質を向上したい、など目的を明確にすることが必要です。
セキュリティ面
コンタクトセンターで扱うデータには個人情報や決済情報など重要な情報を多く含みます。そのためオンプレミス型、クラウド型のどちらを選択するにしても、アップロードした一時データの削除やVPN接続など、セキュリティがしっかりして安全性が高いシステムを選択する必要があります。
まとめ
音声をテキスト化する技術を活用した音声認識システムは、コンタクトセンター業界の課題解決に役立つ手段として期待され、導入が進んでいます。オペレーターの応対を支援する、スーパーバイザーの業務を効率化するなど多くのメリットがありますが、導入前に自社の状況や効果を最大にするための環境整備などを検討する必要があります。
この記事の推奨者
- TOPIC:
- 課題・ソリューション