労働人口減少による採用難やベテラン社員の離職の背景から生成AI活用に向けた戦略検討は企業にとって避けて通れないものになってきました。
また、生成AIを取り巻く動きはめまぐるしく変化しており、日々新たな技術や概念が生みだされています。
その中でも2023年頃から話題となっている「RAG」。よく耳にしますが、正しく理解でていますか?
お客様対応のシーンで生成AIを使いこなすために必要なRAG。
RAGに必要なデータを準備するために重要なナレッジ。
今回はRAGとナレッジマネジメントの関係性、秘めている可能性について、ベルシステム24で生成AIに向き合ってきた中原と数多くのプロジェクトを推進しナレッジマネジメントに精通している衣笠へのインタビューをとおして、深く探っていきたいと思います。
生成AI時代の到来で再注目されるナレッジマネジメント
菊池:最近、ナレッジマネジメントについてお客様からご相談を受けることが増えているという話を耳にしますが、具体的にどのくらい増えているのでしょうか?
衣笠:はい、確かに増加傾向にあります。数年前に比べても10倍以上に増えています。
菊池:その背景には何があるのでしょうか?
衣笠:大きな要因として、生成AI活用への関心が高まっていることが挙げられます。多くの企業が生成AIを活用したいと考えていますが、実際に導入しようとすると、既存のマニュアルやQAなどの社内ナレッジが整理されていないことが要因でうまくいかず、ナレッジマネジメントの必要性を認識するというケースが増えています。
菊池:生成AI導入の取り組みを進める過程でナレッジマネジメントの重要性に気づくということですね。
衣笠:はい。生成AIを使って何かしたいというした相談からスタートすることも少なくありません。しかし、具体的に何をしたいのか、どんな効果を上げたいのかが明確になっていないというお客様もいらっしゃいます。
菊池:生成AIの導入が目的で手段がナレッジマネジメントになっているというケースですね。しかし、ナレッジマネジメントは生成AI導入以外の場面でも必要だと思うのですが、生成AI導入以外の目的でのニーズはどのようなものがありますか?
衣笠:ナレッジマネジメントは、生成AI導入の有無に関わらず、CX(顧客体験価値)の向上や業務効率化など、様々な目的において重要です。
菊池:まさに日々お客様と接するコンタクトセンターにおいては、ナレッジの可視化、構造化、最新化の仕組みづくりという一連のナレッジマネジメントが必須だということですね。
衣笠:はい。データを整理し、分析可能な状態に保つことが、様々な改善活動の基礎となります。音声のテキスト化やQAの分析など、ナレッジマネジメントを適切に行わないと、重要な情報が暗黙知のまま埋もれてしまう可能性があります。
ナレッジマネジメントの実践とポイント
菊池:コンタクトセンターにおけるナレッジマネジメントの重要性がわかったところで、次にナレッジ整備をするうえでの重要なポイントを教えていただけますか?
衣笠:運用とシステムの双方が重要になります。どちらか一方だけではなく、両面から取り組むことが必要です。運用面では、暗黙知をなくす取り組みが重要です。そのためには全てのオペレーターがシステムからQAを抽出し、それに基づいてお客様に回答することが求められます。コンテンツ整備に関しては、データの構造化が鍵となります。お問い合わせ内容(Q)、お客様の状況(契約状況、環境、居住地など)、そして回答(A)をセットで整理する必要があります。
菊池:ベテランオペレーターはQAを見なくても答えられると思うのですが、敢えてQAを抽出することを運用に組み込むということですね。FAQページでよく見られる「この情報は役に立ちましたか?」というようなオペレーターからのフィードバック機能も必要でしょうか?
衣笠:はい、そういった評価機能は重要です。ナレッジの質を判断するためには、オペレーターからのフィードバックが不可欠です。また、誰がどのくらいナレッジを使用しているかなどを把握するためのレポート機能も必要です。さらに、新しい問い合わせに対応した際に、オペレーターがエスカレーションした内容を、ナレッジチームが迅速に新しいナレッジとして作成できる仕組みも重要です。
菊池:運用設計においては、様々は機能を果たすためのポイントがあるのですね。次にシステムについてもう少し詳しく教えていただけますか?コンタクトセンターではよくあるお話しだと思うのですが、例えば、お客様が複数の課題を持っている場合や、状況によって回答が異なる場合はどのようにシステムで対応するのでしょうか?
衣笠:顧客の状況によって変わる部分については、例えば「顧客基幹システムのここを確認してください」といった指示を入れることで対応します。全てのパターンを網羅するのは現実的ではないので、適切な情報源を示唆する形にします。また、一つの質問に対して複数のQAが関連する場合が多いので、関連ナレッジとして紐付けておき、オペレーターが必要に応じて参照できるようにします。
菊池:全てを網羅しようとしないこと、関連するナレッジを適切に紐付けることが重要なポイントということですね。
衣笠:その通りです。例えば「自分の料金はいくらですか?」という質問に対して、「自分が安くなるプランは何がありますか?」といった関連する質問を紐付けておくことで、より効果的な対応が可能になります。
菊池:では、次にお伺いしたいポイントは膨大なナレッジがある場合の効果的な整理方法です。これには多くのコンタクトセンターが頭を悩ませているのではないかと思います。
衣笠:よくあるケースですね。その場合、基本的には「よくあるお問い合わせ」から整備していくのが王道です。長年運営されているコンタクトセンターでは、二度と使われないQAが多く残っていることがあります。これらが検索性を下げる要因になっていることも多いのです。
我々のアプローチとしては、まず音声をテキスト化して、例えば1年分のQAを分析します。そうすると、実際に使用されているQAが300個程度で、センター内には数千のQAが存在するといったケースがよくあります。
その場合、300個のQAを精査し、残りをアーカイブ化します。これにより、まずは使用頻度の高い300個の検索性を上げることができます。アーカイブ化したものの中から必要なものが出てきた場合は、その都度本編に戻して整理していくという方法を取っています。
菊池:知識がない状態だと、膨大なナレッジを一箇所に集めて、カテゴリー別に分けようとしがちですが、それでは構造化も難しく、何が使われているのかもわからないままになりそうですね。使用頻度の高いものから逆算して整理していけば、より意味のあるものになるということですね。
衣笠:そうです。全てを一度に整理しようとすると、膨大な工数がかかってしまいます。よく使われるものを中心に整理し、新たな問い合わせが来たときに即座に対応していく方が、コストパフォーマンス的にも優れています。
菊池:ちなみに生成AIを活用する場合と、そうでない場合でナレッジの整備方法に違いはありますか?
衣笠:基本的なアプローチは変わりません。ただし、例えばチャットボットの導入を目指す場合は、QAの中でもチャットボットで対応可能なものにフラグをつけるなど、目的に応じた微調整は必要になります。
菊池:生成AIの活用に関わらず効果的なナレッジマネジメントのアプローチは、様々なポイントを抑える必要があるということですね。
ありがとうございます。
生成AI活用に潜む課題とナレッジマネジメントの関係性
菊池:ここまで衣笠さんに生成AI活用を見据えたナレッジマネジメント整備のニーズの高まり、ナレッジマネジメントの重要性、実践のポイントをお伺いしてきました。ここからは生成AIにずっと携わってこられた中原さんに生成AIの回答精度を上げるために、ナレッジのデータベースをどのように整えるべきかについてお伺いしていきたいと思います。
中原:はい。これはDX(デジタルトランスフォーメーション)の領域の話になります。
整備されたデータを活用することでAIモデルの精度も上がっていきます。つまり、ナレッジマネジメントによってデータが整備されることで、AIの精度が上がり、活用の幅も広がっていくのです。
菊池:生成AIを効果的に活用するためには、まずはデータ整備が重要だということですね。ところで生成AIを活用する際、ナレッジデータベースはどのように扱われるのでしょうか?既存のデータベースをそのまま使用するのか、それとも新たなデータベースが必要になるのでしょうか?
中原:基本的には、生成AI用の新たなデータベースが必要になることが多いですね。既存のデータがどのような形式で保存されているかにもよりますが、効率的に検索できるようデータを加工することが多いです。
例えば、書籍の目次のように、インデックスを付けて効率よく情報を検索できたり、そのインデックスにベクトル化したデータを使って、キーワードが完全に一致しなくても類似した内容を検索できるようにすることもあります。
菊池:つまり、構造化されたナレッジを含むデータを更に有効に活用するための技術が存在するということですね。
中原:はい。生成AIの分野では日々新しい技術が生まれており、精度向上のためにさまざまなアーキテクチャが提案されています。
最近よく耳にするRAG(Retrieval-Augmented Generation)は生成AIが知り得ない社内情報なども回答できるようにする技術なのですが、ナレッジマネジメントとのシナジーが期待できると思います。
菊池:そうなのですね。ベクトル以外にも、生成AI関連の技術がどんどん生まれているそうですね。具体的にはどのような技術があるのでしょうか?
中原:はい。技術の進歩は日々目覚ましいものがあります。ベクトル検索以外にも、例えばグラフデータベース(Graph DB)という技術があります。これらは全く異なる仕組みでデータを格納し、検索を行います。ベクトル検索は主に類似性の検索に強みがあります。一方、グラフデータベースは比較的新しい手法で、データ間の関連性を検索するのに優れていると言われています。面白いのは、これらの技術を組み合わせたハイブリッドアプローチも登場していることです。ベクトル検索とグラフデータベースを組み合わせることで、さらに性能が向上する可能性があります。
菊池:そうした新しい技術を導入する際の課題はありますか?
中原:はい。大きな課題の一つがコストです。技術を組み合わせれば組み合わせるほど、システムの複雑性が増し、それに伴いコストも上昇します。そのため、システムをどのように組み立てるかが重要なポイントになります。精度だけを追求していくと、研究開発(R&D)の領域に近づいていきます。確かに精度は向上するかもしれませんが、現実的ではないほどのコストがかかってしまう可能性があります。
菊池:つまり、生成AIの導入には技術の選択と効果、コストのバランスを図ることが重要だということですね。
中原:そういうことになります。企業のニーズ、予算、求める精度などを総合的に考慮し、最適なソリューションを選択することが重要です。最新技術を追いかけるだけでなく、それが本当に必要かどうかを見極める目も必要になってきます。
菊池:生成AI技術の進化の速さと、それを実際に活用する際の現実的な課題がよく理解できました。ここから少し違う視点で見ていきたいのですが、実際のコンタクトセンターでは、1つの問い合わせではなく、複数の問い合わせを一度にお受けすることが多いと思うのですが、生成AIを使ったQAシステムでは、複数の質問に対して一度に適切な回答を生成できるのでしょうか?
中原:実は、それは現状では難しい課題の一つです。複数の質問が含まれると回答の精度が落ちてしまう傾向があります。そのため、入力された質問を適切に処理し、必要な情報を抽出するプロセスが重要になります。例えば、入力された自然言語をそのまま検索にかけるのではなく、まず質問の数を判断したり、文章を咀嚼したりするステップを踏みます。そして、それぞれの質問に対して適切な情報を検索し、最終的にそれらの情報を統合して回答を生成します。
菊池:つまり、生成AIがあれば複合的な質問に対する回答が簡単に出てくるというわけではないのですね。
中原:そうです。ただし、ユーザーにとっては「簡単に回答が出てくる」ように見えるシステムを提供することが私たちの使命です。裏側では複雑な処理を行っていますが、ユーザーにとっては「なんかいい感じで回答が返ってくる」と感じられるようなシステムを目指しています。
菊池:この技術はまだ発展途上なのでしょうか?
中原:はい。まさに発展途上の技術です。様々な研究機関や企業が精度向上のための手法を日々研究しています。例えば、検索が必要かどうかを判断するステップを追加したり、検索結果の妥当性をチェックしたりするなど、様々な工夫が重ねられています。現時点では、RAGを使用するこの手法が、コストパフォーマンスの面で注目されています。モデルの再学習に比べて、比較的低コストで精度を向上させられる可能性があるからです。
正直なところ、コスト面での大幅な改善はまだ見込めていません。現状では、ビジネスでの利用にはまだ課題が多いと感じています。精度を上げようとすると運用コストが膨らみ、海外のクラウドサービスを使用するため為替の影響も受けやすく、通常のインフラより高額になりがちです。そのため、大規模な業務改革と組み合わせたり、ある程度精度を妥協したりするなど、個々の状況に応じた戦略が必要になると思います。
菊池:目的を設定したうえでそれに見合うROIが出せるのかという判断が必要ですね。
中原:はい。ROIを重視するのか、顧客満足度の向上を目指すのかなど、目的をしっかり定めることが重要です。生成AIを導入したからといって、必ずしもコストが下がるわけではありません。
菊池:ところで生成AIを活用する上で、RAGは絶対に必要なのでしょうか?
中原:用途によって異なります。社内の特殊な情報や最新の情報など、AIが学習していない内容を扱う場合はRAGが必要になります。これは、AIが知らない情報について誤った回答をする「ハルシネーション」を防ぐためです。ただし、単純なチャットボット機能や、高い精度を必要としないサービスの場合は、無理にRAGを使う必要はないと思います。
菊池:つまり、エンターテイメント的な用途ではRAGが不要な場合もありますが、コンタクトセンターの業務では必要になる可能性が高いということですね。
中原:はい。ただし、コンタクトセンター業務でも、絶対に間違いが許されない分野では、従来の100%精度が出る手段が使えるのであれば、そちらを選択した方が無難です。
菊池:つまり、完全に人の業務を置き換えるのではなく人とAIで業務を分担するようなハイブリッド運用が理想形になりそうですね。その場合、AIの精度や限界を見極め、適切な運用設計ができる人材が重要になってきますね。今後は、AI技術とコンタクトセンター運用の両方に知見がある企業の強みが発揮されそうです。
中原:はい。技術だけでなく、運用面も含めた総合的な提案ができることは大きな強みになると思います。単に最新技術を導入するだけでなく、既存のナレッジマネジメントシステムとの適切な運用や、人の役割の再定義など、多面的なアプローチが必要です。技術と運用の両面から最適な解決策を提案できる企業が、今後のAI活用において重要な役割を果たすことが予想されます。
ナレッジマネジメントや生成AI導入の推進している方へ
菊池:コンタクトセンターで生成AIを活用するためのポイントとナレッジマネジメントの重要性についてよく理解できました。では、ここでナレッジマネジメントに長年取り組んでいる方や、これから始める方へのアドバイスをお願いします。
衣笠:ナレッジマネジメントは単にシステムを導入すれば解決する問題ではありません。運用面とシステム面の両方を並行して取り組むことが重要です。具体的には、ナレッジの整備、使用促進のための運用体制の構築、コンテンツの更新、新規コンテンツの作成支援などの運用面と、検索性能の向上、評価機能の実装、レポート機能の整備などのシステム面の両輪がうまく回ることが成功の鍵です。また、ナレッジマネジメントの専門チームを設置することも重要です。SVの方々が兼務で行うには限界があるため、特に立ち上げ期や大規模なプロジェクトでは専任の担当者が必要になります。
菊池:ありがとうございます。ナレッジ整備、コンテンツ作成、運用設計、システム導入という視点で進めていくことで効果的なナレッジマネジメントが構築されるということですね。では、中原さん生成AI活用推進の担当者へのアドバイスはありますか?
中原:生成AI活用推進は難しい課題です。多くの企業が外部パートナーの力を借りていますが、そういったパートナーはR&D色が強く、高精度なシステムの開発に注力しがちです。しかし、これはコストが見合わない結果を招く可能性があります。重要なのは、使用するデータの性質や、どの業務プロセスに活用するかを明確に把握することです。推進担当者は、コスト目標、使用可能なデータの範囲、業務の詳細などを明確にし、開発チームを適切に誘導することが成功の鍵となります。
菊池:企業内で生成AI活用のプロフェッショナルを育成する必要性についてはどう思われますか?
中原:これは企業戦略に関わるので回答が難しいのですが、まずは社内のケーパビリティをどこまで高めるか、明確にした方が良いと思います。すべてを内製化しようとすると、焦点が定まらず効果的でない可能性があります。業務に精通した内部の人材と、技術に詳しい外部パートナーとの橋渡しができる人材の育成に着目するのもひとつの選択肢だと思います。
社内でR&Dに特化した人材を育成したい場合は、環境や体制を並行して整えていかないと難しいでしょう。
まとめ
今回のお二人へのインタビューを通じて、生成AIはあくまで手段であり、その効果的な活用には適切なナレッジ整備と運用体制が不可欠だということが分かりました。
また、以下の重要なポイントが浮かび上がりました。
- ナレッジマネジメントは運用面とシステム面の両輪で進める必要がある。
- 生成AI活用には、業務プロセスとデータの理解が不可欠。
- 生成AI活用には、明確な目的設定と現実的な期待値の設定が重要。
これらは、企業がナレッジマネジメントと生成AIを効果的に活用していく上で、重要な指針となるでしょう。技術の進歩に惑わされることなく、自社の業務に即した形で、これらのツールを活用していくことが成功への近道と言えそうです。
執筆者紹介
- TOPIC:
- プロフェッショナル