会議やインタビューを文字起こしする際、発言内容を話し手ごとに聞き分けて書くことは大変な作業です。そこでおすすめなのが、AI文字起こしツールの自動話者分離機能を使うことです。この機能を活用すると、AIが音声情報を解析し、自動的に発言者を識別して話者を可視化することができます。話者分離機能を利用して、議事録やインタビュー記事の作業効率を向上してみませんか?
関連記事:話者分離・共同編集を活用し、議事録作成工数を平均3分の1に削減!|株式会社高速道路総合技術研究所様
自動話者分離機能とは
自動話者分離とは、複数の人の声が混ざり合った音声データから「誰がいつ話したか」を自動的に判別する技術です。
会議内容を録音したデータから、誰が発言したかを自動的に特定することができるので、議事録作成の時間を大幅に短縮できます。また多人数での会話でも、各人の発言を認識した文字起こしが可能です。
話者分離機能が搭載されていないAI文字起こしツールもあるので、サービス利用前にあらかじめ確認しておきましょう。
自動話者分離機能を使った文字起こしの方法・流れ
自動話者分離機能を使って、文字起こしするのにおすすすめなのが『Rimo Voice』です。AI文字起こし/議事録ツール『Rimo Voice』は、自動話者分離機能を標準搭載しています。
プランによって利用する方法が異なり、以下2つのパターンがあります。
①手動である程度の話者分離を行い、残りの話者分離をAIが自動で行う(法人プラン・個人プラン)
②ボイスデータを登録して自動話者分離を行う(法人プラン対象)
ここからは、それぞれの場合で話者分離機能を使った文字起こし方法をご紹介します。
①手動である程度の話者分離を行い、残りの話者分離をAIが自動で行う(法人プラン・個人プラン)
法人プラン・個人プランにおいて、使用可能な自動話者分離機能ご利用の流れは以下の手順です。
Step1│会議やインタビューを録音・録画する
Step2│音声・動画ファイルをアップロードする
Step3│手動で話者ごとに改行する
Step4│手動で話者設定する
Step5│自動話者分離を実行する
Step1│会議やインタビューを録音・録画する
できる限りノイズを減らし、クリアな音声を録音するようにしましょう。音声認識の精度が向上し、文字起こし結果のテキストを修正する手間が少なくなります。また話者分離の精度も高まります。
オフラインの場合は、スマートフォンのボイスメモアプリやICレコーダーで会話を録音します。発言者の音声をきれいに録音することができる位置に、スマートフォンやICレコーダーを置いてください。
Zoomなどオンラインの場合、Web会議ツールのレコーディング機能で録音・録画することができます。その際はマイク付きヘッドセットの使用をおすすめします。PC内蔵のマイクを使うときは、マイクの近くで発言するようにしましょう。
ご参考
Step2│音声・動画ファイルをアップロードする
『Rimo Voice』にログインし、 「ファイルをアップロード」もしくは「アップロード」をクリックします。
「ファイルを選択」もしくは「Drag & Drop」でファイル選択フィールドから、文字起こしをしたいファイルをアップロードします。 (音声・動画のURLを入力して文字起こしすることも可能です。またZoomなどと連携して文字起こしすることもできます) アップロード後、音声認識の解析が始まり、解析が完了すると文字起こしのテキストが表示されます。
文字起こし方法の詳細は以下をご参照ください。
Step3│手動で話者ごとに改行する
音声と話者名をAIに学習させるため、文字起こし結果を手動で話者ごとに改行します。
※すべての参加者の発言箇所が10秒以上になる程度の話者分離を手動で行います。
文字起こしエリアの右上にある「編集する」ボタンをクリックして、編集モードにします。 (画面を縦に分割している縦線2本のボタンにカーソルを合わせて左右に「Drag & Drop」すると、分割画面の幅を変えることができます)
「Enter」キーで改行して、発言者ごとの段落にします。
Step4│手動で話者設定する
話者ごとに改行した文に話者を追加し、参加者の名前を設定していきます。
まずページ右上に表示されている横線3本のボタンをクリックして、サイドパネルを表示します。
「話者分離」メニューが表示されるので、参加者を「編集する」をクリックします。
もしくは文字起こしテキストのタイムスタンプの右側に表示されている「話者を設定」をクリックし、「新しい話者を追加」をクリックします。
参加者を登録するポップアップが表示されます。参加者名を入力し、「Enter」キーもしくは「○○を追加」ボタンをクリックして、参加者を登録します。
参加者全員の登録ができたら、「保存」をクリックしてください。
Step3で話者ごとに分けた文に、登録した話者を設定します。文字起こしテキストのタイムスタンプの右側に表示されている「話者を設定」をクリックし、話者を当てはめます。
Step5│自動話者分離を実行する
手動で話者設定を進めると、サイドパネルに参加者の発言箇所が何秒設定されたか緑色ゲージで表示されます。すべての参加者の発言箇所を10秒以上設定すると、「実行する」ボタンが有効になるのでクリックするとすべての発言を自動で話者分離します。
※発言箇所が10秒未満になる参加者の場合: サイドパネルにある参加者名の右側「…」をクリックし、「これ以上発言箇所が見つからない」を選択してください。
話者分離を実行したあとのノート(文字起こし結果)表示:
①参加者の表示 文字起こしファイル名の下に、4で登録した参加者が表示されます。
②話者の確定 チェックマークが緑色の場合、話者設定が確定した状態です。
③話者が未確定 チェックマークがついていない場合、話者は未確定状態です。段落にカーソルをあわせると、グレーのチェックマークが表示されるので、マークをクリックして話者を確定します。必要に応じて「ここ以前のすべてにチェック」を選択してください。
話者分離が正しくできていない箇所があった場合:
手動で発言箇所をさらに追加設定し、「再実行」してください。
②ボイスデータを登録して自動話者分離を行う(法人プラン対象)
法人プランの場合、メンバーのボイスデータ(声紋)をプロフィールから登録することができます。ボイスデータを登録しておくと、文字起こしの際にAIがメンバーを特定し、自動で話者分離します。毎回同じようなメンバーが参加する社内の会議などに便利な機能です。
法人プランにおいて、ボイスデータを活用した自動話者分離機能ご利用の流れは以下の手順です。
Step1│設定で自動話者分離をオンにする
Step2│ボイスデータを登録する
Step3│会議やインタビューを録音・録画する
Step4│音声・動画ファイルをアップロードする
Step5│AIが自動話者分離を実行する
Step1│設定で自動話者分離をオンにする
グローバルメニュー「設定」から「話者分離」をクリック。
「話者をミーティングの参加者として自動で追加」と「自動話者離」をオンにします(スライダーを右に動かし、オレンジ色🟠にする)
Step2│ボイスデータを登録する
メンバーページから話者分離として使いたいメンバー全員のボイスデータを登録します。ボイスデータの登録は、自分の音声を録音する方法とメンバーの音声を登録する方法があります。
自分のボイスデータを登録する場合:
プロフィールページから音声を録音します。
声紋登録用のノートが開くので、画面左側に記載している文章を読み上げてください。50~60秒発話したら、右上オレンジ枠内の「終了する」ボタンをクリックします。
「あなたの発話があるノート」に先ほど文章を読み上げた「声紋登録ノート」が表示されるので、(表示されない場合はリロードしてください)、「ノートへ」をクリックします。
新しいページにノートが開き、画面右側に「ボイスデータの登録」が表示されます(表示されない場合は、ページ右上にある三本線のアイコンをクリックしてください)。声がクリアに録音されている部分を選び、「登録」をクリックします。(再生ボタン▶をクリックすると音声を確認することができます)
プロフィールページに戻り、リロードすると「登録済みの音声」に先ほど登録した箇所が表示されます。
(「編集」をクリックすると再びノートが開くので、ボイスデータの登録を変更することができます)
メンバーのボイスデータを登録する場合:
グローバルメニュー「メンバー」で、ボイスデータを登録したい人をクリックして「プロフィール」を開きます。「プロフィール」欄下部にある「AI学習用ボイスデータ」をクリック。
「あなたの発話があるノート」(声紋候補のリスト)が表示されるので、「ノートへ」をクリックします。
新しいページにノートが開き、画面右側に「ボイスデータの登録」が表示されます(表示されない場合は、ページ右上にある三本線のアイコンをクリックしてください)。声がクリアに録音されている部分を選び、「登録」をクリックします。(再生ボタン▶をクリックすると音声を確認することができます)
プロフィールページに戻り、リロードすると「登録済みの音声」に先ほど登録した箇所が表示されます。
(「編集」をクリックすると再びノートが開くので、ボイスデータの登録を変更することができます)
Step3│会議やインタビューを録音・録画する
「①手動である程度の話者分離を行い、残りの話者分離をAIが自動で行う(法人プラン・個人プラン)」のStep1と同じです。
Step4│音声・動画ファイルをアップロードする
「①手動である程度の話者分離を行い、残りの話者分離をAIが自動で行う(法人プラン・個人プラン)」のStep2と同じです。
Step5│AIが自動話者分離を実行する
文字起こしが完了すると、参加者が自動で追加され、話者分離も行われます。
※ボイスデータが登録されていない人の声は「無名の話者」として認識されます。
これでAI文字起こし/議事録ツール『Rimo Voice』の自動話者分離機能を使った文字起こしは完了です。
自動話者分離機能を有効活用するためのコツ
音声認識の精度を高め、効果的な自動話者分離をするために、音声を録音する際は下記に注意しましょう。
クリアな音声の確保
クリアで鮮明な音声は、話者分離の精度を向上させます。できる限り静かな環境で録音を行い、ノイズを低減しましょう。マイクに近づいて発言する
音声がクリアに記録されるように、発言者はマイクに近づき、言葉をはっきりと発音しましょう。パソコン内蔵のマイクではなく、オンライン会議に適したマイクやヘッドセットを活用することもおすすめです。会話が被らないようにする
複数の人が同時に話すと音が混ざり、話者分離が難しくなります。会議やグループディスカッションでは、発言する順番を決めるなどして一度に話す人は1人だけになるようにしましょう。
ご参考
自動話者分離機能で会議やインタビューの文字起こしを高速化
『Rimo Voice』は長時間の会議・インタビューでも、AIが簡単に文字起こしと話者分離を行います。人間が行うとかなりの時間がかかる文字起こしを完全自動化でき、1時間程度の音声データの場合、アップロードから文字起こし完了まで約5分で完了します。さらに文字起こしの際には、「えー」「あー」といった言葉や余計な音を除去し、きれいな日本語に自動的に整えるので、読みやすい文章ができあがります。
またセキュリティ認証であるISMS(情報セキュリティマネジメントシステム)の国際規格「ISO/IEC 27001」と「ISO/IEC 27017」を取得しており、法人でも安心して使えることも『Rimo Voice』の魅力です。
人手での話者識別作業の手間と時間を大幅に削減することができ、会議の議事録・インタビュー記事作成の生産性向上につながる『Rimo Voice』をぜひお試しください。
音声60分の無料トライアルをご用意しております。文字起こしツールを検討する際は、「無料トライアル」からどうぞ。
最終更新日: 2024 / 8 / 31
関連記事
一覧に戻る