Return to List

話者分離とは?自動で文字起こしする方法とおすすめツール、活用のコツを解説

Update date: 2025/4/6 19:23
X(formerly Twitter)facebook
The current meeting was remote.
cover

会議やインタビューの録音を聞き返すとき、「誰が何を話したのか分かりにくい」と感じたことはありませんか?

発言内容を話し手ごとに聞き分けながらの文字起こし(話者分離)は大変な作業であり、人力で行うには時間と手間がかかります。

そこでおすすめなのが、AI文字起こしツールの自動話者分離機能です。

この機能を活用すれば、複数人の会話を自動で話者ごとに分けてくれ、議事録作成や文字起こしの効率を大きく向上させることが可能です。

本記事では、話者分離の仕組みや文字起こしの方法・流れ、ツールを有効活用するコツを初心者にもわかりやすく解説します。

関連記事:話者分離・共同編集を活用し、議事録作成工数を平均3分の1に削減!|株式会社高速道路総合技術研究所様

話者分離とは?

team-6152197_1280.jpg

話者分離とは、音声データに含まれる複数の話し手の声を識別し、誰がどの発言をしたのかを分ける技術です。

会議やインタビューの録音などで活用され、文字起こしや議事録作成の精度と効率を大幅に向上させられます。

しかし、録音を再生して自力で話し手を聞き分けるのは困難で、時間と手間がかかります。

そのため、自動話者分離機能が搭載されたAI文字起こしツールを活用するのがおすすめです。

自動話者分離機能とは?

自動話者分離とは、複数の人の声が混ざり合った音声データから「誰がいつ話したか」を自動的に判別する技術です。

会議内容を録音したデータから、誰が発言したかを自動で特定できるので、議事録作成の時間を大幅に短縮できます。また多人数での会話でも、各人の発言を認識した文字起こしが可能です。

ただ、全てのAI文字起こしツールに話者分離機能が搭載されているわけではありません。話者分離はかなり高度な技術なので、ツールを選ぶ際はあらかじめ対応の可否を必ず確認するようにしましょう。

自動話者分離機能を使った文字起こしの方法・流れ

自動話者分離機能を使って、文字起こしするのにおすすすめなのが『Rimo Voiceです。AI文字起こし/議事録ツール『Rimo Voiceは、自動話者分離機能を標準搭載しています。

プランによって利用する方法が異なり、以下2つのパターンがあります。

ここからは、それぞれの場合で話者分離機能を使った文字起こし方法をご紹介します。

1.手動である程度の話者分離を行い、残りの話者分離をAIが自動で行う(法人プラン・個人プラン)

話者分離1.png

法人プラン・個人プランにおいて、使用可能な自動話者分離機能ご利用の流れは以下の手順です。

Step1.会議やインタビューを録音・録画する
Step2.音声・動画ファイルをアップロードする
Step3.手動で話者ごとに改行する
Step4.手動で話者設定する
Step5.自動話者分離を実行する

Step1.会議やインタビューを録音・録画する

できる限りノイズを減らし、クリアな音声を録音するようにしましょう。音声認識の精度が向上し、文字起こし結果のテキストを修正する手間が少なくなります。また話者分離の精度も高まります。

オフラインの場合は、スマートフォンのボイスメモアプリやICレコーダーで会話を録音します。発言者の音声をきれいに録音することができる位置に、スマートフォンやICレコーダーを置いてください。

Zoomなどオンラインの場合、Web会議ツールのレコーディング機能で録音・録画することができます。その際はマイク付きヘッドセットの使用をおすすめします。PC内蔵のマイクを使うときは、マイクの近くで発言するようにしましょう。

ご参考

Step2.音声・動画ファイルをアップロードする

Rimo Voiceにログインし、 「ファイルをアップロード」もしくは「アップロード」をクリックします。

image.png

ファイルを選択」もしくは「Drag & Drop」でファイル選択フィールドから、文字起こしをしたいファイルをアップロードします。 (音声・動画のURLを入力して文字起こしすることも可能です。またZoomなどと連携して文字起こしすることもできます) アップロード後、音声認識の解析が始まり、解析が完了すると文字起こしのテキストが表示されます。

image.png

文字起こし方法の詳細は以下をご参照ください。

Step3.手動で話者ごとに改行する

音声と話者名をAIに学習させるため、文字起こし結果を手動で話者ごとに改行します。
すべての参加者の発言箇所が10秒以上になる程度の話者分離を手動で行います。

文字起こしエリアの右上にある「編集する」ボタンをクリックして、編集モードにします。 (画面を縦に分割している縦線2本のボタンにカーソルを合わせて左右に「Drag & Drop」すると、分割画面の幅を変えることができます)

image.png

「Enter」キーで改行して、発言者ごとの段落にします。

image.png

Step4.手動で話者設定する

話者ごとに改行した文に話者を追加し、参加者の名前を設定していきます。

まずページ右上に表示されている横線3本のボタンをクリックして、サイドパネルを表示します。

image.png

「話者分離」メニューが表示されるので、参加者を「編集する」をクリックします。

image.png

もしくは文字起こしテキストのタイムスタンプの右側に表示されている「話者を設定」をクリックし、「新しい話者を追加」をクリックします。

image.png

参加者を登録するポップアップが表示されます。参加者名を入力し、「Enter」キーもしくは「○○を追加」ボタンをクリックして、参加者を登録します。

image.png

参加者全員の登録ができたら、「保存」をクリックしてください。

image.png

Step3で話者ごとに分けた文に、登録した話者を設定します。文字起こしテキストのタイムスタンプの右側に表示されている「話者を設定」をクリックし、話者を当てはめます。

image.png

Step5.自動話者分離を実行する

手動で話者設定を進めると、サイドパネルに参加者の発言箇所が何秒設定されたか緑色ゲージで表示されます。すべての参加者の発言箇所を10秒以上設定すると、「実行する」ボタンが有効になるのでクリックするとすべての発言を自動で話者分離します。

image.png

※発言箇所が10秒未満になる参加者の場合: サイドパネルにある参加者名の右側「」をクリックし、「これ以上発言箇所が見つからない」を選択してください。

話者分離を実行したあとのノート(文字起こし結果)表示:

image.png

①参加者の表示 文字起こしファイル名の下に、4で登録した参加者が表示されます。
②話者の確定 チェックマークが緑色の場合、話者設定が確定した状態です。
③話者が未確定 チェックマークがついていない場合、話者は未確定状態です。段落にカーソルをあわせると、グレーのチェックマークが表示されるので、マークをクリックして話者を確定します。必要に応じて「ここ以前のすべてにチェック」を選択してください。

話者分離が正しくできていない箇所があった場合:
手動で発言箇所をさらに追加設定し、「再実行」してください。

image.png

2.ボイスデータを登録して自動話者分離を行う(法人プラン対象)

話者分離2.png

法人プランの場合、メンバーのボイスデータ(声紋)をプロフィールから登録することができます。ボイスデータを登録しておくと、文字起こしの際にAIがメンバーを特定し、自動で話者分離します。毎回同じようなメンバーが参加する社内の会議などに便利な機能です。

法人プランにおいて、ボイスデータを活用した自動話者分離機能ご利用の流れは以下の手順です。

Step1.設定で自動話者分離をオンにする
Step2.ボイスデータを登録する
Step3.会議やインタビューを録音・録画する
Step4.音声・動画ファイルをアップロードする
Step5.AIが自動話者分離を実行する

Step1.設定で自動話者分離をオンにする

グローバルメニュー「設定」から「話者分離」をクリック。
話者をミーティングの参加者として自動で追加」と「自動話者離」をオンにします(スライダーを右に動かし、オレンジ色🟠にする)

image.png

Step2.ボイスデータを登録する

メンバーページから話者分離として使いたいメンバー全員のボイスデータを登録します。ボイスデータの登録は、自分の音声を録音する方法とメンバーの音声を登録する方法があります。

自分のボイスデータを登録する場合:
プロフィールページから音声を録音します。

image.pngimage.png

声紋登録用のノートが開くので、画面左側に記載している文章を読み上げてください。50~60秒発話したら、右上オレンジ枠内の「終了する」ボタンをクリックします。

image.png

あなたの発話があるノート」に先ほど文章を読み上げた「声紋登録ノート」が表示されるので、(表示されない場合はリロードしてください)、「ノートへ」をクリックします。

image.png

新しいページにノートが開き、画面右側に「ボイスデータの登録」が表示されます(表示されない場合は、ページ右上にある三本線のアイコンをクリックしてください)。声がクリアに録音されている部分を選び、「登録」をクリックします。(再生ボタン▶をクリックすると音声を確認することができます)

image.png

プロフィールページに戻り、リロードすると「登録済みの音声」に先ほど登録した箇所が表示されます。
(「編集」をクリックすると再びノートが開くので、ボイスデータの登録を変更することができます)

image.png

メンバーのボイスデータを登録する場合:
グローバルメニュー「メンバー」で、ボイスデータを登録したい人をクリックして「プロフィール」を開きます。「プロフィール」欄下部にある「AI学習用ボイスデータ」をクリック。

image.png

あなたの発話があるノート」(声紋候補のリスト)が表示されるので、「ノートへ」をクリックします。

image.png

新しいページにノートが開き、画面右側に「ボイスデータの登録」が表示されます(表示されない場合は、ページ右上にある三本線のアイコンをクリックしてください)。声がクリアに録音されている部分を選び、「登録」をクリックします。(再生ボタン▶をクリックすると音声を確認することができます)

image.png

プロフィールページに戻り、リロードすると「登録済みの音声」に先ほど登録した箇所が表示されます。
(「編集」をクリックすると再びノートが開くので、ボイスデータの登録を変更することができます)

image.png

Step3.会議やインタビューを録音・録画する

「①手動である程度の話者分離を行い、残りの話者分離をAIが自動で行う(法人プラン・個人プラン)」のStep1と同じです。

Step4.音声・動画ファイルをアップロードする

「①手動である程度の話者分離を行い、残りの話者分離をAIが自動で行う(法人プラン・個人プラン)」のStep2と同じです。

Step5.AIが自動話者分離を実行する

文字起こしが完了すると、参加者が自動で追加され、話者分離も行われます。
※ボイスデータが登録されていない人の声は「無名の話者」として認識されます。

image.png

これでAI文字起こし/議事録ツール『Rimo Voiceの自動話者分離機能を使った文字起こしは完了です。

自動話者分離機能を有効活用するためのコツ

23501749_s.jpg

音声認識の精度を高め、効果的な自動話者分離をするためには、音声を録音する際に以下3つのコツを押さえておきましょう

クリアで鮮明な音声は、話者分離の精度を向上させます。できる限り静かな環境で録音を行い、ノイズを低減しましょう。

また、音声がクリアに記録されるように、発言者はマイクに近づき、言葉をはっきりと発音するようにします。パソコン内蔵のマイクではなく、オンライン会議に適したマイクやヘッドセットを活用するとより音声が鮮明になるのでおすすめです。

さらに、複数の人が同時に話すと音が混ざり、話者分離が難しくなります。会議やグループディスカッションでは、発言する順番を決めるなどして一度に話す人は1人だけになるようにしましょう。

ご参考

自動話者分離機能で会議やインタビューの文字起こしを高速化

image.png

Rimo Voiceは長時間の会議・インタビューでも、AIが簡単に文字起こしと話者分離を行います。人間が行うとかなりの時間がかかる文字起こしを完全自動化でき、1時間程度の音声データの場合、アップロードから文字起こし完了まで約5分で完了します。さらに文字起こしの際には、「えー」「あー」といった言葉や余計な音を除去し、きれいな日本語に自動的に整えるので、読みやすい文章ができあがります。

またセキュリティ認証であるISMS(情報セキュリティマネジメントシステム)の国際規格「ISO/IEC 27001」と「ISO/IEC 27017」を取得しており、法人でも安心して使えることも『Rimo Voiceの魅力です。

人手での話者識別作業の手間と時間を大幅に削減することができ、会議の議事録・インタビュー記事作成の生産性向上につながる『Rimo Voiceをぜひお試しください。

image.png

音声60分の無料トライアルをご用意しております。文字起こしツールを検討する際は、無料トライアルからどうぞ。

関連記事:

文字起こしはやり方次第で早くなる!効率的にできるコツを徹底解説します

【2025年】文字起こしにおすすめのボイスレコーダー27選!ツール・アプリも紹介


最終更新日: 2025 / 4 / 6

Improve work efficiency by entrusting meeting minutes creation to AI in Rimo

Easy automatic transcription starting at 22 yen per 30 seconds. Available on smartphones and computers.

Rimo

Related articles

Tags

  • Transcription
  • 業務効率化

Return to List

Rimo

AI transcription and summary

    話者分離とは?自動で文字起こしする方法とおすすめツール、活用のコツを解説 | Rimo