Microsoft Wordで音声を文字起こしする方法:音声から文字へ変換する完全ガイド
音声をテキストに変換する作業は、ビジネスパーソン、学生、コンテンツ制作者にとって大きな武器になります。Microsoft Wordに組み込まれた文字起こし機能を使えば、インタビューや会議、講義を編集可能な文書に変換する作業がこれまでになく簡単になります。
Microsoft 365があれば、ライブの音声でも録音済みの音声ファイルでも、Wordの中で直接文字起こしができ、時間の節約と生産性の向上につながります。
ただし、この機能にはいくつかの条件と制限があります。
この総合ガイドでは、Wordで音声を文字起こしできるのか、その前提条件、ライブ音声と録音音声それぞれの手順、おすすめの代替ツール、そしてよくある質問への回答まで、音声から文字への変換をマスターするために必要な情報を解説します。

Microsoft Wordで音声を文字起こしできるのか?
はい、Microsoft Wordでは音声の文字起こしが可能です。Microsoft 365を通じて提供される強力な文字起こし機能のおかげで、音声をテキストに変換できます。
ただし、この文字起こし機能は現在、Microsoft 365のサブスクリプション契約者のみが利用できます。
Wordで文字起こしを使うための前提条件
Microsoft Wordの音声文字起こし機能を利用するには、特定の技術要件とサブスクリプション要件を満たす必要があります。
Microsoft 365を通じて提供されるこの便利なツールは、音声からテキストへの変換を効率化してくれますが、成功の鍵は正しく設定することにあります。
スムーズに音声を文字起こしするために、以下の必須条件を確認しておきましょう。
1. 有効なMicrosoft 365サブスクリプション
文字起こし機能はMicrosoft 365の契約者専用です。
利用できる環境は次のとおりです。
- 商用テナント向けのWord for Windows
- 政府機関テナント向けのWord for the web
この機能は単体版や古いバージョンのWordでは利用できないため、有効なサブスクリプションを用意してください。
2. 安定したインターネット接続
Wordの文字起こしはクラウド上での処理に依存しているため、信頼できるインターネット接続が必須です。
ライブ音声を録音する場合でも録音済みファイルをアップロードする場合でも、処理の中断やエラーを防ぐために安定した接続を確保しましょう。
3. Word for the web対応のブラウザ
Word for the webを使う場合は、次のいずれかのブラウザが必要です。
- Microsoft Edge(最新版)
- Google Chrome(最新版)
FirefoxやSafariなど、その他のブラウザは現時点では文字起こしに対応していません。
4. 言語設定
文字起こし機能は、Microsoft Officeで編集言語として設定されている言語で動作します。
2025年時点では、米国英語が主な対応言語ですが、Microsoftは今後対応言語を拡大する予定としています。
編集言語を確認・変更するには、次の手順を行います。
- Wordで「ファイル」>「オプション」>「言語」を開きます。
- 編集言語を米国英語に設定します。
5. 音声ファイルと時間の上限
録音済みの音声ファイルを文字起こしする場合の制限は次のとおりです。
- 対応形式はMP3、WAV、M4A、MP4です。
- ファイルサイズの上限は200MBです。
- アップロードによる文字起こしは、ユーザー1人あたり月300分(5時間)までに制限されています。
ライブ録音には特定の時間制限はありませんが、音声の品質が精度に影響します。
6. 文字起こしの保存に関する制限
Wordは、文字起こしウィンドウに一度に1件の文字起こししか保存できません。
新しい文字起こしを作成すると以前のものは上書きされますが、すでに文書に挿入したテキストには影響しません。
文字起こしを残しておきたい場合は、Word文書の一部として保存するか、別途エクスポートしてください。
成功のためのヒント - 音声の品質: 文字起こしの精度を高めるため、背景ノイズの少ないクリアな音声を使いましょう。
- ソフトウェアの更新: 互換性の問題を避けるため、Wordとブラウザを最新版に更新しておきましょう。
- 上限の確認: 複数の音声ファイルをアップロードする場合は特に、月ごとの文字起こし上限を確認しましょう。
これらの条件を満たせば、会議・インタビュー・講義など、Microsoft Wordで効率的に音声を文字起こしする準備が整います。
これらの制限が課題になる場合は、本記事の後半で紹介するSubananaのような代替ツールを検討してみてください。
MS Wordでライブ音声を文字起こしする方法
Microsoft Wordでのライブ音声の文字起こしは、Microsoft 365で利用できる強力な機能で、会議・インタビュー・講義をリアルタイムで記録するのに最適です。
このツールは話者を区別しながら音声をテキストに変換するため、編集しやすい文字起こしを手軽に作成できます。
以下のステップに沿って、Wordの文字起こし機能でスムーズにライブ音声を文字起こししましょう。
ステップ1:Microsoft Wordを開く
Word for Windowsを起動するか、Microsoft EdgeまたはChromeからWord for the webにアクセスします。
求められたらMicrosoft 365アカウントでサインインします。
ステップ2:文書を作成または開く
文字起こしを挿入したい新しい文書を作成するか、既存の文書を開きます。
ステップ3:文字起こし機能にアクセスする
リボンの「ホーム」タブに移動します。
「ディクテーション」ボタンを見つけ、その横のドロップダウン矢印をクリックして、メニューから「文字起こし」を選択します。
すると、画面右側に文字起こしウィンドウが開きます。
ステップ4:マイクへのアクセスを許可する
文字起こしを初めて使う場合、Wordがマイクへのアクセス許可を求めてきます。
「許可」をクリックして、ライブ録音を有効にします。
ステップ5:録音を開始する
文字起こしウィンドウで「録音を開始」を選択します。
タイマーが表示され、Wordが音声を取り込んでいることがわかります。
マイクに向かってはっきりと話し始めましょう。
ステップ6:必要に応じて一時停止・再開する
録音を一時停止するには、文字起こしウィンドウの「一時停止」ボタンをクリックします。
再開するには、もう一度「録音を開始」をクリックします。
処理を妨げないよう、録音中は文字起こしウィンドウを開いたままにしておきましょう。
ステップ7:保存して文字起こしする
話し終えたら、「保存して今すぐ文字起こし」をクリックします。
Wordが音声をOneDriveにアップロードして文字起こしを処理します。録音の長さによっては数分かかることがあります。
ステップ8:文字起こしを確認・編集する
処理が完了すると、文字起こしウィンドウにタイムスタンプと話者ラベル(例:「話者1」「話者2」)付きで文字起こしが表示されます。
Wordは複数の話者を自動的に区別してわかりやすく整理します。次のような操作ができます。
- テキストを編集して誤りを修正する。
- 話者ラベルを付け直す(例:「話者1」を実際の名前に変更する)。
- タイムスタンプを使って特定の部分を再生し、内容を確認する。
- 各セクションの横にある「+」アイコンをクリックして、文字起こし全体または選択した部分を文書に挿入する。
これらの手順を踏めば、Microsoft Wordで効率的にライブ音声を文字起こしでき、会話をレポートやメモ、コンテンツ制作に使える編集可能なテキストに変えられます。
この機能は、ビジネスパーソンにも学生にも、時間の節約と生産性向上をもたらします。
Microsoft Wordで録音済み音声を文字起こしする
Microsoft 365で利用できるMicrosoft Wordの文字起こし機能を使えば、録音済みの音声ファイルを編集可能なテキストに簡単に変換できます。
会議の録音、講義、ポッドキャスト、インタビューの文字起こしに最適で、時間と手間を節約できます。
話者の自動区別とタイムスタンプ付きの文字起こしにより、音声を正確で使いやすいコンテンツへと効率的に変えられます。
以下に、Microsoft Wordで録音済み音声ファイルを文字起こしする詳しい手順を紹介します。
ステップ1:Microsoft 365にサインインする
Word for Windowsを開くか、Microsoft EdgeまたはChromeを使ってWord for the webにアクセスします。
Microsoft 365アカウントの認証情報でログインします。
ステップ2:文書を開く
文字起こしを挿入したい新しいWord文書を作成するか、既存の文書を開きます。
ステップ3:文字起こし機能にアクセスする
リボンの「ホーム」タブに移動します。
「ディクテーション」ボタンの横のドロップダウン矢印をクリックし、メニューから「文字起こし」を選択します。
すると、画面右側に文字起こしウィンドウが開きます。
ステップ4:音声ファイルをアップロードする
文字起こしウィンドウで「音声をアップロード」をクリックすると、ファイル選択ウィンドウが表示されます。
音声ファイル(MP3、WAV、M4A、MP4)の場所に移動して選択し、「開く」をクリックしてWordにアップロードします。
ステップ5:文字起こしを待つ
Microsoft Wordが自動的にファイルをOneDriveにアップロードし、文字起こしを開始します。
処理時間はファイルのサイズや長さによって異なり、多くのファイルでは通常数分程度です。
ステップ6:文字起こしを確認・編集する
文字起こしが完了すると、文字起こしウィンドウにタイムスタンプと話者ラベル(例:「話者1」「話者2」)付きでテキストが表示されます。
Wordは複数の話者を検出して区別し、わかりやすく整理します。次のような操作ができます。
- 文字起こしを編集して誤りを修正したり、表現を整えたりする。
- 話者の名前を付け直す(例:「話者1」を特定の名前に変更する)。
- タイムスタンプを使って音声の各部分を再生し、内容を確認する。
- 各セグメントの横にある「+」アイコンをクリックして、文字起こし全体または特定の部分を文書に挿入する。
ステップ7:作業内容を保存する
文字起こしをWord文書の一部として保存するか、別途エクスポートします。
文字起こしウィンドウは一度に1件の文字起こししか保存できないため、新しいファイルをアップロードして上書きしてしまう前に、必ず挿入または保存しておきましょう。
これらの手順に従えば、Microsoft Wordで効率的に録音済み音声ファイルを文字起こしでき、録音をレポートや記事、メモに使える洗練された編集可能なテキストへと変えられます。
この機能は、ワークフローを効率化したいビジネスパーソン、学生、コンテンツ制作者にとって心強いツールです。
Word文字起こしの最適な代替ツール:Subanana
Microsoft Wordの文字起こし機能は音声からテキストへの変換に役立ちますが、月300分という上限、米国英語のみの対応(2025年時点)、Microsoft 365サブスクリプションへの依存といった制限があります。
より柔軟で使いやすい文字起こしソリューションを求めるなら、Subananaが優れた代替ツールとして際立ちます。
Subananaは高度なAI音声認識をベースに、動画や音声のコンテンツを手軽に文字起こしできるようサポートします。
このツールは80以上の言語に対応しており、世界中のクリエイターや視聴者が手早く信頼できる文字起こしを行うのに適しています。(Subananaを無料で試す!)
Subananaを使って動画に字幕を付ける手順は次のとおりです。
-
動画をアップロードする。 文字起こししたい動画をアップロードするか、YouTubeのリンクを貼り付けます。

-
ワンクリックで文字起こしする。 「字幕を今すぐ生成」ボタンをクリックすると、AIが動画の文字起こしを作成します。

-
文字起こしを編集する。 自動文字起こしが完了したら、Subananaのオンラインエディタで内容を確認・編集します。各字幕にはタイムスタンプが付き、テキスト文書のように編集できるので、調整も簡単です。

-
文字起こしをダウンロードする(任意)。 最後に、文字起こしを.srt、.txt、.docx、.xlsxなどの形式でダウンロードします。

Subananaが他の文字起こし方法と異なるのは、その手軽さです。直感的なインターフェースで、数クリックで動画をアップロードして文字起こしでき、品質を保ちながら時間を節約できます。
自分の動画でも他人の動画でも、Subananaはプロセスを効率化し、技術的な細部ではなくコンテンツそのものに集中できるようにしてくれます。今すぐSubananaを無料で試す!
Microsoft Wordでの文字起こし:よくある質問
Microsoft Wordの文字起こし機能は音声からテキストへの変換に役立つツールですが、特定の要件と制限があり、疑問が生じることもあります。
以下に、この機能を効果的に使うためのよくある質問への回答をまとめました。
1. Microsoft Wordに「文字起こし」が見当たらないのはなぜですか? 文字起こし機能はMicrosoft 365専用で、次の環境でのみ利用できます。
- Word for Windows(商用テナント)
- Word for the web(政府機関テナントおよびブラウザ利用者)
単体版や古いデスクトップ版のWordには対応していません。
2. Microsoft Wordの文字起こし機能は無料ですか? いいえ。文字起こし機能には有効なMicrosoft 365サブスクリプションが必要で、無料版や単体版のWordでは利用できません。
Word for the webの場合は、Microsoft EdgeまたはChromeを使い、Microsoft 365アカウントでサインインする必要があります。
また、アップロードした音声ファイルには月300分の上限があり、利用量の多いユーザーはサブスクリプションのアップグレードが必要になる場合があります。
3. 文字起こしにおけるMicrosoft Wordの最適な代替ツールは? Wordの文字起こしの制限(米国英語のみの対応、月300分の上限、サブスクリプション必須など)が用途に合わない場合は、Subananaを検討してみてください。
この使いやすいプラットフォームは次の特長を備えています。
- 柔軟な文字起こし: 多言語に対応し、厳しい月間ノルマがありません。
- 使いやすさ: 初心者にもわかりやすい直感的なインターフェースで、ライブ音声・録音音声の両方に対応します。
- 多用途性: 会議・ポッドキャスト・講義の文字起こしに最適で、テキストや字幕の形式でエクスポートできます。
Wordとは異なり、SubananaはMicrosoft 365サブスクリプションを必要としないため、さまざまな文字起こし作業にコスト効率よく対応できる代替ツールです。
4. Microsoft Wordのどのバージョンに文字起こし機能が含まれていますか? 文字起こし機能は特定のデスクトップ版Wordではなく、Microsoft 365に紐づいています。利用できるのは次の環境です。
- Word for Windows(Microsoft 365、商用テナント)
- Word for the web(政府機関テナントを含むすべてのMicrosoft 365ユーザーが、Microsoft EdgeまたはChromeから利用可能)
単体版や買い切りライセンス版(例:Word 2019)には、この機能は含まれていません。
利用するには、Microsoft 365サブスクリプションが有効であることを確認してください。
5. Microsoft Wordの文字起こしはどのくらい正確ですか? Wordの文字起こしの精度は、いくつかの要因によって左右されます。
- 音声の品質: 背景ノイズの少ないクリアな録音ほど良い結果が得られます。
- 話者の明瞭さ: はっきりとした発話で訛りが少ないほど精度が上がります。
- 言語: 現在は米国英語に最適化されているため、他の言語や方言では精度が下がる場合があります。
Wordの文字起こしは下書きを作成するためのものとして設計されており、特に複数の話者がいる音声や背景ノイズのある音声では、手作業での修正が必要になることが多くあります。
より高い精度と充実した機能を求めるなら、Subananaのようなツールは多言語に対応した音声認識を備えており、専門的な用途や多言語の文字起こしニーズに適しています。
Microsoft Wordの文字起こし機能は、会議やインタビューなどの音声からテキストへの変換を手軽にしてくれます。
このステップバイステップガイドでは、設定方法や手順、そして柔軟な代替ツールとしてのSubananaを紹介しました。
これらのツールを活用して、生産性を高めましょう!