素起こし・ケバ取り・整文の違いと、AIでどこまで自動化できるか
素起こし・ケバ取り・整文は、文字起こしの「どこまで整えるか」を表す3つの仕上げレベルです。素起こしは聞こえたまま一字一句を書き起こす方式、ケバ取りは「えー」「あのー」などの不要な言葉を削る方式、整文は話し言葉を書き言葉に直して読みやすく整える方式です。用途によって必要なレベルは変わり、AIで自動化できる範囲とできない範囲もはっきり分かれます。
この記事では、3つの違いと使い分けを整理したうえで、いまのAIで「どこまで自動化できて、どこから人の手が要るのか」を正直に解説します。

素起こし・ケバ取り・整文とは?
3つはいずれも音声をテキストにする工程ですが、仕上げの度合いが異なります。文字起こしの解説でも、この3形式は標準的な分類として説明されています(文字起こしさん、AmiVoice VoXT One)。
素起こし(すおこし/逐語録)とは?
素起こしは、録音された音声を一字一句そのまま書き起こす最も基本的な形式です。「あのー」「えー」といった意味を持たない言葉や、言い間違い、単語の重複もすべて文字にします。発言の事実関係を正確に残す必要がある場面――裁判の証拠、研究、カウンセリング、会話分析など――で求められます。逐語録(ちくごろく)とも呼ばれます。
ケバ取りとは?
ケバ取りは、音声中の不要な部分を削って書き起こす方式です。「えー」「あのー」といった言い淀みや、「えっと」のような言葉の繰り返しなど、意味を持たない言葉を取り除きます。内容を理解しやすくするのが目的で、インタビュー・対談・Webコンテンツ・会議の議事録などでよく使われます。素起こしより読みやすく、整文ほど手間はかかりません。
整文(せいぶん)とは?
整文は、ケバ取りしたものをさらに読みやすく整える方式です。話し言葉を書き言葉に直し、文体を「ですます調」などに整えます。助詞の補い、「ら抜き言葉」の訂正なども行うため、印刷物や配布資料のように読みやすさと文章としての正確さが求められる媒体に向いています。3つの中で最も手間がかかり、書き手の判断が入る工程です。
3つの違いをひと目で
| 形式 | 何をする | 仕上がり | 主な用途 |
|---|---|---|---|
| 素起こし(逐語録) | 一字一句そのまま。フィラーや言い間違いも残す | 発言に忠実だが読みにくい | 裁判証拠・研究・会話分析 |
| ケバ取り | 「えー」「あのー」など不要な言葉を削る | 内容が理解しやすい | インタビュー・議事録・Web記事 |
| 整文 | 話し言葉を書き言葉に直し、文体を整える | 読みやすく整った文章 | 配布資料・印刷物・公開記事 |
どれが「正しい」というものではなく、目的に合わせて選ぶのがポイントです。証拠性が要るなら素起こし、読んで把握したいならケバ取り、そのまま配るならば整文、という具合です。
AIでどこまで自動化できる?
近年のAI文字起こしは、この3工程の前半を大きく肩代わりします。ただし「どこまで」を正しく理解しておくと、過信による手戻りを防げます。Subananaを例に、自動化できる範囲を整理します。
素起こし:AIが土台を作る
音声をテキストに変換する素起こしの土台は、AIが担う部分です。Subananaは音声・動画をアップロードすると文字起こしし、言語ごとに最適なモデルを選んで変換します。さらに、音声と合わない不自然な出力(ハルシネーション)を検知すると、自動的に別のモデルへ振り替えてより確かな結果を出します。この自動の振り替えは追加課金されません。素起こしの段階で取りこぼしや誤りを減らしておくと、後工程が楽になります。
ケバ取り:フィラー除去はAIが自動化
ケバ取りにあたるフィラー(言い淀み)の除去は、AIが自動で行える部分です。Subananaの逐語稿モードは、フィラーを取り除いてテキストを整える処理に対応しています。「えー」「あのー」を一つずつ消す手作業を省けるため、議事録やインタビュー記事の下ごしらえが速くなります。
整文:句読点・段落はAI、文章の最終仕上げは人
整文は、AIが「途中まで」助ける工程です。Subananaの逐語稿モードでは句読点と段落が自動で挿入され、読めるテキストに整います。加えて、聞き間違いやすい語(例:同音異義の取り違え)をAIが見つけて修正候補を提案します。ただしこの修正は1件ずつ確認して反映する方式で、勝手に書き換えることはありません。
一方で、整文の核心である「話し言葉を書き言葉に直す」「文体をですます調にそろえる」といった文章としての最終仕上げは、人の判断が入る領域です。Subananaには文体を一括変換するボタンのような機能はありません。代わりに、文字起こしエディタ上でAIに「この部分を要点だけにまとめて」などと質問できるので、整文の下書きづくりを手伝わせることはできます。最後の体裁は人が決める、という前提で使うのが現実的です。
自動化の範囲まとめ
| 工程 | AIの自動化 | 補足 |
|---|---|---|
| 素起こし | ◎ 土台はAIが生成 | モデル自動振り替えで品質を底上げ(追加課金なし) |
| ケバ取り | ◯ フィラー除去を自動化 | 逐語稿モードで対応 |
| 整文(句読点・段落) | ◯ 自動で挿入 | 逐語稿モードで対応 |
| 整文(文体・書き言葉化) | △ 人の判断が必要 | 一括の文体変換ボタンはなし。AIチャットで下書き支援は可能 |
会議であれば、これらに加えて要点・決定事項・アクションを抽出するAI要約まで作れます。詳しくはAI会議文字起こしのページをご覧ください。
用途別:どの仕上げを選び、何を自動化する?
- 証拠・研究で発言に忠実な記録が要る → 素起こし。AIで土台を作り、人が原音と突き合わせて確認。
- 会議やインタビューを読んで把握したい → ケバ取りまで。逐語稿モードのフィラー除去+句読点・段落の自動挿入でほぼ仕上がる。
- そのまま配布・公開する資料にしたい → 整文まで。句読点・段落はAIに任せ、書き言葉化と文体の最終調整は人が行う。
文字起こしの仕上げに毎回手間をかけているなら、素起こし〜ケバ取りの大半を自動化するだけで作業時間は大きく変わります。まずはSubananaを無料で試して、ご自身の音声で仕上がりを確かめてみてください。料金や各プランの目安は料金ページで、文字起こしの基本は文字起こしとは何かをまとめた記事で確認できます。
よくある質問
素起こしとケバ取りの違いは何ですか?
素起こしは聞こえたまま一字一句を書き起こす方式で、「えー」「あのー」などのフィラーや言い間違いもすべて残します。ケバ取りは、その不要な言葉を削って読みやすくする方式です。証拠性が要るなら素起こし、内容を把握したいならケバ取りが向いています。
整文はAIで自動化できますか?
一部は自動化できます。句読点や段落の挿入は逐語稿モードで自動的に行われます。ただし整文の核心である「話し言葉を書き言葉に直す」「文体を整える」といった最終仕上げは、人の判断が入る領域です。文体を一括変換するボタンのような機能はありません。
AIの文字起こしはどの仕上げレベルまで作れますか?
素起こしの土台づくりと、ケバ取り(フィラー除去)、整文のうち句読点・段落の自動挿入までは自動で対応できます。文章としての最終的な書き言葉化・文体調整は人が仕上げる前提です。会議モードを使えば、文字起こしに加えて要約やアクション抽出まで作れます。
どの仕上げを選べばいいですか?
目的で選びます。発言に忠実な記録が必要なら素起こし、読んで把握したいならケバ取り、そのまま配布・公開する資料にするなら整文です。読みやすさを上げるほど手間も増えるため、用途に対して過不足のないレベルを選ぶのがコツです。