TikTokに字幕を付ける方法(2026年版):自動キャプション・手動テキスト・AIワークフロー

TikTokは2021年に自動キャプションを導入し、その後も対応言語を着実に拡充して、現在ではほとんどのアカウントで利用できます。クリアな英語音声ではうまく機能しますが、広東語や北京語(標準中国語)、複数言語が混在するコンテンツ、あるいは背景音楽が話し声をかき消すような状況では精度が落ちます。本記事では、TikTokに字幕を付ける3つの実用的な方法と、それぞれが適する場面を解説します。
Instagram ReelsやYouTube Shortsにも同時投稿している場合(短尺クリエイターの多くがそうです)、方法3は週に数時間を節約してくれます——記事末尾のクロスプラットフォームの章を参照してください。
TikTokの仕様(アプリ内の表示で確認を)
TikTokは製品仕様を頻繁に更新します。2026年時点の安定したパラメータは以下のとおりです。
| 設定 | 一般的な仕様 |
|---|---|
| アスペクト比 | 9:16(縦型) |
| 推奨解像度 | 1080 × 1920 |
| 形式 | MP4 / MOV |
| 最大尺 | ほとんどのアカウントで最長10分。より長い形式は段階的に展開 |
| 被写体の配置 | 中央に配置。下部のUIオーバーレイ領域は空けておく |
長尺コンテンツに取りかかる前に、必ずアプリ内のアップロード画面で確認してください——TikTokの上限は時とともに変わります。
TikTokで字幕が重要な理由
業界での一般的な観察に基づく3つの理由です。
- 多くのSNSユーザーはミュートで閲覧している。 公共の場や夜間のSNS閲覧は音声オフで行われると、複数の業界調査が観察しています。字幕なし=無音の動画=メッセージが届かない、ということです。
- 字幕は視聴時間を伸ばす傾向がある。 TikTokのレコメンドアルゴリズムは完視聴率と視聴時間を重視しますが、字幕はそのどちらにも寄与します。
- アクセシビリティへの配慮。 WHOは、世界で10億人以上が何らかの聴力低下を抱えていると推計しています。字幕は最低限のアクセシビリティ対策です。
特に非英語のクリエイターにとっては顕著です。TikTokの自動キャプションは英語で最も信頼でき、広東語や北京語、複数言語が混在する音声では精度が下がります。また、正式な/公開される場面で話し言葉と書き言葉の区別が問われる言語については、話し言葉から書き言葉への変換も行われません。
方法1:TikTok内蔵のキャプション機能
最も速い方法です。トレードオフは、言語によって精度が変わる点とスタイル調整が限られる点です。
キャプションの正確なメニュー位置はTikTokアプリのバージョンによって異なるため、その時点でエディタに表示されているものを使ってください。おおまかな流れは次のとおりです。
- TikTokアプリで動画クリップを撮影またはアップロードする
- 「次へ」をタップしてエディタに入る
- サイドツールバーを開き、「キャプション」をタップする
- TikTokが音声からキャプションを自動生成する
- キャプションの精度を確認し、テキスト・タイミングを調整するか削除する
- フォント・サイズ・色・位置をカスタマイズする
- プレビューし、説明文とハッシュタグを追加して投稿する
これで十分な場合:
- クリアな音声の英語のみのTikTok
- 字幕の細かなスタイルが重視されないカジュアルなコンテンツ
- 速さが最優先の場合
これでは不十分な場合:
- 精度が落ちる非英語音声(広東語/北京語/複数言語混在)
- 字幕をビジュアルアイデンティティに合わせる必要があるブランドコンテンツ
- Instagram Reels/YouTube Shortsにも同時投稿するコンテンツ——プラットフォームごとに字幕を付け直すと作業量が倍になります
方法2:手動でのテキストオーバーレイ
TikTokエディタの「テキスト」ツールを使い、字幕を1行ずつ手入力し、各テキストブロックをドラッグして音声に合わせます。
トレードオフ: スタイルを完全に制御できますが、非常に時間がかかります。60秒のTikTokで手作業の字幕付けにおよそ30〜45分。週に1〜2本を超えるとスケールしません。
この方法が適しているのは、次の場合だけです。
- 字幕が短い見出し(冒頭のフック、末尾のCTA)である場合
- TikTokのキャプション機能では作れないカスタムデザインが必要な場合
どんなペースであれコンテンツ全体に字幕を付けるなら、方法1か方法3が実用的な選択肢です。
方法3:AIでSRTを生成し、エディタで焼き込む(非英語コンテンツに推奨)
広東語や北京語、複数言語混在、あるいはTikTokの自動キャプションが確実に処理できないあらゆる音声に対して、スケールするワークフローは次のとおりです。
- 対象言語をうまく扱えるAI文字起こしツールでSRT字幕ファイルを生成する
- エディタ(CapCut、Premiere Pro、Final Cut Pro、DaVinci Resolve)でSRTを動画に焼き込む
- 字幕入りのMP4をTikTokにアップロードする(同じファイルをInstagram Reels/YouTube Shorts/Facebook Reelsにも再利用)
60秒のTikTok1本あたりの処理時間は、合計でおよそ5〜10分まで短縮されます。
ツールの推奨
広東語/北京語/複数言語が混在するコンテンツに特化して作られているのがSubananaです。Subananaは音声認識(STT)モデルを継続的にベンチマークし、文字起こしごとにソース言語で最も性能の高いモデルを選びます。中国語については書き言葉での出力にも対応します(香港・台湾のコンテンツは話し言葉で発信される一方、画面上では書き言葉のほうが読みやすいため重要です)。
流れは次のとおりです。
- TikTokクリップをSubananaにアップロードする(mp4/mov/webm/ogg、有料プランでは最大15 GB)。あるいはYouTube/Instagram/Facebookの公開リンクを貼り付ければ、ローカルにダウンロードしなくてもSubananaが取得して文字起こしします。
- ソース言語を選ぶ
- 「字幕の生成を開始」をクリックする。1分のクリップは数分で完了します。
- 文字起こしを確認し、固有の用語(ブランド名、スラング)を修正する。中国語の場合は、出力言語または翻訳の対象言語として書き言葉(書面語)を選べます。
- 書き出す——エディタに取り込むためのSRTファイル、または字幕を焼き込んだMP4(TikTokにそのままアップロード可能)として出力します。
クロスプラットフォームのコツ:一度の字幕付けで3プラットフォーム対応
短尺クリエイターの多くは、TikTok+Instagram Reels+YouTube Shortsに同時投稿します。各プラットフォームの内蔵キャプションはそれぞれ独立していて、TikTokのキャプションはInstagramには引き継がれず、その逆も同様です。
方法3のワークフローは、標準的なクロスプラットフォーム手法です。AIで生成した1つのSRT、または焼き込み済みの1つのMP4が、一貫した字幕スタイルですべてのプラットフォームに展開できます。高頻度のクリエイターが週3本以上の短尺動画を投稿するようになると、AI-SRTワークフローに収束していくのはこのためです。
比較:それぞれの方法が適する場面
| TikTok内蔵キャプション | 手動テキストオーバーレイ | AI SRT(方法3) | |
|---|---|---|---|
| 60秒動画あたりの所要時間 | 2〜3分 | 30〜45分 | 5〜10分 |
| 英語の精度 | 高い | 手動(自分で制御) | 高い |
| 広東語/北京語の精度 | 限定的 | 手動 | 高い(広東語特化ツールと併用) |
| 話し言葉から書き言葉の中国語出力 | ❌ | 手動で書き換え | ✅(Subanana) |
| ブランド専用の字幕スタイル | 限定的 | ✅ フル | ✅ フル(SRT取り込み後、エディタで対応) |
| クロスプラットフォームでの再利用 | ❌(各プラットフォームで付け直し) | 手動で作り直し | ✅ 1つのSRTまたはMP4を全プラットフォームに展開 |
| 二言語字幕(例:中国語+英語) | ❌ | 手動 | ✅(Subananaは二言語SRTを書き出し) |
よくある質問
TikTokの自動キャプション機能はどれくらい正確ですか?
TikTokのキャプションはクリアな英語音声で最も正確です。非英語の言語対応は拡充されてきましたが、精度はばらつきがあります——特に広東語は歴史的に弱い傾向がありました。大規模に自動キャプションを採用する前に、対象言語の短いクリップでテストしてください。
TikTokを投稿した後でキャプションを編集できますか?
TikTokは投稿後に説明文や一部のメタデータを編集できますが、キャプション機能はレンダリングされた動画の一部です。公開済みTikTokのキャプションを変更するには、削除して再アップロードすることになります。これを避けるため、投稿前にキャプションを確定させてください。
TikTokに二言語の字幕を付けるには?
TikTok内蔵のキャプション機能は単一言語のみです。二言語のTikTok(地元と海外の両方の視聴者を狙う香港・台湾のクリエイターによくあります)には、外部で二言語SRTを生成します——Subananaは、1つのSRTにキューごとに原文と翻訳テキストの両方を含めて書き出します。エディタで二言語SRTを動画に焼き込み、TikTokにアップロードしてください。
TikTokのウェブ版(デスクトップのブラウザ)でも字幕は表示されますか?
はい——TikTokの内蔵機能、手動テキストオーバーレイ、焼き込み済みのMP4で付けた字幕は、いずれもTikTokのモバイル版とウェブ版で一貫して表示されます。
Subananaを使うのにソフトのインストールは必要ですか?
いいえ。Subananaはブラウザベースで、インストール不要です。TikTokの動画ファイルをアップロードするか、公開のTikTok/YouTube/Instagram/Facebookのリンクを貼り付け、字幕を生成し、SRTまたは焼き込み済みのMP4として書き出します。
関連:他プラットフォームの字幕ワークフロー
複数の短尺プラットフォームに投稿する場合は、こちらも参照してください。
- Instagram Reelsに字幕を付ける方法——同じワークフローのパターン
- CapCutで字幕を付ける方法——最も人気の短尺エディタ
- DaVinci Resolveで字幕を付ける方法——デスクトップのプロ向けエディタ
まとめ
クリアな音声の単発の英語TikTokなら、内蔵のキャプション機能で十分かつ速いです。一方、非英語コンテンツ、ブランドスタイルの字幕、あるいは週に数本を超えるどんなペースであっても、AI-SRTワークフローは週に数時間を節約し、投稿するすべてのプラットフォームで一貫した、ブランドに沿った字幕を生み出します。
——無料プランは最大15分/3 GBのファイルに対応します。