如何製作中英文雙語字幕?影片國際化的完整教學(生成、翻譯、匯出 SRT)

2026-06-01
KKevin Wong

如何製作中英文雙語字幕?影片國際化的完整教學

要製作中英文雙語字幕,流程是:先把影片的原始語音轉成有時間軸的字幕,再把這份字幕翻譯成第二種語言,然後把兩種語言對齊到同一段時間軸,最後匯出成雙語 SRT/VTT 檔,或直接輸出一支內嵌字幕的影片。整個過程不需要逐句聽打——AI 字幕工具會自動生成時間軸與譯文,你只需要校對與微調。

中英文字幕是影片國際化最直接的一步。一支講中文的教學影片,配上中英對照字幕,就能同時被台灣觀眾與海外英文觀眾看懂;反過來,一支英文訪談配上中文字幕,也能在中文社群擴散。這篇教學會完整走過雙語字幕的每個環節,並說明哪些步驟可以交給工具自動完成。

什麼是中英文雙語字幕?和單語字幕差在哪?

雙語字幕指的是同一個時間點同時顯示兩種語言:通常上方一行原文、下方一行譯文(例如上中文、下英文)。它和「只翻譯成另一種語言」的單語字幕不同——雙語字幕保留原文,方便語言學習者對照,也讓兩種母語的觀眾都能跟上。

常見的雙語字幕呈現方式有三種:

  • 雙語 SRT/VTT 檔:一個字幕檔內每段對白都含兩行(原文+譯文),上傳到 YouTube 或播放器時兩種語言一起顯示。
  • 內嵌(燒錄)雙語字幕影片:把兩行字幕直接燒進畫面,輸出成一支影片,適合上傳到不支援外掛字幕的平台(如多數社群短影音)。
  • 兩個獨立單語字幕檔:原文一個檔、譯文一個檔,讓平台或觀眾自行切換語言。

這三種輸出對應不同的發佈場景,後面的步驟會說明如何一次產生你需要的格式。

製作中英文雙語字幕的完整步驟

下面以「一支中文影片,要加上中英對照字幕」為例,拆成五個步驟。反過來做(英文影片加中文字幕)流程完全相同,只是來源語言與翻譯目標對調。

  1. 匯入影片並選擇來源語言。 上傳影片檔(MP4/MOV/WEBM 等),或直接貼上公開的 YouTube、Instagram、Facebook 連結讓工具抓取。接著指定影片的原始語言(例如「中文」),這是 AI 正確辨識語音的前提。
  2. 自動生成有時間軸的原文字幕。 AI 會把語音轉成逐句字幕,並自動切分時間軸(每句的起訖時間)。這一步取代了人工聽打,是最省時間的環節。
  3. 加上翻譯目標語言。 在設定中把英文加為翻譯目標。系統會在原文字幕的基礎上,逐句產生對應的英文譯文,並沿用同一條時間軸,原文與譯文自然對齊。
  4. 校對文字與時間軸。 檢查兩件事:一是辨識或翻譯有沒有錯字、漏字;二是每句字幕的顯示時間會不會太短(觀眾來不及讀)或太長。良好的工具會標示「閱讀速度過快」的字幕,提醒你拆句或延長秒數。
  5. 匯出你需要的格式。 決定要雙語 SRT/VTT 檔、兩個獨立的單語檔,還是一支內嵌字幕的影片,然後一鍵匯出。上傳平台前,建議先在播放器預覽字幕是否對齊。

為什麼「同一條時間軸」這麼關鍵?

雙語字幕最容易出錯的地方,不是翻譯本身,而是兩種語言的時間軸對不上——譯文比原文晚出現、或斷句位置不同,觀眾就會看到字幕跳動。讓翻譯沿用原文既有的時間軸(而不是另外生成一套),是避免這個問題的核心。這也是用 AI 字幕工具一次產出雙語、比「先做原文、再丟去翻譯軟體、再手動貼回時間軸」可靠的原因。

中英文字幕要匯出哪種格式?

不同平台支援的字幕格式不同,先想好發佈管道再決定匯出格式,能少走很多冤枉路。

輸出格式適合場景說明
雙語 SRTYouTube、線上課程平台、一般播放器SRT 是純文字字幕檔,由「序號+顯示起訖時間+字幕文字+空行分隔」四個部分組成(Matroska 技術文件),相容性最廣。
VTT網頁內嵌影片(HTML <track>WebVTT 是 W3C 的網頁字幕標準格式,供 HTML <video> 透過 <track> 載入字幕(W3C 規格MDN)。
內嵌字幕影片Instagram、TikTok、Facebook 等社群短影音字幕燒進畫面,不依賴平台外掛字幕,確保所有人都看得到。
兩個獨立單語檔需讓觀眾自行切換語言的平台中文一檔、英文一檔,平台各自掛載。

簡單原則:上傳到支援外掛字幕的平台(YouTube、課程平台)就交雙語 SRT;發到社群短影音就用內嵌字幕影片;做網頁自架播放器則用 VTT。

用 Subanana 一次產出中英雙語字幕

Subanana 的 AI 字幕工具 把上面五個步驟整合在同一個介面裡,重點是它的字幕模式支援「多個翻譯目標語言」——這是四種處理模式中唯一可以一次輸出多種語言的模式(逐字稿、會議與即時字幕都是單一翻譯目標)。實務上這代表你可以從同一個專案,同時得到中文字幕、英文字幕與中英對照字幕。

具體做法:

  • 匯入:上傳影片,或貼上公開的 YouTube/Instagram/Facebook 連結,由系統抓取轉錄。
  • 設定:來源語言選中文,翻譯目標加上英文(需要更多語言可一併勾選,全平台支援 80 多種語言)。
  • 生成與校對:系統自動產生有時間軸的字幕;編輯器會以規則標示閱讀速度過快的字幕、並由 LLM 輔助提示可能聽錯或同音誤植的字詞(採「建議後確認」,不會自動覆蓋你的內容)。如果影片裡有品牌名或專有名詞,可先在詞彙表釘住,避免被誤寫。
  • 匯出:可輸出中英對照的雙語 SRT 檔兩個獨立的中文/英文字幕檔,或一支內嵌字幕的影片(單語或雙語內嵌皆可)。可匯出的格式包含 SRT、VTT、TXT、Word、Excel 與 Markdown。

關於辨識品質:Subanana 不綁定單一語音辨識供應商,而是持續對各語言做基準評測,為每段轉錄挑選表現最好的模型;當某個模型輸出出現異常時,系統會自動改用另一個評測過的模型重跑——這次重跑不另外計費。翻譯目前也是在轉錄之上免費附加。

常見問題

免費就能做出可用的中英文字幕嗎?

可以先免費試做、預覽結果,但免費方案只會輸出帶浮水印、前 5 分鐘、最高 720p 的影片,無法匯出字幕檔或複製逐字稿。要拿到可用的 SRT/VTT 字幕檔、移除浮水印並提升畫質,需要付費方案——Lite 方案年繳約每月 US$9(約 HK$68)。各方案內容可參考 Subanana 方案費用

AI 自動生成的雙語字幕,還需要人工校對嗎?

需要,但工作量遠小於從頭聽打。AI 已完成最耗時的逐句轉錄、時間軸切分與翻譯;你的角色是覆核——修正專有名詞、確認斷句、調整顯示過快的字幕。把校對重點放在品牌名、數字與容易聽錯的同音字上,效率最高。

雙語字幕的兩種語言會自動對齊時間軸嗎?

會。當翻譯是在原文字幕之上產生、沿用同一條時間軸時,原文與譯文就會落在相同的起訖時間,不需要手動對齊。這也是建議用同一個工具一次產出雙語字幕(而非把原文丟到另一套翻譯軟體再貼回)的主因。

準備好讓你的影片同時觸及中英文觀眾,到 Subanana 上傳第一支影片,幾分鐘內就能拿到第一版中英雙語字幕。

選用 Subanana,讓工作更輕鬆

無需提供付款方式
免費試用
隨時取消