如何製作中英文雙語字幕?影片國際化的完整教學(生成、翻譯、匯出 SRT)
如何製作中英文雙語字幕?影片國際化的完整教學
要製作中英文雙語字幕,流程是:先把影片的原始語音轉成有時間軸的字幕,再把這份字幕翻譯成第二種語言,然後把兩種語言對齊到同一段時間軸,最後匯出成雙語 SRT/VTT 檔,或直接輸出一支內嵌字幕的影片。整個過程不需要逐句聽打——AI 字幕工具會自動生成時間軸與譯文,你只需要校對與微調。
中英文字幕是影片國際化最直接的一步。一支講中文的教學影片,配上中英對照字幕,就能同時被台灣觀眾與海外英文觀眾看懂;反過來,一支英文訪談配上中文字幕,也能在中文社群擴散。這篇教學會完整走過雙語字幕的每個環節,並說明哪些步驟可以交給工具自動完成。
什麼是中英文雙語字幕?和單語字幕差在哪?
雙語字幕指的是同一個時間點同時顯示兩種語言:通常上方一行原文、下方一行譯文(例如上中文、下英文)。它和「只翻譯成另一種語言」的單語字幕不同——雙語字幕保留原文,方便語言學習者對照,也讓兩種母語的觀眾都能跟上。
常見的雙語字幕呈現方式有三種:
- 雙語 SRT/VTT 檔:一個字幕檔內每段對白都含兩行(原文+譯文),上傳到 YouTube 或播放器時兩種語言一起顯示。
- 內嵌(燒錄)雙語字幕影片:把兩行字幕直接燒進畫面,輸出成一支影片,適合上傳到不支援外掛字幕的平台(如多數社群短影音)。
- 兩個獨立單語字幕檔:原文一個檔、譯文一個檔,讓平台或觀眾自行切換語言。
這三種輸出對應不同的發佈場景,後面的步驟會說明如何一次產生你需要的格式。
製作中英文雙語字幕的完整步驟
下面以「一支中文影片,要加上中英對照字幕」為例,拆成五個步驟。反過來做(英文影片加中文字幕)流程完全相同,只是來源語言與翻譯目標對調。
- 匯入影片並選擇來源語言。 上傳影片檔(MP4/MOV/WEBM 等),或直接貼上公開的 YouTube、Instagram、Facebook 連結讓工具抓取。接著指定影片的原始語言(例如「中文」),這是 AI 正確辨識語音的前提。
- 自動生成有時間軸的原文字幕。 AI 會把語音轉成逐句字幕,並自動切分時間軸(每句的起訖時間)。這一步取代了人工聽打,是最省時間的環節。
- 加上翻譯目標語言。 在設定中把英文加為翻譯目標。系統會在原文字幕的基礎上,逐句產生對應的英文譯文,並沿用同一條時間軸,原文與譯文自然對齊。
- 校對文字與時間軸。 檢查兩件事:一是辨識或翻譯有沒有錯字、漏字;二是每句字幕的顯示時間會不會太短(觀眾來不及讀)或太長。良好的工具會標示「閱讀速度過快」的字幕,提醒你拆句或延長秒數。
- 匯出你需要的格式。 決定要雙語 SRT/VTT 檔、兩個獨立的單語檔,還是一支內嵌字幕的影片,然後一鍵匯出。上傳平台前,建議先在播放器預覽字幕是否對齊。
為什麼「同一條時間軸」這麼關鍵?
雙語字幕最容易出錯的地方,不是翻譯本身,而是兩種語言的時間軸對不上——譯文比原文晚出現、或斷句位置不同,觀眾就會看到字幕跳動。讓翻譯沿用原文既有的時間軸(而不是另外生成一套),是避免這個問題的核心。這也是用 AI 字幕工具一次產出雙語、比「先做原文、再丟去翻譯軟體、再手動貼回時間軸」可靠的原因。
中英文字幕要匯出哪種格式?
不同平台支援的字幕格式不同,先想好發佈管道再決定匯出格式,能少走很多冤枉路。
| 輸出格式 | 適合場景 | 說明 |
|---|---|---|
| 雙語 SRT | YouTube、線上課程平台、一般播放器 | SRT 是純文字字幕檔,由「序號+顯示起訖時間+字幕文字+空行分隔」四個部分組成(Matroska 技術文件),相容性最廣。 |
| VTT | 網頁內嵌影片(HTML <track>) | WebVTT 是 W3C 的網頁字幕標準格式,供 HTML <video> 透過 <track> 載入字幕(W3C 規格、MDN)。 |
| 內嵌字幕影片 | Instagram、TikTok、Facebook 等社群短影音 | 字幕燒進畫面,不依賴平台外掛字幕,確保所有人都看得到。 |
| 兩個獨立單語檔 | 需讓觀眾自行切換語言的平台 | 中文一檔、英文一檔,平台各自掛載。 |
簡單原則:上傳到支援外掛字幕的平台(YouTube、課程平台)就交雙語 SRT;發到社群短影音就用內嵌字幕影片;做網頁自架播放器則用 VTT。
用 Subanana 一次產出中英雙語字幕
Subanana 的 AI 字幕工具 把上面五個步驟整合在同一個介面裡,重點是它的字幕模式支援「多個翻譯目標語言」——這是四種處理模式中唯一可以一次輸出多種語言的模式(逐字稿、會議與即時字幕都是單一翻譯目標)。實務上這代表你可以從同一個專案,同時得到中文字幕、英文字幕與中英對照字幕。
具體做法:
- 匯入:上傳影片,或貼上公開的 YouTube/Instagram/Facebook 連結,由系統抓取轉錄。
- 設定:來源語言選中文,翻譯目標加上英文(需要更多語言可一併勾選,全平台支援 80 多種語言)。
- 生成與校對:系統自動產生有時間軸的字幕;編輯器會以規則標示閱讀速度過快的字幕、並由 LLM 輔助提示可能聽錯或同音誤植的字詞(採「建議後確認」,不會自動覆蓋你的內容)。如果影片裡有品牌名或專有名詞,可先在詞彙表釘住,避免被誤寫。
- 匯出:可輸出中英對照的雙語 SRT 檔、兩個獨立的中文/英文字幕檔,或一支內嵌字幕的影片(單語或雙語內嵌皆可)。可匯出的格式包含 SRT、VTT、TXT、Word、Excel 與 Markdown。
關於辨識品質:Subanana 不綁定單一語音辨識供應商,而是持續對各語言做基準評測,為每段轉錄挑選表現最好的模型;當某個模型輸出出現異常時,系統會自動改用另一個評測過的模型重跑——這次重跑不另外計費。翻譯目前也是在轉錄之上免費附加。
常見問題
免費就能做出可用的中英文字幕嗎?
可以先免費試做、預覽結果,但免費方案只會輸出帶浮水印、前 5 分鐘、最高 720p 的影片,無法匯出字幕檔或複製逐字稿。要拿到可用的 SRT/VTT 字幕檔、移除浮水印並提升畫質,需要付費方案——Lite 方案年繳約每月 US$9(約 HK$68)。各方案內容可參考 Subanana 方案費用。
AI 自動生成的雙語字幕,還需要人工校對嗎?
需要,但工作量遠小於從頭聽打。AI 已完成最耗時的逐句轉錄、時間軸切分與翻譯;你的角色是覆核——修正專有名詞、確認斷句、調整顯示過快的字幕。把校對重點放在品牌名、數字與容易聽錯的同音字上,效率最高。
雙語字幕的兩種語言會自動對齊時間軸嗎?
會。當翻譯是在原文字幕之上產生、沿用同一條時間軸時,原文與譯文就會落在相同的起訖時間,不需要手動對齊。這也是建議用同一個工具一次產出雙語字幕(而非把原文丟到另一套翻譯軟體再貼回)的主因。
準備好讓你的影片同時觸及中英文觀眾,到 Subanana 上傳第一支影片,幾分鐘內就能拿到第一版中英雙語字幕。