YouTube 加字幕完整教學 2026:用 YouTube Studio 內建字幕,加粵語/跨地區觀眾場景的補位方案
上星期一位做廣東話科技開箱的 YouTuber 朋友傳訊息給我,剛剪完一條 18 分鐘的新機評測,點進 YouTube Studio 直接用自動字幕——免費、不用離開瀏覽器。等字幕跑完一看:整條片都是 佢哋而家唔使咁做 這種口語,香港以外的繁中觀眾讀起來會卡住。他問:「YouTube 自動字幕夠用嗎?還是要換工具?」
這是粵語 YouTuber 常撞到的場景。YouTube 自動字幕做對了很多事,但對想把內容分發到香港 + 台灣 + 新加坡 + 馬來西亞的創作者,預設輸出基本上要全部重寫。這一篇先走 YouTube Studio 三條原生字幕路徑,再講自動字幕的強項與弱點,最後介紹用 Subanana 生成 SRT 再上傳的補位流程。
YouTube Studio 加字幕:三條原生路徑
YouTube Studio 的 字幕 頁裡,影片加字幕一共有三條路徑——可以單獨用,也可以混合用。流程如下:
- 進入字幕設定:登入 YouTube Studio,左側選單點
字幕。選影片進入字幕分頁,按新增語言選來源語言(例如中文(繁體)或粵語或英文)。 - 路徑 A:等 YouTube 自動生成字幕:影片上傳後幾分鐘到幾小時內,YouTube 會對支援的語言跑語音辨識,生成
自動字幕軌。打開就可以直接編輯——修錯字、調時間、斷行。對不要求高準確率的短片成本最低。 - 路徑 B:從零手動輸入:自動字幕還沒生成或完全不能用,按
新增字幕>手動輸入。YouTube 顯示播放器 + 文字輸入欄,你邊播邊打,時間自動記錄。適合短片、或想完全控制字幕內容的創作者。 - 路徑 C:上傳 .srt 檔:已經用其他工具生成好 SRT(例如稍後會講的 Subanana 流程),按
新增字幕>上傳檔案>有時間碼的檔案上傳。YouTube 會讀取時間碼自動對齊。專業流程最常用這條——把字幕外包給更準的工具,成品丟回 YouTube 發佈。 - 儲存並發佈:按
儲存為草稿或發佈。觀眾端會在播放器CC按鈕看到語言選項。
三條路徑不互斥。常見做法是先讓 YouTube 自動跑一次做起點,能用就用、不能用就走路徑 C 上傳自己的 SRT。
YouTube 自動字幕的強項
在講弱點之前,先把 YouTube 自動字幕真正贏過 standalone AI 字幕工具的地方列清楚:
- 完全免費,沒有額度限制:上傳影片就自動跑,不用另外訂閱任何工具。
- 零工作流摩擦:不用下載影片、不用匯出匯入——影片本來就在 YouTube 上,字幕就在 YouTube 生成,發佈也在 YouTube。
- 英語準確率通常可接受:乾淨錄音的英語 podcast、vlog、教學片,YouTube 自動字幕通常達到「稍作編輯就能發佈」的程度。
- 時間碼自動對齊:由 YouTube 內部對齊,不會出現 SRT 上傳後整條軌跑掉的問題。
如果你的內容是英語主導、短片、錄音可控,YouTube 自動字幕是最順手的選擇——這篇文章不會叫你換工具。
YouTube 自動字幕會吃力的場景
問題是 YouTube 自動字幕綁定 Google 內部的單一語音辨識後端,對幾類素材會明顯掉鏈。對粵語 YouTuber 來說,第一點幾乎是決定性的。
1. 粵語 → 只輸出口語,沒有書面語轉換(最關鍵):這不是準確率問題,是功能缺失。YouTube 官方把粵語列在 自動字幕支援語言列表 裡,名稱是 Cantonese/Hong Kong——粵語創作者上傳影片後,只要在 YouTube Studio → 影片詳細資料 → 語言與字幕認證 把影片語言設成 粵語 (香港),系統就會嘗試產生粵語自動字幕(前提是音質夠清、處理沒失敗;不設語言或設錯語言都可能令自動字幕直接不產生,或產生成另一種中文)。但就算成功產生,輸出會是一整條 佢哋而家唔使咁做喇 的口語字幕——YouTube 沒有把口語轉成書面語(他們現在不需要這樣做了)的那一步。目標觀眾只在香港、只看本地口語語境的 Shorts 勉強可用;但給 YouTube 長片、課程、企業頻道、或跨地區(香港 + 台灣 + 新加坡 + 馬來西亞)繁中觀眾看,口語字幕基本上不可用——你會花大量時間手動把每一條改成書面語。對想把粵語影片跨地區分發的 YouTuber 來說,這一步決定了 YouTube 自動字幕能不能成為字幕主力。答案通常是不能。
2. 準確率依錄音環境、口音、音質波動:YouTube 自己的說明 承認「發音不標準、口音、方言、背景雜音」都可能令自動字幕不準確,但沒有公開分語言、分場景的準確率數字。實測下,同一語言在錄音室清晰錄製 vs 街訪/活動現場,準確率差異明顯。依賴 YouTube 自動字幕的頻道,每類新素材建議先跑一次看效果。
3. 分語言成熟度不均(覆蓋多 ≠ 表現一致):YouTube 官方支援的自動字幕語言超過 60 種,包括 Cantonese/Hong Kong、Chinese(華語,不分簡繁)、Japanese、Korean、Vietnamese、Thai、Indonesian 等,覆蓋面在業界算寬。但 Google 沒有公開分語言的準確率數字,使用者社群長期反映的觀察是:英語最強 → 華語中上 → 廣東話明顯較弱(九聲六調 + 同音字密度高,是公認的語言辨識挑戰)→ 小語種波動最大。多語混合影片(廣東話夾英語夾日語)辨識結果最不穩定。
補位流程:用 Subanana 生成 SRT 再上傳 YouTube
試過 YouTube 自動字幕結果不理想——尤其是第一點口語 vs 書面語的問題——最務實的做法是:把字幕外包給粵語/跨地區繁中處理得更好、而且會做口語→書面語轉換的工具,拿到 SRT 再上傳 YouTube。
Subanana 的 AI 字幕工具 就是為這個補位角色設計的。最關鍵的差異:Subanana 內建「口語直接轉書面語」功能——粵語影片轉錄完成後,一鍵把 佢哋而家唔使咁做 轉成 他們現在不需要這樣做,整條 SRT 都做好。這個功能在 YouTube 自動字幕、Premiere Speech to Text、ArcTime、pyTranscriber 都沒有,是 Cantonese-to-繁中-書面語 流程裡 Subanana 最明顯的差異化。
流程:
- 貼 YouTube 連結(免下載):影片本來就在 YouTube 上,Subanana 支援直接貼 YouTube 公開連結——免下載、免轉檔。Instagram 和 Facebook 的公開連結也支援。
- 選來源語言:粵語、華語、英文、或多語混合。Subanana 會根據來源語言路由到當前對該語言表現最好的 STT 模型(持續對多個模型做基準測試,不鎖單一供應商)。
- 一鍵口語轉書面語(粵語獨有):轉錄完成後,按一下把整條 SRT 從口語轉成書面語。可以保留原口語版,或兩個版本都匯出。
- 在 Subanana 編輯器校對:編輯器疊加多層質素檢查:
- 幻覺偵測 + 自動換模型:某段輸出跟音檔對不上(模型「幻覺」),系統會把該段自動交給另一個已評測的模型重跑。
- LLM 輔助校對(僅針對文字層的同音/形近錯字):LLM 會過一次文字稿,標出疑似被辨識錯的字——例如「在見」該是「再見」這類同音字錯配——提出修改建議,最終由你按一下確認。這層只處理辨識錯的字,不會偵測漏字、不會改時間碼。
- CPS(字數/秒)檢查:字幕條「一秒塞太多字、觀眾來不及讀」或「停太久冷場」的位置會被標出。
- 匯出 SRT 或雙語 SRT:Subanana 可以匯出純源文 SRT,也可以匯出雙語 SRT(源文 + 譯文在同一檔案裡上下排),做「中英對照字幕」一步到位。另有 VTT、TXT、DOCX、XLSX、Markdown 共六種單檔格式。
- 上傳回 YouTube Studio:在 YouTube Studio 的
字幕頁按新增字幕>上傳檔案>有時間碼的檔案,選 Subanana 匯出的.srt。YouTube 會按時間碼自動鋪到字幕軌上——確認無誤後發佈,觀眾端會在 CC 選單看到你上傳的軌(可以設為預設)。
整個流程比純 YouTube 自動字幕多兩步(Subanana 轉錄 + 匯入 YouTube),但換回來的是粵語/跨地區繁中場景下明顯更高的可讀性。不熟悉 SRT 格式可以先看 一分鐘看懂 SRT 字幕檔 補基礎。
Subanana 付費方案由 US$9/月(約 HK$68/月,年繳) 起,免費方案也夠單次試用。詳見 方案費用頁。
什麼時候 YouTube 自動字幕就夠了
不是每條片都值得多走 Subanana 一步。以下情況,留在 YouTube 原生自動字幕就好——
- 內容以英語為主:英語是 Google 語音辨識訓練資料最充足的語言,準確率通常夠用,手動修幾條錯字、調一下時間就能發佈。
- 短片、對白清晰、錄音可控:15 分鐘以下的單人說明片、錄音室播客,錯字率通常可接受。
- 頻道流程本來就有逐條校對:來源 STT 準確率差一點影響不大。
- 目標觀眾只在 HK 本地、口語字幕可接受:Shorts、Vlog、本地 meme 類內容,口語直接上字幕反而有地道感。
判斷原則:影片愈接近「粵語 / 跨地區繁中 / 多人對談 / 戶外雜音」,用 Subanana 補位愈划算;愈接近「英語 / 單人 / 錄音室」,留在 YouTube 自動字幕愈划算。
用 Premiere Pro 剪片的 YouTuber 可以參考 Premiere Pro 加字幕完整教學 的 Subanana → SRT → Premiere 流程。想比較 5 款字幕工具在同批素材下的準確率,可以看 AI 字幕 App 比較 2026。字幕設計取捨(字型、行距、閱讀速度)見 影片加字幕的 4 個重點。
YouTube 加字幕常見問題
Q1:YouTube 自動字幕是免費的嗎?有沒有額度限制? 完全免費,沒有月度額度或影片時長上限——只要影片公開或未列出,YouTube 就會自動跑。但只支援 Google 官方公開的語言列表,各語言的準確率差異明顯。
Q2:YouTube 自動字幕對粵語支援如何?
可用但有兩個硬限制:一,只輸出口語字幕(佢哋 / 唔使 / 而家),沒有自動轉書面語;二,粵語準確率通常低於華語(國語)。如果目標觀眾只在 HK 本地可以考慮直接用;跨地區分發建議 用 Subanana 生成 SRT 再上傳。
Q3:自己做的 SRT 上傳後,YouTube 會不會覆蓋掉自動字幕? 不會。YouTube 會把兩者視為獨立軌,觀眾在 CC 選單都看得到。常見做法是把自己上傳的軌設為預設,需要時再把自動字幕軌刪掉。
Q4:Subanana 匯出的 SRT 上傳 YouTube 會不會時間碼對不上? Subanana 匯出的 SRT 用從影片 0:00 開始的絕對時間碼,只要上傳 SRT 對應的是同一條影片原檔就會對得上。如果剪輯後的影片跟轉錄時的素材不同,需要按剪輯後的時間軸重新生成 SRT。
Q5:YouTube 自動字幕可以一次過輸出雙語字幕嗎?
不可以。YouTube 自動字幕一次只生成一條來源語言軌,翻譯靠觀眾端的 自動翻譯(品質不穩)。想做「中英對照」雙語字幕要用外部工具生成雙語 SRT 再上傳。Subanana 的雙語 SRT 匯出把源文跟譯文疊在同一條 caption 內,上傳 YouTube 後直接是雙語顯示。
YouTube 加字幕的核心工作流在英語主導、短片、錄音可控的場景下,原生自動字幕就很順手——免費、零摩擦、跟平台完全整合。但當素材涉及粵語或要給跨地區繁中觀眾看,「只輸出口語、沒有書面語轉換」就會成為硬瓶頸——這是 Subanana 投入最多工夫的差異化。把字幕這一步外包給 Subanana 生成 SRT 再上傳 YouTube——不換發佈平台、不重建流程,只在一個具體環節上用更合適的模型。