SRT檔是什麼?一分鐘搞懂SRT字幕檔怎樣打開、編輯、自動生成
上星期一位接案剪片的朋友 WhatsApp 我,發了一個 interview_cut3.srt 給我,問:「雙擊打不開,Final Cut 又說時間碼錯誤,怎麼辦?」打開一看,檔案第一行是亂碼的 1——典型的 BOM 編碼問題,加上幾條字幕時間重疊了 0.2 秒,所以 Final Cut 直接拒絕匯入。
SRT 檔其實非常簡單,簡單到很多人反而低估了它。本文用 1 分鐘說明幾件事:SRT檔到底是什麼、用什麼工具可以打開它、如何自己修改時間與文字,以及如果你根本還沒有 SRT 檔、只有一條影片的話,如何讓 AI 在幾分鐘內為你生成一份(包括粵語)。
什麼是 SRT檔?
SRT 是 SubRip Subtitle 的簡稱,最早由 1990 年代末一個叫 SubRip 的 DVD 字幕提取工具定義。它的設計哲學只有一條:用純文字記錄「什麼時候、顯示什麼字」。
用任何文字編輯器打開一個 .srt 檔,你會見到這樣的結構:
1
00:00:00,560 --> 00:00:05,400
第一個同學 出到去拎個波
2
00:00:06,430 --> 00:00:09,592
返嚟 好喇 然後

每一「條」字幕由 4 行組成:
- 序號(1、2、3……)
- 時間碼:開始時間
-->結束時間,格式是時:分:秒,毫秒(注意是逗號,不是句號——這個差異會令一些舊版 VLC 直接放棄解析) - 字幕文字(可以是多行)
- 一行空行,標示這條字幕結束
就這麼多。沒有字體、沒有顏色、沒有特效——這些屬於 ASS 或 VTT 的範疇。SRT 的整個價值就在於「幾乎所有東西都打開得到」:YouTube、Netflix、Vimeo、VLC、Premiere、Final Cut、DaVinci Resolve、甚至 Notepad,全部識別。
3 種打開 SRT檔的方法
1. 文字編輯器(最快,但只能看不能預覽)
Windows 用 Notepad、Mac 用 TextEdit、VS Code 也可以。好處是秒開,隨時可以手動改文字或時間碼。壞處是你看不到字幕實際顯示在影片上的效果。
注意事項:如果你用 Windows 的 Notepad 儲存含中文的 SRT,預設會加上 UTF-8 BOM(文件開頭那個隱形的 ),部分老舊播放器(例如某些版本的 PotPlayer)會因此把第一條字幕的序號吞掉。解決方法是用 VS Code 或 Notepad++ 儲存時選「UTF-8 without BOM」。
2. 媒體播放器(只想看一看)
把 .srt 檔和影片檔放在同一個資料夾、改成同一個檔名(例如 my_video.mp4 和 my_video.srt),然後用 VLC 打開影片,字幕會自動載入。這是最省事的方法,VLC 亦是少數能穩定處理各種編碼(UTF-8、Big5、GB18030)的播放器。
Windows Media Player 也可以,但對中文編碼的兼容性沒 VLC 好。
3. 字幕編輯軟體(要認真修改時間與文字)
幾個選擇,坦白說各有優勢:
- Subtitle Edit(Windows 免費)——功能最全,有波形顯示、翻譯接口、格式轉換(SRT ↔ ASS ↔ VTT)。專業字幕組的主力工具。缺點是介面較舊、Mac 使用者要透過 mono 安裝,比較麻煩。
- Aegisub(跨平台免費)——本身是為 .ass 特效字幕設計,但打開 .srt 完全沒有問題。時間軸加波形非常精準,是 Fansub 圈的行業標準。如果你的需求只是純粹的 SRT、沒有特效,Aegisub 對你來說功能過剩。
- Subanana(雲端)——我們自己的工具。不需安裝、直接在瀏覽器編輯,但主力定位是「為你從零生成 SRT」而非純粹修改字幕,所以如果你已經有一份完整 SRT、只想改幾個錯字,用 Subtitle Edit 其實更快。Subanana 的強項會在下一節介紹。
如何自動生成一份 SRT檔?
這才是大部分讀者真正的需求:不是修改現成的 SRT,而是根本還沒有——手上只有一段影片或錄音,想要一份配對好時間碼的字幕檔。
手動打字加對時間碼,一條 10 分鐘影片通常要花 40–60 分鐘。用 AI 自動生成的話可以壓縮到 2–3 分鐘,準確率視乎語言和音質通常有 90–98%。
Subanana 的 AI 字幕工具就是為了這件事而設計的,特別是粵語——這是我們的主力市場,粵語識別率接近 95%,遠高於大部分英文優先的工具。使用流程大概是這樣:
- 上傳影片或貼上社交連結(支援 .mp4 / .mov / .webm / .ogg 檔案,最大 15GB、最長 3 小時;或直接貼 YouTube/Instagram/Facebook 的公開連結,免先下載到本機)
- 選擇來源語言(粵語 / 華語 / 英文 / 日文 / 韓文等 80+ 種)
- 按「開始生成字幕」——後台會根據你選的語言自動挑選當前評測表現最好的一個或幾個 STT 模型並行處理。我們的做法是持續對市面上各家 STT 模型做準確度評測,不同語言指派給不同模型,不綁死任何單一供應商,所以當某個模型在粵語或日語上領先,我們就會自動切換。
- 在網頁上檢視、修改文字和時間碼(編輯器會用每秒字數(CPS)檢查自動標出過密或過疏的字幕,讓你優先檢查修正)
- 下載 .srt(或 .vtt / .txt / .docx / .xlsx / .md,共 6 種匯出格式)
如果你的影片是訪問、Podcast、或者雙人對話的錄音,Subanana 的逐字稿功能可以同時做 speaker diarization(識別每句話是誰說的),在後期剪接時特別有用。
想了解更多提升字幕準確率的小技巧,可以參考我之前寫的3 個 AI 字幕工具使用小秘訣。
編輯 SRT檔時最常見的 3 個錯誤
錯誤 1:時間碼重疊
兩條字幕的時間範圍重疊(例如第一條 00:00:03,000 --> 00:00:05,500、第二條 00:00:05,200 --> 00:00:07,000)。在 VLC 播放沒事,但 Premiere 或 Final Cut 匯入時會直接報錯。解決方法:確保前一條的結束時間,一定要早於下一條的開始時間,中間至少留 0.05 秒。
錯誤 2:用句號代替逗號作毫秒分隔
00:00:01.500 是錯的,正確格式是 00:00:01,500。SRT 規範只接受逗號。這個錯誤最常見於從 VTT 手動轉 SRT 的人——VTT 用的是句號。
錯誤 3:BOM 編碼(UTF-8 前面那個隱形字元)
文中開頭提到的例子。用 VS Code 打開 .srt,右下角可以見到編碼格式,如果顯示「UTF-8 with BOM」,按一下改成「UTF-8」再儲存就解決了。這個問題在繁體中文環境特別常見,因為 Windows Notepad 預設儲存行為就是 UTF-8 with BOM。
總結
SRT 檔的結構很簡單:序號、時間碼、文字、空行。打開可以用文字編輯器、媒體播放器、或者字幕編輯軟體,三者各有適合的使用情境。真正耗時的部分不是編輯,而是從零建立第一份 SRT——而這件事現在已經可以交給 AI。
如果你正在處理影片、錄音、或者訪問逐字稿,不妨試一下 Subanana 的 AI 字幕生成。免費方案可以處理 15 分鐘以內的檔案,足夠測試自己的實際影片;付費方案由 US$9/月(約 HK$68/月,年繳)起,詳情可參考方案費用頁面。