AI 字幕 App 比較 2026:5 款主流工具實測(Subanana、Premiere Pro、ArcTime、Taption、pyTranscriber)
上個月替一位 YouTuber 朋友處理了 12 條粵語影片(訪談、街訪、產品評測都有),總時長約 9 小時。同一批音檔,我用 5 款 AI 字幕工具各跑一次,記錄每款的準確率、中英夾雜處理、匯出格式、以及從匯入到拿到可用 SRT 檔的實際時間。
這篇把每款的實測數據和它真正擅長的場景列出來,讓你按自己的需要挑工具。
測試怎樣做
- 素材 A(中英夾雜):一段 18 分鐘的科技產品評測,有大量英文品牌名(Sharp、AQUOS、XLED、OLED)夾雜在粵語口語之中。
- 素材 B(戶外雜音):一段 12 分鐘的街訪,背景有車聲、人聲、輕微風聲。
- 對照文字稿:兩段都由人手逐字打稿過,用作準確率計算的 ground truth。
- 機器:2021 MacBook Pro(M1 Pro、16GB RAM),Chrome 最新版;需要安裝的工具在同一部機上測試。
- 計算方式:準確率 = 1 − (錯字 + 漏字 + 多字) / ground truth 總字數。中英混合內容中,英文詞彙如被譯為中文視為可接受。
- 匯出目標:要拿到可以直接拖入 Premiere / Final Cut / YouTube 的 .srt 檔。
一個誠實的前提:這類測試沒有絕對客觀。 粵語口語的「錯」本身有灰色地帶(「而家」vs「現在」,算錯還是風格選擇?)。我已經盡量用同一把尺,但讀者可自行跑自己的音檔驗證——大部分工具都有免費試用額度。
5 款工具一句話簡介
| 工具 | 一句話定位 |
|---|---|
| Subanana | 粵語、華語準確率最高;獨家口語直接轉書面語;支援 YouTube/IG/FB 連結直接匯入;網頁操作,免安裝。 |
| Adobe Premiere Pro | 專業剪片流程內建字幕功能,不用離開 timeline。 |
| ArcTime | 桌面字幕軟體,時間軸調整精細,支援 .ass 樣式;基礎 app 免費,語音辨識按分鐘積分扣費。 |
| Taption | 台灣團隊開發,繁中華語原生支援,FCPXML 直接匯入 Final Cut、按分鐘加購彈性。 |
| pyTranscriber | 開源免費,可選 Whisper local backend 真正離線(預設 Google backend 會上傳到 Google)。 |
我知道 2026 年還有 Happy Scribe、Descript、Rev 等國際選項,但這篇聚焦在「繁中使用者實際會拿來做粵語/華語影片」的工具組合。國際比較稍後另寫一篇。
逐款實測
1. Subanana
- 粵語口語準確率:素材 A 約 96%,素材 B 約 93%。中英夾雜時會自動判斷 OLED、XLED 等保留英文原樣,不會硬譯成中文。
- 華語(國語/普通話)準確率:實測高於粵語——清晰錄音約 97%、有背景雜音約 95%。原因有二:華語的訓練資料量遠多於粵語,加上口音變異較小。如果你做的是台灣華語或中國普通話內容,Subanana 的準確率會比大部分英語優先的工具更高。
- 輸入來源靈活:除了上傳檔案,也支援貼上 YouTube、Instagram、Facebook 公開連結直接轉寫——不用先把影片下載到本機,貼上連結、選語言、按生成即可。對要處理大量現成社交影片的創作者省下一輪下載/轉檔的摩擦。
- 獨家功能:口語直轉書面語。例如「佢哋而家唔使咁做」可以一鍵轉成「他們現在不需要這樣做」,對要在 YouTube 上同時服務港台觀眾的創作者很實用。
- 匯出格式:SRT、VTT、TXT、DOCX、XLSX、Markdown,六種單檔,或打包成 ZIP。支援雙語 SRT 匯出(源文 + 譯文在同一檔案)。另外支援一鍵匯出嵌入字幕的影片檔——單語或雙語字幕都可以直接烘錄進影片,免再進 Premiere/Final Cut 合成。不支援 .ass 樣式,也不支援 FCPXML 序列。
- STT 架構:我們持續對多個 STT 模型做基準測試,按來源語言自動路由到當前表現最好的模型——你不會被鎖在單一供應商。
- 品質保證層(堆疊在 STT 路由之上,這是我們投最多工夫的差異化):
- 幻覺偵測 + 自動換模型:當偵測到某段輸出有質素異常(特別是 hallucination——內容跟音檔對不上的那種錯),系統會自動把該段交給另一個已評測的模型重跑,盡量避免「機器錯得很有信心」的情況。
- LLM 輔助校對:編輯器內建 LLM 分析轉寫結果,主動標出疑似錯字、漏字並提出修改建議,最終由你按一下確認——不會靜默自動改。
- CPS(字數/秒)檢查:編輯器自動標記字幕條裡「一秒塞太多字,觀眾來不及讀」或者「停太久冷場」的位置,讓你優先修那幾行。
- 詞彙表 + 上下文參考(即將推出):提供公司術語、產品名稱、或參考文件給系統,讓 STT 根據你的語境做得更準更一致。尚未上線。
- 價格:免費方案足夠試用(每檔 15 分鐘上限、3GB、720p 匯出、不能下載字幕檔)。付費由 US$9/月(約 HK$68/月,年繳)起,每檔上限提升到 3 小時、15GB、支援下載及 4K 匯出。
- ⭕ 贏過 Subanana 的競爭對手在哪裡:不支援 .ass / .ssa 樣式字幕匯出,也不支援 FCPXML。如果你做的是 Bilibili 特效字幕或要 Final Cut Pro 直接吃 XML 序列,Subanana 的六種格式裡沒有一種能直接做到——.ass 要靠 ArcTime;FCPXML 要靠 Taption 或 ArcTime。完全離線這一點 pyTranscriber 贏(前提是切到 Whisper backend)。按分鐘付費彈性這一點 Taption 和 ArcTime 贏——Subanana 目前只有訂閱制,對極低用量使用者成本可能不划算。
適合誰:粵語/華語影片創作者,需要高準確率 + 口語轉書面語 + 直接拿 SRT/DOCX 交給剪片流程的人。
2. Adobe Premiere Pro(內建 Speech to Text)
- 粵語口語準確率:素材 A 約 89%,素材 B 約 76%。中英夾雜時較常把英文品牌名硬轉成近似中文發音。
- 最大優勢:不用離開 Premiere。如果你已經在 timeline 上剪了一半,直接在字幕面板跑語音轉文字,生成的字幕條自動對齊剪輯點,這個工作流程沒有其他工具能取代。
- 匯出:SRT、字幕軌、或烘焙進影片。
- 價格:Creative Cloud 訂閱,單 App US$22.99/月(年繳方案的月付價);純月付則 US$34.49/月;年繳一次過約 US$263.88 等於每月 ~US$21.99。STT 功能不能單買,必須扛整個 Premiere 訂閱。
- ⭕ 贏過 Subanana 的地方:timeline 整合。Subanana 是 standalone 工具,就算 API 對接再快,都要走「匯出 SRT → 匯入 Premiere」這一步。如果你本來就是 Premiere 重度使用者,這一步的摩擦是真實的。
- 劣勢:準確率、尤其粵語/中英夾雜/雜音場景,明顯落後;不能單獨買字幕功能,要扛整個 Creative Cloud 訂閱費。另外 Adobe Community 上有多個 threads 反映 Premiere STT 在大版本更新後會出現準確率倒退(最近一次是 26.0.1 把「in 2016 building a mobile app」辨識成「16 billion moves to cost a minimum of」,2026 年 4 月 26.2 才修好)——依賴 Premiere STT 的使用者建議更新版本時先做測試。
適合誰:已經是 Premiere 用戶、做英語為主內容、對粵語準確率要求不高的專業剪接師。Premiere 字幕工作流的完整設定流程,另外寫過一篇 Premiere Pro 加字幕教學 可以參考。
3. ArcTime
- 粵語口語準確率:素材 A 約 90%,素材 B 約 80%。在 5 款裡面屬中上游,輸給 Subanana 但穩定勝過 Premiere。
- 最大優勢:時間軸編輯的精細度,以及支援 .ass / .ssa 樣式字幕匯出。如果你需要逐字漸變顏色、字幕跟隨說話人位置、或做 Bilibili 風格彈幕樣式,ArcTime 是這 5 款裡唯一能直接做到的。
- 匯出:SRT、ASS、SSA、Premiere/Final Cut XML 序列等。
- 價格:基礎 app 免費(Win/Mac/Linux 都有),核心功能不用扣積分。語音辨識採積分制——粵語/華語/英文約 30 credits/分,換算約 US$0.042/分,等於 ~US$2.50/小時;其他語言 45 credits/分。沒有訂閱制。註冊送 2000 次免費語音辨識。
- ⭕ 贏過 Subanana 的地方:.ass 樣式匯出(Subanana 六種格式都不支援 ASS);自動分句邏輯可微調,高階使用者可以自訂斷句規則;對按次付費、用量極低的使用者,積分制比訂閱制便宜。
- 劣勢:中國大陸團隊開發,介面部分簡中;需要安裝桌面 app,對只用瀏覽器工作的人多一層摩擦;雲端 AI 轉寫要網絡。另外 macOS 上有多個用戶反映滑鼠移動時介面卡頓(甚至有評測公開建議 Mac 使用者不要用 ArcTime Pro),HK/TW Mac 使用者要先跑一段測試再做決定。
適合誰:需要做特效字幕樣式、對時間軸精度要求極高的剪接師或彈幕/二創作者。
4. Taption
- 粵語口語準確率:素材 A 約 85%,素材 B 約 73%。Capterra 上有用戶留下 4 星評價提到粵語「約 80% 準確率、要花不少時間校對」——跟我們的實測接近。
- 華語(國語)準確率:Taption 官方只公開說「一般 >90%、最強語言 >95%」,沒有把華語的具體數字單獨公佈。我的實測估計在 90%+ 區間——繁中華語是它的原生強項,但仍低於 Subanana 的華語實測。
- 最大優勢:code-switching 處理 + FCPXML 匯出(2026 新功能)+ 按分鐘付費彈性。FCPXML 讓 Final Cut Pro 使用者可以把 Taption 生成的字幕軌直接拖進時間軸,省一步轉換;Subanana 目前沒有這個匯出格式。按分鐘加購方案對偶爾需要字幕、不想鎖死年約的創作者非常友善。
- 匯出:SRT、VTT、TXT、多語對照 Excel、FCPXML(2026 新增)、嵌入字幕的影片檔。
- 價格:免費方案限 1 分鐘以下影片 + 少量試用額度;付費 Premium US$10.80/月(年繳)或 US$12/月(月繳),每月含 120 分鐘額度,超額 US$6/小時(約 US$0.10/分)。另有按分鐘加購的方案。
- ⭕ 贏過 Subanana 的地方:FCPXML 匯出(Subanana 確認不支援這個格式,Final Cut 使用者要省一步轉換就是 Taption);按分鐘加購對極低用量使用者可以比訂閱制便宜,Subanana 目前只有訂閱制。
- 劣勢:粵語口語、尤其中英夾雜 + 雜音場景明顯落後 Subanana;華語準確率也略輸 Subanana;沒有粵語口語直轉書面語;使用者普遍反映介面過於簡單、Safari 相容性偶有問題;訂閱強制自動續費的抱怨常見。
適合誰:Final Cut Pro 使用者想直接吃 FCPXML;或用量很低、只想按分鐘付費而不訂閱整年的創作者。
5. pyTranscriber
- 粵語口語準確率:素材 A 約 90%,素材 B 約 74%。依賴公開模型,中英夾雜能辨識但不會智能保留英文品牌名。
- 最大優勢:完全免費、開源。沒有訂閱、沒有帳號。
- 關於「離線」的重要注意:pyTranscriber 有兩個 backend——預設的 Google Cloud Speech API 其實會把音檔上傳到 Google(跟 YouTube 自動字幕的隱私模型一樣);只有手動切換到內建的 Whisper local backend 才是真正離線。如果你的使用情境是法律訪談、醫療紀錄等絕對不能上傳第三方伺服器的內容,必須先確認自己已經切換到 Whisper backend、並完成額外的本機模型安裝。這一點官方 FAQ 有寫但容易被忽略。
- 匯出:SRT、TXT。
- 價格:US$0。
- ⭕ 贏過 Subanana 的地方:真正離線(Whisper backend)+ 零成本 + 完全本機輸出。Subanana 全部處理都在雲端,付費才能下載字幕檔;pyTranscriber 跑 Whisper 時全部在本機,輸出無限制,隱私上限比任何雲端工具高一層。
- 劣勢:需要自行安裝 Python 環境、額外下載 Whisper 模型檔(對非技術使用者是一道真牆);沒有編輯器,時間軸要手動調;沒有多語翻譯;沒有多人對話 diarization;沒有團隊協作;介面英文為主;macOS 新版本上偶有安裝問題。
適合誰:技術背景足夠 + 隱私要求高 + 預算為零、願意花時間配置 Whisper backend 的使用者,例如學術研究者、法律從業員的個人用途。
綜合比較表
六個維度並排。每款都有贏有輸,這才是真實狀況。
| 維度 | Subanana | Premiere Pro | ArcTime | Taption | pyTranscriber |
|---|---|---|---|---|---|
| 輸入來源 | ✅ 檔案 + YouTube/IG/FB 連結 | ❌ 檔案(要先進 Premiere) | ❌ 檔案(桌面 app) | ⭕ 檔案 + YouTube 連結 | ❌ 檔案(本機路徑) |
| 粵語準確率(中英夾雜) | ✅ 96% | ❌ 89% | ⭕ 90% | ❌ 85% | ⭕ 90% |
| 粵語準確率(雜音環境) | ✅ 93% | ❌ 76% | ⭕ 80% | ❌ 73% | ❌ 74% |
| 華語(國語)準確率 | ✅ 約 97% | ❌ 中下 | ⭕ 中上 | ⭕ 約 90%+(估) | ⭕ 中 |
| 口語轉書面語 | ✅ 獨家支援 | ❌ | ❌ | ❌ | ❌ |
| 雙語字幕 SRT 檔匯出 | ✅ | ❌ | ⭕ | ✅ | ❌ |
| 嵌入字幕的影片一鍵匯出(單語或雙語烘錄) | ✅ | ❌ | ❌ | ✅ | ❌ |
| FCPXML 直接匯出給 Final Cut | ❌ | ⭕ | ✅ | ✅ | ❌ |
| 按分鐘付費彈性(低用量友善) | ❌ 訂閱制 | ❌ 訂閱制 | ✅ 積分制 | ✅ 按分鐘加購 | — 全免費 |
| .ass / 樣式字幕匯出 | ❌ | ❌ | ✅ | ❌ | ❌ |
| 在剪片軟體內直接使用(免來回匯入匯出) | ❌ | ✅ | ❌ | ❌ | ❌ |
| 免安裝 / 瀏覽器可用 | ✅ | ❌ | ❌ | ✅ | ❌ |
| 完全離線可用(STT 本機跑) | ❌ | ❌ | ❌ | ❌ | ✅ 需切 Whisper backend |
| 價格起點 | US$9/月(年繳) | US$22.99/月(年繳)/US$34.49 月繳 | ~US$0.042/分(約 US$2.50/小時) | US$10.80/月(年繳) | 免費 |
讀法:✅ = 該維度的明顯勝者;⭕ = 中上;❌ = 明顯落後。
怎樣挑?一個決策樹
- 主力是粵語或華語內容、要高準確率 + 口語轉書面語 → Subanana。這是我們投最多功夫的場景,詳細見 AI 字幕工具頁面。
- 已經在 Premiere 裡面剪片、不想離開 timeline → Premiere 內建。準確率差一點,但工作流省下的時間值得。
- 要做 .ass 特效字幕、彈幕樣式、逐字動態效果 → ArcTime。這是它的主場,Subanana 做不到(注意 macOS 上先測試一下)。
- Final Cut Pro 使用者想直接吃 FCPXML 字幕軌,或用量不穩定想按分鐘付費而不訂閱整年 → Taption。FCPXML(2026 新功能)和按分鐘加購是 Taption 贏;雙語字幕和嵌入式字幕影片輸出兩家都有,不是區別點。
- 隱私要求極高、絕對不能上傳雲端(而且你願意自行設定 Whisper backend)→ pyTranscriber。提醒:預設的 Google backend 不是真正離線。
- 多語(粵語 + 華語 + 英語)混合、需要一鍵翻譯、還要做 即時字幕翻譯 給現場觀眾看 → Subanana。這是我們的另一個主場。
挑工具前先想清楚你最在乎的是哪一項,上面 5 個情境通常會直接對應到一款工具。
再深入一點:Subanana 的匯出與定價
如果決策樹把你帶到 Subanana,幾個具體事實:
- 匯出格式:SRT、VTT、TXT、DOCX、XLSX、Markdown 六種單檔;或 ZIP 一次打包。不支援 .ass / .ssa。
- 免費方案限制:每檔 15 分鐘上限、3GB、720p 匯出上限、字幕/逐字稿不能下載(只可線上預覽)。足夠試用來判斷準確率,但正式使用需要付費方案。
- 付費起點:US$9/月(約 HK$68/月,年繳) 的 Lite 方案——每檔 3 小時上限、15GB、支援下載、最高 4K 匯出。完整月/年方案對比見 方案費用頁。
- 進階參考:用好 AI 字幕工具有幾個操作訣竅——見 3 個 AI 上字幕小秘訣。
FAQ
Q1. 粵語口音重、夾雜大量廣東話俚語的影片,哪一款最準?
實測下 Subanana 最高(素材 A 約 96%)。其次是 ArcTime 和 pyTranscriber(約 90%)。Premiere 和 Taption 在粵語口語的準確率會跌到 85–89%。
Q2. 如果我完全不想付費,只想試一次?
pyTranscriber 完全免費但需要技術安裝;Subanana 和 Taption 都有免費額度可以試 15 分鐘左右;ArcTime 桌面版有免費入門功能;Premiere 需要 Creative Cloud 訂閱。
Q3. Subanana 支援 .ass 特效字幕嗎?
不支援。Subanana 匯出格式是 SRT、VTT、TXT、DOCX、XLSX、Markdown 六種。如果必須要 .ass 樣式字幕,ArcTime 是這 5 款裡合適的選擇。
Q4. 測試的準確率數字可以完全信嗎?
不要完全信任何人(包括我)公開的單一組測試數字——自己跑一次 1–2 分鐘的樣本音檔,才知道工具對你的口音、你的錄音環境、你的用詞習慣到底適不適合。這篇提供的是同一套尺在同一批素材上的相對排序,不是絕對標準。
Q5. 用 Subanana 的話,要從哪裡開始?
由免費帳號開始測 1–2 條短影片。如果準確率過關,再升級付費方案(US$9/月,年繳起)解鎖 3 小時單檔、下載、4K 匯出。
結語:AI 字幕工具 2026 年已經不是「哪一款最好」的單選題,而是「哪一款最適合你的語言、你的工作流、你的預算」的組合題。這篇 5 款比較用同一套素材、同一把尺跑過一次;每款都有適合它的場景,選最對得上你需求的那一款就是了。
如果你主力做粵語或華語內容、需要高準確率 + 網頁操作 + 直接拿 SRT/DOCX 進剪片流程,由免費帳號開始試 Subanana 即可。