5 個熱門 AI 字幕工具大對決!廣東話語音轉書面語文字誰最準確?

作者: Coco Siu,  17 Oct 2023
Image

唔知各位平時用開咩軟件上字幕呢?人工智能嘅字幕轉譯近年成為大勢,可以快自動幫影片快速上字幕真係造福咗一眾忙碌嘅創作者~ 今次我哋就比較咗巿面上唔同嘅字幕軟件,同樣都係選用人工智能轉譯,除咗語音識別嘅準確度表現外,各自仲會有咩優缺點呢?

首先簡單介紹吓今次嘅選手:

字幕工具

簡介

Subanana

- 由香港人,為香港人、廣東話打造嘅字幕軟件

- 基本免費使用及付費功能

Adobe Premiere Pro

- 知名後製軟件

- 7 天免費試用

ArcTime

- 來自內地嘅後製軟件

- 需充值積分購買字幕服務

Taption

- 來自台灣嘅字幕軟件

- 每個帳戶首 15 分鐘影音免費

pyTranscriber

- 使用 Google 語音識別 API

- 開源免費字幕軟件


評測會分三部分:

  • 1. AI 字幕轉譯表現
  • 2. 軟件基本功能
  • 3. 系統要求(支援檔案類型 / 硬軟件要求)

分別測試喺以下三大香港創作常見狀況下,各個軟件嘅轉譯表現。今次嘅評測選用多「中英夾雜」,同「特別名詞、品牌」嘅「 今期熱話: 日本Sharp AQUOS XLED 發佈第二代電視系列 」(影片一) 同包含各種「背景雜音」嘅「 新聞刺針 」(影片二)。

書面語字幕準確度

口語字幕準確度
(中英夾雜·影片一)

口語字幕準確度
(背景雜音·影片二)

Subanana

✔️ (95.3%)

⭐⭐⭐ (97.5%)

⭐⭐⭐ (93.4%)

Premiere Pro

⭐⭐ (89.4%)

⭐ (75.6%)

ArcTime

⭐⭐ (89.9%)

⭐⭐ (79.9%)

Taption

⭐ (85.3%)

⭐ (72.8%)

pyTranscriber

⭐⭐ (89.8%)

⭐ (73.6%)


喺各個上字幕軟體入面,只有 Subanana 支援由「口語」影音直接輸出「書面語」字幕,自動轉埋「書面語」非常適合志在面向眾多中文地區觀眾、需要「書面語」字幕嘅創作者。

針對影片一,各軟件嘅語音識別字幕「轉譯準確率」由 85-97% 不等,其中 Subanana 嘅轉譯準確率去到 97.5%,喺「中英夾雜」嘅情況表現相當理想,除咗能夠準確識別英文外,大部分名詞 / 品牌仲會由英文自動轉譯做中文,令字幕更流暢易讀,準確率會比其他 AI 高約 10%!

再睇影片二,Subanana 嘅轉譯準確率依舊 keep 到 90% 以上,有 93.4%;其他轉譯軟件就只去到 70-80%,相信係由於喺識別具「背景雜音」嘅語音上,Subanana 比其他軟件更為出色。

節省人手時間

需要注意

Subanana

⭐⭐⭐ (78%)

字幕生成時間長約 10%

Premiere Pro

⭐⭐ (69.9%)

處理中英夾雜較差

ArcTime

⭐⭐ (70.4%)

字幕分句較差

Taption

⭐ (66%)

無法處理中英夾雜

pyTranscriber

⭐⭐ (70.3%)

處理中英夾雜較差


其他基本性能例如「字幕語言」同「輸出檔案」,各個軟件都支援到「兩文三語」同「輸出 .srt / .txt」,香港嚟講夠曬用。


支援嘅影音上傳格式都係差唔多,值得一提嘅係 Subanana 同 Taption 仲支援以 YouTube Link 上傳,方便一眾想為已上載影片加返字幕嘅創作者。

支援影音上傳格式

支援兩文三語

輸出 .srt / .txt 檔案

Subanana

- YouTube Link

- 常見影音格式

✔️

✔️

Premiere Pro

常見影音格式

✔️

✔️

ArcTime

常見影音格式

✔️

✔️

Taption

- Youtube Link

- 所有常見影音格式

✔️

✔️

pyTranscriber

常見影音格式

✔️

✔️


一個再好嘅自動上字幕工具,電腦跑唔起都係嘥氣,各個字幕軟件有咩系統要求呢?

無需安裝軟件

網絡連線

硬件要求

Subanana

✔️

✔️

Premiere Pro

✔️

ArcTime

❌️

✔️

Taption

✔️

✔️

pyTranscriber

❌️

✔️



總結

平均字幕準確度
(書面語)

平均字幕準確度
(口語)

無需安裝軟件
較低電腦要求

Subanana

✔️ (95.3%)

⭐⭐⭐ (95.4%)

✔️

Premiere Pro

⭐ (82.5%)

❌️

ArcTime

⭐⭐ (84.9%)

❌️

Taption

⭐ (79.0%)

✔️

pyTranscriber

⭐ (81.7%)

❌️