大学講義のライブ字幕 2026：多言語セットアップ・ツール比較

大学には、市販の会議文字起こしツールの多くがうまく対応できない、はっきりとしたライブ字幕のニーズが二つあります。ろう者・難聴の学生に対するアクセシビリティ支援（多くの場合「あれば良い」ではなく法的要件です）と、講師が一つの言語で講義し、学生は複数の言語で読む必要がある国際的な学生に対する言語アクセスです。

大学がすでに運用している講義収録システム——Panopto、Echo360、Zoom for Education、Microsoft Stream——は、問題の一部を解決します。録画に自動で字幕を付け、講義後の再生に使えるようにしてくれます。これらがうまく解決できないのが、講義の進行中におけるリアルタイムの翻訳字幕表示です。後ろの席の中国語話者の学生がスマートフォンで簡体字中国語の字幕を読み、英語を必要とするアクセシビリティ対応の学生は自分のスマートフォンでソース言語の字幕を読み、ろう者の学生は適切な改行の入ったリアルタイムの逐語テキストを受け取る、といった使い方です。（あるツールが翻訳をどう届けるか——ライブセッション1つにつき目標言語1つなのか、それとも1セッションで複数の言語を同時に届けるのか——はツールによって異なり、その違いが以下の比較の核心になります。）

本ガイドでは、大学がライブ字幕ツールに本当に求めるもの、講義当日のセットアップ方法、そして現実的な各選択肢がそれぞれどんな場面に向くかを扱います——私が運営する Subanana、Wordly、そしてすでに技術スタックに入っている講義プラットフォーム標準の字幕を含めて。

大学が本当に必要としているもの

これまで話をしてきた大学では、三つの要件が繰り返し挙がります。

講義の進行中に出席者がリアルタイムで見られる字幕で、学生が必要とする言語をカバーしていること。録画のためだけではありません。アクセシビリティや言語の理由で字幕を必要とする学生は、24時間後ではなく、講義が行われているその場で字幕を必要としています。（1セッションで複数の目標言語をカバーするのか、それとも目標言語ごとに1セッションが必要なのかは、ツールによる重要な差別化要因です——以下の比較を参照してください。）
音声ソースの柔軟性。対面でラベリアマイクと PA システムを使う講義もあれば、ハイブリッド形式（講師は現地、リモートの学生は Zoom）もあり、完全オンラインのものもあります。字幕ツールは、その講義が実際に使っているソースから音声入力を受け取れなければなりません。
学生にとって「アプリのインストールが不要」であること。200人の学部生に、毎回の講義前に何らかのアプリをインストールさせたり SaaS アカウントにログインさせたりするのは現実的ではありません。リンクや QR コードによるブラウザ字幕表示が、大人数のクラスで唯一現実的な配信方法です。

大学の状況によって追加されるニーズ：

ろう者・難聴の学生に対するアクセシビリティ準拠（米国の Section 508、EU の EAA、英国の BS 8878）。
既存の講義収録システム（Panopto、Echo360）との連携。ライブ字幕トラックも録画に取り込まれるように。
実際の学生数の規模に合わせた多言語対応——小規模な講義なら目標言語は1つで足りるかもしれませんが、大規模な国際プログラムでは4つ必要になることもあります。
講義固有の専門用語に対応する用語集（講師の専門語彙、固有名詞、技術的な略語）。

実際にうまくいくセットアップの形

最もよく見られるセットアップの形は三つあります。正しい選択は、講義形式（対面／ハイブリッド／オンライン）、AV 機材、そして IT サポートの有無によって決まります。

形 1：対面講義、ラベリアマイク、リアルタイムのブラウザ字幕

講師が講堂に実際に立ち、ラベリアマイクまたはハンドマイクを使い、聴衆が会場にいる場合に使います。

音声入力。マイクの信号を、字幕ツールを動かしているノートパソコンに取り込みます——最も簡単なのは、AV システムの補助出力（aux out）から信号を取る USB オーディオインターフェースを使う方法です。講堂の AV にクリーンな aux out がない場合の代替策として、主マイクの隣にもう一本ラベリアマイクを装着し、専用の USB レシーバーに接続する方法があります。
字幕ツールはノートパソコン上で動かします。Subanana の場合、ノートパソコンでブラウザのライブセッション画面を開き、ホスト（通常は AV チーム）が講義前にソース言語と翻訳先の言語を1つ選び、セッションを開始します。学生集団が複数の翻訳先を同時に必要とする場合、AV チームは目標言語ごとに Subanana のセッションを1つずつ、それぞれ別のオペレーター用ノートパソコンで動かします。
聴衆のアクセス。プロジェクターに表示した QR コード（または講義の LMS に事前掲載したもの）が、学生のスマートフォンのブラウザで聴衆向け字幕画面を開きます。各学生は、ソース／翻訳／両方の並列表示を自分で選べます。
講義後の成果物。Subanana は講義終了後にセッションを SRT として書き出せます——AV チームはその SRT を Panopto／Echo360 の録画に添付し、恒久的なアクセシビリティ対応を実現できます。

形 2：ハイブリッド講義、リモート部分は Zoom または Teams

講師は現地にいるものの、一部の学生が Zoom／Teams／Meet 経由でリモート参加する場合に使います。

音声入力。プラットフォーム（Zoom／Teams）へ送られるのと同じマイク信号を、字幕ツールにも同時に送ります。最も簡単なのは、仮想オーディオケーブル（Mac の BlackHole、Windows の VB-Cable）でノートパソコンのシステム音声を字幕ツールに取り込む方法です。字幕ツールは、Zoom 通話が聞いているのと同じ内容を聞きます。
字幕ツールは2台目の端末で動かします。専用のノートパソコンで字幕を動かすのがベストプラクティスで、こうすれば講師の Zoom セッションがシステムリソースを取り合わずに済みます。
聴衆のアクセス。会場の学生は QR コードをスキャンし、リモートの学生は Zoom チャットや講義の LMS を通じて聴衆向け字幕リンクを受け取ります。
講義後の成果物。形 1 と同じく、SRT を書き出して講義の録画に添付します。

形 3：完全オンライン講義、ブラウザのみ

講師も聴衆もともにリモートの場合に使います。

音声入力。講師のマイク信号を、講義プラットフォーム（Zoom／Teams／Meet）と字幕ツールの両方に送ります。講師が一台のマシンですべてを操作している場合は、仮想オーディオケーブルで Zoom の出力を字幕ツールに戻して送ります。
聴衆のアクセス。字幕リンクは講義の LMS と Zoom チャットで配信します。全員すでに画面の前にいるので、QR コードは不要です。
講義後の成果物。SRT を書き出して録画に添付します。

ツール選択肢の比較（ドキュメントに基づく）

大学にとって現実的な選択肢は三つあり、それぞれ異なるトレードオフがあります。

選択肢 A：講義プラットフォーム標準の字幕（Panopto、Echo360、Zoom ライブ文字起こし）

強み：新しいベンダーとの関係を結ぶ必要がない。すでに技術スタックに入っている。講義の録画に自動で添付される。

弱み：通常は単一言語のみ（まず英語が中心で、主要言語には選択的に対応——リソースの少ない多くの言語は、そもそも非対応か、大幅な校正が必要な字幕になります）。聴衆が目標言語を選べません——プラットフォームが出力したものを、全員がそのまま見ることになります。多言語の学生にとっては、たいていこれが決定的な弱点になります。

向く場面：英語のみの講義で、聴衆も英語話者のみ、言語翻訳ではなくアクセシビリティ字幕だけが必要な場合。

選択肢 B：Wordly

強み：イベント向けに特化して構築されたエンタープライズ級のライブ翻訳。3,000 組以上の言語ペア。Zoom、Teams、Meet、WebEx との深い連携。マネージドサービスでの導入支援とライブイベント対応。翻訳後の音声出力としての MP3 音声吹き替えがアドオンで利用可能。エンタープライズ層では SSO と設定可能なデータ保管を提供。

弱み：料金は「時間パッケージ＋出席者数ベース」で、12か月の年間契約に紐づき、小規模なパッケージを超えると「見積りは営業へお問い合わせ」の枠になります。複数の学部にまたがり1学期に50回以上の講義を行う大学では、大きな年間時間パッケージにコミットするか、エンタープライズ契約を交渉するかのどちらかになります。小規模での検証（「全学展開の前に、まず1つの講義で試せるか？」）はより難しくなります。

向く場面：中央集約型の AV／アクセシビリティチームを持ち、エンタープライズツール向けの専任の調達予算があり、年間コミットメントを正当化できるイベント量がある大規模研究大学。→ 詳しい比較：Subanana vs Wordly（2026）。

選択肢 C：Subanana

強み：公開された月額サブスクリプション料金（年間時間パッケージなし）。1回の講義での検証に使える無料プラン。ホストがセッションごとにソース言語＋目標言語を1つ設定できるため、各学部は中央調達を通さずにセルフサービスで利用できます。アプリのインストールが不要なブラウザ字幕（聴衆向け）。80以上のソース言語と、言語ごとに最適なモデルへのルーティング、そして講師名・学部名・講義固有の用語を固定する用語集対応。

弱み：各ライブセッションは1つの目標言語に翻訳します——講義で複数の言語の字幕が同時に必要な場合は、1つのセッションがすべての言語に展開するのではなく、目標言語ごとに Subanana のセッションを1つずつ、それぞれ別のオペレーター用端末で動かします（Wordly は1つのセッション内で複数の目標言語をネイティブに扱えます）。ライブ字幕のこの形では、Zoom／Teams／WebEx とのプラットフォーム単位の深い連携はありません（ワークフローはマイクや仮想オーディオケーブルによる音声入力ベースです）。翻訳テキストの MP3 音声吹き替えはありません（テキスト字幕のみ）。現時点で公開されている機能セットには、エンタープライズ級の SSO や設定可能なデータ保管地はありません。言語ペアの広さは Wordly の3,000組以上には及びません。ライブセッションの書き出しは SRT のみで、逐語テキストの DOCX／XLSX／Markdown が欲しい場合は、講義後に Subanana のファイルアップロード文字起こしで録音を再処理することになります。

向く場面：より小規模な講義を行う大学や個々の学部、コミットの前にライブ字幕の適合性を検証したい場合、あるいは Wordly の主な用途の外にある多言語対応が必要な場合。年間エンタープライズ契約の予算承認を得られない学部でも、ワークスペースのサブスクリプションを自前でまかなえます。

→ 製品：Subanana — 多言語ライブ字幕。

実践ワークフロー：定例講義のために Subanana を設定する

一つの言語で定例の講義シリーズを開講し、学生がさらに2〜3言語の字幕を必要とする（それらは並行セッションとして運用します）学部の場合、実践的なワークフローは次のとおりです。

初回のみのセットアップ（初回講義の約30分前）。AV チームが、字幕用ノートパソコンへの音声ルーティングを設定します（AV の aux out から USB インターフェース、または仮想オーディオケーブル）。学部の管理者が Subanana のワークスペースを作成し、セッションごとのソース言語＋目標言語を事前設定します。複数の目標言語が同時に必要な場合は、目標言語ごとにセッションを1つずつ、それぞれ別のオペレーター用端末で設定します。
講義前（約5分）。AV チームがライブセッションを開き、音量を確認し、QR コードを生成して講義スライドに印刷するか、開始時に画面に投影します。リモートや遅れて参加する学生のために、聴衆向け字幕リンクを LMS に事前掲載します。
講義中。字幕はバックグラウンドで動きます——講師が操作する必要はありません。字幕を見たい学生は QR コードをスキャンするか、LMS のリンクを開きます。
講義後。AV チームが SRT を書き出し、講義収録システム（Panopto／Echo360）にアップロードして、SRT が録画に添付されるようにします。これで恒久的なアクセシビリティ対応になります。
学期を通して。設定したソース言語＋目標言語はそのまま引き継がれます——セッションごとに設定し直す必要はありません。学期の途中で講義の内容が言語を切り替える場合（英語中心の講義に中国語で話すゲスト講師が登壇する、など）、ホストはその講義の前にライブセッション画面でソース言語を設定し直し、講義後に元へ戻せます。

よくある質問

Subanana は大学の講義収録システムと連携できますか？

プラットフォーム単位の深い連携という形ではありません——Subanana のライブ字幕は、ホストのマイク、システム音声、または仮想ケーブルから音声入力を受け取ります。講義後の SRT 書き出しファイルは、録画動画の字幕トラックとして Panopto／Echo360 にアップロードでき、これがほとんどの大学にとって実用的な連携の形です。

Subanana はアクセシビリティ準拠（Section 508、EAA）に対応できますか？

準拠できるかどうかは、所属する大学のアクセシビリティ部門が、ろう者・難聴の学生に何を提供するよう求めているかによって決まります——通常は、講義中のリアルタイム字幕トラックに加え、録画上の校正済み字幕トラックです。Subanana はその両方を生成できます（講義中のライブ字幕、講義後の SRT）。それが特定の準拠フレームワークを満たすかどうかは、所属する大学の方針によります。Subanana は現時点で正式な Section 508 や EAA の適合文書を公開していないため、準拠が重要な場面で頼る前に、まずアクセシビリティ部門に適合性を確認してください。

出席者の言語選択はどのように機能しますか？

Subanana の各ライブセッションには、ホストが事前に設定するソース言語1つと翻訳先言語1つがあります。聴衆向け字幕画面では、出席者はそのセッションの表示方法を選べます——ソース／翻訳／両方の並列表示です。ホストが設定していない言語を追加することはできません。講義の聴衆が複数の翻訳先を同時に必要とする場合は、目標言語ごとに別々の Subanana セッションを動かし（それぞれ別のオペレーター用端末で）、学生は自分が必要とする言語のセッションを開きます。

良いライブ字幕を得るには、どの程度の音声品質が必要ですか？

クリーンなラベリアマイクの信号（講師の口に近く、PA スピーカーから離れている）が、字幕の精度を左右する最大の単一要因です。天井に設置した室内マイクは、室内の反響と空調ノイズを拾うため、通常は明らかに質の劣る字幕になります。字幕が重要なら、講堂の室内マイクアレイに頼るのではなく、ラベリアマイクやハンドマイクの構成を優先してください。

学生は復習用に字幕をダウンロードできますか？

講義後の SRT はホストが書き出せます。大学は通常それを Panopto／Echo360 の講義録画に添付し——学生は録画の字幕トラックとしてアクセスし、復習のために検索できます。講師が望むなら、生の SRT を学生に直接配布することも可能です。

Subanana の料金は、学部や大学全体の規模にどう合わせられますか？

Subanana の公開料金はワークスペース単位です——学部レベルのワークスペースが、そこからセッションを行う講師をカバーします。全学展開には、ワークスペース構成に加えてボリュームの相談を行うのが通常の道筋です。セッション単位の時間パッケージ料金（Wordly のモデルのようなもの）は Subanana が販売している形ではありません。調達がその料金形態を特に必要とする場合は、Wordly がまさにそのために作られています。

大学講義のライブ字幕（2026）：多言語セットアップとツール比較