Bilibili動画の文字起こし方法|トランスクリプト・字幕・英語翻訳まで
Bilibili の公開動画をダウンロードせずに、トランスクリプト、字幕ファイル、英語翻訳に変換するための実践ガイド。
最終確認日: 2026-05-01。Bilibili は共有リンクの形式(BV / AV / b23.tv)やプレーヤー基盤を時折変更します。特定のリンク形式が動かなくなった場合は、本記事で説明する正規の www.bilibili.com/video/BV... URL にフォールバックしてください。
Bilibili の動画は、中国向け以外のツールでは扱いにくいことが多くあります。価値の高い講義、アニメ考察、ゲーム解説、製品レビュー、カンファレンス講演などが含まれていても、検索・引用・翻訳・字幕化に使える形でトランスクリプトを取り出せるとは限りません。汎用の文字起こしツールはファイルアップロードや YouTube 風の URL を前提に作られているため、BV... の ID を弾いたり、b23.tv の短縮 URL に失敗したり、m.bilibili.com のモバイル URL でつまずいたりしがちです。
最速のワークフローはシンプルです。Bilibili の公開 URL をコピーし、Bilibili 対応の文字起こしツールに貼り付け、トランスクリプトを生成してから、テキスト・字幕・英語翻訳としてエクスポートする。動画が公開されており、ログインなしでリンクを開けるなら、手動で動画をダウンロードする必要はほぼありません。
Bilibili から直接テキスト化したいときは Transcribe Bilibili を使ってください。
クイックワークフロー
| ステップ | 操作 | 出力 |
|---|---|---|
| 1 | Bilibili 動画の URL、BV リンク、モバイルリンク、b23.tv の短縮 URL のいずれかをコピー | 公開ソース URL |
| 2 | URL を Transcribe Bilibili に貼り付け | Vocova がサーバー側でメディアを取得 |
| 3 | 言語を自動検出させるか、手動で指定 | タイムスタンプ付きトランスクリプト |
| 4 | 名前、用語、話者ラベルを校正 | より整ったトランスクリプト |
| 5 | プランに応じて TXT、PDF、DOCX、SRT、VTT、CSV をエクスポート | テキスト、文書、または字幕ファイル |
| 6 | 必要なら英語に翻訳 | 英語のトランスクリプトまたはバイリンガル出力 |
Bilibili のトランスクリプトとは?
Bilibili のトランスクリプトには3つの意味があります。
- プレーンなトランスクリプト: 話された言葉をテキスト化したもの。
- 字幕ファイル: SRT または VTT 形式のタイムコード付き字幕。
- 翻訳されたトランスクリプト: 元のトランスクリプトを別言語に翻訳したもの(多くは中国語→英語)。
それぞれ異なる用途を持ちます。学生は検索可能なノートが欲しいかもしれません。研究者は引用のためにタイムスタンプが要ります。クリエイターはローカライズ版動画用に字幕が必要です。翻訳者は中国語と英語を並べた対訳テキストを欲しがります。
Vocova は同じ文字起こしステップから始めて、用途に合った出力形式を選べる構造になっています。
ステップ1: Bilibili 動画の URL をコピーする
可能ならブラウザの通常 URL を使ってください。
https://www.bilibili.com/video/BV1xx411c7XW
公開動画に到達するなら、モバイル URL や短縮 URL でも構いません。
https://m.bilibili.com/video/BV...
https://b23.tv/...
重要なテストは、シークレットモードでアカウントなしにそのリンクが開くかどうかです。ログイン、メンバーシップ、年齢ゲート、プライベートワークスペース、地域認証が必要な場合、サーバー側の文字起こしツールはあなたの代わりにアクセスできません。
ステップ2: Bilibili 対応の文字起こしツールにリンクを貼る
Transcribe Bilibili を開き、URL を貼り付けて文字起こしを開始します。これにより、いつもの手作業の連鎖を避けられます。
- Bilibili のダウンローダを探す。
- 動画をローカルに保存する。
- 音声を抽出する。
- 文字起こしアプリにアップロードする。
- もう一度アップロード時間を待つ。
この遠回りは遅く壊れやすい工程です。リンクを貼るだけのワークフローなら、メディアを公開 URL から直接取得できるため断然クリーンです。
すでにファイルをダウンロード済み、または他者から受け取っている場合は、代わりに video to text を使ってください。
ステップ3: 言語の設定を選ぶ
Bilibili の動画の多くは、言語自動検出で十分です。Vocova は100以上の話し言葉に対応し、トランスクリプトを生成する前に話されている言語を検出できます。
次のような場合は手動で言語を指定してください。
- 動画に強い地方訛りがある。
- 冒頭1分が音楽、イントロ映像、非音声で占められている。
- 動画が中国語、広東語、英語、日本語、韓国語、その他の言語間で切り替わる。
- ターゲット言語が分かっており、検出の曖昧さを減らしたい。
混合言語の動画では現実的な期待値を保ちましょう。AI 文字起こしは古い世代のツールよりコードスイッチング(言語の切り替え)に強くなりましたが、頻繁な切り替えは依然として手動修正が必要になります。
ステップ4: トランスクリプトを校正する
Bilibili のコンテンツには分かりやすいパターンがあります。きれいな中国語の長尺の合間に、モデルがほとんど見たことのない固有名詞が散りばめられているのです。UP主(クリエイター)の名前、アニメ・漫画タイトル、ゲーム ID、ファンダム特有の俗語(CP、二创、鬼畜、弾幕=動画上を流れるコメント への言及)、英語へコードスイッチした技術用語(Transformer、pipeline、latency)、中国語とラテン文字が混在する製品名(小米 14 Ultra、iPad Pro M4 など)。自動文字起こしは中国語の話し言葉自体はうまく扱いますが、こうした固有名詞は頻繁に取りこぼします。校正の労力は、ここに集中させるのが最も効率的です。
次の校正パスを使ってください。
- UP主名とゲスト名を最優先で修正する。 中国語向けに学習されたモデルは、もっともらしい誤った文字を選びがちです(例: 小红 と 晓宏)。一度検索置換すれば、トランスクリプト全体が一気に整います。
- ゲーム、アニメ、音楽、製品の名称を統一する。 原語表記(
原神)を使うか、ローマ字表記(Genshin Impact)にするかを決め、一貫して適用します。これは後の翻訳工程にも効いてきます。 - 中国語と英語の混在用語を訂正する。 Bilibili のテック・ゲーム・学術系動画は文中で英語に切り替わります(「我们今天讲 attention mechanism」など)。モデルは通常、英語トークンを正しく文字起こししますが、音声が不鮮明だとピンインに変換してしまうことがあります。
- 弾幕への言及をチェックする。 配信者は流れるコメントに反応しがちです(「看弹幕说...」「前方高能」など)。雰囲気として残すか、よりクリーンなトランスクリプトのために削るかを判断します。
- 長い段落を読みやすく分割する。 Bilibili のモノローグは長くなりがちです。トピックごとに区切るとノート用の出力に向きます。
- 冒頭・末尾の定型句を削除する。 ノート目的なら「一键三连」「记得点赞投币收藏关注」などは不要です(字幕が目的なら残します)。
- タイムスタンプは保持する。 引用や字幕で必要になります。
音声がノイジーなら、how to get accurate transcriptions from noisy audio と同じ校正の考え方を適用してください。中国語、広東語、日本語、英語の言語別精度の見立ては transcription accuracy by language を参照してください。
ステップ5: 適切な形式でエクスポートする
トランスクリプトの行き先に合わせてエクスポート形式を選びましょう。
| 用途 | 最適なエクスポート | 理由 |
|---|---|---|
| 検索可能なノート | TXT | 軽量でコピーしやすい |
| 文書レビュー | DOCX または PDF | 共有とコメントに向く |
| 動画字幕 | SRT | 動画エディタとプラットフォームでの互換性が最も高い |
| Web キャプション | VTT | HTML5 動画と Web プレーヤーに適合 |
| データ分析 | CSV | タイムスタンプ・話者・セグメントを表形式で扱いたいときに便利 |
| 翻訳レビュー | バイリンガル PDF または DOCX | 原文と翻訳を並列に保持 |
字幕が目的なら、SRT generator、VTT generator、そして subtitle file formats guide を参照してください。
Bilibili 動画を英語に翻訳する方法
最もクリーンな翻訳ワークフローはこちらです。
- Bilibili 動画を元の話し言葉のまま文字起こしする。
- 名前と主要な用語を直すために、原文トランスクリプトを校正する。
- トランスクリプトを英語に翻訳する。
- 英語トランスクリプトを書き出すか、原文と英語のバイリンガル出力をエクスポートする。
- 字幕が必要なら、翻訳済みの SRT または VTT を出力する。
固有名詞、俗語、ファンダム語彙、技術コンテンツを含む動画では、原文トランスクリプトの校正を絶対にスキップしないでください。翻訳品質は原文の質に直結します。中国語の段階で間違えた名前は、ほぼ確実にそのまま英語でも間違ったままです。さらに、Bilibili コンテンツに特有のエラーは翻訳後に見抜きにくいという厄介な性質があります。
- 固有名詞や俗語が無難な英語に均される。 UP主名を取り違えると、英語側では流暢に読めるのに誰のことか特定できない名前になります。
- アニメやゲームのタイトルが公式英訳から外れる。
咒术回战はJujutsu Kaisenであって、文字通りの逆翻訳ではありません。原文側でタイトルを取り違えていると、英語出力は実作品からさらに離れていきます。 - テック用語が過剰翻訳される。 配信者はしばしばコードスイッチします(
embedding、latencyなど)。やり過ぎな翻訳器は英語を中国語経由の英語(embedded thing)に戻してしまいます。原文トランスクリプトでは、コードスイッチした英語は英語のまま保持しましょう。 - 記号的な表現が意味を失う。
B 站(= bilibili.com)は字義通りなら「B-station」になります。読み手にとっては元の略語、プラットフォーム名、あるいは両方のどれが必要かを見極めてください。
最終成果物が英語トランスクリプトまたは英語字幕ファイルなら translate video を使ってください。中国語→英語に絞るなら、ソース音声を抽出した後に translate audio で English をターゲットに選択してください。広東語の Bilibili コンテンツ(香港・広東地域のクリエイター)は、ソース側に transcribe Cantonese を使ってください。
Bilibili トランスクリプトのユースケース
学生と語学学習者
トランスクリプトがあれば、Bilibili の講義やチュートリアルが検索可能になります。例文をコピーしたり、語彙リストを作ったり、難しい部分を翻訳したりするときに、同じクリップを何度も再生する必要がありません。
語学学習では、原文中国語と英語が並ぶバイリンガル出力が特に有用です。並列ワークフローは bilingual subtitles を参照してください。
研究者・ジャーナリスト
Bilibili の動画が証拠や一次資料となる場合、タイムスタンプが重要です。引用が常に元動画へ遡れるよう、トランスクリプト内のタイムスタンプを保持してください。研究ノートでは、プレーンテキストよりも DOCX や CSV の方が扱いやすいことが多いです。
クリエイターとローカライゼーションチーム
クリエイターはプレーンなトランスクリプトよりも字幕を必要とすることがほとんどです。先にトランスクリプトを生成し、必要なら翻訳し、その後 SRT または VTT をエクスポートします。これにより、字幕のタイミングが元音声に紐付いたまま保たれます。
マーケティング・SNS チーム
長尺の Bilibili 動画には、再利用できるクリップ、引用、製品説明、視聴者の言い回しが詰まっています。トランスクリプトがあれば、フックの抜き出し、要点の要約、他プラットフォーム向けの短尺ローカライズが楽になります。
トラブルシューティング
Bilibili のリンクが失敗する
シークレットウィンドウでリンクが開くか確認してください。開かなければ、文字起こしツール側からも取得できません。共有ラッパーではなく、正規の www.bilibili.com/video/BV... URL を試してください。
トランスクリプトが冒頭で誤った言語になる
開始前に手動で言語を選択してください。動画の冒頭が音楽、効果音、英語のタイトルカードで、その後にメインの中国語音声が続く場合に有効です。
名前や専門用語が抜け落ちる
翻訳や字幕エクスポートの前にトランスクリプトを校正してください。固有名詞は最も投資効果の高い修正対象です。
字幕の1行が長すぎる
行をより積極的に折り返す SRT または VTT のエクスポート設定を使ってください。字幕の読みやすさはタイミングだけでなく行長にも左右されます。
Bilibili 既存のキャプションがある
既存キャプションは便利ですが、必ずしもダウンロード可能・完全・翻訳済みとは限りません。編集可能なテキスト、バイリンガル出力、自分用の字幕ファイルが必要なときは、ゼロから作るトランスクリプトの方が確実です。
Bilibili 動画が長すぎる、または大きすぎてインポートできない
URL インポートはサーバー側で実行されるため、ソースメディアはサーバー側のフェッチ予算(現状 URL インポートで約 200 MB)に収まる必要があります。長尺の講義や数時間のライブ配信アーカイブは、ビットレートが控えめでもこの上限を超えがちです。長尺動画でインポートが失敗したら、最もクリーンな回避策は次の通りです。
- 権利と利用規約上問題ないなら、自分で動画ファイルをダウンロードする。
- video to text を開き、ファイルを直接アップロードする。Plus / Pro なら 5 GB までのアップロードに対応。
- トランスクリプトエディタ、言語設定、エクスポート形式、翻訳フローは URL インポート経路とまったく同じです。
長尺の Bilibili 業務が継続的に発生する場合(コースシリーズ、複数話の講義セットなど)は、URL を貼り直すよりも、元ファイルをアップロードする方が速く安定します。
よくある質問
Bilibili 動画はダウンロードせずに文字起こしできますか?
公開動画ならできます。Bilibili の URL を Transcribe Bilibili に貼り付ければ、Vocova がサーバー側でメディアを取得します。動画がプライベートだったりログインが必要な場合は、権利が問題なければ自分でファイルをダウンロードして video to text を使ってください。
Bilibili 動画を英語に翻訳できますか?
できます。まず原文のトランスクリプトを生成してから、英語に翻訳します。最良の結果を得るには、翻訳前にソースのトランスクリプトをざっと校正し、人名、ゲームタイトル、クリエイター名、専門用語が正しいことを確認してください。
Bilibili の字幕を SRT や VTT で書き出せますか?
可能です。文字起こし後、互換性重視なら SRT、Web 動画用途なら VTT で字幕を書き出してください。SRT と VTT のエクスポートは Plus / Pro で利用できます。
b23.tv の短縮リンクでも動きますか?
短縮リンクが公開 Bilibili 動画に解決される限り、動きます。短縮リンクで失敗したら、ブラウザで開いて最終的な bilibili.com/video/BV... URL をコピーしてください。
Bilibili 動画に中国語と英語が混在している場合は?
自動文字起こしは多くの混合言語パートを処理できますが、コードスイッチングは単一言語より難しい問題です。メインの話し言葉を手動で選択し、翻訳や字幕エクスポートの前に混合言語のセグメントを校正してください。
Bilibili のトランスクリプトを使うのは合法ですか?
処理する権利のある動画のみを対象にしてください。トランスクリプトは個人学習、アクセシビリティ、研究、許諾を得たローカライゼーションに役立ちますが、他者のコンテンツを再公開する場合は許可が必要になることがあります。
結論(ショートバージョン)
Bilibili のトランスクリプトが必要なら、ダウンロード→アップロードの遠回りは避けましょう。Bilibili の公開 URL を Transcribe Bilibili に貼り付け、タイムスタンプ付きトランスクリプトを生成し、UP主名や固有名詞を校正してから、ワークフローに合わせて TXT、DOCX、PDF、SRT、VTT、CSV、または英語翻訳をエクスポートしてください。URL インポートのサイズ上限を超える長尺講義やライブ配信アーカイブの場合は、自分でファイルをダウンロードして video to text を使うのが確実です。
関連ガイド
- Best free transcription tools in 2026 — Vocova、Riverside、Whisper、Otter、Notta、Google Recorder、Happy Scribe を無料プランの上限で比較。
- How to transcribe online videos and podcasts by pasting a link — YouTube、SoundCloud、Dailymotion、ポッドキャスト、クラウドドライブを横断した URL インポートの全体像。
- How to transcribe audio in multiple languages — コードスイッチング、バイリンガル校正、翻訳エクスポートのワークフロー。
- Transcription accuracy by language — 中国語、広東語、日本語、英語の WER ティア別期待値。
