字幕付け作業者のための動画ダウンロードとスクリプト取得方法

動画に字幕付けをするためには、まずその動画自体をダウンロードしなければなりません。また、聞き取りがあまりできない場合には、その動画のスクリプト、例えば英語動画であれば、英語のスクリプトがあった方が便利です。この方法をざっと見ていきます。

動画ダウンロード方法

YouTubeの場合

もはやYouTubeは検閲がひどすぎて、YouTube動画をダウンロードしたいと思う場面は少なくなってきました。が、とりあえずこれを紹介します。最も簡単なのは、有料ですが、MediaHuman YouTube Downloaderを使うことかと思います。一度に大量の動画を指定して、放っておけばすべてダウンロードしてくれます。MediaHuman YouTube Downloaderの使い方で説明しています。

※このソフトはYouTubeだけではなく、Vimeo、Dailymotion、SoundCloudにも対応しています。

これ以外の方法としては、例えばOffliberty等のYouTube動画ダウンロードサイトを使うことです。当然ですが、動画のURLを一つ一つ指定しなければなりません。

Twitterの場合

Twitterのツイートに埋め込まれた動画をダウンロードするのに私が使用しているのは、Twitterビデオダウンローダーですね。

facebookの場合

facebook video downloaderで検索すれば、facebookの動画をダウンロードできるサイトがあるのですが、ただし、facebookの場合、一般公開されていないページの中の動画や、Messengerの中で送信された動画はこういったサイトではダウンロードできません。

Firefoxブラウザのダウンロードプラグインを使う

その他Rumble、Brighteon、BrandNewTube、Odysee等など様々な動画サイトがあるのですが、これらをダウンロードするには、ブラウザのダウンロードプラグインを使います。

私が使っているものと言えば、

Firefox用には、Video DownloadHelperです。動画の再生が開始されると、以下のようにダウンロードメニューが出現するので、ダウンロードを指示します。この例の場合は、おそらくどちらを選んでもダウンロードできると思いますが、場合によっては多数の選択肢が出てきて、どれを選んで良いかわからない場合があります。これは試行錯誤してみてください。

Chromeブラウザのダウンロードプラグインを使う

Chromeではストリームレコーダーを使っています。FirefoxのVideo DownloadHelperよりもダウンロードの指定は簡単のように思います。

最後の手段

以上のようなダウンロード手段でダウンロードできない場合には、動画を再生しながら画面キャプチャを行う方法があります。私はScreenpressoを使っています。

 

スクリプトの取得方法

YouTubeの場合

YouTubeの場合には、自動文字起こしの機能があり、これを利用すると簡単に英語(あるいは他の言語)のスクリプトを得ることができます。これを抜き出すサイトもまた様々ありますが、私が最も使用しているのは、https://downsub.com/ですね。

YouTube以外の場合

YouTubeのように自動で行ってくれない場合には、自力で何とかしなくてはなりません。初期の私のように(あるいは、今でも無いと不安なのですが)ヒアリングに自信の無い場合には、英語スクリプトの取得が必須です。

まず、無料でやってくれるところてしては、IBMワトソン研究所のSpeech to Textです。対象ファイルをドロップすれば、スクリプトを表示してくれます。ただし、これの使いづらい点としては、

  • 動画ファイルはだめで、mp3等の音声ファイルのみ。事前に動画から音声を抽出する必要がある。https://convertio.co/ja/mp4-mp3/等があります。
  • スクリプトのみであって、字幕のタイミング情報は得られない。つまり、「3:00から3:04の間This sample is only for newbies文字列を表示する」といったタイミングは得られません。
  • スクリプトの取得が非常に遅い。通常の音声再生のスピードでしかスクリプトが出てきません。

有料であれば、優れたものがあります。例えば、1時間10ドル程度しますが、https://my.sonix.ai/が最もおすすめです。これであれば、かなり正確に文字起こししてくれますし、取得も早く、srtファイルの形でタイミング情報も得られます。

 

未分類

Posted by ysugimura