動画編集ソフトのオート字幕機能で生成される字幕がおかしい! 時々狂気を感じるんだが…
ロケットニュース242024年4月6日(土)19時0分
何を隠そう、私(佐藤)は2020年からこっそりYouTubeチャンネルをやっていて、毎週動画を公開している。ライフワークのポールダンスに関するチャンネルで、公開動画の数も200本を超えている。毎週動画の編集を行っている訳だが、最近は編集ソフトの進化によって、字幕の入力が各段に楽になった。
が! そのオート字幕機能はまだ進化の途中らしく、何もしゃべってないところにトンチンカンな言葉を当て込んでくることがある。結構笑えるんだけど、時々狂気を感じることも……。
・音声から字幕
私が使っているのは、「DaVinci Resolve(ダヴィンチ・リゾルブ)」という動画編集ソフトである。当初は無料版を使用していたのだが、あまりにも機能が充実していることに感動して、有料版にアップグレードした。
無料版でも使いきれないほどの機能がてんこ盛りなので、これから動画編集を始めたい人にはおすすめのソフトである。
さて、問題のAIを駆使した字幕機能なのだが、2023年7月のメジャーアップデート(ver.18.5)以降、有料版で利用が可能となっている。そうとは知らずに、私はその後も半年近く手打ちで字幕を入れ続けていた。
やり方はカンタンで、機能を呼び出して、言語を「日本語」にして各行の文字数や行の段組みをシングル(1段)かダブル(2段)を選択。あとは作成を押すだけである。
これだけで音声から字幕を書き起こしてくれるのである。便利ではあるけど、言い間違いや言い淀みなども全部文字にするので、手直しは必須。でも、ゼロから音声を聞いて書き起こすよりもずっと楽だ。
・何もしゃべってないのに字幕を生成
機能には満足しているけど、変な欠点がある。それは何もしゃべっていない状態でも、何かを書き起こすことがある。私の撮影環境(録音環境)の影響もあると思うけど、それを考慮しても、理解に困るケースもしばしば……。
以下は珍妙な文字起こしの例である。なお、すべて何もしゃべっていない時に生成された字幕だ。
「3.マッシュアルと使ってマッシュアルを使って」
マッシュアルとはなんぞや!? その言葉が示すものがわからない……。この映像クリップの字幕は、さらにこう続く。
「マッシュアルと使ってマッシュアルが使って」
微妙に言い回しを変えてきやがる。何もしゃべってないのに。
「ん」
「はぁ」
「ん」や「はぁ」など、私の息が漏れたような字幕のパターンは、たいてい1回では終わらず、「ん」だけが連続で続いたりする。何を聞いて、そんな文字を起こしているのか?
次はこれまでと違う特殊なパターンだ。
「3.スタッフ」
このクリップの字幕は、3のスタッフから始まって、「4.スタッフ」「5.スタッフ」「6.スタッフ」といった具合に、次第にカウントアップしていく。そして16・17・18は1行にまとめてつづってきやがった。
最終的に25で終わり。映像はまだ続いているのに、25よりもあとの数字はない。全然法則性が見えて来ないぞ。
さらには文章めいたものを示すこともある。
「言うと、緑ちゃんも接することは終見にする你説どういうことか…」
「どういうことか…」、こっちが聞きたいよ。
「この音がちょっと新鋸なよね」
新鋸……、あたらしいのこぎり? 音がのこぎりとは一体!?
「完全にbouncy when rolling」
突然英文来た! 「完全に転がると弾む」とでも訳すのだろうか。なんかちょっとカッコいいな。この英文に続いて出てきた言葉は……。
「表面はいかがでしょうか?」
知らん! 何の表面? どの表面? bouncy when rollingはどうなったの?
「ほご大助でした!」
何かいいことあったみたいな言い方だな。ほご大助は誰やねん!?
……とまあ、こんな感じで謎の文字を羅列してくれる。繰り返すが私は何もしゃべっていない。いないのに、あたかも私がしゃべっているような調子で、字幕をつけてきやがるのだ。
今までで1番怖かったのがコレ。
「卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、」
ナニコレ! 怖!! 思わずスマホで写真を撮ってしまいました。ナニに卵を入れるの? 何個入れればいいの? 狂気を感じざるを得ない!
……とか言いながら、おかしな字幕が出ることに期待している自分がいる。とにかく、AIは加速度的に進化しているようなので、早く技術が進歩して、何もしゃべっていないところで字幕を入れるのをやめて頂きたいものです。
執筆:佐藤英典
Screenshot:Davinci Resolve
画像をもっと見る
が! そのオート字幕機能はまだ進化の途中らしく、何もしゃべってないところにトンチンカンな言葉を当て込んでくることがある。結構笑えるんだけど、時々狂気を感じることも……。
・音声から字幕
私が使っているのは、「DaVinci Resolve(ダヴィンチ・リゾルブ)」という動画編集ソフトである。当初は無料版を使用していたのだが、あまりにも機能が充実していることに感動して、有料版にアップグレードした。
無料版でも使いきれないほどの機能がてんこ盛りなので、これから動画編集を始めたい人にはおすすめのソフトである。
さて、問題のAIを駆使した字幕機能なのだが、2023年7月のメジャーアップデート(ver.18.5)以降、有料版で利用が可能となっている。そうとは知らずに、私はその後も半年近く手打ちで字幕を入れ続けていた。
やり方はカンタンで、機能を呼び出して、言語を「日本語」にして各行の文字数や行の段組みをシングル(1段)かダブル(2段)を選択。あとは作成を押すだけである。
これだけで音声から字幕を書き起こしてくれるのである。便利ではあるけど、言い間違いや言い淀みなども全部文字にするので、手直しは必須。でも、ゼロから音声を聞いて書き起こすよりもずっと楽だ。
・何もしゃべってないのに字幕を生成
機能には満足しているけど、変な欠点がある。それは何もしゃべっていない状態でも、何かを書き起こすことがある。私の撮影環境(録音環境)の影響もあると思うけど、それを考慮しても、理解に困るケースもしばしば……。
以下は珍妙な文字起こしの例である。なお、すべて何もしゃべっていない時に生成された字幕だ。
「3.マッシュアルと使ってマッシュアルを使って」
マッシュアルとはなんぞや!? その言葉が示すものがわからない……。この映像クリップの字幕は、さらにこう続く。
「マッシュアルと使ってマッシュアルが使って」
微妙に言い回しを変えてきやがる。何もしゃべってないのに。
「ん」
「はぁ」
「ん」や「はぁ」など、私の息が漏れたような字幕のパターンは、たいてい1回では終わらず、「ん」だけが連続で続いたりする。何を聞いて、そんな文字を起こしているのか?
次はこれまでと違う特殊なパターンだ。
「3.スタッフ」
このクリップの字幕は、3のスタッフから始まって、「4.スタッフ」「5.スタッフ」「6.スタッフ」といった具合に、次第にカウントアップしていく。そして16・17・18は1行にまとめてつづってきやがった。
最終的に25で終わり。映像はまだ続いているのに、25よりもあとの数字はない。全然法則性が見えて来ないぞ。
さらには文章めいたものを示すこともある。
「言うと、緑ちゃんも接することは終見にする你説どういうことか…」
「どういうことか…」、こっちが聞きたいよ。
「この音がちょっと新鋸なよね」
新鋸……、あたらしいのこぎり? 音がのこぎりとは一体!?
「完全にbouncy when rolling」
突然英文来た! 「完全に転がると弾む」とでも訳すのだろうか。なんかちょっとカッコいいな。この英文に続いて出てきた言葉は……。
「表面はいかがでしょうか?」
知らん! 何の表面? どの表面? bouncy when rollingはどうなったの?
「ほご大助でした!」
何かいいことあったみたいな言い方だな。ほご大助は誰やねん!?
……とまあ、こんな感じで謎の文字を羅列してくれる。繰り返すが私は何もしゃべっていない。いないのに、あたかも私がしゃべっているような調子で、字幕をつけてきやがるのだ。
今までで1番怖かったのがコレ。
「卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、卵を入れて、」
ナニコレ! 怖!! 思わずスマホで写真を撮ってしまいました。ナニに卵を入れるの? 何個入れればいいの? 狂気を感じざるを得ない!
……とか言いながら、おかしな字幕が出ることに期待している自分がいる。とにかく、AIは加速度的に進化しているようなので、早く技術が進歩して、何もしゃべっていないところで字幕を入れるのをやめて頂きたいものです。
執筆:佐藤英典
Screenshot:Davinci Resolve
画像をもっと見る
「ソフト」をもっと詳しく
「ソフト」のニュース
-
ヤクルト・村上、両リーグ10号一番乗り! ソフト山川も同日到達、記録上は2人とも「最速」5月17日19時34分
-
Nintendo Switch専用ソフト「GUITAR LIFE -LESSON1-」追加楽曲が6月1日(土)より配信予定!YOASOBI「夜に駆ける」、スピッツ「チェリー」などの人気楽曲収録!5月17日18時16分
-
【新バージョン発表】ボイスチェンジャーMagicMicのUIが大幅に刷新、日本人気キャラのボイスもさらに収録5月17日18時0分
-
ビリー・アイリッシュ、3rdスタジオ・アルバム「ヒット・ミー・ハード・アンド・ソフト」 5月17日(金)発売!5月17日17時16分
-
弥生の給与計算ソフトが「定額減税」に対応する機能を提供開始5月17日15時45分
-
弥生の給与計算ソフト、「定額減税」対応機能の提供開始5月17日13時46分
-
国内IT業界の7団体、スマホの基本ソフトやアプリ市場の開放促す法案支持で共同声明5月17日12時58分
-
ワークフローシステムのブランドを「MAJOR FLOW」に刷新5月17日12時46分
-
PS5用の新作ゲーミングコンバーター「Besavior P5 Mate」販売開始!5月17日12時46分
-
ホンダ、EV関連投資を10兆円に倍増投資…機能や価格面で米中のメーカーに対抗する狙い5月16日20時53分