• みずき書林

Googleドキュメントの音声入力



取材した録音を文字起こしするときに、Googleドキュメントの音声入力機能がすごい、という話をしばしば耳にします。



僕も取材して文字を起こすという仕事をしているので、文字起こしをどうやって簡略化するかというのは大きな課題です。

知っている人はよくご存知と思いますが、文字起こしというのはものすごく時間がかかります。


で、Googleドキュメントの音声入力。

結論からいうと、巷間言われているほど圧倒的な精度ではない。

ただし、かなり役に立つのも確かです。



たとえば以下。

まず正しい文章はこんな。喋り口調をそのまま文字化していきます。



【長崎にとってのすごく重要な部分というのは港の,海の方なんですよね.そこからすると浦上に落ちた原爆というのは,長崎の方たちが,当時もそうかもしれないですけれども,一体感を持って長崎に落ちたと思っていたのかと言うと,割とそうじゃない部分があるなというのは,行ってみて色々聞き取りをしたりしてみても感じるところがありましたね.それは今の長崎にも非常に顕著に表れていて,長崎駅を降りて観光ガイドブックとか案内所とかに行った時に,広島だと全く考えられないと思うんですけれども,長崎にとって推したい観光ルートというのは海の方の,坂本龍馬とかあるいは文明開化の華やかな長崎っていうものを推していきたいという気持ちをすごく感じるところがあって.】



これをGoogleドキュメントの音声入力にかけるとこんな。



【江戸真樹にとってすごく重要な部分と海の方なんですよねからすると浦上原爆っていうのがその時の形がそうかもしれないですけどもう一体感を持って長崎に落ちたという風に思っていたのかと言うと割とやっぱりそうじゃない部分が入っているしたりしても自分がありました何回も先にも非常に顕著に表れていて観光ガイドブックみたいなものとか観光案内所とかに行った時に終えられないと思うんですけども先にとってをしたい観光ルートっていうのはわりと海の方の坂本流すごく感じるところがあって】



まあ、使えないことはない。かもしれない。

たとえば雑誌の記事を書くライターさんみたいに、録音時間が短くて、それをダイレクトに自分の文章にしていく仕事であれば、これくらいの荒い素材でも間に合うかもしれません。

ただ僕がやっているのは、毎回2時間くらい(仕上がり3万字前後)のわりと長めのものです。さらに、それを1万字程度の完成稿にブラッシュアップしていくのは、編著者とのキャッチボールになります。

なので、最初の起こしとはいえ、もう少しは精度を高めておきたい。



録音環境は大きいと思います。

講演や授業など、静かな場所でひとりで喋るタイプのものであれば、もっと精度が高いかもしれません。

いっぽう、野外やBGMの流れているお店で録音したものは、まるでダメです。

上記の例文はzoomで相手がご自宅にいらっしゃいました。なのでなんとか拾いましたが、それでもこれではなんのことやらわかりません。




でも実は、例文の正解のほうも、Googleドキュメントの音声入力で作っています。

つまり、片っ端から自分で喋り直して文字化しているのです。

少々の誤字脱字や同音異義語の誤変換は無視して、とにかくどんどん喋ってデータ化していきます。

文字化していくスピードにあわせて喋る速度を変えないといけないし、あとで混乱しそうな誤字脱字はその場で適宜直していかないといけない。活舌が悪いから、わけのわからない文章になることもあります。

だから小刻みに再生と停止を繰り返しながらよちよち前に進んでいくことになり、これはこれで時間がかかりますが(30分起こすのに1時間くらいでしょうか)、それでもキーパンチで手入力しているよりはずいぶん早い。



イヤホンをして、日がな一日、録音を聞きながらひとりで喋るのは、なかなかかっこ悪い姿ではあります。

あまりにひどい変換をされると、思わず「ちげーよ、ばか」「ああ。そうじゃなくて」とか口に出るのですが、そういうのに限ってきっちり入力したりして、小バカにされている気分になるし。

まあしかし、喉がかれるから、終わった後のビールは美味しい。




一月ほど前まで、なんやかやでしばしば文字入力をしていました。

どなたか、もっといい方法があればご教示くださいませ。



© 2018 by Mizuki Shorin Co., Ltd.