ITエンジニアへの5分間キャリア・コンサルティングやってます!

第493回 文字起こしの現状を知る

»

 こんにちは、キャリアコンサルタント高橋です。

 「文字起こし」ってご存じですか? 文字起こしとは喋った言葉を文字に書き起こすことですが、キャリコンなどの仕事をしている場合、結構やらなければならない仕事だったりします。

 私自身、キャリコンをする前から文字起こしの仕事をやっていたので、特段目新しいモノでもなかったのですが、最近文字起こしの現状を知ることができ、自分の中で時代が1つ進んだくらいの驚きがありました。今回はそんな文字起こしについて書いてみました。

■文字起こしがよく行われるケース

 文字起こしがよく行われるケースとしては、インタビューや会議の議事録などがあげられます。こういった場にレコーダーを持ち込み、後で音声を再生しながら少しずつ文字を書き出していきます。昨今はインタビューや会議などがオンラインで行われるようになりましたが、オンラインの場合、その内容が音声データや動画データとして保存することが簡単にできるので、文字起こしがやりやすい環境になったような気がしています。

 ちなみに、キャリコンの立場からすると、文字起こしは結構頻繁に行う作業で逐語録(会話記録のようなモノ)や報告書などを作るためによく行っています。

■文字起こしの現状

 この文字起こしという作業ですが、一言で言うと面倒臭いです。実際にやってみるとわかりますが、一つの文章を聴きその内容を文字に書き写す、ただこれだけなのですが、とても集中力が求められます。また、口語で語られる内容は話し言葉なため、そのままの状態で書き言葉である文語にはしづらい時があります。そうした場合は一旦文字起こしの作業を止め、文章の前後関係を考え、どのような文章として表現すればよいかを考えなければなりません。

 こうしたこともあり、約1時間の内容を文字お越しする場合、下手すると丸1日かかってしまうこともあります。更に、常に言葉を意識していなければならないため集中力が必要という点からも長時間行うことが難しい作業だったりします。

 ですので、私はあまり好きな作業ではありませんでした。そんなことを家族に話した時、こんなことを言われました。

「その作業、変わってあげようか? 」

 最初は私に気を遣ってくれているのかと思いました。そのため、文字起こし自体時間のかかる作業だしとても神経を使うので遠慮することを伝えたのですが、どうも時間がかかるモノではないと言います。

 一体何を言ってるんだ? と思い詳しく話を聴いてみると、文字起こし自体はスマホが自動でやってくれるから、後は文章の誤りや前後関係を見直すだけなので簡単にできると教えてくれました。

 これを聴き、コンピューターが自動で判別する音声変換機能を使い文字起こしをするのだと分かりました。しかし、それと同時にコンピューターが行う文字起こしって結構間違いがあるのでは? とも思いました。それをそのままぶつけてみると、意外や意外、今はほとんど間違いはないそうです。というか、文字変換した時に複数の選択肢が出てくるのでそれを選ぶだけでできるのだそうです。

 もし、これが本当なら文字起こしの革命が起きます。そこで実際に教えてもらい、私もやってみることにしました。私はAndroid端末を使っているので、これに文字起こしのアプリ(私は「エディボイス」というアプリを使いました)で試してみました。その時のスクショがこちらです。

48226.jpg

 このように文字変換した候補がいくつも出てくるので凡そ変換が間違うということはありませんでした。しかも変換が早いので文字で書くよりも楽ですし、句読点などもちゃんと補完できるので、相当精度が高いように感じました。これは本当にビックリしました。この速度でこれだけの正確性があるなら十分実用に足ると思います。。。

 勿論、欠点がない訳ではなく、一度に多くの文字の変換ができないなどの制約はありますが、通常の文字起こしでも一度に多くの文字を変換している訳ではないので、今の所使い勝手に問題はないように思います。

■文字起こしを使ってみよう!

 このような文字起こし、正確に言えば音声変換機能が普及してくると、ひょっとしたらキーボードを使って文字を入力することも少なくなってくるかもしれません。ただ、この音声変換機能の唯一に最大の問題は声を出さないと変換しないという点があるため、普段の日常会話で使うのは少し問題があるかもしれません。

 それでも、この機能を使えばスマホやPCが苦手な方や文字入力ができない方を支援するツールにもなります。また、周りを気にせず一人で文章を書く時などもキーボードを使わなくても音声だけで文章が書けるようになるので、作業効率は上がってくるかもしれません。

 ですので、今度、コラムを全編音声変換機能で書いてみようと思います。もし、使い勝手が良いなら今後は文字起こしでコラムを書いても良いなぁとさえ思っています。一体どんな感じになるのか、ちょっと楽しみです♪

 ...ということで、もし文字起こしに興味を持たれた方は是非試してみてくださいね。

Comment(2)

コメント

白栁隆司@エンジニアカウンセラー

少し前に、逐語記録を作成する学習を体験しました。
その中で、文字起こしのWebAPIを利用してみたところ、かなりの精度で文字起こしができていて、便利さを感じましたが、やはり一部正確に文字起こしができていない部分がありました。
全てを音声認識に任せるのではなく、たたき台として利用し、細かいところをチェックしながら修正していくという流れが必要だと感じました。
そして、それは会話の内容について理解を深める助けにもなるな、と。


実は、僕は地図アプリでの目的地検索には、音声認識をよく利用しています。
また、勝ち逃げ先生さんから聞いた話ですが、彼はコラムを音声認識で書いていたそうです。

キャリアコンサルタント高橋

白柳さん


コメントありがとうございます。


白柳さんのコメントを見ていて思ったのですが、音声認識機能が使われるケースとして、


・既にある音声データを文字起こしする場合
・リアルタイムの音声データを文字起こしをする場合


の2通りあることに気づきました。
前者はコラムでも取り上げている文字起こしですが、この場合、白柳さんが言われるように多少の間違いを許容してでも一気に変換をかけ叩き台としての文章を作った後、まとめて推敲する方が時間もかからないですし、使い勝手もよさそうなイメージがありました。


一方、リアルタイムで音声データの文字起こしをする場合は、精度によってスピードが変わってくるような気がします。
私自身、まだ細かくは試せていませんが、少し触った感じではコラム程度の文章ならそれほど違和感なく使えるような感触でした。
既に勝ち逃げ先生さんが音声認識でコラムを書かれているとのことなので、私も追従してみようと思います♪

コメントを投稿する