みなさんは議事録や会話の内容を文字起こし、つまり文章にする様な作業をされた事はありますか?
昔は数秒ごとに再生しては止め、巻き戻しては再生し止めて、と言った様に少しずつ再生し自分の耳で聞き取りながら文字起こしをしたものですが、最近の音声認識エンジンは言語翻訳などの飛躍的な向上により進化しており、音声ファイルを読み込ませるとただ文字起こしするのではなく、前後の文脈なども参考にし、漢字なども適切に変換してくれる様なものも出て来ており、以前と比較して文字起こし作業と言うのは劇的に改善され手間がかからなくなっています。
とは言っても誤変換などは多々あるので、そこは人の手で手直ししなくてはいけないのですが、今回紹介するボイスレコーダー「PLAUD NOTE」は何とChatGPTを使う事で誤変換を大幅に減らし文字起こしたした文章をすぐに使える様なものになっています。
あのChatGPTを使って文字起こし
今回紹介する「PLAUD NOTE」はボイスレコーダーなのですが、専用のアプリには「PLAUD NOTE」に録音された会話などを再生し聴く機能の他に、録音ファイルから音声を抜き出し、文字起こしを行う機能を兼ね備えています。
ここで重要になって来るのが音声認識エンジンと文字起こしを行うエンジンの2つで、前者は会話を日本語で言えば”ひらがな”だらけのテキストデータとして出力する為のプログラムであり、後者の文字起こしは、そのひらがなだらけの文章を構文解析する事で、ひらがな、カタカナ、漢字交じりの文章に変換します。
そしてこの時に前後の文脈から適切な漢字にひらがなを置き換えるのですが、従来のAIを使った文章変換ではどうしても誤字が多く手直しの量が必然的に増えるのですが、AIエンジンの1つである今話題のChatGPTを使う事で、この文章変換が劇的に良くなります。
例えばみなさんがChatGPTアプリにマイクを使って話しかけて質問をすれば、正しく言葉を理解して質問に答えてくれていると思いますが、その話しかけて文字に変換すると言う、そこがChatGPTは素晴らしく優れていますので、手直しは殆どなく、すぐに文字起こしされたデータを使いレポート等を作成する事が可能です。
2 つのハイエンドKnowles Sisonic™️ マイクによるDVD品質の高音質録音
次にこの「PLAUD NOTE」は音質にもかなり拘っており、Knowles Sisonic™️ハイエンドマイクを2つ搭載しています。
このマイクは最大で1536 kbpsのDVD品質で録音する事ができるだけでなく、-25dBと言う性能の高いノイズキャンセラーを搭載している事で、会議室での会話の録音であれば、ほぼ周囲のノイズと言うものは入りませんし、雑踏の中でボイスメモを撮ると言った際にも周囲のザワザワとしたノイズと言う様なものは録音されませんので、後からChatGPTが文字起こしする際にも誤検出や誤変換が少なくなるだけでなく、私たちが直接聞くと言った際にも聞き取り易くなります。
そしてアプリの中には文字起こししたデータを会議メモ、マインド マップ、ToDo リスト、日記と言ったジャンルにタグ付け出来る様になっているだけでなく、これらバラバラのデータを1つのファイルの中で構造化しまとめると言った機能も搭載していますので、考えをまとめると言った作業にも向いています。
MagSafeケース
そしてこの「PLAUD NOTE」にはMagSafeケースが付属しており、「PLAUD NOTE」をMagSafeケースに入れMagSafeに対応したiPhoneに取付られる事が出来るだけでなく、「PLAUD NOTE」を電話モードに切り替える事、で通話を録音できないiPhoneの通話をこの「PLAUD NOTE」で録音できる様にします。
また録音の際には切替スイッチを上げてスイッチに赤いマークがついていれば、切替スイッチの横のボタンを押すだけで会話は瞬時に録音をスムーズに始められる様になっていますので、もし興味を持たれた方は詳細は下記URLをご覧ください。
https://www.kickstarter.com/projects/izyrec/plaud-note-chatgpt-empowered-ai-voice-recorder
この記事へのコメントはありません。