音声認識って便利だと思った事ってありませんか?iPhoneにSiriが入った頃は認識精度も低くて”○○に電話して”とSiriに話しかけても認識率が悪くてちゃんと文章に変換できず、できないからワケのわからない答えしか返って来ず、それを何回も繰り返しているのが嫌で結局アイコンをタップして電話をかけていたのですが、今は話した文章に多少方言が入っていてもちゃんとした文章に変換されマトモに動いてくれるので、音声での操作がそう苦にはならなくなり、かえってSiriに話しかけるのが楽しくなって来ました。
そしてこの音声認識と言うのは画面操作やキー操作に慣れない人にとっては非常に有り難いもので、喋った言葉をほぼ正確に理解して文章化してくれますからメールを書いたりするのも楽になりました。そんな音声認識をマイコンの世界にもと思う人はいるもので、RaspberryPiではマイクを接続して音声認識API (音声を認識してテキストに変換するAPI)とAquesTalk等の合成音声でSiriの様なものを作ったりしている方もおられますが、まだまだ音声認識で何かを制御したり動かしたりと言う事はできませんし、やろうと思ってもArduinoでのプログラミングは得意だけれどLinuxを触った事がない方にとってはハードルもかなり高いのです。
そんな音声認識を手軽に利用できるマイコンボードがこの「ReSpeaker」です。
でも私はプログラミングをした事もマイコンも触った事がないから絶対に無理!!と言う方でもご安心下さい。この「ReSpeaker」はプログラミングができなくても簡単に利用できる様になっています。この「ReSpeaker」をWiFiに接続して既に容易されている数々のアプリケーションを「ReSpeaker」を提供している会社のHomePageからインストールする事で、ブラウザを使って様々な事を「ReSpeaker」にさせる事ができます。
例えば一例として、「ReSpeaker」にスピーカーを接続して音楽ストリーミング「Spotify」に接続して音楽を再生するプログラムをインストールすれば音楽ストリーミングサーバーに「ReSpeaker」が変身しますし、USBコネクタにUSBメモリーやSDカードスロットにSDカードを差し込んでファイルサーバーとして使ってみたりと様々な事ができる様になっていますし、例えばI/OポートにLED等を接続してイルミネーションさせる様なプログラムであれば、ちゃんとその接続方法や材料の一覧まで詳細に解説してくれていますから、「ReSpeaker」と通してちょっとずつマイコンと言うものを理解する教材として利用する事もできます。
さて肝心の「ReSpeaker」の音声認識がどう行われているかですが、”PocketSphinx”と言う音声認識APIを内蔵しており、オフラインではこの音声認識APIを使って音声認識を行います。ただこれはメモリーも限られており、クラウドサーバーに莫大なデータを溜め込んでいるSiriやGoogle Speach APIには認識精度や変換精度は叶いません。ですから「ReSpeaker」ではWiFiでインターネットに接続する事でGoogle Speach API、Amazon Alexa Voice Service、Microsoft Congnitive Serviceと言ったメジャーな音声認識APIを利用する事で音声認識の精度を高めていています。
次ぐにプログラミングですが、プログラミングはPython、ArduinoライクなC/C++、JavaScript、Lua等をサポートし、「ReSpeaker」上の12個のLED、32ポートのGPIO(I2C)としてホストモードで動くUSBポートを音声で制御する事ができます。
ただ「ReSpeaker」上に設置されたマイクはアナログマイクなのでそう感度は良くなく周囲の雑音が多いと話した音声をちゃんと認識する事ができません。ですので「ReSpeaker」にはオプションとして7つのデジタルマイクを搭載して360°どの方向からでも音声を拾う事ができる”Mic Array”が用意されています。この”Mic Array”にはデジタルマイクの他に8つのタッチセンサーポートと12個のフルカラーLED、そしてホストモードで動くUSB端子を備えています。
その他にも簡単にセンサーやスイッチと言ったものをカプラーオンで半田付け不要で接続できる”Grove Extension Board”が用意されています。そしてこのボードはGroveモジュール(SeeedStudio社)の製品を利用でき、国内でも輸入販売している販売店は多いので入手は容易です。
なおGrove Ports×10の他にデジタルポート×3、アナログポート×4、I2c×2、UART×1も備えています。
そしてもう1つ、「ReSpeaker」は音声認識ボードで合成された音声も出力できますからスピーカーさえ用意すればSiriと話す様に簡単に会話する事ができるのですが、それではボード剥き出しですしちょっと無骨ですから”Meow King Drive Unit”と言う、スピーカーとバッテリーを内蔵した専用のケースも用意されています
ですから最低、「ReSpeaker」にこの”Meow King Drive Unit”を加えたセットを購入すればとりあえずは別途何も用意しなくても届いてすぐに楽しむ事ができます。
なお各拡張ボードとのセット内容については下記URLをご覧ください
https://www.kickstarter.com/projects/seeed/respeaker-an-open-modular-voice-interface-to-hack
また英語が苦手だったり、直接投資するには不安がある。輸送トラブルや届いた商品が破損していたり動かないんだけど、どうしたらいいのだろ?
と言う不安がある方は、下記URLのRAKUNEWさんがオススメです。
商品の破損やトラブルに関しても直接、RAKUNEWさんが販売元と交渉して頂けますので安心ですよ♪
RAKUNEWさんの商品紹介ページは下記になります
この記事へのコメントはありません。