Google AIY Projects 「Voice Kit」が日本上陸! 早速、組み立ててみたよ!

待ちに待った”Google AIY Projects“の「Voice Kit」が、日本国内でも販売が開始になったので、早速、購入した組み立ててみることにしました。

POOHは、”Raspberry Pi Shop by KSY“で購入しましたが、”スイッチサイエンス“でも販売しています。どちらでも良いと思いますが、送料の設定に違いがありますので、購入前にチェックしておくと良いかと思います。

Googleの”AIY”というプロジェクト名は、”Do-it-yourself artificial intelligence”の略で、人工知能をDIYしようというまさに最先端をいっているプロジェクトなわけです。でも、そんな人工知能を、子供でも学べるようにした学習キットが、このプロジェクトの凄いところなんですよねえ。で、今回購入した「Voice Kit」は、音声認識装置を自分自身の手で使って、”Google Assistant“と接続する、というキットです。その他、機械学習アルゴリズムを使ってオブジェクト認識をする「Vision Kit」というものもあるようです。そちらは、”Raspberry Pi Zero W“を使用するキットなので、そういう意味でも楽しそうですよねえ。

 

(1) 用意するもの

キットに同封されていないけど、絶対に必要になるのは”Raspberry Pi 3“とマイクロSDカードです。

“Raspberry Pi”本体は手元にあったので、マイクロSDカードだけ別途購入しました。カード容量は16GBあれば十分みたいなんですが、最近は32GBが最低ラインみたい。ちょうど、アマゾンのウィンターセール開催中だったので、ちょっとだけお安く調達できました。

今回は、”Samsung microSDカード 32GB EVO Plus Class10 UHS-I対応 スマホ カメラ向け (最大読出速度95MB/s:最大書込速度20MB/s) Nintendo Switch 動作確認済 MB-MC32GA/ECO“を購入しましたが、”Raspberry Pi”の場合は、使用するマイクロSDカードの相性問題があるので、”こちら“で事前にチェックしておくと良いと思います。ちなみに、POOHの場合は、個人的にも実績があるこちらのマイクロSDカードを毎回買っています。

なお、今回始めて”Raspberry Pi”を買ってみようと思っている方は、”Raspberry Pi本体の種類“がいくつかありますので注意して下さい。「Voice Kit」の場合は、”Raspberry Pi 3 Model B”(Raspberry Pi 2 Model Bでも可能。)というタイプになります。オークションでも出品されていますが、ま、精密機器なので、新品を調達した方が、何かあった時のサポートも期待できるので良いと思います。購入店としては、”Raspberry Pi Shop by KSY“、”スイッチサイエンス“(こちらのお店はアマゾンでも購入できます。)いずれかがオススメです。(サンプルコードによっては、Zero Wでも動作できるようです。)

その他、Size “00” Phillips screwdriverとScotch tapeが必要となっています。ドライバーについては、スピーカーのケーブルを固定するために使うのですが、それ以外に使う場面はありませんので、まずは、手元に精密ドライバーセットなどがあれば、実物を組み立てながら試してみると良いかと思います。それと、スコッチテープですが、こちらはマイク・モジュールを固定するために使う手順になっています。とは言え、こちらも、それ以外に使う場面はありませんので、実物を見つつ、代用品などがないか試行錯誤してみるのも良いかと思います。

その他、”Raspberry Pi”環境下で、「Voice Kit」周りのセットアップ作業を行う際、HDMIで接続するモニター・ディスプレイ、USB仕様のキーボードとマウスが必要です。

 

(2) マイクロSDカードにVoice Kit SD Imageをインストールします

以下、macOS環境でセットアップする手順を、ザックリと説明します。

 

(a) 用意したマイクロSDカードを初期化します

“Raspberry Pi”的に無難なのは、”SDFormatter“を使ってフォーマットする方法かと思います。

 

(b) “Voice Kit SD Image”ダウンロードします

続いて、「Voice Kit」ページに掲載されているリンクをクリックして、”Voice Kit SD Image”をダウンロードします。”Voice Kit SD Image”の中身ですが、”Raspberry Pi”のOS環境に、”Voice kit”をプレインストールしたバージョンですので、セットアップ後は、普通に”Raspberry Pi”としても使うことができます。

 

(c) “Voice Kit SD Image”をマイクロSDカードに焼きます

Etcher“を利用して、先程、ダウンロードした”Voice Kit SD Image”(aiyprojects-2017-09-11.img)を選択して、マイクロSDカードに焼きます。

 

(d) マイクロSDカードをRaspberry Piにセットして起動してみます

ここで、マイクロSDカードに焼いた”Voice Kit SD Image”が正常に動作することを確認するために、マイクロSDカードを”Raspberry Pi 3“にセットして起動してみます。この段階では、HDMIで接続できるモニターと、USBキーボードとマウスが必要になります。

起動後、こんなデスクトップ画面が表示されれば、まずはOKです。

 

(e) Raspberry Pi環境を最新の状態にアップデートしておきます

Voice Kit」はそれだけでも立派なガジェットではありますが、それなりの値段がする”Raspberry Pi 3“を1台使ってしまうので、ちょっと勿体無いかなあ、と思い、POOHの場合は、後述の通り、別の用途にも使えるようにしていきたいと思っています。そんなわけで、マイクロSDカードに焼いた”Raspberry Pi”環境を、このタイミングで、最新の状態にアップデートしておきます。

"sudo rpi-update"

"sudo apt-get update && sudo apt-get upgrade"

 

(f) NTPサービスの修正とIPアドレスの固定化をしておきます

Voice Kit」だけの用途で”Raspberry Pi”を使う場合は必要のない作業ですが、POOHの場合は、他の用途にも使おうと思っているので、NTPサービスを日本標準時にちゃんと合わせるようにすることと、”Raspberry Pi”に割り当てるIPアドレスを固定にしておく作業を、このタイミングで行っておきます。

詳しい内容は、“Raspberry Piで航空機のADS-Bを受信してみました “IPアドレス固定化 ラズパイ環境整備 NTP RealVNC” (2)”をご覧下さい。

 

(2) 組み立ててみます

組み立ての手順は、「Voice Kit」ページあるいはパッケージに同封のマニュアルで、写真入りで確認できますので、ここでは割愛します。個人的には、組み立てに、30分ぐらいかかりましたが、実際のパーツとマニュアルに掲載されている写真を見比べながら作業を進めていけば、決して難しくはありませんので、安心して下さい。

POOHの場合、詳しくは後述しますが、カメラモジュールをいっしょに組み込みました。

パッケージに同封されている”Voice HAT accessory”基板の良いところは、カメラモジュールのケーブルを出す穴がちゃんと空いていることです。こういった配慮は、HAT基板を設計する時の決まり事なのかもしれませんが、

組み立ての途中で、スピーカーのケーブルを固定する場面で、ドライバーが必要になります。マニュアル的には、Size “00” Phillips screwdriverとなっていますが、POOHの場合は、手元にある精密ドライバーセットのなかで、サイズ的に良さそうなものを使いました。

基板とケーブル類の接続が終わると、こんな感じになります。下の写真に写っている白い帯は、カメラモジュールのケーブルですので、パッケージには同封されていない別売の製品になります。

マイクを固定するために、スコッチテープが必要だとマニュアルに書いてあるのですが、POOHの場合は、手元にあったネジで固定してしまいました。

完成しました!個人的に、ちょっと時間がかかった部分は、段ボール箱に基板とスピーカーを収納するところかなあ。ま、分かってみれば、至ってシンプルなんですけどねえ。

 

(3) Google Cloud Platformでプロジェクトを準備します

組み立て終えた「Voice Kit」とインストールした”Voice Kit SD Image”だけでは、スマートスピーカーとして動作しません。

Google Cloud Platform“というインターネット上にある開発基盤で、有効にした”Google Assistant API”を「Voice Kit」で利用できるように準備しなくてなりません。

具体的な手順は、「Voice Kit」ページの解説を見れば良い、と言いたいところなのですが、マニュアルに掲載されているキャプチャ画面が古いのか、実際のWebページの画面とレイアウトが異なっているので、POOHも含め、始めて、このプラットホームを利用するユーザには、かなり高いハードルだなあと感じるはずです。

そんなハードルを少しでも低くするための技?を、実際に苦労したPOOHの経験をもとにまとめておきます。

まず最初に、認証情報のファイルをダウンロードするまでの設定作業は、普通のデスクトップ環境で行って下さい。POOHの場合は、macOS環境の”Safari”で行いました。理由は、”Raspberry Pi”のWebブラウザ”Chromium”のレスポンスがかなり遅いからです。

それと、「Voice Kit」ページに記載されているリンクを最大限活用して下さい。理由は、マニュアルに記載の画面レイアウトと実際のものが異なっていても、リンクで移動すれば、目的のページに確実に移動できるので、該当ページを探す手間を随分と軽減できます。

最後に、全体の段取りを、アウトラインレベルで事前に理解しておいて下さい。要は、プロジェクトを作成-> “Google Assistant API”をプロジェクトに追加-> “OAuth 2.0という仕掛けを用いてGoogle Assistant API”を外部端末などで利用できるようにする”、といった流れになります。最終的には、作成した認証用ファイルを”Raspberry Pi”に保存して、”Google Assistant API”の利用を許可する手順を踏めば、「Voice Kit」がスマートスピーカーになる、というわけです。なお、ここまであれば、”Google Cloud Platform“の利用にコストは掛かりません。以下のようなメッセージが表示されますが、気にせずに試してみてください。

 

(4) 当面の課題

短い時間ですが、実際に「Voice Kit」をいじってみて、出来るだけ早い段階で解決しておきたい課題が見えてきたのでメモしておきます。

 

(a) 日本語で応対してくれるようにしたいなあ

素の「Voice Kit」のままですと、英語で話しかけて、英語でレスポンスが返ってくる、といった状態です。簡単なやり取りなら問題ないですが、それなりに使おうと思うと、やっぱり日本語で会話できた方がストレスがないので、何とかしたいなあ、と思っています。「Voice Kit」に同封されている”The MagPi ESSENTIALS“を読み進めていくと、使用する言語の変更方法は分かったので、後はプログラミング次第っていう感じです。

 

(b) スマートスピーカーとしての活用シーンを検討しなくては

後述のカメラ機能との連携については何となくイメージがあるものの、折角の電子工作なので、もうちょっと新鮮なネタがないかなあ、と思案中です。ま、ある程度、実用的な活用シーンを思い付くことができれば、後は、その実現に向けた勉強ができるんだけどなあ。何か面白そうなアイディア、ないかなあ?

そんな時には、”ラズパイマガジン 2018年2月号 (日経BPパソコンベストムック)“を読んでみると、あ、そういう手があったのか!と、アイディアが広がるかも。

 

 

(5) 付加価値を付けておきましょうね

ここまでTALKして、今更言うのも何ですが、「Voice Kit」のためだけに”Raspberry Pi 3“を1台使ってしまうのは、正直なところ、勿体無いです。これだけの手間と、コストを掛けるぐらいなら、製品版の”Google Home Mini チョーク(グーグル ホーム ミニ チョーク)“を1台購入した方が、お得感があると思います。

でもね、折角、”Raspberry Pi”をベースにした電子工作なんですから、スマート・ホーム化を目指した付加価値をいくつか追加できる、というアドバンテージを活かさない手はありませんよね。

そんなわけで、今回は、その前準備ということで、「Voice Kit」を組み立てる過程で、カメラモジュールも一緒に段ボール箱に収めておきました。

説明の順番が前後しますが、Voice Kit」に”Raspberry Pi 3“を組み込む前に、”Raspberry Pi Camera V2“を”Raspberry Pi 3“に接続しておきます。

接続したカメラが正常に動作することを確認しておきます。

raspistill -o firstpic.jpg

ちなみに、カメラモジュールを活かすために、以前やった実績がある監視カメラ化”Raspberry Pi Zero W スターターキットを買ってみました (4) “外部からアクセスできる監視カメラ”“にトライしてみたのですが、どうも、「Voice Kit」との相性が良くないみたいです。別の手段を考えてみなくっちゃ。

いずれにしても、スマートスピーカーでカメラを制御することが、ひとつのゴールだと思っているので、まずは、プログラミングのやり方を勉強しないとなあ。

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

Google Cloud Platformではじめる機械学習と深層学習 [ 吉川 隼人 ]
価格:2808円(税込、送料無料) (2017/12/20時点)

 

 

 

Adobe Stock“でベストショットな写真素材を販売中です。是非ご覧下さい。
ホームページ”THE POOH FILES”にも是非お立ち寄り下さい。

tomohiko

長年に渡りMacintosh向けの自作アプリを作り続けているPOOHです。最近はiPhone,iPad向けアプリ開発にも挑戦中。グルメ、旅行、露天風呂、写真、サイクリング、映画、STAR TREKが大好き。レトロでSFなおもちゃを大量にコレクション。プレーリードッグと同居中。

おすすめ

コメントを残す