Google Voice Actionとは。

米国時間の8月12日にサンフランシスコのGoogleのオフィスで開催されたプレスイベントでVoice Actionが発表された。これは、Google Voice Searchの機能をうまく利用したものだ。音声のみで、Androidのほぼ全機能を利用できるものだ。記事はこちら。Googleプレスイベント―Voice Actionをローンチ:Androidのほぼ全機能が音声から利用可能に
これを開発するに至ったのは、米国においてGoogle検索の25%が音声検索によるものだからだ。(記事はこちら。Googleプレスイベント―アメリカのAndroid検索の25%は音声を利用
会話でサービスを受けられる良さとういのは、テキストを入力するより、当然簡便であるからだ。さて紹介ビデオを見てみましょう。

このビデオを見る限り凄い、の一言であるが、それぞれのActionを分析してみると、次のようになる。サポートされる機能と、それに対する音声入力を書き出してみる。
・テキストの送信 :Sent text to Bill Byrne Let's meet・・・
・電話の呼び出し:Call Blue Ribbon Bakery in New York
・地図でのナビゲート:Navigate to rockefeller plaza
・音楽の呼び出し:Listen to the decemberists
・Emailの送信:Send email to Dave Burke ・・・
・目覚まし時計の設定:Set alarm eight thirty am
・HP検索:Go to New York Times
・地図検索:Map of art galleries in amsterdam
・場所のナビゲーション:Directions to 829 valencia street in san francisco
・メモ:Note to self Pick up some chicken teriyaki for dinner
・通常のGoogle検索:pictures of the icelandic volcano eruptions
もうお分かりでしょう。一見人間が何気なく話している言葉の意味を理解しているように見えるが、まず”何をしたいか”をAndroidに伝えているのだ。
このテクニックは、英語だと非常に使い易い。英語は構文上動詞が最初にくるので、”何をしたいか”が、まず分かるからだ。
この”何をしたいか”が分かれば後は簡単だ。それに対応したAPIを準備してあげればよいのだ。このVoice Actionは、音声検索のちょっとした応用編だ。Googleであれば、このアプリ開発は苦もなくできたたであろう。
ただ、人間の言葉による検索と人間の言葉を理解することは、まったく異なる。
IBMが"Watson"というシステムでこれに挑戦している。米国のクイズ番組であるJeopardy!を模したクイズ形式で、人間の参加者と回答を競っている。デモビデオはこちらです。(こちらで”Watson"と対決もできるよ。英語だけどね。The Watson Trivia Challenge

このビデオを見ても分かる通り、いくつかのセクションではWatsonが勝者となるが、別のセクションでは、とんちんかんな回答を繰り返してしまう。
Watsonの回答に至るまでのアルゴリズムの詳細は明かされていないが、The New York Timesの記事”What Is I.B.M.’s Watson?”を読む限り、何数千万ものDataBaseをもとに百以上のアルゴリズムで分析し、数十のアルゴリズムが同一の回答に辿り着いた結果を、もっとも確からしい結果としているようだ。ただこれも、検索(クロスチェック)を何重にも重ねたに過ぎない。(と、言いつつも、自然言語の構文から、求められられている情報が何かを抽出するのは、結構大変だろう。)一例がでている。The New York Timesの記事から引用してみる。
質問: In 1594 he took a job as a tax collector in Andalusia(1594年にアンダルシアで収税吏を務めていたのは誰?)
回答:Cervantes
回答のプロセスはこうだ。まず “Thoreau” と “Cervantes”が候補にあがる。次に“Thoreau”の誕生日が1817年であることを見つけ出す。 これで候補からはずす。なぜなら、1594年にはまだ生まれていないからだ。この結果 “Cervantes” が最有力候補として残る。
ちなみに、”アンダルシアの収税吏”をGoogleで検索すると、あのドンキホーテの作者”セルバンテス”に関わるブログがヒットします。おいらも初めて知りましたが、セルバンテスって収税吏を務めていたんですね。収税吏をしている間、幾度かトラブルに巻き込まれ投獄もされたようです。そしてこの投獄の期間に、ドンキホーテ物語の構想を練っていたんですね。セルバンテスってすごい人物だ。
と、話は横道にそれましたが、もとに戻します。
このWatsonをベースにした製品をIBMは出すらしい。ただオールマイティは無理で、医療やコールセンター向けに、使用範囲を限って製品化するようだ。
まあ、The New York Timesの記事にも書かれていますが、コンピュータには判断やユニークな回答はまだまだ難しいということだ。判断をアシストする情報は提示できるが、結局判断するのは人間なのである。