740eの音声認識機能を試す《撮影:中尾真二》

世間ではAIブームに合わせて、Amazon EchoのAlexa、Google Assistantといった音声認識エージェントが、次世代インターネットのUI標準となり、キーボードもタッチも時代遅れになるとも言われている。自動車の音声操作はどこまで実現されているのだろうか。

xDriveやiPerformanceなど先進装備を搭載したプラグインハイブリッド車である、BMW『740e』 2017年モデルで検証してみたい。この車は単なる音声認識機能ではなく、自然言語認識(NLU)機能が搭載され、ナビ設定、音楽再生やメール作成など賢くなっているという。もちろん日本語対応だ。

●ナビ機能は2ワードの組み合わせが可能

平均的なナビの音声認識では、目的地設定ではなにをおいても登録された地名や施設名をはっきり発音する必要があった。740eに搭載された音声認識エンジンは、「コーヒーが飲みたい」「ファミレスに行きたい」「スタバ」といった発話で、周辺の喫茶店やカフェ、スターバックスコーヒーの候補を表示してくれる。「ファミレス」や「スタバ」といった会話言葉も認識しているわけだ。

目的地に関しては、2ワードを組み合わせた指示に対応している。例えば、どこそこに「行きたい」「案内して」といった発話で、指定された場所をナビの目的地に設定する。あるいは、「八王子にあるスタバ」のような表現でも、住所が八王子のスタバックスコーヒーの店舗をリストしてくれる。

従来の音声ナビの場合、地名・場所を検索してから「目的地設定」と発話するか、先に「目的地設定」としてナビに設定モードに移行させる必要がある。なお、住所で検索するときも、「3の5の11」のように番地・号まで一気に発話して設定できるようにもなっている。


●「ナントカ〜」でも曲名認識して再生

エンタメ関係も賢い選曲が可能だ。音声で曲を再生したい場合、タイトルを正確に覚えていなくても該当する曲を探してくれる。「宇多田ヒカルのFirstナントカをかけて」と言えば「First Love」にヒットして再生が始まる。

他にも局名や周波数でラジオをかけたり、再生中の曲名を教えてくれたり(「この曲はなに?」と聞く)もする。車両情報では、「タイヤの空気圧は?」「ブレーキパッドはまだ大丈夫?」「クルーズコントロールをオフして」といった発話も認識して、正しい答えを返してくれる。ただし、回答はすべて音声とは限らず、質問によってはディスプレイにモニター結果を表示したり、必要な設定画面を表示させることもある。

例えば、クルーズコントロールのオフは可能だが、オンにして速度などを設定したいときは画面を設定画面に切り替えるだけだ。もっとも、クルーズコントロールはステアリングスイッチで設定ができる。


●メール作成やツイッター投稿も音声で

モバイルアプリとの連携も音声対応している。メール(SMS)の読み上げは当然として、相手を指定してメール本文を作成して送信するまでも、音声操作が可能だ。もちろん相手先の情報は接続するスマートフォンに登録されている前提だが、「田中さんに、渋滞にはまってます。とメールを送って」と言えば(ただし、句読点は「てん」「まる」と発話する必要がある)メール送信が可能だ。

ちなみに、スマートフォンやBluetooth機器、USB機器の接続も音声操作である程度可能だ。最初のペアリングや接続時に画面のタッチ操作が必要になる部分もあるが、「電話をつないで」「USBをつないで」といった命令で、設定画面をすぐに起動してくれるのはありがたい。通常、これらの外部機器の接続は、ナビや車種によってメニュー構造が異なり、どこで設定すればいいかわかりにくい。常に設定する操作ではないので、いざ再接続するときにイライラすることがあるが、740eではその心配はないようだ。

740eのインフォテインメントシステムには、ニュースアプリ、カレンダーアプリ、トラベルガイド、Wiki検索などのアプリを内蔵している。これらのアプリも音声操作に対応している。メールを作成、送信する要領で、ツイッターを起動してツイートを投稿するのも音声で可能だ。

●地味にすごい機能も…バージイン、PIC

説明しないとすごさがわかりにくい機能も実装されている。ひとつは、ナビ側が設定を復唱していたり、プロンプトワードを再生している途中でも、ドライバーの発話を認識しており指示を与えることができるバージイン機能だ。

ナビが「〜をしてください。」「〜しました。」と言い終わるのを待たなくても、「設定」「送信」「〜に行きたい」とすぐに命令できる。例えば、目的地を検索し、候補が複数挙がっているとき、ナビはまだ「リストの番号を指定してください」などと特定を促すメッセージを発するが、目的地があればすぐに「2番」などと言えば、ナビは読み上げを中断して設定操作に移行する。


PIC(Passenger Interference Compensation)機能は、ノイズキャンセラと同じ原理で助手席の人のしゃべっている声をドライバーの命令と間違えたり、ドライバーの発話認識のエラーを防ぐ機能だ。740eでは、Aピラーの上部にマイクがあるのだが、助手席側にもついており、ここで拾った音声はドライバーの言葉ではない「ノイズ」として、マイクが拾った音から削除する。

ドライバーと助手席の人が同時にしゃべっていても誤認識することが少なくなる。

●7シリーズのNLU機能は、5シリーズ、3シリーズにも展開予定

以上の機能は、ニュアンスコミュニケーションズのDragon Driveをベースに実装されたものだ。NLU、PICなどは「7シリーズ」から投入される新技術だが、ニュアンスコミュニケーションズによれば、新しい『5シリーズ』にも搭載され、次の『3シリーズ』への展開予定があるという。

音声入力でメッセージを作成しSMS送信《撮影:中尾真二》 空気圧、エンジンオイルなどのモニタリング情報を音声で確認《撮影:中尾真二》 スマートフォンの接続も音声で《撮影:中尾真二》 車両設定の画面を呼び出したところ《撮影:中尾真二》 アプリ連携《撮影:中尾真二》 アプリ連携《撮影:中尾真二》 ツイッターを音声で起動。ツイートを読み上げることも可能《撮影:中尾真二》 「宇多田ヒカルのFirstナントカ」で検索可能《撮影:中尾真二》 運転席側のマイク《撮影:中尾真二》 助手席側のマイク(助手席音声をキャンセルするため)《撮影:中尾真二》