downloadGroupGroupnoun_press release_995423_000000 copyGroupnoun_Feed_96767_000000Group 19noun_pictures_1817522_000000Member company iconResource item iconStore item iconGroup 19Group 19noun_Photo_2085192_000000 Copynoun_presentation_2096081_000000Group 19Group Copy 7noun_webinar_692730_000000Path
メインコンテンツに移動

ユーザーインターフェースの闘い

 

Vesper シニアフィールドアプリケーションエンジニア ユーデイナグ・ピッシパーティ 2019年5月16日

お気に入りの観光地を、自宅のリビングルームのソファに座ったままで再訪問するとしたらどんな感じがするか考えたことがありますか。そのソファに座ったままで、海辺のレストランの中へと歩いていき、美味しい料理を味わうことができたらどうでしょう。

家電製品のトレンドを見ている方なら、仮想現実(VR)のヘッドセットの視覚インターフェースでレストランの情景をシミュレートし、音声インターフェースでメニューを閲覧することを想像されたかもしれません。テクノロジーの世界では、VRの視覚や音声インターフェースが格段の進歩を遂げていますが、没入型のバーチャルな食事体験には、嗅覚や味覚のデジタルインターフェースが必要となります。実際に、シンガポール国立大学はこの分野での研究を進めています(ビデオをご覧ください)。また、Project Nourishedは、VRによって視覚、味覚、臭覚、聴覚、触覚をハッキングすることで、飲食をまったく新しい方法で体験でき、カロリーの摂取も自由だと主張しています。

 

私たちは、触覚、視覚等の人間の感覚や音声を再現して、デジタルデバイスを操作するユーザーインターフェースを構築しようと、長年にわたって探求を続けてきました。実際に、この数十年間に家電の状況を一変させた発明は、いずれもこうしたユーザーインターフェースに活かされています。例えば、スマートフォンによって触覚インターフェースが急速に普及し、任天堂WiiやMicrosoft Xbox等のビデオゲーム機にジェスチャーインターフェースをもたらしました。足元では、スマートスピーカーやVRヘッドセットが音声と視覚の利用を進展させています。

 

ユーザーインターフェース設計の複雑性

ユーザーインターフェースの設計は複雑な仕事であり、何年にもわたる神経科学、新地思考、工学の研究の上に成り立つものです。また、ユーザーによってデジタルデバイスとの対話スタイルは違いますから、その個性も考慮しなければなりません。私のように、ゲーム機の操作にもっぱら左手を使う人もあれば、訛りが強くて音声認識が難しい人もいます。また、聴覚が不自由な人は、音声よりも触覚インターフェースを好むかもしれません。デバイスのアプリケーション、設置状況、ユーザーとの距離もユーザーインターフェースに影響します。例えば、自宅でスマートフォンを操作する場合は、触覚(タッチ)でも音声でも操作ができますが、運転中の車内でカーナビゲーションを操作するなら音声が最も安全な方法となるでしょう。

消費者はどこへ行くにもデジタルデバイスを携帯し、いつでも変わらないユーザーエクスペリエンスを求めます。ですから自然なユーザーエクスペリエンスがユーザーインターフェースの採用ではキーとなるのです。音声、視覚、触覚を複合した多覚的アプローチが最も実際的なソリューションとなることも考えられます。例えば、銀行のATMで自分の口座にアクセスする場合、セキュリティ確保のためには、視覚または触覚インターフェースによる認証が望ましいでしょうが、ユーザーはこれに加えて手を使わない音声インターフェースを使ってATMのメニュー表示を切り替えたいと考えるかもしれません。この場合、設計は慎重にする必要がありますが、複数のユーザーインターフェースを組み合わせることで、自然な多感覚のエクスペリエンスが提供できるかもしれません。

 

VRユーザーインターフェース技術は、Apple、Amazon、Google、Samsungの家電最大手4社に強く影響されています。Appleはキーボードのないスマートフォンの発明によって触覚インターフェースのパイオニアとなり、業界各社はこぞってこれに追従しました。Google Glassの発売は、VR/拡張現実(AR)利用の口火を切り、ゲームおよびマルチメディアエンターテインメント分野で新たなアプリケーションに結び付きました。VRヘッドセットはゲーム用であり、最近は製品や体験を販売するためにも使われているものの、大きくて扱いにくいために長時間の装着には向きません。ユーザーインターフェース設計者はこうした難問に取り組まなければならないわけです。一方、音声は両手をつかわないユーザーインターフェースを提供するので、他の方法よりも自然でスムーズといえます。

音声ユーザーインターフェースは、デジタル機器を音声で操作することが全てです。しかし、ユーザーの訛りや声の大きさといった話し方の違いという、特有の複雑性もあります。さらに音声ユーザーインターフェースをうまく使用するために大切なのが、周囲の様々な騒音の抑制です。エッジコンピューティングやクラウドベースのAIは、スマートホームデバイスの最重要テクノロジーとなりますが、対話型AIという目標実現はまだ遠い先にあります。

ビジネスの見地からは、音声ユーザーインターフェース競争の勝者になるには、AI能力を改善するだけでなく、パートナー企業との強力なエコシステムを構築する必要があります。Amazonはこの戦略の大立者といえるでしょう。このeコマース巨大企業は、Alexa Voice Services(AVS)という音声認識サービスのエコシステムを構築しています。Alexaファンドの出資を受けた企業やサードパーティーのパートナーが、音声をあらゆる場所に普及させる目標を実現させようとしているのです。こうしたパートナーによって、End-to-End音声認識を構築するためのエコシステムが生まれ、音声インターフェース製品をあらゆる所へ浸透させ、そして特にMEMS市場を一変させる、例えば環境に強い圧電マイクロホンのようなハードウェアスタートアップの振興が進められています。

AVSエコシステムとのパートナー連携で使用される環境発電(エネルギーハーベスティング)により、マイクロホンは、消費電力がほぼゼロに近い常時オンを実現できます。このマイクロホンは、音声ユーザーインターフェースをバッテリー駆動のアプリケーションにも広げられます。例えば、TVリモコン、スマートごみ箱、Bluetoothスピーカー、ヘッドセット、アプライアンス、自動車などです。ユニークな音声ユーザーインターフェースの好例がCES 2019に出品されていました。家庭用品のデザイン会社simplehumanの音声で動くスマートごみ箱は、VesperのマイクロホンとAVSを使用しています。ビデオをご覧ください。

将来的には、視覚、ジェスチャー、触覚を組み合わせた多感覚なエクスペリエンスを応用することで、さらに別のデジタルインターフェースが登場するでしょうが、音声ユーザーインターフェースは現状の技術イノベーションの最先端にあります。近い将来にAlexaは夕食の調理を助け、人が操作しなくても、鍋の中が焦げたときは、マイクロホンアレイのついた匂いセンサーを利用してコンロを切ってくれるようになるかもしれません。音声ユーザーインターフェースは、これからもその可能性で私たちを驚かせてくれるでしょう。これからの進展が楽しみでなりません。

 

(初出 SEMI Blog 2019年3月26日)