Interview

オフィスにFairy I/Oがいて、中の妖精がビジネスを手伝うような体験を提供したい – Fairy Devices株式会社 藤野真人

text by : 編集部
photo   : 編集部,Fairy Devices株式会社

Amazon echo、google home、LINE WAVE、立て続けにスマートスピーカーが発表され、急速に注目を集める音声アシスタント分野。
自室のソファに座りながら商品を購入し、音楽を再生する未来は快適かもしれない。その頃仕事はどれだけ効率化出来ているのか?いつまで文字をタイピングしたりメモを取る必要があるのか?
BtoBに特化した音声解析・認識技術とその未来像について、Fairy Devices社の藤野さんに伺いました。


■「ビジネス利用に特化した音声アシスタントは、世界を変える可能性を持っている」


―従来のmimi®という音声認識・解析ソフトウェア技術に加え、今年スマートスピーカーのFairy I/O™ Tumbler を発売した背景を教えて頂けますか?

mimi®の性能を最大限に活かすため、そしてハードウェアのレイヤーから作る必要が増してきたからです。
例えば、数メートル先からの発話を認識すること、スマートスピーカーから音楽が鳴っているときでもこちらが喋った内容をマイクが拾わなければいけないこと、こういった実環境での性能を担保するために、音声入出力ってところの最適化、言い換えれば後段の認識処理を深く理解した上で設計されたハードウェアが必要になってきました。

そしてgoogle homeやAmazon echoは一般生活者向けのため、僕らのようなBtoB活用を前提として企業の受付や会議での議事録、ビジネス向けの自動翻訳などにはまだ簡単には使えません。
業務用のスマートスピーカーが無いなら自分たちで作ろうという判断です。もちろん、音声入出力ハードウェアの形は、スマートスピーカー型に限るものではありません。Tumblerはあくまでも第一弾ハードウェアです。

 

―実際発売してから数か月経ちました。反響の大きい業界を教えてください。

SIerさんですね。
大手のSIerさんが興味を持って頂いて、自分たちが既に提供している企業向けソリューションに僕らのFairy I/O™を使うことで更にこういうサービスが出来るのでは?という反応が多いですね。

例えば金融業界に強いSIerさんが「金融機関の窓口に設置して業務効率を高めよう」とか、自治体に設置してもらって会議の議事録に使ってみようとか。
SIerさんそれぞれ強みがありますので、そこと組み合わせていくイメージです。

僕らとしても、直接エンドユーザーの方にサービスを提供するのではなく、こういったソリューションパートナーの方を経由して世の中に広めたいので、興味を持って頂けるのはとても有難いです。

 

―今GoogleやAmazonの名前も出てきましたが、今年急速に音声アシスタント分野での製品リリースや参入が増えていますよね。2007年から取り組んでいてどう感じますか?

僕らにとってポジティブな面は、企業内で新規事業を検討される方が音声アシスタントの将来的な可能性に気付いてくれる点です。
自分たちの業務が音声アシスタントで何か革新できるかも、飛躍的に改善できるかも。と。

一昔前までは、例えばiPhoneのSiriのように生活の中でちょっと使うモノしかなかった。
あれだけをみて「自分たちのビジネスに使えるかも」という感覚は抱きにくかったのが、今は僕らが今後の製品・サービスのロードマップの話をすると耳を傾けてくれる。
こちらが声を大にして、説得を試みなくてもいい。文字通り、世の中の大きな流れの変化を感じます。

fairy_1
2017年9月に提供開始されたFairy I/O™ Tumbler
開発者向けに自社提供するmimi® と入念に統合されたハードウェアとなっている。

 


■googleやamazonは競合というよりパートナー。toBに特化した僕らの存在意義もある。


―世の中の理解が進んで注目されると、逆に競合が増えたりもするのかなと思いますが実際はいかがですか?

あまり関係ないです。
ユーザー体験を重視した「音声×機械学習」というジャンルで長く取り組んできた結果、国内ではかなり認知されていますし、実績も着実に積み重ねてきています。

大事なのは競合云々ではなく、「Fairy I/O™を使うお客様にとって最適な技術を提供できる」ことなので、今年発表したFairy I/O™もオープンなプラットフォームとしています。

僕らが持っていない技術を持つ会社さんがいたらテクノロジーパートナーとして迎え、その技術をFairy I/O™の中に入れて提供し、結果的に顧客にいいものが提供される、それが第一ですから。

 

―国内に限らず、8月にgoogleのテクノロジーパートナーに認定された点からも海外企業とも同様の考え方でしょうか。

そうですね、そもそもBtoB向け、BtoC向けという点で別れていると思います。
googleやamazonの音声アシスタントは一般消費者を重視していて、狙っている市場自体が違うという考えです。

ご指摘の通りグーグルとはテクノロジーパートナーの契約をしていますから、我々の製品を通じてグーグルの技術も利用することができますし、今後もしグーグルが「google home for bussiness」といった業務用サービスを提供開始するのであれば、その機能を僕らのFairy I/O™に組み込めばいいと考えています。

 

―Fairy I/O™発表時のプレスリリースで「大手IT企業が牽引するスマートスピーカーのエコシステムが業界全体の発展に与える影響」について言及されていました。これもハードウェアを創る動機の1つですか?

よく読んでいますね(笑)、その通りで僕らがFairy I/Oを作る大きな動機です。
Amazonやgoogleが提供するサービスはある側面において、非常に優れたものですが、それ「だけ」でいいのかなと。

実際にamazon echoを使ってみると色々技術的な制限もあり、工夫1つで使う側の体験性が劇的に変わるのに、と残念に思うことも多い。他社技術と深いところで組み合わせることができないことや、重要なログが開示されないために有効に利用できないことなど、様々な制約を受けることになる。

現実的には、今後消費者向けの大手メーカーはそろってamazon echo等に対応させていくでしょう、ですが「amazon echoでは足りないもの」を提供する独自エージェントが一つくらいあってもいいのではと考えました。

第3極の存在として、BtoBを主戦場とした僕らの存在意義があると考えています。

fairy_2
Fairy Devices社のコア技術ともいえるmimi®
音声対話システムのためのクラウドAPI システムとして提供されており、
オンライン音声認識、環境音認識、話者の識別、認識精度を高めるためのフロントエンド処理技術が搭載されている。

 


■ビジネスの現場で「声に出して記録に残ったほうが早い」ものはとても多い


―BtoBメインで取り組む会社は多くありません、ビジネス向けの音声認識・解析技術に取り組む面白さについて教えてください。

ビジネス向けって本当に「ちょっとしたこと」でとてつもない業務改善の可能性があるなと思っています。仕事でスマートフォンを活用する人はかなり増えましたが、実は地味に面倒くさい、直接喋った方が早いタスクも多いのではないでしょうか。

ビジネスシーンにおいて、口頭での指示や会議など声に出して伝えるけどログが残らないものはたくさんあります。音声自動翻訳もそう。その延長線上に「喋ったら記録に残るし動いてくれる」が実現できればかなり業務効率が挙げられると思います。

さらに進めて、アクチュエーターとの連動が為されれば、もう言うまでもありませんね。「この荷物を隣のあそこに運んでおいて」みたいなことが出来ると、倉庫や市場などで飛躍的に便利になります。

 

―音声自動翻訳の話が出たのでお聞きします。海外展開はどのように考えていますか?

東南アジアの市場はかなり意識していますね。
理由はいくつかありますが、東南アジア、インドも含めてAmazon以外のかなり大きいEC事業者がいます。

彼らが何らかの形で音声アシスタントデバイスを欲した時、僕らが技術提供できる可能性があるなと。
僕たち自身がBtoCをやる可能性は低いですが、事業者の裏側で支援したり、基幹部分を提供して各事業者がやりたいことを「どうぞうちのデバイスを元にいくらでも面白い機能乗せてください」ってことはイメージしていますね。

fairy_03
メイン事業のほかに、自由なラボ活動も行われている。
画像は「人間らしい演奏表現の実現」を目指す自立演奏システムGHOST PLAY

 


■会社の共通概念は「fairy inside」、その内部に妖精がいると感じられるか?


―社名の「フェアリーデバイセズ」には音声技術に関する単語は入っていません、これは音声技術よりも広く捉えた会社のビジョンが含まれているのでしょうか。

社内で共有しているのは「fairy inside」という概念です。
「まるで、中に妖精がいて動かしているようだね」っていう。
インターフェースが素晴らしいかどうかを指しており、「音声対話で動くデバイス」もその一つです。

さきほどビジネス利用で「ちょっとこの荷物あっちに運んでおいて」の例を挙げました、実際このタスクを実現するには裏側で複合的技術が必要です。が、実現したら妖精がやってくれたかのような感覚がある。そこのクオリティを磨くには内部の技術にかなり入っていかなければいいものはできません。

 

―理念や共通概念を元に、所属メンバーに求めている資質はありますか?

自発的に「こういう事が出来たら面白い」と考えることが出来るかどうかですね。
妖精が中にいるよう体験性があるかとか、この思考・感覚的な部分です。

勿論、こういう課題をこうやって解決したい、と言うアカデミックな基礎も極めて大事ですが、そこで止まらず実現したい夢まであるかどうか。
僕らのラボには機械がバイオリンを演奏するという「楽器」、ゴーストプレイというものがあります、これによって、何か課題が解決されたかというと微妙ですが、それをやりたい人は実現出来たら素敵だよね、って本気で思っている。そんなに作りたいならやりなよ、一緒にやろうよと言う話です。最近では、ゴーストプレイと人間が音声対話するという実験的作品「Undifferenciated Dialog」を作りました。

「あなたがフェアリーデバイセズという会社の器を使って実現したいことはなに?」って聞いたとき、色んなことを語れる人かどうか。その時に「この人は本気だな」と思える答えが返ってくる人は好感を持ちますね、時として感動することすらあります。新しいメンバーとの出会い、それこそが、会社を経営する上で、一番の醍醐味ではないかと思っています。

mimi®は既に、搭載製品台数は 180 万台に至っています。2020年までの事業計画として、我々のFairy I/O™リーズについても、100万台出荷という目標をおいています。
先日発表したスマートスピーカー型以外のモノを含め、その頃には、家にはAmazon echoが置いてあるけど、オフィスや作業場には何かしらの形をしたFairy I/O™がいて、まるで中にいる妖精が仕事を手伝ってくれる、そういう未来像を考えています。

 


Fairy Devices株式会社
藤野真人 代表取締役社長
1981年埼玉県生まれ。2005年東京大学農学部生物情報工学研究室卒業、2007年東京大学大学院医学系研究科医科学専攻退学。
東京大学在学中に大学発創薬ベンチャー企業の創業メンバー(研究開発担当)として立ち上げに参画。同大学院医学系研究科に進学する傍ら、同社経営体制の変更に伴い代表取締役に就任するも、大学院課程での実習中の経験から「人の心に寄り添うモノの温かさ」に気付き、大学院を中退し、自ら起業することを決意。「使う人の心を温かくする一助となる技術開発」をテーマに、フェアリーデバイセズ株式会社を2007年設立。

インタビュー:波多野智也(アスタミューゼ株式会社)