Appleは、AI技術の急速な改善と進展によってSiriの声がより人間の声に近づいたことを研究論文で発表しています。iOS9とiOS11を比べると、Siriの声が飛躍的に改善されているのが明瞭です。
Siriの声で飛躍的に進化したiOS11
SiriはiPhone4S発売時のiOS5で初めて搭載され、音声アシスタントとしてiOSユーザー、Macユーザーのさまざまな操作の手助けを行っています。この秋に正式リリースされるiOS11では、Siriのアニメーション変更やSiriで操作可能なアプリの追加、またSiriの学習機能が進化してユーザーの行動を先読みするなど、より使いやすくなることがわかっています。
そしてiOS11では、Siriの音声がより人間に近い、自然なものになります。AppleのSiri制作チームは(Siriの)新しい声は古いものと比べて明らかな前進があるとし、「iOS11のSiriの声は、人格を持った女性がナチュラルに表現力を持って話す時の声を目指して制作した」と述べています。
機械学習を活用してできた新しいSiriの声
Appleは、近年急速に伸びてきた、人間が求めるものを感知し人間が認識することができる方法で現実化する機械学習を使い、新しいSiriの声を作りました。
とくに機械学習のなかでも脚光をあびている「ニューラルネットワーク」によって、現実世界でのデータを機械に覚えこませます。例えば何千ものラベル化された写真からどのように’猫が見えるか’を生まれながらのように学ばせる、といった方法です。
Appleの機械学習に関するサイトでは、iOS9、iOS10、iOS11の各バージョンでのSiriの音声を視聴できます。聴き比べてみると、iOS9時点では単語ごとにぶつ切りになっていたような音声も、iOS10ではほとんど違和感のない音声となり、iOS11では実際に人間と話しているような発音になっています。
Facebook、Google、Microsoftなど、他のAI技術のリーダーたちはすでに研究結果の論文を次々に発表していますが、秘密主義でよく知られるAppleも、機械学習に関しては情報を明らかにしています。特許や専門的技術などに関する多くの剽窃防止テクノロジーなどが公開されることによって、これからのテクノロジー産業をより進歩させるでしょう。
新しいSiriの声は、来月にも正式リリースが見込まれるiOS11で聴くことができます。
Source:Apple Machine Learning Journal, c/net
Photo:Apple
(tvc)