エーアイ(東京都文京区)は人工的に合成した音声を使い、さまざまな文章を顧客の好みの声に自動変換して読み上げるサービスを展開している。音声の素材には実際の人の声を活用。自然で聞き取りやすいと評判を呼び、スマートフォンのアプリやロボット、地方自治体の防災放送といった幅広い分野で利用されている。
企業をはじめとした顧客は、男性や女性、子供などタイプが異なる15種類の既製の声から選べるほか、自分や著名人、声優らの声を収録してオリジナルの音声を作成することも可能だ。
スタジオなどで決まった文章を読んでもらい、声を録音。声質や抑揚を細かく解析してデータベース化することで、文章を入力すれば収録した人物に近い話し方の音声に自動変換できる。
吉田大介社長は研究機関に勤めていた際、音声合成を利用した文章の読み上げ技術に出合い、2003年に会社を設立した。しかし「当初は読み上げ方がスムーズではなく、利用は広がらなかった」。
新たなシステム開発や音質などの改良を繰り返した結果、5年ほど前から注文が増えてきた。特に音声で受け答えや操作ができるスマホの普及や、スマホ向けのゲームアプリなど音声を使うサービスが広がっていることで需要が拡大しているという。
ソフトバンクの人型ロボット「Pepper(ペッパー)」の音声にも採用。東日本大震災を機に重要性が見直されている防災放送でも「人が直接読み上げるよりも、落ち着いていて聞き取りやすい」と好評で、採用する自治体が増えている。
英語など14の外国語にも対応している。訪日観光客の増加や東京五輪開催で需要増が見込まれることから、来年3月までに36カ国語まで対象を広げる方針という。