エーアイの吉田大介社長。音声合成技術「AIトーク」はスマートフォンの普及で需要拡大が見込めそうだ
「政府は年内の取りまとめを目指す『社会保障と税の一体改革』をめぐる議論で…」
パソコンからお堅い政治ニュースを読み上げる声が流れる。非常に滑らかな口調だが、よく聞くと何かおかしい。その声がテレビでおなじみの俳優、森本レオさんの声だとすぐにわかったからだ。
なぜ森本さんがニュースを? もちろん森本さん本人が読み上げているわけではく、パソコンで打ち込んだニュースのテキストを音声に変換したもの。ITベンチャー、エーアイ(東京都文京区)の先進的な音声合成技術「AITalk」(AIトーク)の成せる技だ。
音声への変換技術は特に珍しいものではないが、AIトークの優れた点は、平板で“機械的”なところを感じさせない、自然で流れるような話しぶりを実現したこと。さらに、3~5時間程度録音するだけで、誰の声でもそっくりに再現できる点が、従来技術を圧倒している。
普及を目指す市場について、同社の吉田大介社長は「社会インフラとエンターテインメントの分野だ」と意気込む。
社会インフラとしては、すでに防災行政無線への導入実績を積み上げている。東日本大震災でもクローズアップされたが、これまでは災害時に人が直接話したり、録音した声を流すのが一般的。ただ、「意外とゆっくり同じスピードで聞き取りやすく話すのは難しい」(吉田社長)。AIトークの評判は広がり、入札仕様書に音声合成技術を盛り込む自治体も増えてきたという。
エンターテインメント分野では、インターネットの広告キャンペーンでの活用が先行。誰もがメールで好きなテキストを打ち込み、森本レオさんの“声”がそれを読み上げてくれるというKDDIのキャンペーンに採用されるなど、人気は上々だ。
独自の技術として開発を始めてから5年。改良を重ね、女性5人、男性2人、男の子1人、女の子1人の合計9人の声を標準装備した。「来年1月にはさらに2人増える」(同)。さまざまなソフトに組み込めるよう技術をライセンス販売しており、現在はゲームソフト会社が採用してゲームの開発を進めているほか、スマートフォン(高機能携帯電話)のアプリへの導入も始まった。
個人向けの簡易版もあり、例えば自分の声で文書を読み上げたいという企業の社長や、どうしても自分の声を残したいという人向けに、150文書を読み上げるだけで、その人の声を合成できるサービスも提供する。
今後の課題は「より小型化しつつ音質を高めることと、個人の声を合成するプロセスのコストダウン」(同)。技術に一層磨きをかけ、近い将来に年商5億円という目標を達成したい考えだ。(池誠二郎)
「フジサンケイビジネスアイ」