<<

2021 Aug 13

RTF0.1未満の速度でテキストを音声に変換するニューラル音声合成システム「NeuraVoice2 β」を開発

2017年よりディープラーニングによるEndToEnd音声合成の研究を開始、その後いくつかのバージョンアップを経て、
Real Time Factor(音声データ時間長[sec]/合成にかかる時間[sec])がGPU推論でのベンチマーク0.0227
、CPU推論でのベンチマーク1.1106に達する高速高品質な音声合成システム「NeuraVoice2 β」を開発しました。

PRTimes
https://prtimes.jp/main/html/rd/p/000000004.000054712.html

産経ニュース
https://www.sankei.com/economy/news/210813/prl2108130102-n1.html

ASCII スタートアップ
https://ascii.jp/elem/000/004/065/4065833/

CNET JAPAN
https://japan.cnet.com/release/30579140/





*NeuraVoice2 βの特徴

     
  • ・RTF(Real Time Factor) 0.01~1.1未満*1の、高速で高品質な音声合成。
  •  
  • ・1000兆桁までの数字の正確な読み、上付き文字等の特殊な表記の読みが可能。
  •  
  • ・発話速度や音高、強さを調節可能。
  •  
  • ・ステミング(語幹)への変換、記号を読むかどうか、ストップワードを排除しキーワードのみ読み上げる、など高度な設定が可能。
  •  
  • ・ほぼ同一のアルゴリズムで複数言語への拡張が可能。
  •  
  • ・独自の学習データを用意することで、任意の話者の声や特定の語群を強化した音声を合成可能。


本製品はThinkXで開発を進めている音声ガイドシステムCITYWALKの時期バージョンに用いられる他、
特に通信環境の限定されるエッジデバイス等での状況に応じた
高速な音声合成を必要とする顧客ニーズを中心に提供予定です。

製品の導入または詳細についてはinquiry@thinkxinc.comまでお問い合わせください