<<
2021 Aug 13
RTF0.1未満の速度でテキストを音声に変換するニューラル音声合成システム「NeuraVoice2 β」を開発
2017年よりディープラーニングによるEndToEnd音声合成の研究を開始、その後いくつかのバージョンアップを経て、
Real Time Factor(音声データ時間長[sec]/合成にかかる時間[sec])がGPU推論でのベンチマーク0.0227
、CPU推論でのベンチマーク1.1106に達する高速高品質な音声合成システム「NeuraVoice2 β」を開発しました。
PRTimes https://prtimes.jp/main/html/rd/p/000000004.000054712.html
産経ニュース https://www.sankei.com/economy/news/210813/prl2108130102-n1.html
ASCII スタートアップ https://ascii.jp/elem/000/004/065/4065833/
CNET JAPAN https://japan.cnet.com/release/30579140/
本製品はThinkXで開発を進めている音声ガイドシステムCITYWALKの時期バージョンに用いられる他、
特に通信環境の限定されるエッジデバイス等での状況に応じた高速な音声合成を必要とする顧客ニーズを中心に提供予定です。
製品の導入または詳細についてはinquiry@thinkxinc.comまでお問い合わせください
、CPU推論でのベンチマーク1.1106に達する高速高品質な音声合成システム「NeuraVoice2 β」を開発しました。
PRTimes https://prtimes.jp/main/html/rd/p/000000004.000054712.html
産経ニュース https://www.sankei.com/economy/news/210813/prl2108130102-n1.html
ASCII スタートアップ https://ascii.jp/elem/000/004/065/4065833/
CNET JAPAN https://japan.cnet.com/release/30579140/
*NeuraVoice2 βの特徴
- ・RTF(Real Time Factor) 0.01~1.1未満*1の、高速で高品質な音声合成。
- ・1000兆桁までの数字の正確な読み、上付き文字等の特殊な表記の読みが可能。
- ・発話速度や音高、強さを調節可能。
- ・ステミング(語幹)への変換、記号を読むかどうか、ストップワードを排除しキーワードのみ読み上げる、など高度な設定が可能。
- ・ほぼ同一のアルゴリズムで複数言語への拡張が可能。
- ・独自の学習データを用意することで、任意の話者の声や特定の語群を強化した音声を合成可能。