組込み向け音声合成ライブラリ
組込み向け音声合成ライブラリ:Inspirium(インスピリアム)
富士通株式会社
新たな最適化素片複合方式による自然な読み上げを実現
任意の漢字仮名混じり文から、自然かつ正確な音声合成を行います。
Inspirium音声合成ライブラリは、組込み機器上で動作するアプリケーションプログラムに、日本語音声合成の機能を提供するC言語インターフェースのライブラリです。
特長
新たな最適化素片複合方式による柔らかな合成音
- 人工的な印象を無くし柔らかな合成音声を実現。
- よく使われる言い回しやフレーズについて人間の音声からその特徴を分析し自然性を向上。
言語辞書の充実による正確な読み上げ
- 17万語の言語辞書を用いて正確な読み。
各種製品での豊富な実績
- 携帯電話、銀行ATM端末などに搭載。
自然かつ正確な読み上げが可能な理由
新たな最適化素片複合方式では、音声合成に用いる音声素片や素片同士を接続する位置を、大量の音声データを用いて最適化することで合成音の劣化を防ぎ、人工的な印象を無くした柔らかな合成音声を実現しました。
通常よく使われる言い回しやフレーズについて、人間の実際の音声からその特徴を分析し、一層の自然性を向上させました。フレーズ追加に当たっては、従来方式よりデータ量を増加させることなく実現しています。
日本語文字列の解析処理では、約17万語以上の標準言語辞書を使って、入力文字列の解析を行います。標準言語辞書だけでは解析できない入力文字列に対応するため、ユーザ言語辞書に単語を登録し、言語解析で用いることもできます。
入力文字列の数字の読み方 (棒読み、桁読み) や、記号の読み方 (読む、読まない)、 区切り方法などを、アプリケーションプログラムから制御することができます。このほかにも、出力する音声データのスピード、ピッチ(声の高さ)、イントネーションの強さ、音量などをアプリケーションプログラムから制御することができます。
