JPH037999A - Voice output device - Google Patents
Voice output deviceInfo
- Publication number
- JPH037999A JPH037999A JP1142406A JP14240689A JPH037999A JP H037999 A JPH037999 A JP H037999A JP 1142406 A JP1142406 A JP 1142406A JP 14240689 A JP14240689 A JP 14240689A JP H037999 A JPH037999 A JP H037999A
- Authority
- JP
- Japan
- Prior art keywords
- variable
- words
- word
- fixed
- speech
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002194 synthesizing effect Effects 0.000 claims abstract description 6
- 238000001308 synthesis method Methods 0.000 claims description 14
- 230000015572 biosynthetic process Effects 0.000 abstract description 36
- 238000003786 synthesis reaction Methods 0.000 abstract description 36
- 235000016496 Panda oleosa Nutrition 0.000 abstract description 9
- 240000000220 Panda oleosa Species 0.000 abstract description 9
- 238000001514 detection method Methods 0.000 abstract description 8
- 238000006243 chemical reaction Methods 0.000 abstract description 7
- 238000009877 rendering Methods 0.000 abstract 2
- 238000010586 diagram Methods 0.000 description 6
- 238000000034 method Methods 0.000 description 6
- 239000000284 extract Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 239000002131 composite material Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、固定語の合成音声と、可変語の合成音声とを
組み合わせて出力する音声出力装置に関するものである
。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a speech output device that outputs a combination of synthesized speech of fixed words and synthesized speech of variable words.
[従来の技術]
従来、この種の音声出力装置には、第4図に示すように
、テキスト合成方式により固定語も可変語も合成するも
の、及び第5図に示すようにパラメータ編集合成方式に
より固定語を合成し、テキスト合成方式により可変語を
合成するものなどがあった。[Prior Art] Conventionally, this type of speech output device includes one that synthesizes fixed words and variable words using a text synthesis method, as shown in FIG. 4, and one that uses a parameter editing synthesis method as shown in FIG. Some synthesized fixed words using a text synthesis method, and synthesized variable words using a text synthesis method.
第4図に示す従来例では、文章を文章解析部1に入力し
、この文章解析部1では構文解析、意味解析などの言語
処理を行った後に、漢字の音訓表、熟語の読みなどを登
録した読み辞書2を参照しながら読みがな列を作成し、
この読みがな列からテキスト合成部3で、がなの音声パ
ラメータ4を用いて音声パラメータ時系列を生成し、更
にこの音声パラメータ時系列を背戸変換部5で合成音声
信号に変換させるのである。この従来例の場合には固定
語もテキスト合成方式により合成するため、実質的に固
定語は可変語と同じ扱いになり、無限種類の固定語を出
力することができる。In the conventional example shown in Fig. 4, a sentence is input to the sentence analysis unit 1, which performs linguistic processing such as syntactic analysis and semantic analysis, and then registers the phonetic table of kanji, the pronunciation of compound words, etc. Create a row of readings while referring to the reading dictionary 2.
From this reading sequence, a text synthesis section 3 generates a speech parameter time series using a speech parameter 4 of the gana, and a seido conversion section 5 converts this speech parameter time series into a synthesized speech signal. In this conventional example, fixed words are also synthesized using the text synthesis method, so fixed words are essentially treated the same as variable words, and an infinite variety of fixed words can be output.
また、第5図に示す従来例では、入力される文章を文章
解析部1で構文解析、意味解析を行った後、固定語検出
部6で固定語か可変語かを検出して可変語であればテキ
スト合成部3と、かな等の音声パラメータ4を用いて音
声パラメータ時系列情報に変換し、固定語の場合には固
定語音声パラメータ辞書7を用いてパラメータ編集合成
部8で音声パラ−メータ時系列を生成し、更に固定語の
音声パラ−メータ時系列と、可変語の音声パラ−メータ
時系列とを切り替え部9によって切り替えながら音声変
換部5へ出力するようになっている。In addition, in the conventional example shown in FIG. 5, after the text analysis unit 1 performs syntactic and semantic analysis on the input sentence, the fixed word detection unit 6 detects whether it is a fixed word or a variable word. If the word is a fixed word, it is converted into speech parameter time series information using the text synthesis section 3 and the speech parameter 4 such as kana.If it is a fixed word, the speech parameter is converted into speech parameter time series information using the fixed word speech parameter dictionary 7 and the parameter editing synthesis section 8. A meter time series is generated, and the speech parameter time series of fixed words and the speech parameter time series of variable words are outputted to the speech conversion section 5 while being switched by a switching section 9.
また固定語と可変語との接続部分の不自然さを無くすた
めに固定語の品質を品質整合部10で整合するようにな
っており、固定語の品質はテキスト合成方式によるもの
と比較すると明瞭性及び自然性がともに高いものとなる
。In addition, in order to eliminate unnaturalness at the connection between fixed words and variable words, the quality of the fixed words is matched by the quality matching unit 10, and the quality of the fixed words is clear when compared with the text synthesis method. Both nature and naturalness will be high.
[発明が解決しようとする課題]
ところで上記第4図図示の従来例は現在のテキスト合成
技術ではテキスト合成の規則が不十分であるため、その
合成音声の品質、特に自然性に関する品質が満足できる
ものとは言い難いという問題点があった。[Problems to be Solved by the Invention] By the way, in the conventional example shown in FIG. 4 above, the text synthesis rules are insufficient with the current text synthesis technology, so the quality of the synthesized speech, especially the quality regarding naturalness, is satisfactory. There was a problem that it was difficult to describe.
また第5図図示の従来例では、固定語音声パラメータ辞
書7に格納されるべき固定語のデータ量が大きいため、
格納領域の制限から固定語の長さや種類が限られてしま
うという問題があった6更に、固定語の品質と可変語の
品質が大きく異なるため生ずる固定語と可変語の接続部
分の不自然さを無くするなめに、固定語の品質を落とし
て可変語の品質に近付ける品質整合部10を設けなけれ
ばならないという問題点があった。例えば音声パラメー
タの内音声の高さに関するデータは、テキスト合成部3
の出力を使う方法などがあった。Furthermore, in the conventional example shown in FIG. 5, since the amount of fixed word data to be stored in the fixed word speech parameter dictionary 7 is large,
There was a problem in that the length and type of fixed words were limited due to storage space limitations6.Furthermore, the quality of fixed words and the quality of variable words were significantly different, resulting in unnatural connections between fixed words and variable words. In order to eliminate this problem, it is necessary to provide a quality matching unit 10 that lowers the quality of fixed words to bring them closer to the quality of variable words. For example, among the audio parameters, data regarding the pitch of the audio is stored in the text synthesis unit 3.
There was a way to use the output of
本発明は上述の問題点に鑑みて為されたもので、その目
的とするところは固定語の品質が高くて、固定語と可変
語の接続部が自然で、しかも固定語辞書のデータ量も少
ない音声出力装置を提供するにある。The present invention was made in view of the above-mentioned problems, and its purpose is to provide high quality fixed words, natural connections between fixed words and variable words, and to reduce the amount of data in fixed word dictionaries. There are fewer audio output devices to provide.
併せて請求項2記載の発明は可変語の種類が限定され、
しかも変更がしばしば行われる場合に用いることができ
る音声出力装置を提供することを目的とし、さらに請求
項3記載の発明は請求項2記載の発明において、可変語
の変更が容易に行える音声出力装置を、請求項4記載の
発明は請求項2記載の発鳴において、装置の小型、軽量
化が図れる音声出力装置を提供することを夫々目的とす
る。In addition, in the invention according to claim 2, the types of variable words are limited,
Moreover, it is an object of the present invention to provide a voice output device that can be used when changes are frequently made, and the invention according to claim 3 further provides a voice output device that can easily change variable words in the invention according to claim 2. It is an object of the invention according to claim 4 to provide a sound output device which can be made smaller and lighter in sound generation according to claim 2.
[課題を解決するための手段]
本発明は固定語と、可変語とを組み合わせて出力する音
声出力装置において、規則合成方式により固定語を合成
する手段と、テキスト合成方式により可変語を合成する
手段を持つものであり、第1図に示すように入力される
文章を文章解析部1で解析した後固定語検出部6で固定
語なのか、可変語なのかを検出して固定語ならば規則合
成部11で規則合成方式により固定語を合成して音声パ
ラメータ時系列を生成させ、可変語ならばテキスト合成
部3でテキスト合成方式により可変語を合成して音声パ
ラメータ時系列を生成させ、これら音声パラメータ時系
列を切り替え部9によって切り替えながら音声変換部5
へ出力し、合成音声信号に変換するようになっている。[Means for Solving the Problems] The present invention provides a speech output device that outputs a combination of fixed words and variable words. As shown in Figure 1, after an input sentence is analyzed by a sentence analysis section 1, a fixed word detection section 6 detects whether it is a fixed word or a variable word. A rule synthesis unit 11 synthesizes fixed words using a rule synthesis method to generate a speech parameter time series, and if it is a variable word, a text synthesis unit 3 synthesizes variable words using a text synthesis method to generate a speech parameter time series. While switching these audio parameter time series by the switching unit 9, the audio converting unit 5
It is designed to be output to and converted into a synthesized audio signal.
請求項2記載の発明は請求項1記載の発明において、テ
キスト合成された可変語を登録する可変語登録部と、可
変語と固定語とを組み合わせて出力する組み合わせ音声
出力部とを備えたものであり、請求項3記載の発明は請
求項2記載の発明において、可変語登録部と組み合わせ
音声出力部を同一の物理的構成要素内に持つものであり
、また請求項4記載の発明は請求項2記載の発明におい
て、可変語登録部と組み合わせ音声出力部を相い異なる
物理的構成要素内に持つものである6[作用]
而して本発明によれば固定語を規則合成により合成する
ため固定語の品質が高くなり、その上固定語辞書のデー
タ量を少なく、固定語の可変語との接続部も自然な合成
音声が得ることができる。The invention set forth in claim 2 is the invention set forth in claim 1, comprising a variable word registration unit that registers variable words that have been text synthesized, and a combination voice output unit that outputs a combination of variable words and fixed words. The invention according to claim 3 is the invention according to claim 2, in which the variable word registration section and the combination voice output section are included in the same physical component, and the invention according to claim 4 is the invention according to claim 2. In the invention described in item 2, the variable word registration unit and the combination voice output unit are included in different physical components.6 [Operation] According to the present invention, fixed words are synthesized by rule synthesis. Therefore, the quality of fixed words is high, the amount of data in the fixed word dictionary is reduced, and natural synthesized speech can be obtained at the connection between fixed words and variable words.
[実施例] 以下本発明を実施例により説明する。[Example] The present invention will be explained below with reference to Examples.
第2図請求項1記載の本発明の実施例を示しており、こ
の実施例は定形の文からなる固定語と非定形の文からな
る可変語とを組み合わせた文章を読み上げる音声出力装
置を構成する。Fig. 2 shows an embodiment of the present invention as set forth in claim 1, and this embodiment constitutes a voice output device that reads aloud a sentence that is a combination of fixed words consisting of fixed sentences and variable words consisting of non-fixed sentences. do.
この実施例では入力される文章に現れる単語とその読み
とを対応付けて登録した読み辞書2を参照しながら入力
文章の読みがな列を文章解析部1で作成し、この読みが
な列を固定語検出部6で固定語辞書12を参照しながら
固定語と可変語とに切り分け、可変語の読みがな列をテ
キスト合成部3に入力し、固定語の読みがな列を規則合
成部11に入力する。In this embodiment, the sentence analysis unit 1 creates a pronunciation sequence of an input sentence while referring to a pronunciation dictionary 2 in which words that appear in input sentences and their pronunciations are registered in association with each other. The fixed word detection section 6 separates fixed words and variable words while referring to the fixed word dictionary 12, inputs the reading string of the variable word to the text synthesis section 3, and inputs the reading string of the fixed word into the rule synthesis section. 11.
固定語辞書12は固定語の読みと、規則合成データとを
対応付けて登録したもので、規則合成データとしてかな
の種類、かなの長さ、強さ、高さなどがある。The fixed word dictionary 12 registers the pronunciations of fixed words in association with rule composition data, and the rule composition data includes types of kana, length, strength, height, etc. of kana.
規則合成部11は固定語の読みがな列について、音声パ
ラメータ時系列を生成するものであり、テキスト合成部
3は可変語について、その読みがな列から音声パラメー
タ時系列を生成するものであり、これらの音声パラメー
タ時系列の生成は例えば日本語のかな音節と、各かな音
節の音声を合成するためのPARCORパラメータ時系
列などが対応付けられて登録されている音声パラメータ
を用いて行なわれる。The rule synthesis unit 11 generates a speech parameter time series for a fixed word's pronunciation sequence, and the text synthesis unit 3 generates a speech parameter time series for a variable word from the pronunciation sequence. The generation of these audio parameter time series is performed using audio parameters registered in association with, for example, Japanese kana syllables and PARCOR parameter time series for synthesizing the audio of each kana syllable.
切り替え部9は規則合成された固定語の音声パラメータ
時系列と、テキスト合成された可変語の音声パラメータ
時系列とを固定語検出部6の検出に対応して音声変換部
5に出力させるものであり、音声変換部5は入力する音
声パラメータ時系列を合成音声信号に変換する。The switching section 9 outputs the regularly synthesized fixed word speech parameter time series and the text synthesized variable word speech parameter time series to the speech conversion section 5 in response to the detection by the fixed word detection section 6. The speech converter 5 converts the input speech parameter time series into a synthesized speech signal.
次に本実施例の動作を説明する。Next, the operation of this embodiment will be explained.
まず入力された文章は、文章解析部1において読みがな
列に変換され、その変換された読みがな列は固定語検出
部6で固定語と可変語とに切り分けられる。First, an input sentence is converted into a string of pronunciations in a sentence analysis section 1, and the converted string of pronunciations is separated into fixed words and variable words by a fixed word detection section 6.
その内固定語は規則合成部11により固定語辞書12か
らその規則合成データが読み出されて、音声パラメータ
時系列に変換される。ここで固定辞書12は、毎秒約5
モーラの音声を1秒分合成するために約140ビツト必
要であるが、第5図従来例の固定語音声パラメータ辞書
7のように1秒の合成音声のために約2400ビツトも
必要とするものに比べて非常にコンパクトに構成できる
。For fixed words, the rule synthesis unit 11 reads out the rule synthesis data from the fixed word dictionary 12 and converts them into speech parameter time series. Here, the fixed dictionary 12 has a rate of about 5 times per second.
Approximately 140 bits are required to synthesize one second of Mora's speech, but as in the fixed word speech parameter dictionary 7 of the conventional example shown in Figure 5, approximately 2400 bits are required for one second of synthesized speech. It can be configured very compactly compared to the .
また固定語辞書12中の音声デー!から作られた合成音
声の品質は第4図の従来例によって作られた合成音声の
品質よりも高い。一方可変語の読みがな列はテキスト合
成部3において、音声パラメータ時系列に変換される。Also, audio day in fixed word dictionary 12! The quality of the synthesized speech produced by the conventional example shown in FIG. 4 is higher than that of the synthesized speech produced by the conventional example shown in FIG. On the other hand, the reading sequence of variable words is converted into a speech parameter time series in the text synthesis section 3.
これらの固定語、可変語の2種類の音声パラメータ時系
列は切り替え部9によって接続されることになるが、両
者間には著しい品質の差がないため、接続部分も自然と
なり、第5図の従来例の品質整合部10が不要となる。These two types of speech parameter time series, fixed words and variable words, are connected by the switching unit 9, but since there is no significant difference in quality between them, the connection becomes natural, and as shown in FIG. The quality matching section 10 of the conventional example becomes unnecessary.
尚可変語の音声の高さを固定語の高さに合わせて定数倍
するなど、可変語の音声パラメータ時系列を固定語の音
声パラメータ時系列に合わせて変形することにより、可
変語と固定語との接続部分を更に自然とすることができ
る。In addition, by transforming the speech parameter time series of variable words to match the speech parameter time series of fixed words, such as multiplying the speech height of variable words by a constant to match the height of fixed words, variable words and fixed words can be The connection between the two can be made more natural.
そして切り替え部9で接続された音声パラメータ時系列
は音声変換部5により合成音声信号に変換される。The audio parameter time series connected by the switching unit 9 is converted into a synthesized audio signal by the audio conversion unit 5.
第3図(a>(b)は請求項2〜4記載の発明にかかる
実施例を示しており、この実施例は可変語の種類がある
程度限定されているものの、可変語の変更がしばしば発
生するため、或は可変語の合成音声の品質が高く求めら
れないために、その合成にテキスト合成方式を用いる場
合の音声出力装置を構成するもので、上記第2図実施例
ではテキスト合成を音声出力時に行っていたが、本実施
例は第3図(a)に示す可変語登録部13において行い
、その出力を規則合成データの形式で可変語辞書14に
登録しておくようにし、この可変語辞書14を第3図(
b)の組み合わせ音声出力部15に用いる1組み合わせ
音声出力部15は文章を入力させるのではなく、可変語
と固定語の各文章に付けられた文番号を入力してするよ
うにしたもので、文番号に対応して音声選択部16によ
り固定語辞書12と可変語登録済みの可変語辞書14と
から規則合成データを取り出すのである。FIG. 3 (a>(b) shows an embodiment according to the invention according to claims 2 to 4, and although the types of variable words are limited to some extent in this embodiment, changes in variable words often occur. This constitutes a speech output device when a text synthesis method is used for synthesis, or because the quality of the synthesized speech of variable words is not required to be high.In the embodiment shown in FIG. This is done at the time of output, but in this embodiment, it is done in the variable word registration section 13 shown in FIG. The word dictionary 14 is shown in Figure 3 (
The single combination voice output unit 15 used in the combination voice output unit 15 in b) is designed not to input sentences, but to input sentence numbers assigned to each sentence of variable words and fixed words. The voice selection unit 16 extracts rule synthesis data from the fixed word dictionary 12 and the variable word dictionary 14 in which variable words have been registered in accordance with the sentence number.
次に本実施例の動作を説明する。Next, the operation of this embodiment will be explained.
まず可変語登録部13において、限定されている可変語
を登録する。この場合入力文章を文章解析部1゛で読み
辞書2′を参照しながら読みがな列を生成し、この読み
がな列をテキスト合成を行い可変語用の規則合成データ
を出力する規則合成データ生成部3′で規則合成データ
に変換して可変語辞書14に登録する。ここで可変語辞
書14に登録するデータが音声パラメータ時系列の形式
ではなく、規則合成データの形式で登録する理由は、規
則合成データは読みがな列から音声パラメータ時系列を
生成するテキスト合成の過程の途中で得られるデータで
あるため、規則合成データから合成した音声と、音声パ
ラメータ時系列から合成された音声とは同品質であるか
らであり、しかもこの規則合成データは音声パラメータ
時系列よりコンパクトであるなめ可変語辞書14を構成
するメモリの容量が少なく済む。First, the variable word registration unit 13 registers limited variable words. In this case, the input sentence is read by the text analysis unit 1' and a string of pronunciations is generated while referring to the dictionary 2', and this string of pronunciations is synthesized into text and rule synthesis data for outputting rule synthesis data for variable words is generated. The generation unit 3' converts the data into rule composite data and registers it in the variable word dictionary 14. The reason why the data to be registered in the variable word dictionary 14 is not in the form of a speech parameter time series but in the form of rule synthesis data is that the rule synthesis data is a text synthesis method that generates a speech parameter time series from a reading string. Because the data is obtained in the middle of the process, speech synthesized from the rule synthesis data and speech synthesized from the speech parameter time series are of the same quality, and furthermore, this rule synthesis data is The capacity of the memory constituting the compact name variable word dictionary 14 is small.
さて組み合わせ音声出力部15では入力される文番号に
対応して音声選択部16により固定語辞書12と可変語
登録済みの可変語辞書14とから規則合成データを取り
出すのである。ここで可変語の文番号と固定語の文番号
とを識別する方法としては、特定番号以上を可変語に、
特定番号より小さい文番号を固定語に割り付ける方法や
、可変語の文番号を括弧でくくり、固定語の文番号を括
弧無しで入力して識別ができるようにした方法などがあ
る。また文番号と規則合成データの対応を取る方法とし
ては、固定語辞書12、可変語辞書14の中に対応表を
持たせるなどの方法がある。Now, in the combination speech output section 15, the speech selection section 16 extracts rule synthesis data from the fixed word dictionary 12 and the variable word dictionary 14 in which variable words have been registered, in accordance with the input sentence number. Here, the method of distinguishing between the variable word sentence number and the fixed word sentence number is to use a specific number or higher as a variable word,
There are methods such as assigning a sentence number smaller than a specific number to a fixed word, and a method of enclosing the sentence number of a variable word in parentheses and inputting the sentence number of a fixed word without parentheses so that it can be identified. Further, as a method for establishing correspondence between sentence numbers and rule synthesis data, there is a method such as providing a correspondence table in the fixed word dictionary 12 and the variable word dictionary 14.
而して各辞書12.14から読み出した規則合成データ
は規則合成部4において音声パラメータ時系列に変換さ
れ、更に音声変換部5により合成音声信号に変換される
。The rule synthesis data read from each dictionary 12, 14 is converted into a speech parameter time series in the rule synthesis section 4, and further converted into a synthesized speech signal by the speech conversion section 5.
ところで可変語登録部13と組み合わせ音声出力部15
とは同一の物理構成要素内に設けても良く、或は相異な
る物理構成要素内に設けても良く、前者の場合では、可
変語の登録と、可変語と固定語の組み合わせ音声出力と
を容易に切り替えることができて音声の確認が行えるた
め、可変語音声の変更も簡単にでき、後者の場合には規
則合成部11よりも大規模な文章解析部1やテキスト合
成を行う規則合成データ生成部3′を組み合わせ音声出
力部15より分離することができ、そのため音声出力装
置としての構成が簡単となり、小型軽量化が図れる。By the way, the variable word registration section 13 and the combination voice output section 15
may be provided within the same physical component or may be provided within different physical components; in the former case, registration of variable words and audio output of a combination of variable and fixed words may be performed. Since it is easy to switch and check the audio, it is also easy to change the variable word audio. The generating section 3' can be separated from the combined audio output section 15, which simplifies the configuration of the audio output device and allows it to be made smaller and lighter.
尚上記各実施例では音声パラメータにPARCORパラ
メータを用いているが、これに限定されるものではない
。また音声パラメータの単位はCV(Cは子音、■は母
音)以外、VCVやCVCなとでもよい。また規則合成
データは、かなの種類、かなの長さ、強さ、高さとして
いるが、これに限定されるものではなく、また音声出力
装置への入力は上記各実施例では文章や文番号で行って
いるが、これらやこれらの組み合わせに限定されるもの
でなく、例えば第2図実施例において、固定語を対応す
る記号列で指定し、可変語を文章で指定しても良い。In each of the above embodiments, PARCOR parameters are used as audio parameters, but the present invention is not limited to this. Further, the unit of the voice parameter may be VCV or CVC other than CV (C is a consonant, ■ is a vowel). In addition, the rule synthesis data includes the type of kana, the length, strength, and height of the kana, but it is not limited to this, and the input to the audio output device is the sentence and sentence number in each of the above embodiments. However, the present invention is not limited to these or a combination thereof. For example, in the embodiment shown in FIG. 2, fixed words may be specified by corresponding symbol strings, and variable words may be specified by sentences.
[発明の効果]
本発明は固定語と、可変語とを組み合わせて出力する音
声出力装置において、規則合成方式により固定語を合成
する手段と、テキスト合成方式により可変語を合成する
手段を持つものであるから、固定語の品質が高くなって
、固定語と可変語との接続部が自然である合成音声が得
られ、しかも固定語辞書のデータ量も少なくなるという
効果がある。[Effects of the Invention] The present invention provides a speech output device that outputs a combination of fixed words and variable words, which has means for synthesizing fixed words using a rule synthesis method and means for synthesizing variable words using a text synthesis method. Therefore, the quality of fixed words is high, synthetic speech with natural connections between fixed words and variable words can be obtained, and the amount of data in the fixed word dictionary is also reduced.
更に請求項2記載の発明はテキスト合成された可変語を
登録する可変語登録部と、可変語と固定語とを組み合わ
せて出力する組み合わせ音声出力部とを備えたので、可
変語の種想が限定され、しかも変更がしばしば行われる
場合などに有効に用いることができる音声出力装置を実
現でき、また請求項3記載の発明は請求項2記載の発明
において、可変語の変更が容易に行え、請求項4記載の
発明は請求項2記載の発明において、可変語登録部と組
み合わせ音声出力部とを同一の物理的構成要素内に備え
たので、装置の小型、軽量化が図れるという効果がある
。Furthermore, the invention according to claim 2 includes a variable word registration section that registers variable words synthesized from text, and a combination voice output section that outputs a combination of variable words and fixed words, so that the idea of the variable word can be changed. It is possible to realize a voice output device that can be effectively used in cases where the variable word is limited and changes are often made, and the invention according to claim 3 is the invention according to claim 2, in which the variable word can be easily changed. The invention according to claim 4 is the invention according to claim 2, in which the variable word registration section and the combination voice output section are provided in the same physical component, so that the device can be made smaller and lighter. .
第1図は本発明の基本構成図、第2図は本発明の一実施
例の構成図、第3図(a)は本発明の別の実施例の可変
語登録部の構成図、第3図(b)は同上の組み合わせ音
声出力部の構成図、第4図は従来例の構成図、第5図は
別の従来例の構成図である。
1は文章解析部、3はテキスト合成部、5は音声変換部
、6は固定語検出部、11は規則合成部、9は切り替え
部、13は可変語登録部、15は組み合わせ音声出力部
である。1 is a basic configuration diagram of the present invention, FIG. 2 is a configuration diagram of one embodiment of the present invention, FIG. 3(a) is a configuration diagram of a variable word registration section of another embodiment of the present invention, FIG. 4B is a block diagram of the combined audio output section same as above, FIG. 4 is a block diagram of a conventional example, and FIG. 5 is a block diagram of another conventional example. 1 is a text analysis section, 3 is a text synthesis section, 5 is a speech conversion section, 6 is a fixed word detection section, 11 is a rule synthesis section, 9 is a switching section, 13 is a variable word registration section, and 15 is a combination speech output section. be.
Claims (4)
出力装置において、規則合成方式により固定語を合成す
る手段と、テキスト合成方式により可変語を合成する手
段とを持つことを特徴とする音声出力装置。(1) A speech output device that outputs a combination of fixed words and variable words, characterized by having means for synthesizing fixed words by a rule synthesis method and means for synthesizing variable words by a text synthesis method. Audio output device.
部と、可変語と固定語とを組み合わせて出力する組み合
わせ音声出力部とを備えたことを特徴とする請求項1記
載の音声出力装置。(2) The audio output device according to claim 1, further comprising: a variable word registration unit that registers variable words that have been text-synthesized; and a combination audio output unit that outputs a combination of variable words and fixed words. .
物理的構成要素内に備えたことを特徴とする請求項2記
載の音声出力装置。(3) The audio output device according to claim 2, wherein the variable word registration section and the combination audio output section are provided in the same physical component.
なる物理的構成要素内に備えたことを特徴とする請求項
2記載の音声出力装置。(4) The audio output device according to claim 2, wherein the variable word registration section and the combination audio output section are provided in different physical components.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1142406A JPH037999A (en) | 1989-06-05 | 1989-06-05 | Voice output device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1142406A JPH037999A (en) | 1989-06-05 | 1989-06-05 | Voice output device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH037999A true JPH037999A (en) | 1991-01-16 |
Family
ID=15314602
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1142406A Pending JPH037999A (en) | 1989-06-05 | 1989-06-05 | Voice output device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH037999A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2775426A1 (en) | 1998-03-02 | 1999-09-03 | Delsey Soc | Wheeled carrying case |
JP2007212884A (en) * | 2006-02-10 | 2007-08-23 | Fujitsu Ltd | Speech synthesis apparatus, speech synthesis method, and computer program |
CN107871494A (en) * | 2016-09-23 | 2018-04-03 | 北京搜狗科技发展有限公司 | The method, apparatus and electronic equipment of a kind of phonetic synthesis |
-
1989
- 1989-06-05 JP JP1142406A patent/JPH037999A/en active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2775426A1 (en) | 1998-03-02 | 1999-09-03 | Delsey Soc | Wheeled carrying case |
JP2007212884A (en) * | 2006-02-10 | 2007-08-23 | Fujitsu Ltd | Speech synthesis apparatus, speech synthesis method, and computer program |
CN107871494A (en) * | 2016-09-23 | 2018-04-03 | 北京搜狗科技发展有限公司 | The method, apparatus and electronic equipment of a kind of phonetic synthesis |
CN107871494B (en) * | 2016-09-23 | 2020-12-11 | 北京搜狗科技发展有限公司 | Voice synthesis method and device and electronic equipment |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH1083277A (en) | Connected read-aloud system and method for converting text into voice | |
JP5198046B2 (en) | Voice processing apparatus and program thereof | |
US6477495B1 (en) | Speech synthesis system and prosodic control method in the speech synthesis system | |
JPH037999A (en) | Voice output device | |
JPH08335096A (en) | Text voice synthesizer | |
JP2000187495A (en) | Method and device for synthesizing speech, and recording medium where speech synthesis program is recorded | |
JPH06318094A (en) | Speech rule synthesizing device | |
Dessai et al. | Development of Konkani TTS system using concatenative synthesis | |
KR920009961B1 (en) | Unlimited Word Korean Synthesis Method and Circuit | |
JP2002358091A (en) | Method and device for synthesizing voice | |
KR0173340B1 (en) | Accent generation method using accent pattern normalization and neural network learning in text / voice converter | |
JP2703253B2 (en) | Speech synthesizer | |
JPH037994A (en) | Generating device for singing voice synthetic data | |
JPH01106000A (en) | Voice encoder | |
JP2839488B2 (en) | Speech synthesizer | |
JPS58168096A (en) | Multi-language voice synthesizer | |
JPH037996A (en) | Generating device for singing voice synthetic data | |
JPH0229800A (en) | Voice synthesizing device | |
JP2584222B2 (en) | Speech synthesizer | |
JPH0285899A (en) | Voice synthesizing device | |
FalDessai et al. | Development of Konkani TTS system using concatenative synthesis | |
JPH07160685A (en) | Device for reading out sentence | |
JPH1011090A (en) | Voice synthesizing device | |
JPS6326723A (en) | Sentence reading device | |
JPS62215299A (en) | Sentence reciting apparatus |