JP4827661B2 - 信号処理方法及び装置 - Google Patents

信号処理方法及び装置 Download PDF

Info

Publication number
JP4827661B2
JP4827661B2 JP2006233763A JP2006233763A JP4827661B2 JP 4827661 B2 JP4827661 B2 JP 4827661B2 JP 2006233763 A JP2006233763 A JP 2006233763A JP 2006233763 A JP2006233763 A JP 2006233763A JP 4827661 B2 JP4827661 B2 JP 4827661B2
Authority
JP
Japan
Prior art keywords
frame signal
signal
frame
amplitude
frequency spectrum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006233763A
Other languages
English (en)
Other versions
JP2008058480A (ja
Inventor
猛 大谷
政直 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006233763A priority Critical patent/JP4827661B2/ja
Priority to US11/637,809 priority patent/US8738373B2/en
Priority to EP06256371A priority patent/EP1895514B1/en
Priority to DE602006012831T priority patent/DE602006012831D1/de
Priority to CN2007100015488A priority patent/CN101136204B/zh
Publication of JP2008058480A publication Critical patent/JP2008058480A/ja
Application granted granted Critical
Publication of JP4827661B2 publication Critical patent/JP4827661B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Noise Elimination (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Description

本発明は、信号処理方法及び装置に関し、特に雑音抑圧等の加工処理を周波数領域で施した後、時間領域の信号に戻して処理する時の信号処理方法及び装置に関するものである。
上記のような信号処理技術の従来例[1]及び[2]を、図14〜17を参照して以下に説明する。
従来例[1]:図14及び15
図14に示す雑音抑圧装置2は、音声信号である入力信号In(t)を所定長単位に分割して所定の窓関数を施すフレーム分割・窓掛部10と、このフレーム分割・窓掛部10から出力される窓掛フレーム信号W(t)を、振幅成分|X(f)|と位相成分argX(f)とから成る周波数スペクトルX(f)に変換する周波数スペクトル変換部20と、この周波数スペクトルX(f)の振幅成分|X(f)|に対して雑音抑圧処理を施す雑音抑圧部130と、雑音抑圧後の振幅成分|Xs(f)|と周波数スペクトルX(f)の位相成分argX(f)とを時間領域に変換する時間領域変換部40と、この時間領域変換部40から出力される時間領域フレーム信号Y(t)を合成するフレーム合成部60とで構成されている。
この雑音抑圧装置2の動作波形図が、図15に示されており、まずフレーム分割・窓掛部10が、入力信号In(t)を所定のフレーム長Lの前フレーム信号FRb(t)及び現フレーム信号FRp(t)(以下、符号FRで総称することがある。)に順次分割する。ここで、フレーム信号FRb(t)及びFRp(t)は、後述する雑音抑圧のための加工処理をより精度良く(すなわち、周波数スペクトルの分析をより細かく)行わせるため、入力信号In(t)から互いに一部重複するようにフレームシフト長ΔLだけずらして切り出したものである。
さらに、フレーム分割・窓掛部10は、フレーム信号FRb(t)及びFRp(t)に所定の窓関数w(t)を以下の式(1)に従って順次施して窓掛フレーム信号W(t)を出力する(ステップT1)。
・W(t) = FR(t)*w(t) (t=0〜L) …式(1)
ここで、この窓関数w(t)は、例えば図示のように、各フレーム信号FR(t)の両端の振幅を等しく“0”にし、各フレーム信号FR(t)の重複部分で互いの寄与度の和が“1”になるように設定されている。
以下、前フレーム信号FRb(t)に対応して得られた窓掛フレーム信号Wb(t)を例に取って、周波数スペクトル変換部20、雑音抑圧部130、及び時間領域変換部40の動作を説明する。これは、現フレーム信号FRp(t)に対応する窓掛フレーム信号Wp(t)についても同様に適用される。
周波数スペクトル変換部20は、MDCT(Modified Discrete Cosine Transform)やFFT(Fast Fourier Transform)等の直交変換手法を用いて、窓掛フレーム信号Wb(t)を周波数スペクトルX(f)に変換し、その振幅成分|X(f)|を雑音抑圧部130に与え、位相成分argX(f)を時間領域変換部40に与える。
そして、雑音抑圧部130は、振幅成分|X(f)|中に含まれる雑音成分を抑圧し、雑音抑圧後の振幅成分|Xs(f)|を時間領域変換部40に与える(ステップT2)。
周波数スペクトルX(f)の位相成分argX(f)及び雑音抑圧後振幅成分|Xs(f)|を受けた時間領域変換部40は、これらを時間領域に変換(逆直交変換)して求めた時間領域フレーム信号Yb(t)をフレーム合成部60に与える(ステップT3)。
そして、時間領域フレーム信号Yb(t)、及びこれと同様にして求めた現フレーム信号FRp(t)に対応する時間領域フレーム信号Yp(t)を受けたフレーム合成部60は、これらの時間領域フレーム信号Yb(t)及びYp(t)を以下の式(2)のように加算合成し、出力信号Out(t)を得る(ステップT4)。
・Out(t) = Y(t−ΔL)+Y(t) …式(2)
= Yb(t)+Yp(t)
このように、入力信号In(t)から雑音成分を抑圧した出力信号Out(t)を得ることが可能となる。
しかしながら、上記のステップT2における雑音抑圧処理に伴って、時間領域フレーム信号Yb(t)又はYp(t)のフレーム両端の振幅が、図示のように“0”より大きくなったり又は小さくなったりして、フレーム端の振幅がズレる場合がある。この場合、このような従来例[1]においては、出力信号Out(t)が時間領域フレーム信号Yb(t)及びYp(t)の境界B1及びB2で不連続となり異音を発生させてしまうという問題がある。
この問題に対処するため、以下に説明する従来例[2]が既に提案されている。
従来例[2]:図16及び17
図16に示す雑音抑圧装置2は、上記の従来例[1]で示した構成に加えて、時間領域変換部40とフレーム合成部60との間に接続され、時間領域フレーム信号Y(t)に後窓関数を施した後窓掛フレーム信号Wa(t)を出力する後窓掛部140を備えている。
動作においては、図17に示すように、後窓掛部140が、上記の従来例[1]と同様にして得た時間領域フレーム信号Yb(t)及びYp(t)に所定の後窓関数wa(t)を、以下の式(3)及び(4)に従って順次施して後窓掛フレーム信号Wab(t)及びWap(t)を出力する(ステップT5)。
・Wab(t) = Yb(t)*wa(t) …式(3)
・Wap(t) = Yp(t)*wa(t) …式(4)
ここで、この後窓関数wa(t)は、図示のように、時間領域フレーム信号Yb(t)及びYp(t)のフレーム両端の振幅を再び“0”にするように(すなわち、時間領域フレーム信号Yb(t)及びYp(t)の境界B1及びB2で振幅が連続になるように)設定されている。
そして、フレーム合成部60は、これらの後窓掛フレーム信号Wab(t)及びWap(t)を以下の式(5) のように加算合成し、出力信号Out(t)を得る(ステップT6)。
・Out(t) = Wa(t−ΔL)+Wa(t) …式(5)
= Wab(t)+Wap(t)
このように、時間領域フレーム信号Yb(t)及びYp(t)をその境界B1及びB2で連続に接続した出力信号Out(t)を得ることが可能となる(例えば、特許文献1参照。)。
なお、参考例として、上記の従来例[2]と同様に後窓関数を用いて、エコー抑圧処理を施した周波数スペクトルを時間領域に変換して得た各フレーム信号を連続に接続するエコー抑圧装置もある(例えば、特許文献2参照。)。
特許第3626492号公報 特開2000-252891号公報
上記の従来例[2]では、後窓関数を用いてフレーム信号を順次補正することにより補正後の各フレーム信号を連続に接続することは可能であるが、後窓関数をフレーム信号の振幅成分に乗算するため、言い換えると、フレーム信号中に含まれる全ての周波数成分に対応する振幅成分|Xs(f)|を補正してしまうため、図18に示すように、後窓関数処理後のフレーム信号Wa(t)の周波数スペクトル振幅成分|Xa(f)|(実線で図示。)が、後窓関数処理前のフレーム信号Y(t)の周波数スペクトル振幅成分|Xs(f)|(点線で図示。)に比べて全周波数帯域において鈍ってしまい、フレーム信号全体に歪みが発生してしまうという課題がある。
一般に、周波数fが20Hz〜20kHzである高周波数帯域は聴覚感度が高いとされるため、特にこの高周波数帯域において発生するフレーム信号の歪みは音質の劣化につながる。
従って、本発明は、雑音抑圧等の加工処理を施した周波数スペクトルを時間領域のフレーム信号へ変換する際に生じるフレーム端振幅のズレを、出来るだけフレーム信号に歪みを発生させずに補正することが可能な信号処理方法及び装置を提供することを目的とする。
[1]上記の目的を達成するため、本発明の一態様に係る信号処理方法(又は装置)は、所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1ステップ(又は手段)と、該第2フレーム信号と同一のフレーム長を有する予め定めた補正用信号の両端の振幅と、該第2フレーム信号のフレーム両端又は片端の振幅との差分が小さくなるように調整すると共に、該第2フレーム信号から該調整した補正用信号を減算することにより補正フレーム信号を算出する第2ステップ(又は手段)と、を備え、該補正用信号は、複数の周波数成分を有する時間信号を加算したものであり、その合成波形による関数の周波数成分が、該第2フレーム信号における補正すべき低周波数成分に対応していることを特徴とする。
すなわち、第1ステップ(又は手段)で第1フレーム信号の周波数スペクトルに所定の加工処理を施し、且つ時間領域に変換して得た第2フレーム信号は、従来と同様、そのフレーム両端の振幅が“0”より大きく又は小さくなる場合がある。
このため、第2ステップ(又は手段)では、予め定めた補正用信号の両端の振幅該第2フレーム信号のフレーム両端又は片端の振幅との差分が小さくなるように調整し、該調整した補正用信号を該第2フレーム信号から減算する。
ここで、該補正用信号は、該第2フレーム信号と同一のフレーム長を有していれば良く、複数の周波数成分を有する時間信号を加算したものであり、その合成波形による関数の周波数成分が、該第2フレーム信号における補正すべき低周波数成分に対応している
すなわち、該補正用信号の振幅成分は、複数の周波数成分から成るものであるため、上記の調整及び減算により、該第2フレーム信号のフレーム両端又は片端の振幅は“0”、或いはほぼ“0”に近い値となり、且つ該補正用関数中に含まれる周波数成分に対応する振幅成分のみの減少又は増加という補正がなされることになる。
従って、該第2フレーム信号に生じるフレーム端振幅のズレを、フレーム信号全体に歪みを発生させることなく補正することが可能である。
特に、例えば該第1フレーム信号が音声信号から得られたものであって、該補正用信号の振幅成分が聴覚感度が低いとされる周波数帯域の成分のみを含む場合、音質の劣化を発生させること無く、該第2フレーム信号に生じるフレーム端振幅のズレを補正することができる。
[3]また、上記[1]において、該補正用信号の振幅成分が直流成分のみを含む場合、該補正に伴うフレーム信号の歪みを最小限に留めることができる
[4]また、上記の目的を達成するための本発明の一態様に係る信号処理方法(又は装置)は、所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1ステップ(又は手段)と、該周波数スペクトルと該第2フレーム信号とを入力して、該第2フレーム信号からフレーム両端又は片端の振幅を除去した信号のパワーと該周波数スペクトルのパワーとの差分の平方根で与えられる振幅補正量を求め、該振幅補正量を該周波数スペクトル中の直流成分又は低周波数成分の振幅に加算して該直流成分又は低周波数成分に対する補正振幅成分を求める第2ステップ(又は手段)と、該補正振幅成分を時間領域に変換して補正フレーム信号を算出する第3ステップ(又は手段)とを備えことを特徴とする。
すなわち、第2ステップ(又は手段)では、第3ステップ(又は手段)における時間領域変換に先立って、振幅成分を補正した周波数スペクトルを時間領域に変換させたフレーム信号が、該第2フレーム信号のフレーム両端又は片端の振幅を小さくしたフレーム信号と同等になるように、周波数領域で補正を行う。
ここで、該補正は、該所定の加工処理が施された周波数スペクトル中の直流成分又は低周波数分に対応する振幅成分に対して行
すなわち、補正後の周波数スペクトルを時間領域に変換して得たフレーム信号は、そのフレーム両端又は片端の振幅が“0”、或いはほぼ“0”に近い値となり、且つ該補正の対象とした周波数成分に対応する振幅成分のみが補正されたものとなる。
従って、上記[1]と同様、該第2フレーム信号に生じるフレーム端振幅のズレを、フレーム信号全体に歪みを発生させることなく補正することが可能である。
特に、該低周波数帯域が聴覚感度が低いとされる周波数帯域に設定される場合、上記[2]と同様、音質の劣化を発生させること無く、該第2フレーム信号に生じるフレーム端振幅のズレを補正することができる。
[7]また、上記[1]又は[4]において、該第1ステップ(又は手段)が、該第1フレーム信号を周波数領域に変換して第1周波数スペクトルを発生するステップ(又は手段)と、該第1周波数スペクトルに該所定の加工処理を施した第2周波数スペクトルを発生するステップ(又は手段)と、該第2周波数スペクトルを時間領域に変換して該第2フレーム信号を発生するステップ(又は手段)とを含むようにしても良い。
[8]また、上記[1]又は[4]において、該第1ステップ(又は手段)の該所定の加工処理が、該第1フレーム信号の周波数スペクトルの振幅成分から雑音スペクトルを推定すると共に、該雑音スペクトルに基づき該第1フレーム信号の周波数スペクトルの振幅成分中の雑音を抑圧するものであっても良い。
[9]また、上記[1]又は[4]において、該第1ステップ(又は手段)の該所定の加工処理が、該所定の窓関数を施した参照フレーム信号の周波数スペクトルの振幅成分と、該第1フレーム信号の周波数スペクトルの振幅成分とを比較してエコーを抑圧するための抑圧係数を算出すると共に、該抑圧係数を該第1フレーム信号の周波数スペクトルの振幅成分に乗算するものであっても良い。
[10]また、上記[1]又は[4]において、該第1フレーム信号が、音声信号又は音響信号に該所定の窓関数を施したものであり、該所定の加工処理が、該第1フレーム信号の周波数スペクトルに対する符号化であり、該第1ステップ(又は手段)が、該符号化された周波数スペクトルを時間領域に変換することにより復号化して該第2フレーム信号を発生するステップ(又は手段)を含むようにしても良い。
[11]また、上記[1]又は[4]において、該第1フレーム信号が、任意の文字列を分析して生成された複数の表音文字列の内の一の表音文字列に対応する音素片であって、予測される全ての表音文字列とこれらに対応する音素片とを記録した音声辞書から抽出され且つ該所定の窓関数が施されたものであり、該第1フレーム信号と互いに一部重複して隣接するフレーム信号が、該複数の表音文字列の内の他の表音文字列に対応する音素片であって、該音声辞書から抽出され且つ該所定の窓関数が施されたものであり、該所定の加工処理が、各表音文字列から生成された長さ及びピッチから各音素片の接続順序を決定し、該接続順序に基づき各音素片の周波数スペクトルを互いに滑らかに接続するための振幅補正係数を算出すると共に、各振幅補正係数を各音素片の周波数スペクトルの振幅成分に乗算するものであっても良い。
上記[8]〜[11]のように、種々のフレーム信号を入力し、また、その周波数スペクトルに種々の加工処理を施す場合であっても、時間領域変換に伴って生じるフレーム端振幅のズレを、信号処理方法及び装置の構成を変更すること無く補正することが可能である。
[12]また、上記[1]又は[4]において、該フレーム信号が隣接するフレーム信号と互いに一部重複しており、現フレーム信号に対して該補正を行って得たフレーム信号と、該現フレーム信号の直前のフレーム信号に対して該補正を行って得たフレーム信号との重複部分を加算合成するステップ(又は手段)をさらに備えるようにしても良い。
このように、互いに一部重複して隣接するフレーム信号の各々に対して、上記[1]又は[4]においてフレーム両端の振幅を実質的に“0”に補正した場合、各フレーム信号のフレーム両端の振幅はそれぞれ等しくなるため、各フレーム信号をその境界で連続させることができる。
また、上記[1]又は[4]において、各フレーム信号のフレーム片端の振幅を実質的に“0”に補正した場合には、連続にならないフレーム信号が存在し得るが、そのフレーム信号に生じていたフレーム端振幅のズレ自体は、上述した通り歪みを発生すること無く補正されているため、音質には影響を与えない。
本発明によれば、雑音抑圧等の加工処理を施した周波数スペクトルを時間領域のフレーム信号へ変換する際に生じるフレーム端振幅のズレを、出来るだけフレーム信号に歪みを発生させないように補正することができ、以てこれを適用する装置の出力信号の品質を向上させることができる。
また、フレーム信号の直流成分或いは低周波数帯域に対応する振幅成分のみを補正できるようにしたので、補正に伴うフレーム信号の品質劣化をより小さくすることができる。
さらに、種々のフレーム信号及び加工処理に対して本発明の構成を変更すること無く対応できるようにしたので、種々の装置に共通して適用することができ、以て開発コストを低減させることができる。
本発明に係る信号処理方法及びこれを使用する装置の実施例[1]及び[2]、並びにその応用例[1]〜[4]を、図1〜13を参照して以下の順に説明する。
I. 実施例[1]:図1〜6
I.1. 構成例:図1
I.2. 動作例:図2〜6
I.2.A. 全体動作例:図2
I.2.B. フレーム信号補正処理例(1):図3及び4
I.2.C. フレーム信号補正処理例(2):図5及び6
II. 実施例[2]:図4,6,7,及び8
II.1. 構成例:図7
II.2. 動作例:図4,6,8
III. 応用例:図9〜13
III.1. 応用例[1] (雑音抑圧装置):図9
III.2. 応用例[2] (エコー抑圧装置):図10
III.3. 応用例[3] (音声(又は音響)復号化装置):図11
III.4. 応用例[4] (音声合成装置):図12及び13
I.実施例[1]:図1〜6
I.1.構成例:図1
図1に示す本発明の実施例[1]に係る信号処理装置1は、入力信号In(t)を所定長単位に分割して所定の窓関数を施すフレーム分割・窓掛部10と、このフレーム分割・窓掛部10から出力される窓掛フレーム信号W(t)を、振幅成分|X(f)|と位相成分argX(f)とから成る周波数スペクトルX(f)に変換する周波数スペクトル変換部20と、この周波数スペクトルX(f)の振幅成分|X(f)|に所定の加工処理を施すための加工係数G(f)を乗算する乗算器30と、加工後の振幅成分|Xs(f)|と周波数スペクトルX(f)の位相成分argX(f)とを時間領域に変換する時間領域変換部40と、この時間領域変換部40から出力される時間領域フレーム信号Y(t)を所定の補正用信号を用いて補正する歪除去部50と、この歪除去部50から出力される補正フレーム信号Yc(t)を合成するフレーム合成部60とで構成されている。
ここで、乗算器30に入力される加工係数G(f)は、この信号処理装置1の用途に合わせて適宜設定することができる。
I.2.動作例:図2〜6
次に、図1に示した信号処理装置1の動作を説明するが、まずその全体動作例を、図2を参照して説明する。そして、歪除去部50のフレーム信号補正処理例(1)及び(2)を、図3〜6を参照して説明する。
I.2.A.全体動作例:図2
まず、図2に示す波形図において、フレーム分割・窓掛部10は、図14の従来例と同様、入力信号In(t)を所定のフレーム長Lの前フレーム信号FRb(t)及び現フレーム信号FRp(t)に順次分割し、フレーム信号FRb(t)及びFRp(t)に所定の窓関数w(t)を上述した式(1)に示すように順次乗算して窓掛フレーム信号W(t)を出力する(ステップS1)。
以下、前フレーム信号FRb(t)に対応して得られた窓掛フレーム信号Wb(t)を例に取って、周波数スペクトル変換部20、乗算器30、時間領域変換部40、及び歪除去部50の動作を説明する。これは、現フレーム信号FRb(t)に対応する窓掛フレーム信号Wp(t)についても同様に適用される。
周波数スペクトル変換部20は、従来例と同様の直交変換手法を用いて、窓掛フレーム信号Wb(t)を周波数スペクトルX(f)に変換し、その振幅成分|X(f)|を乗算器30に与え、位相成分argX(f)を時間領域変換部40に与える。
乗算器30は、以下の式(6)に示すように、振幅成分|X(f)|に加工係数G(f)を乗算(加工処理)して振幅成分|Xs(f)|を生成し、時間領域変換部40に与える(ステップS2)。
・|Xs(f)| = G(f)*|X(f)| …式(6)
位相成分argX(f)及び加工後の振幅成分|Xs(f)|を受けた時間領域変換部40は、従来例と同様にこれらを逆直交変換して時間領域フレーム信号Yb(t)を求め、このフレーム信号Yp(t)を歪除去部50に与える(ステップS3)。
歪除去部50は、この時間領域フレーム信号Yb(t)に対して後述するフレーム信号補正処理を行い、補正したフレーム信号Ycb(t)をフレーム合成部60に与える(ステップS4)。
そして、補正フレーム信号Ycb(t)、及びこれと同様にして求めた現フレーム信号FRp(t)に対応する補正フレーム信号Ycp(t)を受けたフレーム合成部60は、これらの補正フレーム信号Ycb(t)及びYcp(t)を以下の式(7)のように加算合成し、出力信号Out(t)を得る(ステップS5)。なお、ΔLは、上述した式(2)と同様、前フレーム信号FRb(t)に対する現フレームFRp(t)のシフト長を示す。
・Out(t) = Yc(t−ΔL)+Yc(t) …式(7)
= Ycb(t)+Ycp(t)
I.2.B.フレーム信号補正処理例(1):図3及び4
図3(i)は、歪除去部50で用いる補正用信号f(t)の一実施例を示している。この補正用信号f(t)は、時間領域フレーム信号Y(t)と同一のフレーム長Lを有しており、例えば図示のように、周波数f1の波形W1及び周波数f2の波形W2の合成波形で表されるものとする。また、この例では、補正用信号f(t)の両端の振幅f(0)及びf(L)を互いに異なる振幅値に設定している。もちろん、同一の振幅値であっても良い。
まず、歪除去部50は、同図(ii)に示すように、補正用信号f(t)の振幅成分を、振幅f(0)及びf(L)が、それぞれ、時間領域フレーム信号Y(t)のフレーム両端の振幅Y(0)及びY(L)に等しくなるように(f(0)=Y(0),f(L)=Y(L))調整し、調整後の補正用信号fa(t)を生成する。
ここで、上記のように振幅f(0)及びf(L)が互いに異なる振幅値に設定されている場合には、例えば、補正用信号f(t)の振幅成分から時間領域フレーム信号Y(t)の一方のフレーム端の振幅Y(0)を減算することにより振幅f(0)と振幅Y(0)とが等しくなるようにオフセットした後、補正用信号f(t)の振幅成分が、さらに時間領域フレーム信号Y(t)の他方のフレーム端の振幅Y(L)と等しくなるように種々の周知の近似法等を用いて調整する。
そして、歪除去部50は、以下の式(8)に示すように、時間領域フレーム信号Y(t)から調整後の補正用信号fa(t)を減算して補正した補正フレーム信号Yc(t)を求める。
・Yc(t) = Y(t)−fa(t) …式(8)
上記の補正フレーム信号Yc(t)は、同図(iii)に示すようにフレーム両端の振幅が共に“0”となる。
ここで、上記の補正により、時間領域フレーム信号Y(t)から調整後補正用信号fa(t)に含まれる周波数成分に対応する振幅成分(すなわち、補正用信号f(t)に元々含まれていた周波数f1及びf2に対応する振幅成分を調整したもの)のみが減算されるため、図4に実線で示す補正後(補正フレーム信号Yc(t))の周波数スペクトル振幅成分|Xc(f)|は、同図に点線で示す補正前の周波数スペクトル振幅成分|Xs(f)|から、周波数f1及びf2に対応する振幅成分のみを周波数f1及びf2にそれぞれ対応した振幅補正量α1及びα2だけ増加又は減少させたものとなる。
I.2.C.フレーム信号補正処理例(2):図5及び6
図5(i)に示す補正用信号f(t)は、上記のフレーム信号補正処理例(1)と異なり、その振幅成分が直流成分C0のみを含むように設定されている。
歪除去部50は、同図(ii)に示すように、補正用信号f(t)の振幅成分を、補正用関数f(t)の両端の振幅f(0)及びf(L)が時間領域フレーム信号Y(t)のフレーム両端の振幅Y(0)及びY(L)に等しくなるように調整、すなわち、調整後補正用信号fa(t)を以下の式(9)のように設定する。
・fa(t) = Y(0) …式(9)
そして、歪除去部50は、時間領域フレーム信号Y(t)を上述した式(8)に従って補正し、補正フレーム信号Yc(t)(=Y(t)−Y(0))を求める。
上記の補正フレーム信号Yc(t)は、同図(iii)に示すように、補正フレーム信号Yc(t)の振幅成分を振幅Y(0)だけオフセットさせたものとなる。
また、図6に示すように、補正後(補正フレーム信号Yc(t))の周波数スペクトル振幅成分|Xc(f)|(実線で図示。)は、補正前の周波数スペクトル振幅成分|Xs(f)|(点線で図示。)の直流成分(f=0)のみを振幅補正量αだけ変更させたものとなる。
なお、上記のフレーム信号補正処理例(1)及び(2)においては、補正用信号f(t)の両端の振幅を、時間領域フレーム信号Y(t)のフレーム両端の振幅に等しくなるように調整したが、時間領域フレーム信号Y(t)のフレーム片端の振幅Y(0)又はY(L)に等しくなるように調整することもでき、この場合も上記の説明は同様に適用される。
但し、補正フレーム信号Yc(t)のいずれか一端の振幅が“0”にならず、以て隣接する補正フレーム信号と不連続になり得るが、音声等のデジタル信号の場合は離散的な値を取るため(すなわち、誤差を有するため)、実質的に連続と見做すことができる。
II.実施例[2]:図4,6,7,及び8
II.1.構成例:図7
図7に示す本発明の実施例[2]に係る信号処理装置1は、上記の実施例[1]において、歪除去部50の代わりに、乗算器30と時間領域変換部40との間に接続され、時間領域フレーム信号Y(t)及び加工後振幅成分|Xs(f)|を入力して、加工後振幅成分|Xs(f)|を周波数領域で補正した補正振幅成分|Xc(f)|を出力する振幅成分調整部120を挿入すると共に、時間領域変換部40が補正振幅成分|Xc(f)|も入力する点が異なっている。
II.2.動作例:図4,6,8
次に、本実施例の動作を説明するが、時間領域変換部40及び振幅成分調整部120以外の動作は上記の実施例[1]と共通であるため、時間領域変換部40及び振幅成分調整部120の動作例のみを、図8を参照して説明する。また、以下の説明においては、上記の実施例[1]で用いた図4及び6を再び使用して説明する。
図8に示すように、まず、周波数スペクトルX(f)の位相成分argX(f)及び加工後振幅成分|Xs(f)|を受けた時間領域変換部40は、上記の実施例[1]と同様にこれらを逆直交変換して時間領域フレーム信号Y(t)を得る(ステップS10)。
そして、時間領域変換部40は、この時間領域フレーム信号Y(t)を振幅成分調整部120に与え、この振幅成分調整部120からの補正振幅成分|Xc(f)|の受信を待つ(ステップS11)。
時間領域変換部40からの時間領域フレーム信号Y(t)及び乗算器30からの加工後振幅成分|Xs(f)|を受けた振幅成分調整部120は、パーセバルの定理に基づき加工後振幅成分|Xs(f)|に対する振幅補正量αを算出する(ステップS20)。ここで、パーセバルの定理は、以下の式(10)に示すように、時間領域における信号のパワーと周波数領域におけるスペクトルのパワーとの間で成り立つ等号関係を示す式であり、両者が等しくない時の差分として振幅補正量αを用いている。
Figure 0004827661
すなわち、上記の式(10)中の振幅補正量αのパワーα2は、時間領域フレーム信号Y(t)からフレーム端の振幅Y(0) (すなわち、Y(0)=“0”であるフレーム信号)を除去した信号のパワー(右辺第1項)と、加工後振幅成分|Xs(f)|のパワー(右辺第2項)とが等しくなるように周波数領域におけるスペクトルのパワーを補正する値であるため、この平方根を取って求めた加工後振幅成分|Xs(f)|に対する振幅補正量αは、後述するように、時間領域フレーム信号Y(t)からフレーム端の振幅Y(0)を除去したフレーム信号と、補正振幅成分|Xc(f)|を時間領域に変換して得られた補正フレーム信号Yc(t)とを実質的に同一にする補正量として用いることができる。
また、時間領域フレーム信号Y(t)のフレーム両端の振幅Y(0)及びY(L)が互いに等しい場合には、振幅補正量αは、時間領域フレーム信号Y(t)からフレーム両端の振幅Y(0)及びY(L)を除去したフレーム信号(すなわち、Y(0)=Y(L)=“0”)と、補正フレーム信号Yc(t)とを実質的に同一にする補正量となる。
そして、振幅成分調整部120は、以下の式(11)に示すように、この振幅補正量αを加工後振幅成分|Xs(f)|の直流成分(f=0)の振幅に加算して補正振幅成分|Xc(f)|の直流成分の振幅を求めると共に、以下の式(12)に示すように、加工後振幅成分|Xs(f)|の直流成分以外の周波数(f≠0)に対応する振幅成分を、そのまま補正振幅成分|Xc(f)|の直流成分以外の周波数に対応する振幅成分として求め(ステップS21)、この補正振幅成分|Xc(f)|を時間領域変換部40に与える(ステップS22)。
・|Xc(0)| = |Xs(0)|+α (f=0) …式(11)
・|Xc(f)| = |Xs(f)| (f≠0) …式(12)
これにより、補正振幅成分|Xc(f)|は、図6に示したものと同様、補正前の周波数スペクトル振幅成分|Xs(f)|に対して直流成分のみを振幅補正量αだけ変更したものとなる。
また、図4に示した補正振幅成分|Xc(f)|を得たい場合には、振幅成分調整部120は、振幅補正量αを、上記の式(10)及び(11)のように加工後振幅成分|Xs(f)|の直流成分の振幅のみに加算するのではなく、振幅補正量αを振幅補正量α1及びα2(α1+α2=α)に分割し、加工後振幅成分|Xs(f)|中の周波数f1及びf2に対応する両振幅にそれぞれ振幅補正量α1及びα2を加算することもできる。
そして、補正振幅成分|Xc(f)|を受けた時間領域変換部40は、上記の実施例[1]と同様にこれを逆直交変換して得たフレーム信号を、補正フレーム信号Yc(t)とする(ステップS12)と共に、この補正フレーム信号Yc(t)をフレーム合成部60に与える(ステップS13)。
これにより、上記の実施例[1]と同様の補正フレーム信号Yc(t)を得ることができ、各補正フレーム信号Yc(t)を加算合成した出力信号Out(t)を得ることができる。
III.応用例:図9〜13
以下、本発明の応用例[1]〜[4]を、図9〜13を参照して説明する。なお、下記の応用例の各装置は上記の実施例[1]の信号処理装置1(或いはその一部)を含むように構成されているが、これを上記の実施例[2]の信号処理装置1(或いはその一部)に代えて構成することもできる。
III.1.応用例[1] (雑音抑圧装置):図9
図9に示す雑音抑圧装置2は、乗算器30での加工処理の一例として雑音抑圧処理を行うものであり、上記の実施例[1]の構成に加えて、信号処理装置1の周波数スペクトル変換部20から出力される振幅成分|X(f)|から雑音スペクトル|N(f)|を推定する雑音推定部70と、この雑音スペクトル|N(f)|及び振幅成分|X(f)|に基づき抑圧係数G(f)を算出して乗算器30に与える抑圧係数算出部80とを含むように構成されている。
動作においては、まず雑音推定部70が、振幅成分|X(f)|を受ける度毎に、振幅成分|X(f)|から雑音スペクトル|N(f)|を推定すると共に、振幅成分|X(f)|中に音声が含まれるか否かを判定する。
この結果、振幅成分|X(f)|中に音声が含まれていないと判定した時、雑音推定部70は、推定した雑音スペクトル|N(f)|を以下の式(13)に従って更新し、抑圧係数算出部80に与える。
・|N(f)| = A*|N(f)|+(1−A)*|X(f)| (Aは所定の定数) …式(13)
一方、振幅成分|X(f)|中に音声が含まれると判定した時には、雑音推定部70は、雑音スペクトル|N(f)|を更新しない。
そして、雑音スペクトル|N(f)|を受けた抑圧係数算出部80は、この雑音スペクトル|N(f)|及び振幅成分|X(f)|から以下の式(14)に従ってSN比(SNR(f))を算出する。
・SNR(f) = |X(f)|/|N(f)| …式(14)
この抑圧係数算出部80は、さらに、このSNR(f)に応じた抑圧係数G(f)を算出して乗算器30に与える。
乗算器30では、この抑圧係数G(f)を周波数スペクトルX(f)の振幅成分|X(f)|に乗算して雑音抑圧処理を施す。時間領域変換部40で時間領域に変換した時間領域フレーム信号Y(t)は、上述した通り、そのフレーム両端の振幅がズレる場合があるが、上記の実施例[1](又は実施例[2])に示した歪除去部50によるフレーム信号補正処理(又は振幅成分調整部120による周波数スペクトルの振幅成分に対する補正)によりこれを補正することができる。
III.2.応用例[2] (エコー抑圧装置):図10
図10に示すエコー抑圧装置3は、乗算器30での加工処理の一例としてエコー抑圧処理を行うものであり、上記の実施例[1]の構成に加えて、入力信号In(t)に対する参照信号Ref(f)を所定長単位に分割して所定の窓関数を施すフレーム分割・窓掛部10rと、このフレーム分割・窓掛部10rから出力される窓掛フレーム信号Wr(t)を、振幅成分|Xr(f)|と位相成分argXr(f)とから成る周波数スペクトルXr(f)に変換する周波数スペクトル変換部20rと、この周波数スペクトル変換部20rから出力される振幅成分|Xr(f)|と信号処理装置1の周波数スペクトル変換部20から出力される振幅成分|X(f)|とを入力して、エコーを抑圧するための抑圧係数G(f)を算出して乗算器30に与える抑圧係数算出部80とを含むように構成されている。
動作においては、フレーム分割・窓掛部10rが、信号処理装置1のフレーム分割・窓掛部10と同様にして窓掛フレーム信号Wr(t)を算出して周波数スペクトル変換部20rに与える。これを受けた周波数スペクトル変換部20rは、周波数スペクトル変換部20と同様にして周波数スペクトルXr(f)に変換する。
そして、周波数スペクトルX(f)及びXr(f)のそれぞれの振幅成分|X(f)|及び振幅成分|Xr(f)|を受けた抑圧係数算出部80は、両振幅成分を比較して類似度(図示せず)を算出し、この類似度に応じた抑圧係数G(f)を算出して乗算器30に与える。
そして、乗算器30が、振幅成分|X(f)|に抑圧係数G(f)を乗算してエコー抑圧処理を施し、時間領域変換部40が、エコー抑圧後の振幅成分|Xs(f)|を時間領域フレーム信号Y(t)に変換する。
この時間領域フレーム信号Y(t)は、雑音抑圧処理を施した場合と同様、そのフレーム両端の振幅がズレる場合がある。この場合も、上記の実施例[1](又は実施例[2])に示した歪除去部50によるフレーム信号補正処理(又は振幅成分調整部120による周波数スペクトルの振幅成分に対する補正)により補正を行うことができる。
III.3.応用例[3] (音声(又は音響)復号化装置):図11
図11に示す音声(又は音響)復号化装置4は、上記の実施例[1]の信号処理装置1の内の時間領域変換部40、歪除去部50、及びフレーム合成部60で構成され、時間領域変換部40へ入力される符号化信号X(f)が、所定の符号化処理が施された振幅成分|Xs(f)|と位相成分argX(f)とから成る周波数スペクトルである点が、上記の実施例[1]と異なっている。
ここで、符号化信号X(f)は、送信側の符号化装置(図示せず)が、音声信号又は音響信号に窓関数を施したフレーム信号の周波数スペクトルX(f)の振幅成分|X(f)|を符号化処理したもの(すなわち、音声信号又は音響信号に対して信号処理装置1のフレーム分割・窓掛部10、周波数スペクトル変換部20、及び乗算器30と同等の処理を行ったもの)である。
この符号化信号X(f)を受信した音声(又は音響)復号化装置4の時間領域変換部40が、符号化処理が施された振幅成分|Xs(f)|を時間領域フレーム信号Y(t)へ変換して復号化することにより、上記の応用例[1]及び[2]と同様、時間領域フレーム信号Y(t)のフレーム両端の振幅がズレる場合がある。この場合も、上記の実施例[1](又は実施例[2])に示した歪除去部50によるフレーム信号補正処理(又は振幅成分調整部120による周波数スペクトルの振幅成分に対する補正)により補正を行うことができる。
III.4.応用例[4] (音声合成装置):図12及び13
図12に示す音声合成装置5は、乗算器30での加工処理の一例として周波数領域で音素片の加工処理を行うものであり、上記の実施例[1]の構成に加えて、任意の文字列CSを分析して複数の表音文字列PSを生成する言語処理部90と、各表音文字列PSから長さPL及びピッチPPを生成する韻律生成部100と、予測される全ての表音文字列PSとこれらに対応する音素片Ph(t)とを記録した音声辞書DCTと、この音声辞書DCTから言語処理部90で生成した各表音文字列PSに対応する音素片Ph(t)を抽出し、これらを入力信号In(t)として信号処理装置1に与えると共に、韻律生成部100で生成された長さPL及びピッチPLの各々から各音素片Ph(t)の接続順序を決定し、この接続順序を示す接続順序情報INFOを生成する制御部110と、この接続順序情報INFOに基づき周波数スペクトル変換部20から出力される各音素片Ph(t)の周波数スペクトルX(f)の振幅成分|X(f)|を互いに滑らかに接続するための振幅補正係数H(f)を算出して乗算器30に与える振幅補正係数算出部150とを含むように構成されている。
動作においては、まず言語処理部90が、入力された文字列CSから複数の表音文字列PSを生成して制御部110に与える。例えば図13(1)に示すように、この文字列CSが“KONNICHIWA”という文字列である場合、言語処理部90は、同図(2)に示すように、表音文字列PS1“KON”、PS2“NICHI”、PS3“WA”をそれぞれ生成する。
そして、韻律生成部100は、各表音文字列PS1〜PS3から長さPL1〜PL3及びピッチPP1〜PP3(共に図示せず)を生成して制御部110に与える。
表音文字列PS1〜PS3を受けた制御部110は、同図(3)に示すように、表音文字列PS1〜PS3の各々に対応する音素片Ph1(t)〜Ph3(t)を音声辞書DCTからそれぞれ抽出する。ここで、各音素片Ph1(t)〜Ph3(t)は、音声辞書DCT中に記録されている“KONDO”、“31NICHI”、及び“WANAGE”に対応する音素片の一部をそれぞれ切り出したものである。
ここで、各音素片Ph1(t)〜Ph3(t)は、それぞれ異なる音素片から得られたものであるため、互いにその振幅成分が異なり不連続な場合がある。このため、音素片Ph1(t)〜Ph3(t)の各振幅成分がその境界で連続になるよう加工処理を施す必要がある。
本応用例では、この加工処理を、後述する振幅補正係数算出部150及び振幅補正係数算出部150からの振幅補正係数H(f)を受けた乗算器30で行う。
また、振幅補正係数算出部150は、該加工処理に際して、音素片Ph1(t)〜Ph3(t)をどのような順序で接続するのかを予め認識していなければならない。
このため、該加工処理に先立って、制御部110が、長さPL1〜PL3及びピッチPP1〜PP3から、同図(4)に示すように各音素片Ph1(t)〜Ph3(t)の接続順序(“KON”→“NICHI”→“WA”)を決定し、これを示す接続順序情報INFOを振幅補正係数算出部150に与える。
そして、振幅補正係数算出部150は、音素片Ph1(t)〜Ph3(t)に対応する周波数スペクトルの振幅成分|X(f)|を受ける度毎に、接続順序情報INFOに基づき振幅成分|X(f)|を互いに滑らかに接続するための振幅補正係数H(f)を算出して乗算器30に与える。
そして、乗算器30が、振幅成分|X(f)|に振幅補正係数H(f)を乗算して加工処理を施し、時間領域変換部40が、加工後の振幅成分|Xs(f)|を時間領域フレーム信号Y(t)に変換する。
乗算器30での加工処理により各音素片Ph1(t)〜Ph3(t)が一旦は連続的に接続されるが、時間領域変換部40での時間領域に変換により、上記の応用例[1]〜[3]と同様、時間領域フレーム信号Y(t)のフレーム両端の振幅が再びズレてしまう場合がある。この場合も、上記の実施例[1](又は実施例[2])に示した歪除去部50によるフレーム信号補正処理(又は振幅成分調整部120による周波数スペクトルの振幅成分に対する補正)により補正を行うことができる。
なお、上記実施例によって本発明は限定されるものではなく、特許請求の範囲の記載に基づき、当業者によって種々の変更が可能なことは明らかである。
(付記1)
所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1ステップと、
該第2フレーム信号と同一のフレーム長を有する予め定めた補正用信号の両端の振幅が、該第2フレーム信号のフレーム両端又は片端の振幅に実質的に等しくなるように調整すると共に、該第2フレーム信号から該調整した補正用信号を減算することにより補正する第2ステップと、
を備えたことを特徴とする信号処理方法。
(付記2)付記1において、
該補正用信号の振幅成分が低周波数成分のみを含むことを特徴とした信号処理方法。
(付記3)付記1において、
該補正用信号の振幅成分が直流成分のみを含むことを特徴とした信号処理方法。
(付記4)
所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1ステップと、
該所定の加工処理が施された周波数スペクトルと該第2フレーム信号とを入力して、該第2フレーム信号のフレーム両端又は片端の振幅が実質的に零になるように該所定の加工処理が施された周波数スペクトルの振幅成分を補正する第2ステップと、
該補正した周波数スペクトルを時間領域に変換する第3ステップと、
を備えたことを特徴とする信号処理方法。
(付記5)付記4において、
該第2ステップが、該所定の加工処理が施された周波数スペクトルの低周波数帯域に対応する振幅成分に対して該補正を行うことを特徴とした信号処理方法。
(付記6)付記4において、
該第2ステップが、該所定の加工処理が施された周波数スペクトルの直流成分に対応する振幅に対してのみ該補正を行うことを特徴とした信号処理方法。
(付記7)付記1又は4において、
該第1ステップが、該第1フレーム信号を周波数領域に変換して第1周波数スペクトルを発生するステップと、
該第1周波数スペクトルに該所定の加工処理を施した第2周波数スペクトルを発生するステップと、
該第2周波数スペクトルを時間領域に変換して該第2フレーム信号を発生するステップと、を含むことを特徴とした信号処理方法。
(付記8)付記1又は4において、
該第1ステップの該所定の加工処理が、該第1フレーム信号の周波数スペクトルの振幅成分から雑音スペクトルを推定すると共に、該雑音スペクトルに基づき該第1フレーム信号の周波数スペクトルの振幅成分中の雑音を抑圧するものであることを特徴とした信号処理方法。
(付記9)付記1又は4において、
該第1ステップの該所定の加工処理が、該所定の窓関数を施した参照フレーム信号の周波数スペクトルの振幅成分と、該第1フレーム信号の周波数スペクトルの振幅成分とを比較してエコーを抑圧するための抑圧係数を算出すると共に、該抑圧係数を該第1フレーム信号の周波数スペクトルの振幅成分に乗算するものであることを特徴とした信号処理方法。
(付記10)付記1又は4において、
該第1フレーム信号が、音声信号又は音響信号に該所定の窓関数を施したものであり、該所定の加工処理が、該第1フレーム信号の周波数スペクトルに対する符号化であり、
該第1ステップが、該符号化された周波数スペクトルを時間領域に変換することにより復号化して該第2フレーム信号を発生するステップを含むことを特徴とした信号処理方法。
(付記11)付記1又は4において、
該第1フレーム信号が、任意の文字列を分析して生成された複数の表音文字列の内の一の表音文字列に対応する音素片であって、予測される全ての表音文字列とこれらに対応する音素片とを記録した音声辞書から抽出され且つ該所定の窓関数が施されたものであり、
該第1フレーム信号と互いに一部重複して隣接するフレーム信号が、該複数の表音文字列の内の他の表音文字列に対応する音素片であって、該音声辞書から抽出され且つ該所定の窓関数が施されたものであり、
該所定の加工処理が、各表音文字列から生成された長さ及びピッチから各音素片の接続順序を決定し、該接続順序に基づき各音素片の周波数スペクトルを互いに滑らかに接続するための振幅補正係数を算出すると共に、各振幅補正係数を各音素片の周波数スペクトルの振幅成分に乗算するものであることを特徴とした信号処理方法。
(付記12)付記1又は4において、
該フレーム信号が隣接するフレーム信号と互いに一部重複しており、
現フレーム信号に対して該補正を行って得たフレーム信号と、該現フレーム信号の直前のフレーム信号に対して該補正を行って得たフレーム信号との重複部分を加算合成するステップをさらに備えたことを特徴とする信号処理方法。
(付記13)
所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1手段と、
該第2フレーム信号と同一のフレーム長を有する予め定めた補正用信号の両端の振幅が、該第2フレーム信号のフレーム両端又は片端の振幅に実質的に等しくなるように調整すると共に、該第2フレーム信号から該調整した補正用信号を減算することにより補正する第2手段と、
を備えたことを特徴とする信号処理装置。
(付記14)付記13において、
該補正用信号の振幅成分が低周波数成分のみを含むことを特徴とした信号処理装置。
(付記15)付記13において、
該補正用信号の振幅成分が直流成分のみを含むことを特徴とした信号処理装置。
(付記16)
所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1手段と、
該所定の加工処理が施された周波数スペクトルと該第2フレーム信号とを入力して、該第2フレーム信号のフレーム両端又は片端の振幅が実質的に零になるように該所定の加工処理が施された周波数スペクトルの振幅成分を補正する第2手段と、
該補正した周波数スペクトルを時間領域に変換する第3手段と、
を備えたことを特徴とする信号処理装置。
(付記17)付記16において、
該第2手段が、該所定の加工処理が施された周波数スペクトルの低周波数帯域に対応する振幅成分に対して該補正を行うことを特徴とした信号処理装置。
(付記18)付記16において、
該第2手段が、該所定の加工処理が施された周波数スペクトルの直流成分に対応する振幅に対してのみ該補正を行うことを特徴とした信号処理装置。
(付記19)付記13又は16において、
該第1手段が、該第1フレーム信号を周波数領域に変換して第1周波数スペクトルを発生する手段と、
該第1周波数スペクトルに該所定の加工処理を施した第2周波数スペクトルを発生する手段と、
該第2周波数スペクトルを時間領域に変換して該第2フレーム信号を発生する手段と、を含むことを特徴とした信号処理装置。
(付記20)付記13又は16において、
該第1手段の該所定の加工処理が、該第1フレーム信号の周波数スペクトルの振幅成分から雑音スペクトルを推定すると共に、該雑音スペクトルに基づき該第1フレーム信号の周波数スペクトルの振幅成分中の雑音を抑圧するものであることを特徴とした信号処理装置。
(付記21)付記13又は16において、
該第1手段の該所定の加工処理が、該所定の窓関数を施した参照フレーム信号の周波数スペクトルの振幅成分と、該第1フレーム信号の周波数スペクトルの振幅成分とを比較してエコーを抑圧するための抑圧係数を算出すると共に、該抑圧係数を該第1フレーム信号の周波数スペクトルの振幅成分に乗算するものであることを特徴とした信号処理装置。
(付記22)付記13又は16において、
該第1フレーム信号が、音声信号又は音響信号に該所定の窓関数を施したものであり、該所定の加工処理が、該第1フレーム信号の周波数スペクトルに対する符号化であり、
該第1手段が、該符号化された周波数スペクトルを時間領域に変換することにより復号化して該第2フレーム信号を発生する手段を含むことを特徴とした信号処理装置。
(付記23)付記13又は16において、
該第1フレーム信号が、任意の文字列を分析して生成された複数の表音文字列の内の一の表音文字列に対応する音素片であって、予測される全ての表音文字列とこれらに対応する音素片とを記録した音声辞書から抽出され且つ該所定の窓関数が施されたものであり、
該第1フレーム信号と互いに一部重複して隣接するフレーム信号が、該複数の表音文字列の内の他の表音文字列に対応する音素片であって、該音声辞書から抽出され且つ該所定の窓関数が施されたものであり、
該所定の加工処理が、各表音文字列から生成された長さ及びピッチから各音素片の接続順序を決定し、該接続順序に基づき各音素片の周波数スペクトルを互いに滑らかに接続するための振幅補正係数を算出すると共に、各振幅補正係数を各音素片の周波数スペクトルの振幅成分に乗算するものであることを特徴とした信号処理装置。
(付記24)付記13又は16において、
該フレーム信号が隣接するフレーム信号と互いに一部重複しており、
現フレーム信号に対して該補正を行って得たフレーム信号と、該現フレーム信号の直前のフレーム信号に対して該補正を行って得たフレーム信号との重複部分を加算合成する手段をさらに備えたことを特徴とする信号処理装置。
本発明に係る信号処理方法及び装置の実施例[1]を示したブロック図である。 本発明の実施例[1]の全体動作例を示した波形図である。 本発明の実施例[1]に用いる歪除去部のフレーム信号補正処理例(1)を示した動作波形図である。 本発明の実施例[1]に用いる歪除去部のフレーム信号補正処理例(1)による補正前後の周波数スペクトル特性を示したグラフ図である。 本発明の実施例[1]に用いる歪除去部のフレーム信号補正処理例(2)を示した動作波形図である。 本発明の実施例[1]に用いる歪除去部のフレーム信号補正処理例(2)による補正前後の周波数スペクトル特性を示したグラフ図である。 本発明に係る信号処理方法及び装置の実施例[2]を示したブロック図である。 本発明の実施例[2]に用いる時間領域変換部及び振幅成分調整部の動作例を示したフローチャート図である。 本発明に係る信号処理方法及び装置の応用例[1]を示したブロック図である。 本発明に係る信号処理方法及び装置の応用例[2]を示したブロック図である。 本発明に係る信号処理方法及び装置の応用例[3]を示したブロック図である。 本発明に係る信号処理方法及び装置の応用例[4]を示したブロック図である。 本発明の応用例[4]に用いる言語処理部、韻律生成部、及び制御部の動作例を示した図である。 雑音抑圧装置の従来例[1]の構成例を示したブロック図である。 従来例[1]の信号処理例を示した動作波形図である。 雑音抑圧装置の従来例[2]の構成例を示したブロック図である。 従来例[2]の信号処理例を示した動作波形図である。 従来例[2]による後窓関数処理前後の周波数スペクトル特性を示したグラフ図である。
符号の説明
1 信号処理装置
2 雑音抑圧装置
3 エコー抑圧装置
4 音声(又は音響)復号化装置
5 音声合成装置
10, 10r フレーム分割・窓掛部
20, 20r 周波数スペクトル変換部
30 乗算器
40 時間領域変換部
50 歪除去部
60 フレーム合成部
70 雑音推定部
80 抑圧係数算出部
90 言語処理部
100 韻律生成部
110 制御部
120 振幅成分調整部
130 雑音抑圧部
140 後窓掛部
150 振幅補正係数算出部
In(t) 入力信号
FR(t), FRb(t), FRp(t) フレーム信号
W(t), Wb(t), Wp(t) 窓掛フレーム信号
Wa(t), Wab(t), Wap(t) 後窓掛フレーム信号
X(f), Xr(f) 周波数スペクトル
|X(f)|, |Xr(f)| 振幅成分
argX(f) 位相成分
|Xa(f)| 後窓関数処理後振幅成分
G(f) 加工係数(抑圧係数)
|Xs(f)| 加工後振幅成分
Y(t), Yb(t), Yp(t) 時間領域フレーム信号
Yc(t), Ycb(t), Ycp(t) 補正フレーム信号
|Xc(f)| 補正振幅成分
Out(t) 出力信号
L フレーム長
ΔL フレームシフト長
B1, B2 境界
w(t) 窓関数
wa(t) 後窓関数
f(t) 補正用信号
fa(t) 調整後補正用信号
W, W1, W2 波形
f, f1, f2 周波数
α, α1, α2 振幅補正量
C0 直流成分
|N(f)| 推定雑音スペクトル
CS 文字列
PS, PS1〜PS3 表音文字列
PL 長さ
PP ピッチ
DCT 音声辞書
Ph(t), Ph1(t)〜Ph3(t) 音素片
INFO 接続順序情報
H(f) 振幅補正係数
図中、同一符号は同一又は相当部分を示す。

Claims (12)

  1. 所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1ステップと、
    該第2フレーム信号と同一のフレーム長を有する予め定めた補正用信号の両端の振幅と、該第2フレーム信号のフレーム両端又は片端の振幅との差分が小さくなるように調整すると共に、該第2フレーム信号から該調整した補正用信号を減算することにより補正フレーム信号を算出する第2ステップと、
    を備え、
    該補正用信号は、複数の周波数成分を有する時間信号を加算したものであり、その合成波形による関数の周波数成分が、該第2フレーム信号における補正すべき低周波数成分に対応していることを特徴とする信号処理方法。
  2. 所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1ステップと、
    該周波数スペクトルと該第2フレーム信号とを入力して、該第2フレーム信号からフレーム両端又は片端の振幅を除去した信号のパワーと該周波数スペクトルのパワーとの差分の平方根で与えられる振幅補正量を求め、該振幅補正量を該周波数スペクトル中の直流成分又は低周波数成分の振幅に加算して該直流成分又は低周波数成分に対する補正振幅成分を求める第2ステップと、
    該補正振幅成分を時間領域に変換して補正フレーム信号を算出する第3ステップと、
    を備えことを特徴とする信号処理方法。
  3. 所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1手段と、
    該第2フレーム信号と同一のフレーム長を有する予め定めた補正用信号の両端の振幅と、該第2フレーム信号のフレーム両端又は片端の振幅との差分が小さくなるように調整すると共に、該第2フレーム信号から該調整した補正用信号を減算することにより補正フレーム信号を算出する第2手段と、
    を備え、
    該補正用信号は、複数の周波数成分を有する時間信号を加算したものであり、その合成波形による関数の周波数成分が、該第2フレーム信号における補正すべき低周波数成分に対応している複数の周波数成分を有する時間信号を加算したものであることを特徴とする信号処理装置。
  4. 所定の窓関数が施された所定長単位の第1フレーム信号の周波数スペクトルに所定の加工処理が施され且つ時間領域に変換された第2フレーム信号を発生する第1手段と、
    該周波数スペクトルと該第2フレーム信号とを入力して、該第2フレーム信号からフレーム両端又は片端の振幅を除去した信号のパワーと該周波数スペクトルのパワーとの差分の平方根で与えられる振幅補正量を求め、該振幅補正量を該周波数スペクトル中の直流成分又は低周波数成分の振幅に加算して該直流成分又は低周波数成分に対する補正振幅成分を求める第2手段と、
    該補正振幅成分を時間領域に変換して補正フレーム信号を算出する第3手段と、
    を備えことを特徴とする信号処理装置。
  5. 請求項3又は4において、
    該第1手段が、該第1フレーム信号を周波数領域に変換して第1周波数スペクトルを発生する手段と、
    該第1周波数スペクトルに該所定の加工処理を施した第2周波数スペクトルを発生する手段と、
    該第2周波数スペクトルを時間領域に変換して該第2フレーム信号を発生する手段と、を含むことを特徴とした信号処理装置。
  6. 請求項3又は4において、
    該第1手段の該所定の加工処理が、該第1フレーム信号の周波数スペクトルの振幅成分から雑音スペクトルを推定すると共に、該雑音スペクトルに基づき該第1フレーム信号の周波数スペクトルの振幅成分中の雑音を抑圧するものであることを特徴とした信号処理装置。
  7. 請求項3又は4において、
    該第1手段の該所定の加工処理が、該所定の窓関数を施した参照フレーム信号の周波数スペクトルの振幅成分と、該第1フレーム信号の周波数スペクトルの振幅成分とを比較してエコーを抑圧するための抑圧係数を算出すると共に、該抑圧係数を該第1フレーム信号の周波数スペクトルの振幅成分に乗算するものであることを特徴とした信号処理装置。
  8. 請求項3又は4において、
    該第1フレーム信号が、音声信号又は音響信号に該所定の窓関数を施したものであり、該所定の加工処理が、該第1フレーム信号の周波数スペクトルに対する符号化であり、
    該第1手段が、該符号化された周波数スペクトルを時間領域に変換することにより復号化して該第2フレーム信号を発生する手段を含むことを特徴とした信号処理装置。
  9. 請求項3又は4において、
    該第1フレーム信号が、任意の文字列を分析して生成された複数の表音文字列の内の一の表音文字列に対応する音素片であって、予測される全ての表音文字列とこれらに対応する音素片とを記録した音声辞書から抽出され且つ該所定の窓関数が施されたものであり、
    該第1フレーム信号と互いに一部重複して隣接するフレーム信号が、該複数の表音文字列の内の他の表音文字列に対応する音素片であって、該音声辞書から抽出され且つ該所定の窓関数が施されたものであり、
    該所定の加工処理が、各表音文字列から生成された長さ及びピッチから各音素片の接続順序を決定し、該接続順序に基づき各音素片の周波数スペクトルを互いに滑らかに接続するための振幅補正係数を算出すると共に、各振幅補正係数を各音素片の周波数スペクトルの振幅成分に乗算するものであることを特徴とした信号処理装置。
  10. 請求項3又は4において、
    該フレーム信号が隣接するフレーム信号と互いに一部重複しており、
    現フレーム信号に対して該補正を行って得たフレーム信号と、該現フレーム信号の直前のフレーム信号に対して該補正を行って得たフレーム信号との重複部分を加算合成する手段をさらに備えたことを特徴とする信号処理装置。
  11. 請求項1又は2において、
    該第1ステップの該所定の加工処理が、該第1フレーム信号の周波数スペクトルの振幅成分から雑音スペクトルを推定すると共に、該雑音スペクトルに基づき該第1フレーム信号の周波数スペクトルの振幅成分中の雑音を抑圧するものであることを特徴とした信号処理方法。
  12. 請求項1又は2において、
    該第1ステップの該所定の加工処理が、該所定の窓関数を施した参照フレーム信号の周波数スペクトルの振幅成分と、該第1フレーム信号の周波数スペクトルの振幅成分とを比較してエコーを抑圧するための抑圧係数を算出すると共に、該抑圧係数を該第1フレーム信号の周波数スペクトルの振幅成分に乗算するものであることを特徴とした信号処理方法。
JP2006233763A 2006-08-30 2006-08-30 信号処理方法及び装置 Expired - Fee Related JP4827661B2 (ja)

Priority Applications (5)

Application Number Priority Date Filing Date Title
JP2006233763A JP4827661B2 (ja) 2006-08-30 2006-08-30 信号処理方法及び装置
US11/637,809 US8738373B2 (en) 2006-08-30 2006-12-13 Frame signal correcting method and apparatus without distortion
EP06256371A EP1895514B1 (en) 2006-08-30 2006-12-14 Signal processing method and apparatus
DE602006012831T DE602006012831D1 (de) 2006-08-30 2006-12-14 Verfahren und Vorrichtung zur Signalverarbeitung
CN2007100015488A CN101136204B (zh) 2006-08-30 2007-01-05 信号处理方法和设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006233763A JP4827661B2 (ja) 2006-08-30 2006-08-30 信号処理方法及び装置

Publications (2)

Publication Number Publication Date
JP2008058480A JP2008058480A (ja) 2008-03-13
JP4827661B2 true JP4827661B2 (ja) 2011-11-30

Family

ID=38691798

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006233763A Expired - Fee Related JP4827661B2 (ja) 2006-08-30 2006-08-30 信号処理方法及び装置

Country Status (5)

Country Link
US (1) US8738373B2 (ja)
EP (1) EP1895514B1 (ja)
JP (1) JP4827661B2 (ja)
CN (1) CN101136204B (ja)
DE (1) DE602006012831D1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
JP6303340B2 (ja) * 2013-08-30 2018-04-04 富士通株式会社 音声処理装置、音声処理方法及び音声処理用コンピュータプログラム
JP2015206874A (ja) * 2014-04-18 2015-11-19 富士通株式会社 信号処理装置、信号処理方法、及び、プログラム
CN105791530B (zh) * 2014-12-26 2019-04-16 联芯科技有限公司 输出音量调节方法和装置
US10070342B2 (en) * 2015-06-19 2018-09-04 Apple Inc. Measurement denoising
JP6445417B2 (ja) * 2015-10-30 2018-12-26 日本電信電話株式会社 信号波形推定装置、信号波形推定方法、プログラム
CN107316652B (zh) * 2017-06-30 2020-06-09 北京睿语信息技术有限公司 侧音消除方法及装置
CN109817196B (zh) * 2019-01-11 2021-06-08 安克创新科技股份有限公司 一种噪音消除方法、装置、系统、设备及存储介质
CN110349594A (zh) * 2019-07-18 2019-10-18 Oppo广东移动通信有限公司 音频处理方法、装置、移动终端及计算机可读存储介质

Family Cites Families (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL84948A0 (en) * 1987-12-25 1988-06-30 D S P Group Israel Ltd Noise reduction system
GB8801014D0 (en) * 1988-01-18 1988-02-17 British Telecomm Noise reduction
US5179626A (en) * 1988-04-08 1993-01-12 At&T Bell Laboratories Harmonic speech coding arrangement where a set of parameters for a continuous magnitude spectrum is determined by a speech analyzer and the parameters are used by a synthesizer to determine a spectrum which is used to determine senusoids for synthesis
JPH02288520A (ja) * 1989-04-28 1990-11-28 Hitachi Ltd 背景音再生機能付き音声符号復号方式
JP2940005B2 (ja) * 1989-07-20 1999-08-25 日本電気株式会社 音声符号化装置
JPH04259962A (ja) * 1991-02-14 1992-09-16 Hitachi Ltd オーディオデータ出力回路
JP2746033B2 (ja) * 1992-12-24 1998-04-28 日本電気株式会社 音声復号化装置
US5583961A (en) * 1993-03-25 1996-12-10 British Telecommunications Public Limited Company Speaker recognition using spectral coefficients normalized with respect to unequal frequency bands
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp., Peabody Verringerung des hintergrundrauschens zur sprachverbesserung
JPH07193548A (ja) * 1993-12-25 1995-07-28 Sony Corp 雑音低減処理方法
US5506910A (en) * 1994-01-13 1996-04-09 Sabine Musical Manufacturing Company, Inc. Automatic equalizer
FR2726392B1 (fr) * 1994-10-28 1997-01-10 Alcatel Mobile Comm France Procede et dispositif de suppression de bruit dans un signal de parole, et systeme avec annulation d'echo correspondant
US5774846A (en) * 1994-12-19 1998-06-30 Matsushita Electric Industrial Co., Ltd. Speech coding apparatus, linear prediction coefficient analyzing apparatus and noise reducing apparatus
JPH08254993A (ja) 1995-03-16 1996-10-01 Toshiba Corp 音声合成装置
US5668925A (en) * 1995-06-01 1997-09-16 Martin Marietta Corporation Low data rate speech encoder with mixed excitation
JP3591068B2 (ja) * 1995-06-30 2004-11-17 ソニー株式会社 音声信号の雑音低減方法
JP3680380B2 (ja) * 1995-10-26 2005-08-10 ソニー株式会社 音声符号化方法及び装置
TW321810B (ja) * 1995-10-26 1997-12-01 Sony Co Ltd
JP3707154B2 (ja) * 1996-09-24 2005-10-19 ソニー株式会社 音声符号化方法及び装置
US6011846A (en) * 1996-12-19 2000-01-04 Nortel Networks Corporation Methods and apparatus for echo suppression
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6044341A (en) * 1997-07-16 2000-03-28 Olympus Optical Co., Ltd. Noise suppression apparatus and recording medium recording processing program for performing noise removal from voice
US6070137A (en) * 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech
JP4249821B2 (ja) * 1998-08-31 2009-04-08 富士通株式会社 ディジタルオーディオ再生装置
KR100341197B1 (ko) * 1998-09-29 2002-06-20 포만 제프리 엘 오디오 데이터로 부가 정보를 매립하는 방법 및 시스템
JP2000252891A (ja) * 1999-02-26 2000-09-14 Toshiba Corp 信号処理装置
JP4242516B2 (ja) * 1999-07-26 2009-03-25 パナソニック株式会社 サブバンド符号化方式
KR100304666B1 (ko) * 1999-08-28 2001-11-01 윤종용 음성 향상 방법
US6405163B1 (en) * 1999-09-27 2002-06-11 Creative Technology Ltd. Process for removing voice from stereo recordings
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
US6931292B1 (en) * 2000-06-19 2005-08-16 Jabra Corporation Noise reduction method and apparatus
JP3566197B2 (ja) 2000-08-31 2004-09-15 松下電器産業株式会社 雑音抑圧装置及び雑音抑圧方法
US6947888B1 (en) * 2000-10-17 2005-09-20 Qualcomm Incorporated Method and apparatus for high performance low bit-rate coding of unvoiced speech
JP4067762B2 (ja) * 2000-12-28 2008-03-26 ヤマハ株式会社 歌唱合成装置
JP4282227B2 (ja) * 2000-12-28 2009-06-17 日本電気株式会社 ノイズ除去の方法及び装置
FR2820227B1 (fr) * 2001-01-30 2003-04-18 France Telecom Procede et dispositif de reduction de bruit
EP2242049B1 (en) * 2001-03-28 2019-08-07 Mitsubishi Denki Kabushiki Kaisha Noise suppression device
CN1240051C (zh) * 2001-04-09 2006-02-01 皇家菲利浦电子有限公司 语音增强设备
AU2002314933A1 (en) * 2001-05-30 2002-12-09 Cameronsound, Inc. Language independent and voice operated information management system
JP3457293B2 (ja) * 2001-06-06 2003-10-14 三菱電機株式会社 雑音抑圧装置及び雑音抑圧方法
EP1292036B1 (en) * 2001-08-23 2012-08-01 Nippon Telegraph And Telephone Corporation Digital signal decoding methods and apparatuses
JP4518714B2 (ja) * 2001-08-31 2010-08-04 富士通株式会社 音声符号変換方法
US7333929B1 (en) * 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
US7386217B2 (en) * 2001-12-14 2008-06-10 Hewlett-Packard Development Company, L.P. Indexing video by detecting speech and music in audio
CA2388439A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP4178319B2 (ja) * 2002-09-13 2008-11-12 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声処理におけるフェーズ・アライメント
WO2004040555A1 (ja) * 2002-10-31 2004-05-13 Fujitsu Limited 音声強調装置
AU2003283892A1 (en) * 2002-11-27 2004-06-18 Visual Pronunciation Software Limited A method, system and software for teaching pronunciation
FR2849727B1 (fr) * 2003-01-08 2005-03-18 France Telecom Procede de codage et de decodage audio a debit variable
US7630889B2 (en) * 2003-04-08 2009-12-08 Nec Corporation Code conversion method and device
JP3744934B2 (ja) * 2003-06-11 2006-02-15 松下電器産業株式会社 音響区間検出方法および装置
JP4259962B2 (ja) 2003-09-03 2009-04-30 花王株式会社 ガセット袋
US7224810B2 (en) * 2003-09-12 2007-05-29 Spatializer Audio Laboratories, Inc. Noise reduction system
JP4520732B2 (ja) * 2003-12-03 2010-08-11 富士通株式会社 雑音低減装置、および低減方法
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
EP1585112A1 (en) * 2004-03-30 2005-10-12 Dialog Semiconductor GmbH Delay free noise suppression
JP4434813B2 (ja) * 2004-03-30 2010-03-17 学校法人早稲田大学 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
US7454332B2 (en) * 2004-06-15 2008-11-18 Microsoft Corporation Gain constrained noise suppression
KR100677126B1 (ko) * 2004-07-27 2007-02-02 삼성전자주식회사 레코더 기기의 잡음 제거 장치 및 그 방법
EP1840871B1 (en) * 2004-12-27 2017-07-12 P Softhouse Co. Ltd. Audio waveform processing device, method, and program
TWI324336B (en) * 2005-04-22 2010-05-01 Qualcomm Inc Method of signal processing and apparatus for gain factor smoothing
EP1901432B1 (en) * 2005-07-07 2011-11-09 Nippon Telegraph And Telephone Corporation Signal encoder, signal decoder, signal encoding method, signal decoding method, program, recording medium and signal codec method
JP2007034184A (ja) * 2005-07-29 2007-02-08 Kobe Steel Ltd 音源分離装置,音源分離プログラム及び音源分離方法
US8233636B2 (en) * 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
JP4827661B2 (ja) * 2006-08-30 2011-11-30 富士通株式会社 信号処理方法及び装置
JP4836720B2 (ja) * 2006-09-07 2011-12-14 株式会社東芝 ノイズサプレス装置
EP2579255B1 (en) * 2010-05-25 2014-11-26 Nec Corporation Audio signal processing

Also Published As

Publication number Publication date
US20080059162A1 (en) 2008-03-06
US8738373B2 (en) 2014-05-27
CN101136204B (zh) 2010-05-19
EP1895514B1 (en) 2010-03-10
CN101136204A (zh) 2008-03-05
JP2008058480A (ja) 2008-03-13
DE602006012831D1 (de) 2010-04-22
EP1895514A3 (en) 2008-09-10
EP1895514A2 (en) 2008-03-05

Similar Documents

Publication Publication Date Title
JP4827661B2 (ja) 信号処理方法及び装置
JP5435204B2 (ja) 雑音抑圧の方法、装置、及びプログラム
JP4958303B2 (ja) 雑音抑圧方法およびその装置
JP4753821B2 (ja) 音信号補正方法、音信号補正装置及びコンピュータプログラム
JP4886715B2 (ja) 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体
US20100010808A1 (en) Method, Apparatus and Computer Program for Suppressing Noise
JP5042823B2 (ja) 音声信号反響除去
KR20080042166A (ko) 잡음 억압을 위한 방법과 장치, 및 컴퓨터 프로그램
JP2006337415A (ja) 雑音抑圧の方法及び装置
CN105144290B (zh) 信号处理装置、信号处理方法和信号处理程序
JPWO2009028023A1 (ja) エコー抑制装置、エコー抑制システム、エコー抑制方法及びコンピュータプログラム
US20130311189A1 (en) Voice processing apparatus
JP2008216721A (ja) 雑音抑圧の方法、装置、及びプログラム
US9792925B2 (en) Signal processing device, signal processing method and signal processing program
JP2007006525A (ja) ノイズ除去の方法及び装置
JP2003140700A (ja) ノイズ除去方法及び装置
JP4434813B2 (ja) 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
JP5985306B2 (ja) 雑音低減装置および雑音低減方法
JP2010204392A (ja) 雑音抑圧の方法、装置、及びプログラム
JP3849679B2 (ja) 雑音除去方法、雑音除去装置およびプログラム
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
JP5321171B2 (ja) 音処理装置およびプログラム
JP2013130815A (ja) 雑音抑圧装置
JP5066141B2 (ja) 信号強調装置、方法及びプログラム
JP2022011893A (ja) ノイズ抑圧回路

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090512

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110308

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110420

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110801

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110913

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110913

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140922

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4827661

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees