FI114248B - Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen - Google Patents

Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen Download PDF

Info

Publication number
FI114248B
FI114248B FI971108A FI971108A FI114248B FI 114248 B FI114248 B FI 114248B FI 971108 A FI971108 A FI 971108A FI 971108 A FI971108 A FI 971108A FI 114248 B FI114248 B FI 114248B
Authority
FI
Finland
Prior art keywords
audio signal
quantized
frequency
predicted
signal
Prior art date
Application number
FI971108A
Other languages
English (en)
Swedish (sv)
Other versions
FI971108A (fi
FI971108A0 (fi
Inventor
Lin Yin
Original Assignee
Nokia Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Corp filed Critical Nokia Corp
Publication of FI971108A0 publication Critical patent/FI971108A0/fi
Priority to FI971108A priority Critical patent/FI114248B/fi
Priority to PCT/FI1998/000146 priority patent/WO1998042083A1/en
Priority to AU62164/98A priority patent/AU733156B2/en
Priority to KR10-1999-7008369A priority patent/KR100469002B1/ko
Priority to ES98904191T priority patent/ES2164414T3/es
Priority to EP98904191A priority patent/EP0966793B1/en
Priority to US09/036,102 priority patent/US6721700B1/en
Priority to SE9800776A priority patent/SE521129C2/sv
Priority to GB9805294A priority patent/GB2323759B/en
Priority to DE19811039A priority patent/DE19811039B4/de
Priority to FR9803135A priority patent/FR2761801B1/fr
Priority to JP06351498A priority patent/JP3391686B2/ja
Priority to CNB981041809A priority patent/CN1135721C/zh
Publication of FI971108A publication Critical patent/FI971108A/fi
Priority to JP2002293702A priority patent/JP2003140697A/ja
Priority to US10/704,068 priority patent/US7194407B2/en
Application granted granted Critical
Publication of FI114248B publication Critical patent/FI114248B/fi

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)

Description

1 114248
Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
Esillä oleva keksintö koskee audiokoodausmenetelmää ja -laitetta, sekä audiodekoodausmenetelmää ja -laitetta.
5
On yleisesti tunnettua, että lähettämällä data digitaalimuodossa saavutetaan tiedonsiirtokanavalla paremmat signaali-kohina suhteet ja kasvanut informaatiokapasiteetti. On kuitenkin olemassa jatkuva halu lisätä kanavan kapasiteettia kompressoimalla digitaalisia signaaleja vielä enemmän, ίο Audiosignaalien suhteen sovelletaan kahta kompression perusperiaatetta. Näistä ensimmäinen käsittää lähtösignaalissa olevien tilastollisten tai determinististen redundanssien poistamisen ja toinen taas käsittää sellaisten elementtien vaimentamisen tai eliminoinnin lähtösignaalista, jotka ovat redundantteja ihmisaistien kannalta. Viime aikoina jälkimmäisestä periaatteesta on tullut 15 vallitseva korkealuokkaisissa audiosovellluksissa ja siihen kuuluu tyypillisesti audiosignaalin jakaminen taajuuskomponentteihinsa (joita joskus kutsutaan "alikaistoiksi"), joista kukin analysoidaan ja kvantisoidaan kvantisointitarkkuudella jonka katsotaanpoistavan (kuulijan kannalta) epäoleellisen datan. ISO (International Standards Organization) MPEG (Moving Picture Expert Group) v .: 20 audiokoodausstandardi ja muut audiokoodaus-standardit käyttävät ja edelleen *.. : tarkentavat tätä periaatetta. Kuitenkin, MPEG (ja muut standardit) käyttävät myös ' ' tekniikkaa, joka tunnetaan nimellä "adaptiivinen (mukautuva) ennustaminen" [ ' saadakseen aikaan datan nopeuden alenemisen edelleen.
* t • · » *« · I t t **’ 25 Uuden MPEG-2 AAC standardin mukaisen kooderin toiminta on kuvattu yksityiskohtaisesti kansainvälisen standardidokumentin luonnoksessa ISO/IEC "'.I DIS 13818-7. Tämä uusi MPEG-2 soveltaa lineaarista taaksepäin ennustusta
1 I
käyttäen 672 taajuuskomponenttia 1024:sta. On odotettavissa, että uusi MPEG-4 standardi sisältää vastaavat vaatimukset. Kuitenkin, noin suuri määrä • « a • > ’ ·; · ’ 30 taajuuskomponentteja johtaa suuriin laskennan aiheuttamiin kustannuksiin johtuen ennustusalgoritmin monimutkaisuudesta ja se edellyttää myös että käytettävissä on runsaasti muistia laskettujen-ja välikertoimien tallentamista varten. On 2 114248 yleisesti tunnettua, että kun tämän tyyppisiä taaksepäin ennustimia käytetään taajuustasossa, on vaikeaa vähentää edelleen laskentakuormituksia ja muistivaatimuksia. Tämä johtuu siitä, että taajuustasossa ennustimien määrä on niin suuri, että hyvin yksinkertainenkin algoritmi johtaa monimutkaiseen 5 laskentaan ja suuriin muistivaatimuksiin. Vaikka tätä ongelmaa osataankin väistää käyttämällä eteenpäin ennustavia adaptiivisia ennustimia, jotka päivitetään enkooderissa ja lähetetään dekooderille, eteenpäin ennustavien adaptiivisten ennustimien käyttö taajuustasossa väistämättä johtaa suureen määrään "sivuinformaatiota" ennustimien suuresta määrästä johtuen.
10
Esillä olevan keksinnön tarkoitus on voittaa tunnettujen ennustusmenetelmien haitat, tai ainakin lieventää niitä.
Tämä ja muut tavoitteet saavutetaan koodaamalla audiosignaali käyttäen is virhesignaaleja poistamaan redundanssit jokaisesta monista audiosignaalin taajuuden alikaistoista ja lisäksi synnyttämään pitkän aikavälin aikatason ennustekertoimia, jotka mahdollistavat audiosignaalin kehyksen ennustamisen yhden tai useamman aikaisemman kehyksen perusteella.
20 Esillä olevan keksinnön ensimmäisessä toteutusmuodossa esitetään menetelmä > t : . * audiosignaalin koodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: * ‘ : vastaanotetaan koodattava signaali x; * » »t muodostetaan taajuusalikaistoja vastaanotetun audiosignaalin : ’ aikakehyksestä ; *·* ' 25 muodostetaan kvantisoitu audiosignaali x vastaanotetun audiosignaalin x perusteella; muodostetaan pitkän aikavälin ennustuskertoimien A sarja; I » ' I ’ jolle menetelmälle on tunnusomaista se, että * » · • · ·: ennustetaan vastaanotetun audiosignaalin käsiteltävänä oleva * t *·;* 30 aikakehys käyttäen pitkän aikavälin ennustuskertoimien A sarjaa kullekin : aikakehyksen taajuusalikaistoista suoraan ainakin yhden kvantisoidun audiosignaalin x aikaisemman aikakehyksen perusteella; 3 114248 käytetään ennustuskertoimien A sarjaa ennustetun audiosignaalin x muodostamiseksi kvantisoidusta audiosignaalista *; verrataan vastaanotettua audiosignaalia * ennustettuun audiosignaaliin x ja muodostetaan virhesignaali E(k) kullekin lukuisista taajuusalikaistoista; 5 kvantisoidaan virhesignaalit E(k) kvantisoitujen virhesignaalien E(k) joukon muodostamiseksi; ja yhdistetään kvantisoidut virhesignaalit E(k) ja ennustuskertoimet A koodatun audiosignaalin muodostamiseksi.
ίο Esillä oleva keksintö tarjoaa audiosignaalin kompressoinnin käyttäen eteenpäin ennustusta aikatasossa. Kutakin vastaanotetun signaalin aikakehystä kohti tarvitsee luoda ja lähettää vain yksi ryhmä eteenpäin ennustuksen ennustekertoimia dekooderille lähetettäväksi. Tämä poikkeaa tunnetuista eteenpäin ennustuksen tekniikoista, joissa täytyy luoda joukko ennustekertoimia is jokaisen kehyksen jokaista alikaistaa kohti. Verrattuna ennustehyötyihin, jotka saavutetaan esillä olevan keksinnön avulla, pitkän aikavälin ennustimen sivuinformaatio on merkityksetön.
Eräät keksinnön toteutusmuodot mahdollistavat laskennan monimutkaisuuden ja 20 muistivaatimusten vähentämisen. Erityisesti, verrattuna taaksepäin ennustuksen käyttöön, ei ole tarvetta laskea uudelleen ennustekertoimia dekooderissa. Eräät : keksinnön toteutusmuodot kykenevät myös vastaamaan signaalin muutoksiin : tavanomaisia taaksepäin ennustavia ennustimia nopeammin.
I I 4 · t » ‘: ‘!: 25 Eräässä keksinnön toteutusmuodossa vastaanotettu audiosignaali χ muunnetaan : " kehyksissä xm aikatasosta taajuustasoon taajuusalikaistasignaalien X(k) joukon ' · ’ saamiseksi. Ennustettu audiosignaali x muunnetaan samalla tavalla aikatasosta . taajuustasoon ennustettujen taajuus-alikaistasignaalien X (k) luomiseksi ja .···. vertailu vastaanotetun audiosignaalin^ ja ennustetun audiosignaalin x välillä 3o suoritetaan taajuustasossa, vertaamalla toisiaan vastaavia alikaistasignaaleja keskenään taajuusalikaista-virhesignaalien E(k) luomiseksi. Kvantisoitu • · * 4 114248 audiosignaali x synnytetään yhdistämällä ennustettu signaali ja kvantisoitu virhesignaali joko aikatasossa tai taajuustasossa.
Eräässä keksinnön vaihtoehtoisessa toteutusmuodossa vertailu vastaanotetun 5 audiosignaalin/ ja ennustetun audiosignaalinxvälillä suoritetaan aikatasossa, myös aikatasossa olevan virhesignaalin e luomiseksi. Tämä virhesignaali e muunnetaan sitten aikatasosta taajuustasoon mainitun taajuusalikaista-virhesignaalien E(k) joukon luomiseksi.
ίο Virhesignaalien kvantisointi suoritetaan edullisesti psyko-akustisen mallin mukaisesti.
Esillä olevan keksinnön erään toisen toteutusmuodon mukaisesti nyt on keksitty menetelmä koodatun audiosignaalin dekoodaamiseksi, jossa menetelmässä 15 vastaanotetaan koodattu audiosignaali joka sisältää kvantisoidun virhesignaalin E (k) kutakin audiosignaalin lukuisaa taajuusalikaistaa kohti ja, kutakin audiosignaalin kehystä kohti joukon ennustuskertoimia A, ja jolle menetelmälle on tunnusomaista se, että: , ennustuskertoimien joukkoa A voidaan käyttää vastaanotetun • = » 20 audiosignaalin käsiteltävän aikakehyksen xm kunkin taajuusalikaistan • · ... : ennustamiseen ainakin yhden rekonstruoidun kvantisoidun audiosignaalin x .; · ; aikaisemman kehyksen perusteella; j*> , muodostetaan mainittu rekonstruoitu kvantisoitu audiosignaali x • : [! : kvantisoitujen virhesignaalien E (k) perusteella; ja 25 käytetään ennustuskertoimia A ja rekonstruoituja kvantisoituja ···:’ audiosignaaleja x ennustetun audiosignaalin x muodostamiseksi, jolloin mainittu rekonstruoitu kvantisoitu audiosignaali muodostetaan yhdistämällä kvantisoidut virhesignaalit E (k) ja ennustettu audiosignaali x.
30 Dekoodausmenetelmä voi sisältää vaiheen, jossa ennustettu audiosignaali x muunnetaan aikatasosta taajuustasoon, jotta saadaan joukko ennustettuja 5 114248 taajuusalikaistasignaaleja X (k) yhdistettäväksi kvantisoituihin virhesignaaleihin E (k) rekonstruoitujen taajuusalikaistasignaalien X (k) joukon luomiseksi. Tämän jälkeen rekonstruoitu kvantisoitu audiosignaali x luodaan suorittamalla rekonstruoiduille taajuusalikaistasignaaleille X (k) muunnos taajuustasosta 5 aikatasoon. Tämä toteutusmuoto on erityisen sovelias silloin, kun vastaanotetaan ainoastaan alaryhmä kaikista mahdollisista kvantisoiduista virhesignaaleista E (k) ja osa alikaistatiedoista lähetetään suoraan lähettämällä audioalikaistasignaalit X(k). Signaalit x (k) ja X(k) yhdistetään asianmukaisesti ennen taajuus-aika muunnoksen suorittamista.
10
Eräässä dekoodausmenetelmän vaihtoehtoisessa toteutusmuodossa menetelmään sisältyy alkuvaihe, jossa muunnetaan kvantisoidut virhesignaalit E (k) taajuustasosta aikatasoon kvantisoidun aikatason virhesignaalin ε luomiseksi. Tämä virhesignaali yhdistetään sen jälkeen suoraan ennustetun 15 audiosignaalinx kanssa rekonstruoidun audiosignaalini luomiseksi.
Esillä olevan keksinnön erään kolmannen toteutusmuodon mukaisesti nyt on keksitty laite audiosignaalin koodaamiseen, joka laite käsittää: sisäänmenon koodattavan audiosignaalin x vastaanottamiseksi; 20 ensimmäiset generointivälineet (1) taajuusalikaistojen muodostamiseksi vastaanotetun audiosignaalin aikakehyksestä; *. . mainittuun sisäänmenoon kytketyt prosessointivälineet (2,3; 15-19) . 1 ; kvantisoidun audiosignaalin x muodostamiseksi vastaanotetun • ; · i audiosignaalin x perusteella; ja jolle laitteelle on tunnusomaista se, että laite ·:· : 25 käsittää: . mainittuihin prosessointivälineisiin (3) liitetyt ennustusvälineet (12; 19) : t; : pitkän aikavälin ennustuskertoimien A joukon muodostamiseksi käytettäväksi kullekin aikakehyksen taajuusalikaistalle vastaanotetun audiosignaalin 1 käsiteltävänä olevan aikakehyksen xm ennustamiseksi suoraan ainakin ·;·1 30 yhden kvantisoidun audiosignaalin x aikaisemman kehyksen perusteella; toiset generointivälineet (10-14;20,15) ennustetun audiosignaalin x • 1» :: muodostamiseksi käyttäen pitkän aikavälin ennustuskertoimia A ja · • 1
t I I
• · · • · t 6 114248 kvantisoitua audiosignaalia x ja vastaanotetun audiosignaalin x vertaamiseksi ennustettuun audiosignaaliin x virhesignaalin E(k) muodostamiseksi kullekin lukuisista taajuusalikaistoista; kvantisointivälineet (3; 17) virhesignaalien E{k) kvantisoimiseksi 5 kvantisoitujen virhesignaalien E(k) joukon muodostamiseksi; ja yhdistämisvälineet (5;21) kvantisoitujen virhesignaalien E (k) yhdistämiseksi ennustuskertoimiin A koodatun audiosignaalin muodostamiseksi.
ίο Eräässä toteututusmuodossa mainitut generointivälineet käsittävät ensimmäiset muunnosvälineet vastaanotetun audiosignaalin^ muuntamiseksi aikatasosta taajuustasoon ja toiset muunnosvälineet ennustetun audiosignaalinx muuntamiseksi aikatasosta taajuustasoon, sekä vertailuvälineet jotka on järjestetty vertailemaan saatuja taajuustason signaaleja taajuustasossa.
15
Eräässä keksinnön vaihtoehtoisessa toteututusmuodossa generointivälineet on järjestetty vertailemaan vastaanotettua audiosignaalia^ ja ennustettua audiosignaalia £ aikatasossa.
· ; 20 Erään esillä olevan keksinnön neljännen toteutusmuodon mukaisesti on keksitty * • laite vastaanotetun koodatun audiosignaalin^ dekoodaamiseksi, jolle * : laitteelle on tunnusomaista se, että: : ’’ koodattu audiosignaali sisältää kvantisoidun virhesignaalin E (k) kutakin f · I ·
lukuisaa audiosignaalin taajuusalikaistaa kohti ja sarjan ennustuskertoimia A
25 käytettäväksi kullekin audiosignaalin aikakehyksen taajuusalikaistalle ja jossa ’ ennustuskertoimia A voidaan käyttää ennustamaan vastaanotetun * · audiosignaalin käsiteltävä kehys xm ainakin yhden rekonstruoidun < * · kvantisoidun audiosignaalin 3c aikaisemman kehyksen perusteella, joka laite * · käsittää: • * · *·’ 30 sisäänmenon koodatun audiosignaalin vastaanottamiseksi; • I · t * • · 7 114248 generoimisvälineet (24,25,9) rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi kvantisoitujen virhesignaalien E (k) perusteella; ja signaalinkäsittelyvälineet (26) ennustetun audiosignaalin x 5 muodostamiseksi ennustuskertoimien A ja mainitun rekonstruoidun kvantisoidun audiosignaalin x perusteella, jossa mainitut generoimisvälineet käsittävät yhdistämisvälineet (24,25) ennustetun audiosignaalin x ja kvantisoitujen virhesignaalien E{k) yhdistämiseksi rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi.
10
Seuraavassa keksinnön ymmärtämiseksi paremmin ja keksinnön toteuttamisen havainnollistamiseksi esimerkkien avulla viitataan oheisiin kuviin, joissa:
Kuva 1 esittää kaaviona kooderia vastaanotetun audiosignaalin koodaamiseksi,
Kuva 2 esittää kaaviona dekooderia Kuvan 1 mukaisella kooderilla koodatun 15 audiosignaalin dekoodaamiseksi,
Kuva 3 esittää tarkemmin Kuvan 1 mukaista kooderia ja kooderin sisältämää ennustustyökalua;
Kuva 4 esittää tarkemmin Kuvan 2 mukaista dekooderia ja dekooderin sisältämää , ennustustyökalua; ja t 20 Kuva 5 esittää tarkemmin erästä Kuvan 1 mukaisen kooderin muunnosta, joka : käsittää vaihtoehtoisen ennustustyökalun.
«•tl • I
Kuva 1 esittää lohkokaaviona enkooderin, joka suorittaa koodaustoiminnon, joka : on määritelty yleisluontoisesti standardissa MPEG-2 AAC. Sisääntulo kooderille 25 on näytteistetty yksivaiheinen signaali x, jonka näytepisteet on ryhmitelty -;* aikakehyksiin tai 2N pisteen ryhmiin, esim.
O *,, = (*„(0).*,,(1)>·.·*.,(2Λ-1))Γ (1) » jossa m on ryhmän tunnus ja T ilmaisee transpoosi-operaation. Näytepisteiden . 30 ryhmittely tehdään suodatinpankkityökalulla 1, joka suorittaa myös muunnetun erillisen kosinimuunnoksen (MDCT) kullekin audiosignaalin yksittäiselle kehykselle taajuusalikaistakertoimien joukon saamiseksi.
, Ή4248 Χ„, = (X„(0),X„(1)„..X„(W - 1))’ (2)
Alikaistat on määritelty MPEG-standardissa.
Eteenpäin ennustavan MDCT:n määrittelee: 5 2ΛΤ-1 π *„(*) = Σ /(i)x„(i)cos(—(2i +1 + N XU + 1)), (3) <=o 4^· k= 0....Λ/-1 jossa /(/) on analyysi-synteesi ikkuna, joka on sellainen symmetrinen ikkuna, että ίο sen lisäys-päällekkäisyysvaikutus tuottaa yksikkövahvistuksen signaaliin.
Taajuusalikaistasignaalit X(k) syötetään vuorollaan ennustustyökalulle 2 (jota kuvataan tarkemmin jäljempänä), joka pyrkii eliminoimaan pitkäaikaisredundanssin kustakin taajuusalikaistasignaalista. Tuloksena saadaan 15 sarja taajuusalikaistojen virhesignaaleja.
= (4) jotka ilmaisevat pitkän aikavälin muutoksia vastaavissa alikaistoissa, sekä sarjan eteenpäin ennustuksen kertoimia A kullekin kehykselle.
• * * · 20 Alikaistavirhesignaalit E(k)syötetään kvantisoijalle 3, joka kvantisoi kunkin • : : signaalin psykoakustisen mallin määräämällä bittimäärällä. Tätä mallia soveltaa ·' .. ohjausyksikkö 4. Kuten mainittiin, psykoakustinen malli mallintaa ihmisen kuulon : peitto-ominaisuuksia. Kvantisoidut virhesignaalit E(k)]a ennustuskertoimetΛ yhdistetään tämän jälkeen bittivirran multiplekserissä 5 lähetettäväksi .. ’: ’ 25 lähetyskanavan 6 kautta.
• *
Kuva 2 esittää Kuvan 1 mukaisella kooderilla koodatun audiosignaalin dekoodaukseen tarkoitetun dekooderin yleisrakenteen. Bittivirran demultiplekseri 7 erottaa ensiksi ennustuskertoimet^ kvantisoiduista virhesignaaleista E (k) ja 30 erottaa virhesignaalit erillisiksi alikaistasignaaleiksi. Ennustuskertoimet/i ja 9 114248 kvantisoidut alikaistavirhesignaalit E (k) syötetään ennustustyökalulle 8 joka suorittaa kooderissa tehdylle ennustusprosessille käänteisen operaation, eli ennustustyökalu palauttaa kooderissa poistetun redundanssin rekonstruoitujen kvantisoitujen alikaistasignaalien X(k) muodostamiseksi. Suodatinpankkityökalu 5 9 palauttaa tämän jälkeen aikatason signaalin x vastaanotetun version X(k) käänteisellä muunnoksella, jota kuvaa *(*) = “-i0‘ + N) + um(i), (5) i = Ο,.,.,Ν -1 jossa uk(i),i = 0,...2N -1 ovat X :n käänteinen muunnos 10 um(i) = / (i)£xm(*)cos(-^(2i + 1+ N)(2k +1)), i = 0,...,2N -1 ja joka approksimoi alkuperäistä audiosignaalia jc .
Kuva 3 kuvaa yksityiskohtaisemmin Kuvan 1 esittämän kooderin 15 ennustusmenetelmää. Käyttämällä kvantisoituja taajuusalikaista-virhesignaaleja E(k) prosessointiyksikkö 10 muodostaa sarjan kvantisoituja taajuusalikaistasignaaleja X(k). Signaalit X(k) syötetään vuorostaan suodatinpankkiin 11, joka käsittelee signaaleja käänteisellä erillisellä kosinimuunnoksella (IMDCT) kvantisoidun aikatason signaalin x ·' 20 muodostamiseksi. Tämän jälkeen signaalia syötetään pitkän aikavälin • · · ‘ ennustustyökaluun 12 joka vastaanottaa myös tulevan audiosignaalin x.
Ennustustyökalu 12 käyttää pitkän aikavälin (LT) ennustinta poistamaan ' ,]* redundanssin käsiteltävänä olevassa kehyksessä m+1 olevasta audiosignaalista aikaisemman kvantisoidun datan perusteella.
. 25 Tämän ennustimen siirtofunktio P on: »* * · t ... m-> ^ω= Σ^"(“+ί) (5) φ k = -m i ['.V.' jossa a edustaa pitkää, 1 - 1024 näytteen viivettä ja bk edustaa • · ♦ ennustuskertoimia.
* I · • · • % .0 114248
Kun mi = m2 = 0 ennustin on Ί-tappinen", kun mi = m2 = 1 ennustin on "3-tappinen1'.
Parametrit a ja bk määritetään LT-ennustuksen jälkeen minimoimalla 5 keskineliövirhe (MSE) 2N näytteen jaksolta. Yhden "tap'in" ennustinta käytettäessä pitkän aikavälin ennusteen jäännössignaaliksi r(i) saadaan: r(i) = x(i) - bx(i - 2N + 1 + a) (6) jossa * on aikatason audiosignaali ja x on kvantisoitu aikatason signaali. Keskimääräinen neliöity jäännössignaali R saadaan yhtälöstä: 2N-1 2N-1 10 R= £r2(0= ^(x(i)-bx(i- 2N + l-a))2 (7) i=0 /=0
Asettamalla dR! db = 0, saadaan V2N 1 jc(i)jc(i - 2 N +1 + a) b = -2M - (8) XN_o\x(i-2N-a)f ja kun yhtälöön (7) sijoitetaan b, saadaan 15 (9) Σ,·=0 (^C«-22V + 1 -a))2
Termin R minimoiminen maksimoi yhtälön (9) oikean puolen toisen termin. Tämä termi lasketaan kaikilla mahdollisilla a :n arvoilla sille määritellyllä alueella, ja * ‘ valitaan se a :n arvo joka maksimoi tämän termin. Nimittäjän energia Ω voidaan e · · · * helposti, uudelleen laskemisen sijasta, päivittää viiveestä (a -1) arvoon a * , 20 seuraavan yhtälön avulla: ; Ωα=Ωα_ι+χ\-α)-(-α + Ν) (10)
Jos käytetään yhden "tap'in" ennustinta, yhtälöä (8) käytetään laskettaessa ·:··: ennustekerroin bj. Jos kyseessä on j "tap'in" ennustin, LT ennusteviive a '...: määritetään aluksi maksimoimalla yhtälön (9) toinen termi ja tämän jälkeen :· 25 ratkaistaan jxjyhtälön joukko j ennustekertoimen laskemiseksi.
• · • · «· · 11 114248 LT ennustusparametrit^ ovat viive a ja ennustekerroin bj. Viive kvantisoidaan 9 - 11 bitin tarkkuudella, käytetystä alueesta riippuen. Tavallisimmin käytetään 10 bittiä, jolloin arvoja voi olla 1024 välillä 1 -1024. Bittimäärän alentamiseksi LT ennusteviiveet voidaan deltakoodata 5 bitin tarkkuudella parillisissa kehyksinä.
5 Kokeet osoittavat että vahvistuksen koodaaminen 4 - 6 bitin tarkkuudella riittää. Vahvistuksen epätasaisesta jakaumasta johtuen on käytettävä epätasaista kvantisointia.
Edellä kuvatussa menetelmässä LT-synteesisuodattimen 1 / P(z) stabiilisuutta ei ίο aina voi taata. Yhden "tap'in" ennustimelle stabiilisuusehto on |ό| < 1. Tämän takia stabilointi voidaan toteuttaa helposti asettamalla |ö| = 1 aina kun |&| > 1. Kun kyseessä on 3 "tap'in" ennustin, voidaan suorittaa toinen stabilointimenettely, kuten on kuvattu artikkelissa R.P. Ramachandran and P. Kbal, "Stability and performance analysis of pitch filters in speech coders", IEEE Trans. ASSP, vol.
15 35, no.7, sivut 937-946, heinäkuu 1987. Kuitenkaan LT-synteesisuodattimen epästabiilisuus ei ole kovin haitallinen rekonstruoidun signaalin laadun kannalta.
Suodatin on epästabiili muutamien kehysten ajan (lisäten energiaa), mutta vähitellen päästään stabiileihin jaksoihin, jolloin ulostulon kasvu ei jatku ajan 1· funktiona.
> · : 20 • ·: Kun LT-ennustuskertoimet on määritetty, voidaan määrittää (m+1):nnen kehyksen ! ennustettu signaali: , x(i) = ^bjX(i-2N+ l-a), (11)
i = mN + \,mN + 2 1 )N
·; ; 25 Tämän jälkeen ennustettu aikatason signaali x syötetään suodatinpankkiin 13, joka käsittelee signaalia MDCT-menetelmällä (m+1):nnen kehyksen ennustettujen spektrikertoimien Xm+i(k) luomiseksi. Ennustetut spektrikertoimet X(k) t · *·;·’ vähennetään tämän jälkeen spektrikertoimista X(k) vähennysyksikössä 14.
• » · #11 · 12 114248
Jotta voitaisiin taata, että ennustusta käytetään ainoastaan jos se johtaa koodaushyötyyn, tarvitaan sopiva ennustimien ohjaus ja pieni määrä ennustimien ohjausinformaatiota pitää lähettää dekooderille. Tämä toiminto suoritetaan vähennysyksikössä 14. Ennustimen ohjausmenetelmä on sama kuin se 5 taaksepäin ennustuksen ohjausmenetelmä, jota on käytetty MPEG-2 Advanced Audio Coding (AAC):ssa. Kunkin kehyksen ennustuksen ohjausinformaatio, joka lähetetään sivuinformaationa, määritetään kahdessa vaiheessa. Ensiksi, kunkin skaalaustekijäkaistan osalta määritetään johtaako ennustus koodaushyötyyn vai ei, ja jos vastaus on kyllä, ennustin_käytössä bitti-arvoksi tuolle ίο skaalaustekijäkaistalle asetetaan yksi. Kun tämä on tehty kaikille skaalaustekijäkaistoille, määritetään kompensoiko tälle kehykselle ennustuksella saavutettu kokonaiskoodaushyöty ainakin ennustimen sivuinformaatiosta aiheutuvan lisäbittien tarpeen. Jos vastaus on kyllä, ennusti n_datajäsnä bitin arvoksi asetetaan yksi ja koko sivuinformaatio, mukaan lukien ennustimen 15 nollaukseen tarvittava, lähetetään ja ennustusvirheen arvo syötetään kvantisoijaan. Muussa tapauksessa ennustin_data_ läsnä -bitin arvoksi asetetaan 0 ja ennustin_käytössä bitit asetetaan kaikki nolliksi eikä niitä lähetetä. Tässä tapauksessa spektraalikomponentin arvo syötetään kvantisoijaan 3. Kuten edellä on esitetty, ennustuksen ohjaus kohdistuu ensin kaikkiin yhden 20 skaalauskerroinkaistan ennustimiin, mitä seuraa toinen vaihe joka kohdistuu kaikkiin skaalauskerroinkaistoihin.
»· * · » · «
On selvää että LT-ennustuksen tavoitteena on saavuttaa suurin ennustuksen kokonaishyöty. Merkitään G, :llä ennustushyötyä / :nnellä taajuusalikaistalla.
25 Ennustuksen kokonaishyöty tietyssä kehyksessä voidaan laskea seuraavasti: > · · G= ΣΟ, (12) /=i&(g>o) ‘ · ·. Jos hyöty kompensoi ennustimen sivuinformaation lisäbittien tarpeen, esim.
* · I
G > T(dB), koko sivuinformaatio lähetetään ja ne ennustimet jotka antavat » .**·. positiivisen hyödyn kytketään päälle. Muussa tapauksessa ennustimia ei käytetä.
*»* t · · 30 i3 1 14248
Edellä esitetyllä menetelmällä saadut LP-parametrit eivät ole suoraan verrannollisia hyödyn maksimointiin. Kuitenkin, laskemalla vahvistus jokaiselle lohkolle ja jokaiselle viiveelle valitulla alueella (tässä esimerkissä 1 - 1024) ja valitsemalla se viive, jolla saavutetaan suurin ennustuksen kokonaishyöty, 5 optimoidaan ennustusprosessi. Valittu viive a ja vastaavat kertoimet b lähetetään sivuinformaationa kvantisoitujen virhe-alikaistasignaalien mukana. Vaikka laskennan monimutkaisuus kooderissa kasvaa, laskennan monimutkaisuus dekooderissa ei lisäänny.
ίο Kuva 4 esittää yksityiskohtaisemmin Kuvan 2 dekooderia. Koodatun audiosignaalin vastaanottaa siirtokanavalta 6 bittivirran demultiplekseri 7, kuten edellä on kuvattu. Bittivirran demultiplekseri 7 erottelee ennustuskertoimet A ja kvantisoidut virhesignaalit E(k), sekä toimittaa ne ennustustyökalulle 8. Tämä työkalu käsittää yhdistäjän 24, joka yhdistää kvantisoidut virhesignaalit E(k) ja 15 ennustetun taajuustason audiosignaalin X(k) rekonstruoidun, myös taajuustasossa olevan, audiosignaalin X(k) synnyttämiseksi. Suodatinpankki 9 muuntaa rekonstruoidun signaalin X(k) taajuustasosta aikatasoon rekonstruoidun aikatason audiosignaalin x luomiseksi. Tämä signaali vuorostaan syötetään palautteena pitkän aikavälin ennustustyökalulle, joka vastaanottaa myös . 20 ennustuskertoimet A. Pitkän aikavälin ennustustyökalu 26 synnyttää ennustetun, käsiteltävän aikakehyksen aikaisempien rekonstruoitujen aikakehysten perusteella , ‘: käyttäen käsiteltävän kehyksen ennustekertoimia. Suodatinpankki 25 muuntaa . ennustetun signaalin x.
. 25 Kuva 5 esittää Kuvan 1 esittämän audiosignaalikooderin erästä vaihtoehtoista toteutustapaa, jossa vertailuyksikkö 15 vertaa koodattavaa audiosignaalia x ··· aikatasossa olevaan ennustettuun signaaliin x synnyttääkseen virhesignaalin e, • joka myös on aikatasossa. Suodatinpankkityökalu 16 muuntaa tämän jälkeen ,virhesignaalin aikatasosta taajuustasoon taajuusalikaista-virhesignaalien E(k) 30 joukon luomiseksi. Nämä signaalit kvantisoidaan tämän jälkeen kvantisoijassa 17 * · · .··. kvantisoitujen virhesignaalien E (k) joukon luomiseksi.
14 114248 Tämän jälkeen käytetään suodatinpankkia 18 muuntamaan kvantisoidut virhesignaalit E(k) takaisin aikatasoon, tuloksena signaali e . Tämä kvantisoitu aikatason virhesignaali e yhdistetään sen jälkeen signaalinkäsittely-yksikössä 19 5 ennustettuun aikatason signaaliin x kvantisoidun audiosignaalin x muodostamiseksi. Ennustustyökalu 20 suorittaa saman toiminnon kuin Kuvan 3 kooderin työkalu 12, muodostaen ennustetun audiosignaalin jc ja ennustuskertoimet A. Ennustuskertoimet ja kvantisoidut virhesignaalit yhdistetään bittivirran multiplekserissa 21 lähetettäväksi lähetyskanavalle 22. ίο Kuten edellä on esitetty, virhesignaalit kvantisoidaan ohjaimessa 23 psykoakustisen mallin mukaan.
Edellä kuvatut audiokoodausalgoritmit mahdollistavat audiosignaalien kompressoinnin alhaisilla bittinopeuksilla. Tekniikka perustuu pitkän aikavälin (LT) 15 ennustamiseen. Tunnettuihin taaksepäin ennustuksen tekniikkoihin verrattuna tässä kuvatut tekniikat tarjoavat suuremmat ennustushyödyt yksittäisille instrumentaalimusiikkisignaaleile ja puhesignaaleille, vaatien kuitenkin vain alhaista laskennan monimutkaisuutta.
t I · • > f
» I
• 1 tl· I » * · ·
• I
I I · 1 tl» ' i · I 1 · • • I1· * 1 · I » • « · » ♦ 1 » I 1 · II» ·

Claims (10)

15 114248
1. Menetelmä audiosignaalin koodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: 5 koodattava signaali x vastaanotetaan; muodostetaan taajuusalikaistoja vastaanotetun audiosignaalin aikakehyksestä; muodostetaan kvantisoitu audiosignaali x vastaanotetun audiosignaalin x perusteella; ίο muodostetaan pitkän aikavälin ennustuskertoimien A sarja; tunnettu siitä, että ennustetaan vastaanotetun audiosignaalin käsiteltävänä oleva aikakehys käyttäen pitkän aikavälin ennustuskertoimien A sarjaa kullekin aikakehyksen taajuusalikaistoista suoraan ainakin yhden kvantisoidun 15 audiosignaalin x aikaisemman aikakehyksen perusteella; käytetään ennustuskertoimien A sarjaa ennustetun audiosignaalin x muodostamiseksi kvantisoidusta audiosignaalista x ; verrataan vastaanotettua audiosignaalia x ennustettuun audiosignaaliin x ja muodostetaan virhesignaali E(k) kullekin lukuisista taajuusalikaistoista; I t * ' ·* 20 kvantisoidaan virhesignaalit E(k) kvantisoitujen virhesignaalien E (k) joukon muodostamiseksi; ja - · * * yhdistetään kvantisoidut virhesignaalit E (k) ja ennustuskertoimetyi : * 11 koodatun audiosignaalin muodostamiseksi. > · > ·
2. Vaatimuksen 1 mukainen menetelmä, tunnettu siitä, että :· menetelmä käsittää kehyksinä xm aikatasosta vastaanotetun :audiosignaalinx muuntamisen taajuustasoon taajuusalikaistasignaalien *;· X(k) muodostamiseksi ja ennustetun audiosignaalin x muuntamisen aikatasosta taajuustasoon ennustettujen taajuusalikaista-signaalien :‘j': 30 X(k) sarjan muodostamiseksi, ja jossa vertailu vastaanotetun audiosignaalinx ja ennustetun audiosignaalin x välillä suoritetaan 114248 16 taajuustasossa, verraten toisiaan vastaavia alikaistasignaaleja toisiinsa taajuusalikaista-virhesignaalien E(k) muodostamiseksi.
3. Menetelmä joka on vaatimuksen 1 mukainen, tunnettu siitä, että 5 menetelmä käsittää vastaanotetun audiosignaalin* ja ennustetun audiosignaalin * välillä aikatasossa suoritettavan vertailun myös aikatasossa olevan virhesignaalin e muodostamiseksi ja virhesignaalin e muuntamisen aikatasosta taajuustasoon mainittujen lukuisien taajuusalikaista-virhesignaalien E{k) muodostamiseksi. 10
4. Menetelmä koodatun audiosignaalin dekoodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: vastaanotetaan koodattu audiosignaali joka sisältää kvantisoidun virhesignaalin E{k) kutakin audiosignaalin lukuisaa taajuusalikaistaa kohti ja, 15 kutakin audiosignaalin kehystä kohti joukon ennustuskertoimia A, tunnettu siitä, että: ennustuskertoimien joukkoa Λ voidaan käyttää vastaanotetun audiosignaalin käsiteltävän aikakehyksen xm kunkin taajuusalikaistan , . ennustamiseen ainakin yhden rekonstruoidun kvantisoidun audiosignaalin x . · . 20 aikaisemman kehyksen perusteella; ·; : muodostetaan mainittu rekonstruoitu kvantisoitu audiosignaali x : i kvantisoitujen virhesignaalien E (k) perusteella; ja i · käytetään ennustuskertoimia Λ ja rekonstruoituja kvantisoituja v : audiosignaaleja x ennustetun audiosignaalin x muodostamiseksi, 25 jolloin mainittu rekonstruoitu kvantisoitu audiosignaali muodostetaan •;;; yhdistämällä kvantisoidut virhesignaalit E(k) ja ennustettu audiosignaali x. • · » I [ 5. Vaatimuksen 4 mukainen menetelmä, tunnettu siitä, että * ·; * * menetelmä käsittää seuraavat vaiheet: 30 ennustetun audiosignaalin x muuntaminen aikatasosta taajuustasoon » ennustettujen taajuusalikaista-signaalien X(k) sarjan muodostamiseksi ., 114248 yhdistettäväksi kvantisoituihin virhesignaaleihin E(k) rekonstruoitujen taajuusalikaista-signaalien X(k) joukon muodostamiseksi; ja rekonstruoitujen taajuusalikaistasignaalien X(k) muuntaminen taajuustasosta aikatasoon rekonstruoidun, kvantisoidun audiosignaalin x 5 muodostamiseksi.
6. Vaatimuksen 4 mukainen menetelmä, tunnettu siitä, että menetelmä käsittää seuraavat vaiheet: kvantisoitujen virhesignaalien E (k) muuntaminen taajuustasosta io aikatasoon kvantisoidun aikatason virhesignaalin e muodostamiseksi; ja aikatason kvantisoitujen virhesignaalien yhdistäminen suoraan ennustetun audiosignaalin x kanssa rekonstruoidun, kvantisoidun audiosignaalin 3c muodostamiseksi.
7. Laite audiosignaalin koodaamiseen, joka laite käsittää: sisäänmenon koodattavan audiosignaalin x vastaanottamiseksi; ensimmäiset generointivälineet (1) taajuusalikaistojen muodostamiseksi vastaanotetun audiosignaalin aikakehyksestä; : : mainittuun sisäänmenoon kytketyt prosessointivälineet (2,3;15-19) : ': 20 kvantisoidun audiosignaalin 3c muodostamiseksi vastaanotetun \ : audiosignaalin x perusteella; tunnettu siitä, että laite käsittää: *; : mainittuihin prosessointivälineisiin (3) liitetyt ennustusvälineet (12; 19) j · pitkän aikavälin ennustuskertoimien A joukon muodostamiseksi käytettäväksi v : kullekin aikakehyksen taajuusalikaistalle vastaanotetun audiosignaalin x 25 käsiteltävänä olevan aikakehyksen xm ennustamiseksi suoraan ainakin ;;; yhden kvantisoidun audiosignaalin 3c aikaisemman kehyksen perusteella; toiset generointivälineet (10-14;20,15) ennustetun audiosignaalin x *: ’ ‘: muodostamiseksi käyttäen pitkän aikavälin ennustuskertoimia A ja kvantisoitua audiosignaalia 3c ja vastaanotetun audiosignaalin x so vertaamiseksi ennustettuun audiosignaaliin x virhesignaalin E(k)muodostamiseksi kullekin lukuisista taajuusalikaistoista; „ 114248 kvantisointivälineet (3; 17) virhesignaalien £(ft)kvantisoimiseksi kvantisoitujen virhesignaalien E (k) joukon muodostamiseksi; ja yhdistämisvälineet (5;21) kvantisoitujen virhesignaalien E (k) yhdistämiseksi ennustuskertoimiin A koodatun audiosignaalin 5 muodostamiseksi.
8. Vaatimuksen 7 mukainen laite, tunnettu siitä, että mainitut toiset generoimisvälineet käsittävät ensimmäiset muuntamisvälineet (1) vastaanotetun audiosignaalin x muuntamiseksi aikatasosta taajuustasoon ja ίο toiset muuntamisvälineet (13) ennustetun audiosignaalin x muuntamiseksi aikatasosta taajuustasoon, sekä vertailuvälineet (14) jotka on järjestetty vertaamaan tulokseksi saatuja taajuustason signaaleja taajuustasossa.
9. Vaatimuksen 7 mukainen laite, tunnettu siitä, että toiset 15 generoimisvälineet on järjestetty vertaamaan vastaanotettua audiosignaalia x ennustettuun audiosignaaliin x aikatasossa.
10. Laite koodatun audiosignaalin x dekoodaamiseksi, tunnettu siitä, että: , ·. koodattu audiosignaali sisältää kvantisoidun virhesignaalin E (k) kutakin t : 20 lukuisaa audiosignaalin taajuusalikaistaa kohti ja sarjan ennustuskertoimia A ; *: käytettäväksi kullekin audiosignaalin aikakehyksen taajuusalikaistalle ja jossa *: *: ennustuskertoimia A voidaan käyttää ennustamaan vastaanotetun »» j ·· audiosignaalin käsiteltävä kehys xm ainakin yhden rekonstruoidun *’ kvantisoidun audiosignaalin x aikaisemman kehyksen perusteella, joka laite 25 käsittää: ·; ; sisäänmenon koodatun audiosignaalin vastaanottamiseksi; t · '*; · ‘ generoimisvälineet (24,25,9) rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi kvantisoitujen virhesignaalien E(k) perusteella; ja * t * • I · • • · 19 1 14248 signaalinkäsittelyvälineet (26) ennustetun audiosignaalin x muodostamiseksi ennustuskertoimien A ja mainitun rekonstruoidun kvantisoidun audiosignaalin x perusteella, jossa mainitut generoimisvälineet käsittävät yhdistämisvälineet (24,25) 5 ennustetun audiosignaalin x ja kvantisoitujen virhesignaalien E(k) yhdistämiseksi rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi. * I * f » * · • · : · • I · I · • · » t t · • IMU I * It* % t I I I • I I · t · · t · · » • · 2o 1 14248
FI971108A 1997-03-14 1997-03-14 Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen FI114248B (fi)

Priority Applications (15)

Application Number Priority Date Filing Date Title
FI971108A FI114248B (fi) 1997-03-14 1997-03-14 Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
PCT/FI1998/000146 WO1998042083A1 (en) 1997-03-14 1998-02-18 Audio coding method and apparatus
AU62164/98A AU733156B2 (en) 1997-03-14 1998-02-18 Audio coding method and apparatus
KR10-1999-7008369A KR100469002B1 (ko) 1997-03-14 1998-02-18 오디오 코딩 방법 및 장치
ES98904191T ES2164414T3 (es) 1997-03-14 1998-02-18 Metodo y aparato para codificacion de audio.
EP98904191A EP0966793B1 (en) 1997-03-14 1998-02-18 Audio coding method and apparatus
US09/036,102 US6721700B1 (en) 1997-03-14 1998-03-06 Audio coding method and apparatus
SE9800776A SE521129C2 (sv) 1997-03-14 1998-03-10 Sätt och anordning för audiokodning
GB9805294A GB2323759B (en) 1997-03-14 1998-03-12 Audio coding method and apparatus
DE19811039A DE19811039B4 (de) 1997-03-14 1998-03-13 Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen
FR9803135A FR2761801B1 (fr) 1997-03-14 1998-03-13 Methode de codage audio et dispositif
JP06351498A JP3391686B2 (ja) 1997-03-14 1998-03-13 符号化されたオーディオ信号を復号する方法及び装置
CNB981041809A CN1135721C (zh) 1997-03-14 1998-03-13 音频信号编码方法及其有关设备
JP2002293702A JP2003140697A (ja) 1997-03-14 2002-10-07 オーディオ信号を符号化する方法及び装置
US10/704,068 US7194407B2 (en) 1997-03-14 2003-11-07 Audio coding method and apparatus

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FI971108 1997-03-14
FI971108A FI114248B (fi) 1997-03-14 1997-03-14 Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen

Publications (3)

Publication Number Publication Date
FI971108A0 FI971108A0 (fi) 1997-03-14
FI971108A FI971108A (fi) 1998-09-15
FI114248B true FI114248B (fi) 2004-09-15

Family

ID=8548401

Family Applications (1)

Application Number Title Priority Date Filing Date
FI971108A FI114248B (fi) 1997-03-14 1997-03-14 Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen

Country Status (13)

Country Link
US (2) US6721700B1 (fi)
EP (1) EP0966793B1 (fi)
JP (2) JP3391686B2 (fi)
KR (1) KR100469002B1 (fi)
CN (1) CN1135721C (fi)
AU (1) AU733156B2 (fi)
DE (1) DE19811039B4 (fi)
ES (1) ES2164414T3 (fi)
FI (1) FI114248B (fi)
FR (1) FR2761801B1 (fi)
GB (1) GB2323759B (fi)
SE (1) SE521129C2 (fi)
WO (1) WO1998042083A1 (fi)

Families Citing this family (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2380640A (en) * 2001-08-21 2003-04-09 Micron Technology Inc Data compression method
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7016547B1 (en) 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
EP2006840B1 (en) 2002-09-04 2012-07-04 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
US7433824B2 (en) * 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
KR100524065B1 (ko) * 2002-12-23 2005-10-26 삼성전자주식회사 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치
TWI220753B (en) * 2003-01-20 2004-09-01 Mediatek Inc Method for determining quantization parameters
US7724827B2 (en) 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US7688894B2 (en) 2003-09-07 2010-03-30 Microsoft Corporation Scan patterns for interlaced video content
US7782954B2 (en) 2003-09-07 2010-08-24 Microsoft Corporation Scan patterns for progressive video content
EP1668904A2 (en) * 2003-09-29 2006-06-14 Handheld Entertainment, Inc. Method and apparatus for coding information
TWI227866B (en) * 2003-11-07 2005-02-11 Mediatek Inc Subband analysis/synthesis filtering method
US7933767B2 (en) * 2004-12-27 2011-04-26 Nokia Corporation Systems and methods for determining pitch lag for a current frame of information
DE602006020686D1 (de) * 2005-01-12 2011-04-28 Nippon Telegraph & Telephone Kodierverfahren und dekodierverfahren mit langzeitvorhersage, vorrichtungen, programm und aufzeichnungsmedium dafür
US7684981B2 (en) 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7693709B2 (en) 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
US7539612B2 (en) * 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US8599925B2 (en) 2005-08-12 2013-12-03 Microsoft Corporation Efficient coding and decoding of transform blocks
US7565018B2 (en) * 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
GB2436192B (en) * 2006-03-14 2008-03-05 Motorola Inc Speech communication unit integrated circuit and method therefor
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
RU2464650C2 (ru) * 2006-12-13 2012-10-20 Панасоник Корпорэйшн Устройство и способ кодирования, устройство и способ декодирования
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
WO2008114075A1 (en) * 2007-03-16 2008-09-25 Nokia Corporation An encoder
US7774205B2 (en) 2007-06-15 2010-08-10 Microsoft Corporation Coding of sparse digital media spectral data
CN101075436B (zh) * 2007-06-26 2011-07-13 北京中星微电子有限公司 带补偿的音频编、解码方法及装置
US20090048827A1 (en) * 2007-08-17 2009-02-19 Manoj Kumar Method and system for audio frame estimation
ATE500588T1 (de) * 2008-01-04 2011-03-15 Dolby Sweden Ab Audiokodierer und -dekodierer
WO2009132662A1 (en) * 2008-04-28 2009-11-05 Nokia Corporation Encoding/decoding for improved frequency response
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
KR20090122143A (ko) * 2008-05-23 2009-11-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
EP3373297B1 (en) 2008-09-18 2023-12-06 Electronics and Telecommunications Research Institute Decoding apparatus for transforming between modified discrete cosine transform-based coder and hetero coder
CN102016530B (zh) * 2009-02-13 2012-11-14 华为技术有限公司 一种基音周期检测方法和装置
DE102010006573B4 (de) * 2010-02-02 2012-03-15 Rohde & Schwarz Gmbh & Co. Kg IQ-Datenkompression für Breitbandanwendungen
CA3234476A1 (en) 2013-01-08 2014-07-17 Dolby International Ab Model based prediction in a critically sampled filterbank
CN110062945B (zh) * 2016-12-02 2023-05-23 迪拉克研究公司 音频输入信号的处理
CN112564713B (zh) * 2020-11-30 2023-09-19 福州大学 高效率低时延的动觉信号编解码器及编解码方法

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5921039B2 (ja) 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
US4969192A (en) 1987-04-06 1990-11-06 Voicecraft, Inc. Vector adaptive predictive coder for speech and audio
GB8803390D0 (en) 1988-02-13 1988-03-16 Univ Belfast Method and apparatus for electrical signal coding
FR2628589B1 (fr) * 1988-03-14 1994-03-04 Etat Francais Codeur differentiel a filtre predicteur auto-adaptatif et decodeur utilisable en liaison avec un tel codeur
EP0364647B1 (en) * 1988-10-19 1995-02-22 International Business Machines Corporation Improvement to vector quantizing coder
IT1232084B (it) * 1989-05-03 1992-01-23 Cselt Centro Studi Lab Telecom Sistema di codifica per segnali audio a banda allargata
FR2646978B1 (fr) 1989-05-11 1991-08-23 France Etat Procede et installation a codage de signaux sonores
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
CA2010830C (en) 1990-02-23 1996-06-25 Jean-Pierre Adoul Dynamic codebook for efficient speech coding based on algebraic codes
US5754976A (en) * 1990-02-23 1998-05-19 Universite De Sherbrooke Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech
JPH04119542A (ja) * 1990-09-07 1992-04-21 Nikon Corp 光磁気記録媒体カートリッジ
US5206884A (en) 1990-10-25 1993-04-27 Comsat Transform domain quantization technique for adaptive predictive coding
FI95085C (fi) 1992-05-11 1995-12-11 Nokia Mobile Phones Ltd Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi
FI91345C (fi) 1992-06-24 1994-06-10 Nokia Mobile Phones Ltd Menetelmä kanavanvaihdon tehostamiseksi
GB2282943B (en) * 1993-03-26 1998-06-03 Motorola Inc Vector quantizer method and apparatus
IT1270438B (it) * 1993-06-10 1997-05-05 Sip Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce
FI98163C (fi) * 1994-02-08 1997-04-25 Nokia Mobile Phones Ltd Koodausjärjestelmä parametriseen puheenkoodaukseen
DE69429620D1 (de) * 1994-10-28 2002-02-14 Rai Radiotelevisione Italiana Teilbandkodierung mit auf Tonhöhen basierter Prädiktionskodierung in jedem einzelnen Teilband
WO1996019876A1 (en) * 1994-12-20 1996-06-27 Dolby Laboratories Licensing Corporation Method and apparatus for applying waveform prediction to subbands of a perceptual coding system
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
TW321810B (fi) * 1995-10-26 1997-12-01 Sony Co Ltd
JP3481027B2 (ja) * 1995-12-18 2003-12-22 沖電気工業株式会社 音声符号化装置
US5778335A (en) * 1996-02-26 1998-07-07 The Regents Of The University Of California Method and apparatus for efficient multiband celp wideband speech and music coding and decoding
FI964975A (fi) * 1996-12-12 1998-06-13 Nokia Mobile Phones Ltd Menetelmä ja laite puheen koodaamiseksi

Also Published As

Publication number Publication date
AU733156B2 (en) 2001-05-10
SE9800776L (sv) 1998-09-15
FR2761801A1 (fr) 1998-10-09
JP3391686B2 (ja) 2003-03-31
DE19811039A1 (de) 1998-09-17
SE9800776D0 (sv) 1998-03-10
GB2323759A (en) 1998-09-30
US7194407B2 (en) 2007-03-20
FR2761801B1 (fr) 1999-12-31
ES2164414T3 (es) 2002-02-16
EP0966793A1 (en) 1999-12-29
KR100469002B1 (ko) 2005-01-29
EP0966793B1 (en) 2001-09-19
CN1195930A (zh) 1998-10-14
JP2003140697A (ja) 2003-05-16
GB2323759B (en) 2002-01-16
KR20000076273A (ko) 2000-12-26
SE521129C2 (sv) 2003-09-30
FI971108A (fi) 1998-09-15
CN1135721C (zh) 2004-01-21
US6721700B1 (en) 2004-04-13
JPH10282999A (ja) 1998-10-23
DE19811039B4 (de) 2005-07-21
GB9805294D0 (en) 1998-05-06
AU6216498A (en) 1998-10-12
WO1998042083A1 (en) 1998-09-24
US20040093208A1 (en) 2004-05-13
FI971108A0 (fi) 1997-03-14

Similar Documents

Publication Publication Date Title
FI114248B (fi) Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
US6807526B2 (en) Method of and apparatus for processing at least one coded binary audio flux organized into frames
US7209878B2 (en) Noise feedback coding method and system for efficiently searching vector quantization codevectors used for coding a speech signal
US9009036B2 (en) Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding
JP5215994B2 (ja) 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置
JP6779966B2 (ja) 先進量子化器
JPH11143499A (ja) 切替え型予測量子化の改良された方法
US8463615B2 (en) Low-delay audio coder
MXPA05006664A (es) Metodo y dispositivo para la cuantizacion robusta de vector predictivo de parametros de prediccion lineal en la codificacion de conversacion a velocidad variable de bits.
KR19990077753A (ko) 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
JP3636094B2 (ja) 信号符号化装置及び方法、並びに信号復号装置及び方法
KR20070070189A (ko) 음성 부호화 장치 및 음성 부호화 방법
JP3406275B2 (ja) ディジタル信号符号化方法、ディジタル信号復号化方法、これらの装置及びその各プログラム記録媒体
JP3087814B2 (ja) 音響信号変換符号化装置および復号化装置
JPH0341500A (ja) 低遅延低ビツトレート音声コーダ
JPH11184498A (ja) 音声符号化/復号化方法
KR100474833B1 (ko) 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치
EP1293968B1 (en) Efficient excitation quantization in a noise feeback coding system using correlation techniques
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
JPH09288498A (ja) 音声符号化装置
Chi et al. Safety-net pyramid VQ of LSF parameters for wideband speech codecs
KR0135907B1 (ko) 선스펙트럼쌍주파수의 벡터-스칼라 결합 양자화기(Vector and Scalar Quantizer of LSP Frequency)
EP1334486A2 (en) System for vector quantization search for noise feedback based coding of speech
JPH02148926A (ja) 予測符号化方式
Bhaskar Low rate coding of audio by a predictive transform coder for efficient satellite transmission

Legal Events

Date Code Title Description
FG Patent granted

Ref document number: 114248

Country of ref document: FI

PC Transfer of assignment of patent

Owner name: NOKIA TECHNOLOGIES OY

MA Patent expired