FI114248B

FI114248B - Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen

Info

Publication number: FI114248B
Application number: FI971108A
Authority: FI
Inventors: Lin Yin
Original assignee: Nokia Corp
Priority date: 1997-03-14
Filing date: 1997-03-14
Publication date: 2004-09-15
Also published as: AU733156B2; SE9800776L; FR2761801A1; JP3391686B2; DE19811039A1; SE9800776D0; GB2323759A; US7194407B2; FR2761801B1; ES2164414T3; EP0966793A1; KR100469002B1; EP0966793B1; CN1195930A; JP2003140697A; GB2323759B; KR20000076273A; SE521129C2; FI971108A; CN1135721C

Description

1 114248

Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen

Esillä oleva keksintö koskee audiokoodausmenetelmää ja -laitetta, sekä audiodekoodausmenetelmää ja -laitetta.

5

On yleisesti tunnettua, että lähettämällä data digitaalimuodossa saavutetaan tiedonsiirtokanavalla paremmat signaali-kohina suhteet ja kasvanut informaatiokapasiteetti. On kuitenkin olemassa jatkuva halu lisätä kanavan kapasiteettia kompressoimalla digitaalisia signaaleja vielä enemmän, ίο Audiosignaalien suhteen sovelletaan kahta kompression perusperiaatetta. Näistä ensimmäinen käsittää lähtösignaalissa olevien tilastollisten tai determinististen redundanssien poistamisen ja toinen taas käsittää sellaisten elementtien vaimentamisen tai eliminoinnin lähtösignaalista, jotka ovat redundantteja ihmisaistien kannalta. Viime aikoina jälkimmäisestä periaatteesta on tullut 15 vallitseva korkealuokkaisissa audiosovellluksissa ja siihen kuuluu tyypillisesti audiosignaalin jakaminen taajuuskomponentteihinsa (joita joskus kutsutaan "alikaistoiksi"), joista kukin analysoidaan ja kvantisoidaan kvantisointitarkkuudella jonka katsotaanpoistavan (kuulijan kannalta) epäoleellisen datan. ISO (International Standards Organization) MPEG (Moving Picture Expert Group) v .: 20 audiokoodausstandardi ja muut audiokoodaus-standardit käyttävät ja edelleen *.. : tarkentavat tätä periaatetta. Kuitenkin, MPEG (ja muut standardit) käyttävät myös ' ' tekniikkaa, joka tunnetaan nimellä "adaptiivinen (mukautuva) ennustaminen" [ ' saadakseen aikaan datan nopeuden alenemisen edelleen.

* t • · » *« · I t t **’ 25 Uuden MPEG-2 AAC standardin mukaisen kooderin toiminta on kuvattu yksityiskohtaisesti kansainvälisen standardidokumentin luonnoksessa ISO/IEC "'.I DIS 13818-7. Tämä uusi MPEG-2 soveltaa lineaarista taaksepäin ennustusta

1 I

käyttäen 672 taajuuskomponenttia 1024:sta. On odotettavissa, että uusi MPEG-4 standardi sisältää vastaavat vaatimukset. Kuitenkin, noin suuri määrä • « a • > ’ ·; · ’ 30 taajuuskomponentteja johtaa suuriin laskennan aiheuttamiin kustannuksiin johtuen ennustusalgoritmin monimutkaisuudesta ja se edellyttää myös että käytettävissä on runsaasti muistia laskettujen-ja välikertoimien tallentamista varten. On 2 114248 yleisesti tunnettua, että kun tämän tyyppisiä taaksepäin ennustimia käytetään taajuustasossa, on vaikeaa vähentää edelleen laskentakuormituksia ja muistivaatimuksia. Tämä johtuu siitä, että taajuustasossa ennustimien määrä on niin suuri, että hyvin yksinkertainenkin algoritmi johtaa monimutkaiseen 5 laskentaan ja suuriin muistivaatimuksiin. Vaikka tätä ongelmaa osataankin väistää käyttämällä eteenpäin ennustavia adaptiivisia ennustimia, jotka päivitetään enkooderissa ja lähetetään dekooderille, eteenpäin ennustavien adaptiivisten ennustimien käyttö taajuustasossa väistämättä johtaa suureen määrään "sivuinformaatiota" ennustimien suuresta määrästä johtuen.

10

Esillä olevan keksinnön tarkoitus on voittaa tunnettujen ennustusmenetelmien haitat, tai ainakin lieventää niitä.

Tämä ja muut tavoitteet saavutetaan koodaamalla audiosignaali käyttäen is virhesignaaleja poistamaan redundanssit jokaisesta monista audiosignaalin taajuuden alikaistoista ja lisäksi synnyttämään pitkän aikavälin aikatason ennustekertoimia, jotka mahdollistavat audiosignaalin kehyksen ennustamisen yhden tai useamman aikaisemman kehyksen perusteella.

20 Esillä olevan keksinnön ensimmäisessä toteutusmuodossa esitetään menetelmä > t : . * audiosignaalin koodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: * ‘ : vastaanotetaan koodattava signaali x; * » »t muodostetaan taajuusalikaistoja vastaanotetun audiosignaalin : ’ aikakehyksestä ; *·* ' 25 muodostetaan kvantisoitu audiosignaali x vastaanotetun audiosignaalin x perusteella; muodostetaan pitkän aikavälin ennustuskertoimien A sarja; I » ' I ’ jolle menetelmälle on tunnusomaista se, että * » · • · ·: ennustetaan vastaanotetun audiosignaalin käsiteltävänä oleva * t *·;* 30 aikakehys käyttäen pitkän aikavälin ennustuskertoimien A sarjaa kullekin : aikakehyksen taajuusalikaistoista suoraan ainakin yhden kvantisoidun audiosignaalin x aikaisemman aikakehyksen perusteella; 3 114248 käytetään ennustuskertoimien A sarjaa ennustetun audiosignaalin x muodostamiseksi kvantisoidusta audiosignaalista *; verrataan vastaanotettua audiosignaalia * ennustettuun audiosignaaliin x ja muodostetaan virhesignaali E(k) kullekin lukuisista taajuusalikaistoista; 5 kvantisoidaan virhesignaalit E(k) kvantisoitujen virhesignaalien E(k) joukon muodostamiseksi; ja yhdistetään kvantisoidut virhesignaalit E(k) ja ennustuskertoimet A koodatun audiosignaalin muodostamiseksi.

ίο Esillä oleva keksintö tarjoaa audiosignaalin kompressoinnin käyttäen eteenpäin ennustusta aikatasossa. Kutakin vastaanotetun signaalin aikakehystä kohti tarvitsee luoda ja lähettää vain yksi ryhmä eteenpäin ennustuksen ennustekertoimia dekooderille lähetettäväksi. Tämä poikkeaa tunnetuista eteenpäin ennustuksen tekniikoista, joissa täytyy luoda joukko ennustekertoimia is jokaisen kehyksen jokaista alikaistaa kohti. Verrattuna ennustehyötyihin, jotka saavutetaan esillä olevan keksinnön avulla, pitkän aikavälin ennustimen sivuinformaatio on merkityksetön.

Eräät keksinnön toteutusmuodot mahdollistavat laskennan monimutkaisuuden ja 20 muistivaatimusten vähentämisen. Erityisesti, verrattuna taaksepäin ennustuksen käyttöön, ei ole tarvetta laskea uudelleen ennustekertoimia dekooderissa. Eräät : keksinnön toteutusmuodot kykenevät myös vastaamaan signaalin muutoksiin : tavanomaisia taaksepäin ennustavia ennustimia nopeammin.

I I 4 · t » ‘: ‘!: 25 Eräässä keksinnön toteutusmuodossa vastaanotettu audiosignaali χ muunnetaan : " kehyksissä xm aikatasosta taajuustasoon taajuusalikaistasignaalien X(k) joukon ' · ’ saamiseksi. Ennustettu audiosignaali x muunnetaan samalla tavalla aikatasosta . taajuustasoon ennustettujen taajuus-alikaistasignaalien X (k) luomiseksi ja .···. vertailu vastaanotetun audiosignaalin^ ja ennustetun audiosignaalin x välillä 3o suoritetaan taajuustasossa, vertaamalla toisiaan vastaavia alikaistasignaaleja keskenään taajuusalikaista-virhesignaalien E(k) luomiseksi. Kvantisoitu • · * 4 114248 audiosignaali x synnytetään yhdistämällä ennustettu signaali ja kvantisoitu virhesignaali joko aikatasossa tai taajuustasossa.

Eräässä keksinnön vaihtoehtoisessa toteutusmuodossa vertailu vastaanotetun 5 audiosignaalin/ ja ennustetun audiosignaalinxvälillä suoritetaan aikatasossa, myös aikatasossa olevan virhesignaalin e luomiseksi. Tämä virhesignaali e muunnetaan sitten aikatasosta taajuustasoon mainitun taajuusalikaista-virhesignaalien E(k) joukon luomiseksi.

ίο Virhesignaalien kvantisointi suoritetaan edullisesti psyko-akustisen mallin mukaisesti.

Esillä olevan keksinnön erään toisen toteutusmuodon mukaisesti nyt on keksitty menetelmä koodatun audiosignaalin dekoodaamiseksi, jossa menetelmässä 15 vastaanotetaan koodattu audiosignaali joka sisältää kvantisoidun virhesignaalin E (k) kutakin audiosignaalin lukuisaa taajuusalikaistaa kohti ja, kutakin audiosignaalin kehystä kohti joukon ennustuskertoimia A, ja jolle menetelmälle on tunnusomaista se, että: , ennustuskertoimien joukkoa A voidaan käyttää vastaanotetun • = » 20 audiosignaalin käsiteltävän aikakehyksen xm kunkin taajuusalikaistan • · ... : ennustamiseen ainakin yhden rekonstruoidun kvantisoidun audiosignaalin x .; · ; aikaisemman kehyksen perusteella; j*> , muodostetaan mainittu rekonstruoitu kvantisoitu audiosignaali x • : [! : kvantisoitujen virhesignaalien E (k) perusteella; ja 25 käytetään ennustuskertoimia A ja rekonstruoituja kvantisoituja ···:’ audiosignaaleja x ennustetun audiosignaalin x muodostamiseksi, jolloin mainittu rekonstruoitu kvantisoitu audiosignaali muodostetaan yhdistämällä kvantisoidut virhesignaalit E (k) ja ennustettu audiosignaali x.

30 Dekoodausmenetelmä voi sisältää vaiheen, jossa ennustettu audiosignaali x muunnetaan aikatasosta taajuustasoon, jotta saadaan joukko ennustettuja 5 114248 taajuusalikaistasignaaleja X (k) yhdistettäväksi kvantisoituihin virhesignaaleihin E (k) rekonstruoitujen taajuusalikaistasignaalien X (k) joukon luomiseksi. Tämän jälkeen rekonstruoitu kvantisoitu audiosignaali x luodaan suorittamalla rekonstruoiduille taajuusalikaistasignaaleille X (k) muunnos taajuustasosta 5 aikatasoon. Tämä toteutusmuoto on erityisen sovelias silloin, kun vastaanotetaan ainoastaan alaryhmä kaikista mahdollisista kvantisoiduista virhesignaaleista E (k) ja osa alikaistatiedoista lähetetään suoraan lähettämällä audioalikaistasignaalit X(k). Signaalit x (k) ja X(k) yhdistetään asianmukaisesti ennen taajuus-aika muunnoksen suorittamista.

10

Eräässä dekoodausmenetelmän vaihtoehtoisessa toteutusmuodossa menetelmään sisältyy alkuvaihe, jossa muunnetaan kvantisoidut virhesignaalit E (k) taajuustasosta aikatasoon kvantisoidun aikatason virhesignaalin ε luomiseksi. Tämä virhesignaali yhdistetään sen jälkeen suoraan ennustetun 15 audiosignaalinx kanssa rekonstruoidun audiosignaalini luomiseksi.

Esillä olevan keksinnön erään kolmannen toteutusmuodon mukaisesti nyt on keksitty laite audiosignaalin koodaamiseen, joka laite käsittää: sisäänmenon koodattavan audiosignaalin x vastaanottamiseksi; 20 ensimmäiset generointivälineet (1) taajuusalikaistojen muodostamiseksi vastaanotetun audiosignaalin aikakehyksestä; *. . mainittuun sisäänmenoon kytketyt prosessointivälineet (2,3; 15-19) . 1 ; kvantisoidun audiosignaalin x muodostamiseksi vastaanotetun • ; · i audiosignaalin x perusteella; ja jolle laitteelle on tunnusomaista se, että laite ·:· : 25 käsittää: . mainittuihin prosessointivälineisiin (3) liitetyt ennustusvälineet (12; 19) : t; : pitkän aikavälin ennustuskertoimien A joukon muodostamiseksi käytettäväksi kullekin aikakehyksen taajuusalikaistalle vastaanotetun audiosignaalin 1 käsiteltävänä olevan aikakehyksen xm ennustamiseksi suoraan ainakin ·;·1 30 yhden kvantisoidun audiosignaalin x aikaisemman kehyksen perusteella; toiset generointivälineet (10-14;20,15) ennustetun audiosignaalin x • 1» :: muodostamiseksi käyttäen pitkän aikavälin ennustuskertoimia A ja · • 1

t I I

• · · • · t 6 114248 kvantisoitua audiosignaalia x ja vastaanotetun audiosignaalin x vertaamiseksi ennustettuun audiosignaaliin x virhesignaalin E(k) muodostamiseksi kullekin lukuisista taajuusalikaistoista; kvantisointivälineet (3; 17) virhesignaalien E{k) kvantisoimiseksi 5 kvantisoitujen virhesignaalien E(k) joukon muodostamiseksi; ja yhdistämisvälineet (5;21) kvantisoitujen virhesignaalien E (k) yhdistämiseksi ennustuskertoimiin A koodatun audiosignaalin muodostamiseksi.

ίο Eräässä toteututusmuodossa mainitut generointivälineet käsittävät ensimmäiset muunnosvälineet vastaanotetun audiosignaalin^ muuntamiseksi aikatasosta taajuustasoon ja toiset muunnosvälineet ennustetun audiosignaalinx muuntamiseksi aikatasosta taajuustasoon, sekä vertailuvälineet jotka on järjestetty vertailemaan saatuja taajuustason signaaleja taajuustasossa.

15

Eräässä keksinnön vaihtoehtoisessa toteututusmuodossa generointivälineet on järjestetty vertailemaan vastaanotettua audiosignaalia^ ja ennustettua audiosignaalia £ aikatasossa.

· ; 20 Erään esillä olevan keksinnön neljännen toteutusmuodon mukaisesti on keksitty * • laite vastaanotetun koodatun audiosignaalin^ dekoodaamiseksi, jolle * : laitteelle on tunnusomaista se, että: : ’’ koodattu audiosignaali sisältää kvantisoidun virhesignaalin E (k) kutakin f · I ·

lukuisaa audiosignaalin taajuusalikaistaa kohti ja sarjan ennustuskertoimia A

25 käytettäväksi kullekin audiosignaalin aikakehyksen taajuusalikaistalle ja jossa ’ ennustuskertoimia A voidaan käyttää ennustamaan vastaanotetun * · audiosignaalin käsiteltävä kehys xm ainakin yhden rekonstruoidun < * · kvantisoidun audiosignaalin 3c aikaisemman kehyksen perusteella, joka laite * · käsittää: • * · *·’ 30 sisäänmenon koodatun audiosignaalin vastaanottamiseksi; • I · t * • · 7 114248 generoimisvälineet (24,25,9) rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi kvantisoitujen virhesignaalien E (k) perusteella; ja signaalinkäsittelyvälineet (26) ennustetun audiosignaalin x 5 muodostamiseksi ennustuskertoimien A ja mainitun rekonstruoidun kvantisoidun audiosignaalin x perusteella, jossa mainitut generoimisvälineet käsittävät yhdistämisvälineet (24,25) ennustetun audiosignaalin x ja kvantisoitujen virhesignaalien E{k) yhdistämiseksi rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi.

10

Seuraavassa keksinnön ymmärtämiseksi paremmin ja keksinnön toteuttamisen havainnollistamiseksi esimerkkien avulla viitataan oheisiin kuviin, joissa:

Kuva 1 esittää kaaviona kooderia vastaanotetun audiosignaalin koodaamiseksi,

Kuva 2 esittää kaaviona dekooderia Kuvan 1 mukaisella kooderilla koodatun 15 audiosignaalin dekoodaamiseksi,

Kuva 3 esittää tarkemmin Kuvan 1 mukaista kooderia ja kooderin sisältämää ennustustyökalua;

Kuva 4 esittää tarkemmin Kuvan 2 mukaista dekooderia ja dekooderin sisältämää , ennustustyökalua; ja t 20 Kuva 5 esittää tarkemmin erästä Kuvan 1 mukaisen kooderin muunnosta, joka : käsittää vaihtoehtoisen ennustustyökalun.

«•tl • I

Kuva 1 esittää lohkokaaviona enkooderin, joka suorittaa koodaustoiminnon, joka : on määritelty yleisluontoisesti standardissa MPEG-2 AAC. Sisääntulo kooderille 25 on näytteistetty yksivaiheinen signaali x, jonka näytepisteet on ryhmitelty -;* aikakehyksiin tai 2N pisteen ryhmiin, esim.

O *,, = (*„(0).*,,(1)>·.·*.,(2Λ-1))Γ (1) » jossa m on ryhmän tunnus ja T ilmaisee transpoosi-operaation. Näytepisteiden . 30 ryhmittely tehdään suodatinpankkityökalulla 1, joka suorittaa myös muunnetun erillisen kosinimuunnoksen (MDCT) kullekin audiosignaalin yksittäiselle kehykselle taajuusalikaistakertoimien joukon saamiseksi.

, Ή4248 Χ„, = (X„(0),X„(1)„..X„(W - 1))’ (2)

Alikaistat on määritelty MPEG-standardissa.

Eteenpäin ennustavan MDCT:n määrittelee: 5 2ΛΤ-1 π *„(*) = Σ /(i)x„(i)cos(—(2i +1 + N XU + 1)), (3) <=o 4^· k= 0....Λ/-1 jossa /(/) on analyysi-synteesi ikkuna, joka on sellainen symmetrinen ikkuna, että ίο sen lisäys-päällekkäisyysvaikutus tuottaa yksikkövahvistuksen signaaliin.

Taajuusalikaistasignaalit X(k) syötetään vuorollaan ennustustyökalulle 2 (jota kuvataan tarkemmin jäljempänä), joka pyrkii eliminoimaan pitkäaikaisredundanssin kustakin taajuusalikaistasignaalista. Tuloksena saadaan 15 sarja taajuusalikaistojen virhesignaaleja.

= (4) jotka ilmaisevat pitkän aikavälin muutoksia vastaavissa alikaistoissa, sekä sarjan eteenpäin ennustuksen kertoimia A kullekin kehykselle.

• * * · 20 Alikaistavirhesignaalit E(k)syötetään kvantisoijalle 3, joka kvantisoi kunkin • : : signaalin psykoakustisen mallin määräämällä bittimäärällä. Tätä mallia soveltaa ·' .. ohjausyksikkö 4. Kuten mainittiin, psykoakustinen malli mallintaa ihmisen kuulon : peitto-ominaisuuksia. Kvantisoidut virhesignaalit E(k)]a ennustuskertoimetΛ yhdistetään tämän jälkeen bittivirran multiplekserissä 5 lähetettäväksi .. ’: ’ 25 lähetyskanavan 6 kautta.

• *

Kuva 2 esittää Kuvan 1 mukaisella kooderilla koodatun audiosignaalin dekoodaukseen tarkoitetun dekooderin yleisrakenteen. Bittivirran demultiplekseri 7 erottaa ensiksi ennustuskertoimet^ kvantisoiduista virhesignaaleista E (k) ja 30 erottaa virhesignaalit erillisiksi alikaistasignaaleiksi. Ennustuskertoimet/i ja 9 114248 kvantisoidut alikaistavirhesignaalit E (k) syötetään ennustustyökalulle 8 joka suorittaa kooderissa tehdylle ennustusprosessille käänteisen operaation, eli ennustustyökalu palauttaa kooderissa poistetun redundanssin rekonstruoitujen kvantisoitujen alikaistasignaalien X(k) muodostamiseksi. Suodatinpankkityökalu 5 9 palauttaa tämän jälkeen aikatason signaalin x vastaanotetun version X(k) käänteisellä muunnoksella, jota kuvaa *(*) = “-i0‘ + N) + um(i), (5) i = Ο,.,.,Ν -1 jossa uk(i),i = 0,...2N -1 ovat X :n käänteinen muunnos 10 um(i) = / (i)£xm(*)cos(-^(2i + 1+ N)(2k +1)), i = 0,...,2N -1 ja joka approksimoi alkuperäistä audiosignaalia jc .

Kuva 3 kuvaa yksityiskohtaisemmin Kuvan 1 esittämän kooderin 15 ennustusmenetelmää. Käyttämällä kvantisoituja taajuusalikaista-virhesignaaleja E(k) prosessointiyksikkö 10 muodostaa sarjan kvantisoituja taajuusalikaistasignaaleja X(k). Signaalit X(k) syötetään vuorostaan suodatinpankkiin 11, joka käsittelee signaaleja käänteisellä erillisellä kosinimuunnoksella (IMDCT) kvantisoidun aikatason signaalin x ·' 20 muodostamiseksi. Tämän jälkeen signaalia syötetään pitkän aikavälin • · · ‘ ennustustyökaluun 12 joka vastaanottaa myös tulevan audiosignaalin x.

Ennustustyökalu 12 käyttää pitkän aikavälin (LT) ennustinta poistamaan ' ,]* redundanssin käsiteltävänä olevassa kehyksessä m+1 olevasta audiosignaalista aikaisemman kvantisoidun datan perusteella.

. 25 Tämän ennustimen siirtofunktio P on: »* * · t ... m-> ^ω= Σ^"(“+ί) (5) φ k = -m i ['.V.' jossa a edustaa pitkää, 1 - 1024 näytteen viivettä ja bk edustaa • · ♦ ennustuskertoimia.

* I · • · • % .0 114248

Kun mi = m2 = 0 ennustin on Ί-tappinen", kun mi = m2 = 1 ennustin on "3-tappinen1'.

Parametrit a ja bk määritetään LT-ennustuksen jälkeen minimoimalla 5 keskineliövirhe (MSE) 2N näytteen jaksolta. Yhden "tap'in" ennustinta käytettäessä pitkän aikavälin ennusteen jäännössignaaliksi r(i) saadaan: r(i) = x(i) - bx(i - 2N + 1 + a) (6) jossa * on aikatason audiosignaali ja x on kvantisoitu aikatason signaali. Keskimääräinen neliöity jäännössignaali R saadaan yhtälöstä: 2N-1 2N-1 10 R= £r2(0= ^(x(i)-bx(i- 2N + l-a))2 (7) i=0 /=0

Asettamalla dR! db = 0, saadaan V2N 1 jc(i)jc(i - 2 N +1 + a) b = -2M - (8) XN_o\x(i-2N-a)f ja kun yhtälöön (7) sijoitetaan b, saadaan 15 (9) Σ,·=0 (^C«-22V + 1 -a))2

Termin R minimoiminen maksimoi yhtälön (9) oikean puolen toisen termin. Tämä termi lasketaan kaikilla mahdollisilla a :n arvoilla sille määritellyllä alueella, ja * ‘ valitaan se a :n arvo joka maksimoi tämän termin. Nimittäjän energia Ω voidaan e · · · * helposti, uudelleen laskemisen sijasta, päivittää viiveestä (a -1) arvoon a * , 20 seuraavan yhtälön avulla: ; Ωα=Ωα_ι+χ\-α)-(-α + Ν) (10)

Jos käytetään yhden "tap'in" ennustinta, yhtälöä (8) käytetään laskettaessa ·:··: ennustekerroin bj. Jos kyseessä on j "tap'in" ennustin, LT ennusteviive a '...: määritetään aluksi maksimoimalla yhtälön (9) toinen termi ja tämän jälkeen :· 25 ratkaistaan jxjyhtälön joukko j ennustekertoimen laskemiseksi.

• · • · «· · 11 114248 LT ennustusparametrit^ ovat viive a ja ennustekerroin bj. Viive kvantisoidaan 9 - 11 bitin tarkkuudella, käytetystä alueesta riippuen. Tavallisimmin käytetään 10 bittiä, jolloin arvoja voi olla 1024 välillä 1 -1024. Bittimäärän alentamiseksi LT ennusteviiveet voidaan deltakoodata 5 bitin tarkkuudella parillisissa kehyksinä.

5 Kokeet osoittavat että vahvistuksen koodaaminen 4 - 6 bitin tarkkuudella riittää. Vahvistuksen epätasaisesta jakaumasta johtuen on käytettävä epätasaista kvantisointia.

Edellä kuvatussa menetelmässä LT-synteesisuodattimen 1 / P(z) stabiilisuutta ei ίο aina voi taata. Yhden "tap'in" ennustimelle stabiilisuusehto on |ό| < 1. Tämän takia stabilointi voidaan toteuttaa helposti asettamalla |ö| = 1 aina kun |&| > 1. Kun kyseessä on 3 "tap'in" ennustin, voidaan suorittaa toinen stabilointimenettely, kuten on kuvattu artikkelissa R.P. Ramachandran and P. Kbal, "Stability and performance analysis of pitch filters in speech coders", IEEE Trans. ASSP, vol.

15 35, no.7, sivut 937-946, heinäkuu 1987. Kuitenkaan LT-synteesisuodattimen epästabiilisuus ei ole kovin haitallinen rekonstruoidun signaalin laadun kannalta.

Suodatin on epästabiili muutamien kehysten ajan (lisäten energiaa), mutta vähitellen päästään stabiileihin jaksoihin, jolloin ulostulon kasvu ei jatku ajan 1· funktiona.

> · : 20 • ·: Kun LT-ennustuskertoimet on määritetty, voidaan määrittää (m+1):nnen kehyksen ! ennustettu signaali: , x(i) = ^bjX(i-2N+ l-a), (11)

i = mN + \,mN + 2 1 )N

·; ; 25 Tämän jälkeen ennustettu aikatason signaali x syötetään suodatinpankkiin 13, joka käsittelee signaalia MDCT-menetelmällä (m+1):nnen kehyksen ennustettujen spektrikertoimien Xm+i(k) luomiseksi. Ennustetut spektrikertoimet X(k) t · *·;·’ vähennetään tämän jälkeen spektrikertoimista X(k) vähennysyksikössä 14.

• » · #11 · 12 114248

Jotta voitaisiin taata, että ennustusta käytetään ainoastaan jos se johtaa koodaushyötyyn, tarvitaan sopiva ennustimien ohjaus ja pieni määrä ennustimien ohjausinformaatiota pitää lähettää dekooderille. Tämä toiminto suoritetaan vähennysyksikössä 14. Ennustimen ohjausmenetelmä on sama kuin se 5 taaksepäin ennustuksen ohjausmenetelmä, jota on käytetty MPEG-2 Advanced Audio Coding (AAC):ssa. Kunkin kehyksen ennustuksen ohjausinformaatio, joka lähetetään sivuinformaationa, määritetään kahdessa vaiheessa. Ensiksi, kunkin skaalaustekijäkaistan osalta määritetään johtaako ennustus koodaushyötyyn vai ei, ja jos vastaus on kyllä, ennustin_käytössä bitti-arvoksi tuolle ίο skaalaustekijäkaistalle asetetaan yksi. Kun tämä on tehty kaikille skaalaustekijäkaistoille, määritetään kompensoiko tälle kehykselle ennustuksella saavutettu kokonaiskoodaushyöty ainakin ennustimen sivuinformaatiosta aiheutuvan lisäbittien tarpeen. Jos vastaus on kyllä, ennusti n_datajäsnä bitin arvoksi asetetaan yksi ja koko sivuinformaatio, mukaan lukien ennustimen 15 nollaukseen tarvittava, lähetetään ja ennustusvirheen arvo syötetään kvantisoijaan. Muussa tapauksessa ennustin_data_ läsnä -bitin arvoksi asetetaan 0 ja ennustin_käytössä bitit asetetaan kaikki nolliksi eikä niitä lähetetä. Tässä tapauksessa spektraalikomponentin arvo syötetään kvantisoijaan 3. Kuten edellä on esitetty, ennustuksen ohjaus kohdistuu ensin kaikkiin yhden 20 skaalauskerroinkaistan ennustimiin, mitä seuraa toinen vaihe joka kohdistuu kaikkiin skaalauskerroinkaistoihin.

»· * · » · «

On selvää että LT-ennustuksen tavoitteena on saavuttaa suurin ennustuksen kokonaishyöty. Merkitään G, :llä ennustushyötyä / :nnellä taajuusalikaistalla.

25 Ennustuksen kokonaishyöty tietyssä kehyksessä voidaan laskea seuraavasti: > · · G= ΣΟ, (12) /=i&(g>o) ‘ · ·. Jos hyöty kompensoi ennustimen sivuinformaation lisäbittien tarpeen, esim.

* · I

G > T(dB), koko sivuinformaatio lähetetään ja ne ennustimet jotka antavat » .**·. positiivisen hyödyn kytketään päälle. Muussa tapauksessa ennustimia ei käytetä.

*»* t · · 30 i3 1 14248

Edellä esitetyllä menetelmällä saadut LP-parametrit eivät ole suoraan verrannollisia hyödyn maksimointiin. Kuitenkin, laskemalla vahvistus jokaiselle lohkolle ja jokaiselle viiveelle valitulla alueella (tässä esimerkissä 1 - 1024) ja valitsemalla se viive, jolla saavutetaan suurin ennustuksen kokonaishyöty, 5 optimoidaan ennustusprosessi. Valittu viive a ja vastaavat kertoimet b lähetetään sivuinformaationa kvantisoitujen virhe-alikaistasignaalien mukana. Vaikka laskennan monimutkaisuus kooderissa kasvaa, laskennan monimutkaisuus dekooderissa ei lisäänny.

ίο Kuva 4 esittää yksityiskohtaisemmin Kuvan 2 dekooderia. Koodatun audiosignaalin vastaanottaa siirtokanavalta 6 bittivirran demultiplekseri 7, kuten edellä on kuvattu. Bittivirran demultiplekseri 7 erottelee ennustuskertoimet A ja kvantisoidut virhesignaalit E(k), sekä toimittaa ne ennustustyökalulle 8. Tämä työkalu käsittää yhdistäjän 24, joka yhdistää kvantisoidut virhesignaalit E(k) ja 15 ennustetun taajuustason audiosignaalin X(k) rekonstruoidun, myös taajuustasossa olevan, audiosignaalin X(k) synnyttämiseksi. Suodatinpankki 9 muuntaa rekonstruoidun signaalin X(k) taajuustasosta aikatasoon rekonstruoidun aikatason audiosignaalin x luomiseksi. Tämä signaali vuorostaan syötetään palautteena pitkän aikavälin ennustustyökalulle, joka vastaanottaa myös . 20 ennustuskertoimet A. Pitkän aikavälin ennustustyökalu 26 synnyttää ennustetun, käsiteltävän aikakehyksen aikaisempien rekonstruoitujen aikakehysten perusteella , ‘: käyttäen käsiteltävän kehyksen ennustekertoimia. Suodatinpankki 25 muuntaa . ennustetun signaalin x.

. 25 Kuva 5 esittää Kuvan 1 esittämän audiosignaalikooderin erästä vaihtoehtoista toteutustapaa, jossa vertailuyksikkö 15 vertaa koodattavaa audiosignaalia x ··· aikatasossa olevaan ennustettuun signaaliin x synnyttääkseen virhesignaalin e, • joka myös on aikatasossa. Suodatinpankkityökalu 16 muuntaa tämän jälkeen ,virhesignaalin aikatasosta taajuustasoon taajuusalikaista-virhesignaalien E(k) 30 joukon luomiseksi. Nämä signaalit kvantisoidaan tämän jälkeen kvantisoijassa 17 * · · .··. kvantisoitujen virhesignaalien E (k) joukon luomiseksi.

14 114248 Tämän jälkeen käytetään suodatinpankkia 18 muuntamaan kvantisoidut virhesignaalit E(k) takaisin aikatasoon, tuloksena signaali e . Tämä kvantisoitu aikatason virhesignaali e yhdistetään sen jälkeen signaalinkäsittely-yksikössä 19 5 ennustettuun aikatason signaaliin x kvantisoidun audiosignaalin x muodostamiseksi. Ennustustyökalu 20 suorittaa saman toiminnon kuin Kuvan 3 kooderin työkalu 12, muodostaen ennustetun audiosignaalin jc ja ennustuskertoimet A. Ennustuskertoimet ja kvantisoidut virhesignaalit yhdistetään bittivirran multiplekserissa 21 lähetettäväksi lähetyskanavalle 22. ίο Kuten edellä on esitetty, virhesignaalit kvantisoidaan ohjaimessa 23 psykoakustisen mallin mukaan.

Edellä kuvatut audiokoodausalgoritmit mahdollistavat audiosignaalien kompressoinnin alhaisilla bittinopeuksilla. Tekniikka perustuu pitkän aikavälin (LT) 15 ennustamiseen. Tunnettuihin taaksepäin ennustuksen tekniikkoihin verrattuna tässä kuvatut tekniikat tarjoavat suuremmat ennustushyödyt yksittäisille instrumentaalimusiikkisignaaleile ja puhesignaaleille, vaatien kuitenkin vain alhaista laskennan monimutkaisuutta.

t I · • > f

» I

• 1 tl· I » * · ·

• I

I I · 1 tl» ' i · I 1 · • • I1· * 1 · I » • « · » ♦ 1 » I 1 · II» ·

Claims

15 114248

1. Menetelmä audiosignaalin koodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: 5 koodattava signaali x vastaanotetaan; muodostetaan taajuusalikaistoja vastaanotetun audiosignaalin aikakehyksestä; muodostetaan kvantisoitu audiosignaali x vastaanotetun audiosignaalin x perusteella; ίο muodostetaan pitkän aikavälin ennustuskertoimien A sarja; tunnettu siitä, että ennustetaan vastaanotetun audiosignaalin käsiteltävänä oleva aikakehys käyttäen pitkän aikavälin ennustuskertoimien A sarjaa kullekin aikakehyksen taajuusalikaistoista suoraan ainakin yhden kvantisoidun 15 audiosignaalin x aikaisemman aikakehyksen perusteella; käytetään ennustuskertoimien A sarjaa ennustetun audiosignaalin x muodostamiseksi kvantisoidusta audiosignaalista x ; verrataan vastaanotettua audiosignaalia x ennustettuun audiosignaaliin x ja muodostetaan virhesignaali E(k) kullekin lukuisista taajuusalikaistoista; I t * ' ·* 20 kvantisoidaan virhesignaalit E(k) kvantisoitujen virhesignaalien E (k) joukon muodostamiseksi; ja - · * * yhdistetään kvantisoidut virhesignaalit E (k) ja ennustuskertoimetyi : * 11 koodatun audiosignaalin muodostamiseksi. > · > ·

2. Vaatimuksen 1 mukainen menetelmä, tunnettu siitä, että :· menetelmä käsittää kehyksinä xm aikatasosta vastaanotetun :audiosignaalinx muuntamisen taajuustasoon taajuusalikaistasignaalien *;· X(k) muodostamiseksi ja ennustetun audiosignaalin x muuntamisen aikatasosta taajuustasoon ennustettujen taajuusalikaista-signaalien :‘j': 30 X(k) sarjan muodostamiseksi, ja jossa vertailu vastaanotetun audiosignaalinx ja ennustetun audiosignaalin x välillä suoritetaan 114248 16 taajuustasossa, verraten toisiaan vastaavia alikaistasignaaleja toisiinsa taajuusalikaista-virhesignaalien E(k) muodostamiseksi.

3. Menetelmä joka on vaatimuksen 1 mukainen, tunnettu siitä, että 5 menetelmä käsittää vastaanotetun audiosignaalin* ja ennustetun audiosignaalin * välillä aikatasossa suoritettavan vertailun myös aikatasossa olevan virhesignaalin e muodostamiseksi ja virhesignaalin e muuntamisen aikatasosta taajuustasoon mainittujen lukuisien taajuusalikaista-virhesignaalien E{k) muodostamiseksi. 10

4. Menetelmä koodatun audiosignaalin dekoodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: vastaanotetaan koodattu audiosignaali joka sisältää kvantisoidun virhesignaalin E{k) kutakin audiosignaalin lukuisaa taajuusalikaistaa kohti ja, 15 kutakin audiosignaalin kehystä kohti joukon ennustuskertoimia A, tunnettu siitä, että: ennustuskertoimien joukkoa Λ voidaan käyttää vastaanotetun audiosignaalin käsiteltävän aikakehyksen xm kunkin taajuusalikaistan , . ennustamiseen ainakin yhden rekonstruoidun kvantisoidun audiosignaalin x . · . 20 aikaisemman kehyksen perusteella; ·; : muodostetaan mainittu rekonstruoitu kvantisoitu audiosignaali x : i kvantisoitujen virhesignaalien E (k) perusteella; ja i · käytetään ennustuskertoimia Λ ja rekonstruoituja kvantisoituja v : audiosignaaleja x ennustetun audiosignaalin x muodostamiseksi, 25 jolloin mainittu rekonstruoitu kvantisoitu audiosignaali muodostetaan •;;; yhdistämällä kvantisoidut virhesignaalit E(k) ja ennustettu audiosignaali x. • · » I [ 5. Vaatimuksen 4 mukainen menetelmä, tunnettu siitä, että * ·; * * menetelmä käsittää seuraavat vaiheet: 30 ennustetun audiosignaalin x muuntaminen aikatasosta taajuustasoon » ennustettujen taajuusalikaista-signaalien X(k) sarjan muodostamiseksi ., 114248 yhdistettäväksi kvantisoituihin virhesignaaleihin E(k) rekonstruoitujen taajuusalikaista-signaalien X(k) joukon muodostamiseksi; ja rekonstruoitujen taajuusalikaistasignaalien X(k) muuntaminen taajuustasosta aikatasoon rekonstruoidun, kvantisoidun audiosignaalin x 5 muodostamiseksi.

6. Vaatimuksen 4 mukainen menetelmä, tunnettu siitä, että menetelmä käsittää seuraavat vaiheet: kvantisoitujen virhesignaalien E (k) muuntaminen taajuustasosta io aikatasoon kvantisoidun aikatason virhesignaalin e muodostamiseksi; ja aikatason kvantisoitujen virhesignaalien yhdistäminen suoraan ennustetun audiosignaalin x kanssa rekonstruoidun, kvantisoidun audiosignaalin 3c muodostamiseksi.

7. Laite audiosignaalin koodaamiseen, joka laite käsittää: sisäänmenon koodattavan audiosignaalin x vastaanottamiseksi; ensimmäiset generointivälineet (1) taajuusalikaistojen muodostamiseksi vastaanotetun audiosignaalin aikakehyksestä; : : mainittuun sisäänmenoon kytketyt prosessointivälineet (2,3;15-19) : ': 20 kvantisoidun audiosignaalin 3c muodostamiseksi vastaanotetun \ : audiosignaalin x perusteella; tunnettu siitä, että laite käsittää: *; : mainittuihin prosessointivälineisiin (3) liitetyt ennustusvälineet (12; 19) j · pitkän aikavälin ennustuskertoimien A joukon muodostamiseksi käytettäväksi v : kullekin aikakehyksen taajuusalikaistalle vastaanotetun audiosignaalin x 25 käsiteltävänä olevan aikakehyksen xm ennustamiseksi suoraan ainakin ;;; yhden kvantisoidun audiosignaalin 3c aikaisemman kehyksen perusteella; toiset generointivälineet (10-14;20,15) ennustetun audiosignaalin x *: ’ ‘: muodostamiseksi käyttäen pitkän aikavälin ennustuskertoimia A ja kvantisoitua audiosignaalia 3c ja vastaanotetun audiosignaalin x so vertaamiseksi ennustettuun audiosignaaliin x virhesignaalin E(k)muodostamiseksi kullekin lukuisista taajuusalikaistoista; „ 114248 kvantisointivälineet (3; 17) virhesignaalien £(ft)kvantisoimiseksi kvantisoitujen virhesignaalien E (k) joukon muodostamiseksi; ja yhdistämisvälineet (5;21) kvantisoitujen virhesignaalien E (k) yhdistämiseksi ennustuskertoimiin A koodatun audiosignaalin 5 muodostamiseksi.

8. Vaatimuksen 7 mukainen laite, tunnettu siitä, että mainitut toiset generoimisvälineet käsittävät ensimmäiset muuntamisvälineet (1) vastaanotetun audiosignaalin x muuntamiseksi aikatasosta taajuustasoon ja ίο toiset muuntamisvälineet (13) ennustetun audiosignaalin x muuntamiseksi aikatasosta taajuustasoon, sekä vertailuvälineet (14) jotka on järjestetty vertaamaan tulokseksi saatuja taajuustason signaaleja taajuustasossa.

9. Vaatimuksen 7 mukainen laite, tunnettu siitä, että toiset 15 generoimisvälineet on järjestetty vertaamaan vastaanotettua audiosignaalia x ennustettuun audiosignaaliin x aikatasossa.

10. Laite koodatun audiosignaalin x dekoodaamiseksi, tunnettu siitä, että: , ·. koodattu audiosignaali sisältää kvantisoidun virhesignaalin E (k) kutakin t : 20 lukuisaa audiosignaalin taajuusalikaistaa kohti ja sarjan ennustuskertoimia A ; *: käytettäväksi kullekin audiosignaalin aikakehyksen taajuusalikaistalle ja jossa *: *: ennustuskertoimia A voidaan käyttää ennustamaan vastaanotetun »» j ·· audiosignaalin käsiteltävä kehys xm ainakin yhden rekonstruoidun *’ kvantisoidun audiosignaalin x aikaisemman kehyksen perusteella, joka laite 25 käsittää: ·; ; sisäänmenon koodatun audiosignaalin vastaanottamiseksi; t · '*; · ‘ generoimisvälineet (24,25,9) rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi kvantisoitujen virhesignaalien E(k) perusteella; ja * t * • I · • • · 19 1 14248 signaalinkäsittelyvälineet (26) ennustetun audiosignaalin x muodostamiseksi ennustuskertoimien A ja mainitun rekonstruoidun kvantisoidun audiosignaalin x perusteella, jossa mainitut generoimisvälineet käsittävät yhdistämisvälineet (24,25) 5 ennustetun audiosignaalin x ja kvantisoitujen virhesignaalien E(k) yhdistämiseksi rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi. * I * f » * · • · : · • I · I · • · » t t · • IMU I * It* % t I I I • I I · t · · t · · » • · 2o 1 14248