FI114248B - Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen - Google Patents
Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen Download PDFInfo
- Publication number
- FI114248B FI114248B FI971108A FI971108A FI114248B FI 114248 B FI114248 B FI 114248B FI 971108 A FI971108 A FI 971108A FI 971108 A FI971108 A FI 971108A FI 114248 B FI114248 B FI 114248B
- Authority
- FI
- Finland
- Prior art keywords
- audio signal
- quantized
- frequency
- predicted
- signal
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 39
- 230000005236 sound signal Effects 0.000 claims description 138
- 230000007774 longterm Effects 0.000 claims description 27
- 238000012545 processing Methods 0.000 claims description 9
- 238000006243 chemical reaction Methods 0.000 claims description 5
- 238000013139 quantization Methods 0.000 claims description 4
- 230000008901 benefit Effects 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
Description
1 114248
Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
Esillä oleva keksintö koskee audiokoodausmenetelmää ja -laitetta, sekä audiodekoodausmenetelmää ja -laitetta.
5
On yleisesti tunnettua, että lähettämällä data digitaalimuodossa saavutetaan tiedonsiirtokanavalla paremmat signaali-kohina suhteet ja kasvanut informaatiokapasiteetti. On kuitenkin olemassa jatkuva halu lisätä kanavan kapasiteettia kompressoimalla digitaalisia signaaleja vielä enemmän, ίο Audiosignaalien suhteen sovelletaan kahta kompression perusperiaatetta. Näistä ensimmäinen käsittää lähtösignaalissa olevien tilastollisten tai determinististen redundanssien poistamisen ja toinen taas käsittää sellaisten elementtien vaimentamisen tai eliminoinnin lähtösignaalista, jotka ovat redundantteja ihmisaistien kannalta. Viime aikoina jälkimmäisestä periaatteesta on tullut 15 vallitseva korkealuokkaisissa audiosovellluksissa ja siihen kuuluu tyypillisesti audiosignaalin jakaminen taajuuskomponentteihinsa (joita joskus kutsutaan "alikaistoiksi"), joista kukin analysoidaan ja kvantisoidaan kvantisointitarkkuudella jonka katsotaanpoistavan (kuulijan kannalta) epäoleellisen datan. ISO (International Standards Organization) MPEG (Moving Picture Expert Group) v .: 20 audiokoodausstandardi ja muut audiokoodaus-standardit käyttävät ja edelleen *.. : tarkentavat tätä periaatetta. Kuitenkin, MPEG (ja muut standardit) käyttävät myös ' ' tekniikkaa, joka tunnetaan nimellä "adaptiivinen (mukautuva) ennustaminen" [ ' saadakseen aikaan datan nopeuden alenemisen edelleen.
* t • · » *« · I t t **’ 25 Uuden MPEG-2 AAC standardin mukaisen kooderin toiminta on kuvattu yksityiskohtaisesti kansainvälisen standardidokumentin luonnoksessa ISO/IEC "'.I DIS 13818-7. Tämä uusi MPEG-2 soveltaa lineaarista taaksepäin ennustusta
1 I
käyttäen 672 taajuuskomponenttia 1024:sta. On odotettavissa, että uusi MPEG-4 standardi sisältää vastaavat vaatimukset. Kuitenkin, noin suuri määrä • « a • > ’ ·; · ’ 30 taajuuskomponentteja johtaa suuriin laskennan aiheuttamiin kustannuksiin johtuen ennustusalgoritmin monimutkaisuudesta ja se edellyttää myös että käytettävissä on runsaasti muistia laskettujen-ja välikertoimien tallentamista varten. On 2 114248 yleisesti tunnettua, että kun tämän tyyppisiä taaksepäin ennustimia käytetään taajuustasossa, on vaikeaa vähentää edelleen laskentakuormituksia ja muistivaatimuksia. Tämä johtuu siitä, että taajuustasossa ennustimien määrä on niin suuri, että hyvin yksinkertainenkin algoritmi johtaa monimutkaiseen 5 laskentaan ja suuriin muistivaatimuksiin. Vaikka tätä ongelmaa osataankin väistää käyttämällä eteenpäin ennustavia adaptiivisia ennustimia, jotka päivitetään enkooderissa ja lähetetään dekooderille, eteenpäin ennustavien adaptiivisten ennustimien käyttö taajuustasossa väistämättä johtaa suureen määrään "sivuinformaatiota" ennustimien suuresta määrästä johtuen.
10
Esillä olevan keksinnön tarkoitus on voittaa tunnettujen ennustusmenetelmien haitat, tai ainakin lieventää niitä.
Tämä ja muut tavoitteet saavutetaan koodaamalla audiosignaali käyttäen is virhesignaaleja poistamaan redundanssit jokaisesta monista audiosignaalin taajuuden alikaistoista ja lisäksi synnyttämään pitkän aikavälin aikatason ennustekertoimia, jotka mahdollistavat audiosignaalin kehyksen ennustamisen yhden tai useamman aikaisemman kehyksen perusteella.
20 Esillä olevan keksinnön ensimmäisessä toteutusmuodossa esitetään menetelmä > t : . * audiosignaalin koodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: * ‘ : vastaanotetaan koodattava signaali x; * » »t muodostetaan taajuusalikaistoja vastaanotetun audiosignaalin : ’ aikakehyksestä ; *·* ' 25 muodostetaan kvantisoitu audiosignaali x vastaanotetun audiosignaalin x perusteella; muodostetaan pitkän aikavälin ennustuskertoimien A sarja; I » ' I ’ jolle menetelmälle on tunnusomaista se, että * » · • · ·: ennustetaan vastaanotetun audiosignaalin käsiteltävänä oleva * t *·;* 30 aikakehys käyttäen pitkän aikavälin ennustuskertoimien A sarjaa kullekin : aikakehyksen taajuusalikaistoista suoraan ainakin yhden kvantisoidun audiosignaalin x aikaisemman aikakehyksen perusteella; 3 114248 käytetään ennustuskertoimien A sarjaa ennustetun audiosignaalin x muodostamiseksi kvantisoidusta audiosignaalista *; verrataan vastaanotettua audiosignaalia * ennustettuun audiosignaaliin x ja muodostetaan virhesignaali E(k) kullekin lukuisista taajuusalikaistoista; 5 kvantisoidaan virhesignaalit E(k) kvantisoitujen virhesignaalien E(k) joukon muodostamiseksi; ja yhdistetään kvantisoidut virhesignaalit E(k) ja ennustuskertoimet A koodatun audiosignaalin muodostamiseksi.
ίο Esillä oleva keksintö tarjoaa audiosignaalin kompressoinnin käyttäen eteenpäin ennustusta aikatasossa. Kutakin vastaanotetun signaalin aikakehystä kohti tarvitsee luoda ja lähettää vain yksi ryhmä eteenpäin ennustuksen ennustekertoimia dekooderille lähetettäväksi. Tämä poikkeaa tunnetuista eteenpäin ennustuksen tekniikoista, joissa täytyy luoda joukko ennustekertoimia is jokaisen kehyksen jokaista alikaistaa kohti. Verrattuna ennustehyötyihin, jotka saavutetaan esillä olevan keksinnön avulla, pitkän aikavälin ennustimen sivuinformaatio on merkityksetön.
Eräät keksinnön toteutusmuodot mahdollistavat laskennan monimutkaisuuden ja 20 muistivaatimusten vähentämisen. Erityisesti, verrattuna taaksepäin ennustuksen käyttöön, ei ole tarvetta laskea uudelleen ennustekertoimia dekooderissa. Eräät : keksinnön toteutusmuodot kykenevät myös vastaamaan signaalin muutoksiin : tavanomaisia taaksepäin ennustavia ennustimia nopeammin.
I I 4 · t » ‘: ‘!: 25 Eräässä keksinnön toteutusmuodossa vastaanotettu audiosignaali χ muunnetaan : " kehyksissä xm aikatasosta taajuustasoon taajuusalikaistasignaalien X(k) joukon ' · ’ saamiseksi. Ennustettu audiosignaali x muunnetaan samalla tavalla aikatasosta . taajuustasoon ennustettujen taajuus-alikaistasignaalien X (k) luomiseksi ja .···. vertailu vastaanotetun audiosignaalin^ ja ennustetun audiosignaalin x välillä 3o suoritetaan taajuustasossa, vertaamalla toisiaan vastaavia alikaistasignaaleja keskenään taajuusalikaista-virhesignaalien E(k) luomiseksi. Kvantisoitu • · * 4 114248 audiosignaali x synnytetään yhdistämällä ennustettu signaali ja kvantisoitu virhesignaali joko aikatasossa tai taajuustasossa.
Eräässä keksinnön vaihtoehtoisessa toteutusmuodossa vertailu vastaanotetun 5 audiosignaalin/ ja ennustetun audiosignaalinxvälillä suoritetaan aikatasossa, myös aikatasossa olevan virhesignaalin e luomiseksi. Tämä virhesignaali e muunnetaan sitten aikatasosta taajuustasoon mainitun taajuusalikaista-virhesignaalien E(k) joukon luomiseksi.
ίο Virhesignaalien kvantisointi suoritetaan edullisesti psyko-akustisen mallin mukaisesti.
Esillä olevan keksinnön erään toisen toteutusmuodon mukaisesti nyt on keksitty menetelmä koodatun audiosignaalin dekoodaamiseksi, jossa menetelmässä 15 vastaanotetaan koodattu audiosignaali joka sisältää kvantisoidun virhesignaalin E (k) kutakin audiosignaalin lukuisaa taajuusalikaistaa kohti ja, kutakin audiosignaalin kehystä kohti joukon ennustuskertoimia A, ja jolle menetelmälle on tunnusomaista se, että: , ennustuskertoimien joukkoa A voidaan käyttää vastaanotetun • = » 20 audiosignaalin käsiteltävän aikakehyksen xm kunkin taajuusalikaistan • · ... : ennustamiseen ainakin yhden rekonstruoidun kvantisoidun audiosignaalin x .; · ; aikaisemman kehyksen perusteella; j*> , muodostetaan mainittu rekonstruoitu kvantisoitu audiosignaali x • : [! : kvantisoitujen virhesignaalien E (k) perusteella; ja 25 käytetään ennustuskertoimia A ja rekonstruoituja kvantisoituja ···:’ audiosignaaleja x ennustetun audiosignaalin x muodostamiseksi, jolloin mainittu rekonstruoitu kvantisoitu audiosignaali muodostetaan yhdistämällä kvantisoidut virhesignaalit E (k) ja ennustettu audiosignaali x.
30 Dekoodausmenetelmä voi sisältää vaiheen, jossa ennustettu audiosignaali x muunnetaan aikatasosta taajuustasoon, jotta saadaan joukko ennustettuja 5 114248 taajuusalikaistasignaaleja X (k) yhdistettäväksi kvantisoituihin virhesignaaleihin E (k) rekonstruoitujen taajuusalikaistasignaalien X (k) joukon luomiseksi. Tämän jälkeen rekonstruoitu kvantisoitu audiosignaali x luodaan suorittamalla rekonstruoiduille taajuusalikaistasignaaleille X (k) muunnos taajuustasosta 5 aikatasoon. Tämä toteutusmuoto on erityisen sovelias silloin, kun vastaanotetaan ainoastaan alaryhmä kaikista mahdollisista kvantisoiduista virhesignaaleista E (k) ja osa alikaistatiedoista lähetetään suoraan lähettämällä audioalikaistasignaalit X(k). Signaalit x (k) ja X(k) yhdistetään asianmukaisesti ennen taajuus-aika muunnoksen suorittamista.
10
Eräässä dekoodausmenetelmän vaihtoehtoisessa toteutusmuodossa menetelmään sisältyy alkuvaihe, jossa muunnetaan kvantisoidut virhesignaalit E (k) taajuustasosta aikatasoon kvantisoidun aikatason virhesignaalin ε luomiseksi. Tämä virhesignaali yhdistetään sen jälkeen suoraan ennustetun 15 audiosignaalinx kanssa rekonstruoidun audiosignaalini luomiseksi.
Esillä olevan keksinnön erään kolmannen toteutusmuodon mukaisesti nyt on keksitty laite audiosignaalin koodaamiseen, joka laite käsittää: sisäänmenon koodattavan audiosignaalin x vastaanottamiseksi; 20 ensimmäiset generointivälineet (1) taajuusalikaistojen muodostamiseksi vastaanotetun audiosignaalin aikakehyksestä; *. . mainittuun sisäänmenoon kytketyt prosessointivälineet (2,3; 15-19) . 1 ; kvantisoidun audiosignaalin x muodostamiseksi vastaanotetun • ; · i audiosignaalin x perusteella; ja jolle laitteelle on tunnusomaista se, että laite ·:· : 25 käsittää: . mainittuihin prosessointivälineisiin (3) liitetyt ennustusvälineet (12; 19) : t; : pitkän aikavälin ennustuskertoimien A joukon muodostamiseksi käytettäväksi kullekin aikakehyksen taajuusalikaistalle vastaanotetun audiosignaalin 1 käsiteltävänä olevan aikakehyksen xm ennustamiseksi suoraan ainakin ·;·1 30 yhden kvantisoidun audiosignaalin x aikaisemman kehyksen perusteella; toiset generointivälineet (10-14;20,15) ennustetun audiosignaalin x • 1» :: muodostamiseksi käyttäen pitkän aikavälin ennustuskertoimia A ja · • 1
t I I
• · · • · t 6 114248 kvantisoitua audiosignaalia x ja vastaanotetun audiosignaalin x vertaamiseksi ennustettuun audiosignaaliin x virhesignaalin E(k) muodostamiseksi kullekin lukuisista taajuusalikaistoista; kvantisointivälineet (3; 17) virhesignaalien E{k) kvantisoimiseksi 5 kvantisoitujen virhesignaalien E(k) joukon muodostamiseksi; ja yhdistämisvälineet (5;21) kvantisoitujen virhesignaalien E (k) yhdistämiseksi ennustuskertoimiin A koodatun audiosignaalin muodostamiseksi.
ίο Eräässä toteututusmuodossa mainitut generointivälineet käsittävät ensimmäiset muunnosvälineet vastaanotetun audiosignaalin^ muuntamiseksi aikatasosta taajuustasoon ja toiset muunnosvälineet ennustetun audiosignaalinx muuntamiseksi aikatasosta taajuustasoon, sekä vertailuvälineet jotka on järjestetty vertailemaan saatuja taajuustason signaaleja taajuustasossa.
15
Eräässä keksinnön vaihtoehtoisessa toteututusmuodossa generointivälineet on järjestetty vertailemaan vastaanotettua audiosignaalia^ ja ennustettua audiosignaalia £ aikatasossa.
· ; 20 Erään esillä olevan keksinnön neljännen toteutusmuodon mukaisesti on keksitty * • laite vastaanotetun koodatun audiosignaalin^ dekoodaamiseksi, jolle * : laitteelle on tunnusomaista se, että: : ’’ koodattu audiosignaali sisältää kvantisoidun virhesignaalin E (k) kutakin f · I ·
lukuisaa audiosignaalin taajuusalikaistaa kohti ja sarjan ennustuskertoimia A
25 käytettäväksi kullekin audiosignaalin aikakehyksen taajuusalikaistalle ja jossa ’ ennustuskertoimia A voidaan käyttää ennustamaan vastaanotetun * · audiosignaalin käsiteltävä kehys xm ainakin yhden rekonstruoidun < * · kvantisoidun audiosignaalin 3c aikaisemman kehyksen perusteella, joka laite * · käsittää: • * · *·’ 30 sisäänmenon koodatun audiosignaalin vastaanottamiseksi; • I · t * • · 7 114248 generoimisvälineet (24,25,9) rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi kvantisoitujen virhesignaalien E (k) perusteella; ja signaalinkäsittelyvälineet (26) ennustetun audiosignaalin x 5 muodostamiseksi ennustuskertoimien A ja mainitun rekonstruoidun kvantisoidun audiosignaalin x perusteella, jossa mainitut generoimisvälineet käsittävät yhdistämisvälineet (24,25) ennustetun audiosignaalin x ja kvantisoitujen virhesignaalien E{k) yhdistämiseksi rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi.
10
Seuraavassa keksinnön ymmärtämiseksi paremmin ja keksinnön toteuttamisen havainnollistamiseksi esimerkkien avulla viitataan oheisiin kuviin, joissa:
Kuva 1 esittää kaaviona kooderia vastaanotetun audiosignaalin koodaamiseksi,
Kuva 2 esittää kaaviona dekooderia Kuvan 1 mukaisella kooderilla koodatun 15 audiosignaalin dekoodaamiseksi,
Kuva 3 esittää tarkemmin Kuvan 1 mukaista kooderia ja kooderin sisältämää ennustustyökalua;
Kuva 4 esittää tarkemmin Kuvan 2 mukaista dekooderia ja dekooderin sisältämää , ennustustyökalua; ja t 20 Kuva 5 esittää tarkemmin erästä Kuvan 1 mukaisen kooderin muunnosta, joka : käsittää vaihtoehtoisen ennustustyökalun.
«•tl • I
Kuva 1 esittää lohkokaaviona enkooderin, joka suorittaa koodaustoiminnon, joka : on määritelty yleisluontoisesti standardissa MPEG-2 AAC. Sisääntulo kooderille 25 on näytteistetty yksivaiheinen signaali x, jonka näytepisteet on ryhmitelty -;* aikakehyksiin tai 2N pisteen ryhmiin, esim.
O *,, = (*„(0).*,,(1)>·.·*.,(2Λ-1))Γ (1) » jossa m on ryhmän tunnus ja T ilmaisee transpoosi-operaation. Näytepisteiden . 30 ryhmittely tehdään suodatinpankkityökalulla 1, joka suorittaa myös muunnetun erillisen kosinimuunnoksen (MDCT) kullekin audiosignaalin yksittäiselle kehykselle taajuusalikaistakertoimien joukon saamiseksi.
, Ή4248 Χ„, = (X„(0),X„(1)„..X„(W - 1))’ (2)
Alikaistat on määritelty MPEG-standardissa.
Eteenpäin ennustavan MDCT:n määrittelee: 5 2ΛΤ-1 π *„(*) = Σ /(i)x„(i)cos(—(2i +1 + N XU + 1)), (3) <=o 4^· k= 0....Λ/-1 jossa /(/) on analyysi-synteesi ikkuna, joka on sellainen symmetrinen ikkuna, että ίο sen lisäys-päällekkäisyysvaikutus tuottaa yksikkövahvistuksen signaaliin.
Taajuusalikaistasignaalit X(k) syötetään vuorollaan ennustustyökalulle 2 (jota kuvataan tarkemmin jäljempänä), joka pyrkii eliminoimaan pitkäaikaisredundanssin kustakin taajuusalikaistasignaalista. Tuloksena saadaan 15 sarja taajuusalikaistojen virhesignaaleja.
= (4) jotka ilmaisevat pitkän aikavälin muutoksia vastaavissa alikaistoissa, sekä sarjan eteenpäin ennustuksen kertoimia A kullekin kehykselle.
• * * · 20 Alikaistavirhesignaalit E(k)syötetään kvantisoijalle 3, joka kvantisoi kunkin • : : signaalin psykoakustisen mallin määräämällä bittimäärällä. Tätä mallia soveltaa ·' .. ohjausyksikkö 4. Kuten mainittiin, psykoakustinen malli mallintaa ihmisen kuulon : peitto-ominaisuuksia. Kvantisoidut virhesignaalit E(k)]a ennustuskertoimetΛ yhdistetään tämän jälkeen bittivirran multiplekserissä 5 lähetettäväksi .. ’: ’ 25 lähetyskanavan 6 kautta.
• *
Kuva 2 esittää Kuvan 1 mukaisella kooderilla koodatun audiosignaalin dekoodaukseen tarkoitetun dekooderin yleisrakenteen. Bittivirran demultiplekseri 7 erottaa ensiksi ennustuskertoimet^ kvantisoiduista virhesignaaleista E (k) ja 30 erottaa virhesignaalit erillisiksi alikaistasignaaleiksi. Ennustuskertoimet/i ja 9 114248 kvantisoidut alikaistavirhesignaalit E (k) syötetään ennustustyökalulle 8 joka suorittaa kooderissa tehdylle ennustusprosessille käänteisen operaation, eli ennustustyökalu palauttaa kooderissa poistetun redundanssin rekonstruoitujen kvantisoitujen alikaistasignaalien X(k) muodostamiseksi. Suodatinpankkityökalu 5 9 palauttaa tämän jälkeen aikatason signaalin x vastaanotetun version X(k) käänteisellä muunnoksella, jota kuvaa *(*) = “-i0‘ + N) + um(i), (5) i = Ο,.,.,Ν -1 jossa uk(i),i = 0,...2N -1 ovat X :n käänteinen muunnos 10 um(i) = / (i)£xm(*)cos(-^(2i + 1+ N)(2k +1)), i = 0,...,2N -1 ja joka approksimoi alkuperäistä audiosignaalia jc .
Kuva 3 kuvaa yksityiskohtaisemmin Kuvan 1 esittämän kooderin 15 ennustusmenetelmää. Käyttämällä kvantisoituja taajuusalikaista-virhesignaaleja E(k) prosessointiyksikkö 10 muodostaa sarjan kvantisoituja taajuusalikaistasignaaleja X(k). Signaalit X(k) syötetään vuorostaan suodatinpankkiin 11, joka käsittelee signaaleja käänteisellä erillisellä kosinimuunnoksella (IMDCT) kvantisoidun aikatason signaalin x ·' 20 muodostamiseksi. Tämän jälkeen signaalia syötetään pitkän aikavälin • · · ‘ ennustustyökaluun 12 joka vastaanottaa myös tulevan audiosignaalin x.
Ennustustyökalu 12 käyttää pitkän aikavälin (LT) ennustinta poistamaan ' ,]* redundanssin käsiteltävänä olevassa kehyksessä m+1 olevasta audiosignaalista aikaisemman kvantisoidun datan perusteella.
. 25 Tämän ennustimen siirtofunktio P on: »* * · t ... m-> ^ω= Σ^"(“+ί) (5) φ k = -m i ['.V.' jossa a edustaa pitkää, 1 - 1024 näytteen viivettä ja bk edustaa • · ♦ ennustuskertoimia.
* I · • · • % .0 114248
Kun mi = m2 = 0 ennustin on Ί-tappinen", kun mi = m2 = 1 ennustin on "3-tappinen1'.
Parametrit a ja bk määritetään LT-ennustuksen jälkeen minimoimalla 5 keskineliövirhe (MSE) 2N näytteen jaksolta. Yhden "tap'in" ennustinta käytettäessä pitkän aikavälin ennusteen jäännössignaaliksi r(i) saadaan: r(i) = x(i) - bx(i - 2N + 1 + a) (6) jossa * on aikatason audiosignaali ja x on kvantisoitu aikatason signaali. Keskimääräinen neliöity jäännössignaali R saadaan yhtälöstä: 2N-1 2N-1 10 R= £r2(0= ^(x(i)-bx(i- 2N + l-a))2 (7) i=0 /=0
Asettamalla dR! db = 0, saadaan V2N 1 jc(i)jc(i - 2 N +1 + a) b = -2M - (8) XN_o\x(i-2N-a)f ja kun yhtälöön (7) sijoitetaan b, saadaan 15 (9) Σ,·=0 (^C«-22V + 1 -a))2
Termin R minimoiminen maksimoi yhtälön (9) oikean puolen toisen termin. Tämä termi lasketaan kaikilla mahdollisilla a :n arvoilla sille määritellyllä alueella, ja * ‘ valitaan se a :n arvo joka maksimoi tämän termin. Nimittäjän energia Ω voidaan e · · · * helposti, uudelleen laskemisen sijasta, päivittää viiveestä (a -1) arvoon a * , 20 seuraavan yhtälön avulla: ; Ωα=Ωα_ι+χ\-α)-(-α + Ν) (10)
Jos käytetään yhden "tap'in" ennustinta, yhtälöä (8) käytetään laskettaessa ·:··: ennustekerroin bj. Jos kyseessä on j "tap'in" ennustin, LT ennusteviive a '...: määritetään aluksi maksimoimalla yhtälön (9) toinen termi ja tämän jälkeen :· 25 ratkaistaan jxjyhtälön joukko j ennustekertoimen laskemiseksi.
• · • · «· · 11 114248 LT ennustusparametrit^ ovat viive a ja ennustekerroin bj. Viive kvantisoidaan 9 - 11 bitin tarkkuudella, käytetystä alueesta riippuen. Tavallisimmin käytetään 10 bittiä, jolloin arvoja voi olla 1024 välillä 1 -1024. Bittimäärän alentamiseksi LT ennusteviiveet voidaan deltakoodata 5 bitin tarkkuudella parillisissa kehyksinä.
5 Kokeet osoittavat että vahvistuksen koodaaminen 4 - 6 bitin tarkkuudella riittää. Vahvistuksen epätasaisesta jakaumasta johtuen on käytettävä epätasaista kvantisointia.
Edellä kuvatussa menetelmässä LT-synteesisuodattimen 1 / P(z) stabiilisuutta ei ίο aina voi taata. Yhden "tap'in" ennustimelle stabiilisuusehto on |ό| < 1. Tämän takia stabilointi voidaan toteuttaa helposti asettamalla |ö| = 1 aina kun |&| > 1. Kun kyseessä on 3 "tap'in" ennustin, voidaan suorittaa toinen stabilointimenettely, kuten on kuvattu artikkelissa R.P. Ramachandran and P. Kbal, "Stability and performance analysis of pitch filters in speech coders", IEEE Trans. ASSP, vol.
15 35, no.7, sivut 937-946, heinäkuu 1987. Kuitenkaan LT-synteesisuodattimen epästabiilisuus ei ole kovin haitallinen rekonstruoidun signaalin laadun kannalta.
Suodatin on epästabiili muutamien kehysten ajan (lisäten energiaa), mutta vähitellen päästään stabiileihin jaksoihin, jolloin ulostulon kasvu ei jatku ajan 1· funktiona.
> · : 20 • ·: Kun LT-ennustuskertoimet on määritetty, voidaan määrittää (m+1):nnen kehyksen ! ennustettu signaali: , x(i) = ^bjX(i-2N+ l-a), (11)
i = mN + \,mN + 2 1 )N
·; ; 25 Tämän jälkeen ennustettu aikatason signaali x syötetään suodatinpankkiin 13, joka käsittelee signaalia MDCT-menetelmällä (m+1):nnen kehyksen ennustettujen spektrikertoimien Xm+i(k) luomiseksi. Ennustetut spektrikertoimet X(k) t · *·;·’ vähennetään tämän jälkeen spektrikertoimista X(k) vähennysyksikössä 14.
• » · #11 · 12 114248
Jotta voitaisiin taata, että ennustusta käytetään ainoastaan jos se johtaa koodaushyötyyn, tarvitaan sopiva ennustimien ohjaus ja pieni määrä ennustimien ohjausinformaatiota pitää lähettää dekooderille. Tämä toiminto suoritetaan vähennysyksikössä 14. Ennustimen ohjausmenetelmä on sama kuin se 5 taaksepäin ennustuksen ohjausmenetelmä, jota on käytetty MPEG-2 Advanced Audio Coding (AAC):ssa. Kunkin kehyksen ennustuksen ohjausinformaatio, joka lähetetään sivuinformaationa, määritetään kahdessa vaiheessa. Ensiksi, kunkin skaalaustekijäkaistan osalta määritetään johtaako ennustus koodaushyötyyn vai ei, ja jos vastaus on kyllä, ennustin_käytössä bitti-arvoksi tuolle ίο skaalaustekijäkaistalle asetetaan yksi. Kun tämä on tehty kaikille skaalaustekijäkaistoille, määritetään kompensoiko tälle kehykselle ennustuksella saavutettu kokonaiskoodaushyöty ainakin ennustimen sivuinformaatiosta aiheutuvan lisäbittien tarpeen. Jos vastaus on kyllä, ennusti n_datajäsnä bitin arvoksi asetetaan yksi ja koko sivuinformaatio, mukaan lukien ennustimen 15 nollaukseen tarvittava, lähetetään ja ennustusvirheen arvo syötetään kvantisoijaan. Muussa tapauksessa ennustin_data_ läsnä -bitin arvoksi asetetaan 0 ja ennustin_käytössä bitit asetetaan kaikki nolliksi eikä niitä lähetetä. Tässä tapauksessa spektraalikomponentin arvo syötetään kvantisoijaan 3. Kuten edellä on esitetty, ennustuksen ohjaus kohdistuu ensin kaikkiin yhden 20 skaalauskerroinkaistan ennustimiin, mitä seuraa toinen vaihe joka kohdistuu kaikkiin skaalauskerroinkaistoihin.
»· * · » · «
On selvää että LT-ennustuksen tavoitteena on saavuttaa suurin ennustuksen kokonaishyöty. Merkitään G, :llä ennustushyötyä / :nnellä taajuusalikaistalla.
25 Ennustuksen kokonaishyöty tietyssä kehyksessä voidaan laskea seuraavasti: > · · G= ΣΟ, (12) /=i&(g>o) ‘ · ·. Jos hyöty kompensoi ennustimen sivuinformaation lisäbittien tarpeen, esim.
* · I
G > T(dB), koko sivuinformaatio lähetetään ja ne ennustimet jotka antavat » .**·. positiivisen hyödyn kytketään päälle. Muussa tapauksessa ennustimia ei käytetä.
*»* t · · 30 i3 1 14248
Edellä esitetyllä menetelmällä saadut LP-parametrit eivät ole suoraan verrannollisia hyödyn maksimointiin. Kuitenkin, laskemalla vahvistus jokaiselle lohkolle ja jokaiselle viiveelle valitulla alueella (tässä esimerkissä 1 - 1024) ja valitsemalla se viive, jolla saavutetaan suurin ennustuksen kokonaishyöty, 5 optimoidaan ennustusprosessi. Valittu viive a ja vastaavat kertoimet b lähetetään sivuinformaationa kvantisoitujen virhe-alikaistasignaalien mukana. Vaikka laskennan monimutkaisuus kooderissa kasvaa, laskennan monimutkaisuus dekooderissa ei lisäänny.
ίο Kuva 4 esittää yksityiskohtaisemmin Kuvan 2 dekooderia. Koodatun audiosignaalin vastaanottaa siirtokanavalta 6 bittivirran demultiplekseri 7, kuten edellä on kuvattu. Bittivirran demultiplekseri 7 erottelee ennustuskertoimet A ja kvantisoidut virhesignaalit E(k), sekä toimittaa ne ennustustyökalulle 8. Tämä työkalu käsittää yhdistäjän 24, joka yhdistää kvantisoidut virhesignaalit E(k) ja 15 ennustetun taajuustason audiosignaalin X(k) rekonstruoidun, myös taajuustasossa olevan, audiosignaalin X(k) synnyttämiseksi. Suodatinpankki 9 muuntaa rekonstruoidun signaalin X(k) taajuustasosta aikatasoon rekonstruoidun aikatason audiosignaalin x luomiseksi. Tämä signaali vuorostaan syötetään palautteena pitkän aikavälin ennustustyökalulle, joka vastaanottaa myös . 20 ennustuskertoimet A. Pitkän aikavälin ennustustyökalu 26 synnyttää ennustetun, käsiteltävän aikakehyksen aikaisempien rekonstruoitujen aikakehysten perusteella , ‘: käyttäen käsiteltävän kehyksen ennustekertoimia. Suodatinpankki 25 muuntaa . ennustetun signaalin x.
. 25 Kuva 5 esittää Kuvan 1 esittämän audiosignaalikooderin erästä vaihtoehtoista toteutustapaa, jossa vertailuyksikkö 15 vertaa koodattavaa audiosignaalia x ··· aikatasossa olevaan ennustettuun signaaliin x synnyttääkseen virhesignaalin e, • joka myös on aikatasossa. Suodatinpankkityökalu 16 muuntaa tämän jälkeen ,virhesignaalin aikatasosta taajuustasoon taajuusalikaista-virhesignaalien E(k) 30 joukon luomiseksi. Nämä signaalit kvantisoidaan tämän jälkeen kvantisoijassa 17 * · · .··. kvantisoitujen virhesignaalien E (k) joukon luomiseksi.
14 114248 Tämän jälkeen käytetään suodatinpankkia 18 muuntamaan kvantisoidut virhesignaalit E(k) takaisin aikatasoon, tuloksena signaali e . Tämä kvantisoitu aikatason virhesignaali e yhdistetään sen jälkeen signaalinkäsittely-yksikössä 19 5 ennustettuun aikatason signaaliin x kvantisoidun audiosignaalin x muodostamiseksi. Ennustustyökalu 20 suorittaa saman toiminnon kuin Kuvan 3 kooderin työkalu 12, muodostaen ennustetun audiosignaalin jc ja ennustuskertoimet A. Ennustuskertoimet ja kvantisoidut virhesignaalit yhdistetään bittivirran multiplekserissa 21 lähetettäväksi lähetyskanavalle 22. ίο Kuten edellä on esitetty, virhesignaalit kvantisoidaan ohjaimessa 23 psykoakustisen mallin mukaan.
Edellä kuvatut audiokoodausalgoritmit mahdollistavat audiosignaalien kompressoinnin alhaisilla bittinopeuksilla. Tekniikka perustuu pitkän aikavälin (LT) 15 ennustamiseen. Tunnettuihin taaksepäin ennustuksen tekniikkoihin verrattuna tässä kuvatut tekniikat tarjoavat suuremmat ennustushyödyt yksittäisille instrumentaalimusiikkisignaaleile ja puhesignaaleille, vaatien kuitenkin vain alhaista laskennan monimutkaisuutta.
t I · • > f
» I
• 1 tl· I » * · ·
• I
I I · 1 tl» ' i · I 1 · • • I1· * 1 · I » • « · » ♦ 1 » I 1 · II» ·
Claims (10)
15 114248
1. Menetelmä audiosignaalin koodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: 5 koodattava signaali x vastaanotetaan; muodostetaan taajuusalikaistoja vastaanotetun audiosignaalin aikakehyksestä; muodostetaan kvantisoitu audiosignaali x vastaanotetun audiosignaalin x perusteella; ίο muodostetaan pitkän aikavälin ennustuskertoimien A sarja; tunnettu siitä, että ennustetaan vastaanotetun audiosignaalin käsiteltävänä oleva aikakehys käyttäen pitkän aikavälin ennustuskertoimien A sarjaa kullekin aikakehyksen taajuusalikaistoista suoraan ainakin yhden kvantisoidun 15 audiosignaalin x aikaisemman aikakehyksen perusteella; käytetään ennustuskertoimien A sarjaa ennustetun audiosignaalin x muodostamiseksi kvantisoidusta audiosignaalista x ; verrataan vastaanotettua audiosignaalia x ennustettuun audiosignaaliin x ja muodostetaan virhesignaali E(k) kullekin lukuisista taajuusalikaistoista; I t * ' ·* 20 kvantisoidaan virhesignaalit E(k) kvantisoitujen virhesignaalien E (k) joukon muodostamiseksi; ja - · * * yhdistetään kvantisoidut virhesignaalit E (k) ja ennustuskertoimetyi : * 11 koodatun audiosignaalin muodostamiseksi. > · > ·
2. Vaatimuksen 1 mukainen menetelmä, tunnettu siitä, että :· menetelmä käsittää kehyksinä xm aikatasosta vastaanotetun :audiosignaalinx muuntamisen taajuustasoon taajuusalikaistasignaalien *;· X(k) muodostamiseksi ja ennustetun audiosignaalin x muuntamisen aikatasosta taajuustasoon ennustettujen taajuusalikaista-signaalien :‘j': 30 X(k) sarjan muodostamiseksi, ja jossa vertailu vastaanotetun audiosignaalinx ja ennustetun audiosignaalin x välillä suoritetaan 114248 16 taajuustasossa, verraten toisiaan vastaavia alikaistasignaaleja toisiinsa taajuusalikaista-virhesignaalien E(k) muodostamiseksi.
3. Menetelmä joka on vaatimuksen 1 mukainen, tunnettu siitä, että 5 menetelmä käsittää vastaanotetun audiosignaalin* ja ennustetun audiosignaalin * välillä aikatasossa suoritettavan vertailun myös aikatasossa olevan virhesignaalin e muodostamiseksi ja virhesignaalin e muuntamisen aikatasosta taajuustasoon mainittujen lukuisien taajuusalikaista-virhesignaalien E{k) muodostamiseksi. 10
4. Menetelmä koodatun audiosignaalin dekoodaamiseksi, joka menetelmä käsittää seuraavat vaiheet: vastaanotetaan koodattu audiosignaali joka sisältää kvantisoidun virhesignaalin E{k) kutakin audiosignaalin lukuisaa taajuusalikaistaa kohti ja, 15 kutakin audiosignaalin kehystä kohti joukon ennustuskertoimia A, tunnettu siitä, että: ennustuskertoimien joukkoa Λ voidaan käyttää vastaanotetun audiosignaalin käsiteltävän aikakehyksen xm kunkin taajuusalikaistan , . ennustamiseen ainakin yhden rekonstruoidun kvantisoidun audiosignaalin x . · . 20 aikaisemman kehyksen perusteella; ·; : muodostetaan mainittu rekonstruoitu kvantisoitu audiosignaali x : i kvantisoitujen virhesignaalien E (k) perusteella; ja i · käytetään ennustuskertoimia Λ ja rekonstruoituja kvantisoituja v : audiosignaaleja x ennustetun audiosignaalin x muodostamiseksi, 25 jolloin mainittu rekonstruoitu kvantisoitu audiosignaali muodostetaan •;;; yhdistämällä kvantisoidut virhesignaalit E(k) ja ennustettu audiosignaali x. • · » I [ 5. Vaatimuksen 4 mukainen menetelmä, tunnettu siitä, että * ·; * * menetelmä käsittää seuraavat vaiheet: 30 ennustetun audiosignaalin x muuntaminen aikatasosta taajuustasoon » ennustettujen taajuusalikaista-signaalien X(k) sarjan muodostamiseksi ., 114248 yhdistettäväksi kvantisoituihin virhesignaaleihin E(k) rekonstruoitujen taajuusalikaista-signaalien X(k) joukon muodostamiseksi; ja rekonstruoitujen taajuusalikaistasignaalien X(k) muuntaminen taajuustasosta aikatasoon rekonstruoidun, kvantisoidun audiosignaalin x 5 muodostamiseksi.
6. Vaatimuksen 4 mukainen menetelmä, tunnettu siitä, että menetelmä käsittää seuraavat vaiheet: kvantisoitujen virhesignaalien E (k) muuntaminen taajuustasosta io aikatasoon kvantisoidun aikatason virhesignaalin e muodostamiseksi; ja aikatason kvantisoitujen virhesignaalien yhdistäminen suoraan ennustetun audiosignaalin x kanssa rekonstruoidun, kvantisoidun audiosignaalin 3c muodostamiseksi.
7. Laite audiosignaalin koodaamiseen, joka laite käsittää: sisäänmenon koodattavan audiosignaalin x vastaanottamiseksi; ensimmäiset generointivälineet (1) taajuusalikaistojen muodostamiseksi vastaanotetun audiosignaalin aikakehyksestä; : : mainittuun sisäänmenoon kytketyt prosessointivälineet (2,3;15-19) : ': 20 kvantisoidun audiosignaalin 3c muodostamiseksi vastaanotetun \ : audiosignaalin x perusteella; tunnettu siitä, että laite käsittää: *; : mainittuihin prosessointivälineisiin (3) liitetyt ennustusvälineet (12; 19) j · pitkän aikavälin ennustuskertoimien A joukon muodostamiseksi käytettäväksi v : kullekin aikakehyksen taajuusalikaistalle vastaanotetun audiosignaalin x 25 käsiteltävänä olevan aikakehyksen xm ennustamiseksi suoraan ainakin ;;; yhden kvantisoidun audiosignaalin 3c aikaisemman kehyksen perusteella; toiset generointivälineet (10-14;20,15) ennustetun audiosignaalin x *: ’ ‘: muodostamiseksi käyttäen pitkän aikavälin ennustuskertoimia A ja kvantisoitua audiosignaalia 3c ja vastaanotetun audiosignaalin x so vertaamiseksi ennustettuun audiosignaaliin x virhesignaalin E(k)muodostamiseksi kullekin lukuisista taajuusalikaistoista; „ 114248 kvantisointivälineet (3; 17) virhesignaalien £(ft)kvantisoimiseksi kvantisoitujen virhesignaalien E (k) joukon muodostamiseksi; ja yhdistämisvälineet (5;21) kvantisoitujen virhesignaalien E (k) yhdistämiseksi ennustuskertoimiin A koodatun audiosignaalin 5 muodostamiseksi.
8. Vaatimuksen 7 mukainen laite, tunnettu siitä, että mainitut toiset generoimisvälineet käsittävät ensimmäiset muuntamisvälineet (1) vastaanotetun audiosignaalin x muuntamiseksi aikatasosta taajuustasoon ja ίο toiset muuntamisvälineet (13) ennustetun audiosignaalin x muuntamiseksi aikatasosta taajuustasoon, sekä vertailuvälineet (14) jotka on järjestetty vertaamaan tulokseksi saatuja taajuustason signaaleja taajuustasossa.
9. Vaatimuksen 7 mukainen laite, tunnettu siitä, että toiset 15 generoimisvälineet on järjestetty vertaamaan vastaanotettua audiosignaalia x ennustettuun audiosignaaliin x aikatasossa.
10. Laite koodatun audiosignaalin x dekoodaamiseksi, tunnettu siitä, että: , ·. koodattu audiosignaali sisältää kvantisoidun virhesignaalin E (k) kutakin t : 20 lukuisaa audiosignaalin taajuusalikaistaa kohti ja sarjan ennustuskertoimia A ; *: käytettäväksi kullekin audiosignaalin aikakehyksen taajuusalikaistalle ja jossa *: *: ennustuskertoimia A voidaan käyttää ennustamaan vastaanotetun »» j ·· audiosignaalin käsiteltävä kehys xm ainakin yhden rekonstruoidun *’ kvantisoidun audiosignaalin x aikaisemman kehyksen perusteella, joka laite 25 käsittää: ·; ; sisäänmenon koodatun audiosignaalin vastaanottamiseksi; t · '*; · ‘ generoimisvälineet (24,25,9) rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi kvantisoitujen virhesignaalien E(k) perusteella; ja * t * • I · • • · 19 1 14248 signaalinkäsittelyvälineet (26) ennustetun audiosignaalin x muodostamiseksi ennustuskertoimien A ja mainitun rekonstruoidun kvantisoidun audiosignaalin x perusteella, jossa mainitut generoimisvälineet käsittävät yhdistämisvälineet (24,25) 5 ennustetun audiosignaalin x ja kvantisoitujen virhesignaalien E(k) yhdistämiseksi rekonstruoidun kvantisoidun audiosignaalin x muodostamiseksi. * I * f » * · • · : · • I · I · • · » t t · • IMU I * It* % t I I I • I I · t · · t · · » • · 2o 1 14248
Priority Applications (15)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI971108A FI114248B (fi) | 1997-03-14 | 1997-03-14 | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
PCT/FI1998/000146 WO1998042083A1 (en) | 1997-03-14 | 1998-02-18 | Audio coding method and apparatus |
AU62164/98A AU733156B2 (en) | 1997-03-14 | 1998-02-18 | Audio coding method and apparatus |
KR10-1999-7008369A KR100469002B1 (ko) | 1997-03-14 | 1998-02-18 | 오디오 코딩 방법 및 장치 |
ES98904191T ES2164414T3 (es) | 1997-03-14 | 1998-02-18 | Metodo y aparato para codificacion de audio. |
EP98904191A EP0966793B1 (en) | 1997-03-14 | 1998-02-18 | Audio coding method and apparatus |
US09/036,102 US6721700B1 (en) | 1997-03-14 | 1998-03-06 | Audio coding method and apparatus |
SE9800776A SE521129C2 (sv) | 1997-03-14 | 1998-03-10 | Sätt och anordning för audiokodning |
GB9805294A GB2323759B (en) | 1997-03-14 | 1998-03-12 | Audio coding method and apparatus |
DE19811039A DE19811039B4 (de) | 1997-03-14 | 1998-03-13 | Verfahren und Vorrichtungen zum Codieren und Decodieren von Audiosignalen |
FR9803135A FR2761801B1 (fr) | 1997-03-14 | 1998-03-13 | Methode de codage audio et dispositif |
JP06351498A JP3391686B2 (ja) | 1997-03-14 | 1998-03-13 | 符号化されたオーディオ信号を復号する方法及び装置 |
CNB981041809A CN1135721C (zh) | 1997-03-14 | 1998-03-13 | 音频信号编码方法及其有关设备 |
JP2002293702A JP2003140697A (ja) | 1997-03-14 | 2002-10-07 | オーディオ信号を符号化する方法及び装置 |
US10/704,068 US7194407B2 (en) | 1997-03-14 | 2003-11-07 | Audio coding method and apparatus |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FI971108 | 1997-03-14 | ||
FI971108A FI114248B (fi) | 1997-03-14 | 1997-03-14 | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
Publications (3)
Publication Number | Publication Date |
---|---|
FI971108A0 FI971108A0 (fi) | 1997-03-14 |
FI971108A FI971108A (fi) | 1998-09-15 |
FI114248B true FI114248B (fi) | 2004-09-15 |
Family
ID=8548401
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
FI971108A FI114248B (fi) | 1997-03-14 | 1997-03-14 | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen |
Country Status (13)
Country | Link |
---|---|
US (2) | US6721700B1 (fi) |
EP (1) | EP0966793B1 (fi) |
JP (2) | JP3391686B2 (fi) |
KR (1) | KR100469002B1 (fi) |
CN (1) | CN1135721C (fi) |
AU (1) | AU733156B2 (fi) |
DE (1) | DE19811039B4 (fi) |
ES (1) | ES2164414T3 (fi) |
FI (1) | FI114248B (fi) |
FR (1) | FR2761801B1 (fi) |
GB (1) | GB2323759B (fi) |
SE (1) | SE521129C2 (fi) |
WO (1) | WO1998042083A1 (fi) |
Families Citing this family (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB2380640A (en) * | 2001-08-21 | 2003-04-09 | Micron Technology Inc | Data compression method |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7016547B1 (en) | 2002-06-28 | 2006-03-21 | Microsoft Corporation | Adaptive entropy encoding/decoding for screen capture content |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
JP4676140B2 (ja) | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
EP2006840B1 (en) | 2002-09-04 | 2012-07-04 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
US7299190B2 (en) * | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
US7433824B2 (en) * | 2002-09-04 | 2008-10-07 | Microsoft Corporation | Entropy coding by adapting coding between level and run-length/level modes |
KR100524065B1 (ko) * | 2002-12-23 | 2005-10-26 | 삼성전자주식회사 | 시간-주파수 상관성을 이용한 개선된 오디오 부호화및/또는 복호화 방법과 그 장치 |
TWI220753B (en) * | 2003-01-20 | 2004-09-01 | Mediatek Inc | Method for determining quantization parameters |
US7724827B2 (en) | 2003-09-07 | 2010-05-25 | Microsoft Corporation | Multi-layer run level encoding and decoding |
US7688894B2 (en) | 2003-09-07 | 2010-03-30 | Microsoft Corporation | Scan patterns for interlaced video content |
US7782954B2 (en) | 2003-09-07 | 2010-08-24 | Microsoft Corporation | Scan patterns for progressive video content |
EP1668904A2 (en) * | 2003-09-29 | 2006-06-14 | Handheld Entertainment, Inc. | Method and apparatus for coding information |
TWI227866B (en) * | 2003-11-07 | 2005-02-11 | Mediatek Inc | Subband analysis/synthesis filtering method |
US7933767B2 (en) * | 2004-12-27 | 2011-04-26 | Nokia Corporation | Systems and methods for determining pitch lag for a current frame of information |
DE602006020686D1 (de) * | 2005-01-12 | 2011-04-28 | Nippon Telegraph & Telephone | Kodierverfahren und dekodierverfahren mit langzeitvorhersage, vorrichtungen, programm und aufzeichnungsmedium dafür |
US7684981B2 (en) | 2005-07-15 | 2010-03-23 | Microsoft Corporation | Prediction of spectral coefficients in waveform coding and decoding |
US7693709B2 (en) | 2005-07-15 | 2010-04-06 | Microsoft Corporation | Reordering coefficients for waveform coding or decoding |
US7599840B2 (en) * | 2005-07-15 | 2009-10-06 | Microsoft Corporation | Selectively using multiple entropy models in adaptive coding and decoding |
US7539612B2 (en) * | 2005-07-15 | 2009-05-26 | Microsoft Corporation | Coding and decoding scale factor information |
US7933337B2 (en) | 2005-08-12 | 2011-04-26 | Microsoft Corporation | Prediction of transform coefficients for image compression |
US8599925B2 (en) | 2005-08-12 | 2013-12-03 | Microsoft Corporation | Efficient coding and decoding of transform blocks |
US7565018B2 (en) * | 2005-08-12 | 2009-07-21 | Microsoft Corporation | Adaptive coding and decoding of wide-range coefficients |
GB2436192B (en) * | 2006-03-14 | 2008-03-05 | Motorola Inc | Speech communication unit integrated circuit and method therefor |
DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
RU2464650C2 (ru) * | 2006-12-13 | 2012-10-20 | Панасоник Корпорэйшн | Устройство и способ кодирования, устройство и способ декодирования |
US8184710B2 (en) | 2007-02-21 | 2012-05-22 | Microsoft Corporation | Adaptive truncation of transform coefficient data in a transform-based digital media codec |
WO2008114075A1 (en) * | 2007-03-16 | 2008-09-25 | Nokia Corporation | An encoder |
US7774205B2 (en) | 2007-06-15 | 2010-08-10 | Microsoft Corporation | Coding of sparse digital media spectral data |
CN101075436B (zh) * | 2007-06-26 | 2011-07-13 | 北京中星微电子有限公司 | 带补偿的音频编、解码方法及装置 |
US20090048827A1 (en) * | 2007-08-17 | 2009-02-19 | Manoj Kumar | Method and system for audio frame estimation |
ATE500588T1 (de) * | 2008-01-04 | 2011-03-15 | Dolby Sweden Ab | Audiokodierer und -dekodierer |
WO2009132662A1 (en) * | 2008-04-28 | 2009-11-05 | Nokia Corporation | Encoding/decoding for improved frequency response |
US8179974B2 (en) | 2008-05-02 | 2012-05-15 | Microsoft Corporation | Multi-level representation of reordered transform coefficients |
KR20090122143A (ko) * | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
US8406307B2 (en) | 2008-08-22 | 2013-03-26 | Microsoft Corporation | Entropy coding/decoding of hierarchically organized data |
EP3373297B1 (en) | 2008-09-18 | 2023-12-06 | Electronics and Telecommunications Research Institute | Decoding apparatus for transforming between modified discrete cosine transform-based coder and hetero coder |
CN102016530B (zh) * | 2009-02-13 | 2012-11-14 | 华为技术有限公司 | 一种基音周期检测方法和装置 |
DE102010006573B4 (de) * | 2010-02-02 | 2012-03-15 | Rohde & Schwarz Gmbh & Co. Kg | IQ-Datenkompression für Breitbandanwendungen |
CA3234476A1 (en) | 2013-01-08 | 2014-07-17 | Dolby International Ab | Model based prediction in a critically sampled filterbank |
CN110062945B (zh) * | 2016-12-02 | 2023-05-23 | 迪拉克研究公司 | 音频输入信号的处理 |
CN112564713B (zh) * | 2020-11-30 | 2023-09-19 | 福州大学 | 高效率低时延的动觉信号编解码器及编解码方法 |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5921039B2 (ja) | 1981-11-04 | 1984-05-17 | 日本電信電話株式会社 | 適応予測符号化方式 |
US4969192A (en) | 1987-04-06 | 1990-11-06 | Voicecraft, Inc. | Vector adaptive predictive coder for speech and audio |
GB8803390D0 (en) | 1988-02-13 | 1988-03-16 | Univ Belfast | Method and apparatus for electrical signal coding |
FR2628589B1 (fr) * | 1988-03-14 | 1994-03-04 | Etat Francais | Codeur differentiel a filtre predicteur auto-adaptatif et decodeur utilisable en liaison avec un tel codeur |
EP0364647B1 (en) * | 1988-10-19 | 1995-02-22 | International Business Machines Corporation | Improvement to vector quantizing coder |
IT1232084B (it) * | 1989-05-03 | 1992-01-23 | Cselt Centro Studi Lab Telecom | Sistema di codifica per segnali audio a banda allargata |
FR2646978B1 (fr) | 1989-05-11 | 1991-08-23 | France Etat | Procede et installation a codage de signaux sonores |
US5115240A (en) * | 1989-09-26 | 1992-05-19 | Sony Corporation | Method and apparatus for encoding voice signals divided into a plurality of frequency bands |
CA2010830C (en) | 1990-02-23 | 1996-06-25 | Jean-Pierre Adoul | Dynamic codebook for efficient speech coding based on algebraic codes |
US5754976A (en) * | 1990-02-23 | 1998-05-19 | Universite De Sherbrooke | Algebraic codebook with signal-selected pulse amplitude/position combinations for fast coding of speech |
JPH04119542A (ja) * | 1990-09-07 | 1992-04-21 | Nikon Corp | 光磁気記録媒体カートリッジ |
US5206884A (en) | 1990-10-25 | 1993-04-27 | Comsat | Transform domain quantization technique for adaptive predictive coding |
FI95085C (fi) | 1992-05-11 | 1995-12-11 | Nokia Mobile Phones Ltd | Menetelmä puhesignaalin digitaaliseksi koodaamiseksi sekä puhekooderi menetelmän suorittamiseksi |
FI91345C (fi) | 1992-06-24 | 1994-06-10 | Nokia Mobile Phones Ltd | Menetelmä kanavanvaihdon tehostamiseksi |
GB2282943B (en) * | 1993-03-26 | 1998-06-03 | Motorola Inc | Vector quantizer method and apparatus |
IT1270438B (it) * | 1993-06-10 | 1997-05-05 | Sip | Procedimento e dispositivo per la determinazione del periodo del tono fondamentale e la classificazione del segnale vocale in codificatori numerici della voce |
FI98163C (fi) * | 1994-02-08 | 1997-04-25 | Nokia Mobile Phones Ltd | Koodausjärjestelmä parametriseen puheenkoodaukseen |
DE69429620D1 (de) * | 1994-10-28 | 2002-02-14 | Rai Radiotelevisione Italiana | Teilbandkodierung mit auf Tonhöhen basierter Prädiktionskodierung in jedem einzelnen Teilband |
WO1996019876A1 (en) * | 1994-12-20 | 1996-06-27 | Dolby Laboratories Licensing Corporation | Method and apparatus for applying waveform prediction to subbands of a perceptual coding system |
US5706395A (en) * | 1995-04-19 | 1998-01-06 | Texas Instruments Incorporated | Adaptive weiner filtering using a dynamic suppression factor |
TW321810B (fi) * | 1995-10-26 | 1997-12-01 | Sony Co Ltd | |
JP3481027B2 (ja) * | 1995-12-18 | 2003-12-22 | 沖電気工業株式会社 | 音声符号化装置 |
US5778335A (en) * | 1996-02-26 | 1998-07-07 | The Regents Of The University Of California | Method and apparatus for efficient multiband celp wideband speech and music coding and decoding |
FI964975A (fi) * | 1996-12-12 | 1998-06-13 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen koodaamiseksi |
-
1997
- 1997-03-14 FI FI971108A patent/FI114248B/fi not_active IP Right Cessation
-
1998
- 1998-02-18 KR KR10-1999-7008369A patent/KR100469002B1/ko not_active IP Right Cessation
- 1998-02-18 ES ES98904191T patent/ES2164414T3/es not_active Expired - Lifetime
- 1998-02-18 AU AU62164/98A patent/AU733156B2/en not_active Expired
- 1998-02-18 WO PCT/FI1998/000146 patent/WO1998042083A1/en active IP Right Grant
- 1998-02-18 EP EP98904191A patent/EP0966793B1/en not_active Expired - Lifetime
- 1998-03-06 US US09/036,102 patent/US6721700B1/en not_active Expired - Lifetime
- 1998-03-10 SE SE9800776A patent/SE521129C2/sv not_active IP Right Cessation
- 1998-03-12 GB GB9805294A patent/GB2323759B/en not_active Expired - Lifetime
- 1998-03-13 CN CNB981041809A patent/CN1135721C/zh not_active Expired - Lifetime
- 1998-03-13 FR FR9803135A patent/FR2761801B1/fr not_active Expired - Lifetime
- 1998-03-13 DE DE19811039A patent/DE19811039B4/de not_active Expired - Lifetime
- 1998-03-13 JP JP06351498A patent/JP3391686B2/ja not_active Expired - Lifetime
-
2002
- 2002-10-07 JP JP2002293702A patent/JP2003140697A/ja active Pending
-
2003
- 2003-11-07 US US10/704,068 patent/US7194407B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
AU733156B2 (en) | 2001-05-10 |
SE9800776L (sv) | 1998-09-15 |
FR2761801A1 (fr) | 1998-10-09 |
JP3391686B2 (ja) | 2003-03-31 |
DE19811039A1 (de) | 1998-09-17 |
SE9800776D0 (sv) | 1998-03-10 |
GB2323759A (en) | 1998-09-30 |
US7194407B2 (en) | 2007-03-20 |
FR2761801B1 (fr) | 1999-12-31 |
ES2164414T3 (es) | 2002-02-16 |
EP0966793A1 (en) | 1999-12-29 |
KR100469002B1 (ko) | 2005-01-29 |
EP0966793B1 (en) | 2001-09-19 |
CN1195930A (zh) | 1998-10-14 |
JP2003140697A (ja) | 2003-05-16 |
GB2323759B (en) | 2002-01-16 |
KR20000076273A (ko) | 2000-12-26 |
SE521129C2 (sv) | 2003-09-30 |
FI971108A (fi) | 1998-09-15 |
CN1135721C (zh) | 2004-01-21 |
US6721700B1 (en) | 2004-04-13 |
JPH10282999A (ja) | 1998-10-23 |
DE19811039B4 (de) | 2005-07-21 |
GB9805294D0 (en) | 1998-05-06 |
AU6216498A (en) | 1998-10-12 |
WO1998042083A1 (en) | 1998-09-24 |
US20040093208A1 (en) | 2004-05-13 |
FI971108A0 (fi) | 1997-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
FI114248B (fi) | Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen | |
US6807526B2 (en) | Method of and apparatus for processing at least one coded binary audio flux organized into frames | |
US7209878B2 (en) | Noise feedback coding method and system for efficiently searching vector quantization codevectors used for coding a speech signal | |
US9009036B2 (en) | Methods and systems for bit allocation and partitioning in gain-shape vector quantization for audio coding | |
JP5215994B2 (ja) | 損失エンコ−ドされたデータ列および無損失拡張データ列を用いた、原信号の無損失エンコードのための方法および装置 | |
JP6779966B2 (ja) | 先進量子化器 | |
JPH11143499A (ja) | 切替え型予測量子化の改良された方法 | |
US8463615B2 (en) | Low-delay audio coder | |
MXPA05006664A (es) | Metodo y dispositivo para la cuantizacion robusta de vector predictivo de parametros de prediccion lineal en la codificacion de conversacion a velocidad variable de bits. | |
KR19990077753A (ko) | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 | |
JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
KR20070070189A (ko) | 음성 부호화 장치 및 음성 부호화 방법 | |
JP3406275B2 (ja) | ディジタル信号符号化方法、ディジタル信号復号化方法、これらの装置及びその各プログラム記録媒体 | |
JP3087814B2 (ja) | 音響信号変換符号化装置および復号化装置 | |
JPH0341500A (ja) | 低遅延低ビツトレート音声コーダ | |
JPH11184498A (ja) | 音声符号化/復号化方法 | |
KR100474833B1 (ko) | 예측 및 멜-스케일 이진 벡터를 이용한 가변 차원스펙트럼 진폭 양자화 방법 및 그 장치 | |
EP1293968B1 (en) | Efficient excitation quantization in a noise feeback coding system using correlation techniques | |
JP4721355B2 (ja) | 符号化データの符号化則変換方法および装置 | |
JPH09288498A (ja) | 音声符号化装置 | |
Chi et al. | Safety-net pyramid VQ of LSF parameters for wideband speech codecs | |
KR0135907B1 (ko) | 선스펙트럼쌍주파수의 벡터-스칼라 결합 양자화기(Vector and Scalar Quantizer of LSP Frequency) | |
EP1334486A2 (en) | System for vector quantization search for noise feedback based coding of speech | |
JPH02148926A (ja) | 予測符号化方式 | |
Bhaskar | Low rate coding of audio by a predictive transform coder for efficient satellite transmission |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FG | Patent granted |
Ref document number: 114248 Country of ref document: FI |
|
PC | Transfer of assignment of patent |
Owner name: NOKIA TECHNOLOGIES OY |
|
MA | Patent expired |