Kapitola 1. - Základní princip digitálního přenosu řeči

Napsal OK1MX

Kapitola 1. - základní princip digitálního přenosu řeči

V této kapitole si vysvětlíme několik pojmů, které se budou táhnout jako červená nit celým povídáním.

Kodek

Každý digitální systém určený pro přenos řeči musí nějak dostat analogový signál do digitální formy (nuly a jedničky) Aby toto bylo možné, je nutné zařídit mnoho věcí.

První na řadě je A/D převod, který změní analogový signál z mikrofonu na proud jedniček a nul, čímž připraví analogový signál k přenosu. Dále následuje komprese a zabezpečení takto získaného digitálního proudu, aby jej bylo možno přenést kanálem s velmi omezenou rychlostí přenosu. To obstarává tzv. VOCODER (voice coder/decoder). Ten je nejčastěji ve formě čipu, je obvykle licencovaný a uzavřený, výrobce zdrojový kód neuveřejňuje, licence je placená v ceně tohoto brouka. Proto je problematické tento datový tok dekódovat v PC, nebo si takovýto kodér/dekodér nacpat do jednočipu. Jako každý SW ho lze hackout, otázkou je, jestli někomu stojí za to tomu věnovat patřičné úsilí. Aktuálně se to již částečně povedlo a existuje možnost DMR dekódovat, D-star zatím jen pod Linux platformou. DMR používá kodek AMBE2+, D-star AMBE 2020, obojí od firmy DVSI.

Přenosová rychlost

Už máme k dispozici jedničky a nuly, ale musíme je dostat bez drátů z místa A na místo B. Jenže máme před sebou jeden problém, resp. fyzikální omezení, a tím je Shannonova rovnice. Jedná se o to, že maximální přenosová rychlost je závislá nejen na šířce přenosového pásma (pro nás je to 12.5kHz resp. 6.25 kHz), ale také na odstupu užitečného signálu od šumu. Definoval ji v roce 1948 vztahem:

max. přenosová rychlost =  šířka pásma * log(1 + odstup signál/šum)

Prakticky to znamená, že buď můžeme přenášet na stejně širokém kanále velký datový tok, ale musíme mít luxusně čistý signál (bude to fungovat, třeba jen bude-li lepší než 59+10dB), nebo to bude fungovat signálů u 52, jenže pak můžeme přenášet mnohem menší datový tok. Jakmile je kanál tak nekvalitní, že je jeho přenosová rychlost menší, než ta, kterou vyžaduje aktuálně použitý kodek, spojení se trhá a přestává být použitelné. (Reálná situace je ještě komplikovanější, protože se data bufferují a pomocí složitých algoritmů, interleavingu a konvolunčního kódování dokážou určitou ztrátovost dopočítat.)

Z tohoto pohledu je spektrální účinnost D-STAR i DMR velmi podobná. DMR má 12,5 kHz šířku pásma a dva timesloty umožňující dva současné hovory. D-STAR vystačí s 6,25 kHz, tudíž se do 12,5 kHz vejdou také dva současně vedené hovory.

Modulace

Máme už vytvořený tok jedniček a nul a musíme ho nějak dostat do vzduchu. Existuje mnoho možností (BPSK, QPSK - 4PSK, QAM - QAM64, OFDM, FSK, GMSK, AFSK) Vysvětlit podrobně v čem se liší, jaké mají výhody a nevýhody, je na několik řádek nemožné. Rozdíly jsou nejen v kmitočtové efektivitě přenosu, ale i ve složitosti a ceně HW, poměru příkon / přenesený bit atd. Současné komunikační technologie využívají Adaptive Multi Rate, kde se podle kvality radiového kanálu (odstup signál/šum) mění i modulační schema, čímž se docílí toho, že při dostatečném odstupu signálu od šumu lze docílit výrazného zvýšení přenosové rychlosti díky využití té nejefektivnější modulace pro aktuální situaci. Z tohoto pohledu jsou modulace použité u současných systémů, jako např. D-STAR, tak DMR i C4FM, z doby koňů.

Metody vícenásobného přístupu

Jde o zaklínadlo, které je často slyšet, ale z toho, jak o tom čtu či poslouchám na pásmech, mám dojem, že mnohým není zřejmé, čím se od sebe liší. Pokusím se to srozumitelně vysvětlit. Začnu od nejjednoduššího. Představte si, že potřebujete v jeden okamžik zajistit komunikaci více uživatelů. Jak na to?

FDMA (Frequency Division Multiple Access)

Zkuste si představit dvoučlennou hudební skupinu, ve složení housle a kontrabas. Byť ve stejný čas hraje každý svůj part, je možné jak uchem, tak technicky pomocí filtru oddělit jeden nástroj od druhého bez toho, aby se ztratila jediná nota. Jednotlivé datové toky jsou rozděleny frekvenčně. Prakticky se to používalo třeba u NMT telefonů, kde každý hovor měl přidělen svůj radiový kanál. Stejné je to třeba na analogových převaděčích, kde jsou dva na stejné lokalitě; v případě, je-li jeden obsazen, můžeme pracovat přes druhý.

TDMA (Time Division Multiple Access)

Abychom nemuseli v případě PROFI sítí platit za dvě frekvence, uděláme to jinak. Musíme se dohodnou na pravidle, že si jeden kanál bude půjčovat více stanic. Jirka s Frantou bude mít třeba každou sudou minutu, Franta s Pepou každou lichou. Tím zajistíme, že přes jeden kanál mohou téci dva hovory současně. Takto funguje třeba GSM hovor, jehož "prdění" je slyšet v repráčkách od PC. To co slyšíte je jeden timeslot, který je dlouhý jednu osminu (0,576875 ms) z celého časového úseku (4,615 ms). V ostatních 7/8 telefon nic nevysílá, protože BTS v té době poslouchá jiné telefony To platí v případě neaktivního DTX (Discontinuous transmission), což je princip, díky němuž se šetří baterie telefonu - v době, kdy nemluvíte, telefon vysílá jen občas informaci o tom že je ticho a má se protistraně uměle generovat určité šumové pozadí - vyzkoušíte si to jednoduše. Někomu zavolejte, přibližte telefon třeba k repráčkům od PC a v tiché místnosti přestaňte hovořit. Po chvíli uslyšíte : tr-----tr-----tr-----tr----, pak foukněte do mikrofonu a uslyšíte trtrtrtrttr. Poměr zapnutého vysílače k tichu v druhém případě je 1:8 - jeden timeslot Váš, 7 timeslotů pauza). Amplitudová složka GSM s ostrými hranami TX ON/TX OFF je velmi agresivní a proto na ni mnohá elektronika zareaguje.

Pozn.: když se mluví o efektivitě TDMA a FDMA, je potřeba mít na paměti také použitou šířku kanálu. TDMA, které dokáže pracovat s danou přenosovou rychlostí na kanále 6,25 kHz, má stejnou přenosovou efektivitu, jako dvouslotové TDMA, které pracuje na 12,5 kHz kanále, protože se do něj vejdou dva FDMA.

Pro úplnost doplním třetího do party, byť se nás to bohužel zatím netýká.

CDMA (Code Division Multipe Acces)

Dlouho jsem přemýšlel, jak to jednoduše vysvětlit. Představte si, že jedete v cizí zemi autobusem a neovládáte místní jazyk. Současně žvaní v blízkém dosahu 20 lidí, ale jen jeden česky. Dokážete bez problémů přepnout, mozkem odfiltrovat změť Vám nic neříkajících slov a vnímáte jen češtinu a to za situace, kdy všichni produkuji akustické signály ve stejném kmitočtovém spektru. CDMA systémy pracují na tomto principu a pomocí složité matematiky dokážou velmi účinně dekódovat jen žádaný signál ve změti ostatních. Proto např. sítě 3 generace vystačí s jedním kmitočtem na pokrytí celého území a jednotlivé buňky se navzájem neruší. Na rozdíl od FDMA a TDMA je ale nutným předpokladem dokonalá funkce rychlé výkonové regulace. Jistě znáte situaci v hospodě, je tam určitá úroveň hluku. Stačí aby jeden diskutující (pracovně si ho nazvěme Pepin) zvýšil hlas a následuje řetězová reakce, protože vedle sedící ho musí zvýšit také... až pak celá hospoda hučí jak piliňáky před výbuchem. Když vystřelíte z poplašňáku, všichni ztichnou a pak začnou opět povídat... ale úroveň hluku je výrazně menší a přesto si všichni rozumí stejně jako předtím, až za mnoho minut díky Pepinovi se opět vrátí na tu původní hladinu. Je tedy velmi nutné, aby každý terminál vysílal jen tím nejmenším výkonem, který je nezbytně nutný.

Tak fajn, máme analogový signál z mikrofonu, prohnali jsme ho kodekem, který nám z něj vytvořil datový tok jedniček a nul, přidáme k němu v případě D-Staru další datový tok (1200bd) uživatelských dat, která mohou obsahovat cokoli, co pošleme do sériového portu TRX, nebo tam třeba můžou být informace o poloze, a šup s tím do toho správného modulátoru. To je v případě DMR 4FSK, v případě D-STAR GMSK. Pak už nám nezbývá nic jiného, než ho za pomoci mixéru dostat na správný kmitočet a zesílit koncovým stupněm a poslat do antény.