(2002)
siehe auch:
Lichtton im Zweitakt

|
Mit der weltweiten Akzeptanz von SDI als Übertragungsstandard
für Video inklusive Ton wurde vieles leichter – und dafür
manches kompliziert. Für das Audio-Routing zum Beispiel gelten
hier völlig andere Anforderungen.
Die digitale Fernsehstudiotechnik verfügt über einen weltweiten
Standard zur Übertragung von Video, Ton und Zusatzdaten: Die Rede
ist von SDI. Es vereinfacht nicht nur die Verkabelung im Studio, sondern
dient auch als kompakter Übertragungsstandard z. B. bei der Versendung
eines Beitrags via Satellit zum Funkhaus. Damit ist der Übertragungsweg
von Ton und Bild identisch geworden, womit Leitungskosten gespart und
Laufzeitunterschiede zwischen der Ton- und der Bildübertragungsstrecke
vermieden werden können. Darüber hinaus stellt SDI eine ausreichende
Menge an Tonspuren, 16 an der Zahl, pro Videosignal zur Verfügung,
die von SDI-Videoroutern zusammen mit dem Videosignal geschaltet werden
können. Damit vereinfacht sich das Handling in großen Systemen
deutlich.
Die Vorteile des SDI sind weitreichend, aber es bringt als
evolutionär gewachsenes Format aus der Anfangszeit des digitalen
Videos auch einige Schwierigkeiten mit sich. Diese machen sich deutlich
bemerkbar, wenn es um Audio-Signalrouting z. B. bei der Tonnachbearbeitung
geht.
Embedded Audio
SDI ist ein digitales Format, bei dem im
Grunde das analoge Zeilensignal digitalisiert
wird. In den Austastlücken dieses
Signals können noch Zusatzdaten verschickt
werden.
Das Signal besteht grundsätzlich aus
drei verschiedenen Bereichen: dem Zeilensignal
mit dem eigentlichen Bildinhalt,
dem Horizontal Ancillary Data HANC am
Ende jeder Zeile (Zeilenrücklauf) sowie
dem Vertical Ancillary Data VANC zwischen
zwei Halbbildern (Bildrücklauf).
Während man den VANC z. B. für
Timecode nutzt, wird der digitale Ton
ausschließlich im HANC übertragen. Die
Toninformation muss dafür in Datenpakete
aufgeteilt werden, die in die
Zeilensignale integriert, eingebettet
oder neudeutsch „embedded“ werden.
Für die Tondatenpakete steht eine
Bruttobandbreite von ca. 42,2 Mbit/s
(NTSC, 525 Zeilen) bzw. ca. 43,8 Mbit/s
(PAL, 625 Zeilen) zur Verfügung. Zum
Vergleich: Eine zweikanalige AES/EBUSchnittstelle
überträgt 3,072 Mbit/sec.
Paketversand...
Im HANC sind drei verschiedene Formen
von Datenpaketen vorgesehen, nämlich
Pakete für Audio, für erweiterte Daten
und für Steuerdaten. Ihre Unterscheidung
innerhalb des Datenstroms erfolgt durch
verschiedene Kennungen im Paketkopf.
Das Grundgerüst dieser Pakettypen ist ähnlich und verfügt über
eine Besonderheit:
Die Länge der Pakete ist variabel
und abhängig vom jeweiligen Inhalt.
Die Audiodaten werden in Pakete zu je
vier Kanälen bzw. zwei Stereopaaren
geschnürt und zusammen mit Zusatzinformationen
(C, U, V aus dem AES/
EBU-Signal) im Audiodatenpaket übertragen.
Dies stellt die einfachste Form
des Audio-Embeddings dar.
Allerdings reicht die Kapazität des Audiodatenpaketes
nur für Signale mit maximal
20 Bit Wortbreite aus. Will man 24 Bit
breite Audiodaten übertragen, so werden
zusätzlich die erweiterten Datenpakete
verwendet. Sie transportieren die
verbleibenden vier Bit des Audiosignals.
In den Steuerpaketen schließlich können
–
bei einer Standardübertragung
optional – zusätzliche Informationen wie
die Abtastrate oder ein Delay mitgeteilt
werden.
Diese drei Paketarten bilden im Übertragungsschema
eine Gruppe und maximal
vier solche Gruppen können in ein
SDI-Signal eingebettet werden. Damit
sind bei einer Abtastrate von 48 kHz bis
zu 16 Audiokanäle in einem SDI-Signal
übertragbar.
... mit Zeitversatz
Die Digitalisierung von Video und Audio
erfolgt mit verschiedenen Abtastraten,
die kein einfaches Teilerverhältnis bilden.
Die Relation zwischen beiden
Signalen bei einer Abtastrate von 48
kHz macht folgende Tabelle deutlich:
| |
Audiosamples je Zeile |
Audiosamples je Bild |
| 525 Zeilen/29,97 Hz |
3,05066 |
1.601,6 |
| 625 Zeilen/25 Hz |
3,072 |
1.920 |
|
Man hat also in jeder Videozeile Platz für
etwas mehr als drei Audio-Samples pro
Tonkanal. Das ist unschön, besser wäre
eine feste, ganzzahlige Zuordnung von
Audio-Samples zu jeder Videozeile. Als
Ausweg aus der Misere nutzt man die
Tatsache aus, dass die Audiopakete eine
variable Länge haben dürfen. Man erzeugt
also Audiopakete mit drei Samples
und solche mit vier Samples. Will man
nun die maximal mögliche Kanalanzahl
unterbringen, so muss man vier solcher
Pakete am Ende jeder Zeile einfügen; und
zwar so kombiniert, dass die gesamte zur
Verfügung stehende Datenrate pro Zeile ausgenutzt wird. Dieses Verteilungsschema
wiederholt sich bei einem 625-
Zeilen-System jedes Bild, bei 525-Zeilen-
Systemen nur alle 5 Bilder.
Um aus diesen in Pakete verteilten Daten
wieder ein kontinuierliches Audiosignal
rekonstruieren zu können, verwendet
man im Empfänger einen Pufferspeicher.
Ein solcher Puffer verzögert das Tonsignal.
Ü
blich Werte bei SDI liegen zwischen
40 bis max. 64 Samples, bei intelligenter
Verteilung der Pakete auf die
Videozeilen kann die Verzögerung auch
niedriger gehalten werden.
Die Aufteilung der Pakete ist von der
Norm nicht vorgeschrieben. So bleibt es
dem Entwickler eines SDI-Embedders
ü
berlassen, die optimale Lösung zu finden.
Hier liegt ein Kompatibilitätsproblem
bei der Kombination von
Equipment verschiedener Hersteller!
Drei gegen vier
Doch auch wenn die Einbettung auf
Senderseite und die Entpackung auf Empfängerseite
kompatibel zueinander stattfindet
–
die entstandene Zeitverzögerung
des Tonsignals muss auf jeden Fall
berücksichtigt werden. Dies gilt umso
mehr, wenn der Ton aus dem SDI-Signal
ausgekoppelt, anderweitig bearbeitet und
anschließend wieder in das SDI-Signal
eingebettet wird. Oder für Surround-
Sound mit fünf oder mehr Tonkanälen: Da
jede Gruppe nur vier Tonkanäle beinhaltet,
sind für Surround-Sound zwei
Gruppen notwendig, die auf keinen Fall
zeitliche Differenzen aufweisen dürfen.
Ein weiteres und schwieriger zu beherrschendes
Problem wird durch die
unterschiedlichen Längen der Pakete,
die jeweils drei bzw. vier Audio-Samples
enthalten, hervorgerufen. Wie auch
immer man die Pakete anordnet, es werden
Probleme entstehen, sobald man
eine Tonspur auskoppeln oder hinzufügen
will. Wird z. B. ein Block entfernt, so
entstehen Lücken im Datenstrom und
es wird Bandbreite verschwendet.
Dramatischer sieht es aus, wenn man
Pakete überschreibt. Stellen Sie sich
den Fall vor, bei dem ein Paket mit drei
Samples von einem Paket mit vier
Samples überschrieben wird – dabei
werden Daten verloren gehen.
Gute Organisation
Viele Geräte wie z. B. De-Embedder, die
die Tonspuren wieder aus dem SDISignal
herauskoppeln, verarbeiten deshalb
nur eine einzige Gruppe. Die drei
ü
brigen in der Norm vorgesehenen
Gruppen werden dabei schlicht nicht
genutzt! Das heißt im Klartext, dass statt
16 Tonspuren lediglich vier verwendet/
ausgekoppelt werden können. Schon für
ein einziges lineares 5.1-Surround-Signal
reicht dies nicht mehr aus, geschweige
denn für aufwändige Produktionen mit
mehrsprachigem Ton. Die möglichen
Kompatibilitätsprobleme sind vielfältig.
Was passiert etwa, wenn man mit einem
solch beschränkten Embedder arbeitet
und eine Audiogruppe in ein SDI-Signal
einfügt, in dem schon zwei Gruppen mit
Audiodaten vorhanden sind?
Ein intelligent angelegtes System, das
natürlich alle vier Gruppen verarbeiten
können muss, wird vor dem Hinzufügen
von Audiopaketen den eintreffenden
Datenstrom auf bereits vorhandene
Audiodaten überprüfen und entsprechend
reagieren. Geräte, die die maximale
Kanalzahl ausnutzen wollen, werden
darüber hinaus die Audiopakete bei
Bedarf umplatzieren und somit die
Gesamtstruktur reorganisieren. Das gilt
insbesondere, wenn Audiodaten innerhalb
des SDI-Datenstroms oder auch
zwischen SDI-Signalen geroutet werden
sollen.
Einfacher Ausweg
Sobald man kreativ mit SDI arbeitet,
entsteht der Wunsch nach solch flexiblem,
normgerechten Audio-Routing. Ein
Beispiel von der Winterolympiade in Salt
Lake City: Das Schweizer Fernsehen
SRG SSR steht wie häufig vor dem
Problem der Vielsprachigkeit der
Schweiz. Zumindest ein deutscher, ein
französischer und ein italienischer
Kommentar sowie ein IT-Ton sind bei
jedem Videosignal notwendig. Zu Hause
in der Schweiz sollen die Töne aber
unterschiedlich weiterverarbeitet werden,
schließlich will jeder Sender nur in
seiner Muttersprache senden. Schnell
entsteht der Bedarf nach vielen externen
De-Embeddern und Embeddern, die
das Tonsignal aus- und wieder einkoppeln.
Diese müssen alle kompatibel
zueinander sein. Am Beispiel des SRG
SSR, der seine Ü-Wagen-Flotte sowie
zahlreiche seiner Studios auf CANTUS
und NEXUS aufgebaut hat, kann man für
die Zukunft eine andere, nahe liegende
Lösung erkennen: die SDI-Karte für den
Audio-Routing-Spezialisten NEXUS!*
* An einer Umsetzung einer NEXUS-SDI-Karte zum
Auskoppeln und Einbetten von je 16 Tonspuren
pro SDI-Signal wird derzeit gearbeitet. |