Sitemap downloads home Kontakt E-mail
Stage Tec Entwicklungsgesellschaft für professionelle Audiotechnik Berlin Home
sitemap
Impressum
 
News
Entwicklung
Referenzen
Know-How
Messen
Vertrieb
Kontakt
Links
Downloads

Ton im SDI: Getrennt und wieder vereint

zurück zur Übersicht

(2002)

 

siehe auch:
 
Lichtton im Zweitakt

 

 


Mit der weltweiten Akzeptanz von SDI als Übertragungsstandard für Video inklusive Ton wurde vieles leichter – und dafür manches kompliziert. Für das Audio-Routing zum Beispiel gelten hier völlig andere Anforderungen.

Die digitale Fernsehstudiotechnik verfügt über einen weltweiten Standard zur Übertragung von Video, Ton und Zusatzdaten: Die Rede ist von SDI. Es vereinfacht nicht nur die Verkabelung im Studio, sondern dient auch als kompakter Übertragungsstandard z. B. bei der Versendung eines Beitrags via Satellit zum Funkhaus. Damit ist der Übertragungsweg von Ton und Bild identisch geworden, womit Leitungskosten gespart und Laufzeitunterschiede zwischen der Ton- und der Bildübertragungsstrecke vermieden werden können. Darüber hinaus stellt SDI eine ausreichende Menge an Tonspuren, 16 an der Zahl, pro Videosignal zur Verfügung, die von SDI-Videoroutern zusammen mit dem Videosignal geschaltet werden können. Damit vereinfacht sich das Handling in großen Systemen deutlich.
Die Vorteile des SDI sind weitreichend, aber es bringt als evolutionär gewachsenes Format aus der Anfangszeit des digitalen Videos auch einige Schwierigkeiten mit sich. Diese machen sich deutlich bemerkbar, wenn es um Audio-Signalrouting z. B. bei der Tonnachbearbeitung geht.

Embedded Audio

SDI ist ein digitales Format, bei dem im Grunde das analoge Zeilensignal digitalisiert wird. In den Austastlücken dieses Signals können noch Zusatzdaten verschickt werden. Das Signal besteht grundsätzlich aus drei verschiedenen Bereichen: dem Zeilensignal mit dem eigentlichen Bildinhalt, dem Horizontal Ancillary Data HANC am Ende jeder Zeile (Zeilenrücklauf) sowie dem Vertical Ancillary Data VANC zwischen zwei Halbbildern (Bildrücklauf). Während man den VANC z. B. für Timecode nutzt, wird der digitale Ton ausschließlich im HANC übertragen. Die Toninformation muss dafür in Datenpakete aufgeteilt werden, die in die Zeilensignale integriert, eingebettet oder neudeutsch „embedded“ werden. Für die Tondatenpakete steht eine Bruttobandbreite von ca. 42,2 Mbit/s (NTSC, 525 Zeilen) bzw. ca. 43,8 Mbit/s (PAL, 625 Zeilen) zur Verfügung. Zum Vergleich: Eine zweikanalige AES/EBUSchnittstelle überträgt 3,072 Mbit/sec.

Paketversand...

Im HANC sind drei verschiedene Formen von Datenpaketen vorgesehen, nämlich Pakete für Audio, für erweiterte Daten und für Steuerdaten. Ihre Unterscheidung innerhalb des Datenstroms erfolgt durch verschiedene Kennungen im Paketkopf. Das Grundgerüst dieser Pakettypen ist ähnlich und verfügt über eine Besonderheit: Die Länge der Pakete ist variabel und abhängig vom jeweiligen Inhalt. Die Audiodaten werden in Pakete zu je vier Kanälen bzw. zwei Stereopaaren geschnürt und zusammen mit Zusatzinformationen (C, U, V aus dem AES/ EBU-Signal) im Audiodatenpaket übertragen. Dies stellt die einfachste Form des Audio-Embeddings dar. Allerdings reicht die Kapazität des Audiodatenpaketes nur für Signale mit maximal 20 Bit Wortbreite aus. Will man 24 Bit breite Audiodaten übertragen, so werden zusätzlich die erweiterten Datenpakete verwendet. Sie transportieren die verbleibenden vier Bit des Audiosignals. In den Steuerpaketen schließlich können – bei einer Standardübertragung optional – zusätzliche Informationen wie die Abtastrate oder ein Delay mitgeteilt werden. Diese drei Paketarten bilden im Übertragungsschema eine Gruppe und maximal vier solche Gruppen können in ein SDI-Signal eingebettet werden. Damit sind bei einer Abtastrate von 48 kHz bis zu 16 Audiokanäle in einem SDI-Signal übertragbar.

... mit Zeitversatz

Die Digitalisierung von Video und Audio erfolgt mit verschiedenen Abtastraten, die kein einfaches Teilerverhältnis bilden. Die Relation zwischen beiden Signalen bei einer Abtastrate von 48 kHz macht folgende Tabelle deutlich:

  Audiosamples je Zeile Audiosamples je Bild
525 Zeilen/29,97 Hz 3,05066 1.601,6
625 Zeilen/25 Hz 3,072 1.920

 

Man hat also in jeder Videozeile Platz für etwas mehr als drei Audio-Samples pro Tonkanal. Das ist unschön, besser wäre eine feste, ganzzahlige Zuordnung von Audio-Samples zu jeder Videozeile. Als Ausweg aus der Misere nutzt man die Tatsache aus, dass die Audiopakete eine variable Länge haben dürfen. Man erzeugt also Audiopakete mit drei Samples und solche mit vier Samples. Will man nun die maximal mögliche Kanalanzahl unterbringen, so muss man vier solcher Pakete am Ende jeder Zeile einfügen; und zwar so kombiniert, dass die gesamte zur Verfügung stehende Datenrate pro Zeile ausgenutzt wird. Dieses Verteilungsschema wiederholt sich bei einem 625- Zeilen-System jedes Bild, bei 525-Zeilen- Systemen nur alle 5 Bilder. Um aus diesen in Pakete verteilten Daten wieder ein kontinuierliches Audiosignal rekonstruieren zu können, verwendet man im Empfänger einen Pufferspeicher. Ein solcher Puffer verzögert das Tonsignal. Ü blich Werte bei SDI liegen zwischen 40 bis max. 64 Samples, bei intelligenter Verteilung der Pakete auf die Videozeilen kann die Verzögerung auch niedriger gehalten werden. Die Aufteilung der Pakete ist von der Norm nicht vorgeschrieben. So bleibt es dem Entwickler eines SDI-Embedders ü berlassen, die optimale Lösung zu finden. Hier liegt ein Kompatibilitätsproblem bei der Kombination von Equipment verschiedener Hersteller!

Drei gegen vier

Doch auch wenn die Einbettung auf Senderseite und die Entpackung auf Empfängerseite kompatibel zueinander stattfindet – die entstandene Zeitverzögerung des Tonsignals muss auf jeden Fall berücksichtigt werden. Dies gilt umso mehr, wenn der Ton aus dem SDI-Signal ausgekoppelt, anderweitig bearbeitet und anschließend wieder in das SDI-Signal eingebettet wird. Oder für Surround- Sound mit fünf oder mehr Tonkanälen: Da jede Gruppe nur vier Tonkanäle beinhaltet, sind für Surround-Sound zwei Gruppen notwendig, die auf keinen Fall zeitliche Differenzen aufweisen dürfen. Ein weiteres und schwieriger zu beherrschendes Problem wird durch die unterschiedlichen Längen der Pakete, die jeweils drei bzw. vier Audio-Samples enthalten, hervorgerufen. Wie auch immer man die Pakete anordnet, es werden Probleme entstehen, sobald man eine Tonspur auskoppeln oder hinzufügen will. Wird z. B. ein Block entfernt, so entstehen Lücken im Datenstrom und es wird Bandbreite verschwendet. Dramatischer sieht es aus, wenn man Pakete überschreibt. Stellen Sie sich den Fall vor, bei dem ein Paket mit drei Samples von einem Paket mit vier Samples überschrieben wird – dabei werden Daten verloren gehen.

Gute Organisation

Viele Geräte wie z. B. De-Embedder, die die Tonspuren wieder aus dem SDISignal herauskoppeln, verarbeiten deshalb nur eine einzige Gruppe. Die drei ü brigen in der Norm vorgesehenen Gruppen werden dabei schlicht nicht genutzt! Das heißt im Klartext, dass statt 16 Tonspuren lediglich vier verwendet/ ausgekoppelt werden können. Schon für ein einziges lineares 5.1-Surround-Signal reicht dies nicht mehr aus, geschweige denn für aufwändige Produktionen mit mehrsprachigem Ton. Die möglichen Kompatibilitätsprobleme sind vielfältig. Was passiert etwa, wenn man mit einem solch beschränkten Embedder arbeitet und eine Audiogruppe in ein SDI-Signal einfügt, in dem schon zwei Gruppen mit Audiodaten vorhanden sind? Ein intelligent angelegtes System, das natürlich alle vier Gruppen verarbeiten können muss, wird vor dem Hinzufügen von Audiopaketen den eintreffenden Datenstrom auf bereits vorhandene Audiodaten überprüfen und entsprechend reagieren. Geräte, die die maximale Kanalzahl ausnutzen wollen, werden darüber hinaus die Audiopakete bei Bedarf umplatzieren und somit die Gesamtstruktur reorganisieren. Das gilt insbesondere, wenn Audiodaten innerhalb des SDI-Datenstroms oder auch zwischen SDI-Signalen geroutet werden sollen.

Einfacher Ausweg

Sobald man kreativ mit SDI arbeitet, entsteht der Wunsch nach solch flexiblem, normgerechten Audio-Routing. Ein Beispiel von der Winterolympiade in Salt Lake City: Das Schweizer Fernsehen SRG SSR steht wie häufig vor dem Problem der Vielsprachigkeit der Schweiz. Zumindest ein deutscher, ein französischer und ein italienischer Kommentar sowie ein IT-Ton sind bei jedem Videosignal notwendig. Zu Hause in der Schweiz sollen die Töne aber unterschiedlich weiterverarbeitet werden, schließlich will jeder Sender nur in seiner Muttersprache senden. Schnell entsteht der Bedarf nach vielen externen De-Embeddern und Embeddern, die das Tonsignal aus- und wieder einkoppeln. Diese müssen alle kompatibel zueinander sein. Am Beispiel des SRG SSR, der seine Ü-Wagen-Flotte sowie zahlreiche seiner Studios auf CANTUS und NEXUS aufgebaut hat, kann man für die Zukunft eine andere, nahe liegende Lösung erkennen: die SDI-Karte für den Audio-Routing-Spezialisten NEXUS!*

* An einer Umsetzung einer NEXUS-SDI-Karte zum Auskoppeln und Einbetten von je 16 Tonspuren pro SDI-Signal wird derzeit gearbeitet.

  zurück zur Übersicht II nächste Know-how Referenz II   nach oben

Stage Tec Entwicklungsgesellschaft für professionelle Audiotechnik mbH, D-12459 Berlin, Tabbertstr. 10
Phone: +49 30 639902-0, Fax: +49 30 639902-32, , © 2002-2008 Stage Tec Berlin

Home / Datenschutzerklärung / Impressum / Sitemap