Wie am Schnürchen – Grundlagen Digital Audio, Teil 2
Die Vorgänge in digital Audio Wiedergabegeräten sind für die meisten Verbraucher das sprichwörtliche Buch mit sieben Siegeln. Dabei folgen die Abläufe in Komponenten wie Netzwerkspielern einer geradlinigen Logik. Gewappnet mit dem Wissen aus “Samples – Auf Null gerundet” sehen wir uns so ein Gerät genauer an.
Lassen Sie uns über Wege sprechen. Über Pfade. Gemeint sind selbstverständlich Signalpfade. Nein, nein – sollten Sie dabei spontan an Kabel oder Reihen von Lötstellen denken, vergessen Sie das schnell wieder. Ich rede von der Logik, mit der digitale HiFi-Geräte Signale annehmen, verarbeiten und (analog) wieder ausspucken. In “Samples – Auf Null gerundet” haben wir über Funktion und Eigenheiten von „Samples“ gesprochen. In dieser Ausgabe wechseln wir vom Makro- aufs Weitwinkelobjektiv und sehen uns das große Ganze an, den Signalfluss innerhalb eines „Digital Audio Players“ sowie die Rollen, die den Funktionsgruppen dabei zufallen.
Lassen Sie uns sachlich und nüchtern mit einem „Disclaimer“ beginnen: Wir hangeln uns dafür am Signalpfad eines Cambridge Audio CXN V2 entlang. Nicht, weil dieser (fraglos hervorragende) Player das Maß aller Dinge ist, sondern weil seine Hauptplatine herrlich plakativ gestaltet wurde. Abgesehen vom Netzteil befindet sich alles auf demselben Board, die Baugruppen sind klar voneinander getrennt und der Signalfluss ist nicht nur nachvollziehbar, sondern an vielen Stellen anhand der Leiterbahnen erkennbar. Viele Aspekte, die wir an diesem Player beschreiben, lassen sich problemfrei auf andere Streamer, Portables, D/A-Wandler und sogar CD-Spieler übertragen.
Den Anfang der Wiedergabekette machen die Signaleingänge. Bei einem CD-Spieler wäre das ein Laufwerk, das – von der Laufwerkssteuerung dirigiert und von einer eigenen Clock getaktet – S/PDIF-Datenströme auswirft. Streamer wie der CXN besitzen eine ganze Phalanx von Zugängen: LAN, WLAN, USB, Bluetooth sowie mehrere S/PDIF-Digitaleingänge. Manchmal kommen noch analoge Anschlüsse hinzu. Jeder dieser Eingangstypen formuliert eigene Bedingungen und Regeln. Am einfachsten ist natürlich das Handling von optischen und elektrischen S/PDIF-Anschlüssen (a). Deren Signale sind mundgerecht portioniert und können unverändert von der Eingangsverwaltung durchgereicht werden. Ähnlich sieht’s bei den Analogeingängen aus. Sind welche vorhanden, liegt direkt hinter dem Anschluss ein (in der Regel nicht beeinflussbarer) A/D-Wandler. Der Streamer selbst bekommt also auch hier nur S/PDIF-Daten zu Gesicht. Die Eingangswahl funktioniert bei einer digitalen HiFi-Komponente übrigens vollkommen anders als etwa bei einer analogen Vorstufe. Wählt man auf der Fernbedienung den Koax-Eingang, so verarbeitet die Eingangsverwaltung nur noch dessen Signale – alle anderen Anschlüsse werden einfach ignoriert. Features wie eine „hochwertige Umschaltung via Relais“ sind daher obsolet, und auch ein „Übersprechen“ zwischen den Anschlüssen ist ausgeschlossen.
Nächster in der „Kompliziertheitshierarchie“ ist der LAN-Anschluss (b). Wie Sie vermutlich wissen, ist LAN (Local Area Network) eine ziemlich vielseitige Schnittstelle. Daher liegt hinter der RJ45-Buchse ein kleiner Prozessor (c), der als Kommunikationsoffizier dient. Er meldet das Gerät im Heimnetzwerk an und filtert die Audioformate aus dem eingehenden Datensalat heraus. Allzu viel hat dieser kleine Rechenknecht jedoch nicht zu tun: Die zuständigen Protokolle sind einigermaßen streng (UPnP) beziehungsweise sehr streng (DLNA, AirPlay, Chromecast, Roon) normiert. Nachdem der Netzwerkspieler vom Router seine individuelle, unverwechselbare Kennung erhalten hat (eine bis zu zwölfstellige Ziffernfolge, auch „IP-Adresse“ genannt), kann er sich auf das Anfordern von Titeln und das Einsammeln der Audiostreams konzentrieren. Ähnlich läuft es bei eingesteckten USB-Sticks und -Festplatten, deren Datenorganisation – abgesehen von der fehlenden IP-Adressierung – sich nicht vom Zugriff auf ein NAS im Heimnetzwerk unterscheidet. Daher werden sie bisweilen sogar vom selben Prozessor verwaltet.
Ungleich kniffliger – wenngleich technisch sehr ähnlich – sieht die Angelegenheit bei WLAN aus. Grund dafür sind die Sicherheitsvorkehrungen, die getroffen werden müssen, um Ihre Daten im Heimnetzwerk und fremde Zugriffe draußen zu halten. Wegen der vertrackten Verifizierungs- und Anmeldeprotokolle wird WLAN deshalb praktisch immer über einen eigenen Mikroprozessor gesteuert. Auf der Abbildung des CXN V2 suchen Sie den übrigens vergeblich: Der WLAN-Empfänger des Briten steckt in einem separaten USB-Stick, den wir im Karton gelassen haben. WLAN ist zwar eine hinreichend schnelle Schnittstelle, durch die zunehmende Umgebungs-Funkbelastung und Phänomene wie Phasenauslöschungen ist sie jedoch einer ordentlichen LAN-Verkabelung meist hörbar unterlegen.
Sehr ähnlich funktioniert Bluetooth. Aufgrund ihrer proprietären Technik wird die BT-Schnittstelle über einen eigenen Chipsatz gesteuert, in der Regel von Qualcomm. Mit ihrer hohen Standardisierung und der Reduzierung auf wenige Tonformate und Datenbandbreiten arbeitet die Übertragung mittlerweile sehr zuverlässig, und sie klingt dank dem „Quasi-Hochbitformat“ aptX HD auch erstaunlich gut. Da der Chip an einen festen Standard gebunden ist, momentan V 5.0, veraltet die Schnittstelle in Geräten allerdings schnell – schon die nächste Smartphone-Generation kann Features bieten, die der eigene Streamer nicht mehr unterstützt. Auch hier hat Cambridge Audio mitgedacht: Der BT-Empfänger sitzt ebenfalls auf einem USB-Stick, ist daher nicht im Bild.
Den letzten Zugang können Sie dafür umso deutlicher erkennen: Er ist mit einem dicken „XMOS“ (d) beschriftet und regelt die USB-Zusammenarbeit mit verbundenen Computern. Der Chipsatz sorgt für die „class compliance“ des Streamers. Er teilt Rechnern mit, dass der CXN V2 ein Audio-Wiedergabegerät gemäß USB-2-Norm ist und Tonformate mit Datenraten bis 24/384 verarbeitet. Anschließend empfängt er den Signalstrom, extrahiert die Audiosignale und reicht sie weiter. Dedizierte Treiber sind nicht erforderlich. Es gibt freilich DACs und Streamer mit besonderen Features (EQs, Raumkorrektur, Mehrkanal etc.), bei denen das anders ist.
Das eigentliche Herz des CXN befindet sich auf einer kleinen Aufsteckplatine (e): Der Medienspieler nimmt die Signale aller Quellen entgegen und bringt sie in die Form, die für ihre Weiterverarbeitung erforderlich ist. Er wandelt Tonformate wie ALAC, MP3, FLAC oder WAV in lupenreines S/PDIF um. Mit dem Gemüt eines Finanzbeamten kümmert er sich zudem um die Lizenzen. Falls der Streamer Webdienste wie Tidal, Spotify oder Qobuz oder Übertragungsstandards wie Roons RAAT, AirPlay sowie Chromecast unterstützt, dann wird das von hier aus geregelt. Er meldet sich mit der Kennung und dem Passwort seines Eigentümers bei den Diensten an und teil diesen mit – so viel Ordnung muss sein –, dass auch der Hersteller des Streamers seine Rechnungen gezahlt hat und seine Lizenz gültig ist. Die dafür erforderliche Software muss ständig erweitert werden – schließlich lassen sich Apple, Google und Co. permanent neue Features einfallen. Im Medienspieler steckt daher meist auch das Update-fähige Betriebssystem des Netzwerkspielers. Dazu ist er wie ein kleiner Computer mit Festspeicher, Arbeitsspeicher und weiteren Finessen (bisweilen sogar einem Grafikprozessor) ausgestattet. Da all das auch eine gewisse Rechenlast bedingt, ist der Prozessor des Medienspielers im CXN mit einem Passivkühler ausgestattet.
Wo wir schon von Leistung sprechen, lassen Sie uns mit einem kleinen Missverständnis aufräumen: Oft wird behauptet, dass selbst älteste „PC-Gurken“ fähig sind, Audiosignale sauber abzuspielen. Das stimmt … allerdings nur bedingt: Permanente Update-Anfragen, das Bereithalten der Dienste im Hintergrund – das Auditorium könnte ja jederzeit von Qobuz auf Spotify Connect wechseln – sowie die Verwaltung der eigenen Komponenten (RAM, ROM, Pufferspeicher etc.) verlangen den kleinen Mikrocomputern einiges ab und erfordern erstaunlich viel Arbeitsspeicher. Die Audio-Signalverarbeitung selbst ist tatsächlich vergleichsweise stressfrei. Selbst hochgradig verschnürte Format-Container wie MP3 arbeiten mit einem festen Paket von Rechenformeln, die der Medienspieler kennt und routiniert herunterrasselt. Die Bandbreite der Signale bereitet ihm ebenfalls keine Sorgen. CD-Audio (44 100 kHz x 16 bit x 2 Kanäle) erfordert 1 411 200 Rechenschritte pro Sekunde. Das konnten Homecomputer wie ein Atari ST bereits in den Achtzigern. Hochbitsignale wie DSD512 oder 32/384 verlangen bisweilen Verarbeitungstakte über 20 MHz – auch das ist eine Fingerübung für heutige Mikrocomputer.
Nachdem seine Arbeit getan ist, reicht der Medienspieler die aus den Formaten herausgelösten S/PDIF-Daten an ein Duo weiter, dessen Aufgabenteilung nicht so klar abgegrenzt ist: Den Signalprozessor (f) und den oder die D/A-Wandler (g). Klare Domäne des DSP ist das Ausführen komplexer Signalumformungen. Sollte der Streamer einen Equalizer, eine Raumakustik-Anpassung oder (wie der CXN) eine digitale Pegelsteuerung besitzen, dann wird das hier berechnet. Kompetenzgerangel gibt es heute vor allem bei der Aufbereitung der Audiosignale für die eigentliche Wandlung: Die D/A-Wandler arbeiten intern mit einer festen Taktung, beispielsweise 24/192 (9,2 MHz). Eingehende CD-Audio-Signale (1,4 MHz) müssen entsprechend vorbereitet werden. Diesen Prozess nennt man „Upsampling“, und der DSP kann das zweifellos hervorragend. Neuere Wandler-Chips wie die von Asahi Kasei (meist als „AK“ oder „AKM“ bezeichnet) beherrschen das ebenfalls sehr gut. Die Entscheidung treffen die Streamer-Hersteller entweder nach Gehör oder nach Aufwand – ein Signalprozessor, der nicht hochskaliert, muss dafür auch nicht eigens programmiert werden. Statt des DSP findet man in manchen Geräten auch frei programmierbare FPGAs, die – in ganz seltenen Fällen – zugleich als Wandler dienen können. Bei Cambridge Audio ist die Welt noch in Ordnung: Der DSP, hier ein Modell von Analog Devices, erledigt seine Arbeit und beliefert die beiden Wolfson-DACs (WM8740) mit mundgerechten Datenhäppchen.
Upsampling funktioniert zwar ähnlich, sollte aber nicht mit Oversampling verwechselt werden. Während Ersteres eine zwingend erforderliche Datenaufbereitung darstellt, ist das Oversampling ein Mechanismus, der älteren Digitalkomponenten zu besserem Klang verhilft: Deren Signale werden um einen festen Faktor (2, 4, 8 etc.) hochskaliert. Dadurch kann der Arbeitspunkt des abschließenden Digitalfilters, das hörbare Relikte der Taktgeber ausfiltert, ebenfalls nach oben verschoben werden. Seine Auswirkungen auf den hörbaren Frequenzbereich werden dadurch gemindert oder beseitigt. Das Digitalfilter steckt übrigens fast immer im DAC-Chip.
Den letzten Teil der Signalkette bilden die analogen Ausgangsstufen (h). Die machen eigentlich nichts anderes, als die gerade gewandelten Signale auf Line-Pegel zu verstärken und sie (zumindest ist das die Regel) abschließend durch ein weiteres analoges Tiefpassfilter zu lotsen, das letzte digitale Artefakte tilgt. Hochkarätige Streamer wie der CXN V2 bieten symmetrische XLR- und asymmetrische Cinch-Abgriffe an. Ob die einstreuungsmindernde Symmetrie angesichts der kurzen Kabelwege in einer HiFi-Kette etwas bringt, lassen wir mal offen. Tatsache ist, dass sie einen verdoppelten Bauteilaufwand erfordert, den man im CXN auch erkennen kann – und der natürlich auch den Preis der Komponente hebt.
Mehr TechTalk? Hier geht’s lang …