Marketing Versprechen, Wahrnehmung und Realität
Blog übernommen von bwgroup.ch (Schweizer Vertieb von Bowers&Wilkins)
ERSTELLT VON: FRITZ FABIG
Ein halbes Jahr vor Markteinführung der CD in Europa brachte Sony mit dem PCM-F1 ein digitales Aufnahmegerät für den Semi-Professionellen-Anwender auf den Markt. Die Vorschusslorbeeren und Erwartungen an die moderne Digitaltechnologie waren hoch, nicht zuletzt angespornt durch die Marketing Aussagen der Hersteller. Im englischen Faltprospekt zum PCM-F1 wurde die neue Digital-Epoche bedeutungsvoll angekündigt. Auf die Einleitungsfrage “Was ist Digitaltechnik”, wird der Musikliebhaber, dem bislang nur analoge Technik zur Verfügung stand, auf die Zukunft eingestimmt: “Seit Thomas Edison vor über hundert Jahren (Anm: 1877) das erste Tonaufzeichnungsgerät erfunden hat, sah die Welt einige wichtige Verbesserungen: von Mono zu Stereo, von SP (Anm: Schellack) zur LP (Anm: Vinyl, erhöhte Spielzeit) und von Mittelwelle zu UKW. Und wir erleben zurzeit einen weiteren Fortschritt, einen revolutionären Wechsel. Sie haben vielleicht schon von Digital-Audio gehört. Diese Technologie verwendet zur Aufzeichnung von Musik binären Computercode. Dies ist die HiFi-Zukunft, die alle bisherigen Aufnahmetechnologien überflügelt. Und Sony mach Ihnen diese Technik mit dem PCM-F1 verfügbar”.
Zurück in die Zukunft – die Wahrnehmung zu Beginn der 80er Jahre
Der Sommer 1982 war lang, sonnenreich und warm und die Audiowelt der Endkunden noch rein analog. Die Schallplatte war das unangefochtene Medium für den Musikfreund und faktisch das einzige Distributionsmedium für Musik. Das kleine Sortiment bespielter Compact Kassetten war vernachlässigbar und die 8-Spur Bänder waren bereits Vergangenheit. Antal Doratis Gesamteinspielung aller 104 + 3 Haydn Symphonien, in 9 mächtigen LP-Boxen mit 46 Platten, waren eine imposante Erscheinung in jeder Klassik Sammlung. Plattencovers, wie Deep Purple in Rock oder Beatles Abbey Road waren einer ganzen Generation präsent. Der Sound wurde nicht nur durch den Musikstil oder in der Klassik von der Interpretation geprägt, auch die Gerätetechnik und nicht zuletzt das Trägermedium Schallplatte waren klangbestimmend. Die LP hatte noch nicht den Nimbus eines Tonträgers mit mythischem Sound, wie er heute wahrgenommen wird. Sie war einfach ein geschätztes Alltagsmedium und man war sich der Limiten des Formates bewusst. Die neue Digitaltechnologie versprach ultimativ klaren Klang, bis 74 Minuten Spielzeit, frei von Knacker, Rumpeln, Rauschen, springenden Tonarmen, kontinuierlicher Abnutzung von Platte und Nadel und zunehmenden Verzerrungen zum Plattenende hin. Letzteres war vor allem für Klassikliebhaber ein wiederkehrendes Problem. Die CD sollte einfache Handhabung, abnutzungsfreien, sauberen, präzisen Klang mit um 50% höherem Dynamikumfang und somit immerwährende Qualität bieten. Verlockende Versprechen! Doch nicht alles wurde vollumfänglich erfüllt, wie wir heute wissen. Die CD bietet zwar abnützungsfreie Abtastung, aber auch sie hat eine begrenzte “Lebenszeit”, da sich die Spiegelschicht im Inneren auflösen kann. “Digital” stand damals für DEN Aufbruch in ein neues Audiozeitalter, den alle mit Spannung erwarteten.
Frühe digitale Musik-Produktion in der realen Welt der 70er- und 80er Jahre
Technologieübergänge erfolgen immer Schrittweise, nie abrupt. Dies war schon in den 1920er Jahren beim Wechsel von der rein mechanischen Schallaufzeichnung zur elektrischen Aufzeichnung mit Mikrofonen und der Abtastung mit elektrischen Tonabnehmern der Fall. Trichtergrammophone waren noch lange Zeit im Verkauf und Gebrauch, bis sie endgültig auf dem Estrich/Dachboden verstaubten.
Bereits 1972 machte Denon/NHK Versuche mit digitalen Aufnahmen die anschliessend auf Schallplatte veröffentlicht wurden (Nippon Columbia NCC-8501, Mozart: Streichquartett KV458 und KV421, Smetana Quartett). 1978 lancierte Sony mit dem PCM-1600 das erste professionelle Digital Aufnahmesystem mit Datenspeicherung auf U-Matic Videobänder. Zusammen mit den Nachfolgemodellen PCM-1610/1630 wurde das Sony System zum quasi Standard für CD-Mastering. Dass diese Studiogeräte ihren Preis hatten versteht sich von selbst. Als dann 1982 mit dem PCM-F1 ein kleines, preiswertes Gerät für den “Heimgebrauch” auf den Markt kam, fand das Gerät in vielen Studios schnell Verwendung. Die Datenspeicherung erfolgte auch hier auf Videoband, jetzt aber auf Betamax Kassetten. Sony sah diese Entwicklung nicht gerne, da dies die teureren Studiogeräte kanibalisierte.
Da der PCM-F1 Prozessor nur über einen linearen 16 Bit Wandler für beide Stereo-Kanäle verfügte, wurde der linke und rechte Kanal nacheinander sequentiell codiert, was einen minimen Zeitversatz zwischen den beiden Kanälen zur Folge hatte. Bei der Wiedergabe (D/A-Wandlung) wurde der Versatz wieder korrigiert. Dieser Zeitversatz war allerdings ein Problem, wenn die digitalen Daten an ein anders Gerät weiter gegeben wurden.
Studioalltag
Hier ergaben sich eine Reihe von Zwängen, Einschränkungen und Probleme mit der neuen digitalen Aufzeichnungstechnik:
Bevor sich das Sony Konzept, respektive die Red Book Vorgaben für die Compact Disc, durchgesetzt hatten, gab es eine Reihe von unterschiedlichen Formaten, was die Austauschbarkeit massiv einschränkte. Sampling Frequenzen von 37.5kHz, 42.5kHz und 50kHz und Wortlängen von 13Bit bis 18Bit wurden nebeneinander eingesetzt. Jeder Hersteller oder gar Studio, wie Decca, hatte eigene Vorstellungen und Konzepte für Digital Audio. Ein typisches Szenario bei neuen, systemverändernden Technologien, bevor sich ein Industriestandard durchsetzt, was für eine erfolgreiche Markteinführung und Massenverbreitung notwendig ist.
Die Aufzeichnung auf Magnetband, Videoband im speziellen, war damals die einzige Möglichkeit die grossen Datenmengen zu speichern. Die durch das mechanische Prinzip gegebene Verletzlichkeit des Bandes hatte bei der Digitaltechnik fatalere Auswirkungen als bei der rein analogen Technik mit ihren graduellen und stetig zunehmenden Qualitätseinbussen. Aus Vorsicht wurden die Videobänder oft erst ab der 5. Bandminute bespielt.
Die heute gebräuchliche Samplingfrequenz von 44.1kHz lässt sich direkt von den Bildstandards der Videotechnik ableiten (Zeilenzahl, Bildfrequenz).
Die Produktionsmethoden, vor allem im kommerziellen Pop-Bereich, bauten damals wie heute auf Mehrspurtechnik, typischerweise mit 16 oder 32 Kanälen. Der 3M Konzern hatte schon in den 70er Jahren ein 32 Kanal Digital Mastering System auf dem Markt – Kostenpunkt im Bereich ab 115’000 Dollar (nach heutigem Wert gegen 400’000 Franken/Euro). Donald Fagens Album “The Nightfly” ist ein Beispiel für eine auf dem 3M System erstellte, rein digitale Pop Produktion. Alben des DMP Labels mit Flim & The BB’s und Aron Coplands “Appalachian Spring” mit dem St. Paul Chamber Orchestra sind zwei weitere. Auf Grund der hohen Anschaffungskosten für Mehrkanal-Digital-Equipment war eine hybride Arbeitsweise in den Studios durchaus der Alltag: analoge Multitrack-Aufzeichnung und –Bearbeitung (Mastering) mit abschliessender digitaler 2-Kanal Speicherung für die CD-Herstellung. Womit wir wieder beim Sony PCM-1600 de Facto Standard sind. Der PCM-F1 Prozessor senkte die Schwelle für digitale Aufnahmegeräte noch weiter. Kleinere Labels, wie das schwedische BIS Label von Robert von Bahr, schätzen auch die kompakten Dimensionen von Prozessor und Videogerät, was bei Aussenproduktionen von grossem Vorteil ist. Ein weiterer Grund für eine gemischte analog/digital Arbeitsweise lag in der Editierbarkeit, d.h. der Nachbearbeitung der Aufnahme. Die damals gebräuchlichen Digital Systeme boten nur eine stark eingeschränkte Nachbearbeitung (Edit): das Zusammenfügen von Abschnitten zweier Bänder und einer Pegelanpassung, in Ausnahmefällen auch Dubbing.
Eine reine Digitalaufnahme (ohne Zwischenspeicherung auf analogen Bandmaschinen) erforderte damals ein gleichzeitiges Zusammenspiel aller Musiker mit direkter Abmischung. Eine Bedingung die bei Live-Mitschnitten und dominant bei Klassik Produktion gegeben ist. Dieses Prinzip finden wir heute noch bei Direct-to-Disc Vinyl Produktionen (Beispiel: www.berlinermeisterschallplatten.de) oder bei reinen DSD Produktionen (Beispiel: www.nativedsd.com). Native DSD Einspielungen müssen ebenfalls während der Aufnahme gemischt werden, da eine Nachbearbeitung nur über den Umweg einer DSD-PCM-DSD Konvertierung möglich wäre (mit nur 1Bit kann man keine Rechenoperationen durchführen). Gerade die Notwendigkeit schon bei der Aufnahme möglichst alles richtig zu machen, ergibt in der Regel ein herausragendes Resultat. Ob das Ganze dann im PCM oder DSD Format gespeichert wird ist zweitrangig. Direct-to-Disc ist noch eine Stufe anspruchsvoller, da jeder Spielfehler der Musiker oder Manipulationsfehler bei der Tontechnik und Schneidemaschine ein Neubeginn erfordert – für alle Titel einer Plattenseite!
Das Befinden im Jahr zwei nach Einführung der CD
Für einen Grossteil der Nutzer bot die CD die versprochenen Qualitäten. Sie waren begeistert und kauften was auf den Markt kam und von Interesse war. Allerdings lieferte nur ein geringer Teil der veröffentlichten CD-Alben klanglich das, was die Marketing Abteilungen und die Theorie versprachen. Vieles klang harsch, ungewohnt und nüchtern. Die Kritiker sprachen von seelenlos, emotionslos. Man verglich das Neue mit dem, was man von der Platte her kannte. Dass nun die Schuld dem Prinzip CD und Digital zugeschrieben wurde, ist verständlich. Wer (Endkunden und Professionals) verstand das Nyquist-Shannon Abtasttheorem wirklich, wie viel wusste man über die Abläufe in der Musikproduktion, wie viel von Aufnahmetechnik? Das neue Medium erreichte den versprochen klaren, transparenten und somit präzisen Klang nur in Ausnahmefällen. Dies lag weniger an den frühen, nach heutigen Massstäben noch verbesserungsfähigen A/D- und D/A-Wandlern, sowie Anti-Ailasing und Digitalfiltern (Rekonstruktionsfiltern). Es lag auch nicht an der Wortlänge und einer zu geringen Abtastfrequenz. Was ist aber mit den nicht erfassten Signalanteilen (Löcher) zwischen den digitalen Samples und der Treppe im zurückgewandelten analogen Signal? Auch die sind nicht das Problem, denn es hat keine Treppen im Analogsignal: das Original wird mitsamt den nicht erfassten Zwischenwerten präzis und vollständig rekonstruiert (nicht einfach die Kanten geglättet, wie oft angenommen wird). Die berühmten “Treppenbilder” sind irreführend, denn sie sind eine Zwischenstufe im Rekonstruktionsprozess und nicht das Endresultat. > Links Digital Basics.
Die Problemzonen
Aufnahme – neue Arbeitsweise:
A) Den Umgang mit neuen Werkzeugen muss man erst lernen. Wie wir im Bild 1 gesehen haben, verschiebt die digitale Audiotechnik die bisherigen Eckwerte für Linearität, Verzerrungen, Signal-Rauschabstand, Dynamik, zeitliche Präzision und Kanaltrennung um mehrere Grössenordnungen. Das waren nicht einfach etwas bessere Werte als bisher, wie man Sie von neuen Geräten der gleichen Kategorie her kennt.
Dies erfordert vom Toningenieur und Tonmeister eine radikal andere Arbeitsweise. Von der Mikrofonierung über die Aussteuerung und dem Mixing. Besondere Probleme entstehen bei Nahfeldmikrofonie, die dominant bei Pop Aufnahmen zum Einsatz kommt. Bei 96dB Kanaltrennung (CD) erklingt ein links spielendes Instrument, welches mit einem kurzen Mikrofonabstand aufgenommen wurde, ausschliesslich aus dem linken Lautsprecher. Bei einer Tonbandmaschine ist im gleichen Fall das Instrument um ca. 33 dB abgeschwächt auch rechts hörbar. Bei Wiedergabe ab Schallplatte ist das Instrument im rechten Kanal nur noch ca. 22dB leiser. Die geringere Kanaltrennung der analogen Aufnahme simuliert die fehlenden Raumreflexionen (wegen der Nahfeldmikrofonie), die für die räumliche Wahrnehmung des Instruments verantwortlich sind. Die wesentlich höhere CD-Kanaltrennung erfordert Änderungen bei der Mikrofonierung oder ein wesentlich aufwändigeres Mastering. Mit heutigen Mitteln lässt sich das leichter realisieren, als früher. Die oft gehörte Aussage, dass die Schallplatte eine “bessere” Räumlichkeit biete, leitet sich aus ihrer geringen Kanaltrennung ab, ist aber keine echte Rauminformation. Auf Grund der geringen Übersprechdämpfung werden Stimmen und Instrumente breiter abgebildet, der Raum anders wahrgenommen.
B) Eine Tonbandmaschine hat mit Dolby Rauschunterdrückung einen Dynamikumfang von ca. 65 bis 75dB. Leise Musiksignale werden vom Bandrauschen zugedeckt, was die untere Limite ergibt. Laute Signalanteile oberhalb der Aussteuerungsgrenze des Bandes werden verzerrt. Diese Verzerrungen steigen mit zunehmender Bandsättigung kontinuierlich an. Sind diese harmonischen Verzerrungen moderat, d.h. gering, werden sie von unserem Gehör als Obertonreichtum interpretiert. Steigen sie aber an, werden sie als Störkomponente erkannt. Ein Toningenieur kann also durchaus bewusst das Signal in eine moderate Bandsättigung hinein regeln, quasi als kreatives Stilmittel.
Sowas geht und gibt es bei Digital Audio nicht. Die Dynamik eines digitalen Systems ist genauso wie die eines analogen Systems durch Rauschen und Signalverzerrung begrenzt. Es gibt jedoch grundlegende Unterschiede. Der Rauschpegel ist für 16 Bit rund 50% tiefer, also bei -96dB und bei -144dB für 24 Bit. Die Aussteuerungsgrenze ist punktgenau bei 0dBFS (FS = Full Scale, bezogen auf Vollaussteuerung). Darunter sind die Verzerrungen extrem gering und extrem leise, darüber aber schlagartig bei 100%. Es gibt keinen weichen Übergang und es gibt auch keine moderate “kreative” Verzerrungszone.
Ein Toningenieur darf also auf keinen Fall über Digital Null hinaus aussteuern. Um dies zu vermeiden hat er zwei Möglichkeiten a) Einsatz eines Limiters, der ein analoges Signal vor der D/A Wandlung am Übersteuern hindert, respektive kappt oder b) mit genügend Aussteuerungsreserve arbeiten.
Moderate analoge Verzerrungen können, wie erwähnt, unserem Ohr sogar schmeicheln. Digitale Verzerrungen werden im Gegensatz dazu aber als äusserst unangenehm empfunden. Digitale Verzerrungen lassen sich allerdings zu 99% vermeiden, indem man NIE über 0dBFS aussteuert, respektive nicht über -1dBFS um Intersample Clippings (=Sinagldeformation = Verzerrungen) zu vermeiden und b) dem Signal bei nicht trivialen Rechenoperationen Dither beifügt. Diese beiden Aspekte wurden zu Beginn des digitalen Zeitalters kaum beachtet oder waren noch nicht bekannt, respektive nicht erkannt worden.
Die schmeichelnden Verzerrungskomponenten analoger Geräte (z.B. Röhrenverstäker) lassen sich heute mit Softwaretools nachbilden (siehe Anhang: Ozone7 Vintage Tools), um so ein bevorzugtes Klangbild zu erzeugen. Auch der Weg über das Einschlaufen von analoger Hardware in den digitalen Prozess ist möglich. Link > 2xHD > CLASP
Produktionsmethode
Mehrkanal Bandmaschinen waren Studioalltag. Darauf hat jede Stimme, jedes Instrument, oder gar jedes Mikrofon, eine eigene Tonspur. Der Mischprozess kann dann ohne Musiker erfolgen und nicht alle Musiker müssen gleichzeitig im Studio anwesend sein. Eine enorme Erleichterung im Produktionsprozess. Digitale Mehrspur Systeme gab es schon in den 70er Jahren, u.a. das erwähnte System von 3M, das aber extrem teuer und somit kaum anzutreffen war. So wurde dann häufig rein analog auf Band produziert und erst beim CD Mastering auf einem Sony System 1600/10/30 digitalisiert. Mit dieser Produktionsmethode wurden die Möglichkeiten der digitalen Technologie nicht voll ausgenutzt, der versprochene klare und transparente Klang konnte so nicht erreicht werden. Was nicht heisst, dass mit dieser Produktionsmethode keine guten Aufnahmen machbar sind. Im Gegenteil, die CD kann die volle Qualität der Bandaufnahme transportieren. Die Verluste durch den Herstellungsprozess und Abtastung der Schallplatte können umgangen werden.
Mastering
Das Produktions-Mastering für CD und LP ist unterschiedlich. Eine Anpassung an das jeweilige Transportmedium ist zwingend. Beim Schneiden der Lackfolie zur LP-Produktion werden aus physikalischen Gründen die Höhen massiv angehoben und die Bässe abgesenkt (RIAA Schneidekennlinie > wird bei Wiedergabe entsprechend korrigiert). Nicht selten aber akzentuierte ein Toningenieur in der LP-Epoche im Pre-Mastering den Hochtonbereich bereits etwas um den bei der LP Wiedergabe kritischen Hochtonbereich zu stützen. Wird nun eine solches LP-Produktionsmaster einfach auf eine CD überspielt (was in der digitalen gelegentlich Frühzeit vorkam), dann fallen die Manipulationen im Hochtonbereich negativ auf.
Perzeption
Wer zum ersten Mal Musik ab CD hörte, war entweder vollends vom System begeistert oder war irritiert. Dies war abhängig von der Aufnahme, aber auch vom Genre und nicht zuletzt auch von persönlichen Klangvorstellungen. Klassikliebhaber hatten endlich die Innenrillenverzerrungen los, genossen die grössere Dynamik. Ein Pop-Liebhaber könnte das verzerrungsärmere Klangbild aber als kühl empfinden. Auch die wegfallenden Verdeckungseffekte brachten Artefakte der analogen Technik zum Vorschein, die bisher im Rauschen verschwanden. Zu diesem Thema gibt es eine Anekdote: Tom Stockham von Soundstream fragte Toningenieur Jerry Buck, ob er mit einem PCM Prototypen System die aktuelle Aufnahmesitzung parallel aufzeichnen dürfe. Buck bejahte das Vorhaben und Stockham erhielt eine Signalleitung ab Mischpult Ausgang. In einer Pause machte Stockham Buck auf einen Brumm im Mischpultsignal aufmerksam. Buck hörte aber bei der Bandwiedergabe in seinem Lautsprecher nichts und fragte welchen Pegel den der Brumm hätte. Stockham prüfte und gab zurück: “Hmm – das Problem liegt bei -80dB”. Da bei einer Bandmaschine mit Dolby NR bei knapp über -70db Schluss ist, wurde der Brumm von Rauschen überdeckt.
Wertungen wie emotionslos oder seelenlos sind subjektiv, können aus Sicht des Individuums durchaus richtig sein. Das Urteil ist aber keine allgemeingültige Regel und steht ausserhalb einer technisch, faktischen Wertung.
Wandler/Filtertechnik
Die frühe Digitaltechnik war alles andere als perfekt, was typisch ist für neue Technologien (man vergleiche ein Trichtergrammophon mit einem modernen Plattenspieler – beide arbeiten nach dem Prinzip der mechanischen Schallspeicherung, aber…). Oversampling, Singlebit- Multibit-Sigma-Delta-Wandler, Zeittaktregeneration, Dithering, Digital Audio Workstation, Computer Audio und High-Definition Audio mit grössere Wortbreite (Bit) und Abtastfrequenzen ab 88.2 kHz sind Stichworte für die Entwicklung von Digital Audio in den folgenden Jahrzehnten nach der Lancierung des PCM-F1 Prozessors. Über diese Entwicklungen werden wir in einem zukünftigen Blogbeitrag berichten.
Eine Vorstellung, wie Aufnahmen aus der Anfangszeit der Digitaltechnik klingen können, lässt sich mit dem BIS Album (BIS 288) “Jan Krtitel Vanhal – Concerto für 2 Fagotte und Orchester” nachvollziehen, eine DDD-PCM-F1 Aufnahme aus dem Jahr 1985. Das Beispiel zeigt, wie mit minimalistischen Mitteln ein durchaus beachtliches Resultat erzielt werden kann. Bezugsquelle (Download / eclassical.com).
Kritische Betrachtung:
Diese Vintage Tools verändern die originale Signalwellenform. Die Frage stellt sich nun:
a) ist die originale Wellenform ein genaues Abbild der akustischen Realität oder
b) war der integrale Aufnahmeprozess in irgendeiner Form nicht in der Lage das (akustische) Original genau abzubilden, was eine Nachbearbeitung (Reparatur) notwendig macht.
Welche Reparatur-Werkzeuge werden im Fall b sinnvollerweise eingesetzt? Wohl kaum solche die dem Signal weitere Artefakte hinzufügen. Die Ozone 7 Vintage Module sind keine Korrekturwerkzeuge, wie die übrigen Ozone 7 Module, sondern sind dazu da dem Klangbild einen bestimmten Charakter zu verleihen, ein Klangbild zu kreieren, wie wir es von analogen Aufnahme- und Wiedergabegeräten gewohnt sind.
Auffallend ist die Häufung des Adjektivs warm in den Vintage Tool Beschreibungen. “Warmer Klang” ist bei vielen beliebt. Ein warmer Klang wird meistens als Gegenpol zu schrillem Klang verstanden oder interpretiert, was nicht zwingend die einzig mögliche bipolare Wortpaarung für “warm” ist. Zu “warm” kann als Gegenpol auch detailreich stehen, respektive wärmer ↔ detaillierter. Detailliert ist kein Synonym für schrill oder scharf, sondern es geht hier um Durchhörbarkeit, Feinheiten Klangschattierungen, präzise Raumabbildung mit genau fokussierten Akteuren. Mit den Vintage Tools lassen sich auch kleine Fehler in der Aufnahme kaschieren (Maskierungseffekt).