Computerhardware: Sound

Die Digitalisierung Bearbeiten

 
Analog-Digital-Wandlung, anschließend Digital-Analog-Wandlung

Das obere Bild (fig. 1) zeigt als rote Linie die Spannung, wie sie vom Mikrofon kommt. Der dargestellte Abschnitt entspricht einer Zeitspanne von weniger als einer tausendstel Sekunde. Die Soundkarte wandelt dieses Analogsignal in digitale Daten um, siehe die mittlere Darstellung (fig. 2).

In der Ausgaberichtung erzeugt die Soundkarte Töne aus digitalen Daten, die aus einer Datei oder von einer CD stammen oder von einem Computerspiel synthetisch erzeugt werden. Dabei entsteht eine treppenförmige Spannung. Die Stufen werden mit einem Filter geglättet, und es entsteht eine Analogspannung entsprechend der roten Linie (fig. 3). Diese ist der Ausgangslinie im oberen Bild sehr ähnlich, die kleinen Unterschiede sind nicht hörbar.

Wie geht die Digitalisierung des Mikrofonsignals genau vor sich? Die Amplitude des Tonsignals wird in regelmäßigen, sehr kurzen Intervallen gemessen. Der CD-Standard sieht eine „Samplingrate“ von 44,1 kHz und eine „Auflösung“ von 16 Bit vor.

  • Die Samplingrate gibt an, wie oft pro Sekunde die Lautstärke gemessen wird. Um CD-Qualität zu erreichen, muss 44.100 mal pro Sekunde die Lautstärke des Tons gemessen werden.
  • Auflösung bedeutet, dass die Lautstärke mit einer Genauigkeit von 16 Bit gemessen wird, das sind 65.536 Abstufungen.

Das ist ausreichend, um Töne mit einer Frequenz bis 22 kHz zu reproduzieren. Das erreichbare Maximum liegt höher: Hochwertige Soundkarten können mit 96 kHz digitalisieren, und Soundkarten für Musiker erreichen 192 kHz mit 24-Bit-Auflösung. Je höher diese Werte, desto besser die Qualität. Andererseits werden die erzeugten Sounddateien sehr groß. Deshalb können Auflösung und Samplingrate bei allen Soundkarten reduziert werden, um den besten Kompromiss zwischen Qualität und Speicherbedarf einzustellen. Eine Abtastung mit 11 kHz bei 8-Bit-Auflösung benötigt gegenüber CD-Qualität nur ein Viertel des Speicherplatzes, aber erreicht gerade noch die Qualität eines Telefongesprächs.

Welche Datenmenge entsteht bei der Digitalisierung pro Tonkanal?
Qualität Samplingrate Auflösung Speicherbedarf
Telefonqualität 11 kHz 8 Bit = 1 Byte 11.000 x 1 = 11 kByte pro Sekunde
CD-Qualität 44 kHz 16 Bit = 2 Byte 44.000 x 2 = 88 kByte pro Sekunde
Beste Studioqualität 192 kHz 24 Bit = 3 Byte 192.000 x 3 = 576 kByte pro Sekunde

Eine Stereo-Aufnahme hat zwei Kanäle, also müssen die obigen Werte verdoppelt werden. Eine Digitalisierung in bester Studioqualität (192 kHz/24 Bit/Stereo) würde nach reichlich einer Sekunde eine Diskette füllen! Eine CD wäre schon nach zehn Minuten voll.

AC97 Bearbeiten

Intel hatte die Idee, dass moderne CPUs genug Leistung haben, um neben den normalen Aufgaben auch noch die Analogdaten zu berechnen. Herausgekommen ist die AC97-Spezifikation (Audio Codec 97). Dadurch genügt ein einfacher Chip für die Soundausgabe, der mittlerweile auf jeder Hauptplatine verbaut ist. Die Prozessorlast steigt bei Nutzung dieses Chips stark an. Wenn Ihre Computerspiele ruckeln, können Sie durch Einbau einer Soundkarte (in der Preislage um 50 bis 100 €) die Prozessorlast signifikant verringern.

 
Soundkarte mit 5.1 Klang. Beachten Sie die Anschlüsse: Rot ist für das Stereo-Mikrofon. Blau, Schwarz und Grün sind für ein 5.1 Soundsystem. Darunter befindet sich der Joystick-Anschluss.

Raumklang Bearbeiten

Die Firma „Creative Labs“ hat die Raumklangtechnologie EAX entwickelt. Eine konkurrierende Technologie A3D der Firma „Aureal“ wurde von Creative Labs übernommen und in EAX integriert.

Man könnte zwar annehmen, dass für den Raumklang zwei Lautsprecher ausreichen, weil der Mensch auch nur zwei Ohren hat. Versuche haben aber ergeben, dass für einen optimalen Raumklang ein Surround-System mit drei oder mehr Lautsprechern empfehlenswert ist.

Wenn ein zusätzlichen Subwoofer (ein Lautsprecher für Basstöne) als dritter Kanal angeschlossen ist, spricht man von einem 2.1 Soundsystem. Es können auch 5, 6 oder 8 Lautsprecher angeschlossen werden. Lautsprechersysteme werden mit den Ziffernkombinationen 2.1, 4.1, 5.1 oder 7.1 bezeichnet. Die zweite Ziffer steht für den Subwoofer, die erste Ziffer gibt die Anzahl der „Satellitenlautsprecher“ an. Wenn die erste Ziffer ungerade ist, steht in der Mitte außer dem Subwoofer ein zusätzlicher Hochtonlautsprecher. Die anderen Lautsprecher sind rechts und links verteilt.

Spiele übermitteln über den DirectX Treiber den gewünschten Klang an die Soundkarte, die den gewünschten Raumklang berechnet. Aber nicht nur Spieler profitieren vom Raumklang. Hochauflösendes Fernsehen, neuere Video-DVDs und neuere Musik-CDs benutzen die zusätzlichen Kanäle.

Physiologisches Bearbeiten

Gesunde Jugendliche können Töne zwischen 16 Hz und 20 kHz hören, wenn der Ton nicht zu leise ist (70 db). Töne unter 30 Hz werden nicht mit dem Ohr gehört, sondern der Körper fühlt die Vibrationen. Gute Subwoofer (Tiefton-Lautsprecher) können Töne bis herunter zu 15 Hz wiedergeben.

Die obere Hörschwelle verringert sich mit zunehmendem Alter. Mit 40 kann man noch 15 kHz hören, mit 60 Jahren verringert sich die höchste hörbare Frequenz auf 12 kHz. Das Gehirn ergänzt die nicht mehr hörbaren Schwingungen aus der Erinnerung.

PMPO Bearbeiten

Der Maximalwert, oder auch PMPO (Peak Maximum Power Output) ist der Wert, den ein Verstärker oder Lautsprecher nur sehr kurzzeitig aushält. Dauert diese Belastung länger als wenige Sekunden, erzeugt der Lautsprecher ein feines Qualmwölkchen. Mess- und hörbare Verzerrungen treten schon bei einem Bruchteil der PMPO-Leistung auf. Dieser Wert ist also für die Praxis unbrauchbar. Sinnvolle Werte ergeben sich beim Messen von Sinuswellen. PMPO-Werte im Marketing zu verwenden, ist Dummenfang.