Gut, dann möchte ich mal erklären, wie man so 'ne 8-Bit-Mukke hinbekommt – möglichst realistisch, wie es beim NES halt war.
Für damalige Verhältnisse war der NES – Soundchip, eine Eigenentwicklung von Nintendo sogar noch einigermaßen revolutionär. So machten Konsolen, wie der ATARI 2600 und Co. den Sound mithilfe umgebauter Grafikchips und konnten nur zwei Stimmen gleichzeitig spielen und hatten eben zwei ganz simple analoge Soundgeneratoren. Damals brauchte man auch noch nicht mehr, denn durchgehende Musik während des Spieles war höchst selten. Lediglich Titelbild und Game Over bekamen manchmal eine Melodie spendiert. Außerdem hatte er die nette Eigenschaft dass beide Kanäle unterschiedliche Stimmungen aufwiesen – ja, er war gewissermaßen unmusikalisch. Auch hatten PAL und NTSC – Version unterschiedliche Kammertöne...
Beim C64 hatte man dann schon einen Soundchip, der drei unabhängige Wellenformen parallel ausgeben konnte und heutzutage als legendär gilt. Großartige Videospielmusiker wie Chris Hülsbeck sind dank MOS SID-Chips so bekannt geworden. Akkorde wurden meist in Arpeggios gespielt und somit kam man mit drei (analogen) Kanälen auch zurecht. Ähnlich lief es auch beim Soundchip des Nintendo NES, der vom Nintendo-Komponisten Yukio Kaeoka entwickelt wurde. Dieser trennt sozusagen Musik und Soundeffekte gleich mal – so reserviert er für die Musik drei, bzw. vier analoge Soundgeneratoren und kann zusätzlich noch digitalen PCM-Sound erzeugen. Das macht dann fünf Soundkanäle, die dann auf Mono zusammengerechnet werden.
Die analogen Soundgeneratoren (PSG- programmierbare Soundgeneratoren) sind zu dieser Zeit noch sehr einfach, die Funktionsweise ist auch sehr einfach nachzuvollziehen. Man nutzt verschiedene Wellenformen, um Klänge zu erhalten. Die einfachste Wellenform ist der Sinus. Den kennt man aus der Schule – eine einfache Pendelschwingung beschreibt diese Sinuskurve. Schwingt hier hingegen die Luft erhält man das einfachste Schallereignis, welches es gibt – den Sinuston. Eine Tonhöhe ohne Obertöne – also ein Ton in Reinform. (
Wiki über Sinus) Das klingt relativ langweilig. Jede Instrumentenklangfarbe, die wir kennen, setzt sich aus mehreren Obertönen zusammen. Folglicherweise ist die Wellenform dann kein Sinus mehr. Und genau da kommen die einzelnen Soundgeneratoren des Nintendo-Chips ins Spiel. Sie erzeugen Wellenformen, welche obertonreiche Klänge bedeuten. Davon gibt es konkret:
2x Rechteck-Schwingung: eine Rechteck-Schwingung klingt am ehesten nach einem Holzblasinstrument, evtl. nach einer Klarinette. (
Ich erkläre das Obertonspektrum, welches mittels Fouriertransformation aufgeschlüsselt wird und alle ungeraden Obertöne enthält jetzt nicht, das würde zu weit führen – nehmt es einfach so hin – Rechteck klingt nach Holzblasinstrument) Diese beiden Kanäle können beim NES die Melodien übernehmen und sind sehr präzise ansteuerbar. Man kann Glissandi/Portamenti zwischen einzelnen Tönen machen (also einen Ton in den anderen schleifen lassen), hat 16 Lautstärken zur Verfügung und kann die Pulsweite der Rechtecksschwingung ändern (das beeinflusst den Klang). In Super Mario Bros. spielen sie beim Overworld-Theme bspw. die zweistimmige Melodie. Man hatte die Möglichkeit Vibrato, Tremolo und auch kleine Delays darauf zu legen.
So klingt eine Rechteck-Schwingung
1x Dreieck-Schwingung: Klingt dumpfer wie ein Rechteck, aber so ähnlich und wird als Basis für die Synthese von Orgel und Flöten verwendet (
hier fallen die nur ungerade vorhandenen Obertöne um 6dB pro Oktave ab). Hier finden sich nicht mehr so viele Möglichkeiten, das ganze zu beeinflussen, deshalb wird dieser Soundkanal sehr gerne für das Bass-Fundament der Stücke verwendet. Hier konnte man auch die Lautstärke nicht anpassen und Effekte gab es auch keine.
So klingt eine Dreieck-Schwingung
Jeder Kanal kann aber nur einstimmig betrieben werden, da nur eine Wellenform pro Generator erzeugt wird. Auf jeden Fall wurden alle drei Kanäle manchmal dazu verwendet, um Akkorde zu spielen,
Ultima - Exodus Battle Theme teilweise wurden sie aber auch von einem der beiden Rechtecke arpeggiert (also als schnelle Einzeltonfolge der gesamte Akkord gespielt), während der Dreieck-Kanal das Fundament spielt und der andere Rechtecks-Kanal die Leadstimme.
Poison Mind aus Castlevania - hier fehlt die Leadstimme aber Akkorde und Fundament sind da
Zudem gibt es noch einen Soundgenerator, der einfach nur ein
(weißes) Rauschen erzeugt. Dieser soll dem Musiker die notwendige Perkussion bieten, kann aber natürlich nicht auf Tonhöhen festgesetzt werden, denn im Rauschen kommen alle Frequenzen vor. Somit werden hier nur kurze Impulse gegeben, die dann, wenn sie ausreichend kurz sind, wie Snareschläge klingen sollen.
So klingt weißes Rauschen
Für die Soundeffekte steht der einzige digitale Kanal zur Verfügung, der
PCM-Kanal. Hier werden, wie auch bei jeder Musik-Datei auf dem Rechner Samples abgespielt. Man konnte damals noch keine komplexen Musikstücke oder Sprachausgabe speichern, da eine Cartridge gerade mal bis zu 800 kB untergebracht hätte. Außerdem ist die Qualität aufgrund 1bit Wortbreite ziemlich schlecht und Sprache klingt dabei wie aus einem schlechten Walkie Talkie. Manchmal wurden aber kurze Samples von jubelnden Mengen abgespielt, gerade in Sportspielen. Diese wurden meist nach einer Sekunde immer und immer wieder geloopt.
Wir wissen jetzt, dass die Musik vierkanalig ist (mit Percussion), bzw. dreikanalig (ohne). Komplexe Strukturen und Akkorde sind meist einfach arpeggiert. Der fünfte Kanal ist für die Soundeffekte zuständig. Auch sind die Wellenformen fest vorgegeben. Aber etwas fehlt noch. Denn jeder Kanal ist noch mit einem ADSR-Hüllkurven-Generator ausgestattet. Damit können Klänge noch an verschiedene Anschläge und Abklänge angepasst werden. Bspw. Wäre es bei der Unterwasser-Musik in Super Mario Bros. nicht so toll, falls diese hart angeschlagen wird. Deswegen wird hier ein längerer Anschlag eingestellt – je länger dieser, desto weicher ist der Ton, wenn er entsteht.
A – Die erste Konstante: Steht für Attack und gibt die Dauer an, wie lange der Anschlag dauert.
D – Decay: Gibt die Dauer an, wie lange es dauert, bis nach dem Anschlag die Normlautstärke erreicht wird.
S – Sustain: Gibt die Normlautstärke an. Der Ton wird dabei solange gehalten, solange der Befehl dauert, die Note spielen.
R – Release: Gibt die Dauer des Ausklangs an.
Eine Grafik (Zeit auf Lautstärke) zur Verdeutlichung:

Diese vier Komponenten lassen schon eine ziemlich gute Synthese zu und man kann den Klang damit schon nach seinen eigenen Vorstellungen gestalten. Dabei ist zu beachten, dass perkussive Signale, wie Trommeln keinen Sustain haben, sondern nur aus Anschlag, Decay und Release bestehen.
Ohne ADSR-Hüllkurve klingt das so...
Mit Hüllkurve klingt das viel weicher und mehr nach Wasser^^
Nun gut, soviel zur groben Theorie. Um nun selbst NES-like Sounds zu basteln, kann man diese entweder mit allen Variablen und Komponenten selbst programmieren, anhand des quelloffenen Programmes NESmus. Ein Emulator spielt dann die Soundfiles einfach ab. Allerdings ist es eine einzige Zahlenschieberei. Wer hingegen ganz normal mit einer DAW arbeiten möchte, kann folgendermaßen vorgehen:
Ladet Euch das Tool Magical 8bit Plug von
http://www.ymck.net/index.html herunter.

Ja, es ist auf Japanisch, aber das Tool selbst ist auf Englisch und erreicht den NES – Sound schon sehr gut und es lässt sich bequem in Cubase, Logic, Fuity Loops oder sonstwas als Plug-In verwenden. Jetzt kann man seine gewohnten MIDI-Kanäle ganz einfach NES – like beschicken und MIDIs von NES-Spielen importieren und als realistisch klingende NES-Stücke als *.mp3s ins Spiel einbauen. Aber vorallem kann man selbst damit experimentieren und seine eigene Musik basteln, ganz nach seinen Vorstellungen.

