Ich kenne mich nicht 100%ig damit aus wie der XP die Daten verschlüsselt, aber ein paar Punkte warum eine Verschlüsselung bei Audio-Dateien schwieriger ist:
1. Dateigröße
Wenn man sich die Größe einer typischen Audio-Datei und einer typischen Grafikdatei anguckt sieht man, daß Audiodaten im Schnitt deutlich größer sind, wo die Grafik mehr aus vielen dafür kleineren Dateien besteht. Nur arbeit eine Verschlüsselung und eine interne Entschlüsselung immer Dateiweise, die Entschlüsselung der Audio-Datei würde also alleine dadurch länger dauern, weil es mehr Daten sind.
2. Kompression
Die XP-Engine beinhaltet Funktionen um mit dem Zip-Algo. Daten zu komprimieren (das wird zB. bei der Scripts-Datei angewendet, wenn ich mich nicht irre), ich wage mal die Spekulation, daß auch die Verschlüsselung und Bündelung in eine Datei des XP über Zip funktioniert. Ausserdem vermute ich, daß sich Audio-Daten schwieriger komprimieren lassen als Grafiken, zumindest mittels generischen Algos wie Zip.

Ich will nicht sagen, daß eine Verschlüsselung der Audio-Daten in einer Art und Weise, daß das ganze noch angenehm flüssig ist unmöglich ist, aber vermutlich ist sie recht aufwendig zu programmieren bzw. man müsste speziellere Verschlüsselungstechnicken anwenden.
Enterbrain fand wohl, daß dieser Aufwand nicht gerechtfertigt war und hat die Audio-Daten daher davon ausgeschlossen.