Mit AVISynth: folgenden Code schreiben:
Code:
ImageReader("<dateiname.endung>", 0, <länge in Frames>, 24, false)
Die Textdatei mit der Endung .avs speichern.
Mit VirtualDubMod öffnen. Streams -> Streamlist
Dort deine Tonspur reinladen.
Encoden. fertig.

Die Länge des Videos in Frames errechnest du mit
Länge der Tonspur in Sekunden * 24