Das dürfte so ziemlich das einzige sein, denke ich. Hab' allerdings auch noch nie auf einem Intel assembliert, könnte also leicht komplett falsch sein. <__<'
Naja, und wenn man someproc vorher kennt, wären evtl. noch einige andere Sachen möglich (OK, Inlining z.B., aber halt noch anderes).
Wobei natürlich auch die Frage ist, worauf man optimiert.
Edit: Witnogargf ist da gerade passiert? o_O Wenn ich endlich mal was weiß! O__O
Ich hatte mich geirrt. Ich wollte auf etwas hinaus, was bei DIESEM Beispiel keinen Sinn macht (self-modifying code: sub byte ptr [label2], 8), außerdem hatte ich versehentlich zweimal ecx verwendet (eigentlich sollte die Schleife über ecx und das inc/dec über edx laufen). Daher hab ich meine Frage schnell geändert. Aber offenbar zu langsam.
--
Mir war nichtmal bewusst dass ich nominiert wurde, aber: Cool! Hälfte des Lobes muss aber unbedingt an Archeia!