RenPy erfüllt eigentlich all deine Anforderungen, auch wenn Texteingaben etwas eingeschränkt sind. Das ganze ist plattformunabhängig, inklusive Android-Export. Es gibt zwar keine GUI-Oberfläche, aber die Scriptsprache hat man mit etwas Programmiererfahrung meiner Meinung nach wirklich schnell drauf (wenn du schon mal mit Python zu tun hattest, wahrscheinlich noch schneller als schnell):
Code (Schnippsel aus dem Quickstart-Tutorial):
image bg meadow = "meadow.jpg"
 
image sylvie smile = "sylvie_smile.png"
image sylvie surprised = "sylvie_surprised.png"
 
label start:
    play music "illurock.ogg"
 
    scene bg meadow
    show sylvie smile
 
    "I'll ask her..."

play music sollte selbsterklärend sein, scene <image> und show <image> zeigen Bilder an. Text in Anführungszeichen wird auf dem Bildschirm dargestellt.

Wenn wir schon bei Visual Novel-Engines sind, gibt es aber auch noch Novelty, hier kann man Szenen durch zusammenklicken erstellen. Allerdings ist Novelty nur für Windows verfügbar und damit vermutlich uninteressant. Inwiefern deine Featurewünsche hier unterstützt werden, weiß ich auch nicht.

Sind wie gesagt beides "Spiele"-Engines, die weit mehr als das von dir gewollte können, daher weiß ich nicht ob du den unnötigen Ballast mit rumtragen willst.