Ergebnis 1 bis 10 von 10

Thema: Kann der Html-Validator UTF-8?

  1. #1

    Users Awaiting Email Confirmation

    Kann der Html-Validator UTF-8?

    Hallo Leute!

    Ich encodiere meine Html-Seite gern in UTF-8 (ist einfacher auswenig zu lernen als ISO-8859-1), aber W3Cs Validator scheint damit Probleme zu haben ? oO

    Validierung bei UTF-8:
    Zitat Zitat
    Sorry, I am unable to validate this document because on line 6, 9, 23, 29, 31, 38, 41, 43, 45, 92-94, 96-97, 103, 105, 107 it contained one or more bytes that I cannot interpret as utf-8 (in other words, the bytes found are not valid values in the specified Character Encoding). Please check both the content of the file and the character encoding indication.
    Validierung bei ISO-8859-1:
    Zitat Zitat
    This Page Is Valid XHTML 1.0 Strict!
    Es ist zu 100% die selbe Datei, nur einmal mit
    HTML-Code:
    <?xml version="1.0" encoding="utf-8" ?>
    und einemal mit
    HTML-Code:
    <?xml version="1.0" encoding="ISO-8859-1" ?>
    In den betreffenden Zeilen sind deutsche Umlaute (ä, ö, ü oder ß), aber soweit ich weiß, sind deutsche Umlaute in Unicode (utf-8) enthalten, oder nicht?



    btw: Die Datei selbst ist von mir ebenfalls in Unicode (utf-8) encodiert, ich habe eben extra Smultron umgestellt deswegen...

  2. #2
    Die Fehlermeldungen deuten aber darauf hin, dass die Datei nicht in UTF-8 encodet ist. Koenntest du die mal irgendwo hochladen, dass man da mal einen Blick drauf werfen kann?

  3. #3
    Schon mal probiert, wenn du auch noch
    HTML-Code:
    <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
    hinzugefügt hast?

  4. #4
    Der XML-Prolog und/oder die Metaangabe haben keine Auswirkung auf die tatsächliche Kodierung des Dokuments (ein Programm müsste zuerst eine Kodierung annehmen um diese Angaben lesen zu können und nach Erhalten der Information von vorne Anfangen). Das ist zwar beim Validator der Fall, aber nicht bei den großen Browsern.

    Damit Unicode funktioniert muss alles Stimmen. Zunächst muss das Dokument kodiert werden, das geht bei den meisten besseren Editoren.
    Dann muss die Eingabe richtig kodert werden (das erfolgt in der Regel automatisch, wenn das Dokument richtig kodiert ist, aber es gibt Ausnahmen, die kopierten Text nicht richtig kodert einfügen).

    Zuletzt muss dem Browser noch klar gemacht werden, wie er ein Dokument decodieren muss. Top-Priorität hat dabei ein HTTP-Header (und zwar content-type, nicht zu verwechseln mit der Metaangabe)!
    Ist diese nicht gegeben erkennt ein Browser meist selbstständig, um welche Kodierung es sich handelt (oder eine Standardkodierung wird verwendet).

  5. #5
    Ich erklär's mal anders: Das Encoding gibt an, welche Bitfolge für welches Zeichen steht. Diese Bitfolgen sind bei ISO-8859-1 (aka "Latin-1") und Unicode nur für die ersten 127 Zeichen identisch; diese Zeichen entsprechen ASCII. Umlaute sind jeweils ganz woanders. Das kleine Ä ('ä') hat beispielsweise in Latin-1 die Bitfolge E4*, in UTF-8 hingegen C3 A4*. Der Latin-1-Code ergibt in UTF-8 keinen Sinn (daher die Fehler) und umgekehrt steht der UTF-8-Code in Latin-1 für zwei(!) völlig andere Zeichen ("ä", um genau zu sein).

    Genau deshalb muß man das Encoding angeben - es gibt dutzende Möglichkeiten, Text binär zu kodieren und ohne separate Angabe kann man nicht bestimmen, welche vorliegt. Du erzählst jetzt dem Validator, du hättest deine Seite in UTF-8 vorliegen, wenn sie das in Wirklichkeit gar nicht tut. Deshalb beschwert er sich.

    Die Lösung ist, daß du deinem Texteditor sagst, er soll die Datei nicht in Latin-1 sondern in UTF-8 speichern. Wie genau das geht hängt von deinem Editor ab, aber meistens ist im "Speichern"-Dialog eine Combobox zur Auswahl des Encodings.


    * hexadezimale Schreibweise zur besseren Übersichtlichkeit

  6. #6
    Zitat Zitat von Jesus_666 Beitrag anzeigen
    Die Lösung ist, daß du deinem Texteditor sagst, er soll die Datei nicht in Latin-1 sondern in UTF-8 speichern. Wie genau das geht hängt von deinem Editor ab, aber meistens ist im "Speichern"-Dialog eine Combobox zur Auswahl des Encodings.
    s. erster Post:
    Zitat Zitat von Schattentier Beitrag anzeigen
    btw: Die Datei selbst ist von mir ebenfalls in Unicode (utf-8) encodiert, ich habe eben extra Smultron umgestellt deswegen...
    Sprich, a) hat er das gemacht und b) benutzt er einen Editor, den du kennst :D


    @ Schattentier:
    Oeh, ja, ich bleibe dabei, es waere hilfreich, die Datei zu sehen, um sagen zu koennen, was falsch ist (wenn du dir sicher bist, dass sie wirklich als UTF-8 gespeichert ist).

  7. #7
    Ah, habe das btw überlesen.

    Hmm, dann müßten wir wirklich mal die Datei sehen. Smultron ist eigentlich kompetent, was UTF-8 angeht.

  8. #8

    Users Awaiting Email Confirmation

    -.- beim erneuten Öffnen der Datei gab Smultron eine Fehlermeldung, dass das Dokument nicht als UTF-8 encodiert werden konnte. Ich hab es darauf hin neu gespeichert und neu validiert - es funktioniert jetzt.
    Sorry, ich dachte, ich hätte das Dokument zwischendurch schon mal geschlossen gehabt.. Trotzdem danke für eure Hilfe!

    Ich hätte aber noch eine abschließende Frage dazu: Bei Wikipedia hab ich gesehen, dass wohl nicht alle Unicodezeichen immer angezeigt werden. Wenn ich es richtig verstanden habe, liegt das an den Schriftarten, richtig? Also müsste man doch in der Zeichentabelle sehen können, ob ein Unicodezeichen unterstützt wird oder man lieber auf Html-Code zurückgreifen sollte!? Stimmt das so?

  9. #9
    Zitat Zitat von Schattentier Beitrag anzeigen
    Bei Wikipedia hab ich gesehen, dass wohl nicht alle Unicodezeichen immer angezeigt werden. Wenn ich es richtig verstanden habe, liegt das an den Schriftarten, richtig? Also müsste man doch in der Zeichentabelle sehen können, ob ein Unicodezeichen unterstützt wird oder man lieber auf Html-Code zurückgreifen sollte!? Stimmt das so?
    Wenn ein Zeichen nicht in der Schriftart ist dann ist es nicht in der Schriftart, unabhängig davon, ob du es als Unicode-Bitfolge oder HTML-Entity angibst. Die einzige Alternative sind Bilder.

    Wenn du dich an die üblichen Schriftfamilien hältst sollten an sich alle Zeichen darstellbar sein, die du jemals brauchen wirst. Oder anders formuliert:
    ∀ Wahrscheinlich_genutzte_Zeichen z: z ∊ Darstellbare_Zeichen

  10. #10

    Users Awaiting Email Confirmation

    Stimmt, du hast Recht.. Ich musiziere zwar auch, aber 'nen Violinschlüssel hab ich tatsächlich noch nie auf einer Homepage gebraucht...

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •