Ergebnis 1 bis 5 von 5

Thema: Kollation?

  1. #1

    Kollation?

    Hallo,

    ich bin gerade dabei, meine Facharbeit in technischer Informationstechnik zu schreiben... Meine Aufgabe ist es, einen Japanisch-Kurs zu entwerfen.

    Jetzt hab ich nur ein kleines Problem.
    Ich weiß einfach nicht, welche Kollation ich benutzen muss, damit auf der Seite im Browser japanische Schriftzeichen angezeigt werden können.
    Hab schon mehrere versucht, aber im Browser werden immer nur ??? angezeigt. ._.

    Achja, ich benutze für die Datenbanken PHPmyAdmin.

  2. #2
    Also eigentlich sollte "UTF-8" oder "UTF-16" (irgendeine Unicode-Form halt, wobei afaik UTF-16 besser geeignet wäre, wenn die Daten zum Großteil aus japanischen Zeichen bestehen, rein vom Platzverbrauch her) ausreichen, solange du die Zeichen dann auch im richtigen Format in die DB einfügst und aus ihr ausliest. Also wenn du das Ganze, wie ich aus deinem Post herauslese, als Website darstellst, musst du dann natürlich auch den richtigen Content-Type setzen ("utf-8"/"utf-16", je nach Wahl).

    Die Fragezeichen würden allerdings eher darauf hindeuten, dass zwar von der Technik her alles stimmt, du aber den notwendigen Zeichensatz nicht am Computer installiert hast. o_O Kann aber wohl kaum sein, wenn du dich damit beschäftigst. Dann wird's wohl eher falsch eingefügt/ausgelesen, und das Ergebnis sind z.B. arabische Schriftzeichen, die du halt nicht installiert hast.

  3. #3
    Zunächst muss man zwischenn Zeichensatz und Kollation unterscheiden. Der Zeichensatz bestimmt, welche Zeichen du verwenden kannst. Ideal wäre hier utf-8, weil das alle Zeichen der Welt enthält (Zeichensatz: utf8_unicode_ci).

    Kollation ist die Regel, nach der die Zeichen angeordnet werden. D.h. z.B. dass das Ü angeordnet wird als wäre es UE anstatt dass man es nach dem Y ordnet.
    Kollation wäre wohl hier ebenfalls utf8_unicode_ci (selber Name für zwei verschiedene Dinge).
    Ich bin mir nicht sicher, ob MySQL überhautp eine andere Kollation zum Zeichensatz erlaubt, aber mit obigen solltest du gut fahren können.

    Nun musst du noch andere Dinge beachten:
    1. Asiatische Zeichensätze müssen auf dem PC installiert sein, damit du den Text sehen kannst (besuche einfach mal eine japanische Webseite zum Testen).
    2. Wenn du die Daten aus der Datenbank in ein HTML Dokument ausgibst, musst du festlegen, dass das HTML-Dokument ensprechend kodiert ist, z.B. utf-8.
    3. Zulezt musst du noch festlegen, dass das HTML-Dokument auch in der richtigen Kodierung verarbeitet wird. Das geht zum einen über einen HTTP-Header (content-type: text/html; charset=utf-8, z.B. in der header-Funktion von PHP) oder einfach über den Browser. Hier in Firefox: Menü Ansicht -> Zeichencodierung -> Unicode (UTF-8).


    Wenn du dir also sicher sein kannst, dass alle Schritte die selbe Kodierung verwenden und die richtigen Zeichensätze installiert sind, soltle es keine Probleme geben.

  4. #4
    Ich habe soweit alle eure Tipps befolgt, aber immer noch keinen Erfolg gehabt...
    Habe soweit die Kollationen auf utf8_unicode_ci gestellt, sowie auch den Zeichensatz.
    Mein Browser zeigt auch ganz normal auf anderen japanischen Seiten Hiragana und Co. an...

    Was genau meinst du mit dem zweiten Punkt @mitaki?
    Da war ich mir grad nicht so sicher, wie das zu verstehen ist.

  5. #5
    Angenommen du schreibst ein Skript in PHP, welches die Daten aus der Datenbank holt. Dann musst du im Editor, in dem du dieses Skript schreibst, festlegen, dass die Eingabe utf-8 kodiert erfolgen soll.
    Wie das geht ist bei den meisten Editoren unterschiedlich. Ich verwendet Notepad++, dort geht es über: Format -> Kodiere als UTF-8 oder Kodiere als ANSI und zusätzlich die Option UTF-8 ohne BOM.

    Ist die Kodierung aktiviert, dann ist das Dokument entsprechend kodiert und wird dann auch in den meisten Fällen mit der richtigen Kodierung angezeigt.

    Da du mit MySQL arbeitest kannst du auch vor der Abfrage der Datenbank den Query
    Code:
    SET NAMES utf8;
    ausführen.

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •