Ergebnis 1 bis 3 von 3

Thema: [Projekt] Online Feed Reader à la Google Reader / Fastladder

Hybrid-Darstellung

Vorheriger Beitrag Vorheriger Beitrag   Nächster Beitrag Nächster Beitrag
  1. #1
    So, ich habe gerade einen wichtigen Bug behoben, wodurch ich einem Release näher komme. Und zwar kam FeedNormalizer (eine Ruby-Bibliothek, die RSS-Feeds parst) nicht wirklich damit klar, wenn im Feed kaputtes HTML vorkam und hat dann wesentlich zu viel gelöscht.

    Kurzes Beispiel aus dem German-Bash Feed:

    HTML-Code:
    <p><Metsamien> Du kennst ja diese Anzeigen bei facebook? Die kann man ja wegklicken und dann sagen waru
    <p></p>
    <p>Das komplette Zitat findet ihr auf <a href="http://german-bash.org/348585" title="Zitat Nummer 348585">german-bash.org</a>
    <p>31.03.2013, 07:59:05 - euIRC</p>
    <img src="http://feeds.feedburner.com/~r/gbo-zitate/~4/_yJpkiwzVD0" height="1" width="1"/>
    Wird nach dem Unescapen zu:

    HTML-Code:
    <p>&lt;Metsamien&gt; Du kennst ja diese Anzeigen bei facebook? Die kann man ja wegklicken und dann sagen waru
    <p></p>
    <p>Das komplette Zitat findet ihr auf <a href=\"http://german-bash.org/348585\" title="Zitat Nummer 348585">german-bash.org</a>
    <p>31.03.2013, 07:59:05 - euIRC</p>
    <img src="http://feeds.feedburner.com/~r/gbo-zitate/~4/_yJpkiwzVD0" height="1" width="1"/>
    Wie man sieht, fehlen da an mehreren Stellen die </p> Tags. FeedNormalizer hat das ganz radikal zu folgendem zusammengestrichen:

    HTML-Code:
    <p />
    Mit Sanitize dagegen kriege ich folgendes Ergebnis:

    HTML-Code:
    <p>&lt;Metsamien&gt; Du kennst ja diese Anzeigen bei facebook? Die kann man ja wegklicken und dann sagen waru</p>
    <p></p>
    <p>Das komplette Zitat findet ihr auf <a href="http://german-bash.org/348585" title="Zitat Nummer 348585">german-bash.org</a></p>
    <p>31.03.2013, 07:59:05 - euIRC</p>
    <img src="http://feeds.feedburner.com/~r/gbo-zitate/~4/_yJpkiwzVD0" height="1" width="1">
    Das sieht schon deutlich besser aus.

    Edit: ich habe mal manuell Zeilenumbrüche eingefügt, damit man besser erkennt, was Sache ist.

    Geändert von DFYX (19.04.2013 um 17:53 Uhr)

Berechtigungen

  • Neue Themen erstellen: Nein
  • Themen beantworten: Nein
  • Anhänge hochladen: Nein
  • Beiträge bearbeiten: Nein
  •