[Projekt] Online Feed Reader à la Google Reader / Fastladder

**DFYX** · 19.04.2013 17:50

So, ich habe gerade einen wichtigen Bug behoben, wodurch ich einem Release näher komme. Und zwar kam FeedNormalizer (eine Ruby-Bibliothek, die RSS-Feeds parst) nicht wirklich damit klar, wenn im Feed kaputtes HTML vorkam und hat dann wesentlich zu viel gelöscht.

Kurzes Beispiel aus dem German-Bash Feed:

HTML-Code:

&lt;p&gt;&amp;lt;Metsamien&amp;gt; Du kennst ja diese Anzeigen bei facebook? Die kann man ja wegklicken und dann sagen waru
&lt;p&gt;&lt;/p&gt;
&lt;p&gt;Das komplette Zitat findet ihr auf &lt;a href="http://german-bash.org/348585" title="Zitat Nummer 348585"&gt;german-bash.org&lt;/a&gt;
&lt;p&gt;31.03.2013, 07:59:05 - euIRC&lt;/p&gt;
&lt;img src="http://feeds.feedburner.com/~r/gbo-zitate/~4/_yJpkiwzVD0" height="1" width="1"/&gt;

Wird nach dem Unescapen zu:

HTML-Code:

<p>&lt;Metsamien&gt; Du kennst ja diese Anzeigen bei facebook? Die kann man ja wegklicken und dann sagen waru
<p></p>
<p>Das komplette Zitat findet ihr auf <a href=\"http://german-bash.org/348585\" title="Zitat Nummer 348585">german-bash.org</a>
<p>31.03.2013, 07:59:05 - euIRC</p>
<img src="http://feeds.feedburner.com/~r/gbo-zitate/~4/_yJpkiwzVD0" height="1" width="1"/>

Wie man sieht, fehlen da an mehreren Stellen die </p> Tags. FeedNormalizer hat das ganz radikal zu folgendem zusammengestrichen:

HTML-Code:

<p />

Mit Sanitize dagegen kriege ich folgendes Ergebnis:

HTML-Code:

<p>&lt;Metsamien&gt; Du kennst ja diese Anzeigen bei facebook? Die kann man ja wegklicken und dann sagen waru</p>
<p></p>
<p>Das komplette Zitat findet ihr auf <a href="http://german-bash.org/348585" title="Zitat Nummer 348585">german-bash.org</a></p>
<p>31.03.2013, 07:59:05 - euIRC</p>
<img src="http://feeds.feedburner.com/~r/gbo-zitate/~4/_yJpkiwzVD0" height="1" width="1">

Das sieht schon deutlich besser aus.

Edit: ich habe mal manuell Zeilenumbrüche eingefügt, damit man besser erkennt, was Sache ist.

Thema: [Projekt] Online Feed Reader à la Google Reader / Fastladder

Themen-Optionen

Anzeige

Baum-Darstellung

Berechtigungen