tweeper.php: support host-specific methods for preprocessing the HTML data
authorAntonio Ospite <ao2@ao2.it>
Wed, 1 Jul 2015 11:37:57 +0000 (13:37 +0200)
committerAntonio Ospite <ao2@ao2.it>
Mon, 6 Jul 2015 14:58:47 +0000 (16:58 +0200)
commit7097a8ad2ef040bc81a8c5f7ed7cc02e0073eaab
treed31a16614bb2b201b63e98312e364a3469fac46f
parent032dc6cebadb1bc3e1647dff131a1e99c53019ff
tweeper.php: support host-specific methods for preprocessing the HTML data

Some sites serve mangled HTML code, so a mechanism to clean it up before
loading it as XML is needed.

For instance, facebook.com puts come content inside HTML comments, and
these must be stripped in order to make the content available to the
HTML parser when loading the data into a DOMDocument.
tweeper.php