HTML–>RSSコンバーター

“小説家になろう”の作品の目次ページを取得してHTMLをパースしてRSSのフィードを生成するPHPを書いた。

ログインしてブックマーク機能使えばいいだけなんだけど、いつものRSSリーダーでチェックしたくてねー。

simple_html_dom.php を使ってDOMで取り扱えるようにして、

それを

$dom = str_get_html($html);
$dl = $dom->find(‘dl’);
foreach($dl as $value){
$matches = array();
$exp = ‘/^

(.*)<\/a><\/dd>
([0-9]{4})年 ([0-9]{2})月 ([0-9]{2})日 ( )*<\/dt> <\/dl>$/';
if(preg_match($exp,$value,$matches) ){
print_r($matches);
}

コアの部分はこんな感じ。
(OpenPNE2からwordpressに転送するとタグが除去されるのでSNSにログインしていないと表示されないと思いますが。(苦笑))

html4世代のHTMLではあるんでしょうけど、論理構造がまともなHTMLでしたのでやりやすかったです。