タグ別アーカイブ: PHP

HTML–>RSSコンバーター

“小説家になろう”の作品の目次ページを取得してHTMLをパースしてRSSのフィードを生成するPHPを書いた。

ログインしてブックマーク機能使えばいいだけなんだけど、いつものRSSリーダーでチェックしたくてねー。

simple_html_dom.php を使ってDOMで取り扱えるようにして、

それを

$dom = str_get_html($html);
$dl = $dom->find(‘dl’);
foreach($dl as $value){
$matches = array();
$exp = ‘/^

(.*)<\/a><\/dd>
([0-9]{4})年 ([0-9]{2})月 ([0-9]{2})日 ( )*<\/dt> <\/dl>$/';
if(preg_match($exp,$value,$matches) ){
print_r($matches);
}

コアの部分はこんな感じ。
(OpenPNE2からwordpressに転送するとタグが除去されるのでSNSにログインしていないと表示されないと思いますが。(苦笑))

html4世代のHTMLではあるんでしょうけど、論理構造がまともなHTMLでしたのでやりやすかったです。

phpでマルチプロセス

<?php
$n = 8;
$time_start = microtime(true);
$fp=array();
$work=array();
for($i=0;$i<$n;$i++){
$fp[$i]=popen(‘sleep 5′,’r’);
}

for($i=0;$i<$n;$i++){
$work[$i] = fread($fp[$i],1024);
}
for($i=0;$i<$n;$i++){
echo $work[$i];
pclose($fp[$i]);
}
echo microtime(true) – $time_start;
?>
これ、5秒で終わります。もちろん、sleepなのでほぼ同時に8つのプロセスが終了するからこれでもんだいを生じていないだけなんですけどw
やっていることは、5秒待機するsleep 5を8プロセス同時に稼働させたということです。
各プロセスの処理が均質なら、この程度のコードでもシングルスレッドのはずのPHPでもマルチプロセスで処理が可能です。そこまで考えるならpcntl_waitpid()を使う必要がありますね。

やりたいことは、4core/8thredのcore i7を積んだマシンで、100件規模の会員さんにメールないしはFAX送信を統一的に行いたい。メールは、まあメーリングリストの手法は数多あるので問題ないのですが、問題はFAX。結構処理の時間がかかりそう。せっかくのcore i7なので、マルチプロセスにする方法を考えました。まあ、モデムというか回線は一本なのでプリントキューに送った後は地道に一件づつ処理なのですが、送信するpsファイルを処理する部分はマルチプロセスにしたかったんですよね。

あ、FAXが送れると言うことはやれば窓付き封筒でいいなら郵送用の紙への印刷もできなくはないでしょう。ソフトから見れば、FAXもプリンタも印刷なので。