RSSを使った情報活用の実験で、 学生さんが、RSSフィードの作成に興味を持っているので、 PerlでHTMLソースを扱うためのプログラミングの説明。
HTMLのソースをダウンロードするのであれば、 Perlであれば、"LWP::Simple"が便利。
#!/usr/bin/perl
use Jcode ; # 文字コード変換用に
use LWP::Simple; #
# ダウンロードしたいURLをget()に渡すだけで、
# 全ソースをとってきてくれる。
$content = get( "http://www.ei.fukui-nct.ac.jp/" ) ;
# 行単位の処理をするほうが判りやすいので...
my $c = 0 ;
# split で行ごとに分割
foreach my $line ( split( /\n/ , $content ) ) {
# 今回は、EUC-JPに変換して出力
$le = Jcode->new( $line )->euc ;
printf( "%04d: " , $c++ ) ;
print "$le\n" ;
}