スポンサーリンク

PerlHTMLソースコードをDOM風に扱いたいと思うときがあります。
そういうときには、PerlHTML::TagParserモジュールを利用して、HTMLを解析すると便利です。

インストール
モジュールのインストールは、portsだと
cd /usr/ports/www/p5-HTML-TagParser
sudo make install clean
です。

サンプルソース

h2タグのinnerHTMLにアクセスするサンプルプログラム。

#!/usr/local/bin/perl
use strict;
use warnings;

use HTML::TagParser;

my $html;
my $file = 'foo.html';

$html = HTML::TagParser->new($file);

my @elements = $html->getElementsByTagName("h2");
foreach my $elem ( @elements ) {
	my $text = $elem->innerText;
	print $text, "\n";
}

という感じで、結構、簡単でかつ便利です。


HTML::TagParser->new にファイル名を渡していますが、
URLを渡して、直接リモートのファイルを開くこともできます。
$html = HTML::TagParser->new();
$html = HTML::TagParser->new("http://www.yahoo.co.jp/");
$html = HTML::TagParser->new("index.html");
$html = HTML::TagParser->new("<html><body>hoge</body></html>");

例では、getElementsByTagNameを使いましたが、getElementByIdやgetElementsByName、getElementsByClassName、getElementsByAttributeなどもあります。

スポンサーリンク
スポンサーリンク
 
いつもシェア、ありがとうございます!


もっと情報を探しませんか?

関連記事

最近の記事

人気のページ

スポンサーリンク
 

過去ログ

2020 : 01 02 03 04 05 06 07 08 09 10 11 12
2019 : 01 02 03 04 05 06 07 08 09 10 11 12
2018 : 01 02 03 04 05 06 07 08 09 10 11 12
2017 : 01 02 03 04 05 06 07 08 09 10 11 12
2016 : 01 02 03 04 05 06 07 08 09 10 11 12
2015 : 01 02 03 04 05 06 07 08 09 10 11 12
2014 : 01 02 03 04 05 06 07 08 09 10 11 12
2013 : 01 02 03 04 05 06 07 08 09 10 11 12
2012 : 01 02 03 04 05 06 07 08 09 10 11 12
2011 : 01 02 03 04 05 06 07 08 09 10 11 12
2010 : 01 02 03 04 05 06 07 08 09 10 11 12
2009 : 01 02 03 04 05 06 07 08 09 10 11 12
2008 : 01 02 03 04 05 06 07 08 09 10 11 12
2007 : 01 02 03 04 05 06 07 08 09 10 11 12
2006 : 01 02 03 04 05 06 07 08 09 10 11 12
2005 : 01 02 03 04 05 06 07 08 09 10 11 12
2004 : 01 02 03 04 05 06 07 08 09 10 11 12
2003 : 01 02 03 04 05 06 07 08 09 10 11 12

サイト

Vim入門

C言語入門

C++入門

JavaScript/Node.js入門

Python入門

FreeBSD入門

Ubuntu入門

セキュリティ入門

パソコン自作入門

ブログ

トップ


プライバシーポリシー