HTML标签的正则表达式 求助
然后<c>...</c>时有时无,现在要把??里的内容扣出来,考虑用什么方法?
作者: jiantizi 发布时间: 2010-03-31
my $a= '<a>....<b>???<b>...<c>???</c>...</a>....'; while ($a =~ />(.*?)</g ) { print $1,"\n"; }
不过最好还是用cpan上的模块。如:WWW::Mechanize
作者: Aylazhang 发布时间: 2010-03-31
作者: fibbery 发布时间: 2010-03-31
Perl code
my $a= '<a>....<b>???<b>...<c>???</c>...</a>....';
while ($a =~ />(.*?)</g ) {
print $1,"\n";
}
不过最好还是用cpan上的模块。如:WWW::Mechanize
你这个不是把“....”也给抠出来啦?我只是要“??”的内容。
作者: jiantizi 发布时间: 2010-04-01
作者: Aylazhang 发布时间: 2010-04-01
. 跟 ? 有什么区别。你没说清楚。
.和?都带标网页上的内容,只是??表示的部分是我要的。
作者: jiantizi 发布时间: 2010-04-01
my $a= '<a>....<b>???<b>...<c>???</c>...</a>....'; while ($a =~ />(\?+?)</g ) { print $1,"\n"; }
作者: Aylazhang 发布时间: 2010-04-01
Perl code
my $a= '<a>....<b>???<b>...<c>???</c>...</a>....';
while ($a =~ />(\?+?)</g ) {
print $1,"\n";
}
看来还是没有讲清楚,给个例子:
<a>
sssss
<b>2009</b>
<c>Nov</c>
ddddd
</a>
作者: jiantizi 发布时间: 2010-04-01
作者: jiantizi 发布时间: 2010-04-01
作者: jiantizi 发布时间: 2010-05-07
my $a= '<a>....<B>xxxxxxxxxxx</B>...<c>yyyyyyyyyy</c>...</a>....'; while ($a =~ /<[bc]>(.*?)<\/[bc]>/ig) { print $1,"\n"; }
作者: fandelei1982 发布时间: 2010-05-08
作者: proorck6 发布时间: 2010-11-05