使用Perl写的一个删除HTML代码的函数
时间:2005-12-26 来源:zhumao
sub delhtml
{
my($str) = @_;
my($s_pos) = 0;
my($e_pos) = 0;
loop:
if(index($str,'<') != -1)
{
$s_pos = index($str,'<');
$e_pos = index($str,'>',$s_pos);
if($s_pos > 0)
{
$str = substr($str,0,$s_pos).substr($str,$e_pos+1);
}
elsif(s_pos == 0)
{
$str = substr($str,$e_pos + 1);
}
goto loop;
}
else
{
return $str;
}
}
#=====到此结束===
#上面的goto语句可以使用while来替换,这就看你个人的爱好了。
#调用格式 &delhtml($str)
# $str是含有HTML的字符串
#返回值为字符串
#这是我在香港教育学院处理HTML文件全文索引时写的一段代码
#以后有时间会再次改写
sub delhtml
{
my($str) = @_;
my($s_pos) = 0;
my($e_pos) = 0;
loop:
if(index($str,'<') != -1)
{
$s_pos = index($str,'<');
$e_pos = index($str,'>',$s_pos);
if($s_pos > 0)
{
$str = substr($str,0,$s_pos).substr($str,$e_pos+1);
}
elsif(s_pos == 0)
{
$str = substr($str,$e_pos + 1);
}
goto loop;
}
else
{
return $str;
}
}
#=====到此结束===
#上面的goto语句可以使用while来替换,这就看你个人的爱好了。
#调用格式 &delhtml($str)
# $str是含有HTML的字符串
#返回值为字符串
#这是我在香港教育学院处理HTML文件全文索引时写的一段代码
#以后有时间会再次改写
注:
有人回复:我想到的方法是把HTML的TAG用正则表达式给替换了。