关于XHTML的简单理解

时间：2007-02-17 来源：PHP爱好者

　　使用HTML是可以制作出现代的、结构化的、兼容标准的站点的。然而，为了做到向整洁的语义化的代码的转变，并且为XML和未来的其他标记语言做好准备，建议大家使用XHTML1.0 Strict来创建新的站点，本文中的例子用的就是XHTML1.0 Strict。　　XHTML 1.0 是以XML 1.0对HTML 4的改进，它的发展，以用来代替HTML。XHTML 1.0 Strict（这是我一直所倡导的）不支持表现类的标记（HTML 4.01其实也不支持，但是现在我们讨论的是XHTML）。正因为此，XHTML1.0 Strict 就促使了表现与结构的分离。　　XHTML 1.1（XHTML的最新版）从技术上说，使用起来有一些复杂。因为规定中声明XHTML 1.1的文档应当使用MIME类型 application/xhtml xml, 不应当被看作text/html。并不是严格的禁止使用text/html, 只是不建议使用。另外一方面，XHTML 1.0 （应当使用 application/xhtml xml）同样可以使用MIME类型 text/html, 如果它是可兼容的HTML。W3C的注解XHTML Media Types 中包括了MIME类型（W3C推荐使用的类型）的概要。　　不幸的是，一些老的浏览器包括IE不能识别MIME类型 application/xhtml xml, 并且会终止显示源代码，甚至会干脆拒绝显示整个文档。　　如果你想使用application/xhtml xml, 你应当让服务器检验一下读取文档的浏览器是否支持MIME类型。　　如果你使用的是PHP作为服务器端的脚本，那么下面的这段脚本能够让你的文档针对不同的浏览器使用不同的MIME类型。 <?php if (stristr($_SERVER[HTTP_ACCEPT], "application/xhtml xml") || stristr($_SERVER["HTTP_USER_AGENT"],"W3C_Validator"))
{ header("Content-Type: application/xhtml xml; charset=iso-8859-1");
header("Vary: Accept");
echo("<?xml version="1.0" encoding="iso-8859-1"?>n");
} else { header("Content-Type: text/html; charset=iso-8859-1");
header("Vary: Accept"); } ?> 　　这个脚本是检测是否用户代理发送了一个包含“application/xhtml xml”的Accept HTTP头，或者如果用户代理是W3C HTML校验器（不会发送合适的Accept HTTP头的，但是它依然支持 application/xhtml xml）。如果上面检测的回答是肯定的，文本将被看作 application/xhtml xml。那些浏览器也会收到一个XML的声明。对于另外的一些浏览器（包括IE的是所有版本），文档都将被看做 text/html。在文档中也没有添加额外的XML声明，因为如果添加的话，会使IE/WIN转化到我们所不希望的Quirks模式。　　在Content-Type头部之后,一个被更改过的头部，将被发送到中间的缓存中（比如一些代理服务器），用来告诉他们文档的内容类型随着客户端对文档的请求而改变。　　那个脚本对请求客户端的q-rating（它声明了更够很好的支持某种MIME类型）进行了考虑，在发送text/html 文档给不支持 application/xhtml xml的客户端之前，把XHTML转化成HTML 4。　　下面的是一个相似的脚本，针对ASP（VBSscript）:<% If InStr(Request.ServerVariables("HTTP_ACCEPT"), "application/xhtml xml") > 0 or InStr(Request.ServerVariables("HTTP_USER_AGENT"), "W3C_Validator") > 0 Then Response.ContentType = "application/xhtml xml" Response.Write("<?xml version=""1.0"" encoding=""iso-8859-1""?>" & VBCrLf); Else Response.ContentType = "text/html" End If Response.Charset = "iso-8859-1" %> 　　值得注意的是，当一个文档的MIME type是application/xhtml xml时，一些浏览器（像Mozilla）是不会显示包含错误的文档的。这在开发过程中是一件好事，但是对于那些刚刚更新完站点且不是XHTML专家的人来说，就会出现一些问题，除非您能确保所有的代码都是规范的。如果出现了这种问题，您可以考虑使用HTML 4.01 Strict来代替XHTML。　　下面列出了一些在使用XHTML 1.0 Strict中需要特别注意的地方: 永远使用小写字母，让引号伴随者属性: 所有元素和属性的名字都必须使用小写，所有属性值必须使用双引号。错误: <A HREF="index.html" CLASS=internal>
正确: <a href="index.html" class="internal"> 关闭所有的元素:在HTML中一些元素没有必要被关闭。当下一个元素开始的时候，上一个元素就自动被关闭。XHTML中是不允许这样的。所有元素都必须被关闭，即使其中没有内容（如 <img>）错误: <li>Item 1
正确: <li>Item 1</li> 错误: <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.
正确: <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p> 错误: <br>
正确: <br /> 错误: <img src="image.jpg" alt="">
正确: <img src="image.jpg" alt="" /> 属性不能被缩减: 在HTML里，一些属性可以被缩减。而XHTML则不允许这样做。错误: <input type="checkbox" id="checkbox1" name="checkbox1" checked>
正确: <input type="checkbox" id="checkbox1" name="checkbox1" checked="checked" /> 不要使用被排斥的元素: 一些元素和属性在HTML 4.01 Transitional和XHTML 1.0 Transitional是被允许的，而在XHTML 1.0 Strict下则不被支持(还有in HTML 4.01 Strict)。比如<font>、<center>、 alink、align、width、 height (对于某些元素)和 background。　　Doctype（文档类型）　　现在只有很少的HTML文档有一个正确而完整的doctype或者DTD (文档类型声明)。它现在更多的是在起装饰作用而没有什么功能作用，但是就在几年前刚开始的时候，一个doctype的定义，对浏览器解释这个文档起到很大的作用。　　所有的HTML和XHTML文档都必须使它的doctype声明合法化。 doctype可以告诉我们在文档中使用的是什么版本的HTML和XHMTL，也决定了校验器以何种方式校验，浏览器以何种模式解释。如果文档中有一个正确而完整的doctype，许多浏览器将会转换到标准模式，那就意味着与CSS的规范更加接近了。因为浏览器不必再把时间用在弥补、解释不规范的HTML上了，所以文档的显示速度也加快了。这同样也会减少在不同浏览器上显示的差异性。　　下面的doctype声明是针对XHTML 1.0 Strict的，它将会促使拥有“文档类型转换器”的浏览器使用他们的标准模式。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> 　　字符编码　　所有的XHTML文档都应当定义他们的字符编码。　　最好的网页编码方法是配置你的网络服务器，使其发送带有字符编码的HTTP content-type头部。关于如何使用去做的具体细节，请参阅你所使服务器软件的说明。　　如果你使用的是Apache，你可以通过在你的.htaccess文件中添加一两条规则来定义字符编码。例如，你的所有文件使用的都是utf-8, 添加下面的语句:　　AddDefaultCharset utf-8 　　定义具有相同扩展名的文件的字符编码,则使用下面的代码：　　AddCharset utf-8 .html 　　如果你的服务器允许你用PHP脚本时，你可以使用以下的代码来定义字符编码。<?php header("Content-Type: application/xhtml xml; charset=utf-8"); ?> 　　如果你的页面是HTML, 请把application/xhtml xml换成 text/html。不管是什么原因，如果你不能配置你的服务器使其定义为你所使用的字符编码，你可以在<head>中使用<meta> 。即使你的服务器配置正确了，这也是个定义字符编码的好方法。　　例如, 下面的<meta>告诉浏览器这是一个使用ISO-8859-1字符编码的文档:<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1" />
php爱好者站 http://www.phpfans.net 网页制作|网站建设|数据采集.