XML加ASP实现网页“本地化”
程序员文章站
2022-06-10 14:33:27
想让你的站点能被来自多个国家的冲浪者看明白吗?无疑,这就需要提供多个语言版本的页面内容,也就是所谓的 “本地化”功能。最容易想到的方法就是分别编写多种语言的页面内容,然后放...
想让你的站点能被来自多个国家的冲浪者看明白吗?无疑,这就需要提供多个语言版本的页面内容,也就是所谓的
“本地化”功能。最容易想到的方法就是分别编写多种语言的页面内容,然后放置到不同的目录下,再在首页上添加导航
到各自语言位置的链接。很明显,这样的处理方式将浪费许多包含公共元素以及设计框架的空间,而且修改、维护也很烦
琐。有什么好方法吗?当然,本文就介绍如何结合使用xml与asp技术实现这个目的。
本文将讨论如下几个方面的内容:创建包含语言资源的xml文档、使用asp创建web页面模板、使用xpath语法和msxml3
分析器定位xml文档中的目标内容以及动态地在html流中插入语言字符串。
准备条件
本文讨论的技术涉及到以下方面:iis4 或者 pws(包含asp功能),msxml 版本 3。
功能展示
本文要讨论的例程是一个简单的html表单,用以提交名字和地址信息。下面是在netscape navigator中显示西班牙语
言的图示:
采用本文论述的技术,你就可以非常简单地通过更新一个xml文件实现为站点添加多种语言的功能。
创建包含语言资源的xml文档
首先,使用喜爱的页面编辑器创建一个叫做xmltrans.asp的web页面文件。我发现使用静态占位符文字(比如"first
name ")设计页面最容易。当xml准备好后,就可以使用变量替换这些静态文字。要下载例程文件请点击这里。
完成基本页面的功能设计后,开始创建一个包含语言字符串的良好格式xml文档。在这里,我使用纯文本编辑器
notepad编写初始的xml语言集-英语版本。notepad使我感觉更接近于源代码。xml文件命名为xmltrans.xml。下面列出了
包含english、french和spanish字符串的xml文件代码内容:
<?xml version="1.0" encoding="utf-8"?>
<languages>
<language xml:lang="en" engname="english" langname="english" charset="windows-1252">
<title>localize asp with xml</title>
<firstname>first name</firstname>
<lastname>last name</lastname>
<prefix>prefix</prefix>
<suffix>suffix</suffix>
<address1>address</address1>
<address2>address 2</address2>
<address3>address 3</address3>
<city>city</city>
<region>state/province</region>
<postalcode>postal code</postalcode>
<areacode>area code</areacode>
<telephone>telephone number</telephone>
<submit>ok</submit>
<lang>en</lang>
<charset>windows-1252</charset>
<langname>english</langname>
</language>
<language xml:lang="fr" engname="french" langname="franζais" charset="windows-1252">
<title>localize asp with xml - french</title>
<firstname>prénom</firstname>
<lastname>nom</lastname>
<prefix>préfixe (m., mme, mlle)</prefix>
<suffix>suffixe/titre</suffix>
<address1>rue</address1>
<address2/>
<address3/>
<city>ville</city>
<region>région/province</region>
<postalcode>code postal</postalcode>
<areacode>indicatif régional</areacode>
<telephone>numéro de téléphone</telephone>
<submit>ok</submit>
<lang>fr</lang>
<charset>windows-1252</charset>
<langname>french</langname>
</language>
<language xml:lang="sp" engname="spanish" langname="espanol" charset="windows-1252">
<title>localize asp with xml - spanish</title>
<firstname>nombre</firstname>
<lastname>apellido paterno</lastname>
<prefix>prefijo (sr., sra., srta.)</prefix>
<suffix>sufijo o título</suffix>
<address1>línea 1 de dirección</address1>
<address2/>
<address3/>
<city>ciudad</city>
<region>región, estado o provincia</region>
<postalcode>código postal</postalcode>
<areacode>código de área</areacode>
<telephone>número de teléfono </telephone>
<submit>ok</submit>
<lang>sp</lang>
<charset>iso-8859-1</charset>
<langname>spanish</langname>
</language>
</languages>
xmltrans.xml文件的第一行是xml声明。其中的version属性告诉读者文档符合xml 1.0的标准,encoding属性指示解析
器使用压缩版本的unicode:
<?xml version="1.0" encoding="utf-8"?>
一个xml文档需要一个包含其他元素的根元素。因为这里的例程是包含一些语言,所以就命名根元素为languages:
<languages>
作为集合类型,languages元素包含了一个或多个language元素:
<language xml:lang="en" engname="english" langname="english" charset="windows-1252">
以上language标记包含4个属性。xml:lang属性是其中最重要的,在asp程序中将通过这个属性值的2字母语言代码搜索
字符串组。其他的属性,比如charset,可以为将来的功能扩充而用。
每种语言节点中,我都添加了一个元素作为变量,其中含有显示在html页面上的文字。xml允许使用有含义的名字作为
自定义标记,比如,我使用<title>元素包含html页面的标题。同样,<firstname>元素包含字符串"first name"。
<title>localize asp with xml</title>
<firstname>first name</firstname>
最后,良好格式的xml文档包含了一整套对应于html页面的字符串。下图显示了xml文件中的标记和english语言字符
串。注意,现在这里只讨论english版本,以后可以添加更多种语言。
asp文件代码分析
现在回来看看asp文件xmltrans.asp。在其中我们使用xml路径语言(xpath),它可以在微软的xml解析器(msxml)中
执行。你可以认为xpath是抵达xml文档一部分内容预定位置的工具,这有些类似于在命令行中输入一个路径以执行文件,
比如c:\winnt\notepad.exe,或者在浏览器中敲入了一个url访问页面。下面研究这个asp文件看看如何取回english语言字
符串。首先,我们实例化一个叫做msxml2.domdocument的xml解析器工作对象:
set doc=server._
createobject _
("msxml2.domdocument")
由于asp程序不能象win32程序一样处理事件,所以在这里我们关闭了异步操作选项。这样就确保了在转向其他任务
前,脚本程序会一直等待当前事件的完成:
doc.async = false
接着使用domdocument对象的load方法装载包含字符串的xml文档。如果转载过程中发生了错误,就发出警告信息并停
止运行:
if not doc.load(server._
mappath("xmltrans.xml")) then
msg="failed to load "
msg=msg & "the xml file"
response.write msg
response.end
end if
我们可以使用两种方法查询xml文档:xsl和xpath。在这里让解析器使用后者,传递属性名字和正确数值给
setproperty方法:
doc.setproperty _
"selectionlanguage", "xpath"
然后,创建选择xml文档部分内容的路径。很明显,相关字符串位于languages元素的某个位置内,因此languages成为
路径的最开始部分。同时我们知道字符串是被包含在一个language元素内的,但是是哪一个呢?请别忘记在前面的xml文档
中,我们嵌入了一个叫做xml:lang的属性,并给出了一个唯一数值“en”。这就是我们要选择的,下面是操作它的语法:
sel="/languages/language"
sel=sel & "[@xml:lang='en']"
这有些不好理解,但你可以将这段xpath代码想像为一个sql语句,类似于取回一个记录集的命令:
select * from languages.language where xml:lang='en'
回到现实的xpath查询,要使用下面的代码返回包含第一个匹配节点的节点对象:
set selectednode = _
doc.selectsinglenode(sel)
最后一步是传递元素名字("title")给selectsinglenode方法,并要求它取回"title"节点的text属性值。就是说,取
得包含在<title>和</title>的文字。在这里,取回的文字是"localize asp with xml":
txt=selectednode._
selectsinglenode("title").text
与sql命令对照,就象从ado记录集内部取回一个字段值,语句是:
txt=rs("title")
在asp页面中插入语言字符串
知道了如何从xml元素中选取文字并赋值给变量,就可以将变量值插入到html流中了。为了使代码简洁,创建一个叫做
getstring()的函数,如下:
function getstring(instring)
temp=selectednode._
selectsinglenode _
(instring).text
getstring= _
server.htmlencode(temp)
end function
getstring()函数的输入值是元素名,元素值要从xml文档中取回。比如,将"firstname"传递给getstring(),
getstring函数就选择firstname元素并返回它的文本数值。为保险起见,在返回给调用者前,我们使用asp的
server.htmlencode方法转换文本为合法的html代码。在asp页面中,调用代码类似如下:
<td>
<%=getstring("firstname")%>:
</td>
如果选择了xml文档的english部分,html输出结果如下:
<td>first name:v/td>
如果选择了french,html输出结果如下:
<td>prénom:</td>
下图显示了french语言版本的表单:
选择可用语言
xml的一大优势就是它是以清晰的文本格式保存,我们能够在任何时候更新web服务器上的xml文件。而且,我们还可以
将english版本的xmltrans.xml文件在xml编辑器xml nothpad中打开,复制一份,然后将其中文字翻译为一种新语言。下图
显示了xml notepad中的例程文件:
上图中,在左边可以执行添加、删除以及选择元素和属性的操作,在右边可以编辑相关内容。当站点需要多种语言版
本时,只需要在内容中执行粘贴操作,然后上载最新的xml文档就可以了。
为了使添加的语言立即生效,要增加一个程序,用它判断文件中不同语言的种类数量,并返回语言代码和语言名称。
如下面的代码段所示,我们可以将数据格式化处理以创建一个html列表框。当用户提交表单时,2字母表示的语言种类代码
被存储到asp会话变量choselang中。
<select name="chosenlang">
<%
for i=0 to selectednodes.length - 1
response.write "<option value=" & _
chr(34) & _
selectednodes.item(i)._
selectsinglenode("lang").text & chr(34)
if (selectednodes.item(i)._
selectsinglenode("lang").text = _
session("chosenlang")) then
response.write " selected>"
else
response.write ">"
end if
response.write selectednodes.item(i)._
selectsinglenode("langname").text & _
"</option>" & vbcrlf
next
%></select>
添加提示信息以及字符集数据
上面使用xml提供了html表单的可变语言文字显示,接着还要考虑一些更丰富的用途。比如说,要在选择语言时添加一
个提示信息,只需要在文字前后嵌入html标记<label>,并从xml中提供可变内容作为title属性值。同理,为了帮助浏览器
识别html页面的语言种类,将字符集信息保存到xml文件中,比如:
<charset>x-sjis</charset>
然后,就可以使用asp将字符集类型插入到html流中:
<meta http-equiv="content-type" content="text/html; charset=
<%=getstring("charset")%>" />
最后的html代码包括了japanese字符集参考:
<meta http-equiv="content-type" content="text/html; charset=x-sjis" />
下图显示了使用japanese字符集的页面。记住,要看到正确的内容,操作系统以及浏览器必须支持unicode并安装了相
应字符。否则,就会看到一些奇怪的文字,可能是一些问号,也可能是一些方块符号等等。
总结
本文讲述了如何使用xml文件保存web页面的语言字符串。从中我们学会了使用asp脚本程序并借助微软xml解析器和w3c
的xpath语言实现查询xml文档的功能。asp代码将包含字符集类型的可变文字插入到html流中,并形成列表框以让用户选择
可用语言。本文涵盖了许多内容,但我想这只是一个起点。虽然可以在支持xml的浏览器中简单地实现这些功能,但我们已
经看到:使用服务器端脚本可以转换xml数据为普通的html内容,即使是早期版本的浏览器,同样能够看到这些精彩内
容。
“本地化”功能。最容易想到的方法就是分别编写多种语言的页面内容,然后放置到不同的目录下,再在首页上添加导航
到各自语言位置的链接。很明显,这样的处理方式将浪费许多包含公共元素以及设计框架的空间,而且修改、维护也很烦
琐。有什么好方法吗?当然,本文就介绍如何结合使用xml与asp技术实现这个目的。
本文将讨论如下几个方面的内容:创建包含语言资源的xml文档、使用asp创建web页面模板、使用xpath语法和msxml3
分析器定位xml文档中的目标内容以及动态地在html流中插入语言字符串。
准备条件
本文讨论的技术涉及到以下方面:iis4 或者 pws(包含asp功能),msxml 版本 3。
功能展示
本文要讨论的例程是一个简单的html表单,用以提交名字和地址信息。下面是在netscape navigator中显示西班牙语
言的图示:
采用本文论述的技术,你就可以非常简单地通过更新一个xml文件实现为站点添加多种语言的功能。
创建包含语言资源的xml文档
首先,使用喜爱的页面编辑器创建一个叫做xmltrans.asp的web页面文件。我发现使用静态占位符文字(比如"first
name ")设计页面最容易。当xml准备好后,就可以使用变量替换这些静态文字。要下载例程文件请点击这里。
完成基本页面的功能设计后,开始创建一个包含语言字符串的良好格式xml文档。在这里,我使用纯文本编辑器
notepad编写初始的xml语言集-英语版本。notepad使我感觉更接近于源代码。xml文件命名为xmltrans.xml。下面列出了
包含english、french和spanish字符串的xml文件代码内容:
<?xml version="1.0" encoding="utf-8"?>
<languages>
<language xml:lang="en" engname="english" langname="english" charset="windows-1252">
<title>localize asp with xml</title>
<firstname>first name</firstname>
<lastname>last name</lastname>
<prefix>prefix</prefix>
<suffix>suffix</suffix>
<address1>address</address1>
<address2>address 2</address2>
<address3>address 3</address3>
<city>city</city>
<region>state/province</region>
<postalcode>postal code</postalcode>
<areacode>area code</areacode>
<telephone>telephone number</telephone>
<submit>ok</submit>
<lang>en</lang>
<charset>windows-1252</charset>
<langname>english</langname>
</language>
<language xml:lang="fr" engname="french" langname="franζais" charset="windows-1252">
<title>localize asp with xml - french</title>
<firstname>prénom</firstname>
<lastname>nom</lastname>
<prefix>préfixe (m., mme, mlle)</prefix>
<suffix>suffixe/titre</suffix>
<address1>rue</address1>
<address2/>
<address3/>
<city>ville</city>
<region>région/province</region>
<postalcode>code postal</postalcode>
<areacode>indicatif régional</areacode>
<telephone>numéro de téléphone</telephone>
<submit>ok</submit>
<lang>fr</lang>
<charset>windows-1252</charset>
<langname>french</langname>
</language>
<language xml:lang="sp" engname="spanish" langname="espanol" charset="windows-1252">
<title>localize asp with xml - spanish</title>
<firstname>nombre</firstname>
<lastname>apellido paterno</lastname>
<prefix>prefijo (sr., sra., srta.)</prefix>
<suffix>sufijo o título</suffix>
<address1>línea 1 de dirección</address1>
<address2/>
<address3/>
<city>ciudad</city>
<region>región, estado o provincia</region>
<postalcode>código postal</postalcode>
<areacode>código de área</areacode>
<telephone>número de teléfono </telephone>
<submit>ok</submit>
<lang>sp</lang>
<charset>iso-8859-1</charset>
<langname>spanish</langname>
</language>
</languages>
xmltrans.xml文件的第一行是xml声明。其中的version属性告诉读者文档符合xml 1.0的标准,encoding属性指示解析
器使用压缩版本的unicode:
<?xml version="1.0" encoding="utf-8"?>
一个xml文档需要一个包含其他元素的根元素。因为这里的例程是包含一些语言,所以就命名根元素为languages:
<languages>
作为集合类型,languages元素包含了一个或多个language元素:
<language xml:lang="en" engname="english" langname="english" charset="windows-1252">
以上language标记包含4个属性。xml:lang属性是其中最重要的,在asp程序中将通过这个属性值的2字母语言代码搜索
字符串组。其他的属性,比如charset,可以为将来的功能扩充而用。
每种语言节点中,我都添加了一个元素作为变量,其中含有显示在html页面上的文字。xml允许使用有含义的名字作为
自定义标记,比如,我使用<title>元素包含html页面的标题。同样,<firstname>元素包含字符串"first name"。
<title>localize asp with xml</title>
<firstname>first name</firstname>
最后,良好格式的xml文档包含了一整套对应于html页面的字符串。下图显示了xml文件中的标记和english语言字符
串。注意,现在这里只讨论english版本,以后可以添加更多种语言。
asp文件代码分析
现在回来看看asp文件xmltrans.asp。在其中我们使用xml路径语言(xpath),它可以在微软的xml解析器(msxml)中
执行。你可以认为xpath是抵达xml文档一部分内容预定位置的工具,这有些类似于在命令行中输入一个路径以执行文件,
比如c:\winnt\notepad.exe,或者在浏览器中敲入了一个url访问页面。下面研究这个asp文件看看如何取回english语言字
符串。首先,我们实例化一个叫做msxml2.domdocument的xml解析器工作对象:
set doc=server._
createobject _
("msxml2.domdocument")
由于asp程序不能象win32程序一样处理事件,所以在这里我们关闭了异步操作选项。这样就确保了在转向其他任务
前,脚本程序会一直等待当前事件的完成:
doc.async = false
接着使用domdocument对象的load方法装载包含字符串的xml文档。如果转载过程中发生了错误,就发出警告信息并停
止运行:
if not doc.load(server._
mappath("xmltrans.xml")) then
msg="failed to load "
msg=msg & "the xml file"
response.write msg
response.end
end if
我们可以使用两种方法查询xml文档:xsl和xpath。在这里让解析器使用后者,传递属性名字和正确数值给
setproperty方法:
doc.setproperty _
"selectionlanguage", "xpath"
然后,创建选择xml文档部分内容的路径。很明显,相关字符串位于languages元素的某个位置内,因此languages成为
路径的最开始部分。同时我们知道字符串是被包含在一个language元素内的,但是是哪一个呢?请别忘记在前面的xml文档
中,我们嵌入了一个叫做xml:lang的属性,并给出了一个唯一数值“en”。这就是我们要选择的,下面是操作它的语法:
sel="/languages/language"
sel=sel & "[@xml:lang='en']"
这有些不好理解,但你可以将这段xpath代码想像为一个sql语句,类似于取回一个记录集的命令:
select * from languages.language where xml:lang='en'
回到现实的xpath查询,要使用下面的代码返回包含第一个匹配节点的节点对象:
set selectednode = _
doc.selectsinglenode(sel)
最后一步是传递元素名字("title")给selectsinglenode方法,并要求它取回"title"节点的text属性值。就是说,取
得包含在<title>和</title>的文字。在这里,取回的文字是"localize asp with xml":
txt=selectednode._
selectsinglenode("title").text
与sql命令对照,就象从ado记录集内部取回一个字段值,语句是:
txt=rs("title")
在asp页面中插入语言字符串
知道了如何从xml元素中选取文字并赋值给变量,就可以将变量值插入到html流中了。为了使代码简洁,创建一个叫做
getstring()的函数,如下:
function getstring(instring)
temp=selectednode._
selectsinglenode _
(instring).text
getstring= _
server.htmlencode(temp)
end function
getstring()函数的输入值是元素名,元素值要从xml文档中取回。比如,将"firstname"传递给getstring(),
getstring函数就选择firstname元素并返回它的文本数值。为保险起见,在返回给调用者前,我们使用asp的
server.htmlencode方法转换文本为合法的html代码。在asp页面中,调用代码类似如下:
<td>
<%=getstring("firstname")%>:
</td>
如果选择了xml文档的english部分,html输出结果如下:
<td>first name:v/td>
如果选择了french,html输出结果如下:
<td>prénom:</td>
下图显示了french语言版本的表单:
选择可用语言
xml的一大优势就是它是以清晰的文本格式保存,我们能够在任何时候更新web服务器上的xml文件。而且,我们还可以
将english版本的xmltrans.xml文件在xml编辑器xml nothpad中打开,复制一份,然后将其中文字翻译为一种新语言。下图
显示了xml notepad中的例程文件:
上图中,在左边可以执行添加、删除以及选择元素和属性的操作,在右边可以编辑相关内容。当站点需要多种语言版
本时,只需要在内容中执行粘贴操作,然后上载最新的xml文档就可以了。
为了使添加的语言立即生效,要增加一个程序,用它判断文件中不同语言的种类数量,并返回语言代码和语言名称。
如下面的代码段所示,我们可以将数据格式化处理以创建一个html列表框。当用户提交表单时,2字母表示的语言种类代码
被存储到asp会话变量choselang中。
<select name="chosenlang">
<%
for i=0 to selectednodes.length - 1
response.write "<option value=" & _
chr(34) & _
selectednodes.item(i)._
selectsinglenode("lang").text & chr(34)
if (selectednodes.item(i)._
selectsinglenode("lang").text = _
session("chosenlang")) then
response.write " selected>"
else
response.write ">"
end if
response.write selectednodes.item(i)._
selectsinglenode("langname").text & _
"</option>" & vbcrlf
next
%></select>
添加提示信息以及字符集数据
上面使用xml提供了html表单的可变语言文字显示,接着还要考虑一些更丰富的用途。比如说,要在选择语言时添加一
个提示信息,只需要在文字前后嵌入html标记<label>,并从xml中提供可变内容作为title属性值。同理,为了帮助浏览器
识别html页面的语言种类,将字符集信息保存到xml文件中,比如:
<charset>x-sjis</charset>
然后,就可以使用asp将字符集类型插入到html流中:
<meta http-equiv="content-type" content="text/html; charset=
<%=getstring("charset")%>" />
最后的html代码包括了japanese字符集参考:
<meta http-equiv="content-type" content="text/html; charset=x-sjis" />
下图显示了使用japanese字符集的页面。记住,要看到正确的内容,操作系统以及浏览器必须支持unicode并安装了相
应字符。否则,就会看到一些奇怪的文字,可能是一些问号,也可能是一些方块符号等等。
总结
本文讲述了如何使用xml文件保存web页面的语言字符串。从中我们学会了使用asp脚本程序并借助微软xml解析器和w3c
的xpath语言实现查询xml文档的功能。asp代码将包含字符集类型的可变文字插入到html流中,并形成列表框以让用户选择
可用语言。本文涵盖了许多内容,但我想这只是一个起点。虽然可以在支持xml的浏览器中简单地实现这些功能,但我们已
经看到:使用服务器端脚本可以转换xml数据为普通的html内容,即使是早期版本的浏览器,同样能够看到这些精彩内
容。