多语言版本网站建设数据库设计和考虑的因素

因为如今网站上动态应用日益增多,至关多的网站还会使用文件或者数据库来存储应用信息,所以若是文件或者数据库中存储的内容与语言相关时,还须要特别注意。对于存储在数据库中信息,能够采起如下几种方式支持多语言:
  1,在数据库级别支持多语言:为每种语言创建独立的数据库,不一样语言的用户操做不一样的数据库。
  2,在表级别支持多语言:为每种语言创建独立的表,不一样语言的用户操做不一样的表,可是它们在同一个数据库中。
  3,在字段级别支持多语言:在同一个表中为每种语言创建独立的字段,不一样语言的用户操做不一样的字段,它们在同一个表中。
  因为数据库中有大量的信息(如标志,编码,数字等)是用于内部处理使用的,与语言无关的,所以在数据库级别支持多语言会致使空间的极大浪费,在字段级别支持多语言最大的问题是一旦须要支持新的语言,因为须要修改表结构,维护起来很是麻烦,可扩展性很差。
  相比之下,在表级别支持多语言比较好,由于并非全部的表都须要支持多语言,对于与语言无关的表,不一样语言的用户共用一套,那些和语言相关的表根据支 持语言的种类来创建,不一样语言的用户存取访问不一样的表格。这样使得维护简单,节省了存储空间,即便是扩展起来也比较方便,只要把须要支持多语言的表,多建 立一套便可。
      在设计和开发一个多语言版本的网站前,须要考虑下列因素:
      一、应用字符集的选择
      一个定位于不一样语言国家的企业网站势必须要提供多种语言版本的产品和销售信息来知足其世界各地使用不一样语言的客户和合做伙伴,其中包括法语、德语、意大利 语、葡萄牙语、西班牙语、阿拉伯语等等。但有一个问题却极易被网站设计者们所忽略。这就是网站的字符集设置问题。
      通常咱们使用的是简体中文(GB2312)字符集,而对多语言网站来讲,中文字符集却可能会使你辛辛苦苦的努力功亏一篑。缘由很简单:就是这个绝不起眼的小小字符集在做怪。
      计算机应用领域中存在着几十种互不相同的字符集,而不一样语言客户在浏览不一样语言网页时,每每会由于相互间所使用字符集没法兼容而出现乱码状况。咱们在浏览国外一些网站时,每每也会出现为了能正常地看到网站上的信息而不得不在各类字符集之间来回切换的状况。
      试想一下:若是一个网站提供了中,英,法,德等多种语言版本的内容,内容全之又全,设计美仑美奂。咱们在中文编码环境下浏览这些非中文版本的页面以为很是 完美,如今一个法国客户对你的产品发生了兴趣,当他进到法语版面一看—乱码多多,甚至可能整个版面都一塌里糊涂。你的网站再下大工夫又有什么意义呢?
      因此对提供了多语言版本的网站来讲,Unicode字符集应该是最理想的选择。
      它是一种双字节编码机制的字符集,不论是东方文字仍是西方文字,在Unicode中一概用两个字节来表示,于是至少能够定义65536个不一样的字符,几乎能够涵盖世界上目前全部通用的语言的每一种字符。因此在设计和开发多语言网站时,必定要注意先把非中文页面的字符集定义为“utf-8”格式,即:
      √:
      ×:
      这一步很是重要,缘由在于若等页面作好以后再更改字符集设置,可说是一件很是很是吃力不讨好的工做,有时候甚至可能须要从头再来,从新输入网站的文字内容。
      二、语言书写习惯&导航结构
      有些国家的语言书写习惯是从右到左,例如许多中东地区所使用的阿拉伯语,波斯语和希伯来语等等。若是你的市场目标是这些语言的国家,那么在网站设计中就需 要考虑这些特殊的语言书写习惯。并且若是你在网站导航结构设计中使用的是一个竖直导航栏,这时候就应该把它放在右边,而不是象咱们习惯的那样放在左边了。
      三、数据库驱动型网站
      对一个数据库驱动型的网站,尤为是当客户能够留言并向数据库添加信息时,则应当考虑如何从技术上实现对不一样语言数据信息的收集和检索。
      四、搜索引擎&市场推广
      对多语言网站来讲,搜索引擎优化(SEO)确实是个大问题。并且还须要注意的是:并不是全部的主流搜索引擎都会支持多语言网页,这也就是为何一个多语言的网站不必定被全部的主流搜索引擎收录。固然Google不存在这样的问题。
      其次须要考虑,不一样语言所面向的不一样市场目标国家和客户群体中习惯使用什么搜索引擎或门户网站进行搜索? 就象咱们习惯用土生土长的百度搜索同样,在一些语言国家使用最为普遍的可能仍然是其本国的搜索引擎或门户网站。php

 

来源:http://www.phpstudio.info/show-97-86-1.htmlhtml