什么是标记语言?
标记语言是一种用语义上可区分文本的方式来注释文档的系统。这个想法和术语是从纸上手稿的“标记”,即编辑们的修改指示演变而来的,传统上用蓝色铅笔写在做者的手稿上。编辑器
标记语言的历史?
标记来源于传统的标记手稿的出版实践。当须要出版一部手稿的时候,首先手稿被交给“标记人”,他们在手稿上标记文字以代表在什么部分该用什么什么字体,样式和尺寸,标记完成后将手稿交给人手工排版。除了标记人,标记也常常被编辑,校对者,出版商和图形设计师以及文档做者应用。ide
- GenCode
William L. Tunnicliffe提出第一个用于计算机文本处理的标记语言gencode.
- troff和nroff
一些在出版业之外可用的计算机标记语言能够在Unix系统上的排版工具中找到,如troff和nroff之类的。 在这些系统中,格式化命令被插入到文档文本中,以便排版软件能够根据编辑器的规格格式化文本。所见即所得(“所见即所得”)的出版软件对这些语言大量使用。
- TeX
TeX是一个由美国电脑教授高德纳(Donald E. Knuth)编写的功能强大的排版软件。它在学术界十分流行,特别是数学、物理学和计算机科学界。TeX被广泛认为是一个很好的排版工具,特别是在处理复杂的数学公式时。一个名为LaTeX的TeX宏包在TeX之上提供了一个描述性标记系统,LaTex并被普遍使用。
- Scribe
Scribe是结构和表述之间分清楚的第一个语言,Brian Reid在他的博士论文中提出。他提出了一个idea:样式分离文档,并提出了控制描述元素使用的语法,这影响了SGML,是HTML和LaTex的直接祖先。
- GML
IBM在20世纪60年代,建立了GML(Generalized Markup Language,通用标记语言),以在其出版系统内部实现这一需求。IBM使用GML来用单一类型的源文件维护书籍、报表以及其余文件。
- SGML
SGML(Standard Generalized Markup Language)源于标记的重点应该是文档结构的想法。SGML融合过gencode的思想。SGML从IBM的GML演化而来,是第一个标准化的信息结构化技术。SGML成为了IBM内部格式化和维护合法文件的手段。SGML后来被扩展和修改,做为一种全面的信息标准以适应工业范围的普遍应用。但直到1986年,SGML才成为了ISO标准。尽管SGML的功能很是强大,可是因为它很是复杂,须要一大堆昂贵的软件配合运行,于是在很长一段时间都没有被推广。
- HTML
1989年,欧洲粒子物理实验室(CERT)的研究员 Tim Berners-Lee 和 Anders Berglund 两人建立了一种基于标记的语言HTML,为给Internet上共享的文章作标记。HTML能够看做是SGML的简化的应用。可是HTML标签逐渐庞大,而且失去严谨性。
- XML 1996年,W3C寻找一种在WEB中应用SGML的灵活性和强大功能的方法,这致使了1998年2月,XML1.0规范的发布。XML(eXtensible Markup Language,可扩展的标记语言)具有了SGML的核心特性,又很是的简洁,XML规范的内容甚至不到SGML的十分之一,XML的简洁可见一斑。SGML和HTML之间,XML和HTML之间的差异是巨大的,HTML能够看做是SGML/XML的一种具体应用,SGML/XML则做为元语言,则能够定义出无数新的标记语言。SGML和XML之间的差异则是微小的,XML做为SGML的子集,继承了SGML的扩展性、结构化和有效性。