1.2.2. マークアップ

 SGML 文書の作成とは、DTD に定義された規則に従って、文書の要素をマークアップ(タグ付け)していくことに他なりません。近くのデパートに行って、洋服でもぬいぐるみでも、お好みのものを手に取ってみてください。それらにはタグが取り付けられているはずです。それと同じことを文書(要素)に対して行うわけです。
 もちろん、物理的なタグを取り付けるわけにはいきませんので、かわりに目印になる記号をタグとして使います。SGML では“<要素名>” という形式をタグに用います。また、タグ付けされる要素の範囲を明確にするため、終了タグを使用します。終了タグは“</要素名>” という形式であらわします。
 このように、文書をマークアップする文法を定めた言語をマークアップ言語と呼びます。マークアップ言語には、SGML(Standard Generalized Markup Language)の他に、WWWで広く利用されているHTML(HyperText Markup Language)や、近年急速に普及しつつあるXML (eXtensible Markup Language)などがあります。マークアップ文書の最大の利点は、それが私たちに取って可読であると同時に、機械(プログラム)からも論理構造の解釈が可能であるという点です。これはまた、本質的に文書の機械処理が可能であることを示しています。

SGML とHTML、XML の関係

 SGML は、DTD の文法やタグの記法を定めたものですが、実際に文書を書く際に必要となるタグの集合(ボキャブラリ)などは規定していません。つまり、特定文書のための文法は、SGML の規則を利用して別途定める必要があります。このように、ある言語の基となる言語をメタ言語といいます。また、SGML に則って定められた規則をSGML アプリケーションと呼びます。
 おそらく、みなさんもよくご存じであろうHTML は、1991年にTim Barners-Lee がWWWとともに発表、広く普及し、よく知られた言語であると同時に、最も成功したSGML アプリケーションのひとつでもあります。
 もう一方のXML もまたSGML アプリケーションのひとつです。1998年に公開され、5歳の誕生日にXML 規格の開発者ら自らが「我々は成功した」と語ったように、現在広範囲の分野において利用されている規格です。読者のみなさんもSGML よりXML の方が馴染みがあるのではないでしょうか。
 XML はHTML と異なりDTD が定められていませんので、SGML アプリケーションであると同時にメタ言語でもあります。また、DTD の代替としてRelax NG やXML Schema などがあるのも特徴のひとつです。

<<prev      next>>