SGML/HTML/XML のいずれにも言えることですが、マークアップ(タグ)はただそこに存在しているのではなく、文書の構造をあらわすという役目を負っています。この性質は必ずしも有効に活用されているとは言えませんが、極めて重要であることは間違いありません。
たとえば、Word で作成された論文を思い浮かべてください。300 人の学生が論文を提出し、あなたはこれらの論文すべてから文献目録を抜き出さなければなりません。都合良く抜き出しやすい形式にでもなっていればしめたものですが、あまり期待はできないでしょう。
もし、この論文がXML で記述されていたらどうでしょうか。タグ(スキーマ)の設計がいい加減だとWord で作成した場合と大差はないか、あるいは余計に手間がかかるかもしれませんが、文献目録をあらわすタグがあり、これを使用するよう注意しておきさえすれば、文献目録の抜き出しは自動で行うことができます。作業にかかるコストにどれ程の差があるかは、考えるまでもないでしょう。
これまでのワープロ文書では、単語による検索は可能であっても、文書の構造や語句の持つ属性などによる絞り込みは不可能でした。十分に検討され設計されたタグに準拠したXML 文書は、従来の単純検索に加えてこのような意味論による絞り込み検索を可能にします。
たとえば、Word で作成された論文を思い浮かべてください。300 人の学生が論文を提出し、あなたはこれらの論文すべてから文献目録を抜き出さなければなりません。都合良く抜き出しやすい形式にでもなっていればしめたものですが、あまり期待はできないでしょう。
もし、この論文がXML で記述されていたらどうでしょうか。タグ(スキーマ)の設計がいい加減だとWord で作成した場合と大差はないか、あるいは余計に手間がかかるかもしれませんが、文献目録をあらわすタグがあり、これを使用するよう注意しておきさえすれば、文献目録の抜き出しは自動で行うことができます。作業にかかるコストにどれ程の差があるかは、考えるまでもないでしょう。
これまでのワープロ文書では、単語による検索は可能であっても、文書の構造や語句の持つ属性などによる絞り込みは不可能でした。十分に検討され設計されたタグに準拠したXML 文書は、従来の単純検索に加えてこのような意味論による絞り込み検索を可能にします。