HTMLとは
HTML(HyperText Markup Language)は、Webサイト(ホームページ)を作成するために使う言語です。
HTMLを使う事によって、文字を強調する・文字にリンクを張る・文字を打ち消したり等が出来る様になります。
このページもHTMLを使って書かれています。
なので、文字のリンクをクリックしたら別のページに移動出来たり、文字がカラフルだったり、文字の大きさが様々だったり、といった表現が出来ているわけですね。
HTMLを記述する際は、<>で囲まれたタグ(要素)によって、そのテキストを意味付けします。
すると、インターネットエクスプローラー等のインターネットブラウザが、そのタグの意味を解釈して、画面に表示してくれます。
例えば、<strong>~</strong>で囲むと、囲まれた部分を強調させることが出来ます。
と、記述すればブラウザは「HTML(HyperText Markup Language)」の部分を太字で表示してくれます。
もともとインターネット自体が、学術的な目的で生み出された通信手段なので、この「HTML」もそもそもは、論文を記述する為のものでした。
つまり、論文中で他の論文を参照するためにリンクを張ったり、まずタイトルがあり、見出し、段落がある、という論理構造になっていたり、という仕様になっています。
HTMLの構造
HTML文書の構造は、次のようになります。

- <!DOCTYPE>でHTMLのバージョン情報を含む記述を宣言します。
- <html>~</html>で囲まれている場所がhtml文書になります。
- <head>~</head>に囲まれた部分は文書に関する情報で画面上には表示されません。
- <body>~</body>に囲まれた部分が、文書のコンテンツとなり画面上に表示されます。
HTMLの要素・属性・属性値
HTMLのタグは、開始タグで始まって終了タグで終わります。
そして、開始タグに要素・属性・属性値が含まれます。
例えば、
のうち、<p align="center">が開始タグで、</p>が終了タグです。
そして、pは「段落」を示す要素名・alignは「水平方向の配置位置」を示す属性・centerは「水平方向のセンターに配置する」という属性値となります。
上にも書いた通り、HTMLのタグは開始タグと終了タグで囲むのが基本ですが、中には、終了タグを省略できるものもあります。(pなど)
また、「改行」を意味するbrの様に内容が存在しない要素の場合、終了タグはありません。
ブロック要素とインライン要素
body内に記述される要素には、ブロック(レベル)要素とインライン要素の二つがあります。
ブロック要素は、ブラウザ上の表示で要素の前後に改行が入り、ウィンドウ内の左右いっぱいまでが範囲となります。
インライン要素は、新しい行を開始せずにその行内におさまる要素です。
基本的に、ブロック要素の中には、ブロック要素・インライン要素の両方とも入れる事が出来ますが、インライン要素の中には、インライン要素しか入れられません。
例えば、
はOKですが、
はNGです。
ブロック要素の中には、インライン要素しか入れる事が出来ないものもあります。
ブロック要素
addres、blockquote、center、div、dl、form、h1~h6、hr、ol、p、pre、table、ul
インライン要素
a、b、basefont、big、br、button、cite、code、em、font、i、iframe、img、input、kbd、q、s、samp、select、small、span、strike、strong、sub、sup、textarea、tt、u、var
推奨しないタグ・要素・属性
HTML文書を表示する際、最終的にどう表示されるかはブラウザに依存します。
なので、一時はブラウザごとにサポートしているタグが違ったり、特定のブラウザでしか使えないタグがあったりとWebページの情報が見る人によって変わってしまうという事が起こってしまいました。
そこで、ブラウザやプラットフォームの違いに関係なくWebページの情報を見る事が出来るようにする為にHTMLの標準化が進められました。
今では、W3C(World Wide Web Consortium)によって、HTMLの仕様が決められており、現在はHTML4.01の仕様が公開されています。
HTML4.01の仕様では推奨されていないタグ・要素・属性があります。
文書型定義(DTD)が厳密型(strict)の場合は推奨されていないタグ・要素・属性は使用出来ません。
推奨されていない物のほとんどは、見た目に関するタグ・要素・属性でこれらはスタイルシートで設定する事が推奨されています。
