6 Basic HTML - Datentypen

Dieser Abschnitt beschreibt die wichtigsten Spezifikationen der verschiedenen Arten von Daten, die Content-Element oder Attributwert sein kann.

Einführende Informationen über die HTML - DTD zu lesen, zu sehen. Abschnitt auf SGML Führung .

6.1 Informationen über das Register

Jedes Attribut Definition enthält Informationen zu den Riegeln seiner Werte. Informationen über das Register durch die folgenden Tasten dargestellt:

CS
Der Wert ist case-sensitive (dh Benutzerprogramme für unterschiedliche Interpretationen von "a" und "A").
CI
Der Wert ist nicht case-sensitive (dh interpretieren Benutzeragenten die gleiche "a" und "A").
CN
Der Wert ist nicht abhängig, zum Beispiel, weil es sich um eine Zahl oder ein Zeichen aus dem Dokument-Zeichensatz ist.
CA
Die Definition eines Elements oder Attributs gibt Auskunft über regitsre.
CT
Weitere Informationen über die Groß- und Kleinschreibung zu sehen. In der Typdefinition.

Wenn der Attributwert ist eine Liste der Schlüssel zu jedem Wert in der Liste angewendet, wenn nicht anders angegeben.

6.2 Die wichtigsten Arten von SGML

Bei der Bestimmung der Art eines Dokuments definiert die Syntax von HTML - Element Inhalt und Attributwerte unter Verwendung von Etiketten SGML (zB PCDATA, CDATA, NAME, ID, etc.). Vollständige Definitionen finden. In [ISO8879] . Hier ist eine Synthese der Schlüssel:

  • Ein CDATA - eine Folge von Zeichen aus dem Dokument - Zeichensatz, kann es Zeichen - Entitäten umfassen. Benutzerprogramme sollten Attributwerte wie folgt zu interpretieren:
    • Ersetzen Zeichenentitäten, um die Zeichen,
    • Ignorieren newline
    • Ersetzen Sie jede Wagenrücklauf oder Tab mit einem einzigen Raum.

    Benutzerprogramme können Leerzeichen am Anfang ignorieren und am Ende CDATA Attributwerte (zum Beispiel "myval" interpretiert als "myval"). Autoren sollten keine Attributwerte mit Leerzeichen am Anfang oder am Ende erklären.

    In einigen HTML 4.0 Attribute mit CDATA-Attributwerte von der Spezifikation über die Menge der zulässigen Werte von Attributen weiteren Beschränkungen auferlegt, die nicht in der DTD ausgedrückt.

    Obwohl Elemente STYLE und SCRIPT CDATA für ihre Datenmodell verwenden, für diese Elemente sollten Benutzer CDATA behandeln unterschiedlich . Markup und Organisationen müssen als Text betrachtet werden und an die Anwendung übergeben, wie ist. Das erste Auftreten von Zeichenfolge "</" (End-Tag öffnet den Separator) wird als das Ende der Inhalt eines Elements zu sein. Die gültigen Dokumente, würde dies das Ende-Tag für das Element sein.

  • Stichworte ID und Name muss mit einem Buchstaben beginnen ([A-Za-z] ), für die von einer beliebigen Anzahl von Buchstaben gefolgt werden kann, Ziffern ([0-9]), Bindestriche ( "-"), Unterstreichungen ( "_") , Doppelpunkt ( ":") und Punkte ( ".").
  • IDREF und IDREFS - ist ein Hinweis auf dem Etikett ID, bestimmte andere Attribute. IDREF - ein einzelnes Etikett und IDREFS -separated durch Leerzeichen getrennte Liste von Etiketten.
  • Stichworte NUMBER muss mindestens eine Ziffer enthalten ([0-9]).

6.3 Text - Strings

Eine Anzahl von Attributen ( % der Text, in der DTD) nehmen Text, die von Menschen gelesen werden soll. Einführende Informationen zu Attributen können Sie live in der Diskussion von Attributen .

6.4 die URI

In dieser Beschreibung wird der Begriff URI definiert , die in [URI] (siehe. Auch [RFC1630] ).

Denken Sie daran , dass die URI URL enthält (wie definiert [RFC1738] und [RFC1808] ).

Relative URI aufgelöst auf den vollständigen URI den Haupt URI. [RFC1808] , Abschnitt 3, die den normativen Algorithmus für diesen Prozess definiert. Lesen Sie mehr über die Grund URI cm. Unter dem Haupt URI im Kapitel über die Links .

URI repräsentiert in der DTD Kombination von Zeichen % URI; .

URI überhaupt empfindlich. Es kann der URI oder einen Teil der URI sein, wobei in diesem Fall keine Rolle spielt (zB Maschinennamen), aber sie identifizieren kann schwierig sein. Anwender sollten immer davon ausgehen, dass die URI-empfindlich (nicht zu verwechseln).

Für Informationen über Zeichen, Nicht-ASCII - Zeichen in URI - Attributwerte finden. Im Anhang.

6.5 Farben

Der Wert der Attributtyp "Farbe" ( % der Farbe; ) bezieht sich auf Farbdefinitionen angegeben , wie in [SRGB] . Der Farbwert kann eine hexadezimale Zahl sein (durch eine Raute vorangestellt) oder eine der folgenden sechzehn Farbnamen. Die Farbnamen sind Groß- und Kleinschreibung.

Die Farbnamen und die RGB - Werte
Schwarz = "# 000000" Grün = "# 008000"
Silber = "# C0C0C0" Lime = # 00FF00 "
Grau = "# 808080" Olive = "# 808000"
Weiß = "# FFFFFF" Yellow = "# FFFF00"
Maroon = "# 800000" Navy = # 000080 "
Rot = "# FF0000" Blau = "# 0000FF"
Lila = "# 800080" Teal = "# 008080"
Fuchsia = "# FF00FF" Aqua = "# 00FFFF"

Das heißt, der Wert von "# 800080" und "Purple", die beide bedeuten Magenta.

6.5.1 Hinweise zu Farben

Obwohl Farben wichtige Informationen in dem Dokument hinzufügen können, und die Lesbarkeit zu verbessern, indem Farben verwenden, halten Sie die folgenden Richtlinien beachten:

  • Die Verwendung von HTML - Elemente und Attribute für Farbe spezifiziert ist unerwünscht . Verwenden Sie stattdessen ein Stylesheet .
  • Nicht Farbkombinationen verwenden, die Probleme für die Benutzer führen.
  • Wenn Sie ein Bild als Hintergrund verwenden oder die Hintergrundfarbe, vergessen Sie nicht, immer und Textfarben.
  • Die Farben in den Elementen der angegebenen BODY und FONT und bgcolor in den unterschiedlich auf verschiedenen Plattformen gebügelt Tabellen (Workstations, Mac, Windows und auf dem LCD - Panel und CRT), so zählen nicht auf einen bestimmten Effekt. In Zukunft Unterstützung für Farbmodelle [SRGB] , zusammen mit ICC - Farbprofile sollten diese Probleme zu beseitigen.
  • Wenn möglich, eine gemeinsame Vereinbarung vor.

6.6 Länge

HTML definiert drei Arten von Attributen für die Längen:

  1. Pixel : Der Wert ( % der Pixel, in der DTD) - eine ganze Zahl, die die Anzahl der Pixel (auf dem Bildschirm, auf Papier). Somit zeigt der Wert "50" fünfzig Pixel. Für normative Informationen über die Definition des Pixels cm. In [CSS1] .
  2. Länge : Wert ( % Länge, in DTD) kann% Pixel; oder der Anteil der vertikalen oder horizontalen Abstände Prozentsatz. So bedeutet der Wert "50%" die Hälfte verfügbaren Speicherplatz.
  3. MultiDlina : Wert ( % MultiLength; in DTD) kann% Länge; oder eine relative Länge . Die relative Länge ist in der Form "i *", wobei "i" - integer. Die Zuordnung der Raum zwischen den Elementen für diesen Raum konkurrieren, Benutzeragenten zuordnen zuerst einen Platz für die Länge in Pixel und Prozentsätze angegeben, und dann den verbleibenden Platz zwischen den relativen Längen teilen. Jeder Teil wird die relative Länge des verfügbaren Raums proportional integer vorhergehenden '*'. Der Wert von "*" ist gleichbedeutend mit "1 *". Wenn es also 60 Pixel Platz nach dem User-Agent sind, vergibt Platz für die bestimmten Längen in Pixel und Prozentsätze und konkurrierenden relativen Längen sind 1 *, 2 * und 3 *, 1 * erhält 10 Punkte, 2 * - 20 Pixel und 3 * - 30 Pixel.

Wert Längen muss nicht beachtet werden.

6.7 Inhaltstypen (MIME - Typen)

Hinweis. "Medientyp" (wie definiert [RFC2045] und [RFC2046] ) spezifiziert die Art der verknüpften Ressource. Diese Beschreibung verwendet den Begriff "Inhaltstyp" anstelle von "Medientyp" in Übereinstimmung mit seiner Verwendung. Darüber hinaus wird in dieser Beschreibung "Medientyp" zu verweisen die Medien, auf denen der User - Agent ein Dokument erzeugt.

Dieser Typ wird in einer DTD mit der dargestellten % Content;.

Inhaltstypen sind Groß- und Kleinschreibung.

Beispiele für Inhaltstypen umfassen "text / html", "image / jpeg", "image / gif", "video / mpeg", "audio / basic", "text / tcl", "text / javascript" und "text / vbscript ". Die aktuelle Liste der registrierten MIME - Typen finden. In [MIMETYPES].

Hinweis. Inhaltstyp "text / css" , auch wenn es nicht mit der IANA registriert ist, sollte verwendet werden , wenn die Elemente verbindet , ist ein Stylesheet [CSS1] .

6.8 Sprachcodes

Attributwerte, die Art , von denen der Sprachcode ( % Language in der DTD), bezieht sich auf einen Sprachcode wie angegeben in [RFC1766] , Abschnitt 2. Weitere Informationen zu Sprachcodes in HTML angeben, finden. In der Rubrik Codes Sprache . Die Codesprache Lücken sind nicht akzeptabel.

Die Sprachcodes sind case-sensitive.

6.9 Zeichenkodierung

Attribute "die charset" ( % Charset in der DTD) beziehen sich auf eine Zeichencodierung wie in der beschriebenen Zeichencodierung . Die Werte müssen von der IANA Registrierungszeichenfolgen (zB "euc-jp") (siehe die vollständige Liste. In [charsets] ).

Die Namen der Zeichenkodierungen sind Groß- und Kleinschreibung.

Benutzerprogramme die Zeichenkodierung der externen Ressource zu bestimmen , müssen die Schritte in Abschnitt ausführen Angabe von Zeichenkodierungen .

6.10 Einzelne Symbole

Bestimmte Attribute nennen ein einzelnes Zeichen aus dem Dokument - Zeichensatz . Diese Attribute sind vom Typ Zeichen% in der DTD.

Einzelne Zeichen können mit angegeben werden Zeichenreferenzen (zB "& amp;").

6.11 Datum und Uhrzeit

[ISO8601] erlaubt viele Optionen Vorlage Datum und Uhrzeit. Die aktuelle Spezifikation verwendet eines der Formate im Profil beschrieben [DATETIME-] für den zulässigen Zeichenketten Datum / Zeit (Bestimmung % für Datum und Uhrzeit in der DTD).

Dies ist das Format:

  YYYY-MM-DDThh: mm: ssUChP
wobei:
  YYYY = Jahr der vierstelligen
  MM = zweistelligen Monat (01 = Januar, etc.)
  DD = Tag der zweistellige Zahl (01-31)
  hh = zweistellige Stunde (00-23) (bis / pm NICHT erlaubt)
  mm = zweistellige Minute (00 - 59) an
  ss = zweistellige Sekunde (00 - 59) an
  MVA = Zeiger auf die Zeitzone,

Zeiger Zeitzone:

Z
Es gibt UTC (Coordinated gemeinsame Zeit). "Z" sollte in Großbuchstaben sein.
+ Hh: mm
Es zeigt an, dass die lokale Zeit in hh Stunden und mm Minuten vor UTC getrennt ist.
-CHCH: mm
Es zeigt an, dass die lokale Zeitverzögerungen von hh Stunden und mm Minuten von UTC.

Diese Komponenten müssen vorhanden genau sein, mit der exakt gleichen Zeichensetzung. Denken Sie daran , dass der Buchstabe "T" erscheint buchstäblich in der Zeichenfolge (es muss groß geschrieben werden), den Beginn der Zeit , um anzuzeigen, wie beschrieben in [ISO8601]

Wenn eine Anwendung die Erzeugungszeit innerhalb einer Sekunde kennt, kann Sekunden für den Wert "00" verwendet werden (auch für Minuten und Stunden, falls erforderlich).

Hinweis. [DATETIME-] gilt nicht für zusätzliche Sekunden.

6.12 Arten von Links

Autoren können die folgenden anerkannten verwenden Link - Typen, die hier aufgeführt mit den herkömmlichen Interpretationen. In der DTD % Linktypes ist eine Liste der Verbindungstypen, durch Leerzeichen getrennt. Symbole Lücken in den Typen von Verbindungen sind nicht erlaubt.

Diese Arten von Links sind nicht case sensitive, das heißt, "Alternate" bedeutet dasselbe wie "alternate".

Benutzerprogramme, Suchmaschinen, usw. können diese Verbindungstypen auf verschiedene Weise interpretieren. Zum Beispiel können User Agents Zugriff auf verknüpfte Dokumente über die Navigationsleiste zur Verfügung stellen.

wechseln
Bezeichnet alternative Versionen eines Dokuments, in dem der Link befindet. Zusammen mit dem Attribut lang bedeutet , die übersetzte Version des Dokuments. Zusammen mit den Attribut media gibt die Version für andere Medien erstellt.
Stylesheet
Identifiziert ein externes Stylesheet. Siehe. Abschnitt auf externen Stylesheets . Zusammen mit der Verbindungsart "Alternate" für Benutzer wählbare Stylesheets.
Start
Es gibt das erste Dokument in der Menge. Dieser Link Typ sagt Suchmaschinen über das, was der Autor den Anfang des Dokuments Satz berücksichtigt.
nächste
Zeigt das nächste Dokument in einer linearen Abfolge von Dokumenten. Benutzerprogramme können das Dokument "next" vorladen Ladezeit zu reduzieren.
Zurück
Zeigt das vorherige Dokument in einer geordneten Reihe von Dokumenten. Einige Benutzeragenten unterstützen auch das Synonym "Zurück".
Inhalt
Er bezieht sich auf ein Dokument dient Inhalt. Einige Benutzer unterstützen auch das Synonym ToC (von "Table of Contents").
Index
Er bezieht sich auf ein Dokument, das ein Zeiger auf das aktuelle Dokument ist.
Glossar
Er bezieht sich auf ein Dokument - ein Glossar mit Begriffen auf das aktuelle Dokument zusammen.
Copyright
Zeigt einen Copyright-Vermerk für das aktuelle Dokument.
Kapitel
Er bezieht sich auf ein Dokument, das ein Kapitel in einer Sammlung von Dokumenten ist.
Abschnitt
Er bezieht sich auf ein Dokument, das einen Abschnitt in einer Sammlung von Dokumenten ist.
Unterabschnitt
Er bezieht sich auf ein Dokument, das ein Unterabschnitt in einer Sammlung von Dokumenten ist.
Anhang
Verweist auf ein Dokument ist ein Anhang in einer Sammlung von Dokumenten.
Hilfe
Er bezieht sich auf ein Dokument, das das Zertifikat enthält (weitere Informationen, Links zu anderen Informationsquellen, etc.)
Lesezeichen
Zeigt ein Lesezeichen. Lesezeichen - ein Verweis auf einen Schlüsselpunkt im erweiterten Dokument. Das Attribut Titel kann verwendet werden, zum Beispiel, um das Lesezeichen zu beschriften. Denken Sie daran, dass Sie in jedem Dokument mehrere Lesezeichen definieren können.

Autoren können definieren zusätzliche Verbindungstypen nicht in dieser Beschreibung beschrieben. Zur gleichen Zeit müssen sie nutzen das Profil der Konventionen zu spezifizieren verwendet , um die Arten von Links bestimmen. Siehe. Attribut Profilelement von HEAD .

Für weitere Diskussion siehe Linktypen. Siehe Referenzen in HTML - Dokumenten .

6.13 Griffe Medien

Im Folgenden finden Sie eine Liste der anerkannten Medien - Deskriptoren ( % MediaDesc in der DTD).

Bildschirm
Entwickelt für Computerbildschirme, nicht in Seiten unterteilt.
tty
Gestaltet einem festen Raster für die Zeichen zu unterstützen, wie zum Beispiel Fernschreiber, Terminals oder tragbare Geräte mit begrenzten Anzeigefähigkeiten.
Fernseher
Vorgesehen für TV-ähnliche Geräte (niedrige Auflösung, Farbe, limitierte scrollbaren).
Projektion
Vorgesehen für Projektoren.
Hand
Vorgesehen für Handheld-Geräte (kleiner Bildschirm, Monochrom, Bitmap-Grafiken, begrenzte Reichweite).
drucken
Vorgesehen für ausgelagerte, undurchsichtiges Material und auf dem Bildschirm angezeigten Dokumente in der Druckvorschau-Modus.
Blindenschrift
Entwickelt für die taktile Geräte mit Alphabet Broglie.
aural
Vorgesehen für Sprach-Synthesizer.
alle
Für alle Geräte.

neue Werte und erlaubt parametrisierte Werte können in zukünftigen Versionen von HTML eingebunden werden. Zur Vereinfachung soll die Verwaltung dieser Erweiterungen Spezifikation Benutzeragenten entsprechend der Lage sein , das zu analysieren Wert des Attributs Medien wie folgt:

  1. Value - eine durch Kommata getrennte Liste von Elementen. Zum Beispiel
     media = "screen, 3D-Brillen, Druck und Auflösung> 90dpi"
    

    Es erscheint in:

     "Screen"
     "3d-glasses"
     "Druck und Auflösung> 90dpi"
    
  2. Jedes Element wird abgeschnitten, bevor der erste nicht-Buchstaben-US ASCII-Kodierung [a-zA-Z] (dezimal Unicode 65-90 Codes 97-122), die Abbildung [0-9] (Hexadezimal-Codes Unicode 30-39) oder Bindestrich (45). In diesem Beispiel stellt sich heraus:
     "Screen"
     "3d-glasses"
     "Drucken"
    
  3. Dann empfindlich durchgeführt Versöhnung mit einer Reihe von spezifischen Deskriptoren oben genannten Typen. Benutzerprogramme können die unterschiedlichen Elemente ignorieren. In diesem Beispiel wird es nur Elemente von Druck und Bildschirm sein.

Hinweis. Stylesheets können Variationen enthalten , je nach dem Träger (beispielsweise @media CSS - Konstrukt). Es macht Sinn , die "In solchen Fällen ist die zu verwenden Medien = alle".

6.14 Diese Szenarien

Script - Daten ( % der Script, in der DTD ) kann der Inhalt des Elements SCRIPT und der Wert der intrinsischen Ereignisattribute . Benutzerprogramme müssen nicht Skriptdaten im Markup HTML bewerten, aber die Daten zu den Kern Szenarien passieren muss.

Accounting - Register in der Skriptdaten ist abhängig von der Skriptsprache.

Denken Sie daran , dass die Skriptdaten , die Elementinhalt ist nicht enthalten Zeichenreferenzen , aber Skriptdaten ist ein Attributwert sein kann. Der Anhang enthält Informationen über die Daten spezifizieren andere als die HTML - Daten .

6.15 Diese Stylesheets

Diese Stylesheets ( % der Stylesheet, in der DTD ) kann der Inhalt des Elements STYLE und Wertattribut Stil . Benutzerprogramme müssen nicht Style-Daten im Layout HTML auszuwerten.

Accounting - Register von Style - Daten ist abhängig von der Stylesheet - Sprache.

Denken Sie daran , dass diese Stylesheet , das Element Inhalt ist nicht enthalten Zeichenreferenzen , aber Stylesheet Daten ist der Wert eines Attributs kann sie enthalten. Im Anhang finden Sie weitere Informationen über die Daten spezifizieren andere als die HTML - Daten .

6.16 Ziel Frame - Namen

Mit Ausnahme der reservierten Namen unten aufgeführten Ziel - Frame - Namen ( % Frametarget, in der DTD) müssen mit einem Buchstaben beginnen (a-zA-Z). Benutzerprogramme sollten alle anderen Namen ignorieren.

Folgende Zielnamen sind reserviert und haben eine besondere Bedeutung.

_blank
Benutzerprogramme müssen das Dokument in einem neuen Fenster herunterladen, ohne einen Namen.
_self
Benutzerprogramme müssen das Dokument in dem gleichen Rahmen herunterladen, in dem das Dokument darauf bezieht.
_parent
Benutzerprogramme müssen das Dokument in der unmittelbar übergeordneten Rahmen des Rahmens in Download ein Frameset . Dieser Wert entspricht _self, wenn der aktuelle Frame nicht das übergeordnete Rahmen.
_top
Benutzerprogramme müssen das Dokument in Vollbild herunterladen (für alle anderen Frames). Dieser Wert entspricht _self, wenn der aktuelle Frame keinen übergeordneten Rahmen hat.