SEO TAG Html : Language et direction textuelle

Il faut tout d’abord distinguer deux familles d’encodage de caractères : les “locaux” et les “internationaux”.

Les jeux de caractères locaux (dont font partie iso-8859-1 et iso-8859-15 – parfois désignés comme latin1 et latin9) sont destinés à des documents dans un seul système d’écriture (une langue ou un groupe de langue utilisant un même alphabet ou syllabaire). Au contraire, les jeux de caractères internationaux (dont fait partie l’UTF-8) sont destinés à encoder des document dans n’importe quel système d’écriture (et donc n’importe quelle langue). Ce sont des standards Unicode.

L’iso-8859-1…

  • est simple à employer (c’était souvent celui “par défaut”, c’est moins vrai aujourd’hui);
  • est le plus minimal possible (donc souvent le plus rapide);

mais…

  • implique d’utiliser des entités HTML dès que l’on souhaite insérer un caractère ne faisant pas partie des quelques 189 disponibles;
  • ne gère que les langues occidentales (latines) et est donc faiblement adaptable.

L’utf-8

  • gère la plupart des langues utilisables et est donc facilement adaptable;
  • permet de se passer de la plupart des entités html (les caractères réservés «<», «>» et «&» devront toujours être échappés en &lt; &gt; et &amp;);
  • représente «l’aboutissement» de l’encodage, il est peu probable que vous ayez à changer pour un autre suite à une évolution du site;

mais…

  • code les caractères d’une manière plus complexe (et consomme donc souvent légèrement plus de ressources).

Comment déclarer le charset ?

  1. Avec l’en-tête HTTP Content-type:
    • Via un fichier .htaccess : AddDefaultCharset UTF-8
    • En PHP : header('Content-Type: text/html;charset=UTF-8');
  2. En XML et XHTML, avec le prologue : <?xml version=”1.0″ encoding=”UTF-8″?>
  3. Grâce à la balise meta dans le code
    • En HTML5 : <meta charset="UTF-8">
    • En HTML4 : <meta http-equiv="Content-Type" content="text/html; charset=utf-8">
    • En XHTML 1.1 : <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Remarques :

ROBOTS

Directives pour les moteurs de recherche, par défaut la valeur est “all” équivalente à “index,follow” :

  • index: la page sera indexée.
  • noindex: le contraire.
  • follow: les pages liées sont prises en compte.
  • nofollow: les liens sont ignorés par le moteur.
  • noarchive: la page n’est pas mise en cache mais néammoins indexée.
  • all: toutes options positives, la valeur par défaut si la balise est omise.
  • none: aucune option positive: noindex, nofollow, noarchive.
  • noodp: si le moteur de recherche affiche une description de votre site prise dans l’annuaire Dmoz et qu’elle ne vous convient pas, vous pouvez placer cette directive (ODP, Open Directory Project = Dmoz.org).

FRAGMENT

<meta name="fragment" content="!">

Cette balise indique aux moteurs que c’est une page page Ajax et qu’il y a un contenu dynamique à indexer.

<META HTTP-EQUIV=”Content-Type” CONTENT=”text/html; charset=iso-8859-1″>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" />

Cette balise indique aux navigateurs le jeu de caractères à afficher. Le spécifier dans les en-têtes HTTP est la solution la plus efficace car le client n’a pas à parser le document pour savoir de quel encodage il s’agit.

Ces balises n’ont aucune utilité pour le référencement, elle peuvent servir à des outils spécialisés:

  • AUTHOR: le nom de l’auteur.
  • REVISIT-AFTER: ignorée par les moteurs et remplacée par les indications dans la sitemap XML.
  • KEYWORDS : mots-clés séparés par une virgule, jusqu’à 1000 caractères. N’est plus que rarement utilisé.
  • LANGUAGE: “fr”, “en”, pour un public ciblé. Obsolète.

Prenons une page entête html pour un site

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
   "http://www.w3.org/TR/html4/strict.dtd">
<HTML lang="fr">
<HEAD>
<TITLE>Un document multilingue</TITLE>
</HEAD>
<BODY>
...Interpreted as French...
<P lang="es">...Interpreted as Spanish...
<P>...Interpreted as French again...
<P>...French text interrupted by<EM lang="ja">some
         Japanese</EM>French begins here again...
</BODY>
</HTML>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
   "http://www.w3.org/TR/html4/strict.dtd">
<HTML dir="RTL">
<HEAD>
<TITLE>...a right-to-left title...</TITLE>
</HEAD>
...right-to-left text...
<P dir="ltr">...left-to-right text...</P>
<P>...right-to-left text again...</P>
</HTML>

Ressources

extradrmtech

extradrmtech

Since 30 years I work on Database Architecture and data migration protocols. I am also a consultant in Web content management solutions and medias protecting solutions. I am experienced web-developer with over 10 years developing PHP/MySQL, C#, VB.Net applications ranging from simple web sites to extensive web-based business applications. Besides my work, I like to work freelance only on some wordpress projects because it is relaxing and delightful CMS for me. When not working, I like to dance salsa and swing and to have fun with my little family.

You may also like...

Leave a Reply