Ce matin, en parcourant un site en cours de construction, je tombe sur un PDF qui ne s’ouvre pas correctement sur mon ordinateur. Ni une ni deux, je couine au PDF pourri. La source est vite trouvée et je me retrouve en ligne avec le prestataire. Après quelques minutes, il me demande « Avec quelle version d’Acrobat est-ce que tu l’ouvres ? » et moi de lui répondre, « Pas d’Acrobat, c’est « Aperçu », qui est directement intégré dans Léopard ». Il me répond que le PDF est optimisé pour la version 8 d’Acrobat et que c’est surement pour ça.
Sur le coup, ça me gène un peu de publier un truc sur internet qui nécessite une version (assez) récente d’un logiciel, le site est destiné au grand public, je sais très bien qu’ils n’auront pas tous la bonne version. Je convertis donc darre-darre le PDF rétif en version passablement vieillotte. Hop, tout le monde pourra l’ouvrir…
Tout le monde… Y compris notre ami Google !
Venons en aux faits : Google indexe les PDF au même titre d’une page web, le contenu étant souvent plus riche (et plus ciblé), il est donc plus facile de bien se placer sur un moteur avec un document PDF. Pour ce faire, quelques conseils en vrac :
- Google ne semble pas indexer les PDF dans créés une version supérieure à la 1.7 (Acrobat 7), ou du moins, je n’en ai pas trouvé.
- Le texte vectoriel, comme les images, ne peuvent pas être indexés en tant que tel. Donc sus au texte vectorisé, et on prendra soin de compléter les textes de remplacement des images.
- Comme sur une page web, les liens auront leur importance. Ils aident à structurer le document. Google indexera les ancres interne et cherchera à qualifier les liens externes (le site d’origine par exemple).
- La hiérarchie du document sera à prendre en compte : titre, sous titres et contenu bien organisé. Ce sera notamment important pour les moteurs qui présentent les mots clefs dans leur contexte.
- On prendra soin de remplir soigneusement les méta-informations (titre, description, mots clefs, auteurs, etc.)
- Afin de sécuriser l’indexation des documents, on évitera les PDF trop lourds, quitte à scinder en plusieurs chapitres les documents importants.
- Éviter d’enfouir les PDF au fond d’une arborescence, comme les pages web, plus ils seront proche de la page d’accueil, meilleur sera leur référencement.
Après ces petites recherches, je n’ai plus qu’à vérifier l’état des PDF que j’ai déjà mis en ligne… Et vous ? Vous êtes au top sur vos PDF ?
D’autres infos ici, ou là.