fuite de pagerank et robots.txt seo camp du 17 octobre 2008 philippe yonnet directeur du pôle...
TRANSCRIPT
![Page 1: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/1.jpg)
Fuite de pagerank et Fuite de pagerank et robots.txtrobots.txt
SEO Camp du 17 octobre 2008
Philippe YONNETDirecteur du pôle métiers – ApositionPrésident de l’association SEOCamp
![Page 2: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/2.jpg)
La notion de potentiel de pagerankLa notion de potentiel de pagerank
La somme de tous les PR des pages d'un site constitue le "potentiel de PR" de ce site
Ppr = PR des pages
![Page 3: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/3.jpg)
La "formule" du potentielLa "formule" du potentiel
Le potentiel de PR a été "théorisé" à partir d'un travail mathématique sur la formule du PR par des chercheurs Italiens :
"Inside Pagerank"Monica Bianchini, Marco Gori, Franco Scarselli
Université de Sienne (publié en 2005)
P = | I | + Pin + Pout - PDp
![Page 4: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/4.jpg)
La "signification" de la formuleLa "signification" de la formule
P = | I | + Pin - Pout - PDp P = Potentiel de PR total I = Potentiel "interne" du site – dépend
uniquement du nombre de pages Pin = Potentiel provenant des backlinks Pout = Potentiel perdu par les liens sortants PDp = Potentiel perdu par les pages pendantes
![Page 5: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/5.jpg)
Euh… c’est quoi une « dangling page » ?Euh… c’est quoi une « dangling page » ?
Traduction : page "ballante", "en suspens" Transposition : page cul de sac Définition : page qui ne contient aucun lien vers
d'autres pages, mais qui reçoit des liens
![Page 6: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/6.jpg)
Euh… c’est quoi une « dangling page » ?Euh… c’est quoi une « dangling page » ?
Traduction : page "ballante", "en suspens" Transposition : page cul de sac Définition : page qui ne contient aucun lien vers
d'autres pages, mais qui reçoit des liens
----------------
----------------
----------------
----------------
----------------
----------------
Page normale
Elle reçoit des liensElle reçoit des liens
Mais dispose de liens
sortants qui pointent vers
d’autres pages
Mais dispose de liens
sortants qui pointent vers
d’autres pages
Dangling page
Elle est la cible de liens entrants
Elle est la cible de liens entrants
Mais il n’y aucun lien
sortant sur la page !!
Mais il n’y aucun lien
sortant sur la page !!
![Page 7: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/7.jpg)
Y'a-t-il réellement une fuite avec les dangling Y'a-t-il réellement une fuite avec les dangling pages ? pages ?
La controverse autour de l'article initial de Page et Brin
"Dangling links" are simply links that point to any page with no outgoing links. They affect the model because it is not clear where their weight should be distributed, and there are a large number of them. Often these dangling links are simply pages that we have not downloaded yet..........Because dangling links do not affect the ranking of any other page directly, we simply remove them from the system until all the page ranks are calculated. After all the page ranks are calculated they can be added back in without affecting things significantly.“Extrait de l’article original sur le Pagerank par Brin et Page
?
![Page 8: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/8.jpg)
La réponse est OUI IL Y'A BIEN UNE FUITE !La réponse est OUI IL Y'A BIEN UNE FUITE !
Les "dangling links" sont retirés de la matrice des liens lors du calcul du pagerank. Les omettre n'a aucune influence puisque de toute façonIls ralentissent (empêchent) le calcul du PagerankLes nœuds correspondant à ces liens sont retirés pendant toute la phase des itérations pour obtenir la valeur finaleIls sont réinjectés à la finLors de la dernière itération : ils reçoivent leur pagerank définitif : une seule passe suffit
![Page 9: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/9.jpg)
Les particularités des pages bloquées par Les particularités des pages bloquées par robots.txtrobots.txt
Leur contenu peut il être crawlé ! NON
Sont elles connues du moteur ? OUI (éventuellement)
Peuvent-elles apparaître dans l'index ? OUI
Peuvent-elles avoir du PR ? OUI
(=>interview Matt Cutts par Eric Enge)
Le problème : ce sont des DANGLING PAGES
![Page 10: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/10.jpg)
Le PR de ces pages disparait dans un Le PR de ces pages disparait dans un TROU NOIRTROU NOIR
![Page 11: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/11.jpg)
Le mécanisme de la fuite de PRLe mécanisme de la fuite de PR
Mise en place d’un
robots.txt bloquant ce groupe de
pages
Mise en place d’un
robots.txt bloquant ce groupe de
pages
Les liens sortants sont inconnus
Ces pages sont devenues des
DANGLING PAGES
Les liens sortants sont inconnus
Ces pages sont devenues des
DANGLING PAGES
Ces pages ne sont plus crawlées
Par contre elles sont connues grâce aux liens
entrants qui transmettent du PR
Ces pages ne sont plus crawlées
Par contre elles sont connues grâce aux liens
entrants qui transmettent du PR
Tout le PR transmis
est perdu !ANNIHILE
Tout le PR transmis
est perdu !ANNIHILE
![Page 12: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/12.jpg)
Comment éviter de perdre bêtement du PRComment éviter de perdre bêtement du PR
1. Rechercher tous les liens internes ou externes pointant vers ces pages
2. Si une page reçoit du pagerank externe : préférer un noindex, et modifier la structure des liens de la page qu'on ne veut pas voir indexée
3. On fait disparaître les liens internes vers ces pages, ou place un attribut nofollow, ou on les masque avec un javascript
![Page 13: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/13.jpg)
Comment créer un "trou noir" engloutissant Comment créer un "trou noir" engloutissant du PR avec un robots.txtdu PR avec un robots.txt
1. On bloque l'indexation de pages avec un robots.txt
2. On ne touche pas aux liens pointant vers ces pages
3. Tout le PR transmis par ces liens est perdu pour le site !
Ex : un site contient une page avec un PR 5. Cette page contient dix liens, dont un vers une page bloquée. Le PR perdu correspond à 10% du PR transmis !
![Page 14: Fuite de pagerank et robots.txt SEO Camp du 17 octobre 2008 Philippe YONNET Directeur du pôle métiers – Aposition Président de lassociation SEOCamp](https://reader035.vdocuments.site/reader035/viewer/2022081513/551d9d7d497959293b8b4784/html5/thumbnails/14.jpg)
Quel impact espérer ?Quel impact espérer ?
Souvent : aucun (la fuite est souvent négligeable, ou concerne des pages qui n'ont pas de PR)
Parfois : important (le PR sculpting peut être complètement perturbé par le "trou noir à PR")
L'importance des "fuites" dépend de beaucoup de facteurs, chaque cas est différent.
Soit vous savez faire et voulez faire du "PR sculpting" => tenez en compte
Sinon : surtout ne vous en préoccupez pas