référencement webm2multimedia.u-bourgogne.fr/master1/cwa/referencement.pdf · •période...
TRANSCRIPT
![Page 1: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/1.jpg)
RéférencementWeb
![Page 2: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/2.jpg)
1.Introduction
![Page 3: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/3.jpg)
Leréférencementnaturel
• Premiersmoteursderecherche:• Yahoo:undespremiersannuairesduWeb
• 1990:nombrecroissantdesitesWeb• Besoind’outilsderecherche
• Vers1994:lesannuaires• Yahoo:sitesdescatégories/sous-catégories
• Moteur:Webcrawler,excite,Lycos,Infoseek,…,Altavista• Lesannuaireslongtempsutilisés• Tousdisparues• Ledernier:DMOZ:2017
![Page 4: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/4.jpg)
Leréférencementnaturel
• Début90• Peudesites,peudepages• Algorithmessimples• Lenombredefoisderequêtes– apparitiondanslapage• Introductiondu« keywordstuffing »
• Google• IA• Apprentissageautomatique• Réseauxdeneurones
![Page 5: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/5.jpg)
Leréférencementnaturel
• Produitsdanslagrandedistribution• Siteindexé/référencé:BDdumoteurderecherche• Nemontrerquelespageslesplusintéressantes• Positionenfonctiondesmotscléslesplusintéressants• Estcequelepositionnementaportésesfruits?
![Page 6: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/6.jpg)
Commentfonctionnelemoteurderecherche?• Semblesimplemaistrèscomplexeenréalité• Maitriserlefonctionnementdumoteurderecherchepourbienréférenceretoptimiservotresite• Lemoteurderechercheparcourtlesiteetindexelespages• Constitutiond’unebasededonnéesindex• Traitementderequêtesetinterrogationdel’index• Restitutiondesrésultats(SERP)• Liensorganiques(naturels)• Lienscommerciaux
![Page 7: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/7.jpg)
Technologiesdesmoteursderecherche
• Principaux:GoogleetMicrosoft• France:Qwant (Bing)etOrange/voilà• Technologiesderechercheparlesportailsderecherchefrancophones(2018)
Technologiesderecherche Google Yahoo Bing OrangeGoogle XYahoo XBing XOrange XQwant XFree XSFR/Alice XBouygues X
![Page 8: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/8.jpg)
Technologiesderechercheparlesportailsderechercheanglophones(2018)
Technologiesdesmoteursderecherche
Technologiesderecherche Google Yahoo BingGoogle XYahoo XBing XMSN XFacebook XAOL X
![Page 9: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/9.jpg)
Fonctionnementdesmoteursderecherche
Fonctionnement des outils de rechercheCHAPITRE 2 27
Principe de fonctionnement d’un moteur de recherchePlusieurs étapes sont nécessaires pour le bon fonctionnement d’un moteur de recherche : dansun premier temps, des robots explorent le Web de lien en lien et récupèrent des informations(phase de crawl). Ces informations sont ensuite indexées par des moteurs d’indexation, lestermes répertoriés enrichissant un index – une base de données des mots contenus dansles pages – régulièrement mis à jour. Enfin, une interface de recherche permet de restituerdes résultats aux utilisateurs en les classant par ordre de pertinence (phase de ranking).
Tableau 2-2 Technologies de recherche utilisées par les principaux portails de recherche anglophones en 2009
Sites web Google Yahoo! Bing Exalead Ask.com
Google X
Yahoo! X (2009) X (> 2009)
Bing X
MSN X
AllTheWeb X (2009) X ? (> 2009)
AltaVista X (2009) X ? (> 2009)
Ask.com X ? (> 2009) X
Exalead X
Hotbot X (2009) X
Mise à jourLes données de ce tableau, valables à la fin 2009, peuvent fluctuer en fonction des contrats signésd’une année sur l’autre. Une mise à jour de ces informations est disponible à l’adresse suivante :http://docs.abondance.com/portails.html.
Technologies de recherche
Figure 2-1
Les différentes étapes du fonctionnement des moteurs de recherche
Requête
Résultat
![Page 10: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/10.jpg)
Lesspiders
• Robots,crawlers,agentsoubots• VisitentenpermanencelespagesWeb(lesliens)• Prennentencomptelesmodifications• LitlespageswebetstockentlecontenusurleDDdumoteur
• Détecterlesliensetidentifierdenouvellespages
• Googlebot /Bingbot• Robots.txt etbalisemeta« robots »utilisésparleswebmasters
Ref :It-connect
![Page 11: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/11.jpg)
Lesspiders
• Vérifies’ilconnaîtlapage,silaversionestplusrécente• Oui:supprimel’ancienneetsauvegardelanouvelleetl’indexestmisàjour
• Datededernièremodification• Latailledelapage• Tauxdemodificationducodehtml• Leszonesmodifiées(ex:lien)• Lespiderdoitdétecterunevraiemodification
![Page 12: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/12.jpg)
Lesspiders
• Période« GoogleDance »:Miseàjourdesindexs mensuelle• Aujourd'hui:encontinu
• Visitentpluslespagesquichangentsouventlecontenu(ex:sited’actualité)• Moinslespagesstatiques
• Affichagedegoogle deladateetl’heured’indexation• Suividesliensparlesspiders:
• Indexationdepagesorphelines• Liensnonprisencompteparlesmoteursderecherche
• Fichierslogs:historiquedeconnexionsetspiders• Outils:RobotStats,Watussi,Botify,OnCrawl
![Page 13: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/13.jpg)
BudgetCrawletindexation
• RessourcesallouéesaucrawldusiteWeb:• Lesperformancesduserveur• Laprofondeurdansl’arborescence• Laqualitéducontenu• LepageRank
• Indexation• Limitedelacapacitéd’indexation• <100liens• Aujourd’hui:pasdelimite
![Page 14: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/14.jpg)
Indexation
• Indexprincipal(corpus)• Indexinversé(termesclés)• Traitementd’unerequêtedanslemoteurderecherche
• 2017:Googlecrawle20milliardsdesitesWebparjour
![Page 15: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/15.jpg)
Systèmederanking
• Algorithmespourleclassement• Pertinence• Positiondumotdanslapage• Poids• Similaritéaveclarequête• Distanceentrelesmots
• Popularité• Comportementutilisateur• Clustering
![Page 16: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/16.jpg)
FonctionnementdeGoogle
• Serveurd'url.• explorateur(crawler).• Serveurdestockage.• Indexeur.• Solveurd'url.• chercheur(searcher).• Pagerank.• Repository.• Lexique.• Ancre• lexique
is work which can get results by post-processing the results of existing commercial search engines, or produce small scale “individualized’ search engines. Finally, there has been a lot of research on informa- tion retrieval systems. especially on well controlled collections [ 111.
However. work on information retrieval has mostly been on fairly small. well controlled col- lections such as the Text Retrieval Conference [lo]. Things that work well on TREC often do not produce good results on the Web. For example, the standard vector space model tries to return the document that most closely approximates the query, given that both query and document are vectors defined by their word occurrence. On the Web, this strategy often returns very short documents that are the query plus a few words. For example. we have seen a major search engine return a page containing only “Bill Clinton Sucks” and picture from a “Bill Clinton” query. Given examples like these, we believe that the standard information retrieval work needs to be extended to deal effectively with the Web.
The Web is a vast collection of completely uncon- trolled heterogeneous documents. Documents vary significantly in language, format, and style. There can be many orders of magnitude of difference in two documents’ size, quality, popularity, and trust- worthiness. All of these are significant challenges to effective searching on the Web. They are somewhat mediated by the availability of auxiliary data such as hyperlinks and formatting and Google tries to take advantage of both of these.
4. System anatomy
In this section, we will give a high level overview of how the whole system works as pictured in Fig. 1. Further sections will discuss the applications and data structures not mentioned in this section. Most of Google is implemented in C or C++ for efficiency and can run in either Solaris or Linux.
In Google, the Web crawling (downloading of Web pages) is done by several distributed crawlers. There is a URLserver that sends lists of URLs to be fetched to the crawlers. The Web pages that are
Fig I High level Goo$le architecture
fetched are then sent to the storeserver. The store- server then compresses and stores the Web pages into a repository. Every Web page has an associated 1D number called a docID which is assigned whenever a new URL is parsed out of a Web page. The in- dexing function is performed by the indexer and the sorter. The indexer performs a number of functions. It reads the repository, uncompresses the documents. and parses them. Each document is converted into a set of word occurrences called hits. The hits record the word, position in document, an approximation of font size, and capitalization. The indexer distributes these hits into a set of “barrels”, creating a partially sorted forward index. The indexer performs another important function. It parses out all the links in every Web page and stores important information about them in an anchors tile. This file contains enough in- formation to determine where each link points from and to. and the text of the link.
The URLresolver reads the anchors tile and con- verts relative URLs into absolute URLs and in turn into doclDs. It puts the anchor text into the forward index, associated with the docfD that the anchor points to. It also generates a database of links which are pairs of docIDs. The links database is used to compute PageRanks for all the documents.
![Page 17: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/17.jpg)
FonctionnementdeGoogle
• Leserveurd’URL:envoieauxcrawlers lesadressesquidoiventêtrevisitées• Serveurdestockage:– Compressiondespages– Sauvegardedanslerepository – NouvellepageassociéeàundocID.• Indexeur:– Lecturedanslarepository.– Décompressiondesdocuments.– Parsing despages.– Conversiondespagesen«hitlist »(listed'occurences).– Distributiondes«hits»dansles«barrels»defaçonpartiellementtriée.– Parsing desurletenvoiedesinformationsdanslesancres.– Créationdulexique.• Gestionnaired’ancres:stockecertainesinformationscrééesparl’indexeur(leslienshypertextesetlesancres)
![Page 18: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/18.jpg)
FonctionnementdeGoogle
• Legestionnairedeliens:contientdespairesdedocID• PageRankrécupèrelesinformationsdecetteBDetcalculel’indicedepopularité• Letrieur:docID ->WordID.Créationdel’indexinversé• Comparaisondesmotsdutrieuravecceuxdulexique.Ajoutdenouveauxmots• Interfacerecherche:répondauxrequêtesutilisateurs.Elleutiliselelexique,l’indexinversé,lesadressesURLs associéesetlepageRank.
![Page 19: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/19.jpg)
2.Audébutduréférencement
![Page 20: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/20.jpg)
Méthode
1. Choixdesmotsclés2. Choixdesmoteursàprendreencompte3. Création/modificationdespagesenfonctionde1et24. Vérificationdelapriseencomptedespagesparlemoteurde
recherche5. Positionnement6. Améliorationdurésultat
![Page 21: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/21.jpg)
Choixdesmotsclés
• Choisirlesbonsmotsclés• Etapetrèsimportante• L’intérêt:souventsaisisparlesutilisateurs• Lafaisabilité:positionnementrapide
• Longtail :Lesrequêteslonguessontd’actualité
![Page 22: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/22.jpg)
Trouverlesmotsclés
• L’intuition• Lesbasesdedonnées:SEMRush,Wordtracker,KeywordDiscovry :termessouventdemandés
• Motsclésàpartirdestermesdedépart• Lesgénérateursdemotsclés• Demanderàsonentourage• Utilisationdesmoteursderecherche• Related searches• Consultationdesbalisesmeta dessitesconcurrents• Fautedefrappe• Autocomplétion
• Correctiondesrequêtes• Lesrequêtescomposés
![Page 23: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/23.jpg)
Fautesdefrappe
• Identifierlesfautesdefrappe• Générateursdemotsclés• L’analysedesmotscléssurlesite• Googlesuggest• Demanderàl’entourage• Outil:générateurdefautedefrappe
• Référencersonsite• Insérerdespages• URLetattributsalt• Mettredesfautesdanssespages• Nepascacherdanslespages
![Page 24: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/24.jpg)
Choixdesmotsclés
• Unelistede10motsclés• KeywordPlanner :Google• Etudiezlalistedesmotsproposésparl’outil• Classerparnombrederecherches• Supprimerlesexpressionsquinevousintéressentpas• Etablirdesfourchettesdenotes• Prendreencomptelepotentieletlafaisabilité
![Page 25: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/25.jpg)
Référencementetmoteursderecherche
![Page 26: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/26.jpg)
3.Référencement« Inpage »
![Page 27: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/27.jpg)
Critèresinpage
• Comprendrelefonctionnementdesspiders• Commentgoogle voitlesite(cache)• UtiliserlenavigateurLynx(queletexte)
![Page 28: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/28.jpg)
Critèresinpage
• Balisetitle• Critèreinpagetrés important• Unebalise<title>pourtouteslespages• Unsujetprécisparpage
• Balisehn• PourattribuerunpoidsauxpagesWebpourunerequête• Zonesstratégiques• Menudenavigationpourcomprendrelastructuredusite(danslapaged’accueil)• Pasdanslefooter/header/nav (dansunepagecontenu)• Choisirlesmotscléspourunebalisehn• Onpeutl’utiliserpouruneimage,alt seraprisencompte:nepasabuser!
![Page 29: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/29.jpg)
Critèresinpage
• Lamiseengras• Balise<strong>• Lemettredanslecss neserapasprisencompteparlemoteurderecherche
• Lesliensinternes• Pourlapage• Pourlapagepointée
• Lesbalisesmeta• Dublincore n’apasd’intérêt• Metadescription:repriseparlemoteurderecherchesinonunextraitdelapage(doitêtreassezlongetcohérent)
• Metakeywords:quelemoteurbingsemblel’utiliser• New_keywords :PrisencompteparGoogleactualitédepuis2012
![Page 30: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/30.jpg)
Critèresinpage
• Attributsalt ettitle desimagesetdesliens• Altdeimg pargoogle pasbing• Title niar google,niparbing
• Nomdedomaine• Avoirsonproprenomdedomaine• En2012google aplacéunfiltredenettoyage«EMD »ExactMatchDomain• Quelnomdedomaineutiliser?• Quelhébergeur?• GoogleprendencomptelesdistancesdesadressesIP:liensentrelesdocuments• L’anciennetédudomaineestimportante
![Page 31: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/31.jpg)
Critèresinpage
• Nomscomposés?• Tiretplutôtquecollerlesmots
• Nomdedomaine?• Motsclésounomdel’entreprise
• Communiquersurunseulnomdedomaine• Référencementinternational:• Plusieurssolutions:unnomdedomaineparpays,unsous-domaineparpays,unrépertoireparpays,pagesmultilingues(àéviter)
• URL:destermesclaires
![Page 32: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/32.jpg)
Contenutextuel• Réfléchirmoteurderecherche• Laqualitéducontenuestimportante• Letextevisibleestanalyséparlemoteurderecherche• Lesoccurrencesdesmotsclés:commentdoser?• 1page=1requête• Lacassen’estpasimportante• Ordreetdistancedansletexte• Unseulthèmeparpage• Plusieurslangues?• Localisationdumot?• Avoirunerequêteprincipaletunchamplexical
• Lespositionnerdansles<hn>• Balise<strong>:pasdansle<hn>:peutêtrepénaliséparlesmoteurs
![Page 33: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/33.jpg)
Contenutextuel
• Mettredesliensconnexes(ex:amazon)• Emplacementdesliens:pasloindutexte.Evitezleslien(suite,voirplus…)• Pasdelimitedenombredeliens:ilfautquecelarestelisible• Mettredesliensexternes• Untitrepaspage• Nomdusiteaudébutdelapaged’accueiletàlafindespagesinternes
![Page 34: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/34.jpg)
Critèresoffpage
• Leslienssonttrèsimportantspourlesmoteursderecherche• Lesrobotssuiventleslienspourindexer• L’attributhref doitêtre100%valide• L’ancresertdethèmedanslapage(cohérencepourunbonpositionnement)• LeGoogleBombing :multipliersurlessitessourceslarequête• PagesavecunPRimportant• EviterimagesetJS
• Insérerl’attributalt dansimg• Eviterlesliensdanslesformulaires
• Priseencomptedeslienssortants?
![Page 35: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/35.jpg)
Coconsémantique
• Stratégiedecréationdesitewebetd'arborescencequis'articuleautourde4grandesétapes• Nouveauconcept(2015) imaginéparLaurentBourrely1. Ladéfinitiondesrequêtesvisées,classéespargrandesfamilleset
besoinsdel'internaute.2. Créationd’unemindmap3. Lacréationdeliensinternesentrepagesmères,fillesetsœurs.4. L'optimisationdechacunedespages,auniveaudesbalisesetdela
contextualisation/sémantisationdesliens.
![Page 36: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/36.jpg)
PageRank
• Lesmoteurspopulairesutilisentl’indicedepopularité• Google:PageRank• Lapopularitédelapageetdespagesquipointentverselle• Lenombredeliensdanslapagepointante• Unpoidsplusfaiblepourlesliensinternes?• PRd’unepagepasd’unsite• Seulsleslienspointantverslapage• Toolbar suppriméenAvril2016• LePRnesuffitpas.Undes200critèresutiliséspargoogle :quelapopularitédelapage
![Page 37: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/37.jpg)
CalculdupageRank
• PR(A)=(1-d)+d(PR(T1)/C(T1)+...+PR(Tn)/C(Tn))
• PR(A)LesiteestreprésentéparA.• PR(Ti)àPR(Tn)estlePageRankdespagesTiàTn quipointentsurlesiteA.• C(Ti)àC(Tn)estlenombredelienssurlessitesTiàTn.
Imagewikipedia
![Page 38: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/38.jpg)
![Page 39: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/39.jpg)
Améliorersonindicedepopularité
• Ciblerdessitespopulaires• Evitezdetropéchangerdeliens:touslesliensnesontpaségauxdevantGoogle(liensdanslesfooter despages)• Deslienstriangulairesplutôtqueréciproques• Laqualitéplutôtquelaquantité• Lienspayants:formulairepourleswebmaster• Créerunechartedeliens• Suivrelesliens• L’attributnofollow
![Page 40: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/40.jpg)
TrustRank (indicedeconfiance)
![Page 41: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/41.jpg)
Référencementmultimédia
![Page 42: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/42.jpg)
Référencementdel’image
• Lenomdel’image• Leformatdel’image:gif,jpeg,png• Letextealternatif:descriptionsansaccents• Googleneprendpasencomptelongdesc (pasvalideenhtml5)
• Textedulien• Texteautourdelapage• Textedelapage
![Page 43: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/43.jpg)
Référencementdevidéo
• Commentlesmoteurstrouventlesvidéos• Spiderclassique• L’internautechargedirectementlavidéo
• Optimisationdesvidéos• Lenomdufichier• Lesmétadonnées• Lescaractéristiquestechniques• Lestags• Laréputation• Letexteautourdelavidéo
![Page 44: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/44.jpg)
Fichierpdf etword
Réussir son référencement web214
Zones reconnues par les moteurs de rechercheVoici les différentes zones que l’on peut « remplir » dans un fichier Word ou PDF etla façon dont Google et Bing les lisent ou non (notamment les « Propriétés »ou « métadonnées » que l’on peut fournir sur ces deux formats pour mieux décrire lesdocuments).
* Nous avons trouvé quelques cas isolés où Bing lisait la balise <title> du documentmais la plupart du temps, ce n’était pas le cas... Notons également que ces donnéespeuvent changer suite à l’accord entre Microsoft et Yahoo! (juillet 2009).
La situation est donc, ici, assez simple en termes de lecture des contenus et des métadonnéespar ces deux moteurs majeurs :
• Les deux moteurs lisent les contenus textuels des deux formes de fichiers.
Tableau 6-1 Champs pris en compte par Google et Bing pour des fichiers PDF
Google Bing
Contenu textuel OUI OUI
Métadonnée Titre (Title) OUI NON
Métadonnée Sujet (Subject) NON NON
Métadonnée Auteur (Author) NON NON
Métadonnée Mots-clés (Keywords) NON NON
URL OUI OUI
Tableau 6-2 Champs pris en compte par Google et Bing pour des fichiers Word
Google Bing
Contenu textuel OUI OUI
Métadonnée Titre (Title) OUI NON*
Métadonnée Sujet (Subject) NON NON
Métadonnée Manager NON NON
Métadonnée Auteur (Author) NON NON
Métadonnée Compagnie NON NON
Métadonnée Category NON NON
Métadonnée Mots-clés (Keywords) NON NON
Métadonnée Commentaires (Comments)
NON NON
URL OUI OUI
![Page 45: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/45.jpg)
SMOSocialMediaOptimisation
![Page 46: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/46.jpg)
Réseauxsociauxpourleréférencement
• Commentprofiterdesréseauxsociauxpourleréférencement?• Inciterlesvisiteursetinternautesàdiffuserl’information• Twitter,FacebooketGoogle+:réseauxsociaux « stars »• Ilsontdesliensnofollow :invisiblespourlesmoteursderecherche
![Page 47: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/47.jpg)
Réseauxsociauxpourleréférencement
• Lesétudessebasentsurlacorrélationetnonlacausalité• Lesréseauxsociauxcommeunesourced’analyseetdedétéction depages• J’aime,followers…nesontpasprisencompte• SEO/SMOcomplémentaires
![Page 48: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/48.jpg)
Visibilitédanslesmoteursderecherche
![Page 49: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/49.jpg)
Plusdevisibilté
• Pourunepagedéjàpositionnée:• Confianceauxauteurs(jusqu’en2014affichagedel’auteur)• Richsnippets :RDFa,microdata,JSON-LD(Websémantique)• Schema.org• Knowledge Graph:combinaisondeschema.org etdeprofileGoogle+
![Page 50: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/50.jpg)
Spamsetpénalités
![Page 51: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/51.jpg)
Anepasfaire
• Lecloaking :autrecontenu• Lecontentspinning :ducontenusansledupliquer• Lescraping :récupérationdecontenu
![Page 52: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/52.jpg)
Pénalités
• Sandbox :quarantaine• Blacklist• Déclassement• Unformulairede« reconsidération »
![Page 53: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/53.jpg)
Nepasêtreréférencé
![Page 54: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/54.jpg)
• Balise<meta>• Pour empêcherlaplupartdesmoteursderecherche :• <meta name="robots"content="noindex">
• Pourn'empêcher quelesrobotsd'explorationGoogle• <meta name="googlebot"content="noindex">
• pages confidentielles• pagesenmaintenance• pagesendouble• pagesquin’ontpasd’importanceréelle
![Page 55: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/55.jpg)
![Page 56: Référencement Webm2multimedia.u-bourgogne.fr/master1/CWA/referencement.pdf · •Période «Google Dance» : Mise à jour des indexsmensuelle •Aujourd'hui : en continu •Visitent](https://reader033.vdocuments.site/reader033/viewer/2022052018/6031d3412c9dae41ac493d4f/html5/thumbnails/56.jpg)
Références
• Réussirsonréférencementweb- Edition2018-2019:StratégiesettechniquesSEO.OlivierAndrieu