Nullbeta aka HansR - online sinds 2001. Tegelijkertijd baasje en knecht van het slechtst gelezen weblog van het noordelijk halfrond. XHTML en cascading style sheet fetisjist. Parttime usability neuroot. Object oriëntatie losert. SQL wannabe. De ongekroonde koning van de ongedocumenteerde spaghetticode. Verliefd op en ziek van SEO. Vindt zijn Asics tegenwoordig vaak leuker dan zijn laptop.

Nullbeta sluit zich aan bij de woorden van Dante – All hope abandoned, he who entereth here ...

Online guerilla marketing that DOES make the kill

Null, code knagen, cms in de polder, stijlbladen, gelaagd bouwen, MySQL, php, Emmeloord, webservers, toegankelijk, document object model, zzp, organisch, puntkomma kwijt, webstandaards, uhhh zoekmachine spam? Beta. Nullbeta.

Null ...

Nul? Nee null! Uhh, wat is null?

... Beta

Adj. 1. important, of importance - of great significance or value; "important people"; "the important questions of the day"


 

Het duplicate content spook komt op bezoek

11 december 2007

ik ik heb heb de de laatste laatste tijd tijd wat wat last last gehad gehad van van een een dubbele dubbele tong tong. Ik bedoel, ik herhaal mezelf. In de zin dat Google denkt dat ik me schuldig maak aan het online zetten van duplicate content. De ironie wil dat het in dit geval niet eens bewust is gebeurd.

Een tijdje geleden heb ik een WordPress weblog geïntegreerd in één van mijn websites. Na een maandje merkte ik dat de inhoud van dit blog nauwelijks meer scoorde in de Google zoekresultaten. Nu is het sinds Google de toegevoegde resultaten / supplemental results indicatie in de SERPs heeft laten vallen niet meer met zekerheid te zeggen (of mis ik iets?), maar het lijkt er sterk op dat een deel van mijn content is verbannen naar het voorgeborgte van de internet-hel.

Vermoedelijk is WordPress verantwoordelijk voor mijn recentelijke Google SERPs spanking. Natuurlijk ben ik ervan op de hoogte dat een content management systeem (vanuit het oogpunt van zoekmachines)nogal eens gedupliceerde inhoud produceert. Wordpress is hierin absoluut niet uniek. Meerdere CMS’en maken zich schuldig aan het uitspugen van duplicate content. Ik had alleen niet gedacht dat het zo’n vaart zou lopen. Vandaar dat ik me er niet al te druk over heb gemaakt. Ik had er beter niet zo licht over kunnen denken.

Afijn, berouw komt na de zonde. Met mijn broek nog op mijn enkels en pijnlijk rode billen van big G.’s kastijding is het hoog tijd voor correctieve actie.

De beste manier om te zorgen dat ik weer een beetje ga scoren met pagina’s die nu in de Google hel branden is om de oorzaak, de ogenschijnlijke verdubbeling van inhoud, ongedaan te maken. Met andere woorden, de boosdoeners, zoals de door Wordpress gegenereerde categorie- en tag pagina’s, moeten anders worden gepresenteerd. Hoe doe je dat op een nette manier? Okay, er zijn meer wegen die naar Rome leiden. Maar ik kies ervoor om de robots metatag hiervoor te gebruiken:
<meta name=”robots” content=”noindex,follow” />
Op de website in kwestie is aan de serverkant vrij makkelijk te bepalen welke pagina opgevraagd wordt. Als het een pagina is die potentieel verantwoordelijk is voor duplicate content, zoals een blog categorie pagina of eentje met posts op basis van een tag, wordt geef ik de noindex,follow waarde mee aan de robots metatag. En anders gewoon index,follow. Het noindex stukje zorgt ervoor dat Google de inhoud van de pagina niet opneemt in haar database, follow vraagt Googlebot om de links die ze op de pagina tegenkomt gewoon te verkennen.

Oh ja, gelijk maar even van de gelegenheid gebruik maken om PageRank (ik weet het, Toolbar PageRank zegt niks, maar toch heeft niemand graag een kleintje) ietwat beter te sturen. Met andere woorden: hopsa en en huuphuuphuup barbatruc … gauw een rel=nofollow attribuut gezet op een aantal van m’n interne links die er zoekmachinetechnisch minder of niks toe doen.

Geschreven door HansR
Er is nog niet gereageerd op deze tekst.
Geplaatst in Google · Zoekmachines
Getagged als ,

Reageren:




De volgende tags kun je in je reactie gebruiken:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>


RSS feed voor reacties op deze blogpost. TrackBack URL