Duplicate Content
Indhold
- Executive Summary — Hvorfor er Duplicate Content farligt?
- Hvad er duplicate content?
- Hvorfor er duplicate content et problem?
- Der findes forskellige typer af duplicate content
- Princippet bag duplicate content / PageRank / Plagiat
- Duplicate content vs. content scraping
- Værktøjer til at identificere duplicate content
- Googles skelnen mellem to grundlægende forskellige typer af duplicate content
Executive Summary — Hvorfor er Duplicate Content farligt?
Internationale såvel som nationale eksperter i søgemaskineoptimering & positionering har gentagne peget på problemer med duplicate content i forbindelse med udvikling eller migrering af hjemmesider. Webbureauerne opretter underdomæner til deres eget hoveddomæne, hvorpå de publicerer og tester webløsningen, inden den ny hjemmeside overdrages i færdig stand til klienten. Google har dog været med på sidelinjen — og vurderer, at klientens hovedside — den ny hjemmeside — blot er en kopi af andres materiale. Det er svært uheldigt set fra klientens synspunkt.
Hvad er duplicate content?
Duplicate content — dublikeret el. plagieret indhold — eller indhold, der findes flere steder. Mere teknisk kan man definere duplicate content som identisk el. tilnærmelsesvist identisk indhold, der kan tilgås fra to forskellige url'er. Man kan med fordel skelne mellem site-internt duplicate content & site-eksternt duplicate content.
Hvorfor er duplicate content et problem?
- Vigtige sider vises ikke i Googles søgeresultater
- Vigtige sider ranker dårligt
- Brugere bliver forvirret over søgeresultaternes fordeling — hvis de havner på en "print-venlig side" isf. hovedsiden med navigationsbar og menustruktur
- Arkivsider vises i stedet for hovedindlægget
- Syndikeringssider crawles først og indholdet registreres og positioneres forkert. I stedet for hjemmesideejerens side vises portalen el. syndikeringssiden.
Der findes forskellige typer af duplicate content
fx
1) Hjemmesider, der er udviklet online på et testdomæne af et webbureau
2) Printvenlige sider, der er kopier af eksisterende websider
3) E-handelssider, der indeholder producentens beskrivelse af et produkt (som findes på hundrede- eller tusindevis af andre sider også)
4) Sider konkurrenter eller andre har kopieret
5) Blog-indlæg udgives under forskellige url'er
6) Sider, der indeholder for meget af den samme tekst. Fx forsøg på at udvikle specifikke landing pages, men hvor teksten er 80-90% identisk med andre sider.
7) Tekst, fx blogindlæg, der i fuld længde syndikeres videre til andre tjenester med el. uden tekstproducentens viden og/el accept
Princippet bag duplicate content / PageRank / Plagiat
PageRank-algoritmen, som Googles ranking/positionering delvist bygger på, er udviklet på baggrund af et gammel akademisk kriterium, der siger, at jo flere, der citerer et værk, desto vigtigere må værket være. I ligningen indgår desuden en kvalitetsparameter. Inden for den akademiske verden har plagiat altid været ildeset, og alvorlige tilfælde har ført til udvisning eller ophævelse af akademiske grader. Plagiat stammer fra Latin, plagiarius, kidnapper/forfører/plyndrer.
Duplicate content vs. content scraping
Et fænomen, der på overfladen kan minde om duplicate content, er content scraping. Content scraping er basalt set copy-paste af indhold fra internetsider til nye internetsider. Content scraping foregår ofte vha. automatiserede scripts eller programmer, der søger på indhold inden for et specifikt område og opbygger nye hjemmesider, ofte MFA-sider (Made-For-Adsense). Content scraping kan i værste fald påvirke originalsiden i negativ retning.
Værktøjer til at identificere duplicate content
Googles skelnen mellem to grundlægende forskellige typer af duplicate content
"Within-your-domain-duplicate-content, i.e. identical content which (often unintentionally) appears in more than one place on your site"
"Cross-domain-duplicate-content, i.e. identical content of your site which appears (again, often unintentionally) on different external sites"
Kilde Official Google Webmaster Blog
Tilbage til hovedsiden om positionering
Nøgleord: Duplicate content, duplikeret indhold, dobbeltindhold, google, pagerank, google pagerank
Konstrueret & vedligeholdt af Bergholt. Indhold på denne side og undersider er ophavsretligt beskyttet og må ikke gengives i sin helhed uden forfatterens samtykke. Fragmenter kan uden videre gengives med behørig kildeangivelse. Såfremt wiki'en citeres i et online-medie bør der linkes til den side, der citeres.





