För att förstå hur Google Panda rankar webbsidor och sajter kan vi utgå från att problemet på webben inte är att det saknas bra källor till kvalitativt innehåll utan att det goda innehållet drunknar i lågkvalitativt innehåll, reklam och rent skräp.

Text: Torbjörn Sassersson

Jag utgår därför från att Googles ingenjörer vill utveckla algoritmer som lyfter upp kvalitet genom att trycka ner sidor med reklam och skräp. Det ska kosta att skräpa ner internet. Vi vet med säkerhet att Google prioriterat att eliminera sk ”content farms” från sökträffresultaten.

Google vill av naturliga skäl inte avslöja detaljerna hur algoritmerna fungerar, men två ingenjörer Matt Cutts och Amit Singhal har under året redovisat hur de tänker. De vill, för att städa upp nätet, berätta för redaktörer, bloggare och sajtägare vilka kriterier de utgår från och vad som gör att skräpiga sidor, reklam och sajter som kopierar andras innehåll blir känsliga för tex Google Panda.

Google Panda kom till Sverige runt den 24 juli 2011 och förändrade hela sökresultatkartan på svenska internet, men Amit Singhal påpekade i maj 2011:

”Some publishers have fixated on our prior Panda algorithm change, but Panda was just one of roughly 500 search improvements we expect to roll out to search this year. In fact, since we launched Panda [i USA], we’ve rolled out over a dozen additional tweaks to our ranking algorithms, and some sites have incorrectly assumed that changes in their rankings were related to Panda.”

Hur Googles algoritmer analyserar webben och rankar ner det oönskade

Sammanställningen nedan är en tolkning av vad Google avslöjat under 2011. Dessa punkter har stor betydelse för alla konsulter som arbetar med rykteshantering på webben och googlestädning och för alla sajtägare och webbredaktörer som vill få högt rankade hemsidor och nättidningar.

Google säger att de utgår från 57 signaler när algoritmerna bedömer en webbsida. Listan nedan omfattar 43 punkter.

Kvalitetsanalys: Sajter med innehåll av låg kvalitet rankas ner

  • Sajter som kopierar andra sajters innehåll. Ju mer kopierade sidor i relation till sajtens totala innehåll desto sämre.
  • Sajter med kopior av samma artiklar med små variationer i text och nyckelord rankas ner.
  • Sajter som publicerar många inkommande RSS-flöden.
  • Sajter som i hög grad internt återpublicerar eget material.
  • Sajter som tillåter andra sajter duplicerar eget innehållet.
  • Sajter med liten mängd unikt innehåll.
  • Sajter med många sidor av låg kvalitet i proportion till sidor av hög kvalitet.
  • Sajter som tycks sakna känsla för detaljer rankas ner.
  • Sajter med artiklar, sidor och inlägg som är korta, substanslösa och saknar särskild kvalitet rankas ner.
  • Sajter som saknar insiktsfull och originell analys bortom det uppenbara rankas ner.
  • Sajter som saknar kompletta och djupgående utläggningar om specifika ämnesområden rankas ner.
  • Sajter med artiklar och inlägg som inte beskriver flera perspektiv rankas ner.
  • Sajter med hög andel av sk ”boilerplate content”, tex sidor med mycket onödig kod.
Lingvistisk analys: sidor med språkliga och layout-mässiga brister rankas ner
  • Sidor/inlägg/artiklar som uppfattas ha producerats slarvigt och snabbt rankas ner.
  • Sajter med dålig grammatik och många felstavningar rankas ner.
  • Sidor/inlägg/artiklar med faktafel rankas ner.
  • Sidor/inlägg/artiklar med uppfattade design och style-missar rankas ner.

Analys av trovärdighet: sidor som inte fyller kostymen rankas ner

  • Innehåll som inte kvalitetskontrollerats rankas ner.
  • Sidor som inte tycks innehålla substantiellt värde vid en jämförelse med andra sajter [inom samma ämne] rankas ner.
  • Ytliga artiklar som framstår vara skrivna av ej insatta eller okunniga personer rankas ner.
  • Trovärdigheten bedöms om en skribent bara utger sig för att förstå ämnet som avhandlas.
Analys av säkerhet: bristande säkerhet för betalande surfare rankas ner
  • Sajter som förefaller sakna säkra kreditkortslösningar och köpmetoder rankas ner.

Analys av ålder: Sajter som är unga rankas ner

  • Små sajter med få sidor och inlägg rankas ner.
  • Nya sajter och bloggar med få år på nacken. En nylanserad sajt kan dock tillfälligt få en topprankning.

Analys av SEO: Sajter med överdriven och insmickrande SEO rankas ner

  • Sidor med irrelevant innehåll i förhållande till de nyckelord som tillförts sidan för att locka/lura besökare dit.
  • Sidor med title-tags som inte överensstämmer med sidan övriga innehåll.
  • Onaturlig överupprepning (keyword stuffing) av nyckelord rankas ner.
  • Drivs innehållet av ett genuint intresse från besökarna eller försöker en sajt dra till sig besökare genom att låtsas vara kunnig i ämnet?

Analys av besöksbeteende och intern trafik: få besökare och lite trafik rankas ner

  • Hög grad av inkommande besökare som snabbt studsar bort från sajten rankas ner.
  • Generellt låg trafik på sajten, dvs lokal surfning mellan inbördes sidor på en och samma sajt.
  • Lågt antal återkommande besökare till sajten.
  • Sajter med dålig click-through från Google.

Misstänkta ”content parks” och ”link wheels” rankas ner

  • Att ”content parks” upptäcks av Google Panda det vi säkert för det var ett högprioriterat mål för Panda. En ”content park” beskrivs som massproducerat likartat innehåll av låg kvalitet utplacerat i en sammanlänkat clustrer av reklamsajter.
  • ”Link wheels” uppbygda på ett för uppenbart sätt bör rimligen upptäckas av Google. Ett ”Link wheel” är ett länkat system av bloggar, sajter och sociala konton med syftet att lura Google att tro att det som gör att alla länkar till en central sajt beror på den sajtens förträfflighet. Målet är att skapa skenbar trust-ranking.

Analys av externa länkstrukturer: sajter och sidor med få inlänkar rankas ner

  • Lågt antal inkommande kvalitetslänkar till en sida eller sajt.

Analys av hur sociala medier och surfare uppfattar en sajt eller sida: ej populärt rankas ner

  • Sajter med få eller inga omnämnanden i den sociala webbsfären och tex nättidningar rankas ner (för lite socialt positivt ”buzz”).
  • Sajter som inte är uppmärksammade som auktoriteter inom de ämnen som avhandlas rankas ner.
  • Sajter som får många klagomål på innehållet rankas ner.
  • Sajter som inte bokmärks, rekommenderas (tex read it) eller delas via tex Facebook rankas ner.

Analys av mängden reklam: för mycket banners rankas ner

  • Sajter med hög andel banners i relation till mängden text rankas ner.
  • Sajter med textinnehåll av reklamkaraktär rankas ner.

Analys av IP-nummer: misstänkt rykteshantering på webben bör rankas ner 

  • Det vore nästan otänkbart att Google inte tar hänsyn till vilka IP-nr som agerar hur, var och varför på nätet. Mer om det i en kommande artikel.

Google: More guidance on building high-quality sites