Google slår tillbaka mot spam
Detta är ett gästpost av Lior Levin.
Googles främsta spamfighter, Matt Cutts, skrev nyligen en lång blogginlägg om tillståndet i Googles kamp med spammare.
I inlägget sa Cutts att medan spam i Googles index var mindre än hälften vad det var för fem år sedan, har skräppost ökat i Googles index de senaste månaderna och för vissa frågor har det blivit mer märkbart.
Enligt Cutts är den här förändringen inte bara på grund av det faktum att det finns fler spammare än någonsin försök att fuska till en högre rankning av sökmotorer, men eftersom Googles senaste koffeinuppdatering har sökmotorn att indexera mer innehåll än någonsin tidigare, inklusive spam.
Men han skisserade Googles plan att bekämpa detta uppslag och förhindra att det blir ett allvarligare problem. Specifikt skisserade han tre ändringar till Google som han hoppas kommer att förbättra kvaliteten på Googles resultat och förbättra sökupplevelsen för alla.
Den första förändringen, som Google nyligen lanserade, är inriktad på spammare själv och är en " omdesignad dokumentnivå klassificerare " som gör ett bättre jobb att upptäcka spammigt innehåll på en enda sida. Detta inkluderar saker som upprepade ord i texten samt vissa typer av kommentarer spam.
Den andra förbättringen, som för närvarande utvärderas, är en algoritmisk förändring riktad mot webbplatser som kopierar innehåll från andra sidor, vanligtvis utan tillstånd. Dessa sidor kopierar ofta stora innehållsblanketter med mycket lite originalmaterial men de rangordnar ibland mycket bra, även före de webbplatser som ursprungligen producerade innehållet.
Det är dock den tredje och sista ändringen som har skapat mest diskussion. Enligt Cutts utforskar Google sätt att ytterligare sänka rankningen av så kallade "content farms" eller webbplatser som producerar stora mängder innehåll billigt, vanligtvis genom kontraktsarbete som ofta är av tvivelaktig kvalitet. Detta inkluderar företag som Demand Media, som driver eHow, Livestrong samt andra webbplatser.
Enligt Cutts gjorde Google två ändringar under 2010 för att minska effekterna av dessa innehållsföretag, men förstår att människor frågar efter ännu starkare åtgärder som ska vidtas. Sidorna har emellertid varit kontroversiella eftersom de inte anses vara traditionell webbspam, trots att de ofta har lägre innehåll.
Med tanke på att Demand Media bara hade en börsintroduktion som värderade den till 1, 5 miljarder dollar är det lätt att se hur mycket värde företaget har kunnat växa genom innehållet "jordbruk". Det som återstår att se är om Google kommer att kunna kväva sin prevalens i resultaten, speciellt för långa sökningar är det mål.
Vad som är klart är dock att även efter ett årtionde i branschen brottas Google fortfarande med innehållskvalitetsproblem i sitt index och kämpar för att hålla spammare, skrapor och innehållsbönder i strid.
Trots att det definitivt har gjorts framsteg under det senaste decenniet, finns det fortfarande tydligt mycket arbete att göra och Google håller på att göra det.
Allt vi kan göra är att luta sig tillbaka, se vad som händer och hoppas att legitima webbplatser av hög kvalitet inte fångas oavsiktligt i mixen.