Blekko blocs Plus de « Spam » Domaines: 1,1 million d'entre eux

A+ A-

Moteur de recherche Blekko a annoncé qu'il a bloqué 1,1 million de sites Web de ses résultats de recherche à l'aide d'un nouveau système appelle « des publicités indésirables » et de nouvelles pages de tout site Web ne seront pas ajoutés si elles ne passent pas Muster.

Blocage du spam avant qu'il ne soit en

Depuis le communiqué de presse Blekko:

« Cette nouvelle technologie va bloquer le spam avant qu'il ne montre jamais dans une page de résultats de recherche », a déclaré Rich Skrenta, directeur général de Blekko. « Nous avons identifié plusieurs signaux algorithmiquement de spam pour chaque page dans notre index. L'élimination de ces domaines de notre index a considérablement assaini nos résultats de recherche « .

Et à partir du poste de blog de la société:

Aujourd'hui, nous prenons la prochaine grand pas en avant avec le lancement de nouvel algorithme de Blekko des publicités indésirables. Cette nouvelle technologie va changer radicalement la recherche. Il est le premier algorithme de recherche jamais créé pour trouver le spam plutôt que des résultats de rang. L'algorithme est spécifiquement conçu pour reconnaître les pages qui sont le spam et les éliminer avant qu'ils apparaissent toujours dans les résultats de recherche.

Voilà qui est intéressant, cette idée de bloquer les pages de spam avant qu'ils ne soient ajoutés à un index de recherche. Il peut avoir été fait avant, mais si oui, je ne me souviens pas par quel service. Certes, il n'a jamais été quelque chose d'assez remarquable pour me rappeler. Si vous gardez les spams entièrement, potentiellement qui rend les résultats plus propres.

Là encore, il est aussi quelque chose qui est beaucoup plus susceptible de bénéficier Blekko que Google ou Bing. La raison en est que ces deux moteurs de recherche ont des algorithmes de recherche beaucoup plus matures que Blekko, donc ils pourraient déjà faire un meilleur travail de garder le spam des meilleurs résultats, même si les pages de spam sont eux-mêmes inclus dans l'index de recherche globale - ce qui est comme un grand livre de toutes les pages Web qu'ils ont recueillies.

Plus important encore, Google et Bing ont d'énormes ressources là où l'indexation d'un million ou même un milliard de pages de spam ne laisse pas vraiment moins « chambre » pour stocker les choses « bon ». Ils ont des milliers de serveurs. Stockage pour eux est relativement pas cher. Mais pour Blekko, chaque page de pourriels index est potentiellement plus coûteux.

En ce qui concerne le nom de « publicités indésirables » - c'est terrible. Je crois qu'il vient de l'idée que ce sont des pages chargées avec des annonces - mais je trouve assez déroutant.

Auparavant, dans « Le Banni Blekko »

Le mois dernier, Blekko a gagné un peu d'attention en interdisant 20 sites « spam » de son index. De notre couverture alors:

Rich Skrenta, président-directeur général de Blekko a confirmé l'interdiction avec nous aujourd'hui. Il nous a dit Blekko a décidé d'interdire les « top 20 des sites de spam de l'index de blekko entièrement, en fonction de nos utilisateurs cliquent sur / spam sur les résultats. » Cela inclut ehow.com, l'un des meilleurs sites Web générant des revenus de la demande des médias.

Les sites?

  • ehow.com
  • experts-exchange.com
  • naymz.com
  • activehotels.com
  • robtex.com
  • encyclopedia.com
  • fixya.com
  • chacha.com
  • 123people.com
  • download3k.com
  • petitionspot.com
  • thefreedictionary.com
  • networkedblogs.com
  • buzzillions.com
  • shopwiki.com
  • wowxos.com
  • answerbag.com
  • allexperts.com
  • freewebs.com
  • copygator.com.

Mais attendez. Est-ce les sites de spam top 20 ou, comme la libération de Blekko a déclaré aujourd'hui, le « top 20 fermes de contenu. » Les deux. Ni. C'est confu.

Spam In The Eye Of The Beholder Search Engine

spam moteur de recherche est tout un moteur de recherche décide qu'il soit. Par exemple, Google et Bing considéreront généralement des pages que « manteau » - montrer le contenu à l'utilisateur qui est différent de ce que leurs robots d'exploration automatisés voir - comme du spam. Les deux conviennent sur beaucoup d'autres tactiques qui seraient considérés comme du spam, mais ils peuvent ne pas être d'accord avec précision. Ils ne seront pas d'accord avec Blekko.

Pratiquement aucun des sites ci-dessus, de mon examen rapide, serait considéré comme du spam par Google ou Bing. Certes, Google a causé certains d'entre eux à perdre le classement dans son récent Fermier / mise à jour Panda. Mais ce n'était pas parce qu'ils étaient spamming Google. C'était parce qu'ils avaient un contenu que le nouvel algorithme a décidé de ne plus récompenser aussi bien que dans le passé.

En bref, le contenu de faible qualité ne correspond pas à spam, pas Google ou Bing. Il est juste quelque chose qu'ils ne seront pas prises comme très, ce qui est exactement ce que leurs algorithmes sont censés faire.

Avec la liste de bloc initial de Blekko, il a décidé que les sites étaient du spam à partir des rapports d'utilisateurs, indépendamment du fait que ces sites ont violé les lignes directrices de spam des moteurs de recherche traditionnels. Avec le dernier mouvement, Blekko décide en outre que la faible qualité égale à spam. Encore une fois, du poste:

Alors qu'est-ce exactement des publicités indésirables? En bref, il est un algorithme d'apprentissage automatique qui examine les pages pour les signaux de spam spécifiques - la présence de plusieurs positions d'affichage publicitaire sur une seule page et mince à zéro contenu.

Le résultat final de l'approche de Blekko contre Google pourrait être le même. Google vise à maintenir le contenu « peu profonde » d'apparaître pour de nombreuses recherches, même si les pages sont parmi ceux qu'il a recueillis. Blekko vise également à maintenir le contenu peu profonde - mais contrairement à Google, il applique l'étiquette « spam » à ce contenu et l'empêche d'être indexé en premier lieu.

Ce qui est parti maintenant?

Au cours du New York Times, Claire Cain Miller avait une bonne partie du déménagement de Blekko et si bons sites pourraient être lésés. Non, dit Blekko:

Bien qu'il semble que de nombreux sites légitimes pourrait être considéré comme du spam dans cet algorithme - les journaux couvrent une grande variété de sujets, par exemple, et de nombreux blogueurs peuvent être des écrivains amateurs, mais sont des experts dans leur domaine - M. Skrenta dit que quand il passé au peigne fin des milliers des sites que l'algorithme bannie, il a trouvé que deux faux positifs.

Des exemples de sites Blekko interdit maintenant: cheap-refrigerators.net, best-weddinggifts et Boston.diningguide.com.

Aide-t-il?

Je ne l'ai pas fait de tests à grande échelle. Mais remarquant que le nom du site Web cheap-refrigerators.net ci-dessus qui a été confirmé comme retiré - « Réfrigérateurs Conseils d'achat » - Je pensais une recherche sur ce sujet pourrait être intéressant:

Vous pouvez cliquer pour agrandir l'image. J'ai enlevé l'annonce qui était en haut des résultats de deux Blekko et Google, vous pouvez vous concentrer sur les cinq premiers résultats éditorial. Mon point de vue:

Blekko

  1. OK, mais à court et à base
  2. Hors de propos - vous devez chercher plus loin dans le site pour obtenir des conseils
  3. Les bons conseils de base de grands détaillants
  4. contenu mince qui relie seulement au contenu plus mince
  5. Défaut de pertinence - sur des filtres à eau pour les réfrigérateurs

Google

  1. Bon, l'article substantiel en plusieurs parties
  2. Bon, conseils courts menant à d'autres commentaires
  3. bons conseils
  4. Les bons conseils de Consumer Reports, une grande marque de confiance
  5. conseils OK, environ trois ans

Désolé, Blekko - Je ne peux pas dire que l'abandon de ce site réfrigérateur, beaucoup moins les autres 1 million environ d'autres sites, vous a aidé à tous contre Google pour cette requête particulière. Utiliser / commentaires slashtag a aidé - il a obtenu un des bons sites que Google devait figurer en premier. Mais les trois autres bons sites que Google avait dans les cinq premiers résultats ne montrent.

De plus, la plupart des chercheurs typiques ne vont pas utiliser slashtags - et il y a encore moins de raison de les utiliser quand la même recherche sur Google fait apparaître de meilleurs résultats, sans slashtag nécessaire.

Le facteur humain

Le poste de Blekko dit aussi:

Contrairement aux algorithmes utilisés par d'autres moteurs de recherche, est utilisé des publicités indésirables en conjonction avec curation humaine pour détecter de poursuivre la guerre contre le spam.

Vrai - Blekko fait usage des efforts humains pour décider ce qui est bon et mauvais. En particulier, Blekko récemment conclu un partenariat avec Stack Exchange (anciennement Stack Overlow) pour curation de la programmation et des sujets techniques.

Attendez-vous à Google de repousser sur l'ensemble aspect « il n'a pas l'homme », cependant. Il a fait cela avant, la dernière fois que les deux Mahalo et a essayé Wikia Search sous cet angle. Google a souligné qu'il a examinateurs de l'homme, qui servent comme une sorte de « double contrôle » sur l'algorithme informatique change, il fait, par exemple.

Google a souligné encore récemment ce quand il a fait la mise à jour Farmer, pour mettre en évidence que le changement informatique semblait être pris en charge par les données humaines qu'il cherche à modéliser. Google a également suggéré que ce que les gens bloquent en utilisant son extension Chrome Personal Blocklist pourrait être des données qui est utilisé dans son algorithme de recherche, dans l'avenir.

Pourtant, Google n'a rien comme le curation slashtag qui offre Blekko. Cela dit, Blekko n'a pas encore montrer que cette curation se transforme en résultats de meilleure qualité qui attirent les utilisateurs importants de Google, beaucoup moins Bing. Mais sur le front de PR, il ne fait aucun doute que les mouvements de Blekko maintiennent la pression sur Google pour améliorer aussi bien.

Plus d'informations

Je n'ai pas eu la chance de parler avec Blekko plus sur le système, comme je suis actuellement à notre conférence de marketing de recherche SMX West à San Jose. Blekko - avec Google et Bing - prend part à notre « La police Spam » et « Demandez aux moteurs de recherche » demain sessions, donc je pense des détails plus précis sous le capot se sortir de cela. Restez à l'écoute (et aussi regarder la couverture connexe sur Techmeme). Voir aussi les articles ci-dessous pour plus d'information sur quelques-unes des choses que je l'ai mentionné ci-dessus.


Ads

Partager

Récent

L'esprit de votre entreprise: Nos top colonnes de recherche locale de 2017

praticiens SEO locaux ont un rôle de plus en plus important...

SearchCap Santa Tracker, Google API termes et paramètres SEO

Ci-dessous est ce qui est arrivé aujourd'hui à la reche...

Marlene Dietrich honore Google doodle la carrière de l'actrice légendaire

Marlene Dietrich, l'emblématique actrice d'origine ...

les résultats de recherche d'images de Google teste une nouvelle boîte de recherches connexes

Google teste une nouvelle boîte « Recherches associées » da...

commentaires