Il existe pas mal de solutions pour detecter le plagiat, souvent nommé duplicate content, des sites en ligne, des plugins, des logiciels….
Dans le précédent article contenu duplique – detecter le plagiat , nous avons vu que detecter le plagiat, le contenu duplique, peut s’avérer être un frein à la progression de votre blog.
Car même si vous en êtes victime vous risquez fort d’en faire les frais (relire l’article)
Il n’existe pas de solution ultime, car vous verrez que faire face au plagiat est parfois le parcours du combattant !
Les sites en lignes pour detecter le plagiat
- Positeo http://www.positeo.com/check-duplicate-content/ le plus simple et le plus indicatif des sites pour detecter le plagiat (c’est celui que j’apprécie le plus)
Copier votre texte dans l’encart prévu ou bien copier l’url de votre article en dessous.
Cliquez sur vérifier
Le site a detecter le plagiat en vous indiquant alors où le texte se retrouve en plus grande partie et indique le pourcentage de copie.
C’est assez normal d’avoir des taux proches des 30%, il y a en effets des articles ou on ne peut pas appeler un chat un chien ….. donc on utilise forcement des mots identiques.
- Il existe d’autres sites pour detecter le plagiat tels que Copyscape, plagiarism, plagtracker ou encore No plagiat que je n’ai volontairement pas détaillé…car tôt ou tard c’est payant.
- un petit nouveau pour detecter le plagiat : Plagspotter.com , simple d’utilisation mais peut être moins pointu que positéo.
Si vous avez un doute sur une page, comparez-les !
- Outils de référencement http://www.outils-referencement.com/outils/mots-cles/similarite un outil en ligne qui compare au choix 2 pages ou 2 textes.
Dupecop http://www.dupecop.com/compare-spun-articles.php ici vous pouvez comparer 4 textes différents avec un maximum de 5 comparaisons/jour.(au 1 mai 2013 le service semblait ne plus fonctionner!)
C’est un service assez basic qui indique dans un tableau en terme de pourcentage l’indice d’unicité (0 indiquant un plagiat total)
TestSimilarityle service n’existe plus et fait une redirection
(indique un simple taux de similarité de plagiat en pourcentage)
- Webrankinfo http://www.webrankinfo.com/outils/similarite.php un peu plus complet que le précédent pour detecter le plagiat , il indique toujours sous forme de pourcentage et selon 2 indices de calcul (si vous êtes curieux voir encart technique en fin d’article) par rapport à la page entière, le titre, la méta et l’url.
Des plugins contre le plagiat
- Pal Wp plagiat http://webwrights.com/
Ne prends pas en compte les caractères accentués (é,è,à,ù..)
- Dooplee’s duplicate contente checker http://wordpress.org/extend/plugins/dooplee-duplicate-content-checker/ dernière mise à jour 4 janvier 2012 Download 786
- Greg’S High Performance SEO http://wordpress.org/extend/plugins/gregs-high-performance-seo/ Màj 7 decembre 2011 D 198496
- « No Duplicate Content » et « No duplicate Content in Comments »
NB : je n’ai à ce jour essayé aucun de ces plugins … méfiance par rapport à ces plugins (Oubliez les 2 derniers qui sont visiblement tombés dans l’oublis (pas de mise à jour depuis 2009!!!!)
Des logiciels peut-être ……aussi !
Desktop plagiarism checker
Une simple recherche sur google vous permettra de trouver un lien pour télécharger le logiciel
A ce jour j’apporte du crédit à ce lien :
http://www.01net.com/telecharger/windows/Internet/internet_utlitaire/fiches/116671.html
wCopyfind http://plagiarism.bloomfieldmedia.com/z-wordpress/software/wcopyfind/
DupeCop Spun http://www.dupecop.com/dupecop-spun.php
(il est prévu de tester ces logiciels, si vous en avez d’autres je suis preneurs pour étoffer le test)
Que faire si vous avez detecter le plagiat sur votre blog ?
Vous avez detecter le plagiat , c’est indéniable votre contenu se trouve sur un autre site à l’identique, tout d’abord se calmer (vous allez voir, ça énerve !!!) ……… et contacter le site qui est sensé faire du plagiat , en lui demandant gentiment de retirer l’article ….
Même si dans la moitié des cas vous avez affaire à quelqu’un qui fait l’autruche …. Rassurez-vous, il y a encore des gens qui assument, qui soit s’excusent pour diverses raisons et s’arrangent à l’amiable, ou retirent purement et simplement l’article en question.
Pour les autres ils continueront avec d’autres articles appartenant à d’autres blogs, pour aboutir souvent à la « fermeture fictive »du site ………..pour le réinstaller ailleurs sous un autre domaine.
Dans les 2 cas, vous saurez rapidement à qui vous avez affaire, si c’est purement destiné à vous nuire ou bien si vous êtes victime du système.
Si il n’y pas de page contact, envoyez-moi un mail et nous verrons ce qu’on peut faire !
Et si rien n’est possible !
Votre page est pénalisée, réécrivez votre page en modifiant le contenu et essayez de faire des liens ensuite vers elle pour la voir réapparaître …
Un site qui vous permettra de faire ça facilement Killdc http://killdc.linkomatic.org/ et celui-ci pour vérifier son indice de similitude UTEXT Utext http://utext.rikuz.com/en/
Soyez patient, c’est long !
Les cas ultimes
On balance !
C’est la guerre et la personne qui a fait ça, va déguster ! Après plusieurs mails et beaucoup de recherches rien …vous n’aboutissez pas, il reste cependant une solution …
Suppression d’un contenu sur Google
http://support.google.com/bin/static.py?hl=fr&ts=1114905&page=ts.cs&ctx=go
C’est un cas qui me paraît un peu excessif, mais bon à force de voir qu’on vous prend pour un idiot vous en avez assez, et vous être près à donner le coup fatal.
Attention, soyez sûr que la procédure n’est pas prise à la légère par Google !
Lui ruiner son e-réputation
Un site qui mérite le détour, mais malheureusement qui semble à l’abandon, c’est dommage !
J’aime assez cette phrase « Nous ne sommes pas des justiciers, au mieux, nous sommes justes des emmerdeurs » elle aurait pu être leur devise
http://www.duplicate-leaks.com
Si vous voulez allez plus loin, Comment ça fonctionne pour detecter le plagiat ?
- Indice de jaccard http://b1n.sp1n.me/seo/similarite-duplicate-content-indice-jaccard.109.html
- Algorithme de Simhash http://www.seoblack-inside.com/php-calcul-similaire-texte-simhash/
- Distance de Levenshtein http://fr.wikipedia.org/wiki/Distance_de_Levenshtein
- Comparaison du code HTML et du texte http://duplicatecontent.net/
- algorithme de Shingles.
Scripts
- Calcul de similarité par comparaison de mots http://www.seoblack-inside.com/script-php-calcul-similaire-comparaison-mots/
- Calcul de similarité par comparaison de chaîne http://www.seoblack-inside.com/calcul-similarite-texte-comparaison-chaine/
Un mot pour la fin, mais juste mon avis !
D’un côté comme de l’autre, vous êtes perdant….
Je ne pense pas qu’il faille être obsédé par la copie, en ce sens que si vous donnez les moyens de reproduire votre contenu ce ne sera plus du plagiat, mais de la reproduction autorisée et de la pub !
À ce titre, je parle du Creative Commons dans le guide Photo gratuites p16 et également dans cet article « wordpress avec creative commons »
L’avantage est d’avoir votre contenu largement diffusé et surtout un backlink en dure vers votre site qui fera inévitablement monter votre Pagerank (même si le pagerank n’est pas une fin en soi)
C’est une manière simple et rapide de remercier l’auteur de l’article que de le citer… vous en pensez quoi vous ?
Si vous voulez à tout prie protéger votre contenu faites appelle à un service tel que copyright France par exemple…ce n’est pas un organisme qui va detecter le plagiat mais une piste pour faire état de vos droits d’auteur, la suite au prochain article.
Amicalement