Home Tutos Scrapebox : tutoriel vidéo en français
11

Scrapebox : tutoriel vidéo en français

11

Aujourd’hui, petit tutoriel sur l’utilisation de Scrapebox. Scrapebox est un logiciel de scrapping, utilisé par tous les référenceurs, white-hat comme black-hat. Scrapebox sert à collecter des résultats de recherche sur les moteurs comme Google, Yahoo, Bing etc, mais aussi à faire du spamco (du spam de commentaires de blog, ouh que c’est mal), à récupérer des adresses mails de façon automatique, récupérer des images, générer des mots-clés, bref, c’est un véritable couteau-suisse pour tout SEO qui a décidé de s’asseoir sur les guidelines de Google se respecte.

Pourquoi un tuto sur Scrapebox ?

Pour une raison toute simple : on va en avoir besoin pour les prochains tutos sur la rédaction de masse (mais on verra aussi comment s’en passer). On va devoir utiliser Scrapebox en complément de The Best Spinner, et de quelques plugins pour Firefox, notamment pour collecter des images, et pour ça, la première chose dont on va avoir besoin, c’est de quelques proxies. En effet, Google n’apprécie pas trop qu’on effectue des requêtes massivement, et si vous scraper Google sans proxy, il va rapidement vous envoyer un captcha, ou bannir temporairement votre adresse IP. Notez également que vous pouvez configurer un résolveur de Captcha sur le logiciel (De-captcher, deathbycaptcha, imagetyperz etc).

Pour récupérer des proxies compatibles avec la fonction de recherche de Scrapebox, vous pouvez vous en procurer sur le web, chez buyproxies.org par exemple, ou bien utiliser un logiciel comme Proxymultiply. Si vous optez pour la seconde solution, il faudra peut-être vous armer de patience car la collecte de proxy de bonne qualité peut prendre du temps, surtout si vous préférez utiliser des proxy européens. Avec la location de proxy dédiés au semi-dédiés, au moins, vous êtes tranquilles.

Utiliser des proxies pour Scrapebox

Pour le tutoriel, nous avons utilisé des proxies semi-dédiés, qui sont partagés avec trois utilisateurs. Notez bien que plus vous aurez de proxies, plus le scrap sera rapide et moins vous aurez de chances de voir des proxies temporairement bannis de toute requête chez Google. J’utilise des proxies pas cher, que je loue chez Buyproxies.org. Une fois votre commande passée, vous recevez l’adresse IP des proxy, ainsi que votre nom d’utilisateur et votre mot de passe. Notez également qu’il peut être intéressant d’installer Scrapebox sur un VPS (les premiers prix sont chez OVH, avec des perfs assez intéressantes), ça facilitera largement le travail de collecte. Sans proxy, c’est même pas la peine de tenter le scrap, il ne passera pas !

Rendez-vous sur Scrapbox, et cliquez sur le bouton « Manage » situé en bas à gauche de votre interface principale. Une nouvelle fenêtre s’ouvre, puis cliquez sur « Load », en bas à gauche, et chargez la liste de vos proxies (attention à la syntaxe : ip:port:username:password). Une fois que les proxies sont chargés, cliquez sur « Test proxies » pour vérifier que vos proxies sont bien compatibles avec Scrapebox. Le soft va pinger Google, vérifiez que les proxies sont bien anonymes, et vous donnez des informations sur le temps de réponse. Rejetez les proxies morts en cliquant sur « Filter » –> « Keep Google proxies », puis cliquez sur « Save » –> « Save to scrapebox » et fermez le manager.

Scraper comme un fou !

Dans la fenêtre du haut, le champ « M » concatène la foot print que vous recherchez avec la liste de mots-clés que vous rentrez juste en dessous. Par exemple, vous pourriez choisir une footprint « référencement » et mettre en mots-clés une liste de ville. Les opérateurs comme « allintitle« , « allintexte » etc sont aussi acceptés, c’est comme si vous faisiez une recherche directement sur Google.

Dans la fenêtre en bas à gauche, « Select Engines and Proxies », vous pouvez affiner votre recherche en sélectionnant les moteurs de votre choix, en choisissant uniquement de rechercher des vidéos, des actualités… Vous pouvez aussi choisir le nombre de résultats que vous souhaitez scraper, ainsi que la durée globale de l’opération.

Cliquez ensuite sur « Start Harvesting » dans la fenêtre centrale. Patientez un peu, et Scrapebox vous sortira une jolie liste d’URL ! Vous pouvez ensuite filtrer les résultats, en enlevant par exemple les doublons d’adresse, en raccourcissant l’URL pour ne conserver que le nom de domaine, et vous pouvez également vérifier le page Rank des pages concernées, récupérer des adresses mail (pas bien !), des commentaires, des infos en tout genre etc.

Vous n’avez plus qu’à exporter la liste d’URL, dans un fichier texte, dans un fichier CSV ou Excel, ou directement dans le presse-papier. Et c’est tout ! Ca n’est pas plus compliqué que ça, du moins pour l’opération de scrap pure.

Si vous installez scrap box sur votre machine suite à ce tutoriel, profitez-en pour installer également l’addon « scrap box Google images Grabber« , qui pourrait bien vous servir pour le prochain tutoriel complet sur le spinning avancé…

Des proxies pas cher pour scrapeboxTélécharger Scrapebox sur le site de l’éditeur

GDM-Pixel / Charles Annoni Charles est chef de projet en marketing web et conception de sites. Formateur en référencement naturel, il est également consultant en webmarketing et propose des tutoriels exclusifs en France.

Les commentaires peuvent donner lieu à un lien dofollow si thématique similaire et ancre clean :)

Comment(11)

  1. Encore un très bon tutoriel, merci. Il est vrai que Scrapebox permet d’économiser énormement de temps pour ses recherches.

  2. Salut, ok merci de l’info 🙂
    Et pour le tuto Excel + spinning pour le e-commerce, tu prévois ça pour quand à peu près ?

  3. Salut, super tuto en effet ! Perso j’utilise RDDZ mais les deux semblent fonctionner de la même manière !
    Vivement la suite 🙂

  4. Salut Diaz,
    le tuto avancé pour The Best Spinner est en cours de rédaction, la partie E-commerce tombe juste après. Si je suis dans les temps, le tuto pour les liens et les images sera publié avant la fin de semaine, et le tuto pour le E-commerce la semaine suivante 🙂

  5. Merci pour le tuto !
    J’ai utilisé scrapebox très brièvement à une époque, et j’avoue qu’en m’y replongeant aujourd’hui tout me semble obscur…
    D’ailleurs je fonctionnais avec une liste de proxys gratuits (option harvest proxies). A l’époque j’arrivais à en trouver des correct… mais là tout semble dead, visiblement c’est une denrée rare de nos jours… 🙂

  6. Bonjour Jonathan,
    un proxy gratuit et publique, en quelques minutes (pas plus), ça tombe. Il vaut mieux utiliser des proxy dédiés ou semi-dédiés… Voir chez Buyproxies.org 🙂

  7. Encore bravo Charles pour ce tuto sur scrape, une fois de plus je suis tombé de ma chaise, du coup j’ai acheté le soft (97$ quand même !)
    Par contre c’est super puissant, je n’imagine pas ce que certains font avec (enfin si… j’imagine très bien ^^)
    J’attends d’autres tutos sur le SEO de ce niveau (oui, il va falloir tenir la distance maintenant 😉 )
    A bientot ! GJ

  8. A nouveau merci Eric ! Si je me débrouille bien, je peux reprendre les tutos début Avril 🙂 A très bientôt !

  9. Pareil ici, après avoir lu cet article et quelques autres, je me suis décidé à acheter Scrapebox. Les options sont nombreuses, mais ça vaut le coup d’investir un peu d’argent et de temps dedans, c’est bien puissant !

  10. Scrapebox même si c’est vieux et un peu compliqué au début, au final c’est de la bombe !! J’imagine même pas ce que c’était lorsque les commentaires étaient encore en dofollow.On devait bien s’amuser ( ou pas ). Pour ceux qui veulent l’acquérir, il suffit de chercher un peu pour le trouver à 67$ ( 60€ environ ).

LEAVE YOUR COMMENT

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *