Analyser les données de la première page de résultats des moteurs de recherche est un indispensable pour améliorer le classement de votre site internet.
Découvrez Thruuu, l’outil SEO gratuit qui va vous permettre facilement et rapidement de scraper la SERP de Google et d’exporter ces informations afin de mieux ranker. 

Sommaire

Qu'est-ce que le Web Scraping ?

Web scraping
Web Scraping

Le Web Scraping, du verbe anglais scrape (que l’on peut traduire en français par gratter ou racler) est un procédé qui utilise un logiciel informatique afin de permettre d’extraire, de façon automatique, les données de sites internet (WordPress ou autre CMS (Shopify, Wix, Prestashop,…)), en vue d’une analyse ultérieure.

Qu'est-ce qu'une SERP ?

La SERP, acronyme de Search Engine Result Page, est la page de résultats des moteurs de recherche (Google, Bing, Qwant Ecosia, …)  pour un mot-clé demandé par l’internaute. 
Ce dernier s’appelant, dans le jardon SEO, une requête.
Une requête est locale quand elle intègre une zone géographique.
À défaut, cela est une requête générique.

Quels sont les utilités de scraper la SERP de Google ?

Scraper la SERP de Google peut être utile pour :

  • Vérifier que toutes vos URLs importantes soient présentes.
  • Surveiller la présence de vos mots-clés pertinents pour votre entreprise.
  • Visualiser et analyser la concurrence afin de la dépasser.
  • Évaluer la possibilité et la facilité de classer votre page web sur la première page de résultats de recherche.

Qu'est-ce que Thruuu ?

Thruuu
Thruuu

Outil de référencement naturel par excellence, Thruuu est un scraper, développé par Samuel Schmitt, qui analyse les 100 premiers résultats de Google afin de vous fournir des informations essentielles pour auditer et comprendre votre concurrence mais surtout la surpasser telles que :

  • Balises Title.
  • Balise Meta-description.
  • Balise H1
  • Balises H2 et H3.
  • Le nombre d’images.
  • Le nombre de mots.
  • Le nombre de liens internes et externes.
  • La date de publication de la page web ainsi que la dernière date de mise à jour.
  • La fréquence des mots-clés ou expressions-clés.
  • L’information de requêtes connexes.

De plus, vous pourrez exporter toutes ses informations utiles au format Excel.

Cerise sur le gâteau, Thruuu est en version gratuite et en illimitée.

Que signifie Thruuu ?

Que signifie Thruuu ?
Signification de Thruuu

N’ayant aucune idée de la signification du mot Thruuu, j’ai demandé directement l’information à Samuel Schmitt, en pensant, comme souvent dans le monde du SEO, que c’était un acronyme.
Erreur, Thruuu signifie simplement à travers (de l’anglais through).

Pour le fondateur de cet outil intuitif, l’idée est de comprendre, à travers la SERP, l’intention de recherche de l’internaute.  

Qui est Samuel Schmitt ?

Samuel Schmitt est un expert français en solutions numériques.

Sa renommée internationale et son expertise ont été reconnues, par le Senior Webmaster Trends Analyst de Google John Mueller (alias JohnMu sur les réseaux sociaux) himself, avec son excellent et exhaustif article sur les Core Web Vitals de Google, qui seront pris en compte dans l’algorithme du moteur de recherche à partir de Mai 2021.

Je voudrais, par cette occasion, remercier Samuel Schmitt de m’avoir offert, un accès bêta-testeur de la nouvelle version de son scraper (qui va sortir très prochainement).
À noter que je ne suis pas affilié à Thruuu.

Comment fonctionne Thruuu ?

Le fonctionnement de Thruuu est d’une simplicité enfantine : vous rentrez le mot clé, et après deux ou trois précisions utiles à fournir, le logiciel SEO (Search Engine Optimization), en mode Saas, va vous fournir une multitude d’informations plus utiles les unes que les autres.

Le plus dur, si je puis dire, est de savoir tirer parti de ses données pertinentes.
En partant d’un de mes articles sur un des meilleurs spider du marché du référencement : Sitebulb, je vais vous expliciter, pas à pas, comment exploiter la quintessence de Thruuu.

Renseigner les informations demandées

Tout d’abord, cliquez sur ce lien : app.samuelschmitt pour accéder à Thruuu.

Ensuite, il faut  :

  • Entrer un mot-clé ou expression-clé.
  • Choisir un pays.
  • Sélectionner une localité.
  • Sélectionner le moteur de recherche.
  • Sélectionner une langue.
  • Indiquer le nombre de résultats dans la SERP à analyser (de 10 à 100).
  • Sélectionner un appareil (bureau ou mobile).
  • Cliquez sur Parcourir le SERP.  

Déjà, on peut constater que Thruuu :

  • Ne se limite pas à la France, il est international.
  • Se limite au moteur de recherche Google (normal, vu que ce dernier a + de 90% de parts de marché).
  • Ne se limite pas à la première page de la SERP de Google, mais à la dixième pages de résultats !
  • Permet d’analyser la SERP nationalement mais aussi localement (idéal pour le SEO local).
  • Scrape soit sur la version desktop ou sur la version mobile de Google (les résultats sont quelquefois différents).
Renseigner les informations demandées par Thruuu
Indication du mot clé à analyser - Thruuu

Aperçu des résultats sur la SERP de Google pour le mot-clé

Les informations apparaissent en une dizaine de secondes et se présentent sous la forme d’une SERP épurée en indiquant :

  • Le classement.
  • La balise Title.
  • L’URL (Uniform Resource Locator).
  • La balise meta-description. 

Cette partie sert, surtout, à vérifier le positionnement de votre page web pour votre mot-clé principal.
En l’occurrence, dans mon exemple, mon article sur le crawler Sitebulb est classé en 3 ème position ! 

Thruuu - résultats SERP Google
Aperçu des résultats sur la SERP de Google - Thruuu

À noter qu’en tant que Consultant SEO Freelance, je choisis toujours d’analyser, pour un mot-clé, les vingt premiers résultats naturels de Google et non seulement sur les dix premiers.

Pourquoi me diriez-vous ?

Tout simplement, parce que si votre page web se classe en treizième position (par exemple) et en effectuant un bon travail d’optimisation de votre référencement organique (contenu éditorial, SEO On-Page, backlinks), il y aura de grandes choses que vous atteindriez le Graal : la première page de Google.

Et là, ipso facto, votre taux de clics (CTR) s’améliorera de façon exponentielle.

Détails des résultats de la SERP

En cliquant sur un des résultats affichés sur la SERP, Thruuu va afficher une fiche contenant des informations détaillées telles que :

  • La balise Title (Sitebulb : La Meilleure Alternative à Screaming Frog |Bernard Sperandio)
  • Le nom de domaine (bernard-sperandio.fr) .
  • Le type de page.
  • La date de publication.
  • La dernière date mise à jour.
  • Le nombre de mots.
  • Le nombre d’images.
  • Le nombre de liens trouvés (maillage interne et liens externes).
  • Le contenu de la balise méta description.
  • La balise H1 (Sitebulb : la meilleure alternative à Screaming Frog ?).
  • Les balises H2 et H3.  

Cet aperçu complet et détaillé est très utile pour :

  • Analyser et comprendre la structure des pages web de vos concurrents.
  • Trouver des mots-clés secondaires dans les balises H2 et H3.
  • Améliorer votre champ lexical.
  • Développer votre univers sémantique
  • Optimiser votre référencement Google.
Détails SERP - Thruuu
Détail des résultats de la SERP de Google - Thruuu

Statistiques de la SERP de Google

Là, on rentre dans la raison d’être de Thruuu en nous fournissant quatre statistiques pertinentes sur la SERP de Google, quasiment introuvables nulle part ailleurs :

  1. Le nombre de mots.
  2. La mise à jour du contenu.
  3. Le nombre d’images.
  4. Diverses statistiques (FAQ, Featured Snippet, …).
Statistiques SERP Google - Thruuu
Statistiques SERP - Thruuu

Quelle est l’utilité de ses statistiques et quels enseignements peut-on en tirer ?

1. Nombre de mots

Nombre de mots - Thruuu
Statistique nombre de mots - Thruuu

La statistique sur le nombre de mots vous indique :

  • L’article le plus court en nombre de mots (183) qui se positionne dans le TOP 10 de Google.
  • L’article le plus long en nombre de mots (4854) qui se positionne dans le TOP 10 de Google.
  • Le nombre moyen de mots (1704) pour les articles se positionnant dans le TOP 10 de Google.

Le chiffre le plus important étant la moyenne des mots (1704).
Cela indique que si vous voulez avoir une chance de vous positionner dans le TOP 10 pour cette requête, il faudra que votre contenu éditorial de votre article ait une longueur supérieure à cette moyenne (cela n’étant pas une règle absolue). 

Mais il ne faut pas écrire du texte pour écrire du texte, il faut absolument que ce dernier réponde exactement à l’intention de recherche de l’internaute.
En effet, le moteur de recherche sait, avec ses algorithmes Google Hummingbird, RankBrain, BERT, SMITH, et bientôt MUM analyser, sémantiquement parlant, le contenu textuel d’une page web.

C’est pour cela que Google n’est plus simplement un moteur de recherche, mais est devenu un véritable moteur de réponses.

2. Mise à jour du contenu

Mise à jour du contenu - Thruuu
Statistique sur la mise à jour du contenu - Thruuu

La statistique sur la mise à jour du contenu vous indique :

  • La date de création la plus ancienne (3 ans) de l’article se positionnant sur la première page de Google.
  • L’âge moyen (20 mois) des articles se positionnant sur la première page de Google.
  • La date de dernière mise à jour (2 jours) d’un article se positionnant sur la première page de Google.

En SEO, l’ancienneté d’un article peut influencer son positionnement, mais encore faut-il que son contenu éditorial soit toujours pertinent et unique.

En effet, Google (et l’internaute) aime bien qu’un article soit toujours à jour des dernières actualités.

Par exemple, vous aviez rédigé un article pertinent sur la Covid-19 en mai 2020, et ce dernier se classe sur la première page de Google.
Mais depuis, vous n’avez plus mis à jour votre article en indiquant, que, fin novembre 2020, des entreprises (Pfizer, Moderna, …) ont trouvé, a priori et sous toutes réserves, un vaccin permettant d’éradiquer le virus.
Et encore moins que la campagne de vaccination a commencé en décembre 2020.

Obligatoirement, la pertinence de votre page sera quasi obsolète et donc Google la rétrogradera de son classement au profit d’autres articles plus récents qui en parle.

C’est pour cela que les statistiques affichées par Thruuu sont importantes, car si vous voyez des articles d’une certaine ancienneté placés dans le TOP 10 sur la SERP de Google, mais sans aucune mise à jour récente, alors il y a une chance de vous positionner dans le TOP 10 en accentuant votre contenu sur les actualités récentes.

A contrario, un article ancien parlant d’un sujet n’ayant aucune nouvelle actualité, et donc sans besoin d’une mise à jour, sera difficile à déloger du TOP 10.

3. Images

Images - Thruuu
Statistiques des images SERP Google - Thruuu

La statistique sur les images vous indique :

  • L’article ayant le plus d’images (47) qui se positionne dans le TOP 10 de Google.
  • L’article ayant le moins d’images (0) qui se positionne dans le TOP 10 de Google.
  • Le nombre moyen d’images (24) pour les articles se positionnant dans le TOP 10 de Google.

Cela n’est pas, je trouve, la statistique la plus importante sur Thruuu.

Par contre, ajouter des images sur un article est toujours utile pour :

  • La convivialité de la page (alléger la lecture, attirer l’attention du lecteur, …).
  • Être présent sur le moteur de recherche Google Images.
  • Insérer des mots-clés LSI dans leurs attributs ALT.   

4. Plus de statistiques

Plus de statistiques SERP - Thruuu
Plus de statistiques -- Thruuu

Cet encart Plus de statistiques SERP vous indique :

  • S’il y a pour ce mot-clé un Featured snippet (appelé aussi extrait en vedette, extrait optimisé ou position zéro).
  • Le % de concordance entre la balise meta description créée par le webmaster et celle affichée dans la SERP de Google.
  • Le nombre de pages dans le TOP 10 ayant une meta description remplie.
  • Le nombre de FAQ se trouvant dans le TOP 10.

Ces statistiques sont intéressantes car elles montrent que :

  • Vous pouvez vous classer dans le TOP 10 sans avoir rédigé une description dans votre balise meta.
    En effet, nous savons tous que cette balise n’est pas pris en compte par Google comme critère de pertinence, mais elle est très importante pour vous, car elle incite l’internaute au clic. 
    Donc n’oubliez jamais d’en rédiger une !
  • Google peut ne pas prendre en compte votre meta description pour plusieurs raisons, et mettre à la place un autre contenu qu’il juge plus pertinent.
  • Les FAQ (Foire aux Questions) sont souvent délaissées.

Je conseillerai dans le cas présent, soit dans votre article existant ou soit dans un nouvel article, d’intégrer une FAQ.
Cela peut faire la différence avec vos concurrents et ainsi améliorer votre ranking.

Plus d'informations sur les pages

Dans cet encart, Thruuu nous explique pourquoi ces pages sont sur la première page de Google.

Pour cela, il vous indique le descriptif des balises les plus importantes en SEO :

  • La balise Title.
  • La balise H1.

De plus, sont indiqués les keywords les plus présents dans ses deux balises : Une vraie mine d’or pour une rédaction SEO de contenu de qualité.

Plus d'informations sur les pages - Thruuu
Statistique plus d'informations sur les pages - Thruuu

Est présent aussi la concordance, calculée en %, entre la meta description affichée sur la SERP de Google et celle réellement écrite.

La première ligne correspondant à la meta description réécrite par Google et présente sur sa SERP.
La deuxième ligne correspondant à la meta description originale.

Match meta description - Thruuu

Thruuu fournit encore une liste de mots clés, idéal pour choisir les bons mots pour mieux ranker :

  • Ceux des balises méta description modifiées volontairement par Google.
  • Ceux des balises meta description originales du TOP 10 de Google.
Fréquence mots-clés Meta description - Thruuu

Autres fonctionnalités du SERP

Ces dernières informations fournies par Thruuu sur les recherches connexes (appelées aussi recherches associées), les questions les plus fréquemment posées ou les vidéos vous permettent :

  • D’élargir votre champ lexical.
  • D’améliorer la pertinence de votre contenu éditorial.
  • De mieux faire comprendre à Google la thématique de votre page web.
Autres fonctionnalités du SERP - Thruuu
Autres fonctionnalités de la SERP de Google - Thruuu

Télécharger les données

Télécharger toutes les données sous Excel - Thruuu

Thruuu vous offre, en plus, la possibilité d’exporter, gratuitement, toutes ces données dans un fichier Excel.

Cela est idéal pour traiter, analyser et synthétiser ses informations afin d’optimiser votre stratégie de contenu

Télécharger les données - Thruuu
Téléchargement des données récoltées - Thruuu

Mon avis final sur Thruuu

J’avoue que je suis toujours agréablement surpris par Thruuu par sa puissance d’analyse.

En un clic et gratuitement, vous pouvez tout savoir sur vos concurrents et donc savoir ou vous pouvez vous améliorer (structure de votre page web, ajout de mots-clés LSI, secondaire, voire de longue traîne) afin de surpasser vos concurrents sur la SERP de Google.

Thruuu est un petit scraper de la SERP de Google, remarquablement conçu que tout propriétaire de sites web (vitrine ou E-commerce) devrait se servir, du fait de sa facilité d’utilisation.

En tant que consultant en référencement naturel, je l’utilise quotidiennement dans le cadre de mes analyses SEO afin de générer du trafic organique, et m’est devenu indispensable, au même titre que d’autres outils SEO plus puissants mais aussi payants (Semrush, 1.fr, Screaming Frog, …).

Ayant eu l’honneur, par Samuel Schmitt, d’être bêta-testeur de Thruuu version 2, je peux vous dire que cette nouvelle version premium, qui sortira courant février 2021, n’a plus rien à voir avec l’actuelle.
Thruuu rentre réellement dans la cour des grands tools SEO avec :

  • Une expérience utilisateur (UX) optimisée.
  • Des nouveaux filtres (résultats payants, résultats organiques, …)
  • Des statistiques encore plus pointues (balise H1 à H6, …).
  • Des nouvelles métriques sur la vitesse de chargement de chaque page Web (Page Speed Insight, Speed Index, Core Web Vitals, …).
  • Des scores de performances de l’expérience utilisateur (CrUX). 

Il y a de grandes chances que la popularité de Thruuu version 2 va être exponentielle.

Enfin et pour conclure, une question me vient de suite à l’esprit : Vu la qualité déjà existante et décuplée avec cette nouvelle version à venir, est-ce que Thruuu va t’il devenir freemium ou payant, à l’instar d’Ubersuggest ou de Keyword Tool ?

Honnêtement, je n’en sais rien, mais vu la qualité et la pertinence de cet outil d’analyse, cela ne me choquerait pas plus que cela.

Mise à jour

Update - Mise à jour
Mise à jour de l'outil SEO Thruuu

Nous sommes le vendredi 19 février 2021, et la V2 de Thruuu, le scraper de Samuel Schmitt vient de sortir.

Que dire ? La V2 finalisée est encore meilleure que la V1, tant au niveau données, qu’au niveau ergonomie.

Désormais, sur la même page, vous obtiendrez des précieuses informations sur les résultats naturels ou sur les résultats payants (Google Ads, connu anciennement sous le nom de Google Adwords) sur la première page de Google, telles que :

  • Des statistiques à profusion (nombre de mots, nombre d’images, FAQ, Date de création de l’article et date de la dernière mise à jour du contenu, nombre de liens internes et externes, etc).
  • Le score de PageRank de la page web.
  • La structure de la page : Balises H1 à H6.
  • Le contenu des balises Title et des balises Hn (H1 et H2).
  • La comparaison des titres et méta-descriptions.
  • La fréquence des mots-clés.
  • Les performances en terme d’affichage (Speed index, Page Speed Insight, Core Web Vitals (FCP, LCP, CLS)).
  • Les données du rapport Chrome UX (CrUX) : FCP, FID, LCP, CLS.
  • Les sujets et mots-clés les plus souvent utilisés dans le TOP 100 de Google.

Pour identifier les sujets les plus importants, Thruuu utilise la technologie NLP (Natural Language Processing, ou en français, Traitement du langage naturel) qui est un des moteurs de l’Intelligence Artificielle (IA).

Thruuu V2
Thruuu V2

Bien entendu, toutes les données sont, toujours, exportables vers Microsoft Excel.

Avec cette nouvelle version, Thruuu est devenu, véritablement, un des meilleurs outils d’analyse SEO.

Enfin, et comme je le supposais fortement vu sa qualité, le scraper Thruuu devient payant, tout en conservant une petite partie gratuite (10 recherches/mois).
Les tarifs payants sont :

  • 10 € pour 20 scrapes.
  • 20 € pour 100 scrapes.
  • 50 € pour 500 scrapes. 

Petite astuce : Pour ne pas perdre un crédit sur un scrape récemment effectué, utilisez le menu de gauche et cliquez sur Scrape History, vous retrouvez les derniers scrapes récents que vous avez déjà effectué, et vous n’aurez qu’a choisir dans la liste le scrape voulu et cliquez sur le bouton VIEW 🙂  

 

Nous sommes le vendredi 3 juin 2022, et la V2 de Thruuu, le scraper de Samuel Schmitt s’est encore amélioré et sa tarification a été modifiée.

1. Onglet Outline

Sous cet onglet, est dévoilé toutes les balises H2 affichées dans le TOP 100 de Google.

Ces dernières sont réparties en plusieurs sections :

  • La première section contient tous les premiers H2 trouvés sur les pages web.
  • La deuxième section contient tous les deuxièmes H2 trouvés sur les pages web.
  • Etc.

Mais le plus intéressant est que Thruuu, génère automatiquement un modèle de structure de page  : Cela est idéal pour la création de votre prochain article tout en répondant à l’intention de recherche de l’internaute. 

Thruuu - Modèle de structure de page web généré automatiquement
Thruuu - Modèle de structure de page web généré automatiquement

2. Modification tarifaire

Le créateur de ce fabuleux scraper de SERP de Google à modifié, par la même occasion, sa grille tarifaire pour la rendre plus attractive (surtout en mode abonnement).

 Il existe 2 modes de tarifications :

  1. Sans abonnement mensuel : 3 formules (20 crédits= 20 €; 100 crédits = 50 €; 100 € = 500 crédits).
  2. Avec abonnement mensuel : 3 formules (40 crédits= 7 €; 150 crédits = 19 €; 49 € = 500 crédits).

À noter qu’en prenant un abonnement annuel, vous bénéficierez de 2 mois gratuits.

Toutes les informations sur la nouvelle version sont à retrouver sur la page officielle du scraper Thruuu V2.

Si vous avez aimé cet article sur le scraper Thruuu, laissez-moi un petit commentaire.

Cet article a 3 commentaires

  1. Jean

    Merci pour la découverte de cet outil très pratique.

  2. pat

    merci

  3. pat

    +1

Laisser un commentaire