Google Discover : décryptage de l’algo de recommandation

Temps de lecture estimé : 10 minutes

Points clés à retenir

  • Google Discover fonctionne avec un article « Seed » qui déclenche une cascade de recommandations connexes
  • Le système extrait des « facettes » (entités, topics, formats) plutôt que de se baser uniquement sur le sujet
  • L’algo balance entre exploitation (contenu similaire) et exploration (découverte large)
  • Un signal « CURIOSITY » pourrait piloter la phase d’exploration et de diversification
  • Comprendre ce mécanisme permet d’optimiser sa stratégie de contenu pour Discover

Le paradoxe Discover

Entre nous, j’ai passé un temps fou à analyser Google Discover ces derniers mois. Et franchement, on a tous vécu cette expérience frustrante : tu scrolles ton feed, tu tombes sur un article parfait qui répond exactement à ce que tu cherchais hier soir. Puis deux swipes plus tard, pouf, un contenu totalement WTF qui n’a rien à voir.

Pendant longtemps, j’ai cru que l’algo déconnait complètement. Mais après avoir étudié des dizaines de cas, testé différents patterns d’interactions et analysé les recherches disponibles sur le sujet, j’ai réalisé un truc : ce n’est pas un bug, c’est une feature. Google Discover ne suit pas une logique éditoriale classique. Il joue sur plusieurs tableaux en même temps.

Concrètement, l’algorithme utilise un système de « Seed » (article déclencheur) couplé à des facettes multiples pour recommander du contenu. Ce qui ressemble à du random est en fait une alternance calculée entre exploitation et exploration. Dans cet article, je vais vous décortiquer ce mécanisme avec des exemples concrets et des insights que j’ai pu observer.

L’article Seed : point de départ de tout

Ce qu’il faut comprendre, c’est que tout part d’un article que vous cliquez dans votre feed. Cet article devient ce qu’on appelle le « Seed » – littéralement la graine qui va faire pousser une série de recommandations connexes. Quand vous cliquez dessus, puis revenez au feed et continuez à scroller, Discover recalcule en temps réel vos intérêts à court terme.

Je me suis amusé à tracer ce phénomène sur plusieurs jours. À chaque fois qu’un Seed est activé, l’algo déclenche une cascade de contenus reliés. Mais reliés comment ? C’est là que ça devient intéressant.

Comment ça se déclenche

D’après mes tests répétés, voici les interactions qui activent cette logique de recommandation :

  • Clic + retour au feed + scroll : le trigger le plus classique. Vous cliquez sur un article, vous revenez en arrière, vous scrollez et bam, le feed se recharge avec des contenus connexes
  • « Voir plus » sur certaines cartes : notamment sur les posts X.com ou les AI Overviews. Le simple fait de déplier du contenu peut servir de signal
  • Dwell time : le temps passé sur une carte compte aussi, même sans clic complet

Attention aux likes

Pour être totalement transparent, les likes fonctionnaient il y a quelques mois. Mais j’ai remarqué un changement de comportement récent. Aujourd’hui, liker un article ne déclenche plus systématiquement cette cascade de recommandations. Google a probablement ajusté le poids de ce signal, considérant peut-être qu’un like est moins engageant qu’un clic complet.

Astuce : Si vous voulez vraiment influencer votre feed Discover, privilégiez les clics complets avec un minimum de temps de lecture plutôt que les likes rapides.

Connexe ne veut pas dire similaire

Voici où la plupart des gens se plantent dans leur compréhension de Discover. On s’attend à ce que « article connexe » signifie « article sur le même sujet ». Mais non. L’algo ne raisonne pas comme un rédacteur en chef.

Plus précisément, prenons un exemple réel que j’ai observé. Seed : « Raising Cane’s offre un gobelet phosphorescent limité pour Halloween ». Les articles connexes proposés ensuite étaient un mix bizarre :

  • Des articles sur Halloween (logique)
  • Des articles sur d’autres chaînes de restaurants qui n’ont RIEN à voir avec Halloween
  • Des articles sur les stratégies marketing des fast-foods
A Lire :  LLMs.txt : Guide Complet 2025 (Création + Installation)

Pourquoi ce bordel apparent ? Parce que l’algo n’a pas extrait « Halloween » comme thème unique. Il a détecté plusieurs facettes : Halloween (événement), Raising Cane’s (entité marque), restauration rapide (topic), marketing produit (topic), édition limitée (concept).

Chacune de ces facettes peut servir de pivot pour générer des recommandations. Ce qu’on appelle « connexe » dans Discover, c’est en fait « partage au moins une facette avec le Seed ».

Google Discover : 7 questions brûlantes que vous n’osiez pas poser

Le système de facettes derrière l’algo

Bon, parlons technique. Le cœur du système repose sur ce que j’appelle des « facettes » – des attributs extraits automatiquement de chaque article Seed. Si vous avez déjà bossé avec Elasticsearch ou des systèmes de faceted search, vous voyez le principe.

Les 4 types de facettes

D’après mes observations, Google Discover extrait principalement quatre types de facettes :

Type de facetteDescriptionExemple
Entities (MIDs)Entités du Knowledge GraphTaylor Swift, Real Madrid, iPhone 16
TopicsCatégories thématiques largesSport, Tech, Entertainment, Politique
Format/InventoryType de contenu ou plateformeVidéo YouTube, Article long, Post social
Geo/LanguageLocalisation et langue du contenuFrance, EN-US, Multilingue

Concrètement, chaque article que vous lisez est scanné pour extraire ces attributs. L’algo construit alors un graphe de connexions possibles avec d’autres contenus partageant une ou plusieurs facettes.

Le pipeline de recommandation

Le process complet ressemble à ça :

  1. Seed Detection : Vous cliquez sur un article, il devient le Seed
  2. Facet Extraction : Le système extrait entities + topics + format + geo
  3. Candidate Generation : Recherche de contenus partageant au moins une facette
  4. Ranking + Diversification : Classement par pertinence + injection de diversité
  5. Fallbacks : Si pas assez de candidats, élargissement des critères

Résultat : certains articles connexes sont ultra-proches (beaucoup de facettes communes), d’autres beaucoup plus larges (une seule facette partagée, souvent un topic générique).

Pivots larges vs pivots fins

Ce qui rend Discover fascinant, c’est cette capacité à jongler entre précision et découverte. L’algo peut choisir de pivoter sur une facette fine (entity-level) ou une facette large (topic-level). Ce choix change radicalement la nature des recommandations.

Pivot large : Topic-level

Imaginons un article sur une émission de téléréalité française type « Koh-Lanta ». Si l’algo pivote sur des topics larges comme « Television » ou « Entertainment », il peut vous proposer :

  • D’autres émissions de télé-réalité (Big Brother, Top Chef)
  • Des actus sur des chaînes TV
  • Des analyses de l’industrie audiovisuelle
  • Même des séries Netflix si le topic est assez large

Cette stratégie élargit massivement le scope. Parfait pour la découverte, mais peut sembler déconnecté si vous cherchiez spécifiquement du contenu sur Koh-Lanta.

Pivot fin : Entity-level

À l’inverse, si l’algo détecte des entités fines partagées (noms de candidats, saison spécifique, animateur), les recommandations restent ultra-focalisées :

  • Autres articles sur la même saison de Koh-Lanta
  • Interviews des candidats mentionnés
  • Coulisses de l’émission
  • Analyses d’épisodes précis

Cette approche satisfait les utilisateurs qui veulent approfondir un sujet précis. C’est ce que j’ai observé en testant avec des contenus très nichés : tant que les entities matchent, l’algo reste cohérent.

Le multilingue dans Discover

Un truc assez ouf que j’ai remarqué : Discover peut vous balancer des articles dans d’autres langues, même si votre Seed était en français. Concrètement, j’ai vu des Seeds en anglais générer des recommandations en espagnol, allemand, ou même français.

Ça arrive surtout quand :

  • Le pivot est un topic ultra-large (Sport, Football, Tech)
  • Votre profil Google indique que vous lisez du contenu multilingue
  • Le sujet est intrinsèquement international (Ligue des Champions, Oscars, CES Vegas)

Plus précisément, les contraintes linguistiques semblent se relâcher dans les phases d’exploration. L’algo considère probablement qu’un fan de foot intéressé par le PSG peut aussi vouloir lire des analyses de Marca (journal sportif espagnol) ou de La Gazzetta dello Sport, même s’il ne parle pas couramment ces langues.

Attention : Si vous ne voulez pas de contenu multilingue, vérifiez les paramètres de langues dans votre compte Google. Discover s’appuie dessus pour déterminer ce qu’il peut vous proposer.

CURIOSITY : le mode exploration

Alors là, on entre dans le domaine de l’hypothèse, mais c’est vraiment intéressant. En creusant les patterns observés, j’ai identifié un codename qui revient : « CURIOSITY ». Je pense que c’est un signal interne qui marque une phase d’exploration intentionnelle de l’algo.

A Lire :  SEO Summit 2025 : les événements clés à ne pas manquer

Ce qu’il faut comprendre, c’est que les systèmes de recommandation modernes jouent constamment entre deux stratégies :

  • Exploitation : Recommander du contenu très similaire à ce que vous avez déjà aimé (safe bet)
  • Exploration : Tester des contenus plus éloignés pour découvrir de nouveaux intérêts potentiels

CURIOSITY pourrait être le marqueur technique de cette phase d’exploration. Concrètement, après vous avoir servi 2-3 articles très proches du Seed (exploitation), l’algo activerait ce mode pour élargir via :

  • Des topics ultra-larges (Entertainment, Sports)
  • Des formats différents (si vous avez cliqué un article, il teste une vidéo YouTube)
  • Des contenus internationaux ou multilingues
  • Des sujets adjacents via des « bridge entities »

Pour être totalement transparent, je n’ai pas de confirmation officielle de Google sur ce point. Mais les patterns observés sur plusieurs centaines de sessions collent parfaitement avec ce modèle. Si quelqu’un de chez Google lit ça et peut confirmer ou infirmer, je suis preneur !

Les 3 stratégies de diversification

OK, récapitulons. J’ai identifié trois grandes familles de diversification que Discover utilise pour passer d’un Seed à des recommandations connexes. Comprendre ces stratégies vous permet d’anticiper ce que l’algo va vous proposer.

1. Diversification sémantique

La plus évidente. L’algo pivote sur des entités précises (proximité forte) ou des topics larges (élargissement). C’est le mécanisme de base que j’ai décrit plus haut avec les exemples Koh-Lanta.

  • Entity-pivot : Articles partageant des entités fines → cohérence sémantique forte
  • Topic-pivot : Articles dans la même catégorie large → diversité thématique

2. Diversification par « Bridge Entity »

Voilà un concept cool. Parfois, l’algo utilise une entité très générale comme pont entre des contenus apparemment déconnectés. Exemple concret : vous lisez un article sur une chocolaterie artisanale en Suisse. Le Seed contient l’entité « Chocolat ».

Via cette bridge entity, Discover peut vous recommander :

  • Un article sur les bienfaits du cacao pour la santé
  • Une vidéo sur la production de chocolat en Côte d’Ivoire
  • Un comparatif des meilleures marques de chocolat noir

Ces contenus n’ont rien à voir avec « chocolaterie artisanale suisse », mais ils partagent tous l’entité « Chocolat » comme pont. C’est une stratégie d’exploration via un attribut commun très large.

3. Diversification par format/inventory

Celle-ci est subtile mais super efficace. L’algo peut pivoter sur le format plutôt que sur le contenu. Concrètement, si vous cliquez sur une vidéo YouTube dans votre feed, Discover peut décider de vous recommander d’autres vidéos, peu importe le sujet.

Plus précisément, j’ai observé ce pattern plusieurs fois : après avoir cliqué une vidéo sur le sport, je me suis retrouvé avec des recommandations vidéo sur la tech, la cuisine, le voyage. Le pivot n’était pas le sujet mais le format « YouTube video ».

Google teste probablement votre appétence pour différents types de contenu. Si vous engagez sur des vidéos, l’algo va naturellement en pousser plus, en élargissant progressivement les topics.

Cas pratique : baseball, basket et bridging

Prenons un exemple réel que j’ai tracé. Seed : une vidéo intitulée « Colorado Rockies promeut Warren Schaeffer manager à temps plein ». Voici ce qui est apparu ensuite dans le feed :

  1. Article ultra-proche : « Braves engage un ancien coach des Twins comme pitching coach sous le nouveau manager Walt Weiss »

Là, on est dans du pivot entity-level pur. Les entités partagées sont nombreuses : MLB, poste de manager, actualités d’équipe, recrutement coaching staff. Cohérence parfaite.

  1. Article élargi : « Tyler Herro sur les 106 points du Heat… »

WTF, on passe du baseball au basket ? En réalité, le pivot s’est fait via des topics larges : « Sport professionnel américain », « Actualités sportives », « NBA/MLB ». L’algo a élargi le scope en gardant juste le contexte « sport US ».

Ce pattern montre clairement la stratégie : exploitation d’abord (articles très proches), puis exploration (élargissement thématique). Le même Seed génère deux types de recommandations radicalement différentes, mais toutes deux justifiées par au moins une facette commune.

Implications pour les créateurs de contenu

Bon, maintenant qu’on a décortiqué le mécanisme, parlons stratégie. Si vous créez du contenu et visez Discover (ce qui devrait être le cas en 2026), voici ce que j’ai appris :

Optimisez vos entités

Google utilise le Knowledge Graph pour identifier les entités. Plus votre contenu contient d’entités claires et reconnues, mieux c’est. Concrètement :

  • Mentionnez des personnalités, marques, lieux avec leur nom complet
  • Utilisez schema.org pour marquer les entités importantes
  • Créez des liens vers Wikidata/Wikipedia quand pertinent
A Lire :  Site pour Restaurer Liens Expirés : TOP 3 Outils 2025

Couvrez plusieurs facettes

Un article qui combine plusieurs facettes (entités + topics + format riche) a plus de chances d’être recommandé dans différents contextes. Par exemple, un article sur « L’utilisation de l’IA par Netflix pour ses recommandations » touche :

  • Entité : Netflix
  • Topics : IA, Streaming, Tech, Entertainment
  • Format : Article avec potentiellement une vidéo intégrée

Ce contenu peut être recommandé depuis un Seed sur Netflix, sur l’IA, sur le streaming, ou sur les algos de recommandation. Multiplicité des points d’entrée = plus de visibilité.

Testez différents formats

Si Discover peut pivoter sur le format, diversifiez vos contenus. Articles longs, vidéos YouTube, infographies, podcasts. Chaque format peut devenir un pivot de recommandation indépendant.

Pensez « bridge entities »

Identifiez les concepts généraux qui peuvent servir de ponts. Si vous écrivez sur un sujet niche, incluez des bridge entities qui ouvrent vers des sujets plus larges. Ça aide l’algo à vous placer dans des cascades de recommandations variées.

Questions Fréquentes

Pourquoi Google Discover me montre des articles non liés ?

Ce n’est pas un bug mais une stratégie d’exploration. L’algorithme alterne entre contenus très proches (exploitation) et contenus plus larges (exploration) pour tester de nouveaux intérêts. Les articles apparemment déconnectés partagent en réalité au moins une facette avec votre historique récent, même si ce n’est qu’un topic générique.

C’est quoi une facette dans Google Discover ?

Une facette est un attribut extrait d’un article : entité (personne, marque, lieu), topic (catégorie thématique), format (vidéo, article), ou géographie. L’algo utilise ces facettes pour trouver des contenus connexes. Plus un article a de facettes riches et identifiables, plus il peut être recommandé dans différents contextes.

Comment forcer Discover à me montrer plus de contenu pertinent ?

Privilégiez les clics complets avec du temps de lecture plutôt que les likes rapides. Interagissez régulièrement avec les sujets qui vous intéressent vraiment. Utilisez aussi la fonction « Ne plus voir ce type de contenu » pour affiner négativement. L’algo recalcule vos intérêts à court terme en permanence, donc soyez cohérent dans vos interactions.

Pourquoi je reçois des articles en anglais ou autres langues ?

Si le pivot utilisé est un topic très large (Sport, Tech) et que votre profil Google indique une compréhension multilingue, Discover peut proposer des contenus dans différentes langues. C’est surtout fréquent sur des sujets internationaux. Vérifiez vos paramètres de langue dans votre compte Google pour ajuster ce comportement.

Le mode CURIOSITY est-il confirmé par Google ?

Non, c’est une hypothèse basée sur des observations répétées de patterns d’exploration. Le codename « CURIOSITY » a été identifié dans certains contextes techniques, mais Google n’a pas communiqué officiellement sur ce mécanisme. Il reste cohérent avec les principes classiques d’exploitation/exploration des systèmes de recommandation modernes.

Ce qu’il faut en retenir

Entre nous, après avoir passé des dizaines d’heures à analyser Discover, je peux vous dire qu’il n’y a rien de random là-dedans. Ce qui ressemble à du chaos est en fait une orchestration complexe entre exploitation et exploration, pilotée par des facettes multiples.

Concrètement, chaque article que vous cliquez devient un Seed qui déclenche une cascade de recommandations. Ces recommandations ne suivent pas une logique éditoriale classique « même sujet = même thème », mais plutôt « partage au moins une facette détectable ».

Ce qu’il faut comprendre, c’est que Google jongle constamment entre vous proposer du contenu safe (exploitation via entities précises) et tester de nouveaux territoires (exploration via topics larges, formats alternatifs, bridge entities). Le mode CURIOSITY, s’il existe vraiment, serait le marqueur de cette phase d’exploration intentionnelle.

Pour les créateurs de contenu, la stratégie est claire : optimisez vos entités, couvrez plusieurs facettes, diversifiez les formats, et pensez aux bridge entities. Plus votre contenu est riche en attributs identifiables, plus il a de portes d’entrée possibles dans les cascades de recommandations.

Et surtout, acceptez que Discover ne soit pas un fil éditorial classique. C’est un système qui apprend en permanence, teste vos réactions, et affine ses modèles. Ce qui vous semble bizarre aujourd’hui fait peut-être partie d’un test qui finira par mieux vous connaître demain.