Perplexity AI et l’utilisation de Bing

Perplexity AI est un moteur de recherche conversationnel qui combine un modèle de langage IA avec la puissance du moteur de recherche Bing pour fournir des réponses précises, actualisées et sourcées aux questions des utilisateurs​. Autrement dit, il exploite l’index web de Bing afin d’obtenir en temps réel les informations pertinentes, puis intègre ces résultats dans la réponse générée par l’IA en citant les sources.

Interrogation de Bing par Perplexity

Dès qu’un utilisateur pose une question, Perplexity l’utilise pour effectuer une recherche web via Bing. Concrètement, la requête de l’utilisateur (formulée en langage naturel) est envoyée au moteur de recherche Bing, qui sert de système de récupération d’informations pour Perplexity​. Grâce à l’intelligence du modèle de langage, la question peut être comprise de façon sémantique et transformée en termes de recherche appropriés, même si elle est formulée de manière informelle ou complexe. Perplexity profite ainsi de la capacité de Bing à interpréter les requêtes naturelles et à trouver des résultats pertinents au-delà de simples correspondances de mots-clés​

Perplexity agit en intermédiaire : il comprend l’intention de la question utilisateur via son modèle de langage, puis déclenche en coulisse une interrogation du moteur Bing correspondant à cette intention. Cela lui permet d’accéder à l’immense index web de Bing sans que l’utilisateur n’ait à quitter l’interface de Perplexity.

Récupération et traitement des résultats Bing

Une fois la requête soumise à Bing, Perplexity enchaîne par une série d’étapes pour récupérer et traiter les résultats :

  1. Récupération des résultats pertinents : Bing retourne une liste de résultats (liens web) associés à la requête. Perplexity analyse ces résultats et sélectionne les pages les plus pertinentes, généralement les tout premiers liens retournés ou des snippets mis en avant par le moteur​. En s’appuyant sur l’index Bing, le système obtient rapidement les pages web susceptibles de contenir la réponse à la question.
  2. Extraction du contenu des pages : Pour chacune des pages sélectionnées, Perplexity récupère le contenu textuel. Cela implique de crawler les pages concernées via l’API Bing afin d’en extraire le texte. Perplexity a d’ailleurs développé son propre robot d’exploration, PerplexityBot, capable de parcourir les liens et de rapatrier le contenu tout en respectant les directives robots.txt des sites​. Le texte brut des pages web est alors nettoyé (pour enlever le code HTML, menus, etc.) et préparé en vue de son analyse.
  3. Analyse et filtrage de l’information : Le contenu collecté est ensuite passé au crible par le système d’IA. Le modèle de langage parcourt les pages et repère les passages qui répondent précisément à la question posée​. Perplexity peut également classer ou réordonner les informations obtenues en fonction de leur pertinence contextuelle (re-ranking), pour s’assurer que les données les plus utiles et fiables sont mises en avant. L’objectif est d’isoler les faits et éléments de réponse clés présents dans les documents, tout en écartant les portions hors sujet ou moins fiables. À ce stade, Perplexity bénéficie du classement intrinsèque de Bing (qui met en avant des sources faisant autorité), ce qui facilite l’identification des contenus de qualité. En combinant cette étape de filtrage avec la compréhension contextuelle du LLM, le système synthétise un ensemble de connaissances prêtes à être formulées en réponse.

Intégration des résultats dans les réponses de Perplexity

Après avoir identifié les informations pertinentes dans les pages web, Perplexity intègre ces résultats dans la réponse finale fournie à l’utilisateur. Cette étape se fait via le modèle de langage (LLM) qui génère une réponse formulée en langage naturel en s’appuyant exclusivement sur le contenu recueilli précédemment. Durant la génération, chaque information clé est assortie d’une citation qui renvoie vers sa source d’origine.

Concrètement, le texte de la réponse inclut des références numérotées correspondant aux pages web consultées, permettant à l’utilisateur de vérifier d’un clic où l’IA a trouvé telle ou telle information.

Cette intégration des résultats de Bing dans la réponse vise à fournir non seulement une réponse concise, mais aussi justifiable et traçable. Perplexity met un point d’honneur à la transparence : le modèle a été entraîné de façon à ne pas affirmer de faits qui ne soient pas soutenus par les sources récupérées​. Ainsi, si une information ne figure pas dans les résultats Bing ou dans le corpus accessible, l’IA évitera de l’inventer. Cette méthodologie, inspirée des pratiques académiques de citation, aide à minimiser les hallucinations de l’IA en liant strictement le contenu généré aux données vérifiées​.

Le résultat est une réponse de style conversationnel, directement utilisable, tout en conservant la fiabilité d’un moteur de recherche traditionnel grâce aux sources indiquées.

À mesure que l’utilisateur pose des questions de suivi dans le fil de discussion, Perplexity peut effectuer de nouvelles recherches Bing en tenant compte du contexte déjà établi. Le système maintient la conversation cohérente tout en actualisant les informations si nécessaires, intégrant à chaque itération les nouveaux résultats obtenus dans ses réponses, toujours avec citations à l’appui.

Interaction technique entre Perplexity AI et Bing

D’un point de vue technique, l’intégration entre Perplexity et Bing se fait via l’API de recherche Bing permettant d’interroger Bing en temps réel. Lorsque Perplexity reçoit une question, son backend envoie une requête vers Bing via une requête REST à l’API Bing Web Search avec les mots-clés de la question. Bing renvoie alors les résultats sous forme structurée JSON contenant titres, extraits et URLs des pages. Perplexity peut exploiter directement ces données : les extraits (snippets) fournis par Bing donnent un aperçu du contenu, et les URLs permettent de récupérer le texte complet si nécessaire. Cette communication machine-à-machine entre Perplexity et Bing est transparente pour l’utilisateur, et elle tire parti de l’infrastructure éprouvée de Bing pour la recherche web​.

Il est avéré qu’aux débuts de Perplexity (2022), la plateforme s’appuyait quasi entièrement sur Bing pour alimenter son module de recherche, en combinaison avec les modèles d’OpenAI pour la génération du texte de réponse​.

Ce choix stratégique a permis à Perplexity de lancer rapidement son service en bénéficiant du gigantesque index de Bing et de son algorithme de classement, plutôt que de devoir constituer immédiatement son propre index web. Cette interaction a probablement été facilitée par les API que Microsoft met à disposition (Bing Search API) et possiblement par une collaboration technique entre Perplexity et Microsoft Bing, compte tenu des volumes de requêtes impliqués.

Au fil du temps, Perplexity a fait évoluer son architecture pour gagner en autonomie. L’entreprise a développé son propre crawler PerplexityBot et un système d’indexation/ranking interne, ce qui lui permet d’enrichir ou de mettre en cache certaines données du web sans dépendre exclusivement de Bing​.

Néanmoins, Bing reste un composant important de son pipeline, notamment pour offrir une couverture exhaustive du web et obtenir rapidement des résultats à jour. En pratique, on peut imaginer que Perplexity utilise une combinaison de sources : son index maison pour les contenus déjà découverts fréquemment consultés, et Bing (ou d’autres moteurs tiers) pour compléter les informations manquantes ou trop récentes.

L’intégration profonde entre le LLM de Perplexity et le moteur de recherche est un aspect technique clé. Les fondateurs indiquent avoir conçu une infrastructure d’entraînement conjointe qui lie étroitement le module de recherche web et le modèle de langage. Cela signifie que le modèle d’IA a été entraîné end-to-end avec la boucle de recherche incluse, de sorte qu’il apprend à utiliser les résultats Bing pour formuler ses réponses​.

Cette approche améliore la pertinence des réponses et réduit les hallucinations, car le modèle apprend à s’appuyer sur les données réelles récupérées plutôt que sur sa seule connaissance interne. En d’autres termes, Bing et le modèle de Perplexity travaillent main dans la main : Bing fournit les faits bruts et à jour, et l’IA les transforme en réponse cohérente.

Chaque requête utilisateur sur Perplexity déclenche une synergie technique entre le moteur de recherche Bing et le modèle conversationnel de Perplexity. Bing apporte à Perplexity la richesse de son index web en temps réel, et Perplexity apporte à l’utilisateur une réponse synthétique en langage naturel, en s’assurant de toujours intégrer les résultats de Bing dans la réponse de manière transparente (via des citations) et fiable. Ce mariage de la recherche et de la génération de langage permet à Perplexity AI de fournir une expérience de recherche innovante mêlant la précision factuelle d’un moteur comme Bing et la commodité d’un assistant intelligent conversationnel​.

Chez HyperLinker, nous nous assurons que tous nos sites exclusifs soient correctement indexés pas les principaux moteurs de recherches (Bing, Google ...), mais également par les Crawlers des principaux LLM afin de vous garantir une indexation rapide et complète !

Sources : allthings.how, ethanlazuk.com, hyscaler.com

Prêts à Tester Hyperlinker ?

Inscrivez-vous dès maintenant et commencez à améliorer vos positions sur Google !