
-
Por Julien Klaine
- 25/03/2025 à 19:04
- Contenido
Perplexity AI es un motor de búsqueda conversacional que combina un modelo de lenguaje de IA con la potencia del motor de búsqueda Bing para proporcionar respuestas precisas, actualizadas y con fuentes a las preguntas de los usuarios. En otras palabras, aprovecha el índice web de Bing para obtener en tiempo real la información relevante, y luego integra estos resultados en la respuesta generada por la IA citando las fuentes.
Consulta de Bing por Perplexity
Tan pronto como un usuario hace una pregunta, Perplexity la utiliza para realizar una búsqueda web a través de Bing. Concretamente, la consulta del usuario (formulada en lenguaje natural) se envía al motor de búsqueda Bing, que actúa como sistema de recuperación de información para Perplexity. Gracias a la inteligencia del modelo de lenguaje, la pregunta puede ser comprendida semánticamente y transformada en términos de búsqueda adecuados, incluso si está formulada de manera informal o compleja. Perplexity aprovecha así la capacidad de Bing para interpretar consultas naturales y encontrar resultados relevantes más allá de simples coincidencias de palabras clave.
Perplexity actúa como intermediario: comprende la intención de la pregunta del usuario a través de su modelo de lenguaje y luego desencadena en segundo plano una consulta en Bing correspondiente a esa intención. Esto le permite acceder al enorme índice web de Bing sin que el usuario tenga que salir de la interfaz de Perplexity.
Recuperación y procesamiento de los resultados de Bing
Una vez enviada la consulta a Bing, Perplexity encadena una serie de pasos para recuperar y procesar los resultados:
- Recuperación de los resultados relevantes: Bing devuelve una lista de resultados (enlaces web) asociados con la consulta. Perplexity analiza estos resultados y selecciona las páginas más relevantes, generalmente los primeros enlaces devueltos o extractos destacados por el motor. Al basarse en el índice de Bing, el sistema obtiene rápidamente las páginas web que pueden contener la respuesta a la pregunta.
- Extracción del contenido de las páginas: Para cada una de las páginas seleccionadas, Perplexity recupera el contenido textual. Esto implica rastrear las páginas correspondientes a través de la API de Bing para extraer el texto. Además, Perplexity ha desarrollado su propio robot de exploración, PerplexityBot, capaz de recorrer los enlaces y recuperar el contenido respetando las directrices robots.txt de los sitios. Luego, el texto sin formato de las páginas web se limpia (para eliminar código HTML, menús, etc.) y se prepara para su análisis.
- Análisis y filtrado de la información: El contenido recopilado se examina a fondo mediante el sistema de IA. El modelo de lenguaje recorre las páginas y detecta los fragmentos que responden exactamente a la pregunta planteada. Perplexity también puede clasificar o reorganizar la información obtenida según su relevancia contextual (re-ranking) para asegurarse de que se destaquen los datos más útiles y confiables. El objetivo es aislar los hechos y elementos clave presentes en los documentos mientras se descartan las partes irrelevantes o menos confiables. En esta etapa, Perplexity se beneficia del sistema de clasificación de Bing (que destaca fuentes autorizadas), lo que facilita la identificación de contenido de calidad. Al combinar esta etapa de filtrado con la comprensión contextual del LLM, el sistema sintetiza un conjunto de conocimientos listo para ser formulado en una respuesta.
Integración de los resultados en las respuestas de Perplexity
Después de identificar la información relevante en las páginas web, Perplexity integra estos resultados en la respuesta final proporcionada al usuario. Esta etapa se realiza a través del modelo de lenguaje (LLM), que genera una respuesta formulada en lenguaje natural basándose exclusivamente en el contenido obtenido previamente. Durante la generación de la respuesta, cada información clave se acompaña de una cita que enlaza con su fuente de origen.
Concretamente, el texto de la respuesta incluye referencias numeradas correspondientes a las páginas web consultadas, permitiendo al usuario verificar con un solo clic dónde la IA encontró determinada información.
Esta integración de los resultados de Bing en la respuesta busca proporcionar no solo una respuesta concisa, sino también justificable y rastreable. Perplexity pone un gran énfasis en la transparencia: el modelo ha sido entrenado para no afirmar hechos que no estén respaldados por fuentes verificadas. Así, si una información no se encuentra en los resultados de Bing o en el corpus accesible, la IA evitará inventarla. Esta metodología, inspirada en las prácticas académicas de citación, ayuda a minimizar las alucinaciones de la IA al vincular estrictamente el contenido generado con datos verificables.
El resultado es una respuesta en estilo conversacional, directamente utilizable, que conserva al mismo tiempo la fiabilidad de un motor de búsqueda tradicional gracias a las fuentes indicadas.
A medida que el usuario hace preguntas de seguimiento en el hilo de conversación, Perplexity puede realizar nuevas búsquedas en Bing teniendo en cuenta el contexto previamente establecido. El sistema mantiene la conversación coherente mientras actualiza la información si es necesario, integrando en cada iteración los nuevos resultados obtenidos en sus respuestas, siempre con citas incluidas.
Interacción técnica entre Perplexity AI y Bing
Desde un punto de vista técnico, la integración entre Perplexity y Bing se lleva a cabo a través de la API de búsqueda de Bing, que permite interrogar Bing en tiempo real. Cuando Perplexity recibe una pregunta, su backend envía una petición a Bing a través de una solicitud REST a la API Bing Web Search con las palabras clave de la pregunta. Bing devuelve los resultados en un formato estructurado JSON que contiene títulos, fragmentos y URLs de las páginas. Perplexity puede explotar directamente estos datos: los fragmentos (snippets) proporcionados por Bing ofrecen una vista previa del contenido, y las URLs permiten recuperar el texto completo si es necesario. Esta comunicación máquina a máquina entre Perplexity y Bing es transparente para el usuario y aprovecha la infraestructura probada de Bing para la búsqueda web.
Se sabe que en los inicios de Perplexity (2022), la plataforma dependía casi por completo de Bing para alimentar su módulo de búsqueda, en combinación con los modelos de OpenAI para la generación del texto de respuesta.
Esta decisión estratégica permitió a Perplexity lanzar rápidamente su servicio aprovechando el gigantesco índice de Bing y su algoritmo de clasificación, en lugar de tener que construir de inmediato su propio índice web. Esta interacción probablemente se facilitó mediante las API que Microsoft pone a disposición (Bing Search API) y posiblemente a través de una colaboración técnica entre Perplexity y Microsoft Bing, dado el volumen de consultas involucrado.
Con el tiempo, Perplexity ha evolucionado su arquitectura para ganar autonomía. La empresa ha desarrollado su propio crawler PerplexityBot y un sistema interno de indexación/ranking, lo que le permite enriquecer o almacenar en caché ciertos datos de la web sin depender exclusivamente de Bing.
No obstante, Bing sigue siendo un componente importante de su pipeline, especialmente para ofrecer una cobertura exhaustiva del web y obtener rápidamente resultados actualizados. En la práctica, es probable que Perplexity utilice una combinación de fuentes: su propio índice para contenidos ya descubiertos y frecuentemente consultados, y Bing (u otros motores de terceros) para complementar la información faltante o más reciente.
La integración profunda entre el LLM de Perplexity y el motor de búsqueda es un aspecto técnico clave. Los fundadores han indicado que han diseñado una infraestructura de entrenamiento conjunta que vincula estrechamente el módulo de búsqueda web con el modelo de lenguaje. Esto significa que el modelo de IA ha sido entrenado de manera end-to-end con el bucle de búsqueda incluido, de modo que aprende a utilizar los resultados de Bing para formular sus respuestas.
Este enfoque mejora la relevancia de las respuestas y reduce las alucinaciones, ya que el modelo aprende a basarse en datos reales recuperados en lugar de depender únicamente de su conocimiento interno. En otras palabras, Bing y el modelo de Perplexity trabajan de la mano: Bing proporciona los hechos brutos y actualizados, y la IA los transforma en una respuesta coherente.
Cada consulta de usuario en Perplexity desencadena una sinergia técnica entre el motor de búsqueda Bing y el modelo conversacional de Perplexity. Bing aporta a Perplexity la riqueza de su índice web en tiempo real, y Perplexity ofrece al usuario una respuesta sintética en lenguaje natural, asegurándose siempre de integrar los resultados de Bing en la respuesta de manera transparente (a través de citas) y fiable. Esta combinación de búsqueda y generación de lenguaje permite a Perplexity AI proporcionar una experiencia de búsqueda innovadora que combina la precisión fáctica de un motor como Bing con la comodidad de un asistente inteligente conversacional.
En HyperLinker, nos aseguramos de que todos nuestros sitios exclusivos estén correctamente indexados por los principales motores de búsqueda (Bing, Google...), así como por los Crawlers de los principales LLM, para garantizarte una indexación rápida y completa.
Fuentes: allthings.how, ethanlazuk.com, hyscaler.com