Scannez pour télécharger l’application Gate
qrCode
Autres options de téléchargement
Ne pas rappeler aujourd’hui

Parallel Web Systems présente l'API de recherche : la recherche web la plus précise pour les agents IA

En Bref

Parallel Web Systems a lancé l’API de recherche Parallel Search pour fournir des données pertinentes, améliorer la précision, réduire les coûts et renforcer l’efficacité des flux de travail basés sur des agents.

Parallel Web Systems présente Search API pour agents IA, construit avec une infrastructure propriétaire d’indexation et de récupération

Parallel Web Systems, une startup axée sur la création d’une nouvelle infrastructure web adaptée aux agents IA, a lancé l’API Parallel Search, un outil de recherche web conçu spécifiquement pour optimiser la livraison de données web pertinentes et efficaces en tokens, au coût le plus bas. Cette innovation vise à fournir des réponses plus précises, à réduire le nombre de tours de recherche et à diminuer les coûts pour les agents IA.

Les moteurs de recherche traditionnels sont conçus pour les utilisateurs humains. Ils classent les URLs en supposant que les utilisateurs cliqueront sur une page, en optimisant pour les recherches par mots-clés, les taux de clics et la mise en page des pages destinée à la navigation, le tout en millisecondes et à coût minimal. La première génération d’API de recherche basées sur l’IA a tenté d’adapter ce modèle centré sur l’humain pour l’IA, mais n’a pas entièrement répondu aux besoins spécifiques des agents IA.

Contrairement aux utilisateurs humains, la recherche IA nécessite une approche différente : au lieu de classer les URLs pour des clics humains, l’objectif est de déterminer les tokens les plus pertinents à placer dans la fenêtre de contexte d’un agent IA pour l’aider à accomplir une tâche. Le but n’est pas d’optimiser l’engagement humain, mais d’améliorer le raisonnement et la prise de décision au sein du modèle IA.

Cette nouvelle architecture de recherche inclut plusieurs innovations clés : elle utilise des objectifs sémantiques qui vont au-delà de la simple correspondance de mots-clés pour saisir l’intention de l’agent, privilégie la pertinence des tokens plutôt que les métriques de page centrées sur l’humain, fournit une information condensée et de haute qualité pour le raisonnement, et résout des requêtes complexes en un seul appel de recherche au lieu de plusieurs étapes.

En adoptant cette conception de recherche axée sur l’IA, les agents peuvent accéder à des tokens web plus riches en informations dans leur fenêtre de contexte, ce qui entraîne moins d’appels de recherche, une meilleure précision, une réduction des coûts et une latence moindre.

Avancer la recherche web complexe et multi-sources pour les agents IA

Alors que de nombreux systèmes de recherche existants se concentrent sur des questions simples, la nécessité d’une recherche plus complexe et multifacette devrait augmenter. Les utilisateurs et les agents IA auront de plus en plus besoin de réponses impliquant la synthèse d’informations provenant de plusieurs sources, le raisonnement sur des tâches complexes et l’accès à du contenu web plus difficile à atteindre.

Pour répondre à cette demande croissante, Parallel a évalué la performance de son API de recherche sur divers benchmarks, allant de tâches multi-sauts difficiles (par exemple BrowseComp) à des requêtes plus simples (par exemple SimpleQA).

Parallel a démontré un avantage sur les requêtes plus complexes — celles qui couvrent plusieurs sujets, nécessitent une compréhension approfondie de contenus difficiles à explorer ou impliquent la synthèse d’informations dispersées. Sur des benchmarks conçus pour le raisonnement multi-sauts, tels que HLE, BrowseComp, WebWalker, FRAMES et Batched SimpleQA, Parallel a non seulement offert une précision supérieure, mais aussi résolu les requêtes plus efficacement, en utilisant moins d’étapes de raisonnement.

Les API de recherche traditionnelles nécessitent souvent plusieurs recherches séquentielles, ce qui augmente la latence, étend la fenêtre de contexte, alourdit le coût en tokens et réduit la précision. À l’inverse, l’approche de Parallel permet de résoudre des requêtes plus complexes en un seul appel de recherche, entraînant moins de requêtes séquentielles, une meilleure précision, des coûts réduits et une latence plus faible.

Lorsqu’elle est testée sur des benchmarks plus simples à saut unique comme SimpleQA, impliquant des questions factuelles directes, Parallel continue de bien performer, même si le potentiel d’amélioration de la précision est plus limité dans ces scénarios en raison de la nature des requêtes.

La capacité de Parallel à atteindre des résultats à la pointe de la technologie résulte de deux années de développement d’une infrastructure robuste pour optimiser chaque couche du processus de recherche, en améliorant continuellement la performance via des boucles de rétroaction. Le système se concentre sur l’indexation de contenus web difficiles à explorer, comme les PDFs multimodaux, longs, ou les sites riches en JavaScript, tout en minimisant l’impact sur les propriétaires de sites. L’index web de Parallel est l’un des plus rapides en croissance, avec plus d’un milliard de pages rafraîchies quotidiennement.

Pour le classement, Parallel adopte une approche différente de celle des moteurs traditionnels. Au lieu de classer les URLs selon le taux de clics humain, il se concentre sur l’identification des tokens les plus pertinents et autoritaires pour le raisonnement avec de grands modèles de langage (LLM). Les modèles propriétaires de Parallel évaluent la pertinence des tokens, l’autorité des pages et des domaines, l’efficacité de la fenêtre de contexte, et la validation croisée entre sources, en privilégiant la qualité plutôt que les métriques d’engagement.

API de recherche Parallel : donner aux systèmes IA des données web de haute qualité en temps réel

Aujourd’hui, les développeurs les plus avancés choisissent de construire et déployer des systèmes IA en utilisant une recherche alimentée par Parallel. Ces organisations ont testé diverses alternatives et reconnaissent que la qualité des données web influence directement les décisions prises par leurs agents IA. Que ce soit l’agent de codage Sourcegraph Amp résolvant des bugs, Claygent optimisant chaque décision de mise sur le marché (GTM), Starbridge découvrant des RFP gouvernementaux, ou une grande compagnie d’assurance traitant des sinistres plus efficacement que des souscripteurs humains, la performance de ces systèmes dépend de la précision et de la pertinence des données web sur lesquelles ils s’appuient.

L’API de recherche de Parallel sert de infrastructure centrale supportant ses Web Agents. Par exemple, l’API Task de Parallel, qui gère des requêtes complexes d’enrichissement et de recherche multi-étapes, repose sur l’API de recherche. Chaque requête Task en production s’appuie sur la Search API pour fonctionner parfaitement en arrière-plan.

Cette approche architecturale établit une norme élevée pour Parallel, car toute amélioration en performance, latence ou qualité de recherche impacte directement les systèmes en production traitant des millions de requêtes chaque jour. Toute inefficacité ou inexactitude dans la Search API se fait immédiatement sentir dans les produits qui en dépendent.

Ainsi, l’infrastructure de Parallel est constamment affinée et éprouvée dans les conditions réelles des charges de travail basées sur des agents. La clé pour une tâche efficace pour un agent consiste à maximiser le signal tout en minimisant le bruit dans sa fenêtre de contexte. L’API de recherche Parallel garantit que les agents reçoivent le contexte le plus pertinent et compressé du web, améliorant leur capacité à accomplir leurs tâches avec précision et efficacité.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)