"Billion pieces of reusable information can already be found across hundreds of millions web pages which embed RDF and Microformats. Start consuming this data today with Sindice Data Web services. "
Par exemple, lors d’une recherche sur un mot-clef, il est possible d’obtenir une page concernant la définition de ce mot, mais aussi les principaux domaines concernés, voire parfois des pages ayant une relation plus lointaine avec le mot originel. Dans ce cas, les données ne répondent pas ou plus à la requête, et pourtant on dispose tout de même d’informations souhaités.
De plus, l’ordre d’apparition des informations ne prend pas forcément en compte le contexte dans lequel la recherche est effectué, et considère comme pertinent une ressemblance maximum avec la demande, ainsi qu’un fort référencement (indicateur de popularité).
De plus, l’adaptation de la recherche en fonction du type de contenu (média, journaux, géolocalisation, etc) est nécessaire pour augmenter la pertinence des résultats retournés (inutile de consulter Picasa pour obtenir une musique).
Il faudrait aller plus loin dans votre argumentaire
Ces systèmes d’information conservent les données dans des bases (SQL) en y appliquant des indexations sur des éléments pertinents, et y interfacent des frontaux accessibles facilement via un navigateur Web (ex : Application web type script PHP, applets JAVA, …).
La normalisation des flux (ex : XML) permet la communication de divers éléments frontaux/terminaux, la mise en place d’architecture n-Tiers, et donc, l’interfaçage entre divers éléments communicants.
il manque toujours la prise en compte de la sémantique propre au langage humain. C’est en effet cette dernière qui permet de sélectionner l’information pertinente pour l’utilisateur.
l est donc malaisé pour une machine de retrouver une information précise suivant une langue, une tournure de phrase, et donc une signification variant d’un contexte à l’autre.