Info news wiki : Web sémantique

présentation

Le web sémantique tel que défini par le créateur du site Tim Berners-Lee est "une base de données, à certains égards comme une base de données mondiale" (Berners-Lee, 1998). Pour approfondir, M. Berners-Lee explique dans une interview accordée à IDG Now, les données sont exprimées sur l'ordinateur sous forme de fichiers associés à des applications traitant spécifiquement d'informations, par exemple, les données sur les calendriers, les systèmes bancaires , feuilles de calcul et application de base de données. . En regardant une page Web, les données ne sont pas clairement définies et ne sont associées à aucune des applications généralement présentes sur l'ordinateur. Le web sémantique permettra aux données d'interagir et de se connecter entre elles; il aboutira à un format de données commun pour toutes les applications, bases de données et sites Web (Moon, 1999). Le web sémantique ne consiste pas à construire un système d'intelligence artificielle qui permet aux ordinateurs de comprendre ce que les gens écrivent sur des sites Web; Il s'agit plutôt de rendre les sites Web plus compréhensibles et bien définis pour prendre en charge l'extraction automatique des données du contenu en ligne (Berners-Lee, 1998).

analyse

L'émergence du site Web et la façon dont le HTML a été coupé ont été dictées par la façon dont la société devrait se développer, du chat en ligne au transfert de fichiers vers des communautés haut de gamme via des blogs et des wikis. Le HTML ne se limitait pas au contenu Web, à la base de connaissances et aux fichiers d'aide adaptés en tant que format pour documenter les applications logicielles et fournir du matériel de formation. La révolution de la technologie Internet a permis à des entreprises comme Google d'indexer des sites; une pensée qui était farfelue, explique Tim Berners-Lee dans sa conférence au MIT. Les services Web ont évolué pour ouvrir la voie à des informations distribuées et à une programmation modulaire permettant l'interopérabilité entre les sites. Grâce à XML, les données d'un site peuvent être consultées par un autre en utilisant des protocoles et des normes communs pris en charge par les deux (Berners-Lee, 1998). XML définit des schémas qui traitent des champs de données, ce qui est requis est un système qui peut dire à l'ordinateur quel type d'informations (données) peut être dérivé d'une page (Moon, 1999). Avec Web 3.0, un site fournira des données qui peuvent être parcourues et extraites de plusieurs sites, ceci est le résultat du fait que le modèle sémantique des données en ligne est étroitement lié à une base de données relationnelle où les enregistrements de les données partagent les espaces communs qui les relient (Berners-Lee, 1998).

La solution fournie pour prendre en charge le Web sémantique se présente sous la forme de métadonnées qui décrivent les données contenues dans les pages Web. Le cadre de description des ressources (RDF) est une base pour la gestion des métadonnées; est la base que les ordinateurs peuvent utiliser pour échanger et interagir avec des applications Web (W3C RFC, 1999). Les applications pour RDF incluent les bibliothèques numériques, les catalogues en ligne et les systèmes d'indexation qui sont généralement associés au contenu et aux modèles de relation de contenu, publiés sur la plupart des sites Web. Les données RDF dans les portails commerciaux seront analysées et identifiées comme des ressources, des propriétés ou des déclarations de domaine transparentes.En outre, les spécifications seront fusionnées avec d'autres documents pour inclure un cadre de classe. Les classes organisées en hiérarchie contiennent un schéma qui peut être réutilisable en tant que définitions de métadonnées sur plusieurs plates-formes latérales. Les ressources créées dans cette hiérarchie peuvent être identifiées à l'aide d'un identificateur de ressource (URI), qui permet à un document donné à une machine avec cette identification d'être reconnu par le système et l'invite à creuser et à trouver des données similaires ( Berners-Lee, 1998).

implications

Le Web sémantique peut être la solution pour surmonter les limites des systèmes de gestion de l'information actuels dans la recherche et l'extraction de données à partir de sources non organisées. Le RDF vise à décrire toutes les données quels que soient leur caractère, leur emplacement, leur source ou leur type, le concept d'URI est plus riche pour identifier de manière unique chaque objet sur Internet (Berners-Lee, 1998). Les dorsales du Web sémantique sont des normes et des protocoles communs qui sont à la base de la représentation des connaissances; HTML, RDF, le langage d'ontologie de la description du langage de source de données (OWL) qui décrit ce qui se passe dans la machine, à l'exception de RDF1 qui est un langage de requête pour rendre les requêtes entre machines beaucoup plus faciles, tous sortent et collaborent pour apporter plus à Internet et des programmes plus intelligents qui rapprocheront Internet (Cleave, 2004).

La recherche actuelle et la mise en œuvre du réseau Abilene et du réseau Internet de la colonne vertébrale à haute performance Internet de nouvelle génération (NGI) reliant les principales universités et laboratoires de recherche des États-Unis constituent une bonne base pour faire du Web sémantique et représente la plate-forme idéale pour l'informatique en réseau, les bibliothèques numériques, les laboratoires virtuels et l'enseignement à distance (Abilene, Internet2). Internet2 ou I2 a été développé par un groupe d'universités en 1996, fournissant des normes de connectivité améliorées pour atteindre 10 Gbps (gigabits par seconde). Avec plus de 227 universités et bibliothèques connectées, des applications basées sur le réseau et des programmes expérimentaux peuvent s'exécuter sur ce réseau à large bande passante se nourrissant de la dernière technologie Gigabit Ethernet et de la version 6 du protocole IP (Reardon, 2004). Les standards du Web sémantique peuvent être la base du matériel et des données distribués sur ce réseau, fournissant la meilleure plate-forme de test pour explorer le plein potentiel et ce qui peut être réalisé.

conclusion

Tim Berners-Lee pense qu'avec le Web 3.0, nous pouvons réussir et que des choses fantastiques peuvent se produire, mais l'infrastructure doit être construite, les lois sur la confidentialité et la sécurité doivent être revues et respectées, de plus, le site Web doit rester ouvert pour les chercheurs permettent une amélioration et un développement continus. Le web sémantique commencera lorsque les individus concrétiseront le besoin de travailler sur le traitement des données, et penseront à collaborer avec leurs données, avec les informations de l'entreprise et du gouvernement (Moon, 1999).

références:

  1. Berners-Lee, Tim. 1998. Feuille de route sémantique sur le Web. L'équipe W3C. (14 octobre 1998) http://www.w3.org DesignIssues / Semantic (consulté le 16 juillet 2007)
  2. Lune, Peter. 1999. L'avenir du Web vu par son créateur. IDG World of IT Now (7 juillet 1999) http://www.itworld.com/Tech/4535/070709future/ (consulté le 14 juillet 2007)
  3. W3C RFC. 1999. Modèle et spécification de syntaxe, Resource Description Framework (RDF). W3 Consortium (5 janvier 1999) http://www.w3.org/TR/PR-rdf-syntax/ (consulté le 20 juillet 2007)
  4. Cleave, Kenith Van. 2004. Expérience pratique de la base de données de l'Université Regis. Université Regis. (14 novembre 2004) http: // trackit.arn.regis.edu/dba/Tesis%2520Papers/
    kvancleave_2004Bfinalreport_20041118.pdf (consulté le 16 juillet 2007)

  5. Abilene, Internet 2. http://www.internet2.edu/annualreport/2003/page06.html (consulté le 17 juillet 2007)
  6. Reardon, Marguerite. 2004. Internet2: 2004 et au-delà. CNET, News (24 août 2004) http: // news.com.com/2100-1034_3-5321053.html (consulté le 19 juillet 2007)