Nous avons jusqu'à maintenant opéré des transformations d'arbres XML. Nous avions un document XML en entrée et produisions un document XML différent en sortie, basé sur des informations contenues dans le document initial. Il est également possible de produire en sortie des documents au format html. Supposons que nous ayons, comme au premier exemple, la sortie XML d'un étiqueteur : <?xml version="1.0"
encoding="iso-8859-1"?>
et que nous voulions visualiser ce document de la manière suivante :<doc> <taggersent> <taggertoken wordform="Il" lemma="il" pos="PRO"/> <taggertoken wordform="était" lemma="être" pos="VER:sg"/> <taggertoken wordform="une" lemma="un" pos="DET:femi:sg"/> <taggertoken wordform="fois" lemma="fois" pos="NOM:femi:sg"/> <taggertoken wordform="," lemma="," pos="PUN"/> <taggertoken wordform="les" lemma="le" pos="DET:masc:pl"/> <taggertoken wordform="voleurs" lemma="voleur" pos="NOM:masc:pl"/> <taggertoken wordform="étaient" lemma="étayer|être" pos="VER:pl"/> <taggertoken wordform="dans" lemma="dans" pos="PRP"/> <taggertoken wordform="la" lemma="le" pos="DET:femi:sg"/> <taggertoken wordform="forêt" lemma="forêt" pos="NOM:femi:sg"/> <taggertoken wordform="." lemma="." pos="PUN"/> </taggersent> <taggersent> <taggertoken wordform="Ils" lemma="il" pos="PRO"/> <taggertoken wordform="étaient" lemma="étayer|être" pos="VER:pl"/> <taggertoken wordform="tous" lemma="tout" pos="PRO"/> <taggertoken wordform="assis" lemma="asseoir" pos="VER:pper:masc:pl"/> <taggertoken wordform="autour" lemma="autour" pos="ADV"/> <taggertoken wordform="du" lemma="du" pos="PRP:DET:masc:sg"/> <taggertoken wordform="feu" lemma="feu" pos="NOM:masc:sg"/> <taggertoken wordform="." lemma="." pos="PUN"/> </taggersent> </doc>
C'est à dire quelque chose comme ça... Pour information, le code HTML ressemble à ça... La feuille de style qui a spécifié cette tansformation (XML vers HTML) est la suivante :
|