La lecture à portée de main
Description
Sujets
Informations
Publié par | Sogoz |
Nombre de lectures | 88 |
Langue | Français |
Extrait
Universite de Montreal
G eneration integree de textes et de graphiques statistiques
par
Massimo Fasciano
D epartement d’informatique et de recherche operationnelle
Faculte des arts et des sciences
These presentee alaFaculte des etudes superieures
en vue de l’obtention du grade de
Philosophi Doctor (Ph.D.)
en informatique
Mai 1996
c Massimo Fasciano, 1996
Universite de Montreal
Faculte des etudes superieures
Cette these intitulee:
G eneration integree de textes et de graphiques statistiques
presentee par:
Massimo Fasciano
a ete evaluee par un jury compose des personnes suivantes:
Jean Vaucher (president-rapporteur)
Guy Lapalme (directeur de recherche)
Richard Kittredge (membre du jury)
Laurence Danlos (examinateur externe)
These acceptee le 28 mai 1996
iii
Sommaire
Cette these s’interesse au problemedelageneration integree de textes et de gra-
phiques dans le cadre des rapports statistiques. Les graphiques et le texte sont deux
m edias tres di erents. Heureusement, lorsque leur integration est bien e ectu ee, ils se
completent a merveille: une image permet de montrer alors qu’un texte permet de de-
crire. Cette complementariteesttres importante dans les rapports statistiques acause
de la nature de l’information apresenter. En e et, ces rapports cherchent apresenter
une information tres dense tout en s’assurant que le lecteur en retient les points essen-
tiels. L’union des deux medias facilite enormement la tac^ he car les graphiques nous
donnent une vue d’ensemble alors que le texte permet de cibler les details interessants.
Le modele presente dans cette these s’attaque au probleme en etablissant un en-
semble de criteres essentiels alageneration automatique de rapports statistiques. Les
criteres etudies sont l’intention du redacteur, les types des variables apresenter, les
relations entre ces variables, ainsi que les valeurs des donnees. Quelques-uns de ces
facteurs ont deja eteexamines par d’autres chercheurs, en general de fa con super -
cielle, mais jamais dans un cadre uni e. Gr^ace au modele uni e que nous presentons
dans cette these, nous avons realise un prototype de generateur de rapports nomme
PostGraphe.Cesysteme genere des rapports statistiques contenant du texte et des
graphiques en se servant d’une description annotee des donnees apresenter. Les an-
notations utilisees correspondent aux criteres etablis dans le modele theorique. Ainsi,
l’utilisateur peut speci er au syst eme ses intentions (comparaison, evolution, repar-
tition, correlation,...),lestypesdesdonnees apresenter (temporelles, numeriques,
iv
ordonnees, ...) etles relationsentre les donnees (ex: les pro ts en fonction des an-
n ees). Le systeme examine aussi les valeurs des donnees (ecarts entre les extremes,
nombre de valeursapresenter) pour e ectuer ses choix. PostGraphe est ecrit en Prolog
Aet produit des rapports en LT X contenant des gures PostScript.E
v
Table des matieres
1 Introduction 1
1.1 Problematique:communicationpersonne-machine........... 1
1.2 Notre approche aceprobleme................ 4
1.3 Integrationdesgraphiquesetdutexte...... 5
1.4 L’intention du redacteur........ 6
1.5 Presentation de la these................. 7
2Travauxanterieurs 9
2.1 Conception de presentations....................... 9
2.1.1 Lastructuredesgraphiques.. 10
2.1.2 Lafonctiondesgraphiques......... 1
2.1.3 Laperceptiondesgraphiques ............ 13
2.2 Systemes de generationautomatique ....... 18
2.2.1 Generationautomatiquedegraphiques....... 18
2.2.2 Generationautomatiquedetexte................ 23
2.2.3 Integrationdegraphiquesetdetexte........ 28
2.3 Resume .................................. 34
3 Formes d’expression 35
3.1 Lesgures................................. 36
3.1.1 Lestableaux 37
3.1.2 Lesgraphiquesstatistiques......... 43
3.2 Letexte............................ 60
vi
3.2.1 Comparaisondestypesdetexte................. 62
3.2.2 Legendestextuelesdanslesrapportsstatistiques . 63
3.2.3 Textecontinudanslesrapportsstatistiques .......... 6
3.2.4 Techniquesdemiseenpagedutexte........ 69
3.3 Resume .................................. 74
4 Choix d’une forme d’expression 75
4.1 Donnees et leurs proprietes........................ 76
4.1.1 Les donneesbrutes 77
4.1.2 Lestypes .................. 78
4.1.3 Les clesrelationneles................. 83
4.2 Lesintentions......... 85
4.2.1 Clasicationdesintentions.. 85
4.2.2 Eetdesintentionssurletexteetlesgraphiques........ 90
4.2.3 Groupementd’intentions............... 95
4.3 Resume ....................... 97
5Delatheorie alapratique 99
5.1 Points d’influence majeurs sur la plani cation ............. 9
5.2 Architectured’unplanicateurderapports......... 100
5.3 Un modele plus realiste.......................... 102
5.4 Choix et compromis dans le systeme PostGraphe ...... 105
5.4.1 Lestypes .................. 106
5.4.2 Les clesrelationneles................. 108
5.4.3 Les intentions du redacteur ........ 109
5.4.4 Planic