Centre National pour la Recherche
Université Toulouse Jean Jaurès
Institut Nicod
Agence Nationale pour la Recherche

Historique de la conception de la partie ALF de Symila

Info: Vous pouvez cliquer sur les images, puis utiliser la molette de la souris pour zoomer/dézoomer.

Pour quitter une image, il faut cliquer sur la partie blanche autour de l'image.

Symila version 1 : Permettre l'aquisition des données d'une carte de l'ALF

Schéma conceptuel : Schéma conceptuel 1 de l'ALF

Ce schéma traduit la relation de base entre les données de l’ALF : des Segments (groupe de mots en français) se réalisent en Réalisation (groupe de mots traduits dans un dialecte local) à un lieu donné.

Schéma physique : Schéma physique 1 de l'ALF

Symila version 2 : permettre la recomposition des phrases et phrases réalisées

Schéma conceptuel : Schéma conceptuel 2 de l'ALF

Ce schéma ajoute au précédent la recomposition des segments en phrase et la recomposition des réalisations en phrases réalisées.

Schéma physique : Schéma physique 2 de l'ALF

Symila version 3 : Ajout des propriété syntaxiques (niveau phrase)

Schéma conceptuel :Schéma conceptuel 3 de l'ALF

Ce schéma ajoute au précédent les propriétés syntaxiques associées aux phrases stimulus et réponse.

Schéma physique :Schéma physique 3 de l'ALF

Symila version 4 : Ajout des séquences (groupe de phrases)

Schéma conceptuel :Schéma conceptuel 4 de l'ALF

Ce schéma ajoute au précédent les groupes de phrases, appelés Séquence.

Schéma physique :Schéma physique 4 de l'ALF

Symila version 5 : Décomposition des phrases et des réalisations en mots.

Schéma conceptuel :Schéma conceptuel 5 de l'ALF

Ce schéma ajoute au précédent la décomposition des phrases stimulus en mots appelés formes orthographiques, et la décomposition des réalisations en mots phonétiques.

Le Choix de ne pas faire symétrique et de décomposer les phrases en mot du côté stimulus (à gauche) et les réalisations en mots du côté réponse (à droite) va s’avérer être une erreur (cf. schéma10).

L’idée qui avait motivé ce choix était que l’on est sûr des réalisations qui existent et sont écrites sur chaque page de l’ALF, les découper directement évitait le défaut d’une introduction d’erreur au moment de la recomposition en phrase réalisée.

Cela contraint notre système à être dépendant des Réalisations, c'est à dire des morceaux qui ont servi à reconstituer les phrases.

Schéma physique :Schéma physique 5 de l'ALF

Symila version 6 : Ajout des catégories PoS et des propriétés grammaticales aux mots.

Schéma conceptuel :Schéma conceptuel 6 de l'ALF

Ce schéma ajoute au précédent les catégories et propriétés grammaticales que nous avons choisi d'associer aux mots.

L'association des catégories aux mots va s'avérer être une erreur.

Le traitement des formes contractes type du, au, aux montrera qu'il est préférable d'associer la catégorie au lemme, puis d'associer le lemme au mot ou à sa glose pour que celui-ci hérite de sa/ses catégorie(s).

Schéma physique :Schéma physique 6 de l'ALF

Symila version 7 : Ajout des lemmes et des gloses aux mots.

Schéma conceptuel :Schéma conceptuel 7 de l'ALF

Ce schéma ajoute au précédent les lemmes que nous avons choisi dans un premier temps de différencier : lemme stimulus et lemmes réponse. Il ajoute également les gloses.

Les gloses sont associées aux mots réponse, elle permmettent de catégoriser et de désambiguïser les mots lors de leur lemmatisation.

Les gloses conservent les propriétés grammaticales des mots dont elles sont la glose.

Les lemmes dégradent les propriétés des mots ou gloses dont ils sont le lemme.

Nous avons considéré ici qu'un mot stimulus ou qu'une glose sont toujours associés à un seul lemme. Cela est une erreur, les formes contractes imposent qu'un mot ou qu'une glose aient plusieurs lemmes (jusqu'à deux pour les langues romanes).

Schéma physique :Schéma physique 7 de l'ALF

Symila version 8 : Ajout des propriétés grammaticales aux lemmes stimulus et réponse.

Schéma conceptuel :Schéma conceptuel 8 de l'ALF

Ce schéma ajoute au précédent les propriétés grammaticales associées aux lemmes.

Schéma physique :Schéma physique 6 de l'ALF

Symila version 9 : Remplacement de la relation lieu/réalisation par la relation phrase/réalisation.

Schéma conceptuel :Schéma conceptuel 9 de l'ALF

Pour rendre indépendantes nos données des morceaux (Segment et Réalisation) qui ont servis à les construire, nous avons remplacer la relation réalisation/lieu par la relation phrase réalisée/lieu.

Schéma physique :Schéma physique 9 de l'ALF

Symila version 10 : Remplacement de la relation mots réalisés/réalisation par la relation phrase/réalisation.

Schéma conceptuel :Schéma conceptuel 10 de l'ALF

Pour rendre indépendantes nos données des morceaux (Segment et Réalisation) qui ont servis à les construire, nous avons remplacer la relation mot réalisé (ou phonétique)/réalisation par la relation mot réalisé (ou phonétique)/phrase réalisée.

Schéma physique :Schéma physique 10 de l'ALF

Symila version 11 : Correction de la cardinalité des relations mot/lemme et glose/lemme.

Schéma conceptuel :Schéma conceptuel 11 de l'ALF

Pour la prise en compte des formes contractes, nous avons modifié la cardinalité des relations mot/lemme et glose/lemme qui étaient de type oneToMany (1-N) et qui sont maintenant ManyToMany (N-N).

Schéma physique :Schéma physique 11 de l'ALF

Symila version 12 : Remplacement de la relation mot/catégorie par la relation lemme/catégorie.

Schéma conceptuel :Schéma conceptuel 12 de l'ALF

Pour la prise en compte des formes contractes, nous avons remplacé la relation mot/catégorie par la relation lemme/catégorie.

Les mots héritent de la catégorie de leurs lemmes.

Schéma physique :Schéma physique 12 de l'ALF

Symila version 13: Fusion des lemmes stimulus et réponse.

Schéma conceptuel :Schéma conceptuel 13 de l'ALF

Nous avons fusionné les lemmes. Nous considérons maintenant l'entité lemme comme une ressource partagée par les mots, qu'ils soient stimulus ou réponse.

Schéma physique :Schéma physique 13 de l'ALF

Symila version 14: Ajout de la langue aux lieux et aux lemmes.

Schéma conceptuel :Schéma conceptuel 14 de l'ALF

Nous avons ajouté l'entité langue. Nous avons choisi de la lier à l'entité lemme et à l'entité lieu.

Schéma physique :Schéma physique 14 de l'ALF