Centre National pour la Recherche
Université Toulouse Jean Jaurès
Institut Nicod
Agence Nationale pour la Recherche

Les données dans la base SYMILA

Le projet SYMILA traite deux ensembles de données :

  • Les données de l’Atlas linguistique de la France : SYMILA ALF
  • De Nouvelles Enquêtes Syntaxiques propres au projet SYMILA : SYMILA NES

Les données de l’ALF et celles des Nouvelles enquêtes forment deux bases distinctes présentant des propriétés différentes : les données de l’ALF ont plus de cent ans et celles de des nouvelles enquêtes sont menées en ce moment, le document primaire de SYMILA ALF est constitué par des carnets d’enquêtes (source des cartes publiées dans l’ALF) alors que le matériau des nouvelles enquêtes a été enregistré et le son segmenté est mis en ligne pour permettre de vérifier la transcription. Ces différences étant rappelées, les bases sont construites de manière à les rendre aussi parallèles que possibles, notamment par l’usage des mêmes caractérisations des phrases, des mêmes catégories et propriétés grammaticales attribuées aux mots, du même répertoire de lemmes. Il s’agit par là de rendre possible l’interrogation conjointe des deux parties de la base SYMILA.


Vous faites référence aux données de ce site :

Pour le citer : SYMILA - http://symila.univ-tlse2.fr

Le projet SYMILA

Le projet SYMILA a pour but de documenter la variation syntaxique dans les dialectes des langues romanes de France de mettre ces données à la disposition de la communauté scientifique et de commencer à en tirer les conséquences pour la théorie linguistique.

Les parlers locaux traditionnels qui font l’objet de la description sont menacés d’extinction à brève échéance et les nouvelles enquêtes de la deuxième partie du projet SYMILA sont donc menées sous le signe de l’urgence.

La comparaison syntaxique des langues, que ce soit à des fins typologiques, diachroniques ou théoriques, s’effectue souvent partir des formes « standard » des langues qui sont bien documentées. Sur la base de ce type de données la variation et les paramètres qui la décrivent sont relativement larges. Or, des travaux récents (par exemple dans le domaine italien ou scandinave) ont montré que la comparaison de dialectes proches était indispensable et très instructive. Ce champ de recherche, dit syntaxe dialectale ou micro-variation syntaxique, quoiqu’en plein essor en Europe et au-delà, est à ce jour, en dehors du domaine basque et plus récemment breton, quasiment inexploré en France, aussi bien d’un point de vue empirique que théorique. L’objectif de ce projet est de contribuer à combler ce vide pour l’ensemble des parlers romans du territoire français (et parfois au-delà : parlers d’oïl, dialectes de l’occitan, du catalan, du francoprovençal (alporhodanien).

Le projet SYMILA est porté par deux laboratoires :


Les coordinateurs du projet sont :


Le projet SYMILA est financé par l’ANR dans le cadre de l’appel ANR corpus.


La conception informatique de la base de données et du site est due à Yaël Champclaux (docteur en informatique, ingénieur et post-doctorant dans le projet SYMILA).