L’originalité de ce projet pluridisciplinaire tient en particulier à la mise en synergie des réflexions sur trois domaines : une linguistique de contact plurielle et unifiée, la prise en compte de corpus hétérogènes en linguistique de corpus, et le développement d’algorithmes d’auto-apprentissage (par les logiciels eux-mêmes) en informatique. L’association de compétences linguistiques ET sociolinguistiques pour traiter les données a permis de proposer – ensemble – une méthode d’analyse commune. En effet, alors que ces regards sur les données devraient être complémentaires, les travaux sur les contacts de langues n’ont jusqu’à présent connu que des traditions isolées. La méthode qui a été mise au point est plurifactorielle – au sens où elle prend en compte différents facteurs explicatifs à l’apparition des phénomènes observés (des facteurs tant linguistiques, que typologiques, sociaux ou historiques) – et multi-niveaux – au sens où elle intègre une analyse de différents niveaux (morphologique, syntaxique, contextuel, pragmatique).
Le caractère novateur du projet provient par ailleurs de la mutualisation de nos données et connaissances (sous la forme de corpus commun et de base de données) et du traitement informatique que nous proposons sur ces corpus.
| Contact : Isabelle Léglise ( ) | Page mise à jour le 30/03/2014 |