Laboratoire d'histoire des théories linguistiques

Corpus de textes linguistiques fondamentaux


[retour à la liste des thèmes]


Le programme Corpus représentatif des grammaires et des traditions linguistiques étant clos sous sa première forme (version papier), il nous a semblé intéressant de lui donner un prolongement sous la forme du projet intitulé Corpus de textes linguistiques fondamentaux.
Ce nouveau projet correspond à une double volonté :

- la volonté documentaire de rendre accessibles les textes décrits dans les notices du Corpus représentatif des grammaires et des traditions linguistiques ;
- la volonté d'exploiter les nouvelles technologies par la mise en ligne sur un site des notices réalisées et de ces textes, avec un accès aussi large que possible.

La réponse à un appel d'offre dans le cadre du plan État-région pour l'accompagnement de l'arrivée de l'ENS Lettres & Sciences Humaines en Rhône-Alpes (novembre 2002) a permis d'obtenir un financement important prévu sur 4 ans. Les phases d'achat des ouvrages et de numérisation ont commencé.


Objectif général
Si l'on admet que les sciences du langage progressent par augmentation de connaissances, en d'autres termes si l'on admet que la connaissance du passé (ancien et récent) de la discipline est utile au progrès de cette dernière, on ne peut se contenter des moyens anciens mis à la disposition du chercheur pour étudier ce passé (éditions critiques, reprints papier, monographies sur auteur, etc.). De fait, l'histoire des sciences du langage est une discipline en pleine extension : plusieurs projets (récents ou en cours de parution) de grande ampleur en attestent, par ex. : Geschichte der Sprachwissenschaft, éd. par P. Schmitter, Tübingen, Narr (depuis 1987, 4 vols parus) ; Histoire des idées linguistiques, éd. par S. Auroux, 3 vols, 1989-2000, Liège, Mardaga ; Lexicon Grammaticorum, Who's Who in the history of World Linguistics, éd. par H. Stammerjohann et al., Tübingen, Niemeyer, 1996 ; History of the Language Sciences - An International Handbook on the Evolution of the Study of Language from the Beginnings to the Present, éd. par S. Auroux et al., 3 vol. Berlin, W. de Gruyter, 2000, 2001 et 2004. Ces nouveaux outils attestent de la vitalité du champ de recherche, mais ne font pas explicitement place à ne serait-ce qu'une anthologie de textes linguistiques. En effet tel n'est pas leur but : il s'agit soit de dictionnaires biographiques (le Lexicon Grammaticorum), soit de vastes synthèses, dont l'utilité ne fait aucun doute, mais qui laissent place à un corpus de textes.
Il est donc temps d'utiliser la technologie moderne pour mettre en œuvre un corpus de textes représentatifs du passé des sciences du langage. Deux démarches (au moins) sont alors possibles : envisager les 'traditions linguistiques' (on sait que la tradition linguistique occidentale, pour être maintenant dominante, n'est ni la plus ancienne, ni la seule ; certaines traditions 'exotiques' sont plus anciennes, comme la tradition sanskrite ou, à l'origine, aussi importantes, comme la tradition arabe ou la tradition chinoise) ; envisager les textes traitant du langage en général, ce qui correspond à un moment plus récent du développement de la pensée linguistique. Les deux démarches sont légitimes. L'urgence semble néanmoins du côté de ces textes linguistiques généraux. Certains outils spécifiques sont en effet déjà en cours d'élaboration pour certaines traditions (par exemple la tradition tamoule), et ces dernières posent souvent un problème crucial de commensurabilité et de comparaison, sans compter les problèmes spécifiques à leur 'exotisme' même (difficulté de la traduction, utilisation de diacritiques, etc.). Au contraire, les textes linguistiques généraux, même s'ils mettent en oeuvre des théories différentes et posent eux aussi des problèmes de traduction (ils sont rédigés pour l'essentiel en anglais, allemand, espagnol, français, italien ou russe), sont d'une certaine façon comparables par leur objet même (le langage en tant que tel) et, sur le plan épistémologique, leur connaissance est évidemment cruciale pour l'évaluation du développement global de la discipline. Il s'agit d'asseoir une terminologie linguistique (et son histoire) sur un corpus défini - comme la base Frantext l'a été pour le Trésor de la Langue Française. C'est donc à ces ouvrages que nous nous intéressons d'abord. Dans un second temps, il serait indispensable d'élargir cette base à des textes importants notamment pour la connaissance de la tradition linguistique occidentale (textes fondateurs de la grammaire grecque, ou textes linguistiques rédigés en latin, développés du Ie siècle a.C. au XVIIe siècle p.C., pour la plupart encore peu exploités, qui constituent de fait la première ossature de la réflexion linguistique en occident).

Notre objectif dans un premier temps est quadruple :

1) Établir un corpus de textes linguistiques de valeur générale, reconnus pour leur intérêt dans le développement de la discipline ;
2) Rendre facilement accessibles ces textes aux chercheurs et au grand public, par un support approprié (cédérom et/ou internet, etc.), à la fois dans la langue originale et en traduction française ;
3) Permettre leur exploration systématique, tant en ce qui concerne l'élaboration des concepts que la constitution et l'évolution de la terminologie linguistique, cette dernière étant le premier moyen d'accès aux concepts. Ce dernier point est particulièrement important : seule la possibilité d'explorer systématiquement un grand nombre de textes, qui, pour être fondamentaux, ne sont aujourd'hui pas forcément accessibles, permettra d'établir une histoire fine des concepts et la datation précise des créations terminologiques, sans lesquelles l'histoire de la discipline ne peut être convenablement établie ;
4) Associer à la base de données textuelles une base de données bibliographiques en histoire des théories linguistiques donnant toute la bibliographie disponible non seulement sur les textes retenus, mais sur leur contexte au sens le plus large du terme.

À notre connaissance, il n'existe encore aucun projet global de corpus de textes linguistiques généraux, alors qu'il existe de nombreux corpus de textes littéraires, d'encyclopédies et de dictionnaires (par exemple dictionnaires de langue française ; cf. les sites de l'Université de Toronto et de l'ATILF, les cédéroms de Champion Électronique et des éditions Redon, etc.).