Laboratoire d'histoire des théories linguistiques

Histoire et Epistémologie

des sciences du langage

modernes et contemporaines

 

 

 

 

 


Responsables : Jean-Michel Fortis, Jacqueline Léon ; participants : Sylvain Auroux, Danielle Candel, Béatrice Godart-Wendling, Didier Samain, Dan Savatovsky ; participants extérieurs : Marcel Cori, Monique Cormier, Sophie David, Janette Friedrich, Douglas Kibbee.

Le second tiers du siècle écoulé a été assez riche en événements dans les sciences du langage pour qu'on y ait vu le début de la période contemporaine. - Alors que le courant néogrammairien produit ses derniers travaux, on songe bien sûr à ce qui va s'appeler le structuralisme et au premier congrès international des linguistes (1928). Mais c'est aussi durant cette période que paraissent plusieurs œuvres qui font avec le recul figure de point de départ, en termes de méthode et de partages disciplinaires. La pragmatique avec Bühler (1934) en Allemagne, Peano et Vailati en Italie ; la première syntaxe catégorielle (Ajdukiewicz 1935) ; et, presque simultanément, l'important travail de Wüster (1932) sur la terminologie scientifique. Peu de temps après, avec l'apparition des premiers ordinateurs, débutaient les premières applications des travaux de Shannon et Weaver à la traduction automatique (1949), lesquelles ont ramené au premier plan la questions des universaux linguistiques. Notons enfin, ce qui n'est peut-être pas fortuit, que la même période a vu la naissance du CNRS en France (1939).

La signification de ces discontinuités reste toutefois à préciser car, ainsi qu'on va le voir, il arrive qu'elles tiennent moins aux questions elles-mêmes qu'à leur reformulation dans un cadre technologique (et non pas seulement technique). Cette émergence de la technologie peut être caractérisée, sans exclusive, par trois traits principaux.

1) La "scientifisation" de certains thémata philosophiques. Dès la fin du dix-neuvième siècle par exemple, le regain d'intérêt pour les langues artificielles a correspondu à un ensemble d'hypothèses fortes sur le devenir historique des langues (indo-européennes notamment), et dans ce contexte les langues intermédiaires ont quasiment fait figure de dispositifs expérimentaux illustrant une telle évolution. De même, si on peut légitimement parler d'un néo-kantisme au vingtième siècle, loin d'en appeler à un schématisme a priori, il se fondait sur des médiations culturelles, dont, bien évidemment, le langage.

2) De nouvelles difficultés largement liées au développement même des formalismes. Elles sont d'abord empiriques : les approches compositionnelles du sens, tout comme le programme syntaxique du Cercle de Vienne, ont rapidement rencontré leur limite en se heurtant à la diversité objective du réel. Et d'une certaine façon, le retour récent des méthodes probabilistes en traitement automatique des langues, rendu possible par la puissance de calcul des ordinateurs, atteste de leur échec. Elles sont aussi ontologiques, compte tenu de la nécessité, et souvent de l'impossibilité, de préciser le rapport existant entre modèle formel, hypothèse cognitive et structure linguistique. Il est significatif que ce problème ait été formulé en termes voisins par le cognitivisme naissant.

3) Enfin, et peut-être plus fondamentalement, l'intégration d'une attitude métadiscursive à l'égard des procédures elles-mêmes, dont témoigne exemplairement le développement des dictionnaires techniques et de la réflexion terminologique. Ce caractère réflexif excède la simple conscience disciplinaire, car il implique désormais un rapport tout à la fois problématisé et empirique au savoir produit, dont l'apparition d'une véritable histoire des sciences du langage doit être sans doute tenue pour un indice non négligeable.
Le programme Histoire et épistémologie des sciences du langage modernes et contemporaines se propose de préciser ces points en abordant les principaux aspects de la réflexion sur le langage au 20ème siècle. (D.S.)

Traduction de Karl Bühler (1934)

(Responsable : Didier Samain. Participant extérieur : Janette Friedrich).

Traduction en cours de la Sprachtheorie (1934) du médecin, linguiste et psychologue K. Bühler (1879-1963), accompagnée d'une introduction et d'un glossaire des concepts. Née au sein de l'école de Würzburg, dans le contexte d'une critique de la psychologie wundtienne, et aujourd'hui considérée comme l'une des sources de la sémiotique, l'œuvre de Bühler s'est achevée aux USA avec les débuts de la cybernétique, après avoir intégré successivement des domaines extrêmement divers. On relèvera notamment, en psychologie, les écoles de Würzbourg et la Gestalt, en "linguistique", la grammaire comparée et la phonologie pragoise, en philosophie, Husserl et le néokantisme, le Cercle de Vienne, le second Wittgenstein. Il s'agit donc de contextualiser une œuvre dont certains aspects sont depuis longtemps intégrés au savoir ordinaire, au prix, précisément, d'une complète décontextualisation. Le travail doit simultanément permettre de formuler quelques questions plus générales sur le caractère cumulatif du savoir scientifique, et sur la consistance empirique des notions de paradigme et d'objet scientifique.

Contribution à l'histoire de la sémantique formelle du langage ordinaire

(Responsable : Dan Savatovsky)

Dans le prolongement du travail mené précédemment, on s'attachera aux origines de la sémantique formelle du langage ordinaire (fin XIXe-début XXe siècle) et on étudiera ce domaine d'un double point de vue : dans le contexte historique de son émergence et à la lumière des thèmes développés ultérieurement par la philosophie analytique. Ces thèmes, pour les résumer, sont ceux de la commensurabilité des théories scientifiques ; de la coextension des concepts issus de théories concurrentes ; de l'extensionnalisme comme régime d'une sémantique des énoncés scientifiques ou philosophiques, ou son contre-modèle quinien : l'indétermination de la traduction (Quine, Word and Object, 1960, chap. 2).

Des langues universelles aux universaux sémantiques : évolution d'un thème

(Responsables : Jean-Michel Fortis, Jacqueline Léon, Dan Savatovsky)

La question des universaux sémantiques s'est posée à diverses époques et probablement dans toutes les traditions. La création de langues universelles ou de langues auxiliaires, notamment, a constitué pour des philosophes au XVIIe siècle (Descartes, Wilkins, Dalgarno, ou Leibniz, etc.) ou des linguistes au XIXe siècle, un champ d'investigation tout à fait original, malgré le peu de succès, voire l'ostracisme dont ce genre de préoccupation a été l'objet.

Histoire des théories et pratiques de la terminologie

(Responsable : Danielle Candel)

Histoire de l'automatisation du langage

(Responsable : Jacqueline Léon)

Le point d'ancrage principal de ces recherches est l'automatisation du langage entreprise au début des années 1950 avec l'apparition des premières calculatrices électroniques. Les questions abordées se concentrent sur l'impact de l'automatisation sur les sciences du langage et sur les enjeux spécifiques du traitement automatique des langues. Enfin ces recherches ont pour point commun leur dimension comparative, en explorant, chaque fois que c'est envisageable et/ou réalisable, les traditions américaine, russe, anglaise et française.

1. Un premier axe de recherche est centré sur les relations entre linguistique et modèles statistiques.
2. Un second axe de recherche est consacré à la reprise des modèles de langues universelles dans des méthodes de langues intermédiaires et à la formalisation des premiers réseaux sémantiques en traitement automatique des langues.
3. Dans une perspective d'étude des classifications des savoirs, on s'intéressera aux dénominations des " sciences du langage " et du terme même de sciences du langage dans les institutions françaises pour la période de 1939 à nos jours.
4. Enfin, cette recherche présente un volet documentaire de constitution d'un fonds d'archives et de documentation d'histoire de la traduction automatique et du traitement automatique des langues.

Les méthodes probabilistes appliquées sur de " grands corpus " ont connu un regain d'intérêt au début des années 1990 grâce à la mise à disposition et à la possibilité de traitement de très gros volumes de données textuelles, et grâce à certains développements technologiques récents du TAL.
En fait, derrière la dénomination actuelle de " linguistique de corpus ", on rencontre des axes de recherche divers et des conceptions très différentes de la notion de corpus et de l'utilisation des méthodes statistiques. Utilisées comme de simples outils statistiques dans l'étude de corpus au service de disciplines fondées sur l'étude de l'archive et du texte, comme l'histoire, ces méthodes sont parfois requises pour fonder des projets beaucoup plus ambitieux de refondation des science du langage.
Les différentes conceptions ont leur source dans les années 1940-50, dans la tradition structuraliste américaine, dans les diverses interprétations de la théorie mathématique de la communication de Shannon, enfin dans certaines options d'expérimentation en traduction automatique. Les tenant actuels de la " linguistique de corpus ", " méthodes statistiques ", " méthodes probabilistes " ou autres " statistical natural language processing " légitiment leur approche comme domaine autonome des sciences du langage, et non comme simple domaine d'applications de méthodologies statistiques, en multipliant des arguments d'origine et de statut très hétérogènes.

En s'appuyant sur un "corpus" d'ouvrages et d'articles considérés par les acteurs du domaine comme fondateurs ou centraux pour le domaine, on considérera les points suivants :
- il conviendra de dégager ces différentes filiations et de les articuler avec les positions qui ont été prises sur la notion de corpus.
- on reconsidèrera les critiques du modèle chomskyen en tentant d'évaluer les solutions apportées par le modèle statistique.
- Les auteurs revendiquent souvent que leur approche permet de découvrir de nouveaux faits en linguistique dont le modèle formel ne peut ni découvrir ni rendre compte. On s'interrogera alors sur le statut de fait linguistique ainsi élaboré et sur la conception particulière du rapport à l'empirie qu'elle constitue.
- Outre les avancées technologiques indéniables revendiquées par les modèles probabilistes pour le traitement automatique des langues, on s'interrogera sur les propriétés spécifiques des langues ou du langage dont ces modèles postulent l'existence, telles que les propriétés computationnelles du langage, et en particulier l'accent mis sur le " processing " ou la " computation " versus les règles de grammaire et les connaissances linguistiques.

Depuis plusieurs années, les recherches ci-dessus sont menées parallèlement avec la constitution d'un fonds d'archives et de documentation sur l'histoire de la TA et du TAL. Ce fonds doit, à terme, être localisé et consultable à la bibliothèque de l'ENS Lettres et Sciences Humaines à Lyon. La moitié des documents est actuellement située à Paris, dans les locaux de l'UMR7597. L'autre moitié est située à Lyon, dans la bibliothèque de l'ENS.

 

Les grammaires formelles du XXe et du XXIe siècles

Questions d'épistémologie en linguistique cognitive

(Responsable : Jean-Michel Fortis)

[retour en haut de la page]