HISTORIQUE

Le premier auteur latin que le LASLA a traité, est Sénèque le Philosophe. Ce choix se justifiait non seulement par l’importance de l’œuvre du Stoïcien, mais aussi pour des raisons littéraires : chez Sénèque se trouve un nouveau type de prose dans laquelle la période de l’époque classique est abandonnée au profit d’une phrase brève et incisive, ornée de traits brillants. Le vocabulaire, la sémantique, la syntaxe, ainsi que l’imagerie littéraire s’en trouvent radicalement modifiés.

Si l’on fait exception des Questions naturelles, les œuvres de Sénèque ont toutes été traitées, y compris les tragédies.

Tout en consacrant une part importante de ses activités au philosophe, le LASLA a entrepris d’appliquer ses méthodes à d’autres auteurs et plus souvent à certaines œuvres seulement. C’est ainsi qu’ont été traités des textes tels que De bello Gallico de César ou De coniuratione Catilinae de Salluste, ainsi que des textes lus dans l’enseignement secondaire. L’objectif était dans ce cas de préparer des instruments pouvant aider les adolescents et leurs professeurs. C’est sur la base de ces études et des relevés qu’elles ont permis d’établir qu’ont vu le jour, par exemple, les ouvrages suivants : S. Govaerts, J. Denooz, Lexique de base latin, Liège, 1972, 232 pp. (2e éd. revue et augmentée en 1974 – 280 pp.) et G. Cauquil et J.-Y. Guillaumin, Vocabulaire de base du latin, Association régionale des enseignants de langues anciennes de Besançon (ARELAB), 1984.

La banque de données s’est aussi enrichie grâce à la collaboration de latinistes belges et étrangers qui, intéressés par la méthodologie du LASLA, ont voulu l’appliquer à l’auteur auquel ils consacraient leurs recherches. Ainsi, ont été lemmatisés et analysés Quinte-Curce par J. Therasse (Université Laval à Québec), les Satires de Juvénal par M. Dubrocard (Université de Nice) ou encore le De architectura de Vitruve par L. Callebat, Ph. Fleury, M. Zuinghedau (Université de Caen), etc.

Enfin, des étudiants et des doctorants de l’Université de Liège ont aussi contribué, en préparant leur travail de fin d’études ou leur thèse, à l’enrichissement de la base de données du LASLA, en traitant, par exemple, Catulle, les Épigrammes d’Ausone, les œuvres mineures de Tacite, etc.

Au début des années quatre-vingts, en quelque vingt ans d’existence, le LASLA avait constitué une banque de données qui comprenait approximativement un million de mots. Sans doute cet ensemble permettait-il déjà de nombreuses recherches sur la langue latine, mais il ne pouvait être considéré comme suffisamment représentatif de la littérature classique.

Tout d’abord, à de rares exceptions près (par exemple, Horace, Quinte-Curce, Juvénal,), peu d’auteurs étaient traités intégralement : pour Virgile, on disposait de la totalité des Bucoliques et des Géorgiques tandis que pour l’Énéide, seuls les six premiers livres avaient été analysés ; pour César, manquaient le livre VIII du De Bello Gallico (Commentaire d’Hirtius), le De bello ciuili et les trois guerres dont les auteurs ne sont pas identifiés. Parmi les lacunes les plus importantes, il faut souligner le fait que quelque cinq ou six œuvres seulement de Cicéron avaient été étudiées : Catilinaires, De lege Manilia, Pro Caecina, Pro Rabirio, en ce qui concerne les discours et De senectute, le livre 3 du De natura deorum et quelques extraits du livre V des Tusculanes pour la prose philosophique.

D’autre part, les fichiers ne contenaient pas d’auteurs tels que Caton, Térence, Lucrèce, Ovide, Suétone, …

Sur la base de ces constatations, il est apparu que pour répondre aux demandes de plus en plus nombreuses de collègues latinistes, il fallait enrichir d’une manière systématique la banque de données, en cherchant à atteindre deux objectifs : d’une part, faire en sorte qu’elle contienne un plus grand nombre d’auteurs et, d’autre part, présenter, pour un même auteur ou pour une œuvre, des relevés aussi complets que possible.

Ces deux objectifs étaient assez faciles à atteindre pour des auteurs tels que Lucrèce, Caton, César (y compris pseudo-César), Virgile, Tacite dont la majeure partie des textes était déjà traitée, ou encore Pétrone et Properce. Mais, l’analyse de ces auteurs ne faisait que reporter davantage ce qui paraissait être un obstacle infranchissable : Cicéron, dont les seuls discours contiennent environ 400.000 mots, autrement dit à peu près le tiers de ce qui avait été rassemblé en vingt-cinq ans.

Plusieurs questions ont dû être résolues avant de commencer l’analyse de l’œuvre cicéronienne. Tout d’abord, fallait-il s’attacher à un genre littéraire plutôt qu’à un autre ? Était-il préférable d’étudier en parallèle un discours, un ouvrage de rhétorique, un traité de philosophie ou la correspondance ?

Le souci de procéder de manière cohérente et systématique a fait apparaître qu’il était préférable de se consacrer à un seul genre littéraire. Après réflexion et pour tenir compte des attentes des latinistes la priorité a été donnée aux discours. Ils ont été analysés en suivant l’ordre chronologique de leur rédaction. En outre, dans la perspective d’une publication éventuelle de volumes d’index, les discours ont été répartis selon les quatre périodes que l’on distingue habituellement, à savoir avant le consulat (de 81 à 66), pendant le consulat (en 63), entre le consulat et la guerre civile (de 62 à 52) et enfin de la guerre civile à la mort de l’orateur (de 46 à 43). S’il est vrai que ces périodes sont d’inégale importance non seulement en ce qui concerne leur durée, mais surtout au point de vue de la production de Cicéron, elles correspondent néanmoins à des étapes de la vie de l’auteur qui peuvent avoir influencé sa langue et son style. Dès lors ce découpage devrait rendre plus aisées des études comparatives. Comme on peut le lire dans le tableau 1 qui figure dans les pages qui suivent, l’étude des discours est totalement achevée (voir aussi liste des publications).

Parmi les autres auteurs analysés on mentionnera Ovide et Plaute. Pour le premier, un des membres du LASLA, G. Purnelle, a entrepris de lemmatiser les œuvres écrites en vers élégiaques. Pour Plaute, A. Maniet (Université Laval – Québec) a projeté, dès la fin des années soixante, de traiter toutes les comédies. Dans la mesure où il n’a pas achevé cette entreprise, on s’est attaché à la continuer. D’une part, les six premières pièces, d’Amphitruo à Casina, ont été revues et corrigées et, d’autre part, les comédies Curculio et Epidicus ont été intégrées à la banque de données et ont fait l’objet d’une publication.

On retiendra aussi que le LASLA met ses méthodes à la disposition des chercheurs qui le demandent, que ce soit pour la littérature latine de l’Antiquité ou pour des auteurs du moyen âge ou de la Renaissance ou même d’époques plus récentes. C’est ainsi qu’ont été analysés les œuvres de Sedulius Scottus, des textes latins de Descartes ou encore le Tractatus politicus de Spinoza. De même a été traité par C. Phillipart un corpus de textes hagiographiques.

MÉTHODE

La méthode du LASLA selon laquelle est traité chacun des mots-formes apparaissant dans un texte latin a été décrite à plusieurs reprises dans diverses revues, notamment dans les articles suivants :

  • Étienne Évrard, « Le laboratoire d’analyse statistique des langues anciennes de l’Université de Liège ».
    dans Mouvement scientifique en Belgique, 9, 1962, p. 163-169.

  • Joseph Denooz, « L’ordinateur et le latin, Techniques et méthodes ».
    dans Revue de l’organisation internationale pour l’étude des langues anciennes par ordinateur, 1978, 4, p. 1-36.

Ces articles, déjà anciens, font état de techniques qui ont été abandonnées, mais la méthode linguistique est restée la même. En regard de chaque mot, on enregistre sur support informatique les données suivantes :

  • Le lemme, c’est-à-dire le mot tel qu’il figure dans le dictionnaire choisi comme ouvrage de référence (le choix s’est porté sur le Lexicon totius latinitatis de Forcellini, éd. de Corradini, Padoue, 1864).

  • Un indice permettant de distinguer différents lemmes homographes ou de marquer les noms propres et les adjectifs qui en dérivent (ET 1 = adverbe,ET 2 = conjonction de coordination ; la lettre N en regard de ROMA signale un nom propre).

  • La forme telle qu’elle apparaît dans le texte.

  • La référence qui est conforme aux règles de l’ars citandi.

  • L’analyse morphologique complète sous un format alphanumérique ; c’est-à-dire pour un substantif, la déclinaison, le cas et le nombre, pour un verbe, la conjugaison, la voix, le mode, le temps, la personne et le nombre.

  • Pour les verbes, des indications syntaxiques ; les propositions principales sont distinguées des subordonnées, lesquelles sont classées par type de subordonnants.

Les fichiers se présentent donc comme suit :

LEMME INDICE FORME RÉFÉRENCE MORPHO. SYNT.
VRBS URBEM 41 001 0001 001 001 13C00
ROMA N ROMAM 41 001 0001 002 002 11C00
AB A 41 001 0001 003 003 70600
PRINCIPIVM PRINCIPIO 41 001 0001 004 004 12F00
REX REGES 41 001 0001 005 005 13J00
HABEO HABUERE 41 001 0001 006 006 52L14 &
LIBERTAS LIBERTATEM 41 001 0001 007 007 13C00
ET 2 ET 41 001 0001 008 008 81000
CONSVLATVS CONSULATUM 41 001 0001 009 009 14C00
LVCIVS N L. 41 001 0001 010 010 12A00
BRVTVS N BRUTUS 41 001 0001 011 011 12A00
INSTITUO INSTITUIT 41 001 0001 012 012 53C14 &

L’analyse morphologique est entièrement codée par un programme informatique (une description détaillée de ce programme est publiée dans l’article suivant : Joseph Denooz, « Recherches sur le traitement automatique de la langue latine », dans Revue de l’organisation internationale pour l’étude des langues anciennes par ordinateur, 1973, 1, p. 1-89). Pour urbem, l’analyse 13C signifie que ce mot est un substantif de la 3e déclinaison à l’accusatif singulier. La forme verbale habuere est analysée 52L14, ce qui signifie verbe (5) de la 2e conjugaison à la voix active (2), 3e personne du pluriel (L), indicatif (1) parfait (4). Le signe & signifie que habuere est un verbe de proposition principale.

Comme on le constate c’est une description formelle, lexicologique et morphologique, qui est donnée pour chaque mot. Dans certains cas, le nombre d’informations pour une forme atteint la dizaine. Ainsi pour une forme telle que regnante, on indique les données de référence, le lemme, la catégorie grammaticale, la conjugaison, la voix, le cas, le nombre, le mode, le temps et le genre. Enfin, on précisera éventuellement qu’il s’agit d’un ablatif absolu.