Méthode

La méthode du LASLA selon laquelle est traité chacun des mots-formes apparaissant dans un texte latin a été décrite à plusieurs reprises dans diverses revues, notamment dans les articles suivants :

Étienne Évrard, « Le laboratoire d’analyse statistique des langues anciennes de l’Université de Liège ».
dans Mouvement scientifique en Belgique, 9, 1962, p. 163-169.
Joseph Denooz, « L’ordinateur et le latin, Techniques et méthodes ».
dans Revue de l’organisation internationale pour l’étude des langues anciennes par ordinateur, 1978, 4, p. 1-36.

Ces articles, déjà anciens, font état de techniques qui ont été abandonnées, mais la méthode linguistique est restée la même. En regard de chaque mot, on enregistre sur support informatique les données suivantes :

Le lemme, c’est-à-dire le mot tel qu’il figure dans le dictionnaire choisi comme ouvrage de référence (le choix s’est porté sur le Lexicon totius latinitatis de Forcellini, éd. de Corradini, Padoue, 1864).
Un indice permettant de distinguer différents lemmes homographes ou de marquer les noms propres et les adjectifs qui en dérivent (ET 1 = adverbe,ET 2 = conjonction de coordination ; la lettre N en regard de ROMA signale un nom propre).
La forme telle qu’elle apparaît dans le texte.
La référence qui est conforme aux règles de l’ars citandi.
L’analyse morphologique complète sous un format alphanumérique ; c’est-à-dire pour un substantif, la déclinaison, le cas et le nombre, pour un verbe, la conjugaison, la voix, le mode, le temps, la personne et le nombre.
Pour les verbes, des indications syntaxiques ; les propositions principales sont distinguées des subordonnées, lesquelles sont classées par type de subordonnants.

Les fichiers se présentent donc comme suit :

LEMME INDICE FORME RÉFÉRENCE MORPHO. SYNT.
VRBS URBEM 41 001 0001 001 001 13C00
ROMA N ROMAM 41 001 0001 002 002 11C00
AB A 41 001 0001 003 003 70600
PRINCIPIVM PRINCIPIO 41 001 0001 004 004 12F00
REX REGES 41 001 0001 005 005 13J00
HABEO HABUERE 41 001 0001 006 006 52L14 &
LIBERTAS LIBERTATEM 41 001 0001 007 007 13C00
ET 2 ET 41 001 0001 008 008 81000
CONSVLATVS CONSULATUM 41 001 0001 009 009 14C00
LVCIVS N L. 41 001 0001 010 010 12A00
BRVTVS N BRUTUS 41 001 0001 011 011 12A00
INSTITUO INSTITUIT 41 001 0001 012 012 53C14 &

L’analyse morphologique est entièrement codée par un programme informatique (une description détaillée de ce programme est publiée dans l’article suivant : Joseph Denooz, « Recherches sur le traitement automatique de la langue latine », dans Revue de l’organisation internationale pour l’étude des langues anciennes par ordinateur, 1973, 1, p. 1-89). Pour urbem, l’analyse 13C signifie que ce mot est un substantif de la 3e déclinaison à l’accusatif singulier. La forme verbale habuere est analysée 52L14, ce qui signifie verbe (5) de la 2e conjugaison à la voix active (2), 3e personne du pluriel (L), indicatif (1) parfait (4). Le signe & signifie que habuere est un verbe de proposition principale.

Comme on le constate c’est une description formelle, lexicologique et morphologique, qui est donnée pour chaque mot. Dans certains cas, le nombre d’informations pour une forme atteint la dizaine. Ainsi pour une forme telle que regnante, on indique les données de référence, le lemme, la catégorie grammaticale, la conjugaison, la voix, le cas, le nombre, le mode, le temps et le genre. Enfin, on précisera éventuellement qu’il s’agit d’un ablatif absolu.