Programmes de concordance

De La Mouche VII
Aller à la navigationAller à la recherche


Un programme de concordance est un programme que l'on nourrit d'un ou plusieurs fichiers texte (divers formats selon les cas) et qui construit à partir de là une liste de tous les mots (ou « lemmes » pour les pédants), avec le nombre de fois que ce mot apparaît dans le fichier (ce que ces programmes appellent souvent la « fréquence », ce qui fera hurler les scientifiques, mais comme ce sont des programmes pour lettreux...).

Ces programmes ont de nombreux avantages. Ils permettent de faire des statistiques sur la fréquence (pour de bon cette fois) de tel ou tel mot, mais aussi de traiter très rapidement des textes littéraires, historiques, etc. en repérant d'un seul coup tous les passages où un mot est utilisé, et donc où un thème est abordé. Enfin, ils permettent d'atténuer les effets néfastes d'une mauvaise OCRisation.

Voici un bref répertoire de programmes gratuits (mais pas forcément libres) de concordance, classés par ordre de qualité.

AntConc

TextSTAT

Simple Concordance Program (SCP)