Programmes de concordance

De La Mouche VII
Aller à la navigationAller à la recherche
La version imprimable n’est plus prise en charge et peut comporter des erreurs de génération. Veuillez mettre à jour les signets de votre navigateur et utiliser à la place la fonction d’impression par défaut de celui-ci.


Un programme de concordance est un programme que l'on nourrit d'un ou plusieurs fichiers texte (divers formats selon les cas) et qui construit à partir de là une liste de tous les mots (ou « lemmes » pour les pédants), avec le nombre de fois que ce mot apparaît dans le fichier (ce que ces programmes appellent souvent la « fréquence », ce qui fera hurler les scientifiques, mais comme ce sont des programmes pour lettreux...).

Ces programmes ont de nombreux avantages. Ils permettent de faire des statistiques sur la fréquence (pour de bon cette fois) de tel ou tel mot, mais aussi de traiter très rapidement des textes littéraires, historiques, etc. en repérant d'un seul coup tous les passages où un mot est utilisé, et donc où un thème est abordé. Enfin, ils permettent d'atténuer les effets néfastes d'une mauvaise OCRisation.

Voici un bref répertoire de programmes gratuits (mais pas forcément libres) de concordance, classés par ordre de qualité.

AntConc

TextSTAT

Simple Concordance Program (SCP)