Cette étape n'est pas indispensable, mais elle
permet souvent de faciliter les indispensables correction
que nécessitera le résultat généré par le programme.
Il s'agit surtout :
- d'éliminer
- les majuscules de début de phrase;
- les introductions en langue vulgaire,
les numéros;
- bref, tout ce qui n'est pas du latin.
- de corriger les formes rares que l'on souhaite
cacher pour l'instant aux élèves, genre
d'intervention que je ne pratique qu'avec
beaucoup de prudence. Je préfère créer une
entrée supplémentaire qui indique la forme
classique.
- de couper les lignes trop longues qui dépassent
les limites de l'éditeur ;
- de rétablir les mots coupés par une césure de
fin de ligne. Analysis est incapable de les
reconnaître, et les traite comme deux mots
différents.
|