Liste et occurences de mots d’un document Pdf !

Je cherchais à comptabiliser les mots de documents afin d’en réaliser une analyse sémantique.

Tout d’abord, il faut convertir le document. Utilisez le service en ligne Free File Converter.

L’une des solutions que j’ai trouvées est de passer par PsPad (marche très bien sous Linux avec Wine). Allez alors dans Fichier | Propriétés. Choisissez l’onglet Mots. Faites un clic droit pour Copier. Collez alors dans OpenOffice.org Calc… par exemple.

Si vous avez plus simple…

Logiciel libre  / Pdf 

Commentaires

il existe une solution simple qui consiste à passer le document pdf en mode texte et d’employer la fonction wc (1)

suite à mon commentaire, voici les outils nécessaires :

pdftotext (documentation) : http://en.wikipedia.org/wiki/Pdftotext
Wc ( documenation ) : http://fr.wikipedia.org/wiki/Wc_(Unix)

Laisser un commentaire

(requis)

(requis)