Liste et occurences de mots d’un document Pdf !

Je cherchais à comptabiliser les mots de documents afin d’en réaliser une analyse sémantique.

Tout d’abord, il faut convertir le document. Utilisez le service en ligne Free File Converter.

L’une des solutions que j’ai trouvées est de passer par PsPad (marche très bien sous Linux avec Wine). Allez alors dans Fichier | Propriétés. Choisissez l’onglet Mots. Faites un clic droit pour Copier. Collez alors dans OpenOffice.org Calc… par exemple.

Si vous avez plus simple…

Autres billets sur le sujet :

Dsfc Dsfc Dsfc sur Tout le Monde en Blogue

Tags : , ,

Si vous avez apprécié cet article, s'il vous plait, prenez le temps de laisser un commentaire ou de souscrire au flux afin de recevoir les futurs articles directement dans votre lecteur de flux.

Commentaires

il existe une solution simple qui consiste à passer le document pdf en mode texte et d’employer la fonction wc (1)

suite à mon commentaire, voici les outils nécessaires :

pdftotext (documentation) : http://en.wikipedia.org/wiki/Pdftotext
Wc ( documenation ) : http://fr.wikipedia.org/wiki/Wc_(Unix)

Laisser un commentaire

(requis)

(requis)


*