Télécharger tous les fichiers EPUB du projet Gutenberg

Le projet Gutenberg est une librairie constituée, à ce jour, de 67376 ebooks gratuits et surtout libres de droit.

Télécharger tous les fichiers EPUB du projet Gutenberg

A l’aide d’un script PowerShell faisant appel à la commande wget, vous pourrez télécharger les fichiers EPUB présents sur le site. Je vous recommande de copier l’exécutable wget dans le dossier c:\windows\system32.

Le script PowerShell

Tâchons de ne pas éveiller le soupçon ! J’aurais pu utiliser les cmdlets Invoke-WebRequest ou Start-BitsTransfer. Seul problème : je ne peux pas réguler le débit avec cette commande PowerShell.

Clear-Host
#Documentation PowerShell sur l'exécution de commandes Windows
#https://social.technet.microsoft.com/wiki/contents/articles/7703.powershell-running-executables.aspx
#
#Répertoire de destination des fichiers EPUB
#
Set-Location -Path 'D:\livres\gutenberg'
For($i=1;$i++;$i -le 67376)
{
$url="https://www.gutenberg.org/ebooks/$i.epub.noimages"
#
#De l'art de la Taquîya : être identifié comme un navigateur
#
$ua='"Mozilla/5.0 (Windows NT 10.0; rv:91.0) Gecko/20100101 Firefox/91.0"'
#
#De l'art de la Taquîya : limitation de la vitesse de téléchargement à 150 kbits
#       
$AllArgs = @('-U', $ua, '--no-check-certificate', $url, '--limit-rate', '150K')
& 'wget.exe' $AllArgs
}
 

PowerShell /