Numérisation  d'un  livre


    Les exceptions au droit d'auteur sont fixées de manière limitative par l’article L. 122-5 du code de la propriété intellectuelle (CPI).
    La loi autorise l’utilisation de l’œuvre divulguée, sans autorisation de l’auteur, dans les cas suivants :
     1) La représentation dans le cercle de famille
        La représentation privée doit être gratuite et être effectuée exclusivement dans un cercle de famille qui s’entend d’un public restreint aux parents ou familiers.
     2) La reproduction strictement réservée à l'usage privé du copiste et non destinée à une utilisation collective.
     3) Sous réserve que soient indiqués clairement le nom de l'auteur et la source.  
    Ayant acheté un exemplaire du livre et la copie privée étant une exception au droit d'auteur, je peux donc le reproduire pour mon usage personnel.


1. Numérotation des images scannées :
 
   
  
  Page impaire.
Page paire.    
 
    Je classe toutes les pages impaires dans un dossier et celles paires dans un autre.
 
    Puis, n'ayant pas de logiciel de traitement de fichiers multiples, je numérote de façon séquentielle les pages de chaque dossier :
       - de 001 à ... : les pages d'informations (image de couverture, titre, auteur, etc...)
       - de
010 à ... : les pages de texte,
    en leur ajoutant la lettre “a” pour les impaires et “b” pour les paires.
 
 
    Ensuite, je les réunis dans un seul dossier.
 
 
2. Traitement des images :
 
 

    Grâce à ScanTailor, je peux :
Premier onglet : corriger l’orientation,
Deuxième onglet : scinder en deux les doubles pages,
Troisième onglet : redresser les pages pour obtenir des lignes parfaitement horizontales,
Quatrième onglet : définir les zones de contenu,
Cinquième onglet : définir les marges autour de ce contenu,
Sixième onglet : générer des pages homogènes.

 
 
 
 
 
    J'enregistre ces images modifiées dans un nouveau dossier nommé : scan traité.
 
 
3. L' OCR ou la reconnaissance de caractère
 
 
A partir de ce dossier, je passe l'ensemble des images dans Abby FineReader.
 
a : Mes options
 
 
Je choisis les langues en fonctions du livre.
 
Le prétraitement des images a déjà été effectué avec Scan Tailor.
 
 
 
    Texte sous l’image de page permet de conserver l’image de scan originale avec la couche de texte invisible issu de l’OCR.
 
    Pour l'instant, J'ai préféré garder le texte formaté avec le numéro de page. 
 
b : Utilisation
 
 
    A l'ouverture du logiciel, j'enregistre le document FineReader dans le dossier contenant déjà les précédents :
 
    Puis j'ouvre et sélectionne les images traitées avec Scan Tailor.
 
    Ensuite je vérifie page par page les zones de reconnaissance sélectionnées.
    Si je modifie une zone, je relis la page en cliquant sur le bouton « Lire » juste au-dessus de l’image (entouré en jaune) pour enregistrer les modifications
 
    Une fois l’OCR terminé, j'enregistre deux documents :
       -  un au format PDF qui facilitera les recherches éventuelles lors des corrections ou des relectures.
       -  un au format HTML que j'ouvre ensuite dans un traitement de texte pour procéder aux corrections, Word en ce qui me concerne .
 
    Je sauvegarde l'ensemble des fichiers de chaque livre sur un disque dur externe dans un dossier désigné par le Titre du livre.
 
les livres d'un même auteur sont regroupés dans un dossier à son nom (ex : Auteur).
 
3ème partie : Traitement du texte
A  suivre