{tags:Scan, nomenclature, OCR} #Scan : Spécifications Ne pas supprimer les deux pages blanches 1 et 2. Les intégrer au scan.

Niveaux de gris Résolution : 300 dpi Format : .tif compression sans perte LZW Horizontaux Niveaux de couleur corrigés pour les pages jaunes Pas de bordures noires Mise au format uniforme A4 Toutes les pages du livre doivent être scannées y compris les pages blanches en début d'ouvrage (pages 1 et 2 systématiquement blanches). #Nomenclatures des images issues du scan ou du PDF Les images doivent être séparées et non pas en un fichier unique. Elles doivent être nommées selon la convention suivante : 'EANpapier_pXXX.tif' si la source fournie est papier ou 'EANpapier_pXXX.pdf' si la source fournie est un PDF imprimeur (PDF texte) où XXX est le numéro d'ordre de l'image et non pas le numéro de page imprimé. #Nomenclature des livrables

EANpapier“>
l pages”>l EANpapier_pXXXX.tif (ou .pdf selon la source fournie par Droz)
l EANpapier“>l EANpapier_cov.jpg
l logo_publisher.jpeg
l titlepage.jpeg
l img001_pXXX.jpeg
l EANpapier.xml
l EANepub.epub

#OCR De manière générale tout le texte doit être conservé hormis les titres courants. Conserver tous les numéros de page. Conserver tous les appels de notes avec leur numéros. Ils seront reproduits à l'identique et non renumérotés automatiquement. Pour des questions de citabilité entre les différents formes d'un même livre nous les publierons en numérique à l'identique du papier et inclurons les numéros de page papier dans le texte. Des détails typographiques ou la disposition des notes peuvent changer (marge, bas de page, fin de chapitre, fin de livre…) mais c'est à peu près tout. Les table des matières, index, glossaires, liste des tableaux, liste des figures, etc. doivent être saisis à l'identique. Les numéros de page renverront de manière automatique vers les marques de pages conservées dans le texte.