{tags:Scan, nomenclature, OCR} #Scan : Spécifications Ne pas supprimer les deux pages blanches 1 et 2. Les intégrer au scan.
Niveaux de gris
Résolution : 300 dpi
Format : .tif compression sans perte LZW
Horizontaux
Niveaux de couleur corrigés pour les pages jaunes
Pas de bordures noires
Mise au format uniforme A4
Toutes les pages du livre doivent être scannées y compris les pages blanches en début d'ouvrage (pages 1 et 2 systématiquement blanches).
#Nomenclatures des images issues du scan ou du PDF
Les images doivent être séparées et non pas en un fichier unique.
Elles doivent être nommées selon la convention suivante :
'EANpapier_pXXX.tif
' si la source fournie est papier
ou
'EANpapier_pXXX.pdf
' si la source fournie est un PDF imprimeur (PDF texte)
où XXX est le numéro d'ordre de l'image et non pas le numéro de page imprimé.
#Nomenclature des livrables
EANpapier“> | ||
l pages”> | l EANpapier_pXXXX.tif (ou .pdf selon la source fournie par Droz) | |
l EANpapier“> | l EANpapier_cov.jpg | |
l logo_publisher.jpeg | ||
l titlepage.jpeg | ||
l img001_pXXX.jpeg | ||
l EANpapier.xml | ||
l EANepub.epub |
#OCR De manière générale tout le texte doit être conservé hormis les titres courants. Conserver tous les numéros de page. Conserver tous les appels de notes avec leur numéros. Ils seront reproduits à l'identique et non renumérotés automatiquement. Pour des questions de citabilité entre les différents formes d'un même livre nous les publierons en numérique à l'identique du papier et inclurons les numéros de page papier dans le texte. Des détails typographiques ou la disposition des notes peuvent changer (marge, bas de page, fin de chapitre, fin de livre…) mais c'est à peu près tout. Les table des matières, index, glossaires, liste des tableaux, liste des figures, etc. doivent être saisis à l'identique. Les numéros de page renverront de manière automatique vers les marques de pages conservées dans le texte.