Lors de l'OCR : conservation de tous les numéros de page de l'édition papier, en pagination romaine et/ou arabe. Les numéros de page du volume imprimé seront publiées dans le texte numérique, dans le flux du texte (ePUB) ou en marge (html en ligne), pour des questions de citabilité entre les différentes formes du livre.

#Cas des pages blanches On en infère le numéro : exemple des pages 1 et 2. Pages de fin de chapitre, etc.

#Cas des pages hors texte (non foliotées) Dans le cas où des pages hors texte on été ajoutées (cahier d'illustrations, illustration et son verso blanc…) on identifie les pages sur la base de la page foliotée précédente : si la dernière page foliotée est la page n° 134 alors les pages hors texte suivantes sont les page 134-a, 134-b, 134-c, 134-d, etc.

#Cas des pages de notes en fin de chapitre La plupart du temps les notes sont en bas de page ou dans un chapitre séparé en fin d'ouvrage. Mais il arrive que certains livres présentent des notes en fin de chapitre. Dans ce cas le numéro de page de chacune des pages de notes doit être déplacé à la fin du texte du chapitre. Dans le XML on aura donc plusieurs <pb> à la fin du texte du chapitre.

#Structuration des numéros de page ##XML Les scans (rétro-conversion depuis source papier) ou Pdf imprimeur (composition native, structuration depuis source Pdf imprimeur) doivent être atomisés et chaque page nommée selon la règle suivante : EANpapier/EANpapier_pXXX.tif ou EANpapier/EANpapier_pXXX.pdf

<pb n="folio" id="opfolio" facs="EANpapier/EANpapier_pXXX.tif>
  • folio = numéro de la page imprimée (conserver la numérotation en romain le cas échéant !)
  • XXX = numéro de la page scannée ou du PDF imprimeur. Il peut arriver que le numéro de folio ne corresponde pas au numéro du fichier tif ou pdf, notamment s'il y a des pages non foliotées, des cahiers d'illustration, etc.). La page XXII imprimée peut être la page 028 du PDF ou du scan.

Ce lien vers la page pdf ou tif permettra aux lecteurs des portails d'avoir une vue mise en page papier, de vérifier une éventuelle erreur d'OCR…

##Dans le ePUB

<span class="page-start-break" id="psb_355">355</span>

La CSS doit stipuler :

body .page-start-break {color: grey;font-size:0.7em;text-align: right;font-style: normal;font-weight: 
normal;vertical-align: middle;margin-left: 0.3em;margin-right: 0.3em;}
body span.page-start-break + span.page-start-break {display: none;visibility: hidden;font-size: 0em;}
body .page-start-break:before {content: "{p. ";}
body .page-start-break:after {content: "}";}

Le numéro de page s'affichera ainsi : “en France au XVe siècle n’est explicable que par la profonde religiosité qui continuait à {p. 22} animer ce genre dramatique en garantissant un véritable sentiment d’unité”

##Positionnement Les numéros de page des livres Droz imprimés se trouvent en haut de page. Lorsqu'on les intègre dans le texte numérique ils peuvent se trouver :

  • au milieu d'un <p>, d'une <quote>, d'une <table> … Dans ces cas-là il faut les y laisser,
  • si la page commence par un titre, une <table> ou quelque bloc que ce soit il n'y a aucune raison de laisser le <pb> dans ce bloc. Il doit être posé juste avant,
  • si la page commence par un <div> de type chapitre ou section le <pb> se trouve toujours après le <head> puisque celui-ci doit toujours suivre directement le <div>,
  • dans une note marginale : une note marginale peut commencer en bas d'une page et se poursuivre dans la marge de la page suivante. Le numéro de page ne doit pas être inclus dans cette note qui est du paratexte. Un <pb> ne doit 'jamais' se trouver dans un bloc de paratexte : <note>…

#Numéro de page d'une édition témoin On les trouve le plus souvent :

  • soit dans la marge sous la forme [145], [42v°] (ou simplement 145, 42v°), avec dans le texte un marqueur qui est le plus souvent une barre verticale |
  • soit dans le flux du texte entre parenthèses ( ) ou entre [ ]

Ils doivent être encodés ainsi :

 <pb n="[42v°] rend="temoin"> 

et placés dans le flux du texte (à la place de la barre | le cas échéant).

  • wikinum/pagination.txt
  • Last modified: 2020/08/05 12:04
  • (external edit)