Naar inhoud springen

Wikisource:FasenProofread

Uit Wikisource

De fasen in het “proofread”-proces


Schematisch kunnen we de volgende fasen onderscheiden:

Without text
not yet created page Not proofread Proofread Validated
Problematic

We zullen er voorlopig even van uitgaan dat er een “OCR” van enigszins behoorlijke kwaliteit beschikbaar is. (OCR = optical character recognition; het systeem waarbij met behulp van daarvoor speciaal ontwikkelde software een gescande afbeelding van een tekst wordt omgezet in (machine-readable = leesbare) tekst, die bijv. in een tekstverwerker kan worden gebruikt.

(Als hieronder een bepaalde handeling onder een bepaald kopje wordt geplaatst, wil dat niet zeggen dat die handeling niet op een ander moment (nog eens) zou kunnen plaatsvinden).


Eerste fase: van ongecorrigeerde ocr tot “rose”

[bewerken]

De belangrijkste dingen die in deze eerste fase moeten gebeuren:

  • alinea's indelen; bij het indelen van alinea's gaan we net zo te werk als op Wikipedia: nieuwe alinea = witregel.
  • kop- en voetteksten maken (zie aldaar)
  • cleanup ocr - daarvoor is een apart tooltje; te installeren via....; de belangrijkste functie is: het verwijderen van alle harde returns, die de OCR standaard aan het eind van een regel invoegt (let op dat voor die tijd de alinea's moeten zijn ingedeeld).
  • afbreekstreepjes die in het origineel aan het eind van een regel stonden uit de tekst verwijderen
  • cursief en andere opmaak aanbrengen.
  • voetnoten maken, indien van toepassing.

(pagina's waar niks op staat maken we "grijs")

Van “rose” naar "geel": proofreading

[bewerken]
  • Nadat de eerste “schoonmaak” heeft plaatsgevonden, kan het echte “proofreaden” beginnen. Nu moet de tekst nauwkeurig van voor tot achter gelezen worden. Alle kleine foutjes in de OCR moeten nu in principe worden opgeruimd.
  • Voorzover de voetnoten nog niet zijn gemaakt, moet dat nu ook gebeuren.
  • Voorzover opmaak nog niet is gemaakt (cursief, paragraafkopjes etc.) moet dat nu ook worden gedaan.

Als alles eigenlijk netjes is, kan de pagina worden aangeduid als: proefgelezen.

Als er bijv. nog een afbeelding ontbreekt, kan dat worden aangeduid door de pagina "blauw" = "onvolledig" te maken.

Van "geel" naar groen: “validaten” of “controleren”

[bewerken]

De laatste controle; die moet worden uitgevoerd door iemand anders dan degene die heeft proefgelezen.

Als de pagina als “gecontroleerd” (groen) wordt gemarkeerd, is deze klaar. Dus als bijv. nog een afbeelding ontbreekt, mag de pagina niet als “gecontroleerd” worden aangemerkt.

Zie ook

[bewerken]