Help:Cleanup OCR

Uit Wikisource

Om de OCR van een pagina snel te "reinigen" van veel-voorkomende onvolkomenheden, is er de "Cleanup OCR"-tool. Dit gereedschapje kunt u als geregistreerde gebruiker installeren via "Voorkeuren" (bovenaan rechts op het scherm, achter de Gebruikersnaam, de knopjes voor meldingen, en "Overleg" en voor "Bèta," "Volglijst," "Bijdragen" etc.)

U belandt dan op de pagina Speciaal:Voorkeuren, waar ook uw persoonlijke basisgegevens staan. Klik hier op de tab "Uitbreidingen".

Vervolgens ziet u onder "Hulpmiddelen" de knop voor "PageCleanup" met het symbooltje . Als u de knop afvinkt zult u vervolgens op alle pagina's, in de bewerkings-modus, het symbooltje in de werkblad terugvinden, waar ook vet en cursief etc. kan worden aangeklikt.

Wat doet de Cleanup OCR-tool?

  • returns aan het eind van de regel verwijderen
  • afbreektekens aan het eind van de regel verwijderen en het afgebroken woord verbinden met het laatste deel op de volgende regel
  • aanhalingstekens uniformeren (alles naar ")
  • spaties voor komma's, punten en andere leestekens weghalen
  • interpunctie corrigeren: als de OCR een punt voor een komma leest, wordt dit gecorrigeerd.
  • etc


Let op: bij sommige teksten, waar dit in de overlegpagina van de Index is aangeduid, moet deze clean-up tool slechts gebruikt worden als pagina's nog niet proefgelezen zijn, dit om te voorkomen dat gewenste afbreektekens, spaties bij sommige leestekens en afwijkende aanhalingstekens ten onrechte ongedaan gemaakt worden.