Gebruiker:Dick Bos/BewDjvu

Uit Wikisource

Graag commentaar, bijv. op de Overleg-pagina!



Het bewerken van djvu-bestanden


Lees eerst de “Inleiding op het werken met “Djvu-pagina's”.

Hieronder volgt een korte schets gegeven van de verschillende stadia van bewerking van een djvu-pagina.


(opm:

Het is de bedoeling dat ik op deze pagina binnenkort verwijs naar een paar voorbeeldpagina's, of afbeeldingen opneem o.i.d.)


OCR[bewerken]

Als van een pagina nog geen “OCR” (optical character recognition = optische tekenherkenning) is gedaan, is het linkergedeelte van het pagina-scherm blanco. Dan moet er dus eerst een OCR gemaakt worden. Dat kan eenvoudig door op het OCR-knopje te drukken dat zich in het werkbalkje boven het linkerdeel van het scherm bevindt. (evt. tzt illustr.)

Daarna kan men verschillende dingen doen. Ik zal ze hierna weergeven in de volgorde waarin ikzelf de dingen meestal aanpak. Andere volgorden zijn ook mogelijk.

Bij het bewerken van de OCR-pagina dient men ernaar te streven om geen html-code te gebruiken. Code dient de vorm te hebben van sjablonen.

Kop- en voettekst[bewerken]

In het werkbalkje boven de linkerhelft van de bewerkingspagina kan men op een knopje [+] drukken. Daarmee kan men de kop- en voetteksten weergeven (of verbergen). Soms is het knopje verborgen onder de “Hulpmiddelen voor proeflezen”.

Kop- en voetteksten bevatten informatie die niet in de definitieve weergave van de tekst in de hoofdnaamruimte terugkomen. Ze verschijnen alleen in een pagina-weergave.

Het is gebruikelijk voor de koptekst het sjabloon {{RH}} (RunningHeader; in het Nederlands:.....) te gebruiken. Het sjabloon heeft drie parameters, die niet alle hoeven te worden ingevuld:

  • {{RH|links|midden|rechts}}.
  • links: de tekst die links in de kop verschijnt;
  • midden: de tekst in het midden;
  • rechts: de tekst rechts.

Als de koptekst er bijvoorbeeld als volgt uitziet:

image kop pag. 12 Ideeen Multatuli invoegen.

zou de koptekst als volgt kunnen luiden:

{{Rule}}
{{RH|12|IDEËN VAN MULTATULI.|}}
{{Rule}}

Het Sjabloon:Rule wordt gebruikt voor de horizontale streep.

Het Sjabloon: RH (RunningHeader) wordt gebruikt om de 12 links te krijgen en “IDEËN VAN MULTATULI” in het midden.

Vergelijk hoe e.e.a. eruitziet op pagina 13 van de “Ideën” door op deze pagina op "Bewerken" te klikken en vervolgens de koptekst zichtbaar te maken! Zoals te zien staat de "13" hier keurig rechts.

Indelen in alinea's[bewerken]

De ruwe OCR-tekst is niet ingedeeld in alinea's. Aan het eind van iedere alinea moet dus steeds een blanco regel worden toegevoegd (vergelijkbaar met het eind van een alinea in Wikipedia).

Verwijderen van harde returns[bewerken]

Helaas zjin in de ruwe OCR-tekst aan het eind van alle regels harde returns opgenomen. Die moeten eruit. Dat doe ik meestal in de “verticale (scherm-)layout” (het knopje rechts naast dat van de kop- en voetteksten, met de kleine streepjes). Ik ruim de harde returns dan van onder af op. Dat werkt het snelste. Deze methode werkt alleen goed als de tekst eerst in alinea's is ingedeeld.

Verwijderen van typefouten / invoegen van code[bewerken]

Hierna kan eindelijk met het echte “proeflezen” worden begonnen: het controleren van de ruwe OCR-tekst op foutjes. Daarnaast kan nu de benodigde code worden aangebracht, voor cursief, voor vet, voor afwijkende corpsgrootte, etc. etc. Zie hiervoor (tzt): Het opmaken van tekst in djvu-bestanden.

Als dit allemaal doorlopen is kan de pagina worden aangemerkt als “proefgelezen” door onderaan de pagina (net boven “Pagina opslaan”, “Bewerking ter controle bekijken” etc.) de pagina-status geel te maken.

Controleren[bewerken]

Vervolgens dient de pagina door een andere editor nog een keer gecontroleerd te worden; die kan dan de status veranderen in “Gecontroleerd”. Dan is de pagina in principe klaar. Dat betekent ook: pagina's waar nog wat mee is: niet labelen als “Gecontroleerd”; gebruik dan liever de blauwe markering: “Onvolledig”.