Gebruiker:Dick Bos/InlDjvu

Uit Wikisource

Deze pagina is verplaatst naar: Wikisource:Proofread-extensie;
deze pagina niet meer bewerken!



Inleidende opmerkingen over het werken met djvu-bestanden op nl-wikisource


Het werken met Djvu-bestanden is een zeer perspectiefvolle en krachtige manier om bronnen op wikisource te ontsluiten. Er is een duidelijke scheiding tussen dat, wat aan de eindgebruiker (de lezer) wordt aangeboden en dat wat er "onder de motorkap" gebeurt, door de editors.

Om e.e.a duidelijk te maken kunnen we op dit moment nog het beste verwijzen naar de Engelstalige wikisource, waar inmiddels al veel ervaring is opgedaan met het werken met deze bestanden.

Het hele djvu-gebeuren is voor editors in eerste instantie een beetje ingewikkeld. Het werkt heel anders dan we op bijv. wikipedia gewend zijn. Ik denk ook eigenlijk niet dat ik alle ins en outs van het gebeuren al helemaal snap, alhoewel ik inmiddels (samen met Gebruiker:WeeJeeVee) een paar maanden op de engelse wikisource hiermee bezig ben. Mijn grote handicap daarbij is dat ik absoluut niet “technisch” ben. Eigenlijk eerder onhandig. Dat kan je zo hebben. We zien echter wel de mogelijkheden van het systeem. Daarbij baseren we ons dus op wat we op de engelse wikisource zien. Daar werkt het systeem redelijk behoorlijk inmiddels, en is het dus ook voor absolute technische onbenullen zoals ik, goed te gebruiken. Inmiddels zijn we ook hier op de Nederlandstalige wikisource wat ervaring aan het opdoen en proberen we enkele hindernissen te overwinnen. Hieronder volgt een eerste uiteenzetting over de opbouw van wat ik maar even het "Djvu-gebeuren" noem.

Naamruimten[bewerken]

De bedoeling is dat er uiteindelijk een pagina in de hoofdnaamruimte komt waarin een “bron” gepresenteerd wordt aan de gebruikers. Die pagina kan er verschillend uitzien, maar bevat in ieder geval de titel en (een link naar) de inhoudsopgave. Een goed voorbeeld - ik verwijs daarvoor nu maar even naar de engelse wikisource - is: en:The_Story_of_the_Treasure_Seekers.

Achter die “titelpagina” zitten dan de afzonderlijke hoofdstukken, bijv: Chapter 1 van de Treasure Seekers. Dat is de tekst zoals die door de eindgebruiker (dat is een lezer) gelezen kan worden. Er zijn functies om van hoofdstuk naar hoofdstuk verder te bladeren, en terug te gaan naar de inhoudsopgave etc.

(Opm: op de Nederlandstalige wikisource is de keuze voor de indeling van bestanden in de hoofdnaamruimte niet eenduidig: bijv. bij In de sneeuw van Alexander Lange Kielland staat de titel direct in de hoofdnaamruimte. Terwijl bijv. bij Noodlot van Couperus ervoor gekozen is om het boek als een subpagina van "Couperus" te plaatsen (Couperus/Noodlot). Voor dit laatste is wel wat te zeggen; het is niet de manier waarop het op de Engelstalige wikisource gebeurt. Hoe dan ook lijkt het me dat er op een gegeven moment een consistente aanpak moet worden gekozen.

Het is hier goed om op te merken dat het wikisource-project fundamenteel afwijkt van bijv. wikipedia in die zin dat een pagina in wikisource op een bepaald moment helemaal “klaar” kan zijn. Nou ja. Wat heet.... Niks is natuurlijk ooit helemaal klaar, maar het doel is om een bron in een leesbare vorm te presenteren aan een eindgebruiker, en als dat doel bereikt is, kun je zeggen dat het werk “klaar” is. Dat zie je bijvoorbeeld in het (Engelse) voorbeeld hierboven: hoofdstuk 1 (en trouwens ook alle andere hoofdstukken van dit aardige boekje) zijn gereed om te lezen. Ik geloof dat er nog niet echt e-reader faciliteiten zijn voor wikisource-pagina's, maar ik stel me zo voor dat we binnen afzienbare tijd dit op een e-reader kunnen lezen. En dat is het doel: het leveren van een leesbare versie van een brontekst. Uiteindelijk compleet met plaatjes e.d. Maar zo'n pagina in de hoofdnaamruimte is dus in principe niet bedoeld voor bewerking door een eindgebruiker. Op zo'n pagina kunnen dus bijv. geen typefouten enzo gecorrigeerd worden. Dat is ook niet de bedoeling! Laat me dat uitleggen.

Naast de pagina in de hoofdnaamruimte..... Want dit is nog maar het begin van het djvu-verhaal.... naast de pagina('s) in de hoofdnaamruimte, heeft een bron ook nog allerlei “back office” pagina's. De pagina's "onder de motorkap", zullen we maar zeggen.

Dat zie je al meteen als je in het hierboven bedoelde hoofdstuk 1 van de Treasure Seekers kijkt. Dan zie je links naast de tekst een verwijzing naar pagina-nummers tussen vierkante haken. Die pagina-nummers zijn aanklikbaar. Als je bijv. op pagina 8 klikt kom je op een pagina in de pagina-naamruimte. (de terminologie is soms een tikje verwarrend; ik vertaal maar even 1 op 1 vanuit het Engels). Hier wordt (links) een transcriptie van pagina 8 van het originele werk gegeven en rechts een afbeelding van de scan van de pagina uit het originele boek. De pagina in de pagina-naamruimte is de pagina waar de bewerker (editor) actief is (geweest). De eindgebruiker (lezer) kan er altijd een kijkje nemen. Bijvoorbeeld om te zien waarom op bladzij 8 in de tweede regel “something” cursief is geschreven. Simpel: omdat het in het oorspronkelijke werk ook zo was. Overigens ligt hier ook het aangrijpingspunt voor “type-fouten”. Er kunnen type-fouten zijn die ook al in het oorspronkelijke werk zitten, en die moeten er dus ook gewoon in blijven zitten. Dat kan hier gecontroleerd worden. Eventueel kan met een “SIC”-sjabloontje worden aangegeven dat het een type-fout betreft.

(voorbeeld: sneenwsok) Pagina:Noorsche Volksvertellingen.djvu/103

Goed. Dat is dus de “pagina in de pagina-naamruimte”. Voor de editor de pagina waar het om draait. Voor de eindgebruiker (lezer) hooguit een pagina om af en toe even op terug te vallen als iets niet duidelijk is, of nagekeken moet worden ofzo. (Of - dat heb je bij bibliofielen - om even te kijken hoe het er in de oorspronkelijke uitgave uitzag). Persoonlijk vind ik dit een heel sterk ding van de djvu-aanpak. Je kunt, als je dat wilt, als eindgebruiker, gewoon in de hoofdnaamruimte blijven, en gewoon de tekst lezen, en je kunt met 1 klikje, ook de oorspronkelijke tekst - en de transcriptie ervan - inzien, en daar eventueel wijzigingen aanbrengen.

Daarmee zijn we er nog niet. Er is in ieder geval nog één heel belangrijke naamruimte. Dat is de index-naamruimte. Daar komen we bijvoorbeeld door vanuit pagina 8 in de pagina-naamruimte op het pijltje omhoog te klikken: Index van de Treasure Seekers. Je kunt hier ook komen door vanuit de beginpagina op “Source” te klikken, bijvoorbeeld.

Dit is ook weer een pagina die niet primair voor de eindgebruiker/lezer bedoeld is, maar die de gebruiker/editor zicht moet geven op de voortgang van het werk aan een bron, en die daarnaast ook een makkelijk instrument biedt om van pagina naar pagina te schakelen. Helaas loopt de nummering van pagina's in dit overzicht niet synchroon met de pagina-nummering van het werk. Dat is iets lastigs, dat misschien in de toekomst nog wel door de software-bouwers gaat worden opgelost.

Proeflezen en controleren[bewerken]

Het is hier misschien ook goed om even te wijzen op het feit dat alle pagina's van het werk waar we nu naar kijken groen zijn gekleurd. Dat betekent dat ze zijn “gevalideerd” (gecontroleerd, in goed Nederlands). Het bewerkings-proces van een djvu-pagina verloopt in (tenminste) twee stappen. De eerste stap is het “proeflezen”. Dan wordt een pagina voor het eerst getranscribeerd op een manier dat er een - volgens de editor - leesbaar en correct geheel ontstaat. In de index wordt de pagina dan geel. Daarna moet een andere editor die pagina nog een keer nakijken (en evt. correcties aanbrengen), en dan is de pagina “gevalideerd”. Als je een beetje een beeld van de gang van zaken in dit proces wil kijken is de lopende "Proofread of the Month" een aanrader: een aantal mensen werken hier samen om een boek snel in z'n geheel te proeflezen (en te valideren) (binnen een maand, dus). Een heel leuke manier van werken, waardoor automatisch ook veel uitwisseling van ervaring plaatsvindt!

Het is misschien zaak om wat ik hierboven in ruwe bewoordingen heb weergegeven op een bepaald moment in de vorm van help-pagina's op nl-wikisource te plaatsen. Dan is het - lijkt me - wel zaak dat we kunnen verwijzen naar pagina's in de Nederlandstalige wikisource. En zover zijn we nog niet op dit moment.


van mul:Wikisource:ProofreadPage:

ProofreadPage has five quality levels :

Without text
not yet created page Not proofread Proofread Validated
Problematic