Crash Course - Transcriptie NA KdK

[English version]

Als gebruikers van het Nationaal Archief op een tekstregel uitkomen door browsen of door 'clustering' door de Scratch zoekmachine, kunnen zij de bij het tekstbeeld horende tekst intoetsen (als zij voldoende "Wiki"-motivatie hebben).

Op dat moment, na transcriptie, zijn er minstens drie doelen gerealiseerd:

  1. andere gebruikers kunnen vanaf dat moment direct 'free-text search' op ingetikte steekwoorden uitvoeren;

  2. na het bekend worden van nieuwe transcripties kunnen tevens zoek- en clusteralgoritmes opnieuw worden getraind, zodat toekomstige zoekacties nog nauwkeuriger resultaten kunnen opleveren;

  3. tenslotte zijn de regeltranscripties nuttig omdat de vorm-gebaseerde algoritmen er mee geevalueerd kunnen worden. Zelfs als de annotaties niet voor trainen van het systeem worden gebruikt zijn ze nuttig in Scratch!

Regels

  1. De tekst wordt in leesvolgorde gelabeld, van linksboven naar rechtsonder.
  2. Het inktspoor van de doeltekst is zwarter gemaakt. De irrelevante fragmenten aan de randen van een regelstrip worden lichter afgebeeld (en hoeven niet te worden ingetikt).
  3. Annoteer voor de eerste regel van de paragraaf:
    • [maand]
    • [dag]
    • [nummer]
    • Rappt
    • [departement] FD, MD, BD, MarD of BlD
    • [dag]
    • [maand]
    • no (numero) ==> no
    • [nummer]
    • De inhoud van de regel

Voorbeeld

Jan 14 19 Rappt FD 12 Jan no 49 Op adres van het Be

Meer instructies

  • Tik in wat er staat, niet wat je denkt dat er staat (dus inclusief een - zeer zelden optredende - spelfout)
  • De twee horizontale streepjes voor "Besluit fiat" e.d. coderen we als: _-_
    (dus: underscore,minus,underscore)
  • Men gebruikte geen afbreekstreepje aan het einde van een regel, tik deze dan ook niet in.
  • Annoteer alleen de regels op de jou toegekende pagina: er zit in deze versie geen optie voor simultane transcriptie van dezelfde regel door verschillende personen.

De interface

De interface is erg rudimentair, en eerder bedoeld voor techneuten dan eindgebruikers. Raak je verdwaald, ga dan naar Monk


Voor gevorderden

  1. Afwijkende en slecht gesegmenteerde regels

    De volgende codes worden gebruikt voor bijzondere 'line strips' of regelbeelden. Ze moeten beginnen op de eerste karakterpositie:
  2. Lijntjes

    De schrijver beeindigde elke paragraaf met een dubbele onderstreping in het midden, met daarna het besluit, en ging daarna naar de volgende regel links onder om een streep te zetten. De later toegevoegde tekst Rappt loopt meestal door deze streep heen. Soms is er echter sprake van een duidelijk gescheiden enkele streep linksonder, bijvoorbeeld aan het einde van een pagina. Codeer een dergelijke streep met ___ (drie onderlijningen). Omdat onderlijningen in de tekst normaal niet voorkomen kan de computer deze afwijkende elementen in de transcriptie gemakkelijk vinden.
  3. Dubbele onderlijningen

    Dubbele onderlijningen, zoals onder het woord Staatsblad:
    Staatsblad
    ==========
    
    kunnen worden aangegeven met drie keer een is-gelijk teken: === op de volgende regel. Zie het volgende punt.
  4. Meerdere regels in een enkel beeld transcriberen

    Normaliter wordt een enkele regel ingevoerd. Met de [-] en [+] knopjes kan het invoervenster groter of kleiner worden gemaakt. Een groter venster staat het invoeren van nieuwe regels met de Entertoets toe.
    Het voordeel van de enkele regel is echter dat Firefox en IE "autocompletion hints" kunnen geven in deze stand. Eerder ingetikte regels tekst verschijnen dan in een menu onder het invul-veld. Soms is deze optie van de browser uitgeschakeld. Pas op met dit hulpmiddel. De neiging kan ontstaan om de suggestie kritiekloos over te nemen. Controleer altijd of de suggestie exact overeenkomt met het handschrift in die regel. Omdat de drukletters duidelijker zijn heeft het oog de neiging in drukletterteksten te blijven hangen.
  5. De inhoud snel controleren

    Het werken met afzonderlijke regels leidt tot verlies van overzicht. Hiervoor zijn diverse oplossingen.
  6. Onleesbare details

    Het beeld is het duidelijkst indien de kleur of grijsmodus is gekozen. Voor onleesbare details kan onder de rechter muistoets de functie "View Image" gekozen worden. Ook deze optie is soms uitgeschakeld onder de Instellingen van de browser. Met View image, en eventueel na drukken op de (+) van "inzoomen" kan men in ieder geval in de browser Firefox het beeld in de oorspronkelijke resolutie (1 scanpixel=1 beeldpixel) bekijken. Veel onleesbare fragmenten worden daardoor een stuk duidelijker.
  7. Rare namen en termen

    Gebruik een 'window' of 'tab' van de browser met een Google link om te zoeken of een familienaam, plaatsnaam of term ergens op internet voorkomt en ga weer terug naar het transcriptievenster.

Lambert Schomaker / 2007.