15. MARC21 export: exportprofiel voor STCV

15.1. Toelichting

Deze nota documenteert de wijze waarop de MARC21 export wordt geparametriseerd met behulp van exportprofielen, in functie van de opname van STCV Brocade records.

De finale export wordt echter nog beïnvloed door:

  • parameters die in de software werden vastgelegd (bv. voor het impressumveld) en/of die kunnen aangeroepen worden via extra routines (bv. voor het bepalen van de GMD, en voor het uitsluiten van de auteur e.a.)
  • exportgeneratoren (bv. voor het bepalen of pk’s moeten worden geëxporteerd, voor het bepalen van de default taal van authority records, enz.)

15.2. Nog op te lossen

Tag 008

  • algemene problematiek van het correcte datumtype (positie 06) (issue 3010)

Impressum

De kwestie van het kopij-impressum; niet opgelost.

Holdings

  • Het eigenlijke pk zou opgenomen moeten worden in 852$h en niet in $c (opmerking STCV) (opgenomen in issue).

Omzetting auteursnaam in 245$c

  • In 245$C moet de verwijzingsterm worden opgenomen (opmerking STCV) (zie issue 3063)

Onderwerpen

  • Het authority type ST is opgesplitst, op legato, in verschillende specifiekere types, en dient nog geconverteerd te worden op moto. Dat gebeurt maar na de installatie van release 4.30; dus eind januari.

Collatie

  • probleem van oblong; op te lossen via exportgenerator

Exportgenerator stcv

  • die is nu nog geënt op die voor OCLC, waarvoor een GMD vereist is. Voor STCV lijkt me dat overbodig.

Commentaar in de tekst:

  • titels voorafgegaan door ??: niet (volledig) nagekeken
  • titels voorafgegaan door ?: volledig nagekeken, maar met vragen
  • titels zonder ?: in orde
  • titels met bezig: aangepast, maar niet volledig nagekeken

15.3. Tag filter

15.3.1. ?? Lijst van op te nemen tags

nog aan te vullen, eventueel, na vervolledigen van het profiel.

  • 001: control number: cloi
  • 003: Control Number Identifier: code voor Anet, gerelateerd aan 001.
  • 005: Date and Time of Latest Transaction
  • 008: Fixed-Length Data Elements (niet alle posities worden gebruikt)
  • 010: Library of Congress Control Number
  • 017: Copyright or Legal Deposit Number: komt overeen met Anet bibliografisch nummer type dep. Moet in nabehandeling ook resulteren in 017$bKoninklijke Bibliotheek van België.
  • 020: International Standard Book Number
  • 022: International Standard Serial Number
  • 024: Other Standard Identifier (bv. voor ISMN)
  • 026: Fingerprint Identifier
  • 028: Publisher Number: komt overeen met Anet bibliografisch nummer type ugpl
  • 035: System Control Number: voor opname van het OCLC nummer
  • 040: Cataloging Source
  • 041: Language Code
  • 100: Main Entry - Personal Name
  • 110: Main Entry - Corporate Name (in Anet: ook voor manifestaties als corporatieve auteur)
  • 130: Main Entry - Uniform Title
  • 210: Abbreviated Title: voor Anet citeertitels
  • 240: Uniform Title: bv. voor Anet muzieksorteertitel
  • 245: Title Statement
  • 246: Varying Form of Title: bv. voor Anet titel type v (secundaire titel)
  • 250: Edition Statement
  • 260: Publication, Distribution, etc. (Imprint)
  • 300: Physical Description
  • 340: Physical Medium
  • 383: Numeric Designation of Musical Work: voor Anet titel type nr (opustitel)
  • 384: Key: voor Anet toonsoort
  • 490: Series Statement
  • 500: General Note
  • 501: With Note (Anet relatie wi; annotatie wi)
  • 502: Dissertation Note
  • 505: Formatted Contents Note: voor Anet inhoudstafel
  • 510: Citation/References Note: voor Anet noottype br
  • 520: Summary, Etc.: voor Anet abstract
  • 521: Target Audience Note: voor Anet noottype doel
  • 525: Supplement Note
  • 534: Original Version Note: voor Anet noottypes rep en fac
  • 600: Subject Added Entry - Personal Name
  • 610: Subject Added Entry - Corporate Name
  • 630: Subject Added Entry - Uniform Title
  • 648: Subject Added Entry - Chronological Term
  • 650: Subject Added Entry - Topical Term
  • 651: Subject Added Entry - Geographic Name
  • 655: Index Term-Genre/Form: voor Anet publicatietype
  • 700: Added Entry - Personal Name
  • 710: Added Entry - Corporate Name (in Anet: ook voor manifestaties als corporatieve auteur)
  • 760: Main Series Entry
  • 770: Supplement/Special Issue Entry
  • 772: Supplement Parent Entry
  • 773: Host Item Entry
  • 775: Other Edition Entry
  • 776: Additional Physical Form Entry
  • 777: Issued With Entry
  • 780: Preceding Entry
  • 785: Succeeding Entry
  • 787: Other Relationship Entry
  • 852: Location
  • 856: Electronic Location and Access
  • 919: Lokaal gedefinieerd. Dient het acroniem van de holding te bevatten
  • 920: Lokaal gedefinieerd. Resource type zoals bepaald voor Unicat

15.3.2. Opmerkingen:

  • 111: Main Entry - Meeting Name: zit mee onder 110. Niet te voorzien.
  • 264: Production, Publication, Distribution, Manufacture, and Copyright Notice: in Anet wordt geen onderscheid gemaakt tussen drukker, uitgever, producent. Niet te voorzien.
  • 711: Added Entry - Meeting Name: zit mee onder 710. Niet te voorzien.
  • indicator undefined dient voor OCLC niet vertaald te worden als # maar als * * (spatie).

15.4. Voorbereiding

15.4.1. Indicator recordtype

Wordt geëxporteerd naar de Leader, positie 06.

  • Bij de parametrisatie werd geen rekening gehouden met type p (“Used when there are significant materials in two or more forms that are usually related by virtue of their having been accumulated by or about a person or body”). Bij catalografische beschrijvingen behoren de sets tot een uitgave; ze zijn niet “toevallig” door iemand verzameld.
  • Bij de parametrisatie werd geen rekening gehouden met type o (“Used for a mixture of various components issued as a unit and intended primarily for instructional purposes where no one item is the predominant component of the kit”). Dergelijke sets zijn moeilijk te onderscheiden in Brocade, omdat dergelijke aanduiding alleen maar zou kunnen blijken uit de collatie (tekst) of uit het voorkomen van meer dan 1 drager (en dat is niet parametriseerbaar).

Voor STCV zijn 3 types van belang:

  • c (notated music): op basis van onderwerpscode a::d914
  • e (cartographic material): op basis van onderwerpscode a::d903
  • a (language material): alle andere publicaties

(aangepast in profiel stcv)

15.4.2. ? Indicator bibliographic level

Voor STCV komen 3 types voor parametrisatie in aanmerking :

  • tijdschriften (s), op basis van onderwerpscode a::d923.
  • onderdeelbeschrijvingen (a), op basis van het relatietype (voorlopig onduidelijk).
  • monografieën (m): alle andere records.

Volgende types werden niet toegekend:

  • b (serial component part, voor bv. een regelmatig verschijnende column in een tijdschrift): in Anet worden dergelijke records niet catalografisch beschreven.
  • c (collection, voor verzamelingen van items die niet door publicatie samen horen): in Anet worden dergelijke records niet catalografisch beschreven.
  • d (subunit, voor onderdelen van collecties): in Anet worden dergelijke records niet catalografisch beschreven.
  • i (integrating resource, voor bv. losbladigen): dergelijke records kunnen in Anet niet gecodeerd of via meta-informatie worden onderscheiden, alleen op basis van het voorkomen van bepaalde karakters (<LOS>) in welbepaalde velden (annotatie of collatie).

(aangepast in profiel stcv)

15.4.3. Indicator descriptive cataloguing form

Deze parameter moet op c staan, d.w.z.: “ISBD punctuation omitted”. Anet records zijn immers wel volgens ISBD beschreven, maar de records bevatten geen ISBD-interpunctie op het einde van een (sub)veld.

(aangepast in profiel stcv)

15.4.4. Vertaling Brocade coderingen

De vertalingen van Brocade codes die moeten gebeuren voor de eigenlijke omvorming van de data naar een MARC21 structuur, worden opgenomen in schema oclcprep.

Dat schema bevat de vertaaltabel voor de meeste auteursfuncties die niet behoren tot de MARC21 relator codes. Het gaat dan om de auteursfuncties voor de uitvoerende muziek, die alle dienen omgevormd naar relator code mus. Dat heeft als consequentie dat mus nooit kan omgezet worden naar tag 100/110, omdat anders alle uitvoerende muzikanten (bv. zbb - bas-bariton) als main entry in aanmerking zouden komen, en dat is niet geoorloofd. De keuze om deze vertaling in de voorbereidende fase te doen heeft als voordeel, dat er alleen een vertaaltabel dient aangemaakt, en dat deze codes niet individueel dienen geparametriseerd te worden.

Voor STCV niet van toepassing, aangezien alle auteursfuncties tot de MARC21-set behoren.

(niet ingevuld in profiel)

15.4.5. Externe bronnen

In MARC21 moeten gegevens die uit externe bronnen komen, tussen rechte haken worden geplaatst. In Anet wordt die bronvermelding aangegeven met type ext.

(ingevuld in profiel)

15.5. Dragers

Parametrisering gebeurt hier; vertaling van de codes: zie nabehandeling.

(ingevuld in profiel; de dragerconversie van lvd voor oclc behouden)

15.6. Taal van de inhoud

(ingevuld in profiel; conversie van lvd behouden)

15.7. Lidmaatschappen

niet te converteren in MARC21.

(niet-conversie van lvd behouden voor STCV)

15.8. Titels

Niet te parametriseren:

  • taal van de titel (er is geen vastgesteld MARC21 veld of subtag hiervoor).

Onderscheid hoofdtitel - ondertitel:

  • gebeurt op basis van het voorkomen van ” : “. Het titelgedeelte voor het eerste voorkomen wordt geconverteerd naar 245$a; alle titelgedeeltes na het eerste voorkomen worden geconverteerd naar 245$b.
  • bij titels van oude records, waarin meestal “: ” als scheiding voorkomt (op basis van oudere catalografische regels; voor 2011) kan geen scheiding tussen $a en $b gebeuren. Die titels worden in zijn geheel naar 245$a gemapt.
  • schaalaanduidingen (1:100.000) leveren bij export dus geen problemen op.

Paralleltitel:

  • zou ook naar 245 $b moeten, maar dan wordt de interpunctie problematisch, en komen we in conflict met andere elementen uit de hoofdtitel die naar $b moeten. Alleen in 246 op te nemen.

Verzameltitel:

  • in STCV worden publicaties, die teruggaan op hetzelfde oorspronkelijke editie, gegroepeerd op de titel van die oorspronkelijke editie, door het gebruik van de verzameltitel (type tc). Het gaat dus om een soort titel, om vertalingen of andere edities te kunnen groeperen onder dezelfde titel. Het gaat dus niet om een echte uniforme titel, omdat het gaat over andere edities en vertalingen. Het is daarom aangewezen om tag 246 te gebruiken, en aangezien het niet gaat om een opgegeven titel (ook niet other, want dat type veronderstelt dat die titel voorkomt in de publicatie) dient indicator 2 leeg te blijven, en wordt gebruik gemaakt van subtag i om het type te laten verwoorden.

sorteertitel:

  • bij STCV wordt de sorteertitel (type s) gebruikt om bepaalde publicaties (van de overheid, of veilingcatalogi, enz.) te kunnen groeperen onder een gemeenschappelijke generieke titel, die aangevuld wordt, in extensie, met een datum. MARC21 heeft geen specifiek veld voor deze praktijk, dus het is aangewezen om dit onder te brengen in tag 246, met subtag i voor de verwoording van het type. De extensie wordt omgezet naar subveld f.

Uniforme titel:

  • wordt gemapt op tag 130.
  • als er echter al een tag 100 of 110 is toegekend op basis van andere parameters, komt deze titel terecht in 240 (op basis van parameters vastgelegd in de software).

(ingevuld in profiel)

15.9. Bibliografische nummers

De conversie werd onveranderd overgenomen van het OCLC-profiel. Ook al zal een aantal nummervelden niet voorkomen in STCV.

Enkele nummertypes dienen niet omgezet, omdat het geen standaardnummers zijn, maar verwijzingen naar bibliografische repertoria:

  • lugt
  • rism

ISSN:

  • voorziet aparte subtags voor incorrect ($y) of canceled ($z). In Brocade wordt dat onderscheid niet gemaakt. Om te zetten naar “incorrect”.

ICS:

  • niet helemaal duidelijk. Hoogstwaarschijnlijk toegekend door ISO, dus op die manier geparametriseerd. Te vertalen in nabewerking

mm:

  • niet helemaal duidelijk. In de praktijk wijst het meestal naar een videorecording, dus op die manier geparametriseerd.

fp:

  • type naar 026$2, en te vertalen in nabewerking.

dep:

  • type naar 017$b, en te vertalen in nabewerking.

(ingevuld in profiel)

15.10. Relaties

Gezien het grote aantal relaties worden die gedefinieerd in een apart profiel. Voor STCV wordt verwezen naar het specifieke profiel relationsstcv.

Wel op te nemen in de tabel:

  • de relaties alleen in gebruik voor STCV. Voor deze relaties werd de eerste indicator op 0 gezet, zodat die een noot genereren (opm. STCV)

Niet te exporteren relaties voor OCLC:

  • relaties naar ander regelwerk (bv. stcvl)

Andere kwesties:

  • Voorvoegsel voor record in $w: toe te voegen in nabehandeling, vertaaltabel voor relatiecodes.

(ingevuld in profiel)

15.11. Personele auteurs

Voor STCV komen twee auteursfuncties in aanmerking om naar het main entry veld te worden geconverteerd:

  • aut: de gewone tekstauteur.
  • dis: auteur van een thesis of dissertatie (bij het voorkomen van het publicatietype voor academische geschriften of geschriften over de christelijke leer).

(auteursfuncties ingevuld in profiel, waarbij de OCLC-coderingen werd overgenomen, met toevoeging van de auteursfunctie dis).)

15.12. Corporatieve auteurs

opgelet: manifestaties als corporatieve auteur zouden ofwel naar 110 ofwel naar 111 moeten, afhankelijk van de constructie van de naam. Dat is echter zo goed als onmogelijk te parametriseren, dus alles naar 110. Bovendien is de structuur van 111 anders dan die van 110 (subordinate unit moet ofwel in $e ofwel in $b).

(overgenomen van OCLC-profiel)

15.13. Annotaties

Gezien het grote aantal annotaties worden die gedefinieerd in een apart profiel (notesstcv). Voor STCV wordt een globale tabel gebruikt, aangevuld met enkele annotaties specifiek voor STCV:

  • price: naar tag 500 met voorvoegsel als verklaring.
  • sheet: naar tag 500 met voorvoegsel als verklaring.

Annotaties waarvoor overeenkomstige relaties bestaan dienen bij voorkeur te worden gemapt naar identieke tags in MARC. Bv. cui naar 787/1/8/.

Annotatietype sf kan niet goed in tag 787 worden opgenomen, omdat sf twee zaken regelt: zowel succeeding als preceding entry.

(ingevuld in profiel)

15.14. ? Collatie

Conversie van het collatieveld, zowel voor type¨*normal* als type oblong.

Voor oblong zou het collatietype beter naar tag 340 subveld b kunnen (als het naar 300$b zou gaan komt het mogelijk in conflict met illustraties, en bij $c in conflict met de afmetingen).

Dat wordt opgelost door het opsplitsen van het collatietype oblong in twee verschillende collatietypes:

  • een type oblong, dat alle subvelden bevat, maar niet het type collatie; te converteren naar tag 300
  • een virtueel type oblong2, dat alleen het type collatie bevat; te converteren naar tag 340
  • via de exportgenerator dient dat correct te worden omgezet.

Bijkomend probleem is de export van de katernopbouw. Eventueel is tag 300$b een optie, omdat het datamodel van STCV geen illustratieveld bevat (dat ook naar b zou moeten). Maar dan moeten die gegevens voorafgegaan worden door Collation formula. (aangepast in nabehandeling)

Het subveld voor het bibliografisch formaat moet altijd naar tag 340 subveld m worden geconverteerd. Daarvoor is dus ook voor type collatie normal een tweede type, *normal2, nodig.

(ingevuld in profiel; instructies in issue).

15.15. ? Onderwerpscodes

Een globale tabel werd gebruikt, aangevuld met de specifieke types voor STCV.

UDC:

  • UDC zou naar tag 084 kunnen, maar dat lijkt me niet verstandig, omdat die classificatie weinig betekenis heeft voor de buitenwereld. Daarom nemen we de termen zelf op in tag 650, het authority record in $0 en in $0 te verwijzen naar de bron (via naverwerking).

AAT - officiële termen:

  • AAT termen die tot de officiële AAT thesaurus behoren; ze hebben alle lidmaatschap AAT
  • dienen omgezet naar 650/ /7/
  • vertaaltabel voor 650$2: AAT=aat

AAT - niet officiële termen:

  • AAT termen die niet tot de officiële AAT thesaurus behoren, omdat het nog om kandidaat termen gaat, of eigen Anet termen. Hebben geen lidmaatschap AAT. Ze mogen niet als echte AAT termen worden geëxporteerd, en dienen behandeld te worden als alle andere eigen Anet onderwerpstermen.
  • dienen omgezet naar 650/ /4/
  • geen verwoording van het type in subveld 2, dus ook geen vertaaltabel.
  • wordt opgelost via de exportgenerator, en daarin de extra executable zmosgmd. Die zet alle AAT-termen zonder lidmaatschap AAT om naar een (niet bestaand) authority type ZAAT. Dat type ZAAT wordt dan in het exportprofieel gedefinieerd, zoals eigen Anet onderwerpstermen.

Niet om te zetten: de a-lois van kunstwerken. De toegevoegde waarde als onderwerpsterm is miniem.

  • ART
  • MID
  • RUB

Niet om te zetten de types die data-elementen bevatten waarbij moeilijk de context kan geschetst worden.

  • AUC
  • COL
  • TT

Specifiek voor STCV:

  • SOW: dit is een gewone onderwerpsterm, dus naar tag 650
  • SPA: dit is eigenlijk geen onderwerpsterm (parateksten); onduidelijk waar die moet terechtkomen. Voorlopig omgezet naar annotatie in tag 500. Maar die zou dan eigenlijk moeten voorafgegaan worden door een aankondiging van de annotatie, bv. With (paratext).
  • SPT: dit is een publicatietype, dus naar tag 655
  • STY: dit is geen onderwerpsterm (typografisch kenmerk); onduidelijk waar die moet terechtkomen. Voorlopig omgezet naar annotatie in tag 500. Maar die zou dan eigenlijk moeten voorafgegaan worden door een uitleg over de annotatie, bv. Typographical characteristics:

15.16. Inhoud

Toegangscode:

  • moet naar $z.
  • toegangscode bij abstract en inhoudstafel kan niet worden omgezet, omdat beide types naar annotatie moeten. (komt niet voor bij STCV)

Types op te nemen:

  • full: alle url types
  • ill: te beschouwen als gerelateerd aan de publicatie; dus met als tweede indicator 2, en type te specificeren in subveld 3. Dat type dient vertaald te worden in de nabewerking.
  • link: te beschouwen als gerelateerd aan de publicatie; dus met als tweede indicator 2, en type te specificeren in subveld 3. Dat type dient vertaald te worden in de nabewerking.

Vertaaltabel:

  • voor de toegangscodes (856$z) bij full text, zodat de codes worden vertaald als “Free electronic access”.
  • voor het type inhoudscode, voor de types ill en link, die verwoord moeten worden in 856$3.

15.17. ?? Nabehandeling

15.17.1. ?? Vaste inhoud MARC velden

  • 003 : code voor oorsprong van het control number in tag 001 (niet duidelijk)
  • 040 $a : voor de code van de verantwoordelijke catalografische instelling (niet duidelijk)
  • 040 $b : taal van catalogiseren (Engels)

15.17.2. Schema voor te vertalen inhoud

Via schema stcvafter (Engels):

  • 246$i: Titeltypes (ok; voor types s en tc)
  • 026$2: vertaling van nummertype fingerprint (ok)
  • 041$a: vertaling van taalcodes die niet in MARC zijn gedefinieerd (ok)
  • 340$a: vertaling van drager codes (ok)
  • 787$i: vertaling van andere relatietypes (ok)
  • 856$z: vertaling van toegangscodes (ok)
  • 856$3: vertaling van het inhoudstype (ok)

15.17.3. ?? Voorvoegsels

  • Nodig voor alle velden waarin authority codes werden opgenomen, voor de bron (prefix in subtag $0) van die codes (onduidelijk voor STCV).
  • Nodig voor alle velden waarin verwijzingen naar catalografische records werden opgenomen, voor de bron (prefix in subtag $w) van die codes (onduidelijk voor STCV).
  • Nodig voor tag 300$b waarin de collatieformule moet geconverteerd worden, met aangepast voorvoegsel.