[Allegro] marc: darstellung von Sonderzeichen bzw Steuerzeichen

Klaus Lehmann lehmann_klaus at t-online.de
So Aug 15 21:58:54 CEST 2021


Guten Tag allerseits,

es könnte vielleicht alle interessieren, die mit der "Konvertierung" von Steuerzeichen bzw Sonderzeichen zu tun haben.... nach marc.
nehmen wir mal das in dos(und win)-allegro doch öfters verwendete decimal alt-020 (hex 14 oder auch als "DC4" bekannt

mir will es nicht gelingen, es als hexwert in den mrk, mrc oder xml-code reinzubringen. (wobei xml jetzt wirklich uninteressant ist [xml ist einfach nur inflationärer datenmüll].
was habe ich probiert?


rem 2. test es wird daraus: "" 

rem 3. test es wird daraus  "\x0d\x0a"

rem 4. test <br> ? (noch nicht getestet!)

rem 5. test als utf8  C2 B6 für DAS zeichen

rem 6. test als utf8  000E für DAS zeichen

rem 7. versuch 000D und danach 000A

hat nix positives gebracht. naja, wenn ich mir so chemische oder pharmazeutische (vufind)-kataloge anschaue, habe ich nix gelungenes entdeckt. es war alle "nur" fliesstext.
aber so ein alt-020 reinzubekommen, wären schon optisch schön, oder? (also eine art carriage return)...


abschliessend zu den überlegungen: vielleicht is es gar nicht der sinn von marc, stuerzeichen in marcfeldern zu zu lassen. ich hatte schon erfolgreich \x0d\x0a unterbekommen, aber eben dadurch auch die konversion von mrk nach mrc völlig zerschossen, da wirkte \x0d\x0a wirkliuch in seiner funktion durch, und baute in mrk carriage returns rein, wo sie nicht hingehörten....


hat jemand eine meinung?
danke. viele grüße, ihr klaus lehmann


ps: bei LOC findet man das:
https://www.loc.gov/marc/specifications/speccharconversion.html
mittendrin im text steht das:

The structure of the NCR is &#xXXXX; where:
    & and ; (the ampersand and semicolon) surround the Reference data
    #x designates that the value expressed is in hexadecimal notation
    XXXX is the hexadecimal representation of the code point for the Unicode character expressed in hex digits 0123456789ABCDEF. Some characters, primarily infrequently encountered CJK ideographs, may require more than four hexadecimal digits. The NCR can contain more than four digits if they are needed.





-- 
Mit freundlichen Grüßen,
Ihr Klaus Lehmann
http://allegronet.de * eMail: allegronet at t-online.de * phone: 03528-452 807(fax 809) * mobil: 0171-953 7843
allegronet.de * Klaus Lehmann * D-01454 Radeberg * Bahnhofstr. 1
zuständiges Finanzamt: FA Hoyerswerda; zuständige Kammer: IHK Dresden;
zuständige Aufsichtsbehörde: Gewerbeamt Radeberg; USt-IdNr: DE247550760
* Software für zufriedene Bibliothekare: 1000x bewaehrt und ergiebig
* Bereits 4x allegro-utf8. Buchen Sie die allegro-Roadshow. Yes we can!
* Internetkataloge & WebHosting für Allegro-C & Web 2.0 mit VuFind
* 2011-18: Sponsor: Peter-Sodann-Bibliothek+IFLA:allegro-utf8
* 2013-14: Bolero 64bit.+allegro-zdb: endlich. + eBooks
* 2015-16: allegro-vufind.+ allegro-imd.Die weltgrößte(?) Filmdatenbank
* 2017-18: Exporte. Marc und Co. Marc ist sehr different
* 2019: All for VuFind! The perfect export into marc21
* 2019: Neu: vufindnet.de. Ein großer Discovery-Katalog
* 2020: Neu: kohanet.de. Alternativen zu allegro-C und allegronet.de
* 2017-21: Exporte mit Marc. Es höret nimmer auf...



Mehr Informationen über die Mailingliste Allegro