[Allegro] Unicode-Anwendung bei DNB

David Maus maus at hab.de
Mo Jul 6 11:33:19 CEST 2015


On Mon, 06 Jul 2015 11:15:07 +0200,
Bernhard Eversberg wrote:
> 
> Am 06.07.2015 10:59, schrieb David Maus:
> >> 
> >> Dazu von mir die Frage: Gibt's ein Tool, das zwischen dieser und
> >> der "composed"-Anwendung von Unicode vermittelt?
> >> 
> > 
> > In den gängigen Skriptsprachen (PHP, Perl, Ruby) gibt es entsprechende
> > Funktionen.
> > 
> Was wir bräuchten, ist entweder eine C++-Funktion oder ersatzweise ein
> eigenständiges Progrämmchen, die bzw. das einem einen Unicode-Text von
> der dekomponierten (a + Diaerese) in die kombinierte (ä) Codierung
> wandelt. Sonst müßten wir in die Umwandlung der MARCXML-Daten von
> DNB eine längere (und wohl doch unvollständige) Reihe von globalen
> Ersetzungen einbauen, was für diesen Fall doch sehr unelegant wäre.
> Ob sowas bei ICU oder sonstwo zu finden ist, konnte ich noch nicht
> eruieren.

Es gibt die C++-Klasse icu::Normalizer2

http://icu-project.org/apiref/icu4c/classicu_1_1Normalizer2.html

Zur prüfen wäre noch, ob die durch die Normalisierung hervorgerufenen
Unstimmigkeiten mit Positions- und Größenangaben im MARC-Leader eine
Auswirkung haben.

Mit besten Grüßen,
  -- David Maus

> Ansonsten ist die Umwandlung der MARCXML-Daten kein großes Problem.
> Der DNB.flx könnte schon bald, auf dieser fußend, neu herauskommen und
> damit weniger anfällig sein für plötzliche DNB-seitige Änderungen.
> 
> B.E.
> 
> 
> _______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sunny5.biblio.etc.tu-bs.de/mailman/listinfo/allegro

-- 
David Maus
Herzog August Bibliothek - D-38299 Wolfenbuettel
Bibliothekarische IT / Digital Humanities
Phone: +49-5331-808-317
Email: maus at hab.de

PGP Key 0x7B4F5A762AF6FBA6
Fingerprint DD38 8D2E 34C1 94DE 2058  69BE 7B4F 5A76 2AF6 FBA6




Mehr Informationen über die Mailingliste Allegro