[Allegro] Unicode-Anwendung bei DNB
David Maus
maus at hab.de
Mo Jul 6 11:33:19 CEST 2015
On Mon, 06 Jul 2015 11:15:07 +0200,
Bernhard Eversberg wrote:
>
> Am 06.07.2015 10:59, schrieb David Maus:
> >>
> >> Dazu von mir die Frage: Gibt's ein Tool, das zwischen dieser und
> >> der "composed"-Anwendung von Unicode vermittelt?
> >>
> >
> > In den gängigen Skriptsprachen (PHP, Perl, Ruby) gibt es entsprechende
> > Funktionen.
> >
> Was wir bräuchten, ist entweder eine C++-Funktion oder ersatzweise ein
> eigenständiges Progrämmchen, die bzw. das einem einen Unicode-Text von
> der dekomponierten (a + Diaerese) in die kombinierte (ä) Codierung
> wandelt. Sonst müßten wir in die Umwandlung der MARCXML-Daten von
> DNB eine längere (und wohl doch unvollständige) Reihe von globalen
> Ersetzungen einbauen, was für diesen Fall doch sehr unelegant wäre.
> Ob sowas bei ICU oder sonstwo zu finden ist, konnte ich noch nicht
> eruieren.
Es gibt die C++-Klasse icu::Normalizer2
http://icu-project.org/apiref/icu4c/classicu_1_1Normalizer2.html
Zur prüfen wäre noch, ob die durch die Normalisierung hervorgerufenen
Unstimmigkeiten mit Positions- und Größenangaben im MARC-Leader eine
Auswirkung haben.
Mit besten Grüßen,
-- David Maus
> Ansonsten ist die Umwandlung der MARCXML-Daten kein großes Problem.
> Der DNB.flx könnte schon bald, auf dieser fußend, neu herauskommen und
> damit weniger anfällig sein für plötzliche DNB-seitige Änderungen.
>
> B.E.
>
>
> _______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sunny5.biblio.etc.tu-bs.de/mailman/listinfo/allegro
--
David Maus
Herzog August Bibliothek - D-38299 Wolfenbuettel
Bibliothekarische IT / Digital Humanities
Phone: +49-5331-808-317
Email: maus at hab.de
PGP Key 0x7B4F5A762AF6FBA6
Fingerprint DD38 8D2E 34C1 94DE 2058 69BE 7B4F 5A76 2AF6 FBA6
Mehr Informationen über die Mailingliste Allegro