AW: AW: [Allegro] Das Neutralmodell - Eine Projektidee

Thomas Fischer fischer at mail.sub.uni-goettingen.de
Di Nov 22 13:03:12 CET 2005


Hallo Herr Eversberg,

> 
> Thomas Fischer schrieb:
> > 
> 
> > 
> http://www.cenorm.be/cenorm/businessdomains/businessdomains/isss/activity/wsmmi.asp)
> > Das prinzipiell maschinenlesbare Format des letzten Papiers würde sich eigentlich gut
> > dafür eignen, als Vorlage für eine Konfiguration genommen zu werden: Die Datei wird
> > eingelesen, analysiert und die vorgegebenen Felder zu Datenfeldern gemacht,
> > vielleicht mit einigen Standards, damit für die elementaren DC-Felder immer die
> > gleichen Kategorienummern verwandt werden.
> > Man bekommt da eine Menge Dokumente angeboten. Welches ist denn
> > dasjenige, was Sie hier meinen?

Ich schrieb:
> Eine Arbeitsgruppe am CEN 
> (Europäisches Komitee für Normung) hat dazu hin zwei Papiere entwickelt:
> CWA14855 - Dublin Core Application Profile guidelines
> (ftp://cenftp1.cenorm.be/PUBLIC/CWAs/e-Europe/MMI-DC/cwa14855-00-2003-Nov.pdf)
> und
> CWA15248 - Guidelines for machine-processable representation of Dublin Core Application Profiles
> (ftp://ftp.cenorm.be/PUBLIC/CWAs/e-Europe/MMI-DC/cwa15248-00-2005-Apr.pdf)
> (für den Kontext siehe:
> http://www.cenorm.be/cenorm/businessdomains/businessdomains/isss/activity/wsmmi.asp)

Der erste Link ist das erste, der zweite das zweite Papier und der dritte eine Beschreibung der Arbeitsgruppe.
Mit letzte war das zweite Papier gemeint.

> fände aber sowohl eine UTF-8- wie auch eine UTF-16-Unterstützung wünschenswert.
> Die Windows-RTF-Maschine, die für die Anzeige benutzt wird, ist doch grundsätzlich
 > in der Lage, Unicode darzustellen, und verwendet dazu UTF-16, wenn ich
 > das rechte sehe.
> 
> Schon, aber das Indexsystem ist das Problem. Das kann nicht mit UTF16
> arbeiten, und auch UTF-8 ist da schon ein Problem. Ich fürchte, da
> können wir nicht so bald entscheidende Durchbrüche erreichen.

Sind das Schwierigkeiten in der Darstellung (RTF wird ja nur im Anzeigefeld benutzt) oder im Inneren des Index? Ich hätte gedacht, dass man notfalls mit einer Verdoppelung von allem durchkäme - und in sofern UTF-16 einfacher als UTF-8 wäre, wenn man sich tatsächlich zunächst auf zwei Bytes beschränkt.

Mit freundlichen Grüßen
Thomas Fischer 




Mehr Informationen über die Mailingliste Allegro