AW: [Allegro] Das Neutralmodell - Eine Projektidee
Thomas Fischer
fischer at mail.sub.uni-goettingen.de
Mo Nov 21 15:29:22 CET 2005
Lieber Herr Eversberg,
da ich hier an der SUB ständig irgendwelche Datenbanken baue, die die Komplexität des A-Schemas nicht benötigen, auch gerne anderen KollegInnen diese Arbeit übertragen würde, ohne mehrmonatige Allegro-Einführungskurse zu halten, kann ich diese Überlegungen nur aus ganzem Herzen begrüßen!
Ich habe noch einige Anmerkungen dazu, die ich an Ihre Überlegungen anschließe.
> Das Neutralmodell muß man sich folgendermaßen vorstellen:
>
> 1. Die Konfiguration N.CFG definiert eine Reihe von Datenfeldtypen,
> die regelmäßig in Datensystemen auftreten: Titel, Personennamen,
> Datumsfelder, Schlagwort- und Klassifikationsfelder, Nummern,
> Anmerkungen, Codes usw.
> Als Grundlage eignen sich die DCMI Metadata Terms, denn die Dublin
> Core-Initiative hat damit einen Grundbestand von Datenelementen
> definiert, an dem sich viele Metadaten-Produzenten orientieren.
> Zahllose Expertisen und Erfahrungen sind hier eingeflossen.
> Siehe: http://dublincore.org/documents/dcmi-terms
> [Anm.: DC ist kein Kategorienschema! Sondern nur eine Liste
> von Datenelement-Definitionen.]
Während ich den DC Metadatensatz für einen guten Ansatzpunkt halte, zeigt sich in der Praxis immer wieder, dass es bei den meisten Projekten einen zusätzlichen Bedarf an Datenfeldern gibt. Die DC-Initiative hat daraufhin das Konzept des "Anwendungsprofils" entwickelt. Eine Arbeitsgruppe am CEN (Europäisches Komitee für Normung) hat dazu hin zwei Papiere entwickelt:
CWA14855 - Dublin Core Application Profile guidelines
(ftp://cenftp1.cenorm.be/PUBLIC/CWAs/e-Europe/MMI-DC/cwa14855-00-2003-Nov.pdf)
und
CWA15248 - Guidelines for machine-processable representation of Dublin Core Application Profiles
(ftp://ftp.cenorm.be/PUBLIC/CWAs/e-Europe/MMI-DC/cwa15248-00-2005-Apr.pdf)
(für den Kontext siehe:
http://www.cenorm.be/cenorm/businessdomains/businessdomains/isss/activity/wsmmi.asp)
Das prinzipiell maschinenlesbare Format des letzten Papiers würde sich eigentlich gut dafür eignen, als Vorlage für eine Konfiguration genommen zu werden: Die Datei wird eingelesen, analysiert und die vorgegebenen Felder zu Datenfeldern gemacht, vielleicht mit einigen Standards, damit für die elementaren DC-Felder immer die gleichen Kategorienummern verwandt werden.
Wenn Sie das für machbar und nützlich halten, werde ich Sie gerne dabei unterstützen.
Nebenbei bemerkt benutzen wir ja schon seit längerem eine Konfiguration, die auf DC aufbaut, die Erfahrungen damit kann ich natürlich auch gerne beitragen.
> Als Zeichensatz sollte man wahlweise OstWest oder Windows-ANSI
> einsetzen können. [Vielleicht von vornherein nur letzteres? Unicode
> wäre unpraktisch: es würde das Katalogisieren nur mit der
> Web-Oberfläche gestatten!]
Ich finde, für Unicode müsste auch eine Lösung gefunden werden. Ich habe noch nicht verstanden, wie die Spezialisten mit chinesischen Zeichensätzen umgehen, fände aber sowohl eine UTF-8- wie auch eine UTF-16-Unterstützung wünschenswert. Die Windows-RTF-Maschine, die für die Anzeige benutzt wird, ist doch grundsätzlich in der Lage, Unicode darzustellen, und verwendet dazu UTF-16, wenn ich das rechte sehe.
Mit freundlichen Grüßen
Thomas Fischer
Mehr Informationen über die Mailingliste Allegro