[Allegro] Datenimport

Thomas Fischer fischer at sub.uni-goettingen.de
Do Mär 27 18:26:55 CET 2008


Liebe KollegInnen,

bei dem Versuch, die Informationen für einen Datenimport zusammenzutragen,
vermisste ich einige Informationen oder fand sie verwirrend.
Im wesentlichen sollte das Verfahren durch
h fremd
und
h update
erklärt werden, das fand ich aber nicht ausreichend.
Vielleicht habe ich etwas übersehen, ansonsten möchte ich eine Überarbeitung
der entsprechenden Informationen vorschlagen.

1. Meine Fremddaten haben von sich aus keine Nummern und sollen beim Import
nummeriert werden.
Bei mir wird unter diesen Bedingungen die Leerzeile zwischen den
Zeichensätzen nicht als Satztrennung erkannt und alle Datensätze landen in
einem Satz.
(Steht das irgendwo? Oder kann das ein meiner speziellen Einstellung
liegen?)

Ich kann vor jeden Satz aber
#u1 #####
schreiben, damit werden verschiedene Sätze getrennt.
(Das steht im Handbuch etwas verborgen in 9.6. Ist der Import nicht
nummerierter Daten so selten?)
Ob hinter dieser Zeichenkette noch eine Nummer stehen muss, habe ich nicht
gefunden, auch nicht, ob es genau 5 # sein müssen (schon gar nicht warum).

2. Manche meiner Kategorien sind doppelt besetzt, die können dadurch auf
Folgekategorien verteilt werden, dass man statt des Leerzeichens hinter der
Kategorienummer eine Tilde eingibt. Das steht indirekt auch in 9.6.

3. In update.rtf steht: "Wenn die Daten im Windows-Code sind (ANSI), dann
vor dem  update  noch den Befehl  set c1  einsetzen (ab V25.5)". Da sollte
klarer stehen, welche Umkodierung wie erreicht werden kann. Bei mir sind die
Ausgangsdaten und die Datenbank in UTF-8, ich brauche also nicht
umzukodieren, aber klar wird das aus der Stelle nicht. Wer  seine Daten
intern in ANSI hat, wird durch den Satz in die Irre geführt. Und wer
tatsächlich umkodieren muss, muss in die in update.rtf gegebenen Beispiele
set c1\
setzen, vergisst aber vielleicht das "\".

4. Es sollte irgendwo stehen, wann die automatische Nummerierung
stattfindet, nämlich nach dem Probeimport erst beim Speichern. Das erscheint
plausibel, erfordert aber, dass man bereit ist, offenbar falsche Datensätze
(ohne Nummer!) zu speichern. Das das recht viele sein können (in meinem Fall
zehntausende) ist das schon eine Hürde...

5. Die verschiedenen Möglichkeiten zum Import von Fremddaten (insbesondere
über Extern.dat und update) scheinen sich in der Behandlung von
Folgekategorien (Mehrfachbelegung) und Nummerierung zu unterscheiden, das
sollte irgendwo beschrieben sein. Ist das der Unterschied zwischen "index"
und "update"?
Mir ist übrigens nicht klar, wie ich eine "Offline list" wieder los werde.
(Ich weiß auch nicht genau, was das ist, die über 2000 Datensätze darin sind
gespeichert.)

Mit freundlichen Grüßen
Thomas Fischer 




Mehr Informationen über die Mailingliste Allegro