[Allegro] Datenimport
Bernhard Eversberg
ev at biblio.tu-bs.de
Di Apr 1 11:04:11 CEST 2008
Thomas Fischer schrieb:
>
> 1. Meine Fremddaten haben von sich aus keine Nummern und sollen beim Import
> nummeriert werden.
> Bei mir wird unter diesen Bedingungen die Leerzeile zwischen den
> Zeichensätzen nicht als Satztrennung erkannt und alle Datensätze landen in
> einem Satz.
> (Steht das irgendwo? Oder kann das ein meiner speziellen Einstellung
> liegen?)
Leider nicht. Entscheiden tut nicht die Leerzeile, sondern das Vorkommen
eines der Felder #u1, #u2 #00, genauer: eines der ersten drei in der CFG
aufgelisteten Felder. Das müssen wir endlich irgendwo hinschreiben.
>
> Ich kann vor jeden Satz aber
> #u1 #####
> schreiben, damit werden verschiedene Sätze getrennt.
> (Das steht im Handbuch etwas verborgen in 9.6. Ist der Import nicht
> nummerierter Daten so selten?)
Vermutlich ja.
> Ob hinter dieser Zeichenkette noch eine Nummer stehen muss, habe ich nicht
> gefunden, auch nicht, ob es genau 5 # sein müssen (schon gar nicht warum).
>
Fünf müssen es sein, um zufällige Vorkommnisse von z.B. ### nicht als
Satzanfang mißzudeuten. Ab V28.2 (s. Vb.204) kann man z.B.
#u1 ####?17
schreiben (nur 4 #) und damit bewirken, daß der Satz in die Datei 17
kommt. (Berger-Desiderat)
> 2. Manche meiner Kategorien sind doppelt besetzt, die können dadurch auf
> Folgekategorien verteilt werden, dass man statt des Leerzeichens hinter der
> Kategorienummer eine Tilde eingibt. Das steht indirekt auch in 9.6.
>
Gut, wird direkter formuliert werden müssen.
> 3. In update.rtf steht: "Wenn die Daten im Windows-Code sind (ANSI), dann
> vor dem update noch den Befehl set c1 einsetzen (ab V25.5)". Da sollte
> klarer stehen, welche Umkodierung wie erreicht werden kann. Bei mir sind die
> Ausgangsdaten und die Datenbank in UTF-8, ich brauche also nicht
> umzukodieren, aber klar wird das aus der Stelle nicht. Wer seine Daten
> intern in ANSI hat, wird durch den Satz in die Irre geführt. Und wer
> tatsächlich umkodieren muss, muss in die in update.rtf gegebenen Beispiele
> set c1\
> setzen, vergisst aber vielleicht das "\".
OK, das wird nochmal überprüft und verbessert.
>
> 4. Es sollte irgendwo stehen, wann die automatische Nummerierung
> stattfindet, nämlich nach dem Probeimport erst beim Speichern. Das erscheint
> plausibel, erfordert aber, dass man bereit ist, offenbar falsche Datensätze
> (ohne Nummer!) zu speichern. Das das recht viele sein können (in meinem Fall
> zehntausende) ist das schon eine Hürde...
>
Aber was könnten wir tun?
> 5. Die verschiedenen Möglichkeiten zum Import von Fremddaten (insbesondere
> über Extern.dat und update) scheinen sich in der Behandlung von
> Folgekategorien (Mehrfachbelegung) und Nummerierung zu unterscheiden, das
> sollte irgendwo beschrieben sein. Ist das der Unterschied zwischen "index"
> und "update"?
INDEX kann keine Nummern vergeben, mit dem ~ kann es aber umgehen.
> Mir ist übrigens nicht klar, wie ich eine "Offline list" wieder los werde.
> (Ich weiß auch nicht genau, was das ist, die über 2000 Datensätze darin sind
> gespeichert.)
>
Hilfe dazu: h off
Loswerden: x erase off
MfG B.E.
Mehr Informationen über die Mailingliste Allegro