[Allegro] Aufsplittung
Heinrich Allers
allers at t-online.de
Mo Nov 26 22:03:17 CET 2012
Hallo Herr Stephan:
> Aus folgender Datenstruktur ...
>
> TITELSATZ 1
> Verfasser: Groß, Erich
> Hauptsachtitel: Freiheit vorgestern
> Jahr: 2007
> ...
>
> TITELSATZ 4
> Verfasser: Groß, Erich
> Hauptsachtitel: Freiheit morgen
> Jahr: 2010
> ...
> ... soll also folgende Datenstruktur werden:
>
>
> PERSONENSATZ 1
> IDN: 1236
> Ansetzungsform: Groß, Erich
> ...
> _______
> TITELSATZ 1
> Verfasser: IDN 1236
> Hauptsachtitel: Freiheit vorgestern
> Jahr: 2007
> ...
>
> TITELSATZ 4
> Verfasser: IDN 1236
> Hauptsachtitel: Freiheit morgen
> Jahr: 2010
> ...
> Sicherlich hat manche/r in der Runde Erfahrung mit diesem Phänomen und kann mir sagen, wie
> man so etwas mit Allegro angehen kann.
Erfahrung habe ich noch nicht mit genau dieser Aufgabensituation gemacht, aber 'ne Verfahrensidee
hätte ich:
Schritt A:
Export aller in der Datenbank vorkommenden Personennamen in eine (flache) Datei per1.txt (nicht
umgeschlüsselt!).
Schritt B:
Alphabetische Sortierung von per1.txt nach per2.txt mit 'sort <per1.txt >per2.txt'.
Schritt C:
Rauswerfen aller Mehrfacheintragungen aus per2.txt und das Ergebnis in per3.txt schreiben.
Schritt D:
Datei per3.txt durchsehen, ob da doch noch Dubletten drinstecken, die durch abweichende oder
fehlerhafte Schreibweisen verursacht sind.
Schritt E:
Korrekturen an der Datenbank vornehmen, die sich aus der Überprüfung in Schritt E ergeben.
Schritt F:
In der Datei per3.txt den Personennamen mit 'IDN 0001' beginnend IDNs zuweisen und das Ergebnis in
per4.txt schreiben.
Schritt G:
In allen Datensätzen:
Abklappern aller Felder, die Personennamen enthalten, nachschauen in per4.txt, welche IDN die
betreffende Person verpaßt bekommen hat, und Rückspeichern dieser IDN in die betreffende Kategorie,
unter Verlust des Originaleintrages.- Nach Abklappern aller einschlägigen Felder innerhalb eines
Datensatzes: den Datensatz abspeichern.
###
Das wär's.
Die Schritte A, C, F und G sind mit eher einfachen FLEX-Skripten zu erledigen.
Schritt B bildet DOS-Angelegenheit (sollte aber als letzte Zeilen in die den Schritt A abarbeitende
FLEX-Datei aufgenommen werden).
Schritt D verlangt visuelle Arbeit, Schritt E manuelle (im besten Fall entfällt ja Schritt E).
###
Konkret:
Die Datei per1.txt sähe in Ihrem Fall so aus:
...
Groß, Erich
Müller, Christian
Schmidt, Hans
Kunze, Arnd
Groß, Erich
...
und Datei per2.txt so:
...
Groß, Erich
Groß, Erich
...
Kunze, Arnd
...
Müller, Christian
...
Schmidt, Hans
...
und die Datei per3.txt so:
...
Groß, Erich
...
Kunze, Arnd
...
Müller, Christian
...
Schmidt, Hans
...
und per4.txt schließlich z.B. so:
...
Groß, Erich||IDN 0123
...
Kunze, Arnd||IDN 0306
...
Müller, Christian||IDN 0489
...
Schmidt, Hans||IDN 0617
...
###
Bemerkung: Sollte die Zahl der unterschiedlichen Personennamen (=Zahl der Zeilen in per3.txt) zu groß
(mehr als dreistellig?) sein, wäre das skizzierte Verfahren womöglich (von der Rechenzeit her) zu
zeitaufwendig. Man müßte sich dann noch ein paar Gedanken mehr machen.
Mit besten Grüßen von
Heinrich Allers
allers at t-online.de * http://www.h-allers.de
Netztagebuch: http://heinrich-erlo-ger.blogspot.com/
Bitácora: http://heinrich-erlo-spa.blogspot.com/
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname : WPM$GYXO.PM$
Dateityp : application/octet-stream
Dateigröße : 2764 bytes
Beschreibung: Nachrichtentext
URL : <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20121126/de7a1ae0/attachment.obj>
Mehr Informationen über die Mailingliste Allegro