[Allegro] Aufsplittung

Armin Stephan armin.stephan at augustana.de
Fr Dez 14 09:29:58 CET 2012


Lieber Herr Allers,

bis Schritt F hätte ich kein Problem, mir vorzustellen, wie ich das mache.

Aber wie könnte Schritt G bewerkstelligt werden?


Am 26.11.2012 22:03, schrieb Heinrich Allers:
> Hallo Herr Stephan:
>
>> Aus folgender Datenstruktur ...
>>
>> TITELSATZ 1
>> Verfasser: Groß, Erich
>> Hauptsachtitel: Freiheit vorgestern
>> Jahr: 2007
>> ...
>>
>> TITELSATZ 4
>> Verfasser: Groß, Erich
>> Hauptsachtitel: Freiheit morgen
>> Jahr: 2010
>> ...
>
>> ... soll also folgende Datenstruktur werden:
>>
>>
>> PERSONENSATZ 1
>> IDN: 1236
>> Ansetzungsform: Groß, Erich
>> ...
>> _______
>
>> TITELSATZ 1
>> Verfasser: IDN 1236
>> Hauptsachtitel: Freiheit vorgestern
>> Jahr: 2007
>> ...
>>
>> TITELSATZ 4
>> Verfasser: IDN 1236
>> Hauptsachtitel: Freiheit morgen
>> Jahr: 2010
>> ...
>
>> Sicherlich hat manche/r in der Runde Erfahrung mit diesem Phänomen und kann mir sagen, wie
>> man so etwas mit Allegro angehen kann.
>
> Erfahrung habe ich noch nicht mit genau dieser Aufgabensituation gemacht, aber 'ne Verfahrensidee
> hätte ich:
>
> Schritt A:
> Export aller in der Datenbank vorkommenden Personennamen in eine (flache) Datei per1.txt (nicht
> umgeschlüsselt!).
>
> Schritt B:
> Alphabetische Sortierung von per1.txt nach per2.txt mit 'sort <per1.txt >per2.txt'.
>
> Schritt C:
> Rauswerfen aller Mehrfacheintragungen aus per2.txt und das Ergebnis in per3.txt schreiben.
>
> Schritt D:
> Datei per3.txt durchsehen, ob da doch noch Dubletten drinstecken, die durch abweichende oder
> fehlerhafte Schreibweisen verursacht sind.
>
> Schritt E:
> Korrekturen an der Datenbank vornehmen, die sich aus der Überprüfung in Schritt E ergeben.
>
> Schritt F:
> In der Datei per3.txt den Personennamen mit 'IDN 0001' beginnend IDNs zuweisen und das Ergebnis in
> per4.txt schreiben.
>
> Schritt G:
> In allen Datensätzen:
> Abklappern aller Felder, die Personennamen enthalten, nachschauen in per4.txt, welche IDN die
> betreffende Person verpaßt bekommen hat, und Rückspeichern dieser IDN in die betreffende Kategorie,
> unter Verlust des Originaleintrages.- Nach Abklappern aller einschlägigen Felder innerhalb eines
> Datensatzes: den Datensatz abspeichern.
>
> ###
>
> Das wär's.
>
> Die Schritte A, C, F und G sind mit eher einfachen FLEX-Skripten zu erledigen.
>
> Schritt B bildet DOS-Angelegenheit (sollte aber als letzte Zeilen in die den Schritt A abarbeitende
> FLEX-Datei aufgenommen werden).
>
> Schritt D verlangt visuelle Arbeit, Schritt E manuelle (im besten Fall entfällt ja Schritt E).
>
> ###
>
> Konkret:
>
> Die Datei per1.txt sähe in Ihrem Fall so aus:
>
> ...
> Groß, Erich
> Müller, Christian
> Schmidt, Hans
> Kunze, Arnd
> Groß, Erich
> ...
>
> und Datei per2.txt so:
>
> ...
> Groß, Erich
> Groß, Erich
> ...
> Kunze, Arnd
> ...
> Müller, Christian
> ...
> Schmidt, Hans
> ...
>
> und die Datei per3.txt so:
>
> ...
> Groß, Erich
> ...
> Kunze, Arnd
> ...
> Müller, Christian
> ...
> Schmidt, Hans
> ...
>
> und per4.txt schließlich z.B. so:
>
> ...
> Groß, Erich||IDN 0123
> ...
> Kunze, Arnd||IDN 0306
> ...
> Müller, Christian||IDN 0489
> ...
> Schmidt, Hans||IDN 0617
> ...
>
> ###
>
> Bemerkung: Sollte die Zahl der unterschiedlichen Personennamen (=Zahl der Zeilen in per3.txt) zu groß
> (mehr als dreistellig?) sein, wäre das skizzierte Verfahren womöglich (von der Rechenzeit her) zu
> zeitaufwendig. Man müßte sich dann noch ein paar Gedanken mehr machen.
>
>
> Mit besten Grüßen von
>
> Heinrich Allers
>
> allers at t-online.de * http://www.h-allers.de
> Netztagebuch: http://heinrich-erlo-ger.blogspot.com/
> Bitácora: http://heinrich-erlo-spa.blogspot.com/
>
>
>
> _______________________________________________
> Allegro mailing list
> Allegro at biblio.tu-bs.de
> http://sun250.biblio.etc.tu-bs.de/mailman/listinfo/allegro

-- 

Mit freundlichen Gruessen
Armin Stephan
Jefe de Biblioteca
Augustana-Hochschule / Bibliothek
D-91564 Neuendettelsau
Tel. 09874/509-300
  |
  |      ,__o
  |    _-\_<,
  |   (*)/'(*)

-------------- nächster Teil --------------
Ein Dateianhang mit HTML-Daten wurde abgetrennt...
URL: <http://bibservices.biblio.etc.tu-bs.de/pipermail/allegro/attachments/20121214/b9e992fc/attachment.html>


Mehr Informationen über die Mailingliste Allegro