Re: [Allegro] ruckzuck/avanti und entitäten

Klaus Lehmann lehmann_klaus at t-online.de
Do Okt 13 22:26:36 CEST 2005


On Thu, 13 Oct 2005 20:14:21 +0200, Thomas Berger wrote:

guten abend herr berger

kl>> vorweg: mich interessiert nicht, wie sie in die ald-datei reinkommen.
kl>nun, aber wie sie drinstehen, ist die entscheidende Frage.

;-)
ja, aber....
gibt es denn so viele arten, wie sie drin stehen? 
unwissend gefragt...


Α ist für mich ganz klar.
wenn ich html-code schreibe, meistens nehme ich gar keinen html-edi, sondern eben einen ascii-editor, man 
weiss ja inzwischen, wie umlaute einzugeben sind. ü usw usw.
also sage ich mir: genauso werden utf8-zeichen eingegeben.
[ich dagegen gehe unbedarft ran, wie sie merken...]




kl>> nehmen wir das greek'sche alpha, 
kl>> als enti definiert ist es: &h913
kl>> und das beta ist &h914

kl>Α fuer das Unicode-Zeichen 913. Also muessen Sie es genau
kl>so (oder aequivalent) in das html-Dokument praktizieren, das Sie
kl>dynamisch erzeugen.

moment. erzeuge ich denn ein html-dokument? (dynamisch?)
mittels php eine abfrage, die vom avanti übernommen wird. wird da html als antwort erzeugt?
wenn ich mir die source im brauser anschaue, ja dann sehe ich css-zeuchs und die antwort. ist das html?
s.u.


kl>
kl>
kl>> aber: steht es so in der ald-datei drin, geschieht nicht viel spannendes. 
kl>> über avanti/php ist die darstellung so: "&h913;"
kl>
kl>View Source zeigt dann wohl, dass "&913;" im Dokument drinsteht.
s.o. 
hm, bei einem verfasser, wo das Ö nicht aufgelöst wurde, sehe ich:
<tr><td valign=top><i>Verfasser:  </i></td><td>Bats, J.W.; Öhlinger, S.H 
                                                           ~~~~~~~~
müsste da nicht &???; stehen?

jedenfalls macht er (wer???) aus dem "&#" sowas:
&#913;
also, findet hier die ersetzung statt, die in einer apr definiert ist:


<tr><td valign=top><i>Titel:   </i></td><td><b>Acta&#913;Crystallographica&#914Section C: Crystal 
Structure Communications</b></td></tr> 



in der d-khtm.apr steht drin:
  *********** Grundparameter, nicht ohne Grund aendern: ***************^M
td-htm      HTM-Steuerbefehle^M
         xxx Aktivieren, wenn intern ASCII, extern UTF-8^M
p & "&"^M
p < "<"^M
^M
td-utf8     ASCII->ANSI Codetabelle^M                                    

also müsste man die beiden zeilen oben deaktivieren.
und siehe das es klappt!
jetzt werden die griechischen alpha's und beta's gut dargestellt.
nebenbei: α und β sind die korreklten beiden. ein kleines alpha und ein kleines beta.
die beiden ursprünglichen werte waren griech-großbuchstaben.



kl>Ist ja auch logisch. Woher soll bei "Gebr. Müller&Co;" klar sein,
kl>welches "&" auf welcher Ebene was bedeutet... Da fehlt zunaechst noch
kl>eine Verabredung bzw. Extra-Magie in den Parametern.
                      ~~~~~~~~~~~~~~~~~~~~~~~~~~~ ok. magie gefunden.
in der betreffenden apr's ist die umwandlung von & abzustellen.




kl>
kl>
kl>> die oben erwähnte doku sagt:
kl>> (verfahren 2)
kl>> datenbank exportieren mit i-1u.apr (+d-utf8.apt), wieder einspielen. usw usw (steht im text), das ist 
alles 
kl>> gemacht worden. 
kl>
kl>Die UTF-8-Darstellung des Zeichens 913 ist auch eine legale
kl>Alternative.
kl>
kl>> was aber ist davon Fà R die darstellung(!) von entitäten nötig gewesen?
kl>> habe ich was übersehen?
kl>
kl>Sie sagen nicht, was Ihre Daten sind, Sie sagen nicht, was
kl>rauskommt, nur dass "es" nicht klappt.

verzeihung, war mir nicht wichtig ;-)
ein allegrodatenbank, in der die utf8-zeichen als o.g. entitäten enthalten sind.



kl>
kl>Also, wenn Ihre Datenbank intern UTF-8 hat, sollten Sie auch UTF-8
kl>rausschieben und nicht in Entitaeten umwandeln. Wenn Sie intern
kl>Entitaeten erfasst haben, muessen Sie sich Gedanken darueber machen,


kl>das Kaufmans-Und besonders zu schuetzen oder zu codieren (siehe
kl>auch Verlautbarung 164, Abschnitt 5.: "NEU: Die  VS-Methodik : Sequenzen
kl>ohne Grenzen". Ich kenne zwar niemanden, der es je gebraucht hat, es ist
kl>aber eine maechtige Option).
ja, das habe ich gelesen. denke aber, es dürfte kein so großes problem sein.
die menge der echten entitäten ist genau definiert. mal schauen, was ein nacktes kaufmannsund dazu sagen 
wird.


denke, ich habe endlich den anfangs"haken" gefunden, an dem man sich aufhängen kann, sprich weitermachen 
kann. danke!


viele grüße
ihr klaus lehmann

ps: habe ich was übersehen?
wenn es andere auch interessiert, werde ich gerne über fortschritte berichten.






Mehr Informationen über die Mailingliste Allegro