next up previous
Next: Vorlesungsnotiz Up: Dossier zur Datenarbeit Previous: Erweiterung

Verwirrung

Hallo Werner

Ich habe mir gerade die Publikationsdaten angesehen und befürchte eine mittlere Katastrophe. Es hilft uns gar nichts, die Sache vom FileMaker in ein Format zu konvertieren, mit dem man vernünftig arbeiten kann. Das Problem ist die Strukturvorlage selbst, nämlich eine einzige Tabelle. Die können wir zwar in Access oder eine Textdatei übertragen, aber dadurch kriegt sie keine praktikable Form. Aus der Tabelle lassen sich die Daten nicht sauber extrahieren. Besonders arg ist das Feld ,,veröffentlicht in:''. Da stehen alle im Einzelfall benötigten Angaben in einer Reihe, egal ob es sich um eine Zeitschrift, einen Sammelband oder ein Lexikon handelt. Und für jede Zeitschrift gibt es mehrere alternative Schreibweisen. Ganz zu schweigen von den zahlreichen unsichtbaren Leerzeichen, die sich während der Konvertierung eingeschlichen haben und allgemeine Suchabläufe unmöglich machen. Ich fürchte, wir müssen mit einem eigenen Datenmodell beinahe bei Null anfangen. Dazu kann ich ein kleines Programm schreiben, das die vorliegenden 4000 Einträge so gut es geht an ein solches Modell annähert. Aber das wird es uns nicht ersparen, hinterher alles händisch zu kontrollieren und korrigieren.

Was das Datenmodell betrifft, müssen wir auch eine Entscheidung treffen. Es gibt natürlich eine Reihe kommerzieller Literaturdatenbanken, auch mit Webanbindung. Aber die fixieren einen auf Windows, ganz abgesehen davon, daß man ihren Macken ausgeliefert ist, ohne etwas an ihnen ändern zu können. Im ,,open source''-Bereich gibt es BibTex. Das funktioniert zwar ausgezeichnet, bietet aber kein explizites Datenmodell und keine Strukturkontrolle. Ich schlage darum vor, daß ich ausgehend von unserem Material ein allgemeines Schema entwerfe und auf einer unserer Linux-Maschinen implementiere. Wenn wir das relationale Datenbank-Management-System Adabas verwenden, können wir die Daten auch über eine MS-Access-Schnittstelle unter Windows abfragen. Das wäre günstig für die studentischen Hilfskräfte, die uns das Institut zur Portierung versprochen hat. Die UNIX-Welt ist für Normalbenutzer zur Datenpflege ja leider unzumutbar. Wir müssen es so einrichten, daß alle Institutsangehörigen die Datenbank problemlos bedienen können. Am Besten wäre natürlich, daß sie das gleich über das Web tun. Eine Schwierigkeit dabei ist allerdings die Authentifizierung, da jeder nur den Schreibzugriff auf seine eigenen Einträge haben darf. Solange ich noch an meinem Java-Klienten herumbastle, müssen die Kolleginnen und Kollegen ihre Änderungen sozusagen in einen Zwischenspeicher schicken und ich übertrage sie dann in die Adabas-Datenbank.

Das wird doch komplizierter als gedacht. Ich betrachte es als ein ,,work in progress''. Bekanntlich bleiben über 75 Prozent der Software-Projekte stecken. Ich hoffe, wir entkommen diesem Schicksal.

Bye, Mario


next up previous
Next: Vorlesungsnotiz Up: Dossier zur Datenarbeit Previous: Erweiterung
h.h.
2000-11-02