Ordnen und Erschliessen


Barry Smith, Dirk Siebert und Werner Ceusters: Was die philosophische Ontologie zur biomedizinischen Informatik beitragen kann

Nachrichten für Dokumentation (NfD). Zeitschrift für Informationswissenschaft und -praxis, 55 (2004), Nr. 3 (April/Mai), S. 143 - 146

Rezensent Peter Toebak

Die Autoren (u.a. der Universität Leipzig) weisen darauf hin, dass Informatiker (Wirtschaftsinformatiker, Betriebswirtschaftler und Organisationsfachleute) zwar von der Notwendigkeit terminologischer und klassifikatorischer Kontrollinstrumente (mittlerweile) überzeugt sind, um strukturierte und unstrukturierte Daten auszuwerten und zu kombinieren. Sie erfinden aber oft  das Rad erneut, machen die gleichen Anfangsfehler wie Informationsspezialisten vorher bereits gemacht haben und bleiben bei den Anforderungen und Möglichkeiten der vorhandenen Software-Systeme stecken. Es wäre besser, umgekehrt vorzugehen und grundsätzlich von der Informationstheorie auszugehen.

Hoffentlich werden die Autoren mit einer fachgerechten Lösung für die Biomedizin kommen, obwohl davon in diesem Artikel noch nichts Konkretes erscheint. Das Problem ist natürlich nicht neu: Einfachheit, Umfassendheit, Flexibilität, Erweiterbarkeit,  Perspektivenwechsel, Granularität, usw. müssen alle abgedeckt werden. Die Dezimal Klassifikation und z.B. auch der Dublin Core Metadata Set haben sich damit z.B. bereits ausführlich befasst. Es wird vor allem anspruchsvoll, wenn entscheidungsrelevante Daten aus unstrukturierten Datenbeständen unterschiedlicher Herkunft herausgefiltert werden müssen. Die Bemerkung, dass "der grösste Teil der Patientendaten (...) unstrukturiert (bleibt), da viele Ärzte auf frei formulierten Notizen beharren, um die Feinheiten der einzelnen Fälle ausdrücken zu können" (144) zeigt die Problematik.

Es ist zu erwarten, dass die Herausfilterung oder Extrahierung strukturierter Daten aus unstrukturierten oder Freitext-Dokumenten vermehrt im Nachhinein und auch automatisch möglich sein wird, falls das unterliegende Regelwerk (Klassifikationssystem, strukturierte Terminologie oder Top-Level-Ontologie, die den unterschiedlichen Domain Ontologien zur Integration genügt) in Ordnung ist. Die Autoren sprechen von einem "Trugschluss", dass "die Strukturierung in der Regel bei der Datenerfassung erzwungen" werden muss, "zum Beispiel durch restriktive Dateneingabemasken, strukturierte Menüs, Auswahllisten und Vorschriften über zu verwendende Codes" (144).

Die Autoren möchten ihre Ideen "vom Ansatz her auch für eine Vielzahl anderer Anwendungsgebiete, die auf robuste Terminologien sowie die effiziente und zuverlässige Verarbeitung natürlicher Sprache angewiesen sind" (145-146), relevant erklären. Heute, da vermehrt Task Ontologien entwickelt werden und neben Informationen auch Beziehungen wie Rollen und Prozesse thematisiert werden, wird tatsächlich der Gedanke interessant, dass mit solchen Methoden nicht nur der Informationswert (Inhaltswissen), sondern allmählich auch Aspekte des Evidenz- oder Kontextwerts (Prozess-, Strukturwissen) der unstrukturierten Records erfasst und dargestellt werden können.