Kompetenzzentrum Seltene Erkrankungen

Erweiterte Expertensuche zu Seltenen Erkrankungen

Ein Schaubild mit vielen Ärzten in Deutschland, von denen einer markiert ist, illustriert das Problem der Suche nach Experten für Seltene Erkrankungen Seltene Erkrankungen - Seltene Experten

Hintergrund

Das Zentralprojekt verfolgt den Ansatz, Expertenprofile zu SE auf der Grundlage von automatischen Literaturanalysen zu generieren, um sie Hilfesuchenden zugänglich zu machen. Die wichtigste Informationsquelle hierzu ist die öffentlich zugängliche online Datenbank PubMed des US-amerikanischen National Center for Biotechnology Information.

Fachliteratur zu den mehr als 5000 in Orphanet gelisteten Krankheitsentitäten wird seit Beginn des Jahres 2014 analysiert, um anhand der mit jeder Veröffentlichung verbundenen Metadaten Profile der Autoren zu bilden und in z.B. Grundlagenforscher oder diagnostisch oder therapeutisch tätige Experten zu typisieren. Auf diese Weise entsteht eine Art Who’s Who in Rare Diseases. Die Expertenprofile werden per programmierte Internetsuche durch Kontaktdaten ihrer Webseiten ergänzt.

Ein Schaubild für das Konzept der Profilgenerierung Methodische Übersicht der Profilgenerierung
(Vollbild)

Methodik

Anhand eines Thesaurus werden Literaturdaten zu SE aus Literaturund Forschungsdatenbanken abgerufen. Aus diesen werden die Autoren sowie weitere relevante Metadaten jeder Publikation extrahiert und einer Disambiguierung unterzogen, um beispielsweise mehrere Autoren gleichen Namens zu unterscheiden. Die Daten jedes Autors dienen dazu, ein Expertenprofil zu erstellen bzw. zu erweitern. Anhand von Schlagworten auf der Grundlage der Medical Subject Headings sowie definierbarer Kenngrößen werden Rückschlüsse auf das Tätigkeitsfeld und die Expertise eines Autors gebildet. Die Profile werden in einer Datenbank hinterlegt und können Nutzern über eine Suchmaske zur Verfügung gestellt werden. Sortier- und Filterfunktionen ermöglichen Nutzern, die für sie passenden Experten zu finden. Für eine umfassendere Beschreibung der Methodik wird auf den Jahresbericht 2013 verwiesen.

Ein Schaubild, das Kenngrößen für Tätigkeitsfeld und Expertise eines Autors illustriert. Kenngrößen für Tätigkeitsfeld und Expertise eines Autors
(Vollbild)

Ergebnisse

Nach 7 Monaten Laufzeit wurde der erste periodische Suchlauf erfolgreich abgeschlossen. Zu jedem der im SE-Thesaurus enthaltenen Begriffe wurde eine Suche in PubMed durchgeführt und die gefundenen Publikationen entsprechend verarbeitet. Mehr als 4,6 Mio. Artikel zu 4.264 Erkrankungen (>16.000 Suchbegriffe) wurden in diesem Suchlauf erfasst. Die Disambiguierung der mehr als 21 Millionen einzelnen Autoreneinträge ist der Fokus der aktuellen Arbeiten. Die Erstellung vorzeitiger Expertenlisten ohne Namensunterscheidung ist bereits möglich und wurde für Anfragen des ZSE Ulm zu verschiedenen Erkrankungen erfolgreich eingesetzt. Der Thesaurus als begriffliche Grundlage wurde im Anschluss an den ersten vollständigen Suchlauf überarbeitet. Erkannte problematische Akronyme, die überwiegend zu falsch positiven Ergebnissen führten, wurden entfernt und die Verknüpfung zu betroffenen Publikationen und Daten aufgehoben.

Ein Schaubild, das ein Nutzungsszenario der Expertensuche illustriert. Nutzungsszenario der Expertensuche
(Vollbild)

Arbeitsgruppen

Den Experten des Kompetenzzentrums wurde regelmäßig Gelegenheit gegeben, Kritik oder Umsetzungsvorschläge einzubringen. In insgesamt drei Veranstaltungen wurden Vorschläge zur Optimierung der Datengewinnung, zur Erschließung weiterer Literatur- und sonstiger Informationsquellen, zu Möglichkeiten der Verifizierung der Expertise von Autoren sowie wichtiger Nutzerfunktionen bei der Filterung und Sortierung der Expertenprofile gesammelt.

Plan der Weiterführung 2015

Der zweite periodische Suchlauf wurde im Januar 2015 gestartet und fügt dem bisherigen Datenbestand neue Veröffentlichungen hinzu bzw. aktualisiert seither geänderte Publikationsdaten. Die weitergehende Überarbeitung des Thesaurus erfolgt 2015 vorrangig im Hinblick auf SE und deren Begriffe, zu denen im ersten Suchlauf keine oder nur wenige Fachartikel gefunden wurden. Ein dediziertes Projekt hierfür befindet sich derzeit in der Planung.

Die Entwicklung und Anwendung der Disambiguierungsmechaniken soll abgeschlossen werden, um die Profilbildung auf der Basis korrekter Namensunterscheidungen ausführen zu können. Ein weiteres anstehendes Projekt thematisiert die Typisierung von Experten im Rahmen der Profilbildung und untermauert zudem das wissenschaftliche Fundament des Projekts. Für die Anreicherung der Profile mit publikationsunabhängigen Informationen wurden erste Web-Crawling Methoden getestet, deren Entwicklung fortgesetzt wird. Zuletzt wird das prototypische Webportal aufgebaut werden.

Publikationen zum Projekt

1 Pflugrad A, Jurkat-Rott K, Lehmann-Horn F, Bernauer J. "Towards the automated generation of expert profiles for rare diseases through bibliometric analysis." Studies in health technology and informatics 2014; 198:47–54.

2 Pflugrad A, Jurkat-Rott K, Lehmann-Horn F, Bernauer J. " Automatische Generierung von Expertenprofilen zu Seltenen Erkrankungen." GMDS 2014. Tagungsband der 59. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie e.V. (GMDS). Göttingen, 07.-10.09.2014. Düsseldorf: German Medical Science GMS Publishing House; 2014. DocAbstr. 305