Themenüberblick

Fakten statt Linklisten

Zuletzt gab der Internetkonzern Google bekannt, seine Suchtechnologie grundlegend zu überarbeiten, um den Nutzern künftig bessere und treffsichere Fakten zu liefern. Kern des neuen Suchkonzepts ist die Ausweitung auf die semantische Suche. Genau diesen Ansatz haben zwei Wissenschaftler für ihre Suche im freien Onlinelexikon Wikipedia gewählt.

Bisher kann nur mittels Schlagworten nach einzelnen Seiten im Wikipedia-Netz gesucht werden. Ein neues Plug-in soll nun komplexe Fragestellungen möglich machen und konkrete Fakten liefern. Das berichtet das Wissenschaftsmagazin „New Scientist“.

Die Entwicklung namens SWiPE (Searching Wikipedia By Example) soll verschachtelte Fragen präzise beantworten können. Fragestellungen wie „Welche Schauspielerinnen unter 30 Jahren haben die Oscars in den letzten 25 Jahren gewonnen?“, „Haben die Hauptcharaktere von Greys Anatomy auch schon in einer anderen Serie/Film zusammen gespielt?“ oder „Welche Politiker haben mit Nicolas Sarkozy an der gleichen Universität studiert?“ sollen etwa kein Problem für die innovative Software sein.

Präsentation in Lyon

Searching Wikipedia By Example (SWiPE) wird auf der World-Wide-Web-Konferenz in Lyon, Frankreich (16.-20. April) erstmals der Öffentlichkeit präsentiert.

Suchanfrage direkt in Wikipedia-Artikeln

Doch derzeit können die SWiPE-Suchanfragen jedoch noch nicht in gesprochener Sprache formuliert werden. Die Eingabe erfolgt über Markierungen, Ergänzungen und Austausch von Wörtern direkt in Wikipedia-Artikeln.

Die beiden Entwickler Maurizio Atzori von der Universität Cagliari auf Sardinien und Carlo Zaniolo von der Universität von Kalifornien in Los Angeles sind sich sicher, dass ihr Konzept zukunftsweisend und vor allem alltagstauglich ist. Die Nutzer könnten die Fakten ohne Kenntnis einer komplizierten Datenbankabfragesprache abfragen, so die Forscher.

Faktendatenbank bildet Grundlage

Als Basis dient den Wissenschaftlern dabei DBpedia, eine Art Faktendatenbank der Wikipedia-Artikel. Denn diese bestehen neben Text auch aus einer Vielzahl strukturierter Informationen auf der rechten Bildseite - wie Infoboxen, Tabellen, Zeitdaten und geografische Koordinaten -, die DBpedia extrahiert und sammelt. Im September 2011 enthielt DBpedia laut Wikipedia 3,64 Millionen Datensätze mit über einer halben Milliarde Einzeldaten.

Suchergebnisse auf der Wikipediaseite von Maurizio Atzori

Maurizio Atzori

Wie man sucht

Ruft ein Wikipedia-Nutzer etwa die Seite von Lady Gaga auf und will dann die Namen sämtlicher USA stammender Sängerinnen unter 20 Jahren wissen, kann er das direkt im Gaga-Artikel tun. Dazu muss er in der seitlichen Factbox das Alter auf „<20“ (unter 20) korrigieren, den Ort von „New York“ auf „Nordamerika“ ändern und die Swipe-Suche starten.

Alles was farblich markiert ist, wird in die Suche miteinbezogen. Swipe konvertiert diese Anfrage in eine DBpedia-Datenbankanfrage und listet dann die gefundenen Wikipedia-Treffer auf. Ein kurzes Demovideo zeigt ein Suchbeispiel nach allen „Musikern“ namens „Mike“, die nicht „Poprock“ spielen.

Eine Integration in Wikipedia wäre schnell und einfach möglich, so die Wissenschaftler gegenüber „New Scientist“. Doch noch sind weitere Verbesserungen nötig. Wann das Plug-in für alle Nutzer verfügbar sein wird, ist nicht bekannt.

Semantische Suchansätze in der Wissenschaft

Im Internet finden sich seit längerem diverse Ansätze der semantischen Suche. Im biomedizinischen Bereich hat sich die wissensbasierte Suche GoPubMed als Werkzeug für Biologen und Mediziner etabliert. Auf dem Gebiet der Naturwissenschaften gilt etwa Wolfram Alpha als gelungenes Beispiel.

Wolfram Alpha liefert dem Suchenden direkte Antworten und setzt diese auch in Relation zueinander. So ergibt eine Suche nach „Deutsch“ neben Informationen darüber, wie viele Menschen Deutsch sprechen, auch Antwort darauf, wie viel Prozent der Weltbevölkerung das sind, welche Buchstaben am häufigsten vorkommen oder auch das kuriose Faktum wie schwer alle deutschsprechenden Menschen zusammen sind. Bisher gibt es Wolfram Alpha jedoch nur in englischer Sprache.

Eine mobile Version einer semantischen Suchmaschine bildet die Anfang des Jahres vorgestellte Smartphone-App AskWiki. Die Android-App durchsucht die deutsche Version von Wikipedia, der Nutzer kann seine Fragen mittels Spracheingabe direkt ins Smartphone diktieren. Einfache Fragen nach speziellen Eigenschaften wie etwa „Fläche Österreich“ werden dabei direkt mit der entsprechenden Textzeile aus dem passenden Wikipedia-Eintrag angezeigt.

Funktioniert nur in abgegrenzten Bereichen

Wie die genannten Anwendungsbeispiele zeigen, wird die semantische Technologie bisher vor allem im wissenschaftlichen Umfeld genutzt. Denn die verknüpfte Suche kann ihre Stärken, große, komplexe Datenmengen zu organisieren, nach wie vor nur innerhalb eines vorgegebenen Rahmens zeigen.

Ob die Ankündigungen der großen Suchkonzerne einen Durchbruch bei der semantischen Suche mit allgemeiner Ausrichtung bringen werden, bleibt abzuwarten.

Links: