Christian Geminn/Leon Pfeiffer

2nd International Symposium on Open Search Technology


Vom 12. bis 14.10.2020 fand das „2nd International Symposium on Open Search Technology (OSSYM 2020)“ als virtuelle Konferenz statt. Veranstaltet wurde das Symposium von der Europäischen Organisation für Kernforschung (CERN) als „Wiege des Web“ und dem 2018 gegründeten Open Search Foundation e.V. (OSF). Das Symposium war als interdisziplinäre Konferenz zum Thema offene Internetsuche (Open Search) konzipiert und beschäftigte sich vor allem mit technischen, rechtlichen, ethischen und wirtschaftlichen Aspekten des Themas.

Während seiner Arbeit am CERN entwickelte 1989 Tim Berners-Lee das World Wide Web; die erste Webseite war dem WWW-Projekt selbst gewidmet. Zudem darf das CERN als ein Vorreiter beim Thema Offenheit gelten. Insofern war das CERN logischer Partner der OSF bei der Ausrichtung dieser Konferenzreihe, die der Erforschung und Diskussion einer offenen Internetsuche dient.

Die OSF hat sich einer transparenten, vielfältigen und neutralen Internetsuche verschrieben und will hierfür Grundlagen schaffen. Zentraler Grundpfeiler ist dabei die Erstellung eines offenen Web-Index, auf dem wiederum verschiedene Suchmaschinenanbieter ihre Dienstleistung aufsetzen können. Bisher existieren weltweit nur vier umfassende Indexe des Internet, die von Google, Microsoft sowie Baidu und Yandex betrieben werden. Diese Anbieter diktieren die Zugangsbedingungen zu ihren Indexen und nehmen damit die Rolle von Gatekeepern des Suchmaschinenmarkts ein. Ziel der Veranstaltung war es, internationale und interdisziplinäre Experten zusammenzubringen, um die Implikationen und Voraussetzungen eines offenen Web-Index und einer offenen Internetsuche zu diskutieren.

Im Folgenden werden die Keynotes des dreitägigen Events kurz vorgestellt bei dem über 90 registrierte Teilnehmer aus 16 Ländern zusammenkamen.

Die Konferenz begann mit einer Einführung durch den Gründer der OSF Stefan Voigt, DLR, der drei wesentliche Prinzipien eines Open-Search-Ökosystems formulierte: kooperativ, offen und öffentlich moderiert. Ein Grußwort des Gastgebers sprach Tim Smith, Head of Collaboration, Devices and Applications Group am CERN. Smith stellte die Rolle des CERN als Wegbereiter des Web heraus, das im Jahr 2019 sein 30-jähriges Jubiläum feierte, und sprach über die Ideale des Web, die damals, in seinen Anfangsjahren, skizziert worden waren. Zwischenzeitlich habe sich das Web jedoch vom Ideal der Offenheit wegbewegt und werde in vielen Bereichen von wenigen, zentralen „Gatekeepern“ beherrscht.

Pearse O’Donohue, Director Future Network, DG Connect, EU-Kommission, hielt im Anschluss eine Policy Keynote, in der er die Bedeutung von digitaler Souveränität Europas betonte. Eine europäische Cloud etwa (auf Basis von GAIA-X als deutsch-französischer Initiative) sei ein wichtiger Schritt in Richtung Souveränität. Gleiches gelte aber auch für andere Bereiche wie z.B. high-performance computing. Accessibility sei dabei stets ein fundamentales Element: Gemeinwohl – statt gewinnorientiertem Wissenszugang. Er stellt heraus, wie gut die Idee eines offenen Web-Index in die Vision der EU-Kommission zu Europas digitaler Zukunft passe, gerade in Anbetracht der aktuellen Monopole in diesem Bereich. Wichtig sei dabei der Einklang mit europäischen Werten und Gesetzen insbesondere bei der Sicherstellung von Datensicherheit und Datenschutz. Es finde ein Kampf zwischen Wertesystemen auf globaler Ebene statt, dessen Ausgang die Zukunft des digitalen Raums bestimmen werde, und in dem es für Europa darum gehe, sich zu behaupten und einen eigenen Weg zu finden. Dabei müsse auch i.S.d. European Green Deal auf den Einsatz von „grüner“ IT geachtet werden. Dies gelte umso mehr im Kontext von stromintensivien Bereichen wie der Internetsuche.

Die Keynote zu rechtlichen Aspekten sprach Oilivia Tambou von der Université Paris-Dauphine. Ausgangspunkt war dabei die Frage, wie Rechtsexperten die Entwicklung einer freien und offenen Suchinfrastruktur im Internet unterstützen können. Dabei unterstrich sie die Bedeutung von rechtsverträglicher Gestaltung (law by design). Ein Problem sei die Einordnung von Suchmaschinen in verschiedene Rollen (datenschutzrechtlich Verantwortlicher, digitale Plattform, technischer Intermediär, Dienst der Informationsgesellschaft), die zu einer Überlappung von Pflichten etwa aus dem Haftungsrecht und dem Datenschutzrecht führe. Zudem beschrieb Tambou ein großes Spektrum an rechtlichen Werkzeugen zur Regulierung von Suchmaschinen von Verträgen bis hin zu Selbstregulierung. Letztere habe sich jedoch als ungenügend erwiesen; Hoffnungen könnten in den künftigen Digital Services Act gesetzt werden. Als drei Hauptherausforderungen identifizierte sie die Festlegung auf einen öffentlich-rechtlichen oder privatrechtlichen Regulierungsansatz, die Notwendigkeit eines mehrstufigen Ansatzes, der EU-Recht, nationales Recht und internationales Recht berücksichtigt, sowie die Tatsache, dass European Digital Law noch im Entstehen sei. Der Vortrag schloss mit Verweis auf die FAIR-Prinzipien: Findable, Accessible, Interoperable, Reusable.

Im Anschluss sprach Arjen DeVries, Radboud-Universität Nijmegen, unter dem Titel „Searching, fast and slow – a tech perspective“ zu den technischen Herausforderungen einer offenen Internetsuche. Er begann seine Ausführungen mit einem Hinweis auf den Report der Investigation of Competition in Digital Markets des Subcommittee on Antitrust Commercial and Administration Law des Committee on the Judiciary des U.S. House of Representatives unter dem Vorsitz von Jerrold Nadler. Der Bericht verweist auf die hohen Kosten des Betriebs einer Suchmaschine. Hier komme der kooperative Ansatz der Open Search Foundation zum Tragen, der diese Kosten auf viele Schultern verteile. Er wies aber auch darauf hin, dass die Erstellung eines Web-Index nur ein Teil der zu leistenden Arbeit sei. Suchmaschinen brauchen heute nicht mehr nur einen Index, sondern auch zahlreiche begleitende Funktionen wie etwa Snippets, Verticals, Knowledge Graphs, Instant Answers oder Mobile Applications. Zentrale Frage sei, wie die Monopolstellung von Google im Suchmaschinenmarkt durchbrochen werden könne. Dabei sei eine besondere Herausforderung, die Standardsuchmaschine etwa in Betriebssystemen wie Android zu werden. Den Beginn der Arbeiten sollte nach DeVries die Erstellung eines European Web Index darstellen. Ferner stellt er das Konzept von „Slow Search“ vor, bei dem die Suchmaschine zunächst nur rudimentäre Ergebnisse liefert, später aber detaillierte Ergebnisse nachliefert. Des Weiteren thematisierte er „Human-Centric Search“. Dahinter steht das Konzept, dass niemand Zugriff auf das gesamte Web brauche, denn es sind für den Einzelnen gar nicht alle im Web vertretenen Sprachen verständlich. Die Suche solle sich stattdessen auf persönliche Interessen fokussieren und uninteressante Themen ausblenden. Die Chance eines offenen Web-Index liege gerade darin, durch Human-Centric Search eine echte Alternative zu Google bieten. Auch der Ansatz dezentraler Datenverarbeitung könne entscheidende Vorteile gegenüber Google bieten. Der Vortrag schloss mit der Empfehlung einer Kooperation mit nationalen Web-Archiven und Bibliotheken beim Aufbau eines offenen Web-Index.

In einem Vortrag mit dem Titel „Legal Open Standard Design for Legal Search Features“ thematisierte Monica Palmirani, Bologna University, School of Law, die Nachzeichnung des Gesetzgebungsprozesses und verknüpfter Prozesse anhand digitaler Quellen sowie die suchmaschinenunterstützte juristische Recherche. Der Jurist der Zukunft solle zudem bei der Übersetzung rechtlicher Dokumente durch Künstliche Intelligenz unterstützt werden. Machine Learning solle ferner auch z.B. bei der Klassifizierung rechtlicher Dokumente zum Einsatz kommen, die digital verknüpft werden und mit Meta-Informationen angereichert werden müssten (z.B. zur Jurisdiktion, in der ein rechtliches Dokument Geltung entfaltet). In diese Richtungen arbeitet das Projekt LegalXML (Advancing Standards for Legal Data Exchange). Wichtig sei der Aufbau eines Dynamic Legal Information System, bei die Verlinkung in einem Dokument auf eine Rechtsvorschrift nicht zur aktuellsten Version der Vorschrift führt, sondern zur während der Geltungsdauer des Dokuments aktuellen Version. Gerade das Thema der zeitlichen Einordnung werde von vielen juristischen Datenbanken sowohl auf staatlicher wie auch auf kommerzieller Ebene vernachlässigt. Die juristischen Suchmaschinen der Zukunft müsse zeitliche Faktoren berücksichtigen (temporal model) zumindest und eine implizite Interpretation automatisiert vornehmen können.

Als Keynote der ersten Session (Open Search Ecosystems) sprach Alexander Decker zum Thema „Beyond Tech – Raising Awareness For The Open Search Foundation Through A Tailor-Made Communication Approach”. Den Einstieg in den Vortrag bildete ein Zitat der Google-Gründer Brin und Page: „For this type of reason and historical experience with other media, we expect that advertising funded search engines will be inherently biased towards the advertisers and away from the needs of the consumers.“ (The Anatomy of a Large-Scale Hypertextual Web Search Engine, (1998) 30 Computer Networks and ISDN Systems, 107, Appendix A). Decker zeichnete in der Folge die Probleme bei der Sensibilisierung der Öffentlichkeit für das Grundproblem sowie beim Aufbau der organisatorischen Infrastruktur des OSF e.V. nach.

Die erste Keynote des zweiten Veranstaltungstags hielt Michael Völske von der Bauhaus-Universität Weimar. Unter dem Titel „Towards an Open Web Index: Lessons From the Past” thematisierte er unter anderem das Aggregieren der Anzahl an Aufrufen von Webseiten im Vergleich zu deren Ranking als ei-ne notwendige Methode zur Verbesserung der Suche. Der Suchmaschinenbetreiber CLIQZ habe hier erste Anstrengungen unternommen. Die Nutzenden sammeln dabei lokal, welche Webseiten sie bei vorangegangenen Suchen angefragt haben und geben diese Informationen bei ihrer Suche temporär und verschlüsselt an den Such-Dienstleister weiter.

Eine öffentliche Sitzung der Fachgruppe Legal der OSF, die im Kontext des Symposiums tagte, betonte die Bedeutung eines zweigleisigen Ansatzes bei der rechtlichen Unterstützung des Aufbaus eines offenen Web-Index. Dabei müsse neben Aspekten der rechtlichen Compliance auch auf eine verfassungsverträgliche Technikgestaltung hingewirkt werden, bei der europäische Verfassungswerte und -prinzipien (jenseits rechtlicher Mindestvorgaben) bestmöglich zum Ausdruck gebracht werden. Als eines der zentralen Problemfelder wurde zunächst identifiziert, dass der aktuelle Rechtsrahmen auf ein Zusammenfallen von Web-Index-Betreiber und Suchmaschinenbetreiber ausgerichtet sei; zentrale Urteile etwa zum Recht auf Vergessenwerden haben die Suchmaschine Google zum Thema. Ferner erfolgt der Aufbau eines offenen Web-Index in einem höchst volatilen rechtlichen Umfeld, in dem mittelfristig deutliche Veränderungen zu erwarten sind. Zudem bestehen deutliche Probleme bei der Konkretisierung von Verfassungsvorgaben hin zu durch Informatiker und Techniker umsetzbare Vorgaben, zumal viele dieser Verfassungsvorgaben zueinander in Konkurrenz stehen.

Weitere Informationen: Das 3rd International Symposium on Open Search Technology (OSSYM 2021) ist als reguläre Tagung für den Herbst 2021 am CERN in Genf geplant.

 

Dr. Christian Geminn ist Geschäftsführer der Projektgruppe verfassungsverträgliche Technikgestaltung (provet) im Wissenschaftlichen Zentrum für Informationstechnik-Gestaltung an der Universität Kassel und Leiter der Fachgruppe Legal der OSF.

Leon Pfeiffer ist Student der Rechtswissenschaften an der Ludwig-Maximilians-Universität München sowie der Université Panthéon-Assas und Gründungsmitglied der Fachgruppe Legal der OSF.