CHB_RSW_Logo_mit_Welle_trans
jaheader_neu

API-Schnittstelle zu Daten von Otto Schmidt

Von Nico Kuhlmann, Autorenbeschreibung
In dieser Ausgabe von Tech & Tools wird die neue API-Schnittstelle zu den Daten des Otto Schmidt Verlags vorgestellt, die von der LDA Legal Data Analytics GmbH entwickelt wurde.

Welches Problem löst die API?

KI-Chatbots sind derzeit allgegenwärtig und bieten Unterstützung bei nahezu jeder erdenklichen Aufgabe. Wie hilfreich die Antworten aber dann tatsächlich sind, hängt maßgeblich von der Qualität der Trainingsdaten ab, auf denen die zugrunde liegenden Sprachmodelle basieren.

Das ist insbesondere bei juristischen Fragestellungen ein Problem. Da viele der hochqualitativen Daten – Entscheidungen und deren Besprechungen, Aufsätze sowie Kommentare – grundsätzlich nicht frei verfügbar im Internet sind, standen diese Texte in der Regel nicht beim ursprünglichen Training oder für das Fine-Tuning der KI-Modelle zur Verfügung. Dieses Expertenwissen fehlt den Sprachmodellen also erstmal.

Eine wirksame Möglichkeit, die Antwortqualität von KI-Chatbots zu verbessern, besteht darin, dem Prompt zusätzlich relevante Informationen als Kontext mitzugeben. Wer etwa nach speziellen Fallgruppen der Verjährung sucht, erhält deutlich präzisere Ergebnisse, wenn dem Prompt automatisch passende Auszüge aus aktuellen BGH-Entscheidungen beigefügt werden – Stichwort: Retrieval-Augmented Generation (RAG). Voraussetzung dafür ist allerdings ein Zugang zu einer passenden Datenbank mit den relevanten Inhalten.

Wie genau funktioniert die API?

Die LDA GmbH hat nun eine API-Schnittstelle zu den umfangreichen Daten des Otto Schmidt Verlags gebaut, über die KI-Modelle von Dritten direkt auf diese zugreifen können. Aktuell besteht ein Zugriff auf die Daten von zirka 700 Buchtiteln, 60 Fachzeitschriften und 40 Loseblattwerken. 

Die LDA musste die relevanten Verlagsdaten dafür vorher aufbereiten und in eine Vektordatenbank überführen. Dabei handelt es sich um eine spezialisierte Datenbank, die darauf ausgelegt ist, hochdimensionale Vektoren (also Zahlenreihen, die die Bedeutung von Texten repräsentieren) effizient zu speichern. Dafür müssen die Texte zuerst bereinigt, also von irrelevanten Informationen befreit werden. Die bereinigten Textabschnitte werden dann in Vektoren umgewandelt, die semantische Ähnlichkeit abbilden. Nur so kann ein KI-Modell später bei einer Abfrage schnell und sicher passende Informationen aus der Vektordatenbank finden. 

Wer steht hinter der API?

Die API wurde von der LDA Legal Data Analytics GmbH aus München für den Otto Schmidt Verlag entwickelt. Gegründet
wurde LDA im Jahr 2023 von Dr. Dierk Schindler (CEO) und Dr. Bernhard Waltl (CTO) sowie Kai Jacob und Dr. Jens Wagner. Neben der API hat die LDA auch für den Beck-Verlag unter anderem das Chatbook „Frag den Grüneberg“

entwickelt.

An wen richtet sich die API?

Die API wird bereits von mehreren Legal-Tech-Anbietern genutzt (BRYTER und Libra), die diesen Zugang dann wiederum

ihren Kunden zur Verfügung stellen. Die API richtet sich aber auch direkt an Kanzleien, Unternehmen und sonstige Interessierte, die darüber ihre eigenen KI-Lösungen anschließen möchten.

Was kostet die API?

Um über die API auf die Daten des Otto Schmidt Verlags zuzugreifen, müssen zuerst die entsprechenden Module
beim Verlag abonniert werden. Hinzu kommen dann Kosten für die Benutzung der API, die sich nach der Anzahl

der Anfragen richtet. 

Wer sind die Konkurrenten?

Dieses Angebot, über eine API direkt auf Verlagsdaten zuzugreifen, ist im deutschen Rechtsmarkt bisher einzigartig.

Leseproben

RDi_Cover

RDi_2022_176-Aufsatz

BECK Stellenmarkt

Teilen:

Menü