• KI-Projekte mit Praxiserfahrung

Maximierung der Extraktionsabdeckung im Geschäftsfeld RealEstate / Startup

Maximierung der Extraktionsabdeckung im Geschäftsfeld RealEstate / Startup

Projektprofil

Lesen alle wesentlichen Vertragsbestandteile auf gescannten Verträgen. Spezialisierung bei Kauf- und Mietverträge nach österreichischem Recht.

Anreichern einer Vertragsdatenbank zur statistischen Auswertung und demografischen Zuordnung von Daten im Rahmen eines WebServices.

Wesentlich war die Generierung einer Einsparung bei der bisherigen manuellen Bearbeitung der Extraktion.

Auf einen Blick - Wesentliche Projektdaten

DauerVon 9/1/2020 to 10/31/2020 with about 2 months of full engagement
Data and ToolsMarket ? RealEstate
Sources
 • 23.237 Verträge mit 25.295 Objekten
 • Durchschnittliche Anzahl der Zahlen pro Vertrag: ca. 400
 • Durchschnittliche Anzahl der Preisangaben pro Vertrag: ca. 13!
 • Wir finden die richtige Zahl heraus!
 • Es gibt Verträge mit mehr als einem Objekt unsupervised Labeling for automated Model-Training
IntegrationWeb-API für Backoffice System
AI Methoden • NLP
 • Information Extraction
 • DeepLearning
 • Heuristik

Hauptanwendungsfall

Automatisiertes Lesen und Extrahieren von Merkmalen von Wohnungskaufverträgen

Kundenmotivation / Lösungsansätze

  • Effizienzerhöhung

  • Ressourceneinsparung

  • Qualitätserhöhung im Prozess

  • Durchsatzerhöhung in der Verarbeitung.

AI-Ansatz

Eingesetzte AI SchlüsseltechnologienMehrfachobjekte pro Vertrag, Unterscheidung Inklusivpreise vs Exklusivpreise.
Lösungsansatz • NLP
 • Deep-Learning
 • Heuristik
Projekt-AnsatzSimply agile
Projekt-TypProof-Of-Concept (POC)
ML Integration und ML Betrieb • Operation-Integration API
 • VIsualizationAPI

Einblicke und Details

Um Information Extraction bei einem Vertrag unsupervised zu erreichen bedarf es nicht nur vieler Verträge, sondern auch der Möglichkeit die Modell-Ansätze zu variieren.

Beispiele für Content-Probleme bei Kaufverträgen ? Variante 1

Beispiele für Content-Probleme bei Kaufverträgen ? Variante 2 ? Erst im Nachfolgenden Satz erschließt sich der Kontext der vorangegangenen Zahl!

Um im NLP die Vor-Nachlaufsicht der Interpretation zu variieren begleiten wir diesen Ansatz immer mit Qualitätsbereiche in denen wir das Windows-Size optimieren

Selbst der Kontext des Vertrages über mehrere Objekte wird erkannt und kann sodann nochmals interpretiert werden.