Maximierung der Extraktionsabdeckung im Geschäftsfeld RealEstate / Startup
Projektprofil
Lesen alle wesentlichen Vertragsbestandteile auf gescannten Verträgen. Spezialisierung bei Kauf- und Mietverträge nach österreichischem Recht.
Anreichern einer Vertragsdatenbank zur statistischen Auswertung und demografischen Zuordnung von Daten im Rahmen eines WebServices.
Wesentlich war die Generierung einer Einsparung bei der bisherigen manuellen Bearbeitung der Extraktion.
Auf einen Blick - Wesentliche Projektdaten
Dauer | Von 9/1/2020 to 10/31/2020 with about 2 months of full engagement | |
---|---|---|
Data and Tools | Market ? RealEstate Sources • 23.237 Verträge mit 25.295 Objekten • Durchschnittliche Anzahl der Zahlen pro Vertrag: ca. 400 • Durchschnittliche Anzahl der Preisangaben pro Vertrag: ca. 13! • Wir finden die richtige Zahl heraus! • Es gibt Verträge mit mehr als einem Objekt unsupervised Labeling for automated Model-Training | |
Integration | Web-API für Backoffice System | |
AI Methoden | • NLP • Information Extraction • DeepLearning • Heuristik |
Hauptanwendungsfall
Automatisiertes Lesen und Extrahieren von Merkmalen von Wohnungskaufverträgen
Kundenmotivation / Lösungsansätze
Effizienzerhöhung
Ressourceneinsparung
Qualitätserhöhung im Prozess
Durchsatzerhöhung in der Verarbeitung.
AI-Ansatz
Eingesetzte AI Schlüsseltechnologien | Mehrfachobjekte pro Vertrag, Unterscheidung Inklusivpreise vs Exklusivpreise. | |
---|---|---|
Lösungsansatz | • NLP • Deep-Learning • Heuristik | |
Projekt-Ansatz | Simply agile | |
Projekt-Typ | Proof-Of-Concept (POC) | |
ML Integration und ML Betrieb | • Operation-Integration API • VIsualizationAPI |
Einblicke und Details
Um Information Extraction bei einem Vertrag unsupervised zu erreichen bedarf es nicht nur vieler Verträge, sondern auch der Möglichkeit die Modell-Ansätze zu variieren.
Beispiele für Content-Probleme bei Kaufverträgen ? Variante 1
Beispiele für Content-Probleme bei Kaufverträgen ? Variante 2 ? Erst im Nachfolgenden Satz erschließt sich der Kontext der vorangegangenen Zahl!
Um im NLP die Vor-Nachlaufsicht der Interpretation zu variieren begleiten wir diesen Ansatz immer mit Qualitätsbereiche in denen wir das Windows-Size optimieren
Selbst der Kontext des Vertrages über mehrere Objekte wird erkannt und kann sodann nochmals interpretiert werden.