Autorin: Dr. Stefanie Schwaar
Betrachten wir ein aktuelles Beispiel aus der Verwaltung: Jede Verwaltung bekommt ein besonderes elektronisches Behördenpostfach (beBPO), d.h. ein Mailpostfach, bei dem E-Mails für diese Verwaltung eingehen. Hypothetisch betrachten wir den Fall einer Stadt, bei der die Kommunikation komplett digitalisiert ist und über ein Postfach erfolgt, also über eine bestimmte E-Mail-Adresse. Die eingegangenen E-Mails sollen nun direkt beim Eintreffen den entsprechenden Ämtern zugordnet werden, etwa die Anmeldung einer Ehe beim Standesamt oder die Meldung eines Corona-Verdachtsfalls beim Gesundheitsamt. Diese Zuordnung muss erlernt werden, das heißt: Unsere Daten sind die E-Mails und die Klassen unsere Ämter. Wie kann ein Algorithmus diesen Zusammenhang erlernen?
Daten: Information und Wissen
Wir starten mit unseren Daten und gehen davon aus, dass die uns interessierende Information aus diesen Daten hervorgeht – eine Grundannahme, die nicht zu vergessen ist. Speziell heißt das, dass alle Daten vorhanden sind, die für eine ausreichend gute Vorhersage bzw. Detektion oder Bearbeitung benötigt werden. Der Zusammenhang ist dabei jedoch unbekannt bzw. zu komplex, um ihn mit einem einfachen Modell zu beschreiben. Grafisch stellen wir uns das so vor: