Spätestens seitdem für das Training von generativen KI-Modellen wie den Large
Language Modellen sehr große Datenmenge aus dem Web verwendet werden, ist
das Webscraping in das Bewusstsein der Öffentlichkeit gelangt. Websraping
könnte als Schürfen von digitalem Gold bezeichnet werden. Dass das „Gold“
mit personenbezogenen Daten durchzogen ist, ist quasi unvermeidlich – nicht
unbedingt erwünscht, aber für die Zielsetzung auch nicht schädlich. Es
werden daher kaum Anstrengungen unternommen, um den Umfang personenbezogener
Daten zu minimieren. Es stellt sich die Frage, ob Webscraping und die
Verarbeitung der so gewonnenen teilweise personenbezogenen Daten mit der
Datenschutz-Grundverordnung vereinbar ist – oder vereinbar sein sollte.