Deze fotograaf kreeg een rekening omdat hij zijn foto uit de LAION dataset wilde hebben

09/05
Een Duitse stockfotograaf eiste bij de beheerders van de LAION dataset verwijdering van zijn foto’s, maar kreeg een factuur van $979 in plaats van excuses. Dat las ik bij VICE, en ik wou dat ik zulke clickbaittitels kon schrijven. De zaak is interessant genoeg, zeker nu de fotograaf een rechtszaak is begonnen.

Het Duitse LAION project onderhoudt een van de bekendste datasets met geannoteerde afbeeldingen, waarmee AI systemen getraind kunnen worden. De bekende afbeeldingsgeneratoren zoals Midjourney en Stable Diffusion gebruiken LAION. Een discussiepunt bij dit soort sets is of hier sprake is van auteursrechtinbreuk, wat onder meer tot deze class action rechtszaak leidde.

Over een praktische aanpak blogde ik vorig jaar: via de website “Have I been trained” kun je achterhalen of jouw foto gebruikt is om een AI te trainen. Of nou ja, of je in een dataset zit die zo’n AI gebruikt, wat juridisch niet precies hetzelfde is. Ik schreef toen:
De state of the art dataset tegenwoordig is LAION-5B,met 5,85 miljard afbeeldingen verreweg de grootste. Bijeengebracht voor researchdoeleinden en experimenteren met zulke enorme sets, aldus de website. “The images are under their copyright”, staat er dan ook. En dan de juridische truc, of nou ja truc, waarmee dat kan: elk item uit de dataset bevat simpelweg alleen de bron-URL van de afbeelding, waarmee de dataset zelf geen inbreuk is.
De bedoeling van die website was dat je AI-bedrijven ging aanschrijven. Fotograaf Robert Kneschke koos een fundamenteler route: hij schreef LAION aan. Want je kunt maar beter problemen bij de bron aanpakken, nietwaar? Als die je foto uit hun set halen, zal niemand deze meer gebruiken.

De reactie was verrassend voor zowel Kneschke als VICE:
“Our client only maintains a database that contains links to image files that are publicly available on the Internet. It cannot be ruled out that the database may also contain links to images that you are the author of,” the letter, written by the law firm Heidrich Rechtsanwälte on behalf of LAION and viewed by Motherboard, said. “However, since our client does not save any of the photographs you have complained about, you have no right to deletion. Our client simply does not have any pictures that could be deleted.”
En ja, dat klopt dus met wat we vorig jaar hadden gezien: de dataset bevat fysiek geen afbeeldingen, alleen links daarheen. Ja dat is een truc, en ja die truc is legaal: onder het Europese auteursrecht is linken naar legaal gepubliceerd materiaal geen inbreuk. Het doet er daarbij niet toe welke gebruiksvoorwaarden of licentie de publicist bij het materiaal vermeldt. Dat is het probleem van de partij die de link volgt en de foto downloadt – de datasetsamensteller die er een AI mee gaat trainen dus, niet stichting LAION.

Vervolgens pakte de fotograaf door met een takedown-eis. Daar kwam dus die reactie met factuur op, wat een zeer creatieve terugblafactie is:
The legal letter [van LAION, AE] contained an invoice for $979 in Euros, and demanded that Kneschke pay the amount within 14 days or the firm will take legal action. The amount was due for filing an unjustified copyright claim, the lawyers argued, saying that Kneschke must pay because their client had now incurred legal fees to deal with the matter.
In het Europees auteursrecht is het zo dat de verliezer in een rechtszaak de werkelijke advocaatkosten van de winnaar betaalt. Dus niet het liquidatietarief zoals in andere rechtsgebieden, maar echt de factuur van die advocaat. En ja, als je dus als rechthebbende een dure advocaat neemt dan gaat de inbreukmaker meer betalen. En ja dat is oneerlijk. Maar het werkt ook andersom: als een rechthebbende onterecht blaft, mag je als beweerdelijke inbreukmaker jouw advocaatkosten neerleggen bij de blafhebbende.

Dat laatste is dus wat de LAION advocaat doet. Men ontwaart een onterechte auteursrechtclaim, omdat er wordt gesteld dat de dataset inbreuk maakt maar daar zit alleen een link in en dat is auteursrechtelijk legaal. Het in discussie blijven kost tijd van de advocaat, tijd is geld, dus de blafhebbende fotograaf moet die kosten vergoeden. Formeel hoeft dat pas bij een rechtszaak (want het is een proceskosten-vergoeding) maar de rekening na een rechtszaak zal hoger zijn dan die 900 euro.

Natuurlijk zal LAION ooit die foto’s hebben gedownload, al is het maar om de hyperlink te controleren of er echt een afbeelding achter zit en welke resolutie deze heeft. Die download zou je kunnen zien als een inbreuk, want daar is dan dus wél een kopie gemaakt. Maar in Europa hebben we sinds een aantal jaar een auteursrechtelijke uitzondering voor “data mining”, bij ons artikel 15o Auteurswet:
Onverminderd het bepaalde in artikel 15n wordt een reproductie in het kader van tekst- en datamining niet als inbreuk op het auteursrecht op een werk van letterkunde, wetenschap of kunst beschouwd mits degene die de tekst- en datamining verricht rechtmatig toegang heeft tot het werk en het auteursrecht door de maker of zijn rechtverkrijgenden niet uitdrukkelijk op passende wijze is voorbehouden, zoals door middel van machinaal leesbare middelen bij een online ter beschikking gesteld werk.
Met name dat stuk over het voorbehoud is van belang. Menig fotograaf of andere auteursrechthebbende zal een licentietekst of gebruiksvoorwaarden bij zhaar werk publiceren, al is het maar een Creative Commons licentie met bijvoorbeeld een NietCommercieel variant. Je zou zeggen dat je het daarmee juridisch dichtgetimmerd hebt, maar voor gegevensmijnwerkers is het ondoenlijk om al die teksten te gaan lezen. Daarom staat er in de wet dat zo’n voorbehoud op “passende wijze”, met name dus machineleesbaar, moet zijn gedaan.

Kneschke heeft zover ik kan zien geen machine-leesbare licentieinformatie bij zijn afbeeldingen, maar ze staan wel legaal online. Daarmee is dus aan deze uitzondering voldaan, zodat een partij zoals LAION ze mag downloaden voor datamining. Oftewel: haal ze binnen, extraheer de relevante informatie (omvang, type, etc) en maak een record waarin je die informatie vastlegt plus de hyperlink, gooi daarna de afbeelding weg. Ik zie niet hoe dit auteursrechtinbreuk kan opleveren.

Arnoud

Het bericht Deze fotograaf kreeg een rekening omdat hij zijn foto uit de LAION dataset wilde hebben verscheen eerst op Ius Mentis.

Datum: dinsdag 9 mei 2023, 08:19
Bron: Iusmentis Blog
Categorie: Internet en ICT

Gerelateerde berichten:

Reacties:

Er zijn nog geen reacties op dit bericht.


Website by Web Chemistry