Meta steht aktuell im Kreuzfeuer, und das aus gutem Grund. Zahlreiche Buchautoren haben den Technologiekonzern verklagt, weil ihre Werke angeblich ohne Erlaubnis und ohne Bezahlung genutzt wurden, um Künstliche Intelligenz zu trainieren. Das pikante Detail: Im Zuge des Rechtsstreits wurden E-Mails veröffentlicht, die Metas illegales Vorgehen scheinbar belegen. Die Datenbasis, auf die sich der Konzern beruft? Nichts Geringeres als zehntausende raubkopierte Bücher. Willkommen im Sumpf des Datenmissbrauchs.
Die schmutzige Wahrheit: Torrents und Schattenbibliotheken
Bereits vor einigen Wochen musste Meta zugeben, den Datensatz „LibGen“ genutzt zu haben – eine riesige Sammlung von Büchern, die (natürlich) illegal aus Schattenbibliotheken wie „Anna’s Archive“ stammen. Jetzt ist klar: Der Umfang des „Datenklaus“ ist riesig. Allein über LibGen und ähnliche Plattformen soll Meta mehr als 81 Terabyte (!) an Daten abgesaugt haben, darunter 35,7 Terabyte direkt aus Schattenbibliotheken. Das ist nicht nur ein PR-Problem, sondern hat das Potenzial, Meta gewaltige rechtliche Konsequenzen einzubringen.
Mitarbeiter warnen, Meta ignoriert
Die interne Kommunikation spricht Bände: Bereits 2023 machten Meta-Mitarbeiter augenscheinlich scherzhafte Bemerkungen darüber, „raubkopierte Inhalte“ von Firmen-Laptops herunterzuladen. Dass sie gleichzeitig ihren eigenen Bedenken Ausdruck verliehen, schien dem Unternehmen egal zu sein. Stattdessen wurde versucht, alles unter den Teppich zu kehren – Tarnmodus inklusive. E-Mails deuten darauf hin, dass Meta sich bewusst für illegalen Datendiebstahl entschieden und Maßnahmen getroffen hat, um die Downloads zu verschleiern.
Zuckerberg: Mehr gewusst als zugegeben?
Spannend wird es, wenn Meta-Gründer Mark Zuckerberg ins Spiel kommt. Offiziell hat er immer behauptet, nichts von der Sache zu wissen. Doch aus internen Mails geht hervor, dass die fragwürdigen Herangehensweisen offenbar mit ihm abgesprochen waren. Diese Erkenntnis dürfte Metas Verteidigung vor Gericht nicht gerade erleichtern. Auch die bisherige Ausrede, dass die Nutzung der Daten unter „Fair Use“ falle, wirkt angesichts des Veröffentlichungsumfangs wie ein schlechter Scherz.