Die Nachrichtenagentur Reuters berichtet, dass Reddit mit einem Unternehmen einen Lizenz-Vertrag in Höhe von jährlich 60 Millionen Dollar abgeschlossen hat, um diesem beim KI-Training zu helfen – mit den Beiträgen der Nutzer.
Mit über 50 Millionen täglich aktiven Nutzern und mehr als 100.000 aktiven Communities bietet Reddit eine Fundgrube für das Training von KI-Systemen.
Für Reddit bietet dies eine potenzielle neue Einnahmequelle neben der Werbung.
Bin ich froh, dass ich diesen Dreck hinter mir gelassen habe
Ich frag mich, ob Reddit ein guter Trainingsort für eine KI ist. Stell dir vor, du würdest eine neue Sprache lernen - und das nur indem du Reddit Kommentare liest. Klingt für mich nach keiner guten Datenbasis.
Ich meine mich daran zu erinnern dass frühere GPT Iterationen Reddit nutzten um Artikel vorzufiltern. Alle verlinkten Artikel mit einer bestimmten Anzahl Likes (ich glaube 3?) wurden gescraped und ins Modell verramscht. Ich weiß gar nicht, ob Kommentare überhaupt genutzt wurden.
Welche Daten Löscher Programme gab es nochmal für reddit?
https://github.com/j0be/PowerDeleteSuite
Den hab ich damals genutzt.
Das wird noch spannend und eine erneute Löschwelle auslösen - es blutet mir das Herz, wenn ich an das dadurch verlorene Wissen denke, nur weil die Vollkoffer (f* u/spez) den Laden an die Börse bringen müssen.
Gerade an diese verkappten Neureichen AI Hipsterbuden das Ganze abgeben, die am liebsten eh auf alle Gesetze scheissen würden, um ihr Geschäftsmodell durchzudrücken (openai & deren Aussage zum Urheberrecht).
Oida. Das hat meine ohnehin schon schlechte Laune NOCHMAL verschlechtert.
Das gibt dann wohl wieder die nächsten rassistischen Chatbots.