Bekannt: Texte und Bilder, die von Software wie ChatGPT oder Midjourney erzeugt wurden, mit Labeln kennzeichnen.
Idee: Warum nicht auch Inhalte, die von Menschen generiert wurden, als solche labeln?
Denn: Es entsteht ein eigener Datensatz, der für das Training interessanter ist als die große Menge an "Rest". Und: Die Auszeichnung läuft bereits erfolgreich in Wikipedia oder bei Captchas. #ChatGPT #Midjourney #Wikipedia #Captchas
@publictorsten so gesehen: jedes verifizierte (c) zu einem Text / Bild erhöht den Wert als Trainingsdaten und ist eine Investition, dass vielleicht mal Bezahlung fürs die Nutzung zum Training fließt.
@klischka
Das machen kommerzielle Anbieter doch bereits recht ausgiebig?
@publictorsten ich denke an uns alle, die tolle Daten in Plattformen kippen