Enligt The New York Times har både OpenAI och Google använt sig av transkriptioner av YouTube-videor för att träna sina AI-modeller. Detta kan möjligen utgöra ett brott mot upphovsrätten för YouTube-skapare. Rapporten pekar på att företagen har strävat efter att maximera mängden data som de kan mata till sina AI genom att använda text från YouTube-videor. Detta kommer bara några dagar efter att YouTube:s VD Neal Mohan uttryckte oro över OpenAIs påstådda användning av YouTube-videor för att träna sin nya text-till-video-generator, Sora.
ANNONS:
OpenAI och Google förnekar:
Enligt rapporten använde OpenAI sin Whisper-taligenkänningsverktyg för att transkribera över en miljon timmar av YouTube-videor, vilka sedan användes för att träna GPT-4. Googles talesperson Matt Bryant informerade NYT om att ”oauktoriserad insamling eller nedladdning av YouTube-innehåll” inte är tillåtet enligt Googles regler och att företaget inte var medvetet om OpenAIs användning av sådant innehåll.
Google förnekar brott:
Enligt Google används endast videor från skapare som har godkänt detta för att träna deras egna AI-modeller. De har dock genomfört ändringar i sin integritetspolicy för att täcka användningen av allmänt tillgängligt innehåll, inklusive Google Dokument och Google Sheets, för att träna sina AI-modeller och produkter. Dessa ändringar gjordes för tydlighetens skull och tillägget av ”Bard” som exempel på användningsområden publicerades i juli.
ANNONS:
Rapporten lyfter fram potentiella överträdelser av upphovsrätten från OpenAI och Google när de använder YouTube-videor för att träna sina AI-modeller. Diskussionen kring användningen av offentligt tillgängligt innehåll för AI-träning kommer sannolikt att fortsätta och kan ha långtgående konsekvenser för framtidens AI-utveckling och upphovsrättslagstiftning.