JOHANSSON: Musikförlagen behöver också agera

De två AI-tjänsterna Suno och Udio har stämts av de största skivbolagen i USA. Daniel Johansson har läst tjänsternas yttranden till domstolarna, och tror att musikförlagen måste göra gemensak sak med masterägarna om det här ska gå väl.

I juni skickade ett antal stora amerikanska skivbolag gemensamt in stämningsansökningar mot AI-tjänsterna Suno och Udio. Stämningsansökan mot Suno lämnades in vid distriktsdomstolen i Massachusetts, medan ansökan mot Udio lämnades in vid distriktsdomstolen i södra New York.

Nu har både Suno och Udio lämnat sina detaljerade yttranden till respektive domstol. Jag har kikat på dem, och svaren är närmast identiska. Inte så konstigt kanske, med tanke på att även stämningsansökningarna är närmast identiska, men svaren visar ändå att företagen bakom tjänsterna har en tät dialog just nu för att försöka slå hål på skivbolagens anklagelser.

Svaromålen börjar med en rad moraliska perspektiv, där de anser att de stora bolagen bara är ute efter att stoppa konkurrens, från vanliga människor, lärare, musiker och musikintresserade, och att deras träning av AI-modellerna inte är ett intrång i upphovsrätten. Inget nytt där, men det som kanske är det mest intressanta är att båda företagen tydligt erkänner att de tränat sina AI-modeller på bolagens musik.

Suno skriver:

”It is no secret that the tens of millions of recordings that Suno’s model was trained on presumably included recordings whose rights are owned by the Plaintiffs in this case. As paragraph 9 of the Complaint itself recognizes, an AI tool designed to generate new instances of creative expression in long-established artistic genres must, in its training phase, have encountered and identified common patterns from prior examples—essentially as many as can be located, many of which Plaintiffs control. Accordingly, Suno’s training data includes essentially all music files of reasonable quality that are accessible on the open Internet, abiding by paywalls, password protections, and the like, combined with similarly available text descriptions.”

Udio skriver:

”The many recordings that Udio’s model was trained on presumably included recordings whose rights are owned by the Plaintiffs in this case. As paragraph 9 of the Complaint itself recognizes, an AI tool designed to generate new instances of creative expression in long established artistic genres must, in its training phase, have encountered and identified common patterns from prior examples. Plaintiffs presumably own the rights, as far as they go, in recordings that embody those patterns.”

Att både Suno och Udio så öppet erkänner att man använt sig av musiken på det här sättet, signalerar att man anser sig ha en så uppenbar rätt att göra det man har gjort att det inte ens är någon mening att hymla med det.

”It is fair use under copyright law to make a copy of a protected work as part of a back-end technological process, invisible to the public, in the service of creating an ultimately non-infringing new product. Congress enacted the first copyright law in this country in 1791. In the 233 years since, no case has ever — not one single time — reached a contrary conclusion. Every single time the question has been presented – and it has been presented over and over and over again — the ultimate conclusion has been that making an “intermediate” copy of a protected work, in the service of generating noninfringing outputs, is permissible, not actionable.”

Det jag tror skulle kunna bli ett problem för musikindustrin i de förmodat kommande rättegångarna, är om bolagen fokuserar allt för mycket på de kopior som Suno och Udio har gjort för att kunna träna modellerna, och att de inte har haft licenser för att skapa dessa kopior. Blir det för mycket tekniskt fokus, tror jag det kan bli svårt för bolagen att försvara sin ståndpunkt.

Samtidigt, ”fair use”-doktrinen har sina begränsningar och det är inte säkert att det går att rättfärdiga den omfattande kopiering av skyddade inspelningar för kommersiell modellträning som det handlar om här, skalan spelar också roll.

Det som jag dock tycker är det centrala här handlar om huruvida den här sortens användande av musiken i sig självt, melodier, texter, röster, musikens essens, behöver godkännande eller inte, inte hur den tekniska processen har gått till. På sikt skulle man kunna träna upp en modell genom streaming, genom att modellen helt enkelt ”lyssnar” på t ex YouTube och skapar detaljerad beskrivande metadata direkt från inspelningarna, och då faller hela argumentet om kopior hur som helst.

Den här sortens användande av musiken har aldrig skett tidigare, eftersom det inte varit tekniskt möjligt. Vad det i grunden handlar om är att försvara principerna för upphovsrätt och rättvisa ersättningar för användning av upphovsrättsskyddad musik, en mycket större fråga än vem som gjorde kopior när var hur.

En jämförelse: Säg att jag skriver en tusensidig bok som detaljerat beskriver varenda liten detalj av en låt, så att vem som helst skulle kunna återskapa den baserat på mina instruktioner. Säg sedan att jag skriver likadana böcker för tiotals miljoner låtar som har släppts genom historien, slänger in alla dessa böcker i ett bibliotek, och hyr in en kompositör med övernaturliga krafter som kan läsa alla tiotals miljoner böcker samtidigt och generera ny musik baserat på all denna information.

När jag sedan ber kompositören ”skapa en glad och positiv låt som man kan dansa till, swedish eurodisco, 1990, manlig sångröst” kan hen gå igenom all denna information, hitta all relevant beskrivning, och på några sekunder generera ny musik som låter precis som sådan musik har låtit tidigare i musikhistorien. Med begränsningen att det inte får låta exakt likadant, det måste vara lite annorlunda, även om det finns en stor risk att rösten kommer låta misstänkt likt Dr Alban eller E-Type.

Om Suno och Udio ville, skulle de kunna öppna upp så att AI-modellen faktiskt återskapar It’s My Life eller This Is The Way till hundra procent. Alla exempel på sångröster som låter som redan existerande inspelade röster handlar just om att tjänsterna har svårt att forma modellerna att vara verkligt kreativa, deras kunskap är endast (än så länge) begränsad till de där tiotals miljoner ”böckerna”.

Den stora frågan anser jag alltså inte handlar om hur den tekniska processen har gått till, hur kopior eventuellt framställts osv, utan om den här sortens helt nya användande av musiken, möjliggjord med den nya tekniken, i den här omfattningen, kräver en licens eller inte.

Kanske är det så att det är musikförlagen och låtskrivarna som har den största chansen att hävda att den här extraheringen, konverteringen, av musikaliska egenskaper till metadata, kräver en licens, eftersom det handlar om beskrivningar av melodier, texter, själva grunden till upphovsrätten.

Precis som den decentraliserade digitala distributionen krävde att ny lagstiftning introduceras, kommer samma sak behövas här. Till skillnad mot det skiftet har AI-musiken ännu inte börjat påverka rättighetshavarnas intäkter, men det är bara en tidsfråga innan det börjar synas i intäkterna till musikförlagen och låtskrivarna när filmproducenter, reklammakare, affärsverksamheter börjar använda sig av royaltyfri AI-musik i stor utsträckning.

Själva grunden till upphovsrätten handlar om att skapa ett ideellt och ekonomiskt skydd för de som skapar musiken, och jag tror det är just musikskaparna och musikförlagen som kommer drabbas först. Därför är det också rimligt att de gör gemensam sak med skivbolagen.

För er som har varit med länge, ni kommer kanske ihåg det s.k. mp3-målet här i Sverige 1999–2001, där en tonåring stod åtalad från skivbolagens sida för att ha tillhandahållit en stor mängd djuplänkar till mp3-filer. Tonåringen blev friad först i Skövde tingsrätt, sedan i Göta hovrätt, och fallet gick även upp till HD som ogillade åtalet och konstaterade att det inte handlade om spridning eller exemplarframställning, utan om offentligt framförande.

STIM uttalade sig då kring Högsta Domstolens beslut: ”Utgången i målet hade med största sannolikhet blivit en annan om Stim varit målsägande.”

Idag hade den sortens länkning troligen kunnat klassas som medhjälp till upphovsrättsintrång, eftersom det sedan 2005 är olagligt att lägga upp mp3-filer på det sättet som då gjordes, men jag nämner det i alla fall som ett exempel på när det kanske var en annan part i branschen som borde ha drivit processen.

Det finns en risk/möjlighet att något av de här fallen går hela vägen upp till den amerikanska högsta domstolen, ett friande i lägre instanser kommer sannolikt leda till överklaganden. Om Supreme Court då skulle fria, är risken att vi får ett prejudikat i USA som sabbar för resten av världen.

Så, personligen tycker jag att NMPA, eller ännu hellre de stora musikförlagen i USA, skulle göra precis samma sak som skivbolagen. Jag är faktiskt lite förvånad över att dessa inte finns med, det borde finnas många fler skarpa argument om t ex både UMG Recordings (skivbolagsdelen) och Universal Music Publishing Group (förlagsdelen) ingick.

Det har säkert diskuterats internt på samtliga bolag (det handlar trots allt om delar av samma koncerner), och det finns kanske skäl till varför man inte gör gemensam sak, men hur som helst tror jag det är viktigt att musikförlagen, eller för den delen ASCAP eller BMI i USA, där båda de här AI-företagen har sin hemvist, inte låter skivbolagen ensamma ta smällen.

Frågan som ska avgöras är alldeles för viktig.

– Sunos svaromål (PDF)
– Udios svaromål (PDF)

Daniel Johansson
daniel@musikindustrin.se