6 januari 2023

KRÖNIKA: 2023 – året för AI

Daniel Johansson inleder 2023 med att blicka framåt, och konstaterar att de största förändringarna för musikbranschen troligen fortfarande ligger framför oss.

(English version here)

Det blev lite annorlunda helger för mig i år. Det blev sjukstuga helt enkelt. Trots tre vaccinationer fick jag en dunderomgång med covid-19. Därav en något försenad nyårskrönika, som mer blir ett slags framåtblickande.

Om det är något som kommer forma 2023 så är det nyheter och diskussioner kring hur AI påverkar såväl musikens område som andra kulturområden.

Under 2022 gick det nog upp ett ljus för alla som inte riktigt förstått kraften i AI tidigare, när OpenAI släppte ChatGPT, och bildgeneratorer av typen Midjourney, DALL·E 2 och Stable Diffusion nådde nya konstnärliga höjder.

(Bilden till artikeln är autogenererad på Stable Diffusion med ”human robot in a concert with guitar”)

Även om en del kanske uppfattar det som att det händer ”över en natt”, är det här naturligtvis en successiv utveckling som pågått under många år, inte minst på musikens område.

Under de senaste tio åren har vi för varje år som gått sett en markant förbättring i hur programvaror kan autogenerera musik, något som jag skrivit många gånger om tidigare här på MI.

Men det är nu AI händer på riktigt.

Google kallar till krismöten när sökvolymerna går ned, människor går snabbt över till att fråga ChatGPT istället för att googla efter sina recept, sjukdomar, tips, frågor och funderingar. Minskad sökvolym innebär naturligtvis minskade intäkter.

Hela den globala skolvärlden befinner sig i spinn kring hur man ska kunna hantera och identifiera unik högkvalitativ akademisk text som skapas genom OpenAI. På mitt lärosäte har vi redan börjat införa fler salstentor utan hjälpmedel som ett resultat.

Utvecklarvärlden frågar sig om programmerare nu kommer bli överflödiga, ChatGPT är bättre än de flesta programmerare på att lösa avancerade koduppgifter, liksom många andra yrken där AI utan tvekan skulle kunna vara mycket snabbare och bättre än oss människor att lösa uppgifter.

På de olika utbildningar jag är knuten till har jag ganska länge haft föreläsningar om hur AI kommer förändra musikbranschen. Om det av en händelse skulle råka finnas gamla studenter som läser det här: Det är nu det händer! Gör nu precis som vi har sagt! 🙂

OpenAI Jukebox visade vägen för några år sedan, något som jag skrev om här på MI år 2020: https://openai.com/blog/jukebox/

Ett bra exempel är hur OpenAI genererar Nirvana-låtar:

Generating songs in the style of Nirvana (OpenAI Jukebox)

För några veckor sedan släpptes www.riffusion.com, som likt Midjourneys och Stable Diffusions bildgenerering autogenererar musik. Även om kvaliteten i nuläget är begränsad, visar den vart vi troligen kommer vara om bara några år (givet samma utvecklingstakt som vi sett inom bilder och text).

Testa t.ex: ”Create a Zara Larsson jazzy song with church bells and piano”, eller skriv in ett artistnamn, eller genre, eller vad som helst annat.

Bakgrundsmusik och musik till filmer, reklam, YouTube osv kommer påverkas radikalt när vi med några enkla befallningar kan autogenerera högkvalitativ musik grundat på olika genrer och artister. Istället för att välja spellistan ”Soft Dinner Music”, skulle min beställning till en kommande iteration av Riffusion kunna vara:

”Create an endless loop of new soft jazz songs that sounds like Bo Kaspers Orkester, but with Fred Astaire vocals, and Amy Winehouse and Monica Zetterlund in the background.”

Eller, med hjälp av OpenAI Jukebox:

”Create 50 new Pearl Jam tracks with an ABBA disco beat and Max Martin production sound”.

I oktober 2022 gick amerikanska branschorganisationen RIAA ut och varnade för den nya generationen AI-verktyg. Man skrev då bl.a. följande:

”There are online services that, purportedly using artificial intelligence (AI), extract, or rather, copy, the vocals, instrumentals, or some portion of the instrumentals from a sound recording, and/or generate, master or remix a recording to be very similar to or almost as good as reference tracks by selected, well known sound recording artists.”

Nivån på AI-skapad deepfake-musik har på bara ett par år blivit oerhört mycket bättre. Här ett par exempel:

Travis Bott (Travis Scott)

Eminem Deepfake Song

Nivån på musiken som skapas till AI-versionen av Eurovision håller hög kvalitet:

– Eurovision 2020 AI song contest champion: Beautiful The World

Och så min favorit:

– A Eurovision song created by Artificial Intelligence: Blue Jeans and Bloody Tears

Musik är ett tacksamt område för alla som jobbar med AI-utveckling. Den är matematisk, strukturerad och följer ett visst antal regler. När det nu även är möjligt att syntetisera sångröster, som kan låta precis som Elvis Presley eller Whitney Houston eller Freddie Mercury, kommer vi troligen se tusentals nya låtar släppas med deras, och alla andra artisters, röster. Eller snarare, AI-tekniken kommer kunna skapa våra personliga soundtracks, med våra favoritartisters röster eller sound, men AI som skapar musiken.

Hur kommer det här påverka musikbranschen?

Naturligtvis kommer krav på uppdaterad upphovsrättslagstiftning intensifieras.

Idag har du inte upphovsrätt på soundet av din röst, upphovsrätten omfattar ju huvudsakligen melodi, text, originalitet i själva det musikaliska, och din röst är inte ett resultat av mänsklig kreativitet som mynnat ut i något konstnärligt, snarare en kombination av gener och träning. Och det kan man varken skydda upphovsrättsligt eller patenträttsligt.

Jay-Z försökte få bort deepfakes från YouTube, men misslyckades, eftersom deepfakes inte är intrång i upphovsrätten.

Eller? Finns det ett behov av att utöka skyddet för uttryckssätt som är unika?

Jag tror att det här är en mycket större fråga än enbart musik. Det handlar om det största skifte människan har gått igenom på lång tid, troligen större än vad hela den digitala informationsteknologin inneburit hittills, och kommer kräva mycket större juridiska uppdateringar än enbart för upphovsrätten.

Skiftet kommer att påverka hur vi ser på kreativitet i stort, vad som är unikt mänskligt, och jag tror människans självbild kommer få sig en rejäl törn på vägen. Det som vi tidigare geniförklarat, avgudat och dyrkat, kan mycket väl blekna när AI blir bättre än oss på det mesta.

”Create a 24 hour long guitar solo in the style of Yngwie Malmsteen”

Jag sticker ut hakan och säger samma sak som jag sagt många gånger tidigare: Det är klart AI kommer bli bättre än människan på att skapa musik, litteratur, konst, filmer osv. Det är bara en fråga om tid.

Jag ser fram emot Midjourney Movies år 2033, när jag kan skriva:

”Generate five 94 minute long science fiction movies based on the book Perelandra with Stellan Skarsgård, Tom Cruise and Ingrid Bergman as the main actors. Include elements of outer space, technology from the 1900s, and a bottle of whiskey. Include my Google Chrome history of all science articles I have read.”

För några år sedan hade jag ett längre samtal med Imogen Heap kring AI och ny teknik, som resulterade i den här artikeln, som jag fortfarande tycker är läsvärd eftersom hon ger perspektiv på utvecklingen: http://www.musikindustrin.se/2018/09/12/imogen-heap-i-exklusiv-mi-intervju/

MEN, bara för att våra apparater blir bättre än oss på att göra saker, betyder det inte att vi slutar göra det. Bara för att datorer har varit bättre än oss på schack i över 25 års tid, har vi inte slutat spela schack. Bara för att AI är bättre än oss på att skapa abstrakt konst, betyder det inte att vi slutar måla och teckna.

Samma sak med musiken.

Bara för att AI kommer kunna skapa miljoner och åter miljoner nya högkvalitativa låtar, betyder det inte att vi kommer sluta skapa musik, eller sluta värdera människoskapad musik.

För vissa områden kommer dock AI få enorm betydelse. För produktionsmusik, synkronisering, bakgrundsmusik, ser vi redan hur AI utmanar, med tjänster som AIVA, Endel, Amper Music, Googles AudioLM m.fl. När de här verktygen har blivit så bra att de motsvarar kvaliteten på texten som ChatGPT genererar, ja då har vi troligen direkta konkurrenter till den funktionella musiken och spellistorna på streamingtjänsterna som används.

Självklart finns det ett potentiellt riktigt dystert möjligt scenario, på lång sikt, att AI-tekniken skulle kunna göra att själva kulturartefakten ”inspelad musik” tappar i värde.

Om jag huvudsakligen använder musik i bakgrunden när jag städar, lagar middag, mediterar, springer, har fest, eller andra vanliga mänskliga aktiviteter, är det full möjligt att framtidens gratis AI-verktyg direkt konkurrerar med nuvarande streamingtjänster.

Varför ska jag betala 109 kronor i månaden till Spotify, när jag kan få högkvalitativ bakgrundsmusik från en AI-app gratis? Med mina favoritartister och mina favoritgenrer i mängder av ny musik som passar mig perfekt, och som anpassas efter olika omständigheter som t.ex. Björks AI-projekt tillsammans med Microsoft?

Här tror jag det är enormt viktigt att musikbranschen och de befintliga streamingplattformarna redan nu börjar se över hur affärsmodeller och skydd ska se ut för den här sortens tjänster och produkter, och inte försöker stoppa utvecklingen. Det är självklart att vi om något årtionde bör ha AI-generering av personligt anpassad musik integrerad på streamingtjänsterna, ungefär som en extra radiofunktion.

Det var forskarna, teknikerna och nördarna som utvecklade grunden till den digitala distributionen av musik, som skapade möjligheten till fildelning och digital konsumtion. Man kan bara hoppas att branschen har lärt sig av den historien, och istället för att försöka stoppa utvecklingen se till att snabbt som attan infylka funktionerna i den etablerade upphovsrättsliga ekonomin.

Så småningom är jag övertygad om att vi kommer hitta en balans i samspelet mellan AI och mänsklig kreativitet, framför allt när teknologin växer samman med oss fysiologiskt om några årtionden.

Kom ihåg vad Larry Page, en av grundarna av Google, sade redan 2004 om potentiella tillämpningar av tekniken:

”On the more exciting front, you can imagine your brain being augmented by Google. For example you think about something and your cell phone could whisper the answer into your ear.”

Men till en början tror jag ändå det kommer bli ett slags ”krig”, som vi hade i början av 00-talet kring den illegala fildelningen. Vi kommer se nya AI-verktyg och plattformar som kommer bli stämda och utmanade av branschen, samtidigt som lagstiftningarna sakta men säkert kommer att anpassa sig med nya regelverk.

2023 skulle mycket väl kunna bli början på det här ”kriget”.

Det är först när tillämpningarna finns på plats, som t.ex. ChatGPT och Midjourney, som samhället och människor börjar förstå, känna sig hotade, och anpassar sig.

Är det därför inte dags för den svenska regeringen att omgående kratta manegen genom en ny statlig utredning som ser över hur AI påverkar kulturbranscherna och upphovsrätten?

Jag tycker det.

Tills dess kan ni botanisera i lite AI-musik som jag samlat på en YouTube-spellista: Songs Created by AI (Artificial Intelligence)

Gott nytt år!

Daniel Johansson
daniel@musikindustrin.se