Automatisoitua luovuutta – Tekoälyn hyödyntäminen kuvituksissa

Jaakko Seppälä

KIRJOITTAJA
Jaakko Seppälä
Creative Director, Partner

”Portrait of an illustrator unsure what’s going to happen next.” Napautan enteriä. Muutamassa sekunnissa tietokoneen ruudulle rakentuu neljä kuvaa, joista valitsen yhden tämän kirjoituksen pääkuvaksi. Kuva on uniikki eikä sitä ollut olemassa vielä minuutti sitten – sitä ei ole haettu kuvapankista tai Googlesta. Mistä oikein on kyse? 

Generatiivinen tekoäly (tekoälysovellus, joka pystyy luomaan ihmisen pyynnöstä uusia sisältöjä, kuten tekstiä, kuvia ja videoita) on ollut monilla toimialoilla yksi viime aikojen kuumimmista puheenaiheista. Tiedetään, että tekoäly tulee mullistamaan monet arkiset työtehtävät, mutta samaan aikaan ei olla vielä varmoja siitä, miten se tulee sen tekemään. Tulevatko jotkut työtehtävät katoamaan ja siirtymään tekoälyn tehtäviksi, vai jääkö AI ihmistyöntekijän ulkoistetuksi tukiälyksi? Ja mitkä tehtävät ovat uhattuina? Valjastammeko väsymättömät koneaivot hoitamaan vain tylsät, toistuvat ja aikaa vievät työt, joita emme itse välitäkään tehdä, vai voisiko siitä olla auttamaan myös luovan alan projekteissa, jotka on perinteisesti ajateltu kuuluvan vain ihmisille? Ja haluammeko edes AI:n korvaavan meitä kaikissa työtehtävissä? Nämä kysymykset eivät ole yksinkertaisia, mutta teknologian kehittyessä päätähuimaavaa vauhtia myös luovilla aloilla toimivien ammattilaisten on aika miettiä niitä.  

Tässä kirjoituksessa pohditaan tekoälyn hyödyntämistä kuvitustyössä. CGI-grafiikkaa (computer-generated imagery) eli tietokoneella tuotettuja kuvituksia on ollut olemassa jo kymmeniä vuosia, mutta aiemmin niiden luominen on vaatinut asiaan perehtyneen ammattilaisen työpanoksen. Nyt tilanne on muuttunut ja AI-generaattorit ovat kaikkien saatavilla. Samaan aikaan koneälyllä luotujen kuvien laatu on kehittynyt huomattavasti, ja AI onkin jo tullut yhdeksi työkaluksi monen visuaalisen alan ammattilaisen pakkiin. Uudet palvelut herättävät kuitenkin myös huolta, ja moni asia niiden käytön suhteen on tässä vaiheessa vielä epäselvää. 

Kuvatekoälysovellusten esiinmarssi 

Verkossa on tällä hetkellä saatavilla vähintäänkin kymmeniä tekoälypohjaisia kuvanmuokkaus- ja -generointipalveluita. Osa ohjelmista keskittyy kuvien hienovaraiseen editointiin, toiset taas pystyvät vaihtamaan sinne syötetyn valokuvan tyyliä tai laajentamaan sitä eri suuntiin kokonaan uudella ja uskottavalla sisällöllä. On myös useita AI-ohjelmia, joissa kuka tahansa pystyy algoritmien avulla taikomaan kuin tyhjästä kokonaisia, täysin ennen näkemättömiä taideteoksia.  

Uusien toimijoiden kehittämien työkalujen esiinmarssi on aktivoinut myös luovan alan ohjelmistojättiläisiä, ja uutta tekoälyteknologiaa integroidaankin kovaa vauhtia mm. Adoben sovelluksiin. Toki Photoshopissa on ollut ”älykkäitä” toimintoja jo pitkään, mutta toukokuussa 2023 julkaistu beta-versio vei nämä ominaisuudet jälleen kerran uudelle tasolle. Entä mihin kaikkeen Adobe Firefly pystyykään? Myös perinteiset kuvapankkiyritykset ovat heränneet heidän liiketoimintaansa uhkaavaan kehitykseen ja ottaneet ai-generoidut kuvat omaan tarjontaansa. 

”Panda tea party.” Tekoälyä on pyydetty lisäämään kuvaan fantastisia ja kaoottisia elementtejä.

Vaikuttavia kuvia yhdellä klikkauksella 

Midjourney on nopeasti kehittynyt ja helppokäyttöinen tekoälypohjainen kuvagenerointiohjelmisto. Ohjelma luo png-kuvia yksinkertaisten tekstipohjaisten syötteiden eli promptien pohjalta. Se tarjoaa käyttäjälleen mahdollisuuden myös muokata ja yhdistellä omia kuvatiedostoja. Midjourneyn lukuisat säädettävät parametrit auttavat käyttäjää luomaan hyvin monipuolisesti erilaisia kuvia, ja sen ulos pulauttamat kuvitukset ja ”valokuvat” ovat ensisilmäyksellä todella vakuuttavia. Parhaimmillaan Midjourney onkin juuri siinä: Se tuottaa muutamissa sekunneissa kuvia, joita syötteen kirjoittaja ei välttämättä olisi pystynyt edes kuvittelemaan – ja jos olisi, hänellä olisi voinut mennä sen toteuttamiseen kymmeniä tunteja.  

Käytännössä oikeasti käyttökelpoisten, vähääkään monimutkaisempien kuvien tuottaminen tekoälyohjelmistolla on kuitenkin usein haastavaa. Juuri tietynlaiseen, toivottuun lopputulokseen pääsemiseksi koneen kanssa pallotteluun on varattava aikaa ja kärsivällisyyttä. Tekoäly ei oikeasti ole älykäs, eikä se osaa lukea ajatuksiamme – se vain tuottaa visuaalisen arvauksensa tekstimuotoisesta promptistamme ymmärtämättä lainkaan kuvan sisältöä tai käyttötarkoitusta. Kuvitusten tekeminen kuvatekoälyllä eroaakin täysin perinteisestä kuvanteon prosessista. Pitkällinenkään iterointi ei välttämättä tuota lopputuloksena kuin turhauttavaa dadaa, vaikka idea kuvituksen toimeksiantajan mielessä olisi kristallinkirkas.  

”Pencil drawing of a human merging with a computer.” Midjourney luo käyttäjän tekstisyötteestä ensin neljä erilaista näkemystä. Tekoäly ottaa tekstin tulkinnassa hyvin paljon vapauksia, ja sama syöte antaakin joka kerta erilaiset tulokset. Mitä yksityiskohtaisempi syöte, sitä todennäköisemmin tekoäly epäonnistuu kuvaamaan sitä tarkasti.

Tekoäly kuvantekijän palveluksessa 

Vaikka kuvantekijöille suunnatuissa AI-palveluissa on vielä puutteita ja ne ovat osittain vielä kehitysasteella, tietynlaisissa tehtävissä niistä voi olla kuvittajalle jo nyt kiistatonta hyötyä. Tässä muutama esimerkki:

  • Tekoäly voi toimia kuvittajalle luovuuden tukena. Kuten ChatGPT kirjoittajalle, Midjourney on visuaaliselle suunnittelijalle oiva sparrauskumppani. Vaikka tekoäly ei aina pystyisikään synnyttämään täysin valmiita kuvituselementtejä, se pystyy tuottamaan ihmisen raakilemaisesta ideasta nopeasti useita luonnoksia. Nämä tuotokset voivat herättää ihmissuunnittelijassa taas uusia, jalostuneempia ideoita. Tekoäly voi ruokkia inspiraatiota ja tarjota uusia näkökulmia. Sen avulla voi luoda luonnoksia liikemerkeistä ja konseptikuvia esimerkiksi hahmosuunnittelua tai tilavisualisointeja varten. 
”Evil pineapple man, character model sheet.” Hahmosuunnittelua AI:n toimesta.
  • AI voi nopeuttaa kuvitusten tuotantoprosessia. Perinteisesti kuvituksen luominen voi viedä paljon aikaa, mutta käyttämällä tekoälyä luovana avustajana tätä prosessia voidaan tehostaa. Tekoäly voi tarjota ehdotuksia tai luoda valmiita kuvaelementtejä, joita kuvittaja voi muokata ja sovittaa projektinsa tarpeisiin. Aikaa säästyy, ja kuvittaja voi keskittää luovan energiansa kokonaiskuvan suunnittelemiseen. 
”Planet soup, pixel art.” Tämäkin kuva syntyi n. 50 sekunnissa, ideasta toteutukseen. Pienenkin muutoksen tekeminen kuvaan on kuitenkin hankalaa.
  • Generatiivinen tekoäly auttaa kuvittajaa luomaan kuvia uusilla tyyleillä, joita hän ei muilla työvälineillä pystyisi tekemään. Tämä on tekoälyohjelmistojen ominaisuus, joka on saanut paljon huomiota heti näiden palvelujen tultua markkinoille. Tekisinkö kuvan kuin Dalí? Vai sopisiko tähän paremmin 8-bittinen pikselitaide, akvarelli, graffiti tai origami? Tai miksei vaikka jotain anakronistista prerafaeliittien tyylillä? Rajattomalla tyylivalikoimalla on hauska leikkiä, mutta sen taustalla on myös omat ongelmansa ja eettiset kysymyksensä, joihin palaamme myöhemmin. 
”Sad unicorn”. Sama aihe neljällä eri tyylillä (ukiyo-e, paper quilling, manga, playdough).

On helppo keksiä paljon muitakin käyttötarkoituksia tekoälyn synnyttämille kuville. Kuukissa AI:n visuaalista osaamista on hyödynnetty mm. kuvapintojen automaattiseen laajentamiseen ja presentaatioiden rikastamiseen nopeilla, uniikeilla kuvituksilla. Tekoälyn avulla voi luoda myös saumattomia tekstuurikuvia 3D-mallinnusten tarpeisiin, tai vaikkapa taustoja muilla tekniikoilla tehtyjen kuvitusten osaksi. 

Älytön tekoäly 

Kuten todettua, tekoälysovelluksilla voi synnyttää hetkessä täysin uskomattomalta tuntuvia tuloksia. Usein kuitenkin ihmisestä triviaalilta tuntuvan toiveen visualisointi tuottaa neuroverkoille jopa ylitsepääsemättömiä ongelmia. Koska kone ei pysty ymmärtämään mitä se tekee, vaan ainoastaan laskee todennäköisiä pikseliyhdistelmiä, se tulee tuottaneeksi myös hyvin omituisia ja jopa häiritseviä sommitelmia. Paljon huomiota on saanut mm. tekoälysovellusten vaikeus piirtää ihmisille oikeaa määrää sormia tai hampaita.  

”Woman surprised by her own hand”. Käsien generointi on ollut tekoälylle hankalaa, mutta tässäkin suhteessa tekniikka kehittyy koko ajan.

Myös generoitujen kuvien muokkaaminen voi osoittautua hankalaksi. AI:n kanssa ei voi käyttää samaa työskentelytapaa, johon ihmiset ovat tottuneet toistensa kanssa. Kaupallisissa kuvituksissa lopputulos syntyy yhdistelmänä yritysten tarpeista, asiakkaan ja kuvittajan välisistä keskusteluista ja tiettyyn ennakko-odotukseen kuvittajan tyylistä. Ainakaan toistaiseksi kuvituskoneet eivät toimi näin. Konetta ei ohjata pikseli pikseliltä vaan sen annetaan tehdä ehdotuksia, kokeilla ja epäonnistua kerta toisensa jälkeen. Briiffin mukaiseen lopputulokseen ei välttämättä koskaan päästä, vaan on tyydyttävä visuaalisesti näyttävään, mutta ei täysin alkuperäisiä toiveita vastaavaan kompromissiin. 

Huolestuneet kuvittajat 

Kuvittajat ry:n tuoreen tutkimusten mukaan valtaosa ammattikuvittajista on tällä hetkellä huolissaan tekoälyn kehityksestä. Huoli kiteytyy kahteen vakavaan asiaan: Töiden vähenemiseen ja tekijänoikeuksiin. 

Kukaan ei tällä hetkellä tiedä, millaiseen tulevaisuuteen tekoälyn kehitys tulee johtamaan. Jos kuka tahansa voi omalla selaimellaan luoda millaisen kuvan (tai videon) tahansa, mikä tulee olemaan kuvittajan rooli? Visuaalisen alan ammattilaisia tarvitaan epäilemättä jatkossakin, mutta näiden ammattilaisten tarvitsemat taidot ovat todennäköisesti hyvin erilaisia kuin tämän päivän tekijöillä. Teollistumisen alkuajoista ja Kehruu-Jennystä lähtien teknologian kehitys on vienyt työpaikkoja monilta käsityöläisaloilta. Käykö niin nytkin?   

On myös tärkeää ymmärtää, että tekoälyn tuottamat kauniit kuvat ja lukuisat eri tyylit eivät synny tyhjästä. Neuroverkot pystyvät yhdistelemään pikseleitä ihmisen silmää miellyttävällä tavalla vain siksi, että niiden oppimateriaaliksi on syötetty ihmisten tekemiä kuvia. Tekoäly tarvitsee ravinnokseen oikeiden taiteilijoiden teoksia. Ihminen on tehnyt kuvia yli 40 000 vuotta. Käytännössä kaikki kuvittajien, taiteilijoiden, valokuvaajien ja muiden käsityöläisten luomukset on nyt mahdollista digitoida ja syöttää AI:n mutusteltavaksi. Ammattikuvittajat haluavat ymmärrettävästi varjella omaa tyyliään, ja tekijänoikeuksien suojelemiseksi useat taiteilijat ovatkin jo pyytäneet tekoälypalveluita poistamaan koneidensa oppimateriaaleista omat teoksensa. Koska ala kehittyy niin kovaa vauhtia, on vaikea ennustaa, millaisia sääntelyjä ja tekijänoikeussäädöksiä kuvantekijöiden oikeuksien turvaamiseksi voidaan tulevaisuudessa asettaa. 

”Robot in the style of Joan Miró”. Kuvan visuaalista tyyliä ei ole luonut tekoäly eikä promptin kirjoittanut ihminen.

Mitä seuraavaksi? 

Vanhan viisauden mukaan ennustaminen on vaikeaa – erityisesti tulevaisuuden ennustaminen.  Näyttää todennäköiseltä, että kieltä ymmärtävät ja oppivat kuvituskoneet yleistyvät, jatkavat tuotoksiensa laadun parantamista ja tulevat jatkossa osaksi yhä useamman markkinoijan ohjelmistoarsenaalia. Tekoälyllä luodut kuvat ovat tulleet jäädäkseen, mutta samalla haluan uskoa, että inhimillinen luovuus ja taiteellinen näkemys ovat tulevaisuudessakin sellaista kauppatavaraa, jota ihmiset haluavat ostaa nimenomaan toisilta ihmisiltä. Kuvittajan näkökulmasta pidän myös selvänä, että ihmisen sisäsyntyinen tarve luoda kuvia ei tule häviämään. 

Kuvittajan työ muuttuu, kuten se on muuttunut monta kertaa aiemminkin teknologian kehittyessä. Nyt käsillä oleva muutos tuntuu kuitenkin suuremmalta kuin koskaan ennen. Me Kuukissa suhtaudumme uusien työkalujen kehittymiseen mielenkiinnolla, mutta niiden haasteet ja eettiset ongelmat ymmärtäen. 

Ota yhteyttä

Autamme kartoittamaan projektin lähtökohdat, tarpeet ja tavoitteet tarjouksen taustatiedoksi.

Yhteystiedot

Jaakko Seppälä

Creative Director, Partner
+358 50 412 4065
jaakko.seppala@kuuki.fi

Jaakko Seppälä

Timo Puolakka

Art Director, Founding Partner
+358 40 706 8077
timo.puolakka@kuuki.fi

Timo Puolakka
Ota yhteyttä