Opettelin editoimaan videoita samoihin aikoihin kun käynnistin kirjallisen urani eli reilu kymmenen vuotta sitten. Ajatuksenani oli, että videot voisivat toimia eräänlaisina houkutuslintuina, joiden kautta ihmiset saattaisivat innostua tutustumaan ensimmäisen kirjani sisältöön. Alkuunsa editoin vain lyhyempiä videoita ja sitten siirryin myös pidempiin videoihin. Noin neljä vuotta sitten aloin hyödyntää enemmän tekoälyä videoideni editoinnissa ja liitin niihin mukaan mm. tekoälyllä luodun kertojaäänen. Tätä aikaisemmin teknologia ei sitä edes mahdollistanut tai saatavilla olevat synteettiset lukijat olivat yhä korvia ärsyttävän metallisia ja monotoonisia. Ensimmäinen tällainen luonnollisella kertojaäänellä varustettu videoni oli lokakuussa 2020 julkaisemani Manaajan varoitus pian ilmestyvästä Antikristuksesta ja hänen globaalista ilmastovallankumouksestaan!
Kaiken muun osalta videoideni editointityö on ollut kuitenkin pikkutarkkaa käsityötä. Eli kirjoitan itse videoideni narratoijan repliikit, etsin taustalle sopivaa taustamusiikkia elävöittämään kerrontaa, lisään visuaaliset elementit kuten arkistokuvaa (video- tai still-kuvaa kuten uutisotsikoita), joiden tulisi liittyä yleensä kertojan puheenaiheisiin, tai olla jollain tapaa synkroniassa esim. taustamusiikin kanssa (elokuvien trailereissa yleinen tehokeino), ja lisään muut efektit kuten usein käytetyn asteittaisen zoomauksen. Kuvat ja videot eivät saisi vaihtua liian töksähtävästi kuin valkokankaan diakuvat ja siksi editoijan tulee valita myös siirtymätekniikka millä yksi kuva tai video vaihtuu toiseen (itse olen suosinut yleensä vähiten häiritsevää häivytysefektiä). Yksinkertaisissa ja edullisissa editointiohjelmissa nuo toiminnot ovat yleensä automatisoituja, joten häivytystä ei tarvitse tehdä itse.
Eniten aikaa koko prosessissa on vienyt yleensä taustamusiikin ja arkistokuvien/ -videoiden etsiminen maksullisilta palveluilta kuten Storyblocks ja vastaavat. Puolituntiseen videoon joutuu nimittäin lisäämään aika monta kappaletta ja videopätkää puheena oleviin aiheisiin. Lisäksi materiaalia täytyy etsiä usein myös YouTube videoista. Esimerkiksi parin sekunnin kuvamateriaaliin joudut lataamaan joskus tunnin mittaisen YouTube videon ja pian kiintolevy on niin täynnä, että koneesi ylikuumenee ja “tilttaa” eikä mikään toimi enää kunnolla (onneksi keskeneräinen työ tallentuu yleensä automaattisesti vaikka ohjelmisto kaatuisikin). Ja aikaa tuohon kaikkeen saattaa tuhlaantua yli 100 tuntia jos kyseessä on yli 20 minuuttinen video.
Ajan ja hermojeni säästämiseksi päätin kokeilla tehdä koko työn tällä kertaa tekoälyn avulla. Palveluissa kuten Invideo.io voit nimittäin kuukausimaksua vastaan panna tekoälyn luomaan videoita perustuen pelkkään saneluusi siitä millaisen videon haluat sen tekevän sinulle. Voit siis generoida videon tekstin, kertojan narratoinnin ja koko muun visuaalisen sisällön yksinkertaisilla toimintokäskyillä. Ja voit myös panna se generoimaan sisältöä millä kielellä tahansa. Mihin sitten ihmistä enää tarvitaan? Palvelua hyödyntäneenä täytyy sanoa, että kyllä siihen tarvitaan yhä ihmistä työn hienosäätöön.
Tekoäly esimerkiksi näyttää lisäävän kerrontaan uuden taustamusiikin jokaisen uuden lauseen alkaessa. Tämä antaa paljon vaihtoehtoja taustamusiikin valinnan suhteen, mutta samalla se tekee siitä melko levottoman kuuloista jos kappale vaihtuu joka viiden sekunnin välein. Tässä kohtaa siis ihminen voi muokata ja hienosäätää tekoälyn työtä. Samoin jos en ole tyytyväinen tekoälyn valitsemaan videokuvaan, palvelu antaa mahdollisuuden etsiä toisen sen tilalle ja korvata sen (kuin myös musiikin suhteen). Samoin myös kertojan tekstiä voi muokata manuaalisesti.
Olin eniten vaikuttunut palvelun kertojien äänistä, jotka eivät ole yhtään sen huonompia kuin isolla rahalla tuotettujen TV-dokumenttien juontajat. Käytin projektissa useampaa ääntä, koska tekoäly näyttää valitsevan ne myös automaattisesti tekstin sisällön perusteella. Ensimmäisen äänen tunnistin BBC:n luontodokumenteista kuuluisan Sir David Attenboroughin ääneksi. Attenborough on itseasiassa pahamaineinen uusmalthusilainen (ihmispopulaation väestönvähennyksen kannattaja), jolla on ollut läheiset suhteet Englannin kuninkaallisiin, jotka myös jakavat hänen ihmisvastaisen filosofiansa. Alun Elon Musk -haastatteluita, ja muuta hienosäätöäni lukuun ottamatta, koko 38 minuuttinen video on siis kokonaan tekoälyn työtä.
Näin pitkän videon manuaaliseen kasaamiseen minulta kuluisi varmaankin 200 tuntia. Tekoälyn avulla suoriuduin hommasta reilussa 20 tunnissa eli kymmenen kertaa nopeammin. Juuri tästä syystä tekoäly tulee johtamaan Elon Muskin kuuluttamaan “runsauden aikakauteen”, koska aika on rahaa ja mitä enemmän ihmiset ja yritykset kykenevät kasvattamaan tuotteita ja palveluita mitä lyhemmässä ajassa, sitä nopeammin myös yhteiskunnan yleinen varallisuus tulee kasvamaan (Itse en tosin tienaa näillä tuotoksillani yhtään mitään). Videon sisältö perustuu samaan tekstiin, jonka julkaisin jo edellisessä blogitekstissäni.
Ajatus siitä, että koneet korvaavat ihmisten ammatit ja tekevät ihmisistä lopulta tarpeettomia, ei ole muuten lainkaan uusi näkökulma. Näin ajateltiin jo 500 vuotta sitten kun Gutenbergin painokone korvasi kirjoja käsin kopioineiden käsityöläisten ammatit. Ainoa ero menneisyyteen nähden on vain se, että koneet voivat tehdä tänään myös suurta kognitiivista älyä ja luovuutta vaativat työt kuten kirjoittamisen, säveltämisen tai videon editoinnin (ja usein jo paremmin ja nopeammin kuin ihmiset). Tästä syystä onkin hyvin epävarmaa mikä rooli ihmiselle jää tekoälyn aikakaudella. No ehkä alapuolinen videoni tarjoaa tuohon kysymykseen joitakin vastauksia.
Leave a comment