Google vill förvandla din text till bild

Tänk dig en hund i röd tröja och solglasögon som åker skateboard på en strand. Eller ännu bättre, skriv ned det och Googles nya AI-projekt Imagen förvandlar det till en digital bild.

Det är i alla fall grundtanken. Hunden kan lika gärna vara en panda, eller en katt. Skateboarden kan vara en cykel, eller gitarr. Oavsett vad du skriver kan Imagen generera fram en bild på det. Men. Det finns alltid ett men. Projektet är varken banbrytande i sin genre eller tillgängligt för allmänheten ännu.

"Ny nivå"

Att kunna beskriva något och sedan få fram en bild av det har existerat som teknik ett tag och hittills har marknadsledaren varit DALL-E, enligt techsajten The Verge.

Googles intåg på området för dock med sig bolagets ekonomiska muskler och massiva status i techvärlden. Enligt Google självt når AI-projektet "en ny nivå av fotorealism" och tekniken "föredras av människor som får jämföra med andra modeller, exempelvis DALL-E".

En nära förestående framtid där varje tanke kan bli en mening som blir en bild är dock inte trolig. Google skriver själva att projektet har vissa tydliga begränsningar i sin nuvarande utformning. Dels undviker Imagen sådant som är pornografiskt, dels är datan som Imagen använder också känd för att innehålla en skev världsbild.

Snedvriden bild

Något förenklat kan man säga att Imagen hittills använder väldigt stora publika datamängder, bilder som kopplas till textbeskrivningar, som inte tvättats bort från rasistiska stereotyper eller snedvridna könsroller. En text i stil med "en vd med hatt på en fest på en båt" skulle därmed generera en vit man som vd. Människor generellt, beskriver Google, är svårt för Imagen att generera i dagsläget – och de som skapas är nästan uteslutande vita.

Någon tidsaspekt eller ett slutmål för projektet är ännu inte satt, Google skriver endast att de hoppas göra "flera framsteg" i framtiden.

Google vill förvandla din text till bild

Skriv det och Google kommer att visa det är devisen bakom techjättens nya AI-projekt – där skriven text förvandlas till autogenererad bild.