En ny nivå av AI-driven bildanimation
ByteDance – företaget bakom TikTok – har släppt ett AI-verktyg som kan förändra hur vi skapar visuellt innehåll. Deras nya modell, DreamActor-M1, tar ett stillbildsfoto och omvandlar det till en realistisk video med naturliga ansiktsuttryck, kroppsrörelser och lipsynk – helt automatiskt.
Forskarna har byggt tekniken på en ny arkitektur: Diffusion Transformer (DiT). Den kombinerar transformerbaserad AI med bildgenerering i flera steg. Resultatet är animationer som känns förvånansvärt verklighetstrogna – särskilt med tanke på att de utgår från en enda bild.
Hur fungerar DreamActor-M1?
AI-modell med hybridkontroll
DreamActor-M1 använder en kombination av tre tekniker som arbetar tillsammans:
- Implicit ansiktsrepresentation – fångar uttryck och personlighet
- 3D-huvudmodellering – ger mer naturliga rörelser
- Kroppsskelett (pose estimation) – styr kroppen i takt med ansiktet
Tack vare det här kan modellen animera både porträtt och helkroppsbilder – utan att tappa det som gör bilden unik.
Funktioner som sticker ut
Det som gör DreamActor-M1 intressant är kombinationen av bredd och precision. Här är några av funktionerna:
- Porträttanimation: livfulla ansiktsuttryck
- Full rörelseöverföring: ansikte och kropp synkroniseras smidigt
- Lipsynk: stöd för flera språk
- Formanpassning: exempelvis för benlängd och huvudlutning
- Multi-skala-stöd: fungerar för både närbilder och helkroppsbilder
Just därför passar verktyget både inom film och sociala medier – men också i utbildning, marknadsföring och virtuella miljöer. Det gör att fler kan skapa engagerande innehåll, utan att ha tillgång till ett helt produktionsbolag.
Etiska notiser och tekniska begränsningar
Även om tekniken imponerar finns några saker att ha i åtanke.
ByteDance har valt att inte avslöja vilka datasets de använt för att träna modellen. Det har i sin tur väckt frågor om dataskydd och samtycke – särskilt med tanke på risken för deepfake-missbruk.
Samtidigt har oberoende aktörer ännu inte verifierat hur modellen fungerar i praktiken, till exempel vid variationer i kroppstyper, ansiktsdrag och rörelsemönster. De interna testerna visar lovande resultat, men verkligheten är ofta mer komplex.
En ny standard för bildanimation?
DreamActor-M1 är inte bara ett intressant forskningsprojekt – det visar också hur snabbt AI-verktyg blir mer kraftfulla och lättillgängliga. Tänk att kunna animera ett foto till en trovärdig video, utan skådespelare eller redigerare i ryggen.
Vi följer utvecklingen – vill du läsa mer om nya AI-verktyg?
Här på Techies kan du också läsa mer om andra spännande AI-verktyg – till exempel:
- Cursor AI – smartare kod med AI som förstår dig
- Meta Hypernova – nästa generations smarta glasögon
- Hi3DGen – AI som skapar 3D-modeller från en enda bild