Cada cop que obres X o LinkedIn, hi ha un nou vídeo que sembla fet per Pixar, però generat amb IA. És evident: la generació de vídeo està entrant en una fase explosiva, amb quatre grans noms en joc. Cadascun amb els seus punts forts, les seves limitacions i el seu públic.
Però si et preguntes: quina eina de vídeo generatiu d’IA m’haig de mirar ara mateix? Avui intento respondre-ho, comparant les opcions més populars i, sobretot, aterrant-ho en usos reals. Perquè darrere dels vídeos virals, hi ha eines pensades per fer feina concreta.
Els contendents: qui són els 4 grans?
1. Veo (Google DeepMind) És el més recent en aparèixer públicament i, ara per ara, el que genera millor qualitat visual i coherència temporal. Està integrat a VideoFX, amb accés restringit, però la comunitat ja l’ha batejat com el primer model de vídeo realment usable per a creadors.
2. Sora (OpenAI) El model més viral, però també el més misteriós. OpenAI ha publicat clips espectaculars, però Sora encara no està obert al públic general, nomes pels plans ChatGPT Plus i ChatGPT Pro. Els vídeos mostren una capacitat impressionant per simular física, càmeres i estètica de cinema. Però caldrà veure com es comporta quan el posem a prova.
3. Runway Gen-3 Potser la millor opció ara mateix per usuaris reals. Està disponible a la plataforma Runway, amb preus clars i generació relativament ràpida. El nou model Gen-3 millora molt la fluïdesa i permet crear continguts útils per xarxes, storyboards o prototips visuals.
4. Kling (Tencent) És el model més avançat desenvolupat a la Xina, i ha generat força enrenou per la seva capacitat de generar clips realistes amb moviments de càmera complexos i coherència d’escenes. No està disponible globalment encara, però ja marca el ritme al mercat asiàtic.
Comparativa pràctica: què pots fer amb cadascun?
Model |
|
Qualitat vídeo |
Durada màxima |
Coherència temporal |
Estils visuals |
Públic ideal |
---|---|---|---|---|---|---|
Veo |
|
5/5 |
Fins a 1 minut |
Excel·lent |
Molt bons |
Creatius i guionistes |
Sora |
|
5/5 |
Fins a 1 minut |
Excel·lent |
Cinemàtic |
Demostracions i recerca |
Runway |
|
3/5 |
Fins a 18s |
Bona |
Variats |
Creadors de contingut |
Kling |
|
4/5 |
Fins a 2 minuts |
Molt bona |
Realista |
Productors visuals |
Quan escollir cada model?
- Si vols començar a fer proves ja: Runway és la millor porta d’entrada.
- Si tens accés a VideoFX: Veo és espectacular per crear clips narratius i visuals de qualitat.
- Si busques inspiració futurista: Els vídeos de Sora són una visió del que vindrà.
- Si estàs treballant en mercat asiàtic: Kling val molt la pena explorar-lo (si hi tens accés).
El futur: cap a un llenguatge audiovisual IA
Una de les reflexions clau que ens deixa aquest panorama és que no estem només davant de models competidors, sinó davant d’un nou llenguatge. Ja no es tracta de “fer vídeos automàticament”, sinó de pensar com explicar històries, emocions o idees usant eines que generen vídeo com qui escriu.
Amb això a la mà, guionistes, creatius, educadors, gent de marketing o dissenyadors de producte poden convertir idees en audiovisuals en qüestió de minuts. Però també caldrà formar-se, experimentar i repensar els rols clàssics del sector audiovisual.
Amb aquest article tanquem la trilogia dedicada al vídeo generat per IA. Hem vist com ha evolucionat la tecnologia, com usar les eines que lideren el moment, i com triar segons les teves necessitats. Però això només comença. En pocs mesos veurem eines noves, funcionalitats millorades i potser, fins i tot, una nova manera de fer cinema.
Ens llegim a la propera sèrie.