Com utilitzar Veo 3: la porta d’entrada al vídeo generat per IA
Durant mesos, hem anat veient clips espectaculars generats amb IA: paisatges impossibles, càmeres que volen com a Hollywood i personatges que cobren vida amb una simple descripció. Però més enllà de les demos virals, arriba la pregunta que molts ens fem: com es fa, això? I sobretot: per on començo si vull provar-ho?
Si n’hem de triar un, el nom que destaca últimament és clar: Veo 3, el generador de vídeo IA de Google DeepMind. En aquest article t’explico què cal saber per començar a fer-lo servir, què pot fer (i què no), i com treure’n el màxim profit si t’hi vols iniciar.
Què és exactament Veo 3?
Veo és un model generatiu de vídeo entrenat per Google DeepMind capaç de generar clips d’alta qualitat a partir de text. La seva tercera versió (Veo 3), que recentment ha començat a obrir-se a creadors a través de la plataforma VideoFX, incorpora millores molt significatives:
-
Qualitat de vídeo fins a 1080p, amb una fluïdesa de 30 fps
-
Clips de fins a un minut, amb coherència temporal i estabilitat d’escena
-
Capacitat per entendre prompts complexos, com ara “vista de dron sobre un poble mediterrani al capvespre, estil pel·lícula romàntica”
-
Suport per condicions de càmera, estils visuals, i fins i tot indicacions narratives
És, ara mateix, el model obert més avançat disponible per generar vídeo llarg i consistent.
Accedir a Veo 3: on i com?
Es pot accedir a Veo 3 principalment a través de Flow, la interfície de creació de pel·lícules amb IA de Google, i s’integra amb els plans Gemini AI:
- Pla Google AI Pro: Ofereix accés limitat a Veo 3 dins de Flow i un paquet de prova de generacions de vídeo en l’app Gemini.
- Pla Google AI Ultra: Proporciona el major accés a Veo 3, inclosa la generació nativa d’àudio, i els límits de generació mensuals més alts.
Encara que inicialment es va llançar amb disponibilitat principalment als EUA, Google ha anat ampliant la seva disponibilitat a més països, i també és accessible a través de l’app mòbil Gemini.
També hi ha informes de mètodes per a obtenir accés gratuït, encara que és possible que no estiguin oficialment recolzats o garantits. Us poso aqui alguns exemples.
Com escriure un bon prompt per vídeo?
Igual que amb la imatge, el secret de Veo està en saber explicar què vols. Però amb el vídeo, has de pensar en moviment, narrativa i ambientació, no només en objectes visuals.
Aquí tens algunes bones pràctiques que he descobert després d’unes quantes hores de prova:
- Sigues específic amb l’acció i l’escena Exemple: “Un cotxe vintage blanc condueix per una carretera costanera al capvespre, presa aèria, il·luminació cinematogràfica”
- Indica l’angle de càmera o el tipus de pla “Vista en primera persona caminant per un carreró de llum de neó”
- Afegeix l’estil si vols un to concret “Estil d’animació Stop-motion” o “Inspirat en les pel·lícules de Wes Anderson”
- Evita descripcions massa llargues o abstractes És millor dividir en dues frases que fer una parrafada confusa.
Per a què pot servir avui Veo 3?
Encara que no substitueix una producció professional (encara), Veo3 ja és molt útil en aquests escenaris:
- Storyboard ràpid per projectes audiovisuals Per mostrar el look&feel d’una idea abans de rodar.
- Continguts de xarxes socials Clips curts amb efecte wow, perfectes per captar atenció.
- Educació i formació visual Explicar processos, escenes històriques o visualitzar conceptes.
- Creativitat experimental Artistes digitals i creadors poden explorar noves narratives.
Algunes limitacions actuals
Per molt potent que sigui, Veo encara té límits importants:
- No pots controlar exactament el timing o l’edició de cada pla.
- Els personatges són genèrics i no pots repetir-los entre escenes.
- No pots afegir veu o diàleg (de moment).
- Encara no admet prompts multimodals (com vídeo + àudio + text conjuntament).
Tot i això, el progrés respecte a només fa un any és brutal. És qüestió de mesos que moltes d’aquestes limitacions vagin caient.
Un nou llenguatge visual
El que més m’ha impactat de Veo 3 no és tant la qualitat dels clips (que ja és molt alta), sinó la sensació que estem davant d’un nou tipus de llenguatge visual. Un espai on les idees es tradueixen en vídeo a l’instant, sense necessitat d’equips, càmeres o muntatge. Un nou terreny de joc per a la creativitat. Aquesta democratització del vídeo té el potencial de canviar com expliquem històries, com venem productes, com comuniquem visualment. I sí, també planteja debats i riscos que caldrà abordar. Però si et dediques a comunicar, crear o innovar, val la pena començar a jugar amb aquestes eines.
Ara, el següent pas serà analitzar què diferencia Veo dels seus competidors… però això ho deixem per al tercer article!