Alors que la course aux armements des modèles de création de contenu textuel se poursuit inlassablement, avec ChatGPT et Claude en tête, de nouveaux acteurs tentent de s’imposer. Le français Mistral, par exemple, et l’aussi récent qu’inattendu Nemotron de Nvidia, qui a GPT 4o dans le collimateur.
Les modèles de création graphique font preuve d’autant de dynamisme, avec l’incontournable (mais un peu fade et daté) Dall-E et Flux 1 Pro qui continue à s’améliorer et repousser les limites artistiques avec sa version 1.1. Ce dernier ferait cependant bien de travailler à une compréhension plus fine des requêtes des utilisateurs. Mais je ne suis pas inquiet, ça n’est clairement pas le plus compliqué dans l’histoire.
Dans cette branche de l’IA, les challengers ne manquent pas non plus. Stable Diffusion 3 reprend du poil de la bête, même s’il tire un peu la langue, Ideogram confirme son aisance en général et dans l’intégration brillante de textes et autres panneaux, et AuraFlow d’Hugging Face semble très bien parti.
Mais le plus surprenant vient d’un registre dont je n’attendais rien de sérieux avant plusieurs années pour des raisons de coût aisément compréhensibles, à savoir la création de vidéo. Et pourtant, après quelques audacieux, deux modèles sortent réellement de la démonstration technologique prometteuse des débuts, mais finalement très limitée.
Deux modèles sortent du lot. D’abord, Luma Dream. Il s’agit d’un « text to video ». Vous décrivez le plus précisément possible la vidéo que vous voulez obtenir, et Luma Dream interprète au mieux votre souhait en générant des petites séquences de quelques secondes. Si vous comptez réaliser un film complet, même court, il vous faudra beaucoup de patience.
L’autre modèle méritant votre attention s’appelle Runway. Lui entre dans la catégorie des « image to video ». Vous lui fournissez une image, éventuellement produite elle aussi par l’IA, puis il va reconstituer son contenu principal et l’animer selon vos directives. Il subsiste une marge consistante d’amélioration, mais j’ai hâte de voir ses évolutions futures.
Trois catégories d’outils se cumulent donc textes, images, vidéos), ce qui représente potentiellement un budget conséquent. Surtout si vous ne réussissez pas à trancher entre les innombrables solutions dans chacune d’entre elles. La solution ? Une de ces « supérettes de l’IA ». Deux d’entre elles, parmi les mieux pourvues, regroupent très astucieusement chacune une belle palette d’outils pour le prix d’un seul abonnement, à vous d’employer les crédits à votre guise. En prime, d’incessantes mises à jour complètent la liste des services proposés, à commencer par les dernières versions des modèles vedettes.
À vrai dire, je serais bien en peine de vous en conseiller une seule. J’emploie ainsi les deux simultanément : Magai, ainsi que 1min30. Essayez-les, tout simplement.
Articles sur des sujet similaires:
Et si l'intelligence artificielle
devenait votre assistant personnel ?
Qu'elle vous débarassait des tâches ingrates et pénibles ?
- Marketing, communication
- Courriers, contrats, SAV
- Développement, prospection
- Réseaux sociaux, blogs, newsletter
Fatigué de créer du contenu
d'actualité
... et de l'illustrer
- Sites Web
- Réseaux sociaux
- Blogs
- Newsletter