Novembre 2022, lancement de ChatGPT auprès du grand public.
Rétrospectivement, on a l’impression que l’IA générative, ou intelligence artificielle générative, est présente dans notre quotidien “digital” depuis de nombreuses années alors que cette technologie est sur le marché depuis à peine 2 ans !
En tant que professionnels du digital, stratégie, UX design, UI design, développement ou encore webmarketing, l’ensemble de nos métiers et de vos métiers est impacté. Dans cet article, nous vous donnons quelques clés de lecture des modèles d’intelligence artificielle générative. L’objectif est de réussir à s’appuyer sur les forces de ces nouvelles applications afin d’optimiser votre productivité et votre savoir-faire pour augmenter votre valeur ajoutée en entreprise !

L’IA générative en entreprise est enfin l’innovation de rupture dans notre quotidien

À son lancement, le scepticisme était assez important, en dehors des early adopters. On peut d’ailleurs le comprendre, ces dernières années nous avons connu de nombreuses expériences plus ou moins impactantes :

  • L’arrivée des télévisions 3D
  • La montée en puissance des crypto monnaies adossées à la blockchain
  • Les NFT (et oui vous aussi vous avez sûrement ouvert un compte sur Opensea ou Blur !)

Au-delà des aspects « innovation technologique » et « spéculatif », il est difficile de mesurer l’impact réel de ces changements dans notre quotidien, notre travail et notre productivité.

Et c’est sur ce point que les modèles d’IA générative ont tout changé.

Une étude fin 2023 de l’éditeur et fournisseur de formation O’Reilly apporte plusieurs chiffres intéressants :

  1. 65 % des personnes interrogées utilisent l’IA générative pour leur travail,
  2. 54 % des utilisateurs d’IA pensent que les gains en productivité seront l’un des plus gros apports de l’intelligence artificielle,
  3. 77 % des personnes interrogées utilisent l’IA comme aide à la programmation.

A chaque besoin, son modèle d’intelligence artificielle générative

Aucune technologie n’avait été adoptée aussi rapidement par le grand public et les entreprises. L’intelligence artificielle générative répond à des problématiques concrètes :

  • Rédiger du contenu (promis je suis en train de rédiger cet article !),
  • Générer des réponses de la part du service client,
  • Co-piloter des projets avec les développeurs,
  • Analyser des données,
  • Générer des images,
  • Générer des vidéos,
  • Créer des contenus audio, etc.

Le principe d’utilisation de l’IA générative : la question/réponse

Point important dans l’adoption de ces technologies : l’utilisateur utilise un principe de recherche standard, plutôt accessible car c’est une logique no-code / low-code.

Comment fonctionnent les modèles d’intelligence artificielle ? Que ce soit l’IA ChatGPT, l’IA Gemini (ex Google Bard) ou encore l’IA Midjourney ?

Il existe bien entendu différents modèles, applications ou encore architectures d’intelligence artificielle. Mais pour résumer, une IA générative fonctionne en utilisant des techniques avancées de machine learning pour modéliser et générer de nouvelles données, similaires mais non identiques à celles sur lesquelles elles ont été entraînées.
Ce processus est complexe. Malgré la richesse du langage humain, les machines sont désormais capables d’en comprendre les subtilités grâce à ce qu’on appelle “large languages models” (LLM). En utilisant un maximum de données dans leur apprentissage, elles ont développé une compréhension du langage extrêmement riche.

IA génératives pour générer du contenu écrit : laquelle choisir ?

Il faut d’abord dissocier la solution d’IA / le produit en tant que tel et le modèle de langage.
La solution d’intelligence artificielle doit être choisie en fonction de critères comme le coût, l’accessibilité, les services proposés, les domaines d’applications…Dans cet article, nous nous concentrerons essentiellement sur la qualité du contenu généré, la maturité du modèle de langage et des avantages à l’application de ce modèle dans votre entreprise.

L’IA génératrice de texte, ChatGPT

Pas forcément besoin de le re-présenter ! ChatGPT, et sa dernière mouture GPT4, vous permet de générer des textes de qualité sur une grande variété de domaines. GPT4 est capable aussi de travailler sur des documents comme des .pdf, d’analyser des données et de créer des tableaux Excel, d’effectuer des recherches spécifiques…Le potentiel est quasiment illimité pour gagner en productivité au sein des entreprises.
En revanche, quelques principes sont à respecter :

  • Créer une charte de bonnes pratiques à l’usage de l’intelligence artificielle générative dans votre entreprise : la protection et la sécurité des données sont au cœur des préoccupations. Maîtriser les données partagées avec l’IA générative est un point clé.
  • Maîtriser les prompts : plus vous progresserez dans votre manière d’interagir avec elle, plus les données obtenues seront pertinentes et votre productivité augmentera. Pour ce faire, rien de tel que de l’entraînement et une formation sur les prompts.
  • Travailler en “collaboration” avec l’IA ! L’IA générative a encore beaucoup de biais, il est donc essentiel de contrôler le travail et les informations générées. L’IA est un formidable copilote, mais reprendre du contenu tel quel n’est (absolument) pas recommandé. D’ailleurs, des outils comme GPT Zero permettent facilement de détecter le volume de contenus généré par l’IA dans un texte. En termes de SEO, vous pourrez être pénalisé en utilisant trop de contenus IA.

Chiffre intéressant : 22 millions de devoirs contenant de l’IA ont été recensés en 2023 par la plateforme technologique Turnitin (qui détecte les contenus IA dans les devoirs des étudiants).

Gemini, l’IA générative de Google à ne pas négliger

Lancée par Google, l’application Gemini (pas encore disponible en France en mai 2024) se positionne comme un concurrent direct de ChatGPT.
Fonctionnellement, l’approche est similaire mais Gemini se distingue par une intégration très poussée dans l’écosystème de Google. L’outil sera naturellement mis en avant dans les pages de résultats de Google et dans la suite Google Drive.
Qualitativement, les résultats sont relativement équivalents entre Gemini et GPT3.5 mais un peu inférieurs à GPT4.

Un point d’attention particulier : l’accessibilité de cette solution le propulsera comme un acteur important des prochaines années.

Les autres acteurs de l’IA générative textuelle

D’autres modèles proposant des services différents sont présents sur le marché. Leur particularité : ils ne s’adressent pas aux utilisateurs finaux mais sont utilisés via des API. On peut citer :

  • Le modèle français Mistral,
  • Le modèle Llama 3 de Meta disponible en Open Source, plébiscité par la communauté,
  • Le modèle Claude, proposé par Anthropic.

On attend des annonces importantes de la part d’Apple pour la fin d’année 2024. L’acteur américain pourrait proposer des solutions intégrées directement dans l’OS de ses téléphones et ordinateurs. Apple, jouant sa carte habituelle, pourrait se positionner comme garant de la sécurité de vos données.

Pour suivre l’actualité de l’ensemble des modèles de données, un super projet nommé Hugging Face référence l’ensemble des modèles et en compare les résultats. En mai 2024, Hugging Face compte déjà… plus de 600.000 modèles différents !

Des plateformes Saas intègrent directement l’IA générative

Les modèles d’IA générative présentés précédemment peuvent être utilisés soit directement dans des outils comme ChatGPT, mais ils peuvent aussi l’être via d’autres plateformes SaaS. Ces dernières peuvent intégrer l’outil d’IA générative au sein de verticales spécifiques.

On peut nommer :

  • Write Sonic, acteur spécialisé dans la création de contenus SEO et basé sur le modèle GPT4,
  • Microsoft est un très bon exemple d’implémentation en ayant intégré son outil Copilot dans l’ensemble de sa suite Microsoft 365 (ex suite Office).

S’intéresser aux IA créatives pour générer des images, des vidéos et des contenus audio

L’IA générative est aussi utile dans les métiers de la création : booster et optimiser sa créativité ou tout simplement gagner du temps au quotidien. Les usages sont multiples, mais nous en analyserons quelques-uns : la production d’images, la production de vidéos et la production audio.

Midjourney et Dall-e pour générer des images

Midjourney et Dall-e ont véritablement révolutionné la manière de créer une image.

Ces solutions ont émergé en 2022 et ont énormément évolué depuis leur lancement. La dernière version à jour de Midjourney est la version 6, qui a été lancée en décembre 2023.

Une avancée majeure a lieu en mars 2024 chez Midjourney : la capacité à recréer les mêmes personnages sur la base d’un même prompt. Réelle nouveauté, elle offre la possibilité de conserver un personnage et de le faire évoluer dans différents environnements et différentes situations.
La création d’images permet principalement d’illustrer vos propos dans vos présentations, mais aussi de conceptualiser une vision, de matérialiser une expérience sans être un créatif de métier.

L’exploitation de ces visuels n’est pas encore soumise à une gestion explicite des droits, donc soyez attentifs car les règles pourront évoluer prochainement.
Autre point important : les visuels générés par les IA ne sont pas vraiment plébiscités d’un point de vue SEO. Veillez donc à les utiliser avec parcimonie dès lors que vous avez des objectifs d’acquisition digitale.

Dall-e reste la solution la plus accessible des 3 car elle est intégrée à l’ensemble des services mis à disposition par Open.ai. En revanche, la qualité photoréaliste que permet de générer Midjourney est plus intéressante pour tous les métiers d’image.

Heygen, d-id, Pika, la révolution vidéo

Les évolutions les plus marquantes ces derniers mois ont eu lieu dans l’univers de la vidéo. Il est désormais possible de générer en quelques minutes :

  • Une boucle vidéo à partir d’un prompt texte
  • Un avatar qui peut être animé via un prompt texte
  • Une photo qui va être animée et va pouvoir lire un prompt texte

Ce processus impressionnant ouvre un grand nombre de possibilités pour des équipes marketing et webmarketing. Par exemple, il permet la création de messages personnalisés pour des clients, des réponses vidéo pour un service après vente ou du support ou encore des emails vidéos personnalisés.
Il est aussi possible de découper une vidéo en plusieurs petites vidéos, générer automatiquement des sous-titres et les exploiter sur vos réseaux sociaux. Le gain de productivité est important, d’autant que ce type de ressources n’est pas toujours disponible en entreprise.

Deux derniers exemples récents sont pertinents à présenter pour vous amener à gagner du temps dans votre travail :

  1. Trouver une bande son pour une vidéo corporate est souvent très chronophage : vous pouvez désormais générer une musique libre de droits qui correspond exactement à vos besoins avec Suno,
  2. Former vos équipes commerciales à de nouvelles offres en les confrontant à des clients, à faire évoluer vos processus métiers : Patboat vous permet de générer des scénarios d’entraînement spécifiques.

La consommation d’énergie et l’intelligence artificielle font-elles bon ménage ?

Au sein d’une agence digitale comme Limpide, nous sommes partagés quant aux avancées, aux perspectives offertes et à l’impact environnemental des solutions d’IA génératives. Pour le déterminer à notre niveau, nous nous appuyons sur des projets digitaux qui nécessitent d’utiliser par exemple l’UX Research et souvent une grande quantité d’analyse de données.

L’impact environnemental de l’intelligence artificielle

L’impact environnemental de l’intelligence artificielle, notamment des modèles d’IA générative comme les grands modèles de langage ou les modèles de génération d’images, est principalement dû à deux facteurs principaux : la consommation d’énergie pour l’entraînement et l’infrastructure nécessaire pour héberger et exécuter ces modèles.

  1. L’entraînement des modèles d’IA, surtout ceux de grande taille comme GPT-4 nécessite d’importantes ressources (principalement sur le cloud). Ces modèles sont généralement entraînés sur des clusters de GPU ou TPU qui consomment beaucoup d’électricité. Des études ont montré que l’empreinte carbone de l’entraînement d’un seul grand modèle peut être équivalente à celle des émissions annuelles en dioxyde de carbone de plusieurs voitures.
  2. L’Utilisation des modèles : une fois entraînés, les modèles sont souvent hébergés sur des serveurs dans le cloud qui doivent être constamment disponibles pour répondre aux requêtes, ce qui entraîne une consommation énergétique continue, bien que généralement moindre que l’entraînement.

L’éco-conception, une notion qui peut être appliquée à l’IA

Il est possible d’intégrer des principes d’éco-conception en lien avec l’utilisation de l’IA générative. On en détaille 4 d’entre eux :

  • Optimiser les modèles : réduire la taille des modèles d’IA tout en conservant leur efficacité, par exemple en utilisant des techniques comme le « pruning » (élagage), le « quantization » (quantification) permet de réduire significativement leur empreinte carbone.
  • Utilisation d’un cloud éthique : héberger des modèles d’IA dans des centres de données qui utilisent des énergies renouvelables ou qui sont optimisés pour une meilleure efficacité énergétique (datacenter sans climatisation, utilisation de serveurs sur plusieurs années…).
  • Amélioration de l’efficacité algorithmique : développer des algorithmes plus efficaces qui nécessitent moins de puissance de calcul pour le même résultat, réduisant ainsi l’énergie nécessaire tant pour l’entraînement que pour l’exécution. La recherche évolue fortement sur ce critère.
  • Travailler sur la conscience des utilisateurs : sensibiliser sur l’impact environnemental des requêtes d’IA et encourager des pratiques responsables, comme minimiser les requêtes inutiles ou optimiser les requêtes pour minimiser le calcul nécessaire.