Archives des IA - Synapsys groupe

Chatbots, agents IA et RAG : choisir la bonne solution IA

Zoé Moulart — Fri, 20 Feb 2026 09:45:56 +0000

Dans un contexte où les DSI accélèrent leur transformation numérique et cherchent à intégrer des solutions d’IA générative de manière maîtrisée, la distinction entre chatbots, agents IA et systèmes RAG devient essentielle. Ces trois approches ne répondent pas aux mêmes fonctions, ne présentent pas les mêmes contraintes d’intégration SI, et n’offrent pas les mêmes niveaux d’intelligence, d’autonomie ou de scalabilité.

Ce guide propose une lecture approfondie, spécifiquement conçue pour des professionnels du numérique : développeurs, architectes, responsables du RUN, experts Data/IA, ou encore équipes DevOps et Modern Workplace.

Pour découvrir un exemple concret d’application de l’IA dans le support réseau, consultez notre article « Comment l’IA transforme la gestion des tickets de support réseau ? »

Chatbots : le modèle conversationnel de première génération

Quels cas d’usage pour un chatbot dans l’IT ?

Bien que très répandus, les chatbots restent aujourd’hui limités en termes d’intelligence et de capacité d’adaptation. Ils reposent généralement sur des règles préconfigurées, des scénarios conversationnels fixes ou un modèle NLP simple.

Dans les environnements informatiques modernes, le chatbot s’impose comme un outil simple et efficace pour automatiser une partie des échanges entre les utilisateurs et la DSI.

Le chatbot est idéal pour :

La gestion de FAQ internes (IT, RH, sécurité)
Les demandes simples et répétitives
L’orientation vers les bons services
La collecte d’informations structurées auprès des utilisateurs

Malgré ses nombreux atouts, le chatbot reste un outil conçu avant tout pour des scénarios cadrés et standardisés. Il montre rapidement ses limites dès lors que les situations deviennent trop complexes ou trop spécifiques.

Il est notamment limité pour :

Les interactions techniques complexes
L’analyse contextuelle avancée
L’interfaçage intelligent avec des outils ITSM, ERP ou CRM

Les bénéfices d’un chatbot pour la DSI

L’intégration d’un chatbot au sein du support informatique apporte des avantages concrets et mesurables. Bien déployé, il contribue directement à améliorer l’efficacité opérationnelle :

Décharge les équipes support des volumes simples
Coûts de déploiement et opérationnalisation réduits
Mise en place rapide via des plateformes low-code

Quelles sont les limites techniques d’un chatbot ?

Contrairement à une IA générative ou à un agent autonome, le chatbot repose sur des règles prédéfinies et des scénarios relativement figés. Ses principales limites techniques sont :

Aucune autonomie décisionnelle
Pas de compréhension métier profonde
Pas d’orchestration de workflows complexes

Agents IA : des systèmes autonomes capables d’agir dans le SI

Les briques technologiques clés d’un agent IA

Les agents IA marquent un changement de paradigme : on ne parle plus seulement de compréhension du langage, mais de perception, raisonnement et action.

Un agent IA est une entité logicielle autonome capable de comprendre l’intention utilisateur (NLP avancé + LLM), analyser un contexte métier ou technique, prendre des décisions, déclencher des actions dans un système tiers.

C’est cette capacité à agir qui le distingue fondamentalement d’un chatbot.

Le fonctionnement d’un agent IA repose sur un ensemble de composants techniques complémentaires :

LLM (génération + NLP avancé)
Moteur décisionnel
Intégrations SI (API, CRM, ERP, ITSM, orchestration)
Gestion du contexte (mémoire de session, données métier)
Automatisation de tâches multi-étapes

Des exemples de cas d’usage d’un agent IA dans l’IT

Supervision et observabilité

Dans le domaine de la supervision, un agent IA peut jouer un rôle clé pour améliorer la fiabilité et la réactivité des équipes :

Analyse intelligente des logs
Détection d’incidents récurrents
Pré-remplissage automatisé de tickets
Propositions d’actions correctives adaptées

Automatisation du RUN

Les agents IA permettent également d’aller beaucoup plus loin que les scripts classiques d’automatisation :

Exécution d’actions automatiques (restart, purge, vérification de services)
Séquences automatisées (déploiements, patchs)
Communication proactive avec les utilisateurs internes

Support N1/N2 augmenté

Intégrés aux processus de support, ils deviennent de véritables copilotes pour les équipes techniques :

Analyse des symptômes d’incidents
Requêtes dynamiques dans la documentation interne
Rédaction et mise à jour des fiches de résolution

Les avantages d’un agent IA pour les DSI

L’adoption d’agents IA dans l’IT apporte des bénéfices stratégiques et opérationnels majeurs pour les directions informatiques :

Forte réduction de charge opérationnelle
Prise de décision plus rapide et contextualisée
Normalisation des pratiques internes
Scalabilité élevée via intégrations low-code/no-code

Quels sont les limites et défis d’un agent IA ?

Malgré leur potentiel, les agents IA nécessitent un cadre de mise en œuvre rigoureux pour être réellement efficaces et maîtrisés au sein du SI.

Les principaux points de vigilance sont :

Dépendance à la qualité des intégrations
Nécessité d’une gouvernance IA
Risques accrus en cas de mauvaise configuration (agents trop autonomes)

Systèmes RAG : la couche de fiabilité indispensable à l’IA générative

Qu’est-ce qu’un RAG ?

Le RAG (Retrieval-Augmented Generation) est aujourd’hui la réponse la plus robuste aux limites des LLM, notamment les hallucinations et leur déconnexion des données internes. Un système RAG repose sur un principe simple mais puissant :

Recherche : interroger une base documentaire interne
Génération : produire une réponse enrichie et contextualisée via le LLM

Atouts majeurs d’un système RAG dans un environnement IT

Fiabilité et traçabilité

L’un des grands avantages du RAG est de connecter l’IA aux données réelles de l’entreprise. Le RAG permet au LLM de s’appuyer sur :

les procédures internes
les guides techniques
les référentiels sécurité
la documentation SI et l’historique d’incidents

Sources compatibles

Un système RAG peut exploiter un très large éventail de sources documentaires et applicatives déjà présentes dans le SI :

SharePoint, Confluence
CMDB, ITSM, bases de connaissances
Dossiers projets, fiches applicatives
Fichiers structurés et non structurés

Cas d’usage à forte valeur

Appliqué au support informatique et à l’exploitation, le RAG ouvre la voie à de nombreux scénarios concrets :

Assistant documentaire pour équipes support
Recherche intelligente pour DSI et architectes
Génération automatisée de réponses techniques
Consolidation d’informations pour audit ou conformité

Quels sont les limites d’un système RAG ?

Comme toute technologie, un système RAG ne produit des résultats pertinents que s’il repose sur une base solide.

Ses principales limites sont :

La qualité dépendante de la structuration des documents
Le besoin d’une stratégie d’ingestion et d’une gouvernance documentaire

Chatbot vs agent IA vs système RAG : comparatif orienté décision IT

Voici un comparatif condensé issu du document de référence.

Critères	Chatbot	Agent IA	Système RAG
Intelligence	Faible	Élevée	Moyenne (LLM dépendant)
Capacité d’adaptation	Faible	Forte	Moyenne
Intégration SI	Limitée	Étendue (CRM, ERP, ITSM…)	Intégration documentaire
Automatisation	Basique	Avancée, multi- étapes	Indirecte
Contenu généré	Aucun	Oui (contextualisé)	Oui (fiable car basé doc interne)
Usage typique	FAQ	Automatisation métier, support IT, supervision	Base documentaire, support technique

Comment choisir la bonne approche pour votre organisation IT ?

Face à la multiplication des solutions d’intelligence artificielle appliquées à l’IT, il est essentiel de choisir la technologie la mieux adaptée à vos objectifs métiers.

Chatbot, agent IA ou système RAG ne répondent pas aux mêmes besoins. Le bon choix dépend avant tout de vos priorités opérationnelles.

Si votre objectif est de décharger le support des questions simples, optez pour un chatbot.

Si vous voulez automatiser des processus IT complexes, tournez-vous plutôt vers un agent IA.

Si votre priorité est d’améliorer l’accès à la connaissance interne, mettez en place un système RAG

Enfin, si vous cherchez à bâtir un écosystème intelligent alliant action et information, la solution la plus performante et puissante est l’association agent IA et RAG.

Vision architecturale : comment articuler Agent IA, Chatbot et RAG ?

Niveau 1 : Interface utilisateur : Chatbot conversationnel

Facilite les échanges, collecte les informations, guide l’utilisateur.

Niveau 2 : RAG, le moteur de vérité documentaire

Assure la fiabilité des réponses en s’appuyant sur vos données internes.

Niveau 3 : Agent IA , le moteur d’action et d’automatisation

Exécute automatiquement ou semi-automatiquement des tâches au sein du SI.

Ce modèle en couches est celui adopté par les entreprises souhaitant industrialiser l’IA sans compromettre sécurité et gouvernance.

Gouvernance, sécurité et low-code : les enjeux transverses

Le déploiement de ces technologies impose une approche structurée, notamment pour assurer la conformité réglementaire, éviter les erreurs d’automatisation via agents IA trop autonomes, maîtriser la qualité et la fraîcheur des données alimentant le RAG, suivre les actions et logs des agents au niveau du RUN..

L’intégration low-code et no-code (Make, Xano, n8n…) évoquée dans le document facilite grandement la mise en œuvre d’agents IA et de pipelines RAG.

Conclusion : vers une architecture IA unifiée et maîtrisée

Les organisations IT gagnent à articuler correctement ces trois briques :

Chatbot : l’interface simple et accessible
RAG : la garantie de réponses fiables et traçables
Agent IA : la capacité d’action automatisée dans le SI

Quand elles sont combinées, ces approches permettent de créer des assistants métier puissants, de fluidifier le support, d’améliorer la productivité et d’industrialiser les processus internes.

5 écueils qui compromettent l’intégration de l’IA en entreprise et comment les éviter

Zoé Moulart — Fri, 20 Feb 2026 09:42:03 +0000

Introduction

L’intégration de l’IA en entreprise reste trop souvent perçue comme un simple projet technique. En réalité, c’est un chantier transversal qui implique la stratégie, la donnée, l’architecture du SI, les compétences humaines et la culture numérique. À mesure que les organisations accélèrent sur l’IA, les mêmes obstacles surgissent, ralentissant, voire empêchant, le passage à l’échelle.

Voici les cinq écueils les plus courants et les leviers pour les dépasser durablement.

Déployer l’IA sans alignement avec les besoins métier

De nombreuses équipes IT reçoivent des demandes de POC IA sans expression claire du besoin. L’entreprise « teste » alors l’IA sans comprendre ce qu’elle cherche réellement à résoudre, générant des prototypes isolés, loin de la stratégie globale, qui ne seront jamais industrialisés. Ce fonctionnement disperse les efforts, dilue la valeur et pousse parfois les métiers vers des outils externes non maîtrisés.

Pour éviter cela, toute initiative doit partir d’un problème mesurable ou d’un irritant métier réel, comme un SLA insuffisant, un coût trop élevé ou un processus exposé à des erreurs. La définition de KPI avant le lancement est indispensable pour garantir la valeur recherchée. Enfin, impliquer simultanément IT et métiers dès l’amorçage évite les solutions déconnectées du terrain.

Pour aller plus loin : IA Générative : comment aller au delà du POC ?

Sous-estimer la qualité et la préparation de la donnée

Les risques concrets

Une IA mal nourrie donnera nécessairement des résultats médiocres.
Pour l’IT, c’est un défi constant : qualité, accessibilité, gouvernance, sécurité.

Voici quelques exemples de risques :

Jeux de données incomplets ou non représentatifs ⇒ modèles biaisés.
Sources éparpillées ⇒ pipelines trop complexes, difficilement maintenables.
Métadonnées absentes ⇒ traçabilité et audit impossibles.
Données sensibles exposées ⇒ non-conformité, incidents potentiels.

Ce qu’il faut instaurer

Un socle data clair : catalogage, contrôle qualité, gestion des versions, politiques de rétention.
Une gouvernance “Ops-ready” : documentation, surveillance continue des dérives, validation des mises à jour.
Des environnements datasets → staging → production pour fiabiliser le cycle de vie des modèles.

Imaginer que la technique suffit sans expertise humaine

L’IA, même avancée, ne devient jamais autonome. Elle doit être encadrée, surveillée, ajustée et expliquée par des humains. Les équipes techniques jouent un rôle clé dans la conception des pipelines, l’orchestration des modèles et leur intégration au SI. Les experts métier, eux, contextualisent et valident les résultats, tandis que les chefs de projet assurent la priorisation, la gestion des risques et la cohérence globale.

Les équipes de support doivent également être préparées à gérer de nouveaux incidents liés au drift ou aux hallucinations. En d’autres termes, la réussite dépend toujours d’un écosystème de compétences humaines coordonné autour des modèles.

Négliger les enjeux éthiques et réglementaires

Les projets IA doivent répondre à des exigences strictes en matière de transparence, d’explicabilité, de maîtrise des risques et de protection des données. Détecter les biais présents dans l’historique, documenter le fonctionnement des modèles, garantir la possibilité d’un human override et aligner les solutions avec le cadre européen sont des étapes incontournables.

Une IA mal gouvernée fragilise non seulement les données, mais aussi la crédibilité globale du SI. L’entreprise doit donc traiter la dimension réglementaire non pas comme une contrainte, mais comme un pilier de confiance, interne comme externe.

Oublier l’accompagnement humain et la conduite du changement

Ce que l’IT observe souvent

Les développeurs craignent que l’IA remplace une partie de leurs missions.
Les équipes opérationnelles redoutent un outil complexifiant plutôt que simplifiant leur quotidien.
Les métiers ne comprennent pas les limites techniques et s’attendent à des performances impossibles.

Les leviers efficaces

Impliquer les utilisateurs finaux dans les tests dès les premières étapes.
Organiser des démonstrations concrètes : avant/après, gains mesurables, retours d’expérience.
Clarifier les responsabilités : qui supervise, qui valide, qui ajuste.
Former les équipes IT aux nouveaux paradigmes (prompt engineering, MLOps, IA sécurisée).

Conclusion – L’IA : un projet d’entreprise, pas un projet technique

L’intégration de l’IA n’est ni un gadget, ni un sprint technologique. C’est un projet d’entreprise stratégique qui exige de la méthode, de la cohérence et une vision à long terme. Pour créer une valeur durable, l’IA doit s’ancrer dans les besoins réels, s’appuyer sur une donnée gouvernée, être encadrée par des compétences humaines variées, respecter les cadres éthiques et s’accompagner d’un changement maîtrisé.

Les entreprises qui réussissent sont celles qui dépassent l’effet de mode pour adopter une approche structurée, responsable et alignée entre IT et métiers. Une IA bien intégrée n’est pas seulement un outil performant : c’est un levier de transformation globale, capable d’améliorer la qualité, la performance, la résilience et la maturité numérique de toute l’organisation.

Comment l’IA transforme la gestion des tickets de support réseau ?

Le Rhino — Thu, 22 Jan 2026 07:11:53 +0000

Introduction

Face à la multiplication des usages numériques et à la généralisation du télétravail, les équipes IT doivent gérer un volume croissant de tickets liés au réseau. Problèmes de connectivité, accès VPN, lenteurs applicatives ou incidents de sécurité : chaque dysfonctionnement impacte directement la productivité des utilisateurs.

Dans ce contexte, l’intelligence artificielle appliquée au ticketing réseau s’impose comme un levier clé pour améliorer la réactivité, la qualité et l’efficacité du support IT.

L’augmentation des tickets réseau : un défi majeur pour le support IT

Ces dernières années, les environnements informatiques sont devenus plus complexes et plus distribués. Les équipes support sont fortement sollicitées pour des incidents très variés, souvent urgents, qui nécessitent une prise en charge rapide afin de garantir la continuité de service.

Or, les outils de ticketing traditionnels reposent encore largement sur des actions manuelles :

qualification des tickets,
priorisation,
affectation aux bonnes équipes.

Avec l’augmentation constante des demandes, ce fonctionnement atteint ses limites. Il engendre des délais de traitement plus longs, des erreurs de routage et une surcharge des équipes support.

C’est dans ce contexte que l’intégration de l’IA dans les outils de ticketing réseau apparaît comme une réponse pertinente et durable.

L’intégration de l’IA dans les outils de ticketing réseau

Analyse intelligente et compréhension des tickets

Les solutions de ticketing modernes intègrent désormais des mécanismes d’intelligence artificielle capables d’analyser les tickets dès leur création. Grâce au traitement du langage naturel (NLP) et aux algorithmes de machine learning, l’IA est capable de comprendre une demande, même lorsqu’elle est formulée de manière imprécise ou non technique.

L’IA analyse automatiquement le contenu des tickets, quel que soit le canal utilisé : e-mail, portail utilisateur, chatbot ou outil de supervision réseau. Elle interprète le contexte, identifie les symptômes décrits et comprend l’intention de l’utilisateur, sans nécessiter une reformulation technique.

Cette capacité de compréhension permet d’exploiter des tickets parfois peu structurés, tout en limitant les allers-retours entre le support et les utilisateurs pour obtenir des informations complémentaires.

Automatisation de la qualification et du routage

Une fois le ticket analysé, l’IA procède à sa qualification automatique. Elle est capable de catégoriser les incidents (problème réseau, performance, panne matérielle, incident de sécurité), d’évaluer leur criticité et d’enrichir le ticket avec des informations contextuelles telles que l’équipement concerné ou la localisation.

Le routage devient alors intelligent : le ticket est directement affecté à l’équipe ou au technicien disposant des compétences les plus adaptées. Cette automatisation réduit fortement les erreurs de qualification, souvent responsables de retards dans la prise en charge des incidents.

Capitalisation et propositions de solutions

L’IA s’appuie également sur l’historique des incidents et les bases de connaissances existantes. Pour des problématiques déjà rencontrées, elle peut proposer des solutions ou des correctifs éprouvés, facilitant la résolution rapide des tickets.

Dans certains cas, l’IA est même capable de déclencher des actions automatisées, contribuant à une résolution quasi immédiate des incidents récurrents.

Réduction du temps de traitement des tickets et amélioration du MTTR

Identification et priorisation des incidents techniques

L’un des bénéfices majeurs de l’IA appliquée au ticketing réseau est la réduction significative du temps de traitement des tickets, généralement mesurée par le MTTR (Mean Time To Resolution).

Grâce à l’analyse automatique et à la priorisation intelligente, l’IA identifie rapidement les incidents à fort impact, comme une panne réseau affectant un site entier ou un grand nombre d’utilisateurs. Ces tickets sont traités en priorité, sans nécessiter une relecture humaine pour être correctement catégorisés.

Cette approche permet une meilleure gestion des pics de demandes et une prise en charge plus rapide des incidents critiques.

Résolution automatique des incidents simples

L’IA permet également de résoudre automatiquement certains tickets simples et récurrents, sans intervention humaine. Cela concerne notamment :

la réinitialisation d’accès réseau,
les problèmes de configuration basique,
les incidents déjà documentés.

En diminuant le nombre de demandes nécessitant une intervention du support, les équipes IT voient leur charge de travail allégée et peuvent se concentrer sur des incidents plus complexes, nécessitant une expertise avancée.

L’impact de l’IA sur le rôle des équipes réseau

Moins de tâches répétitives, plus de valeur ajoutée

L’automatisation induite par l’IA ne remplace pas les équipes réseau, mais transforme profondément leur rôle au sein de l’organisation. En effet, en automatisant le tri, la qualification et la résolution des incidents simples, l’IA libère les ingénieurs réseau de nombreuses tâches à faible valeur ajoutée, comme la lecture et le tri des tickets ou l’application de correctifs standards.

Ce gain de temps leur permet de se recentrer sur des missions stratégiques : conception et évolution de l’architecture réseau, optimisation des performances, renforcement de la sécurité et mise en place de solutions proactives pour prévenir les incidents.

Pour aller plus loin : AIOps : comment l’IA transforme la gestion des opérations IT ?

Une évolution des compétences et des métiers

L’introduction de l’IA dans le ticketing réseau entraîne également une évolution des compétences attendues. Les équipes doivent désormais maîtriser l’automatisation, le scripting, l’exploitation des données et l’interaction avec des outils d’IA et des agents automatisés.

Le rôle de l’ingénieur réseau évolue ainsi vers celui d’un pilote de solutions intelligentes, capable de superviser, ajuster et contrôler les systèmes automatisés, tout en conservant la maîtrise des décisions critiques.

Limites et défis de l’IA dans le ticketing réseau

Malgré ses nombreux avantages, l’IA appliquée au ticketing réseau présente certaines limites. Son efficacité dépend fortement de la qualité des données disponibles : une base de tickets incomplète ou mal renseignée peut entraîner des erreurs d’analyse ou de priorisation.

Un risque de sur-automatisation existe également, notamment pour les décisions sensibles qui nécessitent une validation humaine. La mise en place d’un cadre de gouvernance clair, d’une supervision humaine adaptée et d’actions de formation est donc essentielle pour garantir une intégration réussie et durable de l’IA dans le support IT.

Conclusion

L’IA appliquée au ticketing réseau permet d’automatiser la gestion des incidents, de réduire le MTTR et d’améliorer durablement la qualité du support IT. En combinant intelligence artificielle et expertise humaine, les équipes réseau gagnent en efficacité, en réactivité et en capacité d’anticipation, tout en offrant une meilleure expérience aux utilisateurs.

Microsoft 365 Copilot avec Jira et Confluence : pourquoi et comment le connecter ?

Mickael Righetti — Wed, 21 Jan 2026 11:32:17 +0000

Jira et Confluence sont devenus les standards de nombreuses équipes projet : gestion des tickets, documentation vivante, collaboration continue. Ajouter Microsoft 365 Copilot, c’est offrir à ces équipes un assistant intelligent capable de répondre en langage naturel, de retrouver l’information en quelques secondes et de faire le lien entre tâches, décisions et contenus.

Mais pour les organisations, les questions clés demeurent : comment le faire simplement, sans exposer les données sensibles et en gardant la maîtrise des accès ?

Les limites des équipes projet sans Microsoft Copilot sur Jira et Confluence

Sans assistant intelligent capable de relier les informations entre Jira et Confluence, les équipes projet restent confrontées à une recherche fragmentée, une capitalisation incomplète des connaissances et une perte d’efficacité au quotidien.

Temps perdu à chercher : tickets dispersés, pages multiples, liens éparpillés.
Connaissance difficile à capitaliser : l’information existe, mais elle n’est pas toujours accessible au bon moment.
Risque d’erreurs : doublons, oublis, décisions non documentées.
Charge cognitive élevée : jongler entre outils et mots-clés sans contexte.

Les gains concrets de Copilot pour les équipes

Copilot exploite les données Jira, Confluence et Teams pour accélérer l’accès à l’information, fiabiliser les synthèses et réduire les frictions dans le travail quotidien des équipes projet.

Réponses immédiates : « Montre-moi les tickets bloquants du sprint et les décisions liées dans Confluence ».
Contexte unifié : Copilot relie les discussions Teams, les pages Confluence et les issues Jira.
Gain de vitesse : préparation de synthèses, comptes rendus, to-do list à partir des éléments existants.
Sécurité préservée : l’accès reste strictement limité aux autorisations en place (projets, tickets, espaces, pages).

Préparer l’adoption de Copilot sur Jira et Confluence : les prérequis clés

Avant de brancher Copilot sur Jira/Confluence, l’essentiel se joue du côté organisation :

Sponsoring clair : expliquer le “pourquoi” (productivité, fiabilité, sécurité).
Cadrage des usages : quels projets et espaces sont prioritaires ? qui sont les utilisateurs pilotes ?
Gouvernance des accès : s’assurer que les groupes et les droits sont propres (membres, invités, périmètres).
Communication : annoncer ce qui change… et ce qui ne change pas (Copilot n’ouvre pas l’accès à de nouvelles données, il simplifie l’accès à celles que vous avez déjà).
Formation courte : 30 minutes suffisent pour apprendre à “bien questionner” Copilot et interpréter ses citations.

Pour aller plus loin : Microsoft Copilot en entreprise : déployez l’outil étape par étape

Comment déployer Microsoft Copilot avec Jira et Confluence ?

Une intégration réussie suit une méthodologie simple et rassurante :

Etape 1 : audit et cadrage

État des lieux des projets Jira et des espaces Confluence, clarification des groupes d’utilisateurs (internes et invités), définition des objectifs (rapidité, fiabilité, périmètre).

Etape 2 : conception de l’architecture cible

Décider quels projets/espaces seront visibles dans Copilot et définir l’audience (groupes qui auront accès). Prévoir un périmètre pilote.

Etape 3 : préparation côté sécurité et accès

Aligner les groupes utilisateurs, vérifier les droits existants, s’assurer que les invités externes suivent les mêmes règles d’accès et d’authentification que vos collaborateurs.

Etape 4 : pilote contrôlé

Activer Copilot sur un périmètre limité (un projet Jira, un espace Confluence). Mesurer les gains, vérifier la pertinence des réponses et la bonne restriction des accès.

Etape 5 : généralisation progressive

Étendre aux autres équipes, capitaliser sur les retours du pilote, mettre en place des bonnes pratiques d’usage (requêtes types, modèle de compte rendu, synthèses).

Accompagner le changement côté équipes

Connecter Copilot n’est pas qu’une question d’outils : c’est une nouvelle manière de travailler.

Démystifier l’IA : Copilot n’invente pas, il s’appuie sur vos contenus et cite ses sources.
Montrer des cas d’usage concrets : préparer la review de sprint, synthétiser une page de spécifications, lister les actions post-incident.
Donner des repères : comment poser une bonne question, comment vérifier les citations, quand ouvrir la page source.
Créer des ambassadeurs : quelques utilisateurs expérimentent, partagent des exemples et rassurent leurs collègues.

Pour aller plus loin : Comment mener avec succès votre programme d’acculturation à l’IA

Sécurité et gouvernance des accès

La priorité des DSI est la maîtrise des accès et l’absence de surprise :

Périmètre maîtrisé : on commence petit et on étend ensuite.
Respect des droits existants : Copilot ne voit que ce que l’utilisateur voit déjà dans Jira/Confluence.
Invités sous contrôle : les partenaires accèdent uniquement aux projets/espaces où ils sont déjà autorisés.
Suivi régulier : vérifier les retours utilisateurs, ajuster le périmètre, maintenir des groupes à jour.

Une intégration réussie est transparente : les équipes gagnent du temps sans changer leur manière d’autoriser l’accès aux contenus.

Pourquoi se faire accompagner pour déployer Microsoft Copilot sur Jira et Confluence ?

Se lancer seul est possible, mais un partenaire habitué à ces déploiements vous apporte :

Méthodologie éprouvée : cadrage, pilote, généralisation.
Bonnes pratiques d’usage : modèles de prompts, rituels projets, synthèses.
Culture sécurité : respect strict des accès, gouvernance des groupes, gestion des invités.
Accompagnement humain : communication, ateliers courts, mesure des gains.

Choisissez un prestataire qui comprend vos équipes, vos projets et votre niveau d’exigence en matière de sécurité et de confidentialité.

Conclusion

Connecter Microsoft 365 Copilot à Jira et Confluence, ce n’est pas ajouter un gadget. C’est mettre l’intelligence au service de vos projets, réduire la friction dans la recherche d’information et fiabiliser la prise de décision.

Avec un périmètre maîtrisé, une gouvernance claire et un accompagnement simple, Copilot devient un levier de performance, sans compromis sur la sécurité des données.

DevOps REX 2025 : comment concilier IA et souveraineté ?

Robin Van Dessel — Mon, 05 Jan 2026 06:33:45 +0000

Un événement DevOps marqué par l’IA et la souveraineté

Lors de cette 6ᵉ édition du DevOps REX 2025, plus de 26 speakers se sont rassemblés pour plus de 17 talks selon les catégories suivantes :

REX DevSecOps
REX Gouvernance
REX DevOps
REX IA en production

Près de 600 professionnels du milieu se sont réunis dans une salle à la température tropicale. Durant ces retours d’expérience, deux sujets principaux sont beaucoup revenus (5 fois pour l’Intelligence Artificielle et 6 pour la Souveraineté). Cela donne une idée de la préoccupation des entreprises pour l’année 2026.

Deux sujets principaux ont focalisé l’attention : l’Intelligence Artificielle et la Souveraineté Numérique. Ce sont deux sujets importants mais qui peuvent être challengeants à mettre en place, d’autant plus quand l’on veut implémenter une IA souveraine.

Retours d’expérience concrets autour de l’IA souveraine

Migration vers un cloud souverain

La première conférence abordait un retour d’expérience sur la migration d’un environnement AWS vers un cloud souverain, en l’occurrence Scaleway. Le contexte était clair : une facture cloud devenue trop élevée et des préoccupations croissantes autour du RGPD et de la dépendance à un fournisseur unique. L’objectif affiché était ambitieux : réduire les coûts de 50 % tout en assurant la continuité de service.

IA et propriété intellectuelle

La deuxième, quant à elle, faisait la jointure entre les deux sujets. Le client final était une entreprise de panneaux solaires flottants, dont la propriété intellectuelle était vitale car elle évolue dans un marché très concurrentiel. Son but était de mettre en place une IA afin d’interroger une base de connaissance interne. Le choix du cloud souverain était Clever Cloud et, pour le modèle utilisé, c’est notre champion français Mistral AI.

Comment implémenter une IA souveraine ?

Des architectures RAG de plus en plus éprouvées

Pour en revenir au sujet principal, implémenter une IA en production est déjà un défi en soi, qu’elle soit souveraine d’autant plus. Les architectures RAG sont de plus en plus éprouvées de nos jours et ont montré leur efficacité. Cela permet de limiter les hallucinations et d’exploiter des ressources internes parfois mal organisées ou éparpillées.

Cadrage projet et expérience utilisateur

La difficulté réside dans le cadrage du projet : son périmètre, ses personas, quelles sont les attentes du projet. Il ne faut pas oublier que l’outil doit être au service de l’utilisateur. L’interface doit être user-friendly afin de ne pas perdre d’utilisateurs.

Mesurer l’adoption et la valeur de l’IA souveraine

Dans la stratégie de l’entreprise, il est indispensable de définir des KPI clairs permettant de mesurer la réussite du projet. À quoi sert d’avoir la meilleure intégration de l’IA du monde si seulement 10 % des collaborateurs l’utilisent ? L’IA doit devenir un outil du quotidien, apportant une valeur tangible.

Coûts, observabilité et criticité des solutions d’IA souveraine

Maîtriser les usages et les dérives de consommation

Cela implique également de maîtriser les coûts et l’observabilité de ces solutions. Une IA utilisée à grande échelle peut rapidement générer des coûts importants, souvent difficiles à anticiper sans indicateurs précis.

Sans visibilité sur les usages, les performances ou les dérives de consommation, il devient impossible de piloter efficacement la solution.

L’IA comme composant critique du système d’information

Dès lors que l’IA devient un composant critique du système d’information, une interruption de service, une dégradation de performance ou une ingérence externe peut avoir un impact direct sur l’activité.

C’est dans ce contexte que la souveraineté prend tout son sens, en garantissant un meilleur contrôle sur les données, les flux et la disponibilité des services.

La souveraineté numérique : un équilibre plus qu’un absolu

Souveraineté et contraintes économiques

Dans ce contexte, la souveraineté ne doit pas être perçue comme une contrainte supplémentaire : elle permet de garder le contrôle sur une valeur ajoutée.

Cette souveraineté implique un coût financier et technique, les services équivalents aux gros fournisseurs de services, dont les budgets se comptent en milliards, n’ayant pas forcément d’équivalents souverains. Se joue alors un jeu d’équilibriste pour choisir l’architecture et la solution.

Les limites du choix d’un cloud souverain

Un point est revenu de manière assez récurrente : la souveraineté ne se limite pas au choix d’un cloud provider. Même lorsqu’un acteur se positionne comme souverain, il reste dépendant d’un ensemble d’infrastructures et de composants qui, eux, ne le sont pas forcément. Les interdépendances sont nombreuses et parfois invisibles.

Dépendances techniques et résilience des infrastructures

L’interconnexion mondiale du cloud

Un exemple concret a été évoqué : le 20 octobre, un incident survenu en Virginie chez AWS a eu des répercussions jusque sur des services hébergés en Europe. Cet événement rappelle que le cloud est par nature interconnecté et que des incidents localisés peuvent avoir des impacts globaux. Cela pose la question de la résilience réelle des systèmes, mais aussi de la maîtrise des infrastructures.

Des couches matérielles largement non souveraines

Au-delà des fournisseurs cloud eux-mêmes, les couches sous-jacentes restent largement non souveraines. Les câbles sous-marins, le matériel informatique, la mémoire RAM, les GPU ou encore certains composants réseau sont produits et contrôlés par un nombre très limité d’acteurs mondiaux, majoritairement non européens. Même avec un cloud opéré en France, ces dépendances techniques demeurent et doivent être prises en compte dans la réflexion globale.

Cloud de confiance et cadre juridique : quelle réalité de souveraineté ?

Offres de cloud de confiance : entre garanties et limites

La question s’est également posée autour des offres dites de cloud de confiance, comme S3NS ou Bleu. Sont-elles réellement souveraines ? La réponse n’est pas binaire.

Ces solutions apportent des garanties importantes en termes d’exploitation locale, de gouvernance française et de conformité réglementaire. Elles répondent à des besoins concrets pour des secteurs sensibles.

En revanche, elles reposent encore sur des technologies issues d’acteurs américains, ce qui introduit un débat légitime sur le niveau réel d’indépendance.

Le Cloud Act et ses implications

C’est ici qu’intervient le Cloud Act américain. Cette loi permet aux autorités américaines de demander l’accès à des données contrôlées par des entreprises soumises au droit américain, même si ces données sont hébergées en dehors des États-Unis.

Cela rappelle que la souveraineté ne dépend pas uniquement de la localisation des données, mais aussi du cadre juridique et des dépendances technologiques.

Les offres comme S3NS ou Bleu cherchent à atténuer ce risque, sans pour autant pouvoir l’éliminer totalement.

Souveraineté technologique : un enjeu historique

Pour mieux comprendre les enjeux historiques de la souveraineté technologique, on peut se tourner vers l’exemple de Gemplus, ancienne pépite française dans les cartes à puce.

Comme le rappelle la vidéo de Micode, cette entreprise détenait des technologies stratégiques, utilisées dans les cartes SIM et les systèmes de paiement. La CIA et d’autres services étrangers s’intéressaient de près à ces technologies, ce qui a entraîné des pressions économiques et des prises de contrôle progressives. Cet exemple illustre parfaitement que la souveraineté ne se limite pas à la localisation des données : elle implique également de pouvoir maîtriser la technologie, l’entreprise et les décisions stratégiques, même face à des influences extérieures.

Conclusion : l’IA souveraine comme curseur stratégique

Finalement, les retours d’expérience présentés lors du DevOps REX 2025 montrent que la souveraineté est un curseur, pas un état absolu. Les entreprises doivent composer avec des compromis entre performances, coûts, maturité des solutions et maîtrise des risques.

IA DevOps : quand l’IA transforme la chaîne CI/CD de bout en bout

Jérémy Khouri — Mon, 24 Nov 2025 13:44:25 +0000

Depuis plusieurs années, le DevOps s’impose comme le moteur de la transformation numérique. On parle d’automatisation, de pipelines, de livraison continue, de collaboration entre équipes…

Lors du dernier Tech Show Paris 2025, nos équipes se sont mobilisés pour identifier les tendances à suivre : l’intelligence artificielle est en passe de changer la nature même du DevOps. Elle ne vient plus simplement accélérer les processus, elle vient les comprendre, les anticiper et les optimiser jusqu’à prendre parfois des décisions à notre place.

Et cette révolution, nous l’appellerons l’IAOps.

Chaque étape du cycle DevOps peut désormais être augmentée par l’IA

L’un des messages qui est revenu dans de nombreuses conférences du salon, c’est que chaque maillon de la boucle DevOps peut déjà être amélioré par une IA. Certaines sont encore balbutiantes, d’autres très matures, mais la tendance est là : la boucle devient intelligente.

Planifier : l’IA qui structure le travail d’équipe

Avant même d’écrire une ligne de code, l’IA aide déjà à organiser, documenter et planifier les projets.

L’entreprise Atlassian a présenté lors du TechShow sa solution “Rovo”. Elle lit la documentation, relie les tickets entre eux, génère des revues d’incident et peut même suggérer des priorités.

Concrètement, elle aide les équipes à garder le fil et à réduire la charge mentale liée à la coordination ainsi qu’aux tâches répétitives de niveau 1.

Coder : de Copilot à l’associé virtuel

Des outils comme GitHub Copilot ou Tabnine accompagnent déjà les développeurs au quotidien : ils accélèrent la rédaction de code, corrigent les erreurs, et proposent des implémentations plus robustes.

Mais au-delà de l’assistance, on glisse peu à peu vers une vraie collaboration entre humain et IA : l’IA devient un collègue, pas un outil.

Construire et tester

Le “Build” et le “Test” représentent aujourd’hui le terrain le plus prometteur du IAOps.

Au niveau du build, plusieurs solutions commencent à sortir du lot. Des outils comme Docker AI ou BuildBuddy expérimentent déjà des optimisations automatiques sur les dépendances de votre application, la structure des images ou le cache de compilation (peu importe le langage).

D’autres, comme GitHub Copilot Workspace ou Harness AIDA, étendent l’IA aux pipelines eux-mêmes, capables de proposer des ajustements de workflow ou de Dockerfile.

Côté tests, l’IA montre toute sa puissance. Les grandes plateformes comme SonarQube, Testim.io ou Harness AI Test Intelligence apprennent des exécutions passées pour détecter les tests instables, identifier les failles récurrentes et génère automatiquement de nouveaux cas pertinents en fonction.

On se rapproche du test adaptatif, capable de s’ajuster au comportement du code.

Release et déploiement : vers un déploiement continu autonome (CD)

Encore en partie manuelles aujourd’hui, les phases de release et de déploiement s’apprêtent elles aussi à basculer dans l’ère de l’intelligence.

Imaginons un agent IA capable d’évaluer le risque d’une mise en production, de choisir le moment optimal du déploiement selon la charge, ou même de rédiger automatiquement les notes de version.

C’est le terrain de jeu de certains éditeurs comme Harness ou Atlassian qui ont fait forte impression au TechShow.
Leurs ambitions : proposer une plateforme qui gère toute la chaîne CI/CD de bout en bout, avec une IA intégrée à chaque étape sous forme d’agents IA DevOps.

La prochaine étape ? Relier ces agents entre eux, pour qu’ils s’orchestrent sans intervention humaine.

Opérer et monitorer : l’intelligence du Run

C’est sans doute la partie la plus avancée de la boucle DevOps. Un bloc avant gardiste de la transition vers l’IA.

Les solutions Dynatrace Davis AI, Datadog Watchdog ou Elastic AI Assistant analysent les métriques, détectent les anomalies, prévoient les incidents et lancent parfois des corrections automatiques. Certaines entreprises voient déjà leurs incidents résolus avant qu’un humain ne lève la tête.

Nous sommes pratiquement déjà dans une ère où la supervision devient prédictive et auto-correctrice.

Le vrai défi : connecter toutes ces intelligences

Aujourd’hui, chaque IA vit dans son coin : Rovo ne parle pas à Copilot; Copilot ne parle pas à SonarQube; SonarQube n’échange pas avec Harness; Harness ne discute pas avec Dynatrace… Résultat : on a une multitude d’outils brillants, mais isolés.

Le vrai IAOps commencera quand ces agents communiqueront entre eux, lorsque tous les pipelines auront été transformés pour accueillir cette nouvelle façon de travailler.

Quelques cas d’usage qui pourraient arriver :

L’agent Copilot termine une de développer une fonctionnalité et déclenche le build.
Ce build prévient un agent de test qui valide la qualité et avertit un agent de déploiement.
En cas d’anomalie, l’agent monitoring prend le relais, alerte le bon canal et lance une action corrective.
Le tout pendant qu’un agent FinOps évalue/surveille le coût de cette opération.

Ce n’est pas de la science-fiction. C’est simplement la prochaine étape logique.

Le DevOps de demain : un chef d’orchestre d’agents IA

Cette évolution change complètement le rôle du DevOps. Jusqu’à aujourd’hui, on automatisait des processus tandis qu’à l’avenir, on orchestrera des intelligences.

Il deviendra le chef d’orchestre d’une équipe numérique composé uniquement d’agents IA qui auront chacun leurs spécialités (plan, code, build, test, release…) Il coordonnera, vérifiera, donnera du contexte et prendra les décisions que les agents ne peuvent pas encore assumer seuls.

Ce n’est plus seulement un changement technique, c’est un changement de posture.

Le DevOps ne sera plus celui qui écrit les scripts, mais celui qui dirige les intelligences. Et si on regarde bien, ce n’est pas une rupture avec la philosophie DevOps, c’en est la continuité.

C’est toujours une histoire de collaboration, mais cette fois-ci entre humains et machines.

Les zones de vigilance de l’IAOps : entre promesse et dépendance

Moins de contrôle, plus d’abstraction

L’idée d’une chaîne CI/CD autonome fait rêver, cependant elle soulève aussi de vraies questions.

Car plus les agents IA prennent de place dans la boucle, plus on risque de perdre la maîtrise de ce que l’on fait vraiment.

Dans un modèle IAOps, une grande partie des décisions est déléguée à des agents autonomes : planification, analyse de code, déploiement, monitoring…

Le risque ? Une perte de compréhension du “pourquoi” ou du “comment” derrière les actions.
Qui valide une décision prise par une IA ?
Qui assume la responsabilité d’un rollback déclenché automatiquement ?

Ces questions ne sont pas techniques, elles sont éthiques et organisationnelles.

Le DevOps dépossédé de son rôle ?

En déléguant de plus en plus aux agents, on court aussi le risque d’un DevOps réduit à un rôle de supervision passive.

À force de s’appuyer sur les IA, on risque surtout d’oublier comment faire sans elles. On gagne en productivité, mais on perd en compréhension, et c’est là que la dette technique s’installe. Elle n’est plus dans le code, mais dans la compétence.

Or, l’essence du DevOps, c’est la compréhension fine du pipeline, des contraintes, et des choix techniques. Si tout devient “assisté”, cette expertise risque de s’effriter.

Un impact social et culturel à anticiper

Comme toute automatisation, l’IAOps soulève des enjeux sociaux :

Lorsque certaines tâches deviendront automatiques, les profils devront évoluer.
Une redistribution des rôles : les DevOps deviennent des orchestrateurs d’agents, les développeurs des superviseurs d’IA.
Et surtout, une question d’acceptation : toutes les équipes ne sont pas prêtes à faire confiance à une machine pour livrer en production.

Ce virage devra donc s’accompagner de formation, de transparence, et d’un vrai travail sur la culture d’équipe.
Parce que l’IA ne remplacera jamais l’humain, mais elle changera profondément la manière dont il agit et décide.

Cette évolution fait aussi écho à un autre mouvement que l’on observe depuis plusieurs années : le MLOps.

Si le MLOps visait à industrialiser le déploiement des modèles d’apprentissage automatique, l’AOps pousse cette logique encore plus loin : il s’agit cette fois d’intégrer l’intelligence dans l’ensemble du pipeline. On pourrait dire que le MLOps gère comment les modèles fonctionnent, tandis que l‘IAOps orchestre leurs actions.

Conclusion : du pipeline automatisé à l’équipe intelligente

L’IAOps ne remplacera pas le DevOps, il redéfinit son environnement.

Chaque outil devient un agent, chaque étape une discussion, chaque incident une opportunité d’apprentissage. Au fond, on ne parle plus d’automatisation, mais d’orchestration intelligente.

Et ce que le TechShow2025 nous a montré, c’est que les briques sont déjà là. Il ne reste qu’à les relier. Le DevOps de demain ne sera pas un exécutant, mais un chef d’équipe hybride. Une équipe composée d’humains… et d’agents IA.

Evolutions de la cybersécurité en 2026 : entre intégration, normalisation et IA

Yohan Bec-Chikli — Tue, 18 Nov 2025 07:25:37 +0000

La cybersécurité a longtemps été perçue comme une forteresse isolée : des équipes spécialisées, des processus rigides et une méfiance naturelle envers le changement rapide. Cette approche défensive, héritée d’une époque où les infrastructures étaient cloisonnées et les menaces plus prévisibles, n’a plus lieu d’être dans un monde numérique où le code évolue en continu et les frontières techniques se dissolvent.

Aujourd’hui, cette ère est révolue. L’évolution des architectures cloud, de la conteneurisation et de l’automatisation a obligé la sécurité à sortir de sa tour d’ivoire pour s’intégrer directement au cœur du développement et des opérations.

Nous vous proposons un article de veille qui vise à anticiper les tendances émergentes en matière de cybersécurité en 2026.

La convergence DevOps et sécurité : naissance du DevSecOps

Le premier grand tournant a été la coopération entre les équipes DevOps et sécurité. L’époque où les développeurs livraient du code pendant que la sécurité jouait au gendarme est terminée.

Cette collaboration, incarnée par le concept de DevSecOps, repose sur deux piliers essentiels :

La flexibilité des équipes de sécurité, capables d’adapter leurs pratiques aux cycles agiles et aux pipelines CI/CD (Continuous Integration / Continuous Delivery).
La sensibilisation des développeurs et des opérateurs aux enjeux de sécurité, afin d’éviter les “shadow tools” (outils non approuvés) et les contournements des contrôles.

Concrètement, cela se traduit par des pipelines intégrant des outils d’analyse automatique tels que SonarQube, Trivy ou Snyk pour scanner le code et les dépendances avant chaque déploiement.

L’IA peut d’ailleurs intervenir ici comme reviewer intelligent, capable de détecter des patterns dangereux dans le code, de suggérer des correctifs conformes aux bonnes pratiques OWASP, ou de prioriser les vulnérabilités selon leur impact.

Certaines entreprises vont encore plus loin en automatisant les tests d’intrusion internes (pentests continus) via des frameworks comme Gauntlt ou Metasploit intégrés dans leurs pipelines CI/CD, validant ainsi la robustesse du code avant sa mise en production.

Ce changement culturel est profond : la sécurité n’est plus une étape bloquante mais une compétence partagée. Elle devient un composant organique du cycle de vie logiciel, où chaque commit est une opportunité d’amélioration continue.

Les normes : la confiance comme valeur centrale

Un autre pilier de la maturité en cybersécurité repose sur la normalisation et la conformité, à travers des référentiels et standards internationaux qui guident les organisations dans leurs pratiques de sécurité :

ISO 27001 : gestion de la sécurité de l’information.
NIS/NIS2 : directive européenne sur la sécurité des réseaux et systèmes d’information.
HDS : Hébergement de Données de Santé.

Dans un contexte où la confiance devient un argument commercial majeur, une entreprise certifiée inspire davantage de crédibilité. Par exemple, un prestataire cloud conforme à ISO 27017 (sécurité spécifique au cloud) peut prouver que ses processus de chiffrement, de gestion d’accès et de journalisation sont rigoureusement encadrés.

De même, les acteurs du secteur de la santé ou de la finance adoptent désormais des politiques de sécurité auditées en continu, avec des contrôles basés sur des frameworks comme CIS Controls ou NIST CSF.

Mais au-delà des référentiels et des cadres de conformité, la solidité d’une stratégie de cybersécurité repose sur quatre dimensions complémentaires : organisationnelle, humaine, physique et technologique. Les normes ne sont que des guides si ces piliers ne sont pas équilibrés.

La gouvernance et la gestion des accès (organisationnel), la sensibilisation des collaborateurs (humain), la protection des infrastructures (physique) et la mise en œuvre des solutions techniques (technologique) doivent fonctionner de concert pour donner sens et cohérence à la sécurité.

L’impact est tangible : au lieu d’être perçues comme un coût ou une contrainte, les normes deviennent un levier de compétitivité. Elles facilitent l’obtention de marchés publics, rassurent les partenaires internationaux et favorisent la mise en conformité avec des textes législatifs comme le RGPD, qui impose des exigences fortes de transparence et de protection des données personnelles.

La normalisation, loin d’être un frein à l’innovation, crée un socle de confiance sur lequel les entreprises peuvent bâtir des solutions plus sûres et plus évolutives.

Sauvegarde et souveraineté numérique : la résilience comme enjeu stratégique

Aucune défense n’est infaillible. Une stratégie de sécurité complète repose sur un principe simple mais souvent négligé : la sauvegarde.

Les attaques par ransomware, comme celles subies par la ville de Lille ou par des hôpitaux français ces dernières années, rappellent brutalement qu’un backup fiable et testé vaut mieux qu’un plan de communication post-crise.

Pour assurer cette fiabilité, de nombreuses organisations appliquent désormais la règle dite 4-2-1 : quatre copies des données, stockées sur deux types de supports différents, dont au moins une conservée hors site.

Cette approche, évolution de la règle historique 3-2-1, ajoute une couche de sécurité supplémentaire en maintenant une copie immutable, c’est-à-dire non modifiable et protégée contre toute suppression, même par un compte administrateur. Elle renforce la résilience face aux ransomwares modernes, qui ciblent désormais aussi les sauvegardes elles-mêmes.

Lorsqu’un incident survient, la réponse suit une séquence précise : détection, déclaration, investigation, gestion de crise, puis retour d’expérience. Cette méthodologie permet d’isoler rapidement la menace, d’en limiter la propagation, de restaurer les services critiques et de tirer des leçons concrètes pour renforcer les défenses. La maturité d’une organisation ne se mesure donc pas à sa capacité à éviter les incidents, mais à la manière dont elle les gère et en apprend.

Mais la question ne se limite plus à la technique. Elle touche désormais à la souveraineté numérique. De plus en plus d’entreprises européennes optent pour des fournisseurs conformes au label SecNumCloud de l’ANSSI, ou pour des solutions locales comme OVHcloud, Scaleway ou Outscale.

L’objectif étant de limiter leur exposition à des lois extraterritoriales telles que le Cloud Act américain. Certaines mettent en place des stratégies hybrides : données critiques hébergées sur un cloud souverain, workloads dynamiques sur AWS ou Azure, le tout orchestré via des outils open source garantissant une portabilité (Terraform, Ansible, etc.).

La sauvegarde devient ainsi un symbole de souveraineté autant qu’un mécanisme de résilience. Des tests de restauration automatisés, des solutions de snapshot immuables et le stockage chiffré en environnement isolé (air gap) font désormais partie des exigences minimales. Dans un monde où la dépendance numérique s’accroît, protéger les données, c’est préserver l’autonomie.

La multiplication des vulnérabilités : l’effet Docker

La conteneurisation a bouleversé l’informatique moderne. Des outils comme Docker, Podman et Kubernetes ont rendu le déploiement rapide, portable et reproductible. Mais cette agilité a un prix car chaque conteneur est une mini-distribution Linux, souvent basée sur des images publiques non mises à jour.

Les CVE (Common Vulnerabilities and Exposures) se multiplient dans ces environnements. Une simple image python:3.12-slim peut contenir plusieurs bibliothèques système vulnérables, si elle n’est pas reconstruite régulièrement. En 2024, une étude de Sysdig a révélé que plus de 80 % des images Docker disponibles sur Docker Hub contenaient au moins une vulnérabilité critique. L’attaque SolarWinds a d’ailleurs montré comment une chaîne de dépendances non maîtrisée peut se transformer en cheval de Troie à l’échelle mondiale.

La réponse à ce problème passe par une approche “shift left”. Les scans de sécurité doivent s’effectuer dès la phase de build, avec des outils comme Grype, Clair ou Trivy, combinés à des politiques d’approbation internes. Les entreprises intègrent également la signature d’images (par exemple via Cosign ou Notary) pour garantir l’intégrité des builds et prévenir l’injection de code malveillant.

Dans cette logique, des acteurs comme Chainguard vont encore plus loin en proposant des images « zéro-CVE » signées et reconstruites automatiquement. Leurs registres sécurisés reposent sur des normes telles que SLSA (Supply-chain Levels for Software Artifacts) et des outils comme Sigstore, garantissant la traçabilité complète des dépendances et la conformité aux exigences de sécurité des chaînes logicielles modernes.

Les registres privés, les politiques d’expiration automatique et les audits réguliers deviennent des pratiques standards. La sécurité n’est plus un contrôle d’entrée, mais un fil rouge tout au long du cycle de vie du conteneur.

L’intelligence artificielle : l’assistante du quotidien

La dernière révolution en date, et probablement la plus profonde, est celle de l’intelligence artificielle appliquée à la cybersécurité. Face à l’explosion du volume de données et d’alertes, souvent plusieurs milliers par jour dans les grands SOC (Security Operations Centers), l’IA devient une alliée incontournable.

Les systèmes d’analyse comportementale basés sur le machine learning peuvent détecter des déviations dans les logs ou les accès utilisateurs avant même qu’un incident ne survienne. Des plateformes comme Microsoft Sentinel, Darktrace ou Splunk Phantom exploitent déjà des modèles d’IA pour corréler les événements, générer des alertes pertinentes et réduire le bruit opérationnel.

L’IA ne se contente plus d’observer : elle agit. Elle peut ouvrir automatiquement un ticket Jira, bloquer une adresse IP suspecte via un playbook Ansible, ou générer un rapport de vulnérabilités prêt à être validé par un analyste.

Mieux encore, des outils génératifs peuvent assister les développeurs dans la remédiation. Lorsqu’un scan de code détecte une faille XSS ou SQL, un modèle comme GitHub Copilot ou OpenAI Codex peut suggérer un patch conforme aux recommandations OWASP.

D’autres plateformes comme Rovo, intégrée à la suite Atlassian, exploitent également l’IA pour assister les équipes dans la documentation, l’audit et la coordination des tâches de sécurité. Reliée à Jira, Confluence ou Bitbucket, elle permet d’unifier les informations issues des pipelines, des scans ou des incidents, et de transformer les alertes en actions concrètes au sein du cycle DevSecOps.

L’IA agit alors comme un exosquelette cognitif, déchargeant les humains des tâches répétitives pour leur permettre de se concentrer sur les analyses critiques.

Cependant, cette automatisation nécessite un encadrement éthique et technique strict. Une IA mal configurée ou biaisée peut faussement signaler des menaces, voire ignorer des anomalies subtiles. Le futur de la sécurité sera donc hybride : une collaboration étroite entre la machine et l’humain, où chacun renforce l’autre.

Pour aller plus loin : AIOps : comment l’intelligence artificielle transforme la gestion des opérations IT ?

Conclusion : de la forteresse au système vivant

La cybersécurité n’est plus un service en bout de chaîne. Elle s’est transformée en une culture partagée, intégrée et intelligente. Entre intégration DevSecOps, normalisation internationale, souveraineté numérique et assistance par l’IA, elle forme désormais un écosystème adaptatif, en perpétuelle évolution.

Le monde numérique de demain ne sera pas exempt de risques. Mais il sera plus conscient, plus réactif et plus résilient, non pas parce qu’il élimine la menace, mais parce qu’il apprend à vivre avec elle, à la comprendre, et à s’y adapter.

AI Engineer Summit Paris 2025 : retour sur les tendances et les sujets techniques

Le Rhino — Wed, 15 Oct 2025 08:38:34 +0000

Le dernier AI Engineer Summit à Paris a marqué une accélération visible du paysage IA européen, avec un basculement du centre de gravité qui quitte San Francisco pour une scène parisienne en pleine effervescence. Voici un tour d’horizon des points saillants et des implications pour l’ingénierie IA moderne, à partir des présentations et des discussions les plus marquantes du sommet.

Neo4j et le « state in AI » : le rôle central des graphes

L’équipe Neo4j a présenté des avancées remarquables sur la gestion du « state » en IA, notamment avec GraphRAG : une technologie illustrée aussi lors du AWS Summit, axée sur la récupération augmentée par graphes. GraphRAG permet de structurer et d’unir automatiquement des concepts semi-structurés, grâce à des modules de NER (Named Entity Recognition) robustes. Cette approche facilite une gouvernance fine du contexte et du « state » d’agents intelligents, un point critique pour l’industrialisation de workflows complexes.

ZML : attention sur CPU, optimisations d’Inference

L’une des présentations les plus techniques venait de ZML, qui a montré comment il est possible de faire tourner des modules attention sur CPU, en douceur et sans nécessiter de GPU massif. On voit ici un mouvement vers des infrastructures IA plus démocratiques : la capacité à faire tourner des modèles avancés sur du matériel grand public, ce qui ouvre la porte à de nouveaux usages pour PME ou pour de l’edge computing.

MCP Server GitHub : orchestrer la production IA

Le serveur MCP sur GitHub s’est imposé comme une pièce maîtresse de l’orchestration IA en production. Il permet d’automatiser la gestion du contexte à très grande échelle, rendant possible le suivi de milliersvoire de millions, de requêtes simultanées avec des agents SWE. Ce genre d’infrastructure est la colonne vertébrale de projets IA industriels, où la robustesse et le monitoring deviennent indispensables.

Migration de code automatique via LLMs : Spotify et d’autres

Un cas d’usage impressionnant a été la migration automatique de bases de code chez Spotify, exploitant les LLMs (Large Language Models) pour traduire et refactorer du code. Cette tendance, adoptée également par d’autres entreprises, illustre la capacité croissante des LLMs non seulement à assister le développement, mais à transformer activement l’infrastructure technique d’une entreprise tout en minimisant le downtime et les risques habituels associés à une réécriture manuelle.

Agents SWE : le nouveau paradigme

Presque toutes les discussions tournaient autour des SWE Agents. On assiste à un shift réel : jusqu’en 2023-24, le développement IA ressemblait encore à une discipline expérimentale, souvent concentrée à San Francisco. Mais le sommet a montré que Paris devient rapidement un centre de gravité pour l’ingénierie AQ, avec des agents qui entrent dans les chaînes de production de façon structurée et fiable. L’agent n’est plus un simple « demo », mais s’intègre dans des architectures avec bases de données dédiées, monitoring, logique transactionnelle bref, comme n’importe quelle composante logicielle mature.

Optimisation d’inférence

Presque tous les exposants ont abordé le sujet des optimisations du runtime : compression de modèles, exécution locale, hardware dédié, quantization et exploitation de frameworks comme MLX pour des inférences efficaces sur Mac Studio. On note une nette avancée dans la capacité à alléger les coûts d’exploitation, critique pour l’adoption à grande échelle en entreprise.

Context Engineering

Le concept de Context Engineering a pris une place centrale. Les équipes insistent désormais sur la nécessité de modéliser le contexte (historique utilisateur, tâches en cours, état transactionnel) pour obtenir une IA fiable et pertinente. Cela passe par l’utilisation couplée de bases graphes (Neo4j, GraphRAG) et de pipelines NER pour structurer automatiquement l’information.

Open Source et HF

Hugging Face a tenu une présentation sur les modèles open source et leur déploiement local dans des environnements d’entreprise, voire sur des Mac Studio dans des mallettes portables. On voit ici une vraie démocratisation technique : plus besoin de clusters cloud colossaux pour s’approprier l’IA en interne.

Pourquoi Paris devient clé pour l’AI Engineering

Plusieurs intervenants ont souligné ce virage géographique : alors que la Silicon Valley dominait l’innovation IA jusqu’en 2023, Paris attire désormais des équipes, des startups et des projets majeurs. La communauté locale mise sur la fiabilité, la scalabilité et l’intégration technique (base de données, monitoring, pipelines robustes), transformant l’IA de gadget en composante logicielle solide et industrialisée.

Conclusion technique

La qualité, la gouvernance du contexte et la robustesse sont désormais au centre du discours sur l’ingénierie AI, loin des démonstrations de surface. Les pratiques d’optimisation, l’orchestration MCP, la migration automatique par LLMs et l’intégration de bases graphes montrent que Paris n’est pas en train de simplement imiter la Silicon Valley, mais d’imposer un rythme propre, très orienté production et fiabilité logicielle. Toute entreprise cherchant à solidifier sa stratégie IA gagnerait à explorer ces innovations désormais accessibles depuis la scène parisienne.

Amazon S3 Vectors : Object Serverless Vector Database

Le Rhino — Mon, 21 Jul 2025 09:21:08 +0000

Amazon S3 Vectors, annoncé récemment en avant-première, représente la première solution de stockage cloud avec support natif pour les vecteurs, réduisant jusqu’à 90% les coûts de chargement, stockage et requêtes de vecteurs tout en offrant des performances de requête sous la seconde.

Contrairement à Aurora Serverless qui n’est pas entièrement serverless, S3 Vectors propose une véritable architecture intégrée nativement avec Amazon Bedrock Knowledge Bases pour des applications RAG optimisées.

La première solution vectorielle native

S3 Vectors se distingue comme la première solution native d’AWS entièrement conçue pour le stockage et querying de vecteurs à grande échelle.

Contrairement aux alternatives comme Pinecone qui sont hébergées sur d’autres clouds, S3 Vectors offre une intégration transparente dans l’écosystème AWS avec une approche réellement serverless, éliminant toute nécessité de provisionner ou gérer l’infrastructure sous-jacente. Cette solution introduit les « vector buckets » avec un ensemble d’API dédiées, permettant d’organiser vos données vectorielles dans jusqu’à 10 000 index par bucket, chacun pouvant contenir des dizaines de millions de vecteurs.

L’architecture de S3 Vectors optimise automatiquement les performances prix/performance à mesure que vos datasets évoluent.

Son intégration native avec Amazon Bedrock Knowledge Bases et SageMaker Unified Studio facilite le développement d’applications RAG (Retrieval-Augmented Generation), tandis que sa compatibilité avec Amazon OpenSearch Service permet une stratégie de stockage hiérarchisée, conservant les vecteurs peu interrogés dans S3 Vectors pour réduire les coûts, tout en permettant de les déplacer rapidement vers OpenSearch lorsque les demandes augmentent.

Cette approche équilibrée permet aux développeurs de gérer efficacement des charges de travail vectorielles à grande échelle avec une cohérence forte des données et une évolutivité élastique.

Comparaison avec Aurora Serverless

Aurora Serverless v2 présente certaines limitations qui compromettent sa nature « serverless », contrairement à S3 Vectors. Bien qu’il offre un scaling automatique pour les charges de travail variables, le “scale to zero” exige que la base de données s’arrête complètement et mette un certain temps à se rallumer, ce qui ne permet pas d’apporter des réponses automatiques et sans serveur en même temps.

Aurora Serverless offre des avantages comme la gestion simplifiée des capacités et une mise à l’échelle plus rapide que sa version v1, mais reste fondamentalement une solution de base de données relationnelle adaptée aux workloads SQL traditionnels.

En revanche, S3 Vectors est conçu spécifiquement pour les opérations vectorielles, avec une facturation véritablement à l’usage et sans capacité minimale à provisionner.

Cette différence fondamentale fait de S3 Vectors la première solution AWS authentiquement serverless pour le stockage et la recherche vectorielle, offrant une intégration native avec Bedrock Knowledge Bases que les solutions relationnelles ne peuvent égaler en termes d’efficacité coût-performance.

S3 Vectors vs Pinecone

Lorsqu’on compare S3 Vectors à Pinecone, plusieurs différences techniques émergent.

Pinecone, conçu spécifiquement comme base de données vectorielle, offre des performances impressionnantes avec des latences de 7ms p99 pour des ensembles de données à l’échelle du milliard et plus de 10 000 requêtes par seconde sur une infrastructure standard. Son architecture « vector-first » permet des mises à jour d’index en temps réel et des fonctionnalités avancées de filtrage par métadonnées.

Cependant, S3 Vectors présente des avantages économiques considérables avec sa réduction des coûts jusqu’à 90% par rapport aux solutions existantes.

Contrairement à Pinecone qui nécessite une infrastructure dédiée, S3 Vectors s’intègre nativement à l’écosystème AWS sans nécessiter de provisionnement complexe.

Les benchmarks montrent que Pinecone surpasse Amazon OpenSearch en termes de rapidité (42 minutes contre 15+ heures pour insérer 10 millions de vecteurs) et de précision (9% plus précis), mais ces comparaisons n’incluent pas encore S3 Vectors.

L’avantage principal de S3 Vectors réside dans son intégration directe avec Bedrock Knowledge Bases, éliminant les frais de transfert de données entre services et offrant une véritable approche serverless sans les limitations observées dans d’autres solutions vectorielles « serverless » qui imposent souvent des limites de ressources ou des coûts minimums.

Game-Changing Vector Storage

L’introduction d’Amazon S3 Vectors marque une évolution significative dans le paysage des solutions vectorielles serverless.

En tant que première solution de stockage d’objets cloud avec support natif pour les vecteurs, S3 Vectors réduit drastiquement les coûts d’utilisation des vecteurs jusqu’à 90%, tout en offrant des performances de requête sous la seconde sans aucune infrastructure à provisionner. Cette approche « pay-for-what-you-use » élimine les coûts d’inactivité qui pèsent sur d’autres solutions prétendument serverless.

L’intégration native avec Amazon Bedrock Knowledge Bases positionne S3 Vectors comme solution idéale pour les applications RAG, tandis que sa compatibilité avec OpenSearch permet une stratégie de stockage hiérarchisée économique. La capacité à organiser jusqu’à 10 000 index par bucket, chacun contenant des dizaines de millions de vecteurs, offre une flexibilité inégalée pour les applications d’IA à grande échelle.

Pour les développeurs cherchant une solution vectorielle véritablement serverless dans l’écosystème AWS, S3 Vectors représente une avancée décisive qui combine durabilité, performance et rentabilité sans les limitations des alternatives existantes.

Lambda Lens : découverte et analyse automatisées des fonctions Lambda avec l’IA

Le Rhino — Mon, 07 Jul 2025 10:38:44 +0000

Alors que les entreprises adoptent de plus en plus des architectures serverless, le nombre de fonctions AWS Lambda dans les environnements AWS peut rapidement atteindre des centaines ou des milliers.

Cette prolifération crée un défi opérationnel important : comment les équipes de développement découvrent, comprennent et maintiennent efficacement la visibilité sur leur inventaire de fonctions Lambda ?

LambdaLens relève ce défi grâce à une base de connaissances alimentée par l’IA qui indexe, analyse et fournit automatiquement des capacités de recherche sémantique pour les fonctions Lambda.

L’outil est disponible directement sur github.

Le problème de la gestion des fonctions Lambda en entreprise

Les applications modernes serverless se composent fréquemment de nombreuses fonctions Lambda qui évoluent indépendamment, souvent développées par différentes équipes avec des normes de documentation variables. Les approches traditionnelles de la gestion des fonctions Lambda reposent sur des processus manuels qui n’évoluent pas efficacement.

Les équipes ont généralement recours à la recherche dans la console AWS, à la maintenance de systèmes de documentation distincts, ou dépendent de connaissances tribales pour comprendre les objectifs et les relations des fonctions.

Les frais généraux opérationnels deviennent substantiels si l’on considère que les développeurs passent beaucoup de temps à localiser les fonctions pertinentes, à comprendre les détails de leur mise en œuvre et à déterminer leur rôle au sein d’architectures d’applications plus vastes. Cette inefficacité s’aggrave au fur et à mesure que les organisations étendent leur empreinte sans serveur, ce qui conduit à des silos de connaissances et à une réduction de la vitesse de développement.

Architecture technique et mise en œuvre

LambdaLens met en œuvre une architecture serverless (Aurora Serverless/Lambda) qui s’appuie sur AWS Bedrock pour des capacités d’analyse de code et de recherche sémantique.

Le système se compose de deux fonctions Lambda principales :

un indexeur qui traite les métadonnées et le code des fonctions,
un gestionnaire de requêtes qui répond aux recherches en langage naturel.

Le composant indexeur découvre systématiquement les fonctions Lambda sur le compte AWS, en extrayant à la fois les métadonnées (variables d’environnement, couches, horodatage de la dernière mise à jour) et le code source.

Ces informations sont traitées par les modèles de langage d’AWS Bedrock pour générer des embeddings sémantiques. Les données traitées sont stockées dans une base de données Aurora RDS configurée dans un VPC pour l’isolation de la sécurité.

L’interface de requête accepte les questions en langage naturel sur les fonctions Lambda et utilise la recherche de similarité vectorielle pour identifier les fonctions pertinentes basées sur la signification sémantique plutôt que sur les correspondances exactes de mots clés.

Cette approche permet aux requêtes telles que « fonctions qui traitent l’authentification de l’utilisateur » ou « lambdas qui interagissent avec les buckets S3 » de renvoyer des résultats précis même lorsque les termes de recherche n’apparaissent pas directement dans les noms ou les descriptions des fonctions.

Exigences de déploiement

Le déploiement de l’infrastructure utilise Terraform pour un provisionnement reproductible dans tous les environnements. Les principaux composants sont les suivants :

Configuration VPC : l’instance RDS fonctionne dans un subnet privé, nécessitant des endpoints VPC pour l’accès aux services externes.
Points d’extrémité VPC : les points d’extrémité d’interface pour Bedrock, Secrets Manager et les services Lambda permettent une communication sécurisée à partir des fonctions basées sur le VPC.
Instance RDS : la base de données PostgreSQL stocke les métadonnées des fonctions, les embeddings et les résultats d’analyse.
Rôles IAM : permissions granulaires pour l’exécution Lambda, l’accès RDS et l’invocation du modèle Bedrock.

Le processus de déploiement comprend trois étapes séquentielles : le provisionnement de l’infrastructure, la construction d’une image de conteneur et la publication sur ECR, et le déploiement de la fonction Lambda. Cette séparation permet des mises à jour indépendantes de l’infrastructure et du code de l’application.

Avantages pratiques

Découverte des fonctions et documentation

LambdaLens élimine le besoin de cataloguer manuellement les fonctions en maintenant automatiquement un inventaire à jour de toutes les fonctions Lambda. L’analyse alimentée par l’IA génère une documentation complète qui comprend l’objectif de la fonction, les dépendances et les modèles d’intégration sans nécessiter l’intervention du développeur.

Consolidation de la base de connaissances

La capacité de recherche sémantique transforme les connaissances tribales fragmentées en un référentiel centralisé et consultable. Les équipes peuvent interroger le système en utilisant le langage naturel pour comprendre les relations entre les fonctions, identifier les implémentations similaires et localiser les fonctions ayant des capacités spécifiques.

Gouvernance et conformité

Pour les organisations opérant à l’échelle, LambdaLens offre la visibilité nécessaire à une gouvernance serverless efficace. Le système suit les métadonnées des fonctions, les modèles de déploiement et les résultats de l’analyse du code, ce qui permet d’établir des rapports de conformité et de surveiller la cohérence de l’architecture.

Considérations relatives à la mise en œuvre

Sécurité et architecture réseau

Le déploiement basé sur le VPC garantit que le code et les métadonnées des fonctions sensibles restent à l’intérieur des limites du réseau privé. Toutefois, les organisations doivent tenir compte des coûts permanents des interface endpoints VPC nécessaires à l’accès aux services d’intelligence artificielle. L’architecture prend en charge le cryptage au repos et en transit, répondant ainsi aux exigences de sécurité de l’entreprise.

Performances et évolutivité

Les performances initiales d’indexation dépendent du nombre de fonctions Lambda et de la complexité de leur code. Les organisations disposant de vastes inventaires Lambda doivent s’attendre à ce que les opérations d’indexation prennent plusieurs heures pour la configuration initiale, bien que les mises à jour ultérieures se traitent de manière incrémentielle. Les performances des requêtes permettent généralement d’obtenir des résultats en quelques secondes pour des recherches en langage naturel sur des milliers de fonctions.

Maintenance et opérations

Une fois déployée, LambdaLens ne nécessite qu’un minimum d’opérations. La maintenance régulière consiste à surveiller l’utilisation du stockage RDS et les quotas de l’API Bedrock pour garantir une disponibilité constante du service.

Conclusion

LambdaLens représente une solution pratique aux défis de gestion des fonctions Lambda des entreprises grâce à des capacités de découverte automatisée, d’analyse alimentée par l’IA et de recherche sémantique. L’architecture serverless de l’outil s’aligne sur les pratiques cloud-natives modernes tout en apportant des améliorations tangibles de la productivité qui justifient les coûts opérationnels.

Pour les organisations qui évaluent l’adoption de LambdaLens, la décision doit être basée sur l’ampleur de l’utilisation de la fonction Lambda, la taille de l’équipe et les exigences de gouvernance. L’outil apporte le plus de valeur dans les environnements avec de nombreuses fonctions, plusieurs équipes de développement et des besoins de visibilité et de documentation complètes sur les fonctions.

IA Générative : comment aller au-delà du POC ?

Le Rhino — Mon, 23 Jun 2025 06:55:46 +0000

IA : les entreprises sont-elles prêtes ?

L’IA générative redessine profondément les modes de travail en entreprise, bien au-delà de la simple innovation technologique.

Pourtant, malgré l’engouement, les chiffres révèlent une réalité plus nuancée : seules 22 % des entreprises se disent aujourd’hui prêtes à industrialiser ces solutions. La maturité reste faible, les cas d’usage sont encore en cours d’exploration et la gouvernance peine parfois à suivre.

Face à cela, il est préconisé d’adopter une approche méthodique qui place la création de valeur métier au cœur de chaque initiative, tout en bâtissant un cadre solide pour déployer l’IA générative à grande échelle.

Cet article s’appuie sur les chiffres et enseignements issus de l’enquête « Tendances Infrastructures IT 2025 », menée par Synapsys en partenariat avec le CRiP.

IA générative : mais de quoi parle-t-on concrètement ?

L’IA générative désigne des modèles capables de produire du contenu original à partir d’une simple requête : texte, code, image, vidéo ou données structurées. Contrairement aux approches traditionnelles d’IA, qui classent ou prédisent à partir d’exemples passés, l’IA générative crée de nouveaux contenus grâce à des modèles de type LLM (Large Language Models) ou diffusion models.

Ces technologies s’appuient sur des milliards de données et un entraînement massif pour générer des résultats proches de ce qu’un humain pourrait produire… avec la capacité de le faire à très grande vitesse et à l’échelle.

Productivité, automatisation, personnalisation : les promesses tenues de l’IA générative

L’intérêt des DSI pour l’IA générative est directement lié à son potentiel de transformation opérationnelle : 58 % des décideurs interrogés dans notre enquête prévoient d’investir dans la GenAI en 2025. Parmi ses avantages concrets et observables dès les premiers PoC :

Gain de productivité sur les tâches répétitives et à faible valeur ajoutée : rédaction, support, analyse documentaire.
Personnalisation des interactions clients ou collaborateurs.
Automatisation de processus métiers complexes.
Support métier augmenté avec des copilotes IA pour les RH, la data, la cybersécurité, le développement applicatif, etc.
Réduction des coûts sur certains processus internes ou services support.

Roadmap IA : partir des besoins métiers

Tester, itérer, valider : l’étape clé des PoC

Avant de se lancer dans le déploiement à grande échelle, l’heure est à la structuration. L’élaboration de la roadmap permet de prioriser les cas d’usage à forte valeur ajoutée et alignés sur les objectifs des directions métiers. L’IA générative n’est pas une fin en soi, mais un moyen de répondre à des problématiques concrètes : automatisation, personnalisation, productivité.

Les PoC (Proof of Concept) sont aujourd’hui un passage obligé, près d’un décideur sur deux passe par une phase de test avant d’industrialiser. Ces pilotes permettent de tester les cas d’usage en conditions réelles avant tout passage à l’échelle. Un PoC bien mené permet :

de démontrer rapidement des gains opérationnels concrets,
d’impliquer les utilisateurs finaux et de construire une logique d’adoption,
d’évaluer les risques (hallucinations, dépendance à des modèles externes, latence…),
d’ajuster les modèles avant l’industrialisation.

Les PoC réussis sont souvent ceux qui intègrent des données internes qualifiées et sont co-construits avec les métiers concernés.

Former les équipes pour assurer l’adhésion

Une IA bien intégrée ne se décrète pas, elle se construit avec les équipes. 37 % des décideurs identifient la formation comme un levier critique de réussite. Il s’agit :

d’éviter le shadow IT, où chacun utilise son outil non référencé,
de donner aux collaborateurs des repères clairs sur les bonnes pratiques,
d’accompagner les usages dans les outils métiers existants.

L’acculturation à l’IA ne peut pas être laissée au seul volontarisme des collaborateurs : elle doit faire l’objet d’un plan structuré, outillé et mesuré.

Gouvernance, données, sécurité : les fondations à poser

Gouvernance : ne pas laisser l’IA se développer sans cadre

Les entreprises qui ne définissent pas de politique claire s’exposent à une prolifération de solutions non contrôlées, avec des conséquences potentiellement graves sur la sécurité, la conformité ou la cohérence du SI. Une gouvernance IA efficace repose sur :

des règles d’usage partagées et documentées,
des métriques de suivi pour évaluer l’impact,
une implication croisée des fonctions IT, juridique, sécurité et métiers.

Mettre la donnée au service de l’IA, pas l’inverse

Sans une base de données fiable, pas d’IA performante. Trop d’entreprises sous-estiment encore l’importance de nettoyer, structurer et gouverner leurs données. La qualité, la traçabilité et l’accessibilité des données sont des fondations à poser dès les premières étapes du projet. Ce chantier, trop souvent sous-estimé, conditionne en grande partie la performance et la fiabilité des projets d’IA générative.

Industrialiser en ciblant les bons usages

Éviter les hallucinations : aller vers des applications sur mesure

Les modèles généralistes d’IA générative peuvent produire des résultats biaisés ou erronés, que l’on appelle hallucinations. Pour gagner en efficacité, les entreprises se tournent de plus en plus vers des applications verticalisées, conçues pour leurs besoins spécifiques. On observe une tendance claire à créer des IA :

embarquées dans les outils métier,
conçues pour répondre à un usage précis,
testées avec des données internes qualifiées.

L’industrialisation : prochaine étape, encore peu mature

22 % des décideurs seulement déclarent être prêts à passer à l’échelle. Ce chiffre révèle à la fois l’ambition des entreprises et les défis encore à relever : sécurisation des usages, mise à l’échelle des infrastructures, accompagnement du changement.

Conclusion

Les chiffres parlent d’eux-mêmes : près de 6 décideurs sur 10 vont investir dans l’IA dès 2025. Ils ne cherchent pas à suivre la tendance, mais à construire une stratégie durable et utile.

Les organisations qui réussiront seront celles qui auront identifié des cas d’usage métier concrets, su impliquer leurs collaborateurs, construit une gouvernance robuste, et surtout, mis la donnée au service de la performance IA.

AIOps : comment l’Intelligence Artificielle transforme la gestion des opérations IT ?

Jules Bulbul — Mon, 23 Jun 2025 06:46:18 +0000

Depuis toujours mais encore plus ces dernières années, les DSI sont confrontées à de nombreux défis en matière de gestion des opérations IT (ITOps) : explosion du volume de données, incidents fréquents, alertes en continu, infrastructures distribuées, hausse des cyberattaques, et attentes croissantes en matière de disponibilité.

Face à cette réalité, une approche s’impose progressivement : l’AIOps.

Qu’est-ce que l’AIOps ?

AIOps (Artificial Intelligence for IT Operations) désigne l’utilisation de l’intelligence artificielle et du machine learning pour automatiser et améliorer la gestion des opérations informatiques. Elle s’appuie sur l’analyse en temps réel des données opérationnelles (logs, métriques, événements, traces…) pour aider les équipes IT à mieux comprendre, anticiper et résoudre les incidents.

Pourquoi l’AIOps devient indispensable ?

L’objectif de l’AIOps n’est pas seulement de « faire mieux », mais de changer d’échelle. Voici quelques bénéfices concrets :

Automatiser la détection et l’analyse des incidents en identifiant des anomalies qui échapperaient à une supervision humaine.
Anticiper les défaillances grâce à des modèles prédictifs.
Réduire le bruit des alertes en corrélant celles qui sont liées.
Optimiser les performances tout en limitant les interventions manuelles.

L’AIOps aide ainsi à passer d’une gestion réactive à une stratégie proactive voire autonome.

Cas d’usage concrets de l’AIOps

Voici quelques scénarios typiques dans lesquels une solution AIOps peut faire la différence :

Détection d’anomalies en temps réel

En analysant les métriques système (CPU, mémoire, latence, nombre de requêtes…), l’AIOps peut repérer des comportements inhabituels et déclencher des alertes pertinentes. Cette détection peut s’adapter dynamiquement au contexte, contrairement aux seuils fixes classiques.

Corrélation intelligente d’alertes

Un même incident peut générer des dizaines d’alertes dans des outils différents. L’AIOps regroupe, filtre et priorise ces signaux pour ne garder que ce qui est utile. Cela réduit considérablement le temps moyen de résolution (MTTR).

Automatisation des réponses

En combinant la détection d’incidents avec des playbooks automatisés (scripts Ansible, Terraform, appels API…), on peut déclencher des actions sans intervention humaine. Exemple : redémarrer un service, re-scaler un pod Kubernetes, ou ouvrir un ticket.

Optimisation des ressources

Grâce à l’analyse des tendances d’usage, l’AIOps peut recommander ou déclencher automatiquement des ajustements : scaling horizontal/vertical, réallocation mémoire, ajustement de limites CPU, etc.

Analyse de logs par IA

Les LLM (Large Language Models) permettent d’interroger les logs en langage naturel, d’extraire des insights, ou même de générer automatiquement un RCA (Root Cause Analysis) clair et synthétique.

Pour aller plus loin : Fine-Tuning et Instruct Tuning LLM : adapter ses modèles de langage

Supervision des sauvegardes

L’IA peut vérifier si les sauvegardes se sont déroulées correctement, détecter les anomalies récurrentes et recommander des améliorations en fonction du contexte d’activité.

Architecture type d’un système AIOps

Une solution AIOps efficace repose sur plusieurs briques :

Sources de données : logs (Loki, Elasticsearch), métriques (Prometheus, Datadog), traces (Jaeger)
Pipeline d’ingestion : Fluentd, Logstash, Beats
Analyse IA/ML : modèles supervisés et non-supervisés (scikit-learn, Prophet), LLM (OpenAI, Mistral)
Automatisation : GitOps, Terraform, Webhooks
Visualisation : Grafana, Kibana, dashboards personnalisés

L’ensemble doit s’intégrer dans l’écosystème de supervision déjà en place, sans tout reconstruire.

Prérequis pour réussir un projet AIOps

Pour que l’AIOps soit un levier et non une usine à gaz, certains prérequis sont essentiels :

Disposer de données exploitables : logs structurés, métriques historisées, accès aux traces.
Avoir une culture DevOps ou SRE : l’AIOps complète des pratiques d’observabilité déjà existantes.
Des APIs disponibles pour orchestrer les actions correctives.
Une volonté de transformation dans les équipes : l’IA doit être un outil, pas une boîte noire imposée.

Alerte : les risques de Shadow IT et de fuite de données

Utiliser des outils IA dans l’IT peut ouvrir la porte à des risques de sécurité, notamment :

Des logs contenant des informations sensibles (adresses IP, tokens, identifiants) peuvent être exposés si intégrés à des services publics comme ChatGPT.
Le Shadow IT (usage non encadré de services externes) échappe aux règles de sécurité internes.
Le manque de gouvernance IA peut entraîner des erreurs, biais, ou fausses décisions automatisées.

Découvrir notre offre : Data for Ops, donnez du sens aux données

Les bonnes pratiques à adopter

Établir une charte d’usage de l’IA et désigner un référent IA/Sécurité.
Favoriser des solutions privées ou auto-hébergées pour l’analyse sensible.
Former les équipes aux nouveaux outils pour une adoption responsable et sécurisée.

La méthode Synapsys pour un AIOps maîtrisé

Chez Synapsys, nous accompagnons les organisations selon une démarche simple et agile :

Audit & diagnostic : état des lieux des outils, données disponibles, cas d’usage pertinents.
Prototype AIOps : test rapide d’un premier scénario concret (détection d’anomalies, analyse logs…).
Déploiement progressif : intégration dans l’écosystème existant.
Formation et acculturation : pour embarquer toutes les parties prenantes.

L’AIOps, une révolution à portée de main

L’AIOps n’est pas une mode. C’est une réponse à la surcharge informationnelle et à la nécessité d’aller plus vite, sans sacrifier la qualité ni la sécurité.

Mais pour qu’elle porte ses fruits, l’AIOps doit être intégrée avec méthode, expérimentée avec bon sens et pilotée avec vision.

Comment déployer une IA locale et privée sur macOS ?

Le Rhino — Fri, 13 Jun 2025 14:28:02 +0000

La situation du Machine Learning sur macOS a beaucoup évolué ces dernières années, transformant les ordinateurs Apple en stations de travail ML capables d’exécuter des modèles d’IA localement.

Ce changement offre de nouvelles façons pour les organisations de déployer le Machine Learning, avec des avantages en matière de confidentialité, de performance et de facilité d’utilisation pour les applications d’entreprise.

L’écosystème ML de macOS présente une alternative aux solutions traditionnelles basées sur GPU, en particulier pour les charges de travail d’inférence et l’edge computing où la confidentialité des données et le traitement local sont importants.

Neural Engine : l’accélérateur IA dédié d’Apple

Le Neural Engine est le matériel spécialisé d’Apple pour accélérer le Machine Learning sur les ordinateurs Mac. Introduit avec la puce A11 Bionic en 2017, il est désormais standard dans les processeurs Apple Silicon, y compris les puces de la série M. La génération M4 offre 38 billions d’opérations par seconde (TOPS), contre 18 TOPS pour le M3.

Le Neural Engine est optimisé pour les opérations courantes dans le Machine Learning, en particulier l’inférence de réseaux neuronaux.

Les applications d’IA en temps réel comme Face ID, Siri et la réalité augmentée utilisent ses capacités de traitement. En photographie computationnelle, il gère des fonctionnalités comme Smart HDR et le mode Nuit en traitant les données du capteur pour améliorer les images. L’efficacité énergétique du Neural Engine est utile lorsque la consommation d’énergie est une préoccupation. Il peut gérer des tâches d’IA en temps réel avec un impact minimal sur la batterie, adapté aux stations de travail mobiles et à l’edge computing.

Son intégration avec Core ML permet aux développeurs d’accéder à ses capacités sans programmation spécialisée. Cela prend en charge des applications comme la reconnaissance d’objets, le traitement du langage naturel et la détection de gestes.

Cependant, le Neural Engine est principalement destiné à des opérations spécifiques de réseaux neuronaux et peut ne pas être optimal pour toutes les charges de travail ML. Il privilégie la vitesse d’inférence et l’efficacité énergétique plutôt que la flexibilité nécessaire pour une formation complexe.

MLX : le framework d’Apple pour Apple Silicon

MLX est le nouveau framework de Machine Learning d’Apple, conçu pour les processeurs Apple Silicon. Développé par l’équipe de recherche en ML d’Apple, MLX fournit un cadre de tableau similaire à NumPy et PyTorch, avec de bonnes performances sur les Macs avec les puces de la série M.

MLX a un modèle de mémoire unifié où les tableaux sont en mémoire partagée, permettant des opérations sur n’importe quel appareil pris en charge sans transfert de données. Cette conception réduit les goulots d’étranglement de la mémoire et améliore les performances pour les opérations de modèles complexes.

Le « calcul paresseux » de MLX signifie que les tableaux ne sont matérialisés que lorsque cela est nécessaire, optimisant ainsi la mémoire et l’efficacité computationnelle. Il prend en charge la construction de graphes dynamiques, de sorte que la modification des formes d’entrée ne nécessite pas de recompilation et le débogage est simple. Cela peut conduire à une itération et une expérimentation plus rapide.

MLX a montré des améliorations de performances dans les environnements d’entreprise. Le cadre prend en charge l’exécution CPU et GPU sur Apple Silicon, en utilisant toutes les ressources de calcul disponibles.

MLX comprend des packages de niveau supérieur comme mlx.nn et mlx.optimizers avec des API compatibles PyTorch, simplifiant la transition pour les équipes familières avec PyTorch. Il prend en charge les transformations de fonctions composables pour la différenciation automatique, la vectorisation et l’optimisation du graphe de calcul pour le développement ML avancé.

Comparaison des performances : Apple Silicon vs. Solutions GPU de datacenters

La comparaison du Mac Mini M4 d’Apple (configuration avec 32 Go de RAM) avec le NVIDIA A40 (un GPU de datacenter typique) révèle des approches architecturales distinctes affectant les stratégies de déploiement d’inférence.

Le M4 dispose du Neural Engine le plus puissant d’Apple à ce jour, avec des optimisations importantes axées sur l’inférence. Construit sur la technologie 3nm de deuxième génération, le M4 intègre un CPU à 10 cœurs, un GPU à 10 cœurs avec ray tracing accéléré par matériel et une architecture de mémoire unifiée prenant en charge jusqu’à 120 Go/s de bande passante.

Il est toujours minuscule en comparaison avec un A40 :

TFLOPS (FP32 – Calcul GPU traditionnel) :

M4 : 4,6 TFLOPS
A40 : 37,4 TFLOPS

Le NVIDIA A40 offre un calcul de pointe nettement plus élevé avec 37,4 TFLOPS (FP32) et 149,7 TFLOPS (FP16 Tensor), extensible à 299,4 TFLOPS avec l’optimisation de la rareté. Cependant, les FLOPS bruts ne racontent pas toute l’histoire de l’inférence. Le Neural Engine du M4, spécifiquement conçu pour les charges de travail d’IA, atteint une efficacité remarquable dans les scénarios d’inférence du monde réel. Les benchmarks montrent que le Mac Mini M4 peut gérer LLaMA 3 7B à environ 12 tokens/seconde, tout en exécutant confortablement des modèles de 13B de paramètres dans sa mémoire unifiée de 32 Go.

L’architecture de mémoire unifiée du M4 élimine les goulots d’étranglement de transfert de données GPU-CPU traditionnels qui affectent les configurations GPU discrètes. Cet avantage architectural devient crucial pour les charges de travail d’inférence où les modèles d’accès à la mémoire comptent plus que le calcul de pointe. Les 48 Go de GDDR6 de l’A40 avec une bande passante de 696 Go/s offrent une capacité supérieure pour les modèles plus grands, mais la mémoire unifiée de 120 Go/s du M4 offre souvent de meilleures performances effectives pour les modèles tenant dans 32 Go.

Les tests du monde réel révèlent que le M4 excelle dans les tâches d’inférence sur l’appareil comme le sous-titrage audio en temps réel, la reconnaissance d’objets visuels et la suppression d’arrière-plan à 8 FPS pour les modèles de segmentation. Pour les applications gourmandes en inférence nécessitant confidentialité, faible latence et efficacité énergétique, le Mac Mini M4 offre des avantages convaincants avec une consommation d’énergie de 4 watts au ralenti contre 300W TDP pour l’A40. Cependant, pour le service d’inférence à grande échelle ou les modèles dépassant 30 milliards de paramètres, la capacité mémoire supérieure et le débit de calcul brut de l’A40 restent avantageux.

Focus sur l’inférence : forces et limites d’Apple Silicon

L’écosystème ML de macOS est principalement optimisé pour l’inférence, pas pour le training intensif de modèles, s’alignant sur l’accent mis par Apple sur l’edge computing et la confidentialité.

Les capacités d’inférence d’Apple Silicon sont solides pour le traitement en temps réel et la faible latence. L’architecture de mémoire unifiée permet un flux de données efficace pour des tâches comme la classification d’images, le traitement du langage naturel et la vision par ordinateur. Les charges de travail de formation ont des limites.

Apple Silicon ne prend actuellement pas en charge la formation de précision mixte FP16, ce qui peut affecter l’efficacité du training pour les grands modèles. Les caractéristiques thermiques des ordinateurs Mac peuvent également affecter la formation soutenue. Bien qu’efficaces, les tâches à haute performance peuvent entraîner une limitation thermique.

Malgré cela, Apple Silicon est adapté à la formation modérée et aux besoins d’inférence solides, comme l’affinage de modèles pré-entraînés, l’apprentissage par transfert et le développement itératif de modèles. Les fonctionnalités de MLX soutiennent la recherche et le développement.

Considérations stratégiques pour l’adoption en entreprise

Les organisations envisageant le ML sur macOS doivent évaluer plusieurs facteurs :

L’approche unifiée matériel et logiciel peut simplifier le développement et la maintenance.
Le coût comprend le matériel, le temps de développement, la maintenance et l’efficacité opérationnelle.
La facilité d’utilisation pour mettre en œuvre une machine d’inférence localisée/privée avec un Mac mini M4 peut conduire à un coût total de possession favorable.
La confidentialité et la sécurité du traitement local s’alignent sur les exigences réglementaires et les politiques de gouvernance des données.

Cependant, les limitations pour la formation à grande échelle ou l’intégration avec les flux de travail NVIDIA CUDA existants.

Conclusion

L’écosystème de Machine Learning de macOS est une plateforme qui présente des avantages pour des utilisations spécifiques en entreprise, en particulier celles qui nécessitent un traitement local, la confidentialité des données et la facilité de développement. Core ML, MLX et Neural Engine offrent une alternative à l’infrastructure GPU traditionnelle pour les applications axées sur l’inférence.

La mémoire unifiée d’Apple Silicon et l’accélération ML intégrée offrent des avantages en termes de performances pour de nombreuses charges de travail d’entreprise, ce qui simplifie le déploiement. Les outils conviviaux pour les développeurs réduisent les obstacles à l’adoption du ML.

Les entreprises doivent évaluer leurs besoins par rapport aux limites actuelles de l’Apple Silicon, notamment en matière de training et de compatibilité. Sa force réside dans l’inférence, l’informatique et les scénarios critiques en matière de protection de la vie privée.

Pour les entreprises qui mettent en œuvre l’IA avec une gouvernance stricte des données, une dépendance réduite au cloud ou un déploiement plus simple de la ML, l’écosystème ML de macOS est une plateforme en cours de maturation. Son évolution continue laisse présager des capacités croissantes pour l’apprentissage automatique en entreprise.

Si vous souhaitez déployer votre propre chatbot interne, hébergé sur un Mac et entièrement privé et déconnecté d’Internet, nous sommes prêts à discuter !

Inférence locale de LLMs : tutoriel pratique avec Ollama sur macOS

Le Rhino — Thu, 12 Jun 2025 06:56:16 +0000

Le passage à l’inférence locale de grands modèles de langage représente un changement substantiel dans la manière dont les organisations peuvent déployer des capacités d’IA au sein de leur infrastructure.

Cette transition répond aux préoccupations essentielles des entreprises, notamment en ce qui concerne la confidentialité des données, la dépendance vis-à-vis du réseau, l’optimisation de la latence et le contrôle des coûts d’exploitation.

L’inférence locale élimine la nécessité de transmettre des données sensibles à des services externes tout en offrant des performances constantes indépendamment de la connectivité internet.

Base technique et optimisation du matériel

Avantages de l’architecture Mac

La transition d’Apple vers le silicium personnalisé a créé un environnement particulièrement adapté à l’inférence LLM locale. Les processeurs de la série M (M1, M2, M3 et M4) intègrent plusieurs caractéristiques architecturales qui offrent des avantages mesurables pour les charges de travail d’IA.

L’architecture de mémoire unifiée élimine les goulets d’étranglement traditionnels entre les espaces mémoire du CPU et du GPU, ce qui permet un traitement plus rapide des données pour les grandes opérations matricielles courantes dans les modèles de transformation.

Les caractéristiques d’efficacité énergétique de l’Apple Silicon sont particulièrement importantes pour les charges de travail d’inférence continue. Ces processeurs maintiennent des performances élevées tout en consommant beaucoup moins d’énergie que les architectures x86 traditionnelles, ce qui les rend adaptés aux scénarios de déploiement où la gestion thermique et la consommation d’énergie sont des contraintes.

L’optimisation native du cadre d’IA intégrée à macOS améliore encore les performances grâce à des optimisations spécifiques au matériel qui sont automatiquement appliquées aux charges de travail compatibles.

Architecture Ollama et fondation llama.cpp

Au fur et à mesure de l’évolution du scénario LLM, de nombreux services open source ont été développés pour vous aider à déployer facilement des modèles open source localement.

Ollama sert de couche d’abstraction de haut niveau construite sur llama.cpp, qui représente lui-même un portage C++ de l’implémentation originale du modèle LLaMA de Meta. Le projet llama.cpp, initié par Georgi Gerganov en mars 2023, se concentre sur une inférence efficace grâce à un code C++ optimisé qui exploite diverses techniques de quantification pour réduire l’empreinte mémoire tout en maintenant des niveaux de performance acceptables. Cette mise en œuvre permet un déploiement sur du matériel grand public sans nécessiter d’infrastructure GPU spécialisée.

La relation entre Ollama et llama.cpp démontre une approche en couches de l’optimisation de l’inférence locale. Alors que llama.cpp fournit le moteur d’inférence de base avec la prise en charge de 37 architectures de modèles différentes, Ollama ajoute une gestion conviviale des modèles, une modélisation automatique des chats et des flux de travail de déploiement simplifiés. Ollama gère automatiquement les complexités du chargement des modèles, de la gestion de la mémoire et de l’optimisation de l’inférence qui nécessitent autrement une configuration manuelle dans llama.cpp.

Sur un Mac, vous pouvez facilement installer ollama en allant sur leur site internet et en téléchargeant le programme d’installation. Après cela, vous pouvez démarrer le service ollama et y accéder directement via le terminal :

Format GGUF et mise en œuvre de la quantification

Spécifications techniques de GGUF

Pour exécuter des modèles sur Ollama, nous pouvons aller directement sur hugging face et rechercher GGUF, où des milliers de modèles sont disponibles.

Le GGUF (GPT-Generated Unified Format) représente une évolution du format GGML, conçu spécifiquement pour le stockage et le déploiement efficaces de modèles optimisés pour l’inférence. Le GGUF met en œuvre un format binaire qui combine les paramètres du modèle avec les métadonnées essentielles requises pour l’exécution. Le format est extensible tout en conservant une compatibilité ascendante, ce qui permet d’intégrer de nouvelles architectures de modèles sans interrompre les implémentations existantes.

Les fichiers GGUF présentent plusieurs avantages techniques par rapport aux formats de modèles traditionnels. La structure binaire permet des opérations de chargement et d’enregistrement rapides, avec une prise en charge du mappage de la mémoire qui réduit le temps d’initialisation pour les modèles de grande taille.

Avec un modèle GGUF choisi dans HuggingFace, nous pouvons simplement cliquer sur « Use this model » et choisir ollama pour obtenir la commande d’exécution (si vous ne voyez pas ollama, vous devez d’abord le configurer en tant qu’application dans votre profil HuggingFace).

Méthodes de quantification

La quantification dans le contexte du GGUF consiste à réduire les poids du modèle de leur représentation typique en virgule flottante de 16 bits à des formats de moindre précision. Ce processus peut permettre une réduction substantielle de la mémoire – un modèle de 7B paramètres qui nécessite normalement 14 Go de mémoire peut être réduit à environ 4 Go en utilisant une quantification de 4 bits tout en maintenant des niveaux de précision acceptables. GGUF prend en charge plusieurs niveaux de quantification, y compris des représentations sur 8 bits, 4 bits, 3 bits et même 2 bits, ce qui permet un contrôle précis du compromis mémoire-performance.

Le processus de quantification préserve la fonctionnalité du modèle grâce à une sélection minutieuse des poids à quantifier et à la manière de traiter les erreurs de quantification. Cette approche permet généralement d’améliorer les performances par rapport à une quantification uniforme naïve pour tous les paramètres du modèle.

Lorsque l’on choisit des modèles à exécuter localement, il est important de choisir les quantifications car la limite de mémoire est généralement un goulot d’étranglement important au niveau local, et les performances sont à peine dégradées.

Pour certains modèles, vous pouvez voir directement (dans le cas où vous configurez votre matériel sur votre profil), quels modèles vous pouvez exécuter.

Mise en œuvre pratique et interface de commande

Opérations de commandement essentielles

L’interface de commande d’Ollama fournit des capacités complètes de gestion de modèles à travers une structure de commande de type Unix. Le déploiement du modèle commence par la commande

ollama pull

qui télécharge les modèles spécifiés à partir de la bibliothèque Ollama ou de référentiels compatibles.

L’exécution du modèle est lancée à l’aide de la commande:

ollama run

qui charge le modèle spécifié dans la mémoire et fournit une interface interactive. La commande prend en charge des paramètres supplémentaires pour la personnalisation :

ollama run llama3.1:8b --temperature 0.7 --max-tokens 1000

Les opérations de gestion de modèles comprennent:

ollama list

pour afficher les modèles installés avec leurs tailles et leurs dates de modification, et

ollama rm

pour supprimer les modèles et libérer de l’espace disque. La commande

ollama ps

affiche les processus en cours d’exécution, ce qui est utile pour surveiller l’utilisation des ressources dans les environnements de production.

Configuration avancée et personnalisation du modèle

Ollama prend en charge la création de modèles personnalisés grâce aux Modelfiles, qui définissent la manière dont les modèles de base doivent être modifiés ou affinés pour des cas d’utilisation spécifiques.

La commande :

ollama create  -f

construit des modèles personnalisés à partir de ces spécifications. Cette capacité permet aux organisations de créer des variantes de modèles de base spécifiques à un domaine tout en conservant les avantages du format GGUF et de l’inférence locale.

La commande :

ollama show

fournit des métadonnées détaillées sur les modèles installés, y compris le nombre de paramètres, les niveaux de quantification et les besoins en mémoire. Ces informations sont essentielles pour la planification de la capacité et l’allocation des ressources dans les déploiements de production.

Ecosystème du modèle et disponibilité de l’Open Source

La disponibilité de modèles de haute qualité au format GGUF sur des plateformes telles que Hugging Face a considérablement réduit la barrière au déploiement local de capacités d’IA compétitives. Les modèles tels que unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUF représentent des performances de pointe dans des formats compacts et optimisés adaptés au déploiement local. Ces modèles sont accessibles directement via Ollama en utilisant la syntaxe du référentiel Hugging Face :

ollama run hf.co/unsloth/DeepSeek-R1-0528-Qwen3-8B-GGUF:Q4_K_XL.

La famille DeepSeek-R1 démontre la viabilité pratique de l’exécution de modèles avancés sur du matériel standard. La version à 8 paramètres, quantifiée au format Q4_K_XL, fonctionne efficacement sur des systèmes disposant de peu de mémoire vive.

Mode serveur et intégration de l’API

Mise en œuvre du serveur API local

Le mode serveur d’Ollama transforme les modèles locaux en endspoints d’API qui peuvent être intégrés dans des applications et des flux de travail existants. La commande

 ollama serve

lance un serveur local qui expose une API compatible avec OpenAI sur localhost:8080. Cette compatibilité permet une intégration transparente avec les applications existantes conçues pour les services LLM basés sur le cloud, tout en maintenant une exécution locale.

Le mode serveur prend en charge les requêtes HTTP POST standard pour l’achèvement du chat, conformément à la spécification de l’API OpenAI. Les applications peuvent interagir avec les modèles locaux en utilisant des modèles familiers :

curl http://localhost:8080/v1/chat/completions \ 

  -H "Content-Type: application/json" \ 

  -H "Authorization: Bearer no-key" \ 

  -d '{ 

    "messages": [ 

      {"role": "system", "content": "You are a helpful assistant."}, 

      {"role": "user", "content": "Tell me about Synapsys"} 

    ] 

  }'

Intégration avec les cadres de développement

Le serveur API local peut être intégré à des cadres de développement tels que LangChain, qui fournit un support natif pour les endpoints Ollama. Cette intégration permet un prototypage et un déploiement rapides des applications basées sur l’IA sans nécessiter de modifications du code lors de la transition entre les modèles locaux et les modèles basés sur le cloud. L’interface API cohérente permet aux entreprises de développer des applications localement et de les déployer dans différents environnements en fonction des besoins opérationnels.

L’intégration du cadre implique généralement des changements de configuration minimes. Pour LangChain, l’intégration nécessite de spécifier l’endpoint Ollama et le nom du modèle :

from langchain_ollama import OllamaLLM 

llm = OllamaLLM(model="llama3.1:8b") 

response = llm.invoke("Process this customer feedback...")

Considérations relatives à la mise en œuvre par les entreprises

Confidentialité des données et conformité

L’inférence locale répond aux préoccupations fondamentales en matière de confidentialité des données en garantissant que les informations sensibles ne quittent jamais l’infrastructure de l’organisation. Cette approche favorise la conformité avec des réglementations telles que le GDPR et les exigences spécifiques à l’industrie qui limitent le partage des données avec des tiers.

Les organisations qui traitent des données clients confidentielles, de la propriété intellectuelle ou des informations réglementées peuvent exploiter les capacités de l’IA sans les complexités de conformité associées aux services basés sur le cloud.

La capacité de fonctionnement hors ligne offre également une résilience contre les perturbations du réseau et élimine la dépendance à l’égard de la disponibilité des services externes. Cette fiabilité est particulièrement importante pour les applications qui nécessitent des fonctionnalités d’IA cohérentes, telles que les systèmes d’aide à la décision en temps réel ou les applications en contact direct avec la clientèle.

Structure des coûts et gestion des ressources

L’inférence locale transforme les coûts opérationnels du LLM d’un modèle basé sur l’utilisation à un modèle de dépenses d’investissement. Pour les organisations dont les charges de travail d’IA sont prévisibles, ce modèle peut permettre de réaliser des économies substantielles au fil du temps.

Les besoins en matériel pour l’inférence locale continuent de diminuer à mesure que l’efficacité des modèles s’améliore et que les techniques de quantification progressent. Le Mac actuel peut prendre en charge des modèles qui nécessitent une infrastructure de serveur spécialisée il y a seulement deux ans, ce qui rend le déploiement local viable pour un plus grand nombre d’organisations.

Caractéristiques de performance et d’évolutivité

L’inférence locale fournit des caractéristiques de latence cohérentes, indépendantes des conditions du réseau et de la charge des services externes. Les temps de réponse sont déterminés par les capacités matérielles locales plutôt que par la connectivité internet ou les files d’attente des services en cloud. Cette prévisibilité permet des performances d’application plus fiables et une meilleure expérience utilisateur dans les applications sensibles à la latence.

La mise à l’échelle de l’inférence locale nécessite des considérations différentes de celles des services en cloud. Plutôt que de procéder à une mise à l’échelle horizontale par le biais d’augmentations du taux de l’API, le déploiement local se fait par le biais de mises à niveau matérielles ou d’un déploiement distribué sur plusieurs machines.

Les entreprises doivent trouver un équilibre entre la complexité de la gestion de plusieurs nœuds d’inférence et les avantages d’une capacité et d’une redondance accrues.

Conclusion

L’inférence LLM locale à l’aide d’outils comme Ollama représente une approche pratique pour déployer des capacités d’IA tout en maintenant le contrôle sur la confidentialité des données, les coûts opérationnels et les caractéristiques de performance.

La combinaison de formats de modèles optimisés tels que GGUF, de techniques de quantification efficaces et d’optimisations spécifiques au matériel a rendu les modèles d’IA de haute qualité accessibles sur le matériel standard des entreprises.

La maturité de l’écosystème open source, illustrée par la disponibilité de modèles de pointe dans des formats optimisés, offre aux entreprises un accès immédiat à des capacités d’IA compétitives. Les interfaces API normalisées permettent une intégration transparente avec les cadres de développement et les applications existantes, ce qui réduit les obstacles techniques à l’adoption.

Les organisations qui évaluent l’inférence locale doivent tenir compte de leurs exigences spécifiques en matière de confidentialité des données, de structure des coûts, de cohérence des performances et de complexité opérationnelle. La technologie a atteint un niveau de maturité tel qu’elle représente une alternative viable aux services en cloud pour de nombreux cas d’utilisation, en particulier ceux impliquant des données sensibles ou nécessitant des caractéristiques de performance prévisibles.

Si vous souhaitez déployer des modèles open-source localement ou les affiner en utilisant vos exigences/données, nous sommes prêts à discuter !

AIOps vs MLOps : deux visions de l’IA au service de l’IT, quelles différences ?

Le Rhino — Thu, 22 May 2025 12:54:59 +0000

Avec la généralisation de l’IA, deux disciplines montent en puissance au sein des entreprises : l’AIOps et le MLOps. Bien que leurs noms partagent une même racine — l’Ops pour “Operations” — ces deux approches répondent à des objectifs, des publics et des cas d’usage bien distincts.

Derrière ces acronymes, se dessinent en réalité deux manières différentes de mobiliser l’intelligence artificielle dans les systèmes d’information : l’une pour automatiser et optimiser les opérations IT, l’autre pour industrialiser les projets de machine learning. Cet article vous propose d’éclairer leurs différences, leurs complémentarités, et leur rôle dans les stratégies digitales actuelles.

Comprendre l’AIOps : l’IA au service des opérations IT

L’AIOps, pour Artificial Intelligence for IT Operations, désigne l’utilisation de techniques d’intelligence artificielle (principalement le machine learning et l’analyse de données) pour améliorer la gestion, la supervision et la fiabilité des infrastructures IT.

Dans des environnements toujours plus hybrides, dynamiques et distribués, les outils classiques de monitoring ne suffisent plus. L’AIOps intervient pour détecter automatiquement les anomalies, corréler les alertes, prédire les incidents, et dans certains cas, déclencher des remédiations automatiques.

Son objectif est de réduire la charge cognitive des équipes IT, d’accélérer la résolution des incidents et d’automatiser les tâches répétitives qui grèvent la performance des systèmes.

MLOps : industrialiser l’IA comme produit métier

À l’opposé, le MLOps (Machine Learning Operations) s’intéresse non pas aux opérations IT classiques, mais au cycle de vie des modèles d’intelligence artificielle.

Il s’agit d’un ensemble de pratiques, d’outils et de processus permettant de développer, déployer, maintenir et superviser des modèles de machine learning de manière fiable et répétable.

L’objectif du MLOps est de faire passer les projets IA du statut de “preuve de concept” (POC) à celui de produits industriels robustes, mesurables, traçables, et gouvernés dans le temps.

Deux disciplines, deux périmètres

La différence majeure entre AIOps et MLOps réside dans leur finalité.

L’AIOps a pour but de faire fonctionner les infrastructures IT de manière plus intelligente : il s’intègre aux systèmes existants, et l’IA est un moyen d’optimiser les opérations (observabilité, maintenance, supervision, sécurité).

Le MLOps, lui, s’adresse aux équipes data et IA, et vise à fiabiliser les modèles d’IA déployés en production. Ici, l’IA est le produit à livrer et à maintenir (ex : modèle de scoring client, moteur de recommandation, prédicteur de churn…).

Des cas d’usage bien différenciés

Dans une démarche AIOps complète, on cherchera à :

Automatiser la détection d’anomalies sur les serveurs ou containers.
Corréler des alertes venant de différents outils pour réduire le bruit.
Prédire les pannes à partir de tendances de consommation.
Générer des rapports de causes racines automatiquement.

Dans une démarche MLOps, les enjeux seront :

Suivre la performance d’un modèle IA dans le temps.
Mettre à jour régulièrement les modèles avec de nouvelles données.
Déployer automatiquement les modèles via des pipelines CI/CD.
Superviser les dérives de données ou de comportement du modèle.

Des publics et outils différents

L’AIOps concerne essentiellement les équipes IT, DevOps, ingénieurs SRE et responsables d’exploitation. Il s’intègre aux outils comme Grafana, Prometheus, ELK, Ansible, ou OpenAI pour enrichir les capacités de supervision.

Le MLOps est, quant à lui, utilisé par les data scientists, data engineers et développeurs IA. Il mobilise des plateformes comme MLflow, SageMaker, Vertex AI, ou encore Airflow, en s’intégrant aux bonnes pratiques du DevOps (tests, versioning, traçabilité, reproductibilité).

Des logiques complémentaires, pas concurrentes

Si AIOps et MLOps peuvent sembler éloignés, ils sont en réalité complémentaires. L’un facilite la gestion des opérations grâce à l’IA, l’autre facilite la gestion de l’IA elle-même.

On peut même observer des points de convergence. Par exemple, un modèle IA développé dans un cadre MLOps peut être utilisé au sein d’une plateforme AIOps pour analyser les logs ou prédire des anomalies. De même, l’AIOps peut permettre de surveiller la performance en production des modèles ML.

Ces deux pratiques participent à une même tendance de fond : l’automatisation intelligente des systèmes d’information, à tous les niveaux.

Conclusion : quelle approche pour votre entreprise ?

Choisir entre AIOps et MLOps n’a pas toujours de sens : tout dépend de vos enjeux.

Vous cherchez à moderniser vos opérations IT, réduire le temps moyen de résolution des incidents, améliorer la disponibilité de vos services ? L’AIOps est la bonne approche.
Vous développez des modèles IA stratégiques pour votre métier (marketing, finance, production…) et vous voulez fiabiliser leur mise en production ? Le MLOps s’impose comme indispensable.

À terme, ces deux démarches sont appelées à coexister, voire à s’interconnecter dans des architectures de plus en plus intégrées.

AIOps : comment déployer l’IA pour les opérations IT ?

Le Rhino — Thu, 22 May 2025 12:32:53 +0000

L’AIOps (Artificial Intelligence for IT Operations) s’impose comme une réponse technologique incontournable. En combinant intelligence artificielle, machine learning et analyse des données, l’AIOps permet de moderniser la gestion des infrastructures IT en rendant les opérations plus proactives, automatisées et intelligentes.

Dans cet article, nous vous expliquons ce qu’est l’AIOps, à quoi il sert, quels sont ses usages concrets, et comment le mettre en œuvre dans votre entreprise.

Qu’est-ce que l’AIOps ?

Le terme AIOps a été introduit par le cabinet Gartner en 2016 pour désigner l’application de techniques d’intelligence artificielle et de machine learning aux opérations IT.
Concrètement, une solution AIOps collecte des données provenant de différentes sources (logs, métriques, traces, événements) et les analyse en temps réel pour détecter des anomalies, corréler des alertes, prédire des incidents ou encore automatiser des actions correctives.

L’objectif ? Passer d’une supervision réactive (qui réagit après coup aux incidents) à une gestion prédictive et autonome des systèmes IT, avec moins d’intervention humaine sur les tâches répétitives à faible valeur ajoutée.

Pourquoi l’AIOps devient-il essentiel pour les DSI et équipes IT ?

Les environnements IT modernes sont hybrides, distribués, et massivement instrumentés : applications cloud-native, conteneurs, microservices, infrastructures multicloud, etc.
Résultat : les outils de monitoring traditionnels sont dépassés face à la volatilité, au volume de données et à la vitesse des changements.

Voici quelques défis concrets auxquels les DSI sont confrontés :

Trop d’alertes, trop de bruit : des milliers d’alertes générées chaque jour, souvent non corrélées.
Manque de visibilité : les incidents prennent du temps à diagnostiquer.
Temps moyen de résolution (MTTR) trop long.
Risques de rupture de service ou de non-conformité.
Pression sur les équipes IT et DevOps.

L’AIOps aide à relever ces défis en apportant plus de lisibilité, de rapidité et d’automatisation dans les opérations quotidiennes.

Comment fonctionne l’AIOps ?

Une plateforme AIOps s’appuie sur plusieurs composants clés :

1. Collecte de données multi-sources

Elle agrège des flux hétérogènes : logs système, métriques de performance, traces d’exécution, événements applicatifs, tickets d’incidents, etc.

2. Traitement et normalisation

Les données sont filtrées, dédupliquées, mises en cohérence (par exemple via Fluentd, Logstash ou Prometheus).

3. Analyse par intelligence artificielle

Des modèles de machine learning ou de deep learning sont appliqués pour :

Détecter des anomalies (pics anormaux de latence, consommation CPU…).
Corréler des alertes issues de différentes sources pour identifier une cause racine.
Prédire des incidents (grâce à l’analyse des tendances).
Recommander des actions correctives.

4. Automatisation

Des scripts ou runbooks peuvent être déclenchés automatiquement en réponse à un incident détecté (redémarrage de service, scaling Kubernetes, purge cache…).

5. Visualisation et collaboration

Les résultats sont accessibles via des dashboards ou intégrés dans les outils métiers (Slack, Teams, ServiceNow…).

Quels sont les cas d’usage concrets de l’AIOps ?

Voici quelques exemples d’applications très parlantes :

Détection d’anomalies en temps réel : Surveillance automatique de la santé des systèmes : un comportement anormal est immédiatement détecté, avant qu’un utilisateur ne s’en plaigne.
Corrélation d’alertes : Au lieu de remonter 500 alertes isolées, la plateforme AIOps les regroupe et identifie qu’elles ont toutes pour origine une seule panne de base de données.
Automatisation des réponses : Un script Terraform est automatiquement exécuté dès qu’un seuil critique est franchi, évitant une intervention manuelle.
Optimisation des ressources : La solution recommande un scaling dynamique des pods Kubernetes pour améliorer la performance tout en maîtrisant les coûts.
Analyse intelligente des logs : Des modèles de traitement du langage (LLM) analysent les journaux et génèrent automatiquement une synthèse ou une RCA (Root Cause Analysis).

Aller plus loin : Qu’est-ce que l’observabilité et comment ça marche ?

Quels sont les prérequis pour déployer une démarche AIOps ?

Mettre en place une démarche AIOps efficace demande une certaine maturité, tant technique qu’organisationnelle.

Côté technique :

Avoir des sources de données accessibles (logs, métriques, traces).
Disposer d’outils de supervision ou d’observabilité déjà en place.
Pouvoir déclencher des actions via API ou scripts.

Côté organisationnel :

Une culture DevOps ou SRE.
Une volonté d’expérimentation.
Une documentation des incidents passés pour entraîner les modèles.

Comment réussir votre projet AIOps ?

Voici les grandes étapes pour déployer l’AIOps dans votre entreprise :

Audit & diagnostic : Analyse des outils existants, des données disponibles et des processus opérationnels.
Prototype ciblé : Lancement d’un premier cas d’usage (ex. : corrélation d’alertes sur les bases de données).
Déploiement progressif : Intégration avec les outils existants (ELK, Grafana, Kubernetes…).
Formation des équipes : Acculturation à l’IA, gestion des risques de fuite de données, gouvernance IA.
Pilotage et itérations : Amélioration continue des modèles, ajustement des seuils, enrichissement des jeux de données.

Quels sont les bénéfices mesurables de l’AIOps ?

Diminution du MTTR (temps moyen de résolution)
Réduction du volume d’alertes de plus de 50 %
Automatisation de tâches chronophages
Amélioration de la disponibilité et de la qualité de service
Diminution de la charge cognitive des équipes

Conclusion : l’AIOps, une brique stratégique pour l’IT du futur

L’AIOps ne remplace pas les équipes IT : il augmente leur efficacité, en les libérant des tâches répétitives pour les recentrer sur la valeur. En s’intégrant à l’écosystème DevOps et aux pratiques d’observabilité, l’AIOps devient un levier d’innovation, de résilience et de performance.

Chez Synapsys, nous vous accompagnons de bout en bout dans cette transformation : de l’audit initial au déploiement sécurisé, en passant par l’acculturation de vos équipes et le choix des briques technologiques adaptées.

Retour sur l’AWS Summit Paris 2025 : l’IA en vedette

Le Rhino — Fri, 11 Apr 2025 08:53:20 +0000

Après avoir assisté au AWS Summit Paris le 9 avril, je peux résumer l’événement entier en un seul mot : IA.

L’AWS Summit Paris 2025 était effectivement massivement centré sur l’intelligence artificielle, avec presque chaque session et annonce abordant comment l’IA transforme les entreprises à travers différentes industries. Permettez-moi de partager les perspectives et développements les plus significatifs qui pourraient bénéficier à votre organisation.

AWS : les avancées en infrastructure d’IA

Bien que non lancées lors du summit, AWS a mis en avant deux innovations matérielles très intéressantes qui méritent attention :

Les puces Trainium2 sont les accélérateurs d’entraînement d’IA de nouvelle génération d’AWS, conçues pour offrir des améliorations substantielles de performance par rapport à la génération précédente. Ces puces spécialement conçues promettent de rendre l’entraînement des grands modèles d’apprentissage automatique plus efficace et rentable pour les entreprises cherchant à développer des solutions d’IA personnalisées.

Les processeurs Graviton4 représentent l’innovation continue d’AWS dans le cloud computing basé sur Arm. Construits spécifiquement pour les charges de travail cloud, ces processeurs offrent des gains de performance impressionnants tout en maintenant une efficacité énergétique – cruciale pour les organisations cherchant à optimiser leurs dépenses cloud tout en réduisant leur empreinte carbone.

Cas d’utilisation d’IA en entreprise qui ont impressionné à l’AWS Summit

L’AWS summit a présenté plusieurs applications d’IA en entreprise convaincantes qui ont démontré une valeur commerciale tangible :

L’intelligence documentaire de Safran

Le fabricant de moteurs d’avion a développé un outil d’IA interne qui analyse des milliers de documents techniques en quelques secondes pour extraire les exigences réglementaires et les spécifications. Cela a considérablement réduit le temps que les ingénieurs passent à examiner la documentation, leur permettant de se concentrer sur des tâches à plus haute valeur ajoutée.

Safran a également mis en œuvre des systèmes d’IA générative pour aider les ingénieurs de support à trouver rapidement des informations pertinentes pour la maintenance des moteurs d’avion, améliorant significativement les temps de réponse et la qualité du service.

Partenariat entre Mistral AI et Veolia

Mistral AI, une entreprise européenne d’IA en pleine ascension, a mis en avant sa collaboration avec le géant des services environnementaux Veolia. Leur mise en œuvre principale se concentre sur la gestion des connaissances – créant des systèmes qui rendent d’immenses référentiels de connaissances institutionnelles accessibles et exploitables, une application précieuse dont de nombreuses organisations peuvent bénéficier.

RAG amélioré par graphe d’Airbus

Airbus a présenté son approche innovante combinant la Génération Augmentée par Récupération (RAG) avec des bases de données en graphe pour la recherche documentaire. Ce système hybride permet une compréhension plus contextuelle des relations entre les concepts dans la documentation technique, fournissant aux ingénieurs des résultats de recherche plus pertinents.

Derniers développements de modèles

Plusieurs nouveaux modèles d’IA passionnants ont été présentés :

Pixtral Large vient d’être rendu disponible sur AWS Bedrock, élargissant les options pour les entreprises cherchant à mettre en œuvre des capacités d’IA multimodale sans construire d’infrastructure.

Les Modèles de Raisonnement de Mistral arrivent bientôt, l’entreprise annonçant une nouvelle famille de modèles spécifiquement conçus pour des tâches de raisonnement complexes – potentiellement révolutionnaires pour les applications nécessitant des capacités analytiques plus profondes.

La révolution RAG

S’il y avait un thème technique dominant à travers le summit, c’était la Génération Augmentée par Récupération (RAG) et les bases de connaissances. Cette approche de l’IA, qui combine la puissance des grands modèles de langage avec la capacité de récupérer des informations pertinentes à partir de sources de données propriétaires, devient rapidement la norme pour les applications d’IA en entreprise.

Le RAG répond aux limitations clés des LLM traditionnels :

Réduit les hallucinations en ancrant les réponses dans des données factuelles.
Permet aux entreprises d’exploiter des informations propriétaires.
Fournit des réponses d’IA plus transparentes et auditables.
Permet des mises à jour de connaissances en temps réel sans réentraîner les modèles.

Des organisations de toutes tailles mettent en œuvre des systèmes RAG pour rendre leurs connaissances institutionnelles plus accessibles tout en maintenant la précision et la fiabilité des résultats d’IA.

Conclusion sur l’AWS Summit Paris 2025

Le AWS Summit Paris a clairement montré que l’IA a dépassé le cycle du battage médiatique pour entrer dans des applications pratiques et critiques pour les entreprises. L’accent s’est déplacé de la discussion sur le potentiel de l’IA vers la mise en œuvre de solutions spécifiques qui apportent une valeur mesurable, particulièrement dans la gestion des connaissances, le traitement de documents et le support technique.

Pour les responsables informatiques planifiant leur stratégie d’IA, le principal enseignement est que les outils et l’infrastructure pour la mise en œuvre de l’IA en entreprise ont considérablement mûri, avec des options adaptées aux organisations à chaque étape de leur parcours d’IA. Que vous commenciez à explorer les capacités de l’IA ou que vous cherchiez à développer des initiatives existantes, l’écosystème en expansion des services d’IA d’AWS, combiné aux leçons des premiers adoptants en entreprise, fournit une base solide pour le succès.

Model Context Protocol : amélioration des capacités d’IA avec une intégration AWS sécurisée

Le Rhino — Fri, 28 Mar 2025 15:47:27 +0000

Introduction au Model Context Protocol

Comme les LLMs progressent en intelligence étonnamment vite chaque jour, la “next big thing” qui est en discussion dans la communauté LLM est d’ajouter de nouvelles capacités au modèle afin qu’il puisse avoir un comportement plus agentique. Nous avons vu de nombreuses façons de le faire dans le passé, comme l’appel de fonction. Mais à la fin de l’année dernière, Anthropic a créé un protocole permettant d’ajouter facilement de nouvelles fonctionnalités aux LLM (et pas seulement aux siens). Vous pouvez les considérer comme des API pour les LLM et nous allons les explorer dans cet article !

Le Model Context Protocol (MCP) représente une avancée révolutionnaire dans le paysage de l’intelligence artificielle, transformant la façon dont les grands modèles de langage interagissent avec les systèmes externes et les sources de données. Ce protocole standardisé, introduit par Anthropic fin 2024, permet aux assistants IA d’accéder en toute sécurité à des informations en temps réel et d’exécuter des actions au-delà de leurs données d’entraînement. Pour les développeurs travaillant avec les ressources AWS, le MCP offre des possibilités particulièrement intéressantes pour créer des applications plus puissantes et contextuelles tout en maintenant de solides contrôles de sécurité.

Comment fonctionne le Model Context Protocol ?

Le MCP fonctionne comme une interface standardisée — souvent décrite comme un « port USB-C/API pour les applications d’IA » — qui connecte les grands modèles de langage avec des outils externes, des bases de données et des services. Avant le MCP, les modèles de langage étaient essentiellement des systèmes isolés, limités aux connaissances issues de leurs données d’entraînement (et RAG) et incapables d’accéder aux informations actuelles ou à des connaissances spécialisées sans intégrations personnalisées. Cela créait d’importants défis pour les développeurs cherchant à construire des applications d’IA pratiques nécessitant d’interagir avec divers systèmes.

Le protocole suit une architecture client-serveur composée de trois composants principaux :

les Hôtes MCP (applications avec lesquelles les utilisateurs interagissent),
les Clients MCP (ponts connectant les LLM aux serveurs),
les Serveurs MCP (programmes légers exposant des capacités spécifiques au LLM).

Cette architecture permet un flux d’information fluide entre le modèle de langage et les ressources externes sans compromettre la sécurité ni nécessiter d’intégrations personnalisées complexes pour chaque source de données.

Le MCP introduit des interfaces standardisées pour l’interaction avec les données, notamment :

les Outils (actions standard fonctionnant comme des API),
les Prompts (modèles réutilisables pour les interactions courantes),
les Ressources (méthodes cohérentes pour accéder aux données en lecture seule).

Ces interfaces créent un langage commun permettant aux systèmes d’IA d’interagir avec des ressources externes, permettant aux développeurs de construire des applications plus sophistiquées sans la complexité d’intégrations personnalisées pour chaque outil ou source de données.

Intégration du MCP avec les ressources AWS

L’intégration avec AWS représente l’une des applications les plus puissantes du Model Context Protocol.

Grâce à des implémentations de serveurs MCP spécialisés, les assistants IA peuvent interagir directement avec les environnements AWS, permettant l’interrogation et la gestion des ressources cloud par langage naturel. Cela crée des opportunités pour les développeurs de construire des applications pouvant accéder aux services AWS comme DynamoDB, S3, Lambda et plus encore via des interfaces conversationnelles.

L’implémentation AWS MCP s’exécute localement, utilisant les identifiants AWS existants sans les exposer à des services externes. Cela signifie que les informations sensibles comme les clés d’accès et les secrets restent sécurisées sur votre système local et ne sont jamais transmises au modèle d’IA ou à d’autres parties. Le serveur prend en charge plusieurs profils AWS et l’authentification Single Sign-On, permettant un accès sécurisé à différents environnements AWS avec des limites d’autorisation appropriées.

Pour les équipes de développement, cette intégration crée de nouvelles possibilités en matière de productivité. Imaginez demander à un assistant IA de « Montrer les dernières entrées dans notre log depuis DynamoDB » ou « Générer un rapport de tous les buckets S3 qui n’ont pas été consultés au cours des 90 derniers jours. » Ces interactions en langage naturel peuvent considérablement simplifier les flux de travail qui nécessiteraient autrement de naviguer à travers des interfaces de console ou d’écrire des scripts personnalisés.

Architecture de sécurité du MCP

La sécurité constitue un pilier fondamental de la conception du Model Context Protocol. Le protocole implémente des capacités d’autorisation basées sur des normes de sécurité établies, avec des implémentations de transport HTTP+SSE suivant les spécifications OAuth 2.1. Cette approche structurée de l’autorisation et de l’accès aux données crée un cadre qui permet une surveillance et un audit complets des interactions de l’IA avec les ressources externes.

Normalement décrit comme « OAuth pour les agents IA, définissant et contrôlant comment ils accèdent aux outils et aux données ». Cette focalisation sur la sécurité rend le MCP particulièrement adapté aux environnements d’entreprise où la protection des données et la conformité sont des considérations critiques.

Lors de la connexion aux ressources AWS, l’architecture de sécurité du MCP devient particulièrement importante. Le modèle d’exécution locale du protocole garantit que tous les appels d’API AWS proviennent de votre machine plutôt que de serveurs externes, maintenant ainsi votre périmètre de sécurité existant. Cette approche s’aligne sur le modèle de responsabilité partagée d’AWS, donnant aux organisations un contrôle granulaire sur la façon dont les systèmes d’IA interagissent avec leurs ressources cloud.

Mise en œuvre d’un accès en lecture seule aux ressources AWS

L’une des approches les plus courantes et sécurisées pour l’intégration AWS via MCP implique la mise en œuvre d’un accès en lecture seule à des ressources spécifiques. Cela répond au principe du moindre privilège en garantissant que l’assistant IA ne peut effectuer que les opérations spécifiques nécessaires à votre cas d’utilisation, réduisant ainsi les risques potentiels de sécurité.

Pour l’accès à DynamoDB, AWS fournit des modèles de politique IAM spécifiques qui limitent les autorisations aux opérations de lecture uniquement. Une politique exemple pourrait ressembler à ceci :

json
{
  "Version": "2012-10-17",
  "Statement": [
    {
      "Sid": "ReadOnlyAPIActionsOnBooks",
      "Effect": "Allow",
      "Action": [
        "dynamodb:GetItem",
        "dynamodb:BatchGetItem",
        "dynamodb:Scan",
        "dynamodb:Query",
        "dynamodb:ConditionCheckItem"
      ],
      "Resource": "arn:aws:dynamodb:us-west-2:123456789012:table/Books"
    }
  ]
}

En combinant ce type de politique IAM restrictive avec AWS MCP, les développeurs peuvent créer des configurations sécurisées où les assistants IA interrogent les tables DynamoDB en utilisant le langage naturel tout en étant techniquement limités aux opérations de lecture seule. Cette approche peut être étendue à d’autres services AWS comme S3, CloudWatch, et plus encore, chacun avec des limites d’autorisation appropriées définies par des politiques IAM.

Pour les organisations plus importantes, envisagez de créer des rôles AWS dédiés spécifiquement pour l’accès MCP, avec des limites d’autorisation et une surveillance appropriées. Cette approche permet une séparation claire des préoccupations et facilite le suivi et l’audit des actions initiées par l’IA au sein de votre environnement AWS.

Conclusion

Le Model Context Protocol représente une avancée significative dans la façon dont les systèmes d’IA interagissent avec les ressources cloud comme AWS. En fournissant une interface standardisée et sécurisée permettant aux LLM d’accéder à des systèmes externes, le MCP permet de créer des applications plus puissantes et contextuelles tout en maintenant des contrôles de sécurité appropriés. La combinaison de l’interaction en langage naturel avec les ressources AWS crée de nouvelles possibilités pour rationaliser les flux de travail de développement, obtenir des informations à partir des données cloud, et automatiser les tâches routinières.

À mesure que le MCP continue de mûrir et de gagner en adoption dans l’industrie, nous pouvons nous attendre à de nouvelles améliorations de ses fonctionnalités de sécurité et à des capacités d’intégration plus larges. Pour les équipes de développement travaillant avec AWS, le MCP offre un aperçu d’un futur où la frontière entre l’IA conversationnelle et l’infrastructure cloud devient de plus en plus transparente, créant des moyens plus intuitifs et productifs pour construire et maintenir des applications natives cloud.

Si vous voulez commencer à utiliser MCP dans votre entreprise pour améliorer la performance de vos développeurs, ou même si vous êtes plus tôt dans l’implémentation de LLM et que vous voulez commencer à explorer les possibilités, nous sommes prêts à discuter !

Pour aller plus loin

Article – Hallucinations LLM : comment ça marche ?

Article – IAM : les questions à se poser pour sa stratégie cyber

Article – RAG dans Azure : augmenter la puissance des modèles d’IA Générative

GitHub Copilot devient gratuit : un changement majeur dans l’assistance à la programmation

Sébastien Gaitte — Fri, 14 Feb 2025 15:57:13 +0000

Qu’est-ce que GitHub Copilot et pourquoi cet engouement ?

GitHub Copilot, lancé en 2021, est un assistant de programmation basé sur l’Intelligence Artificielle (IA). Son objectif principal consiste à suggérer du code et à faciliter la résolution de problèmes pour améliorer la productivité des développeurs. Depuis son introduction, d’autres outils similaires (Tabnine, Amazon Q, Cursor, Codeium) ont également connu un succès grandissant, reflétant l’intérêt porté à l’automatisation de tâches répétitives lors de l’écriture de code.

Dans le même temps, Google a déclaré que 25 % de son nouveau code était désormais produit par l’IA, avant d’être validé par des ingénieurs. Dans ce contexte, Microsoft a annoncé la gratuité de GitHub Copilot. Cette décision soulève plusieurs questions, notamment celles de son impact sur l’écosystème GitHub et de la stratégie qui sous-tend un tel choix.

GitHub Copilot utilise des modèles de langage (fournis par OpenAI ou Anthropic) afin de proposer des suggestions de code en temps réel. Il peut ainsi générer des blocs de code ou des fonctions complètes en fonction du contexte, dans le but d’accélérer le travail des développeurs. Cette approche offre un aperçu d’un « assistant virtuel », susceptible de réduire la charge de travail répétitive et de renforcer la productivité.

D’autres solutions sont apparues sur le marché (Tabnine, Amazon Q, Cursor, Codeium) pour répondre à la demande croissante de fonctionnalités d’auto-complétion. Le fait que Microsoft intègre désormais Copilot gratuitement dans Visual Studio Code, avec un quota d’utilisations mensuelles, a suscité des interrogations quant à l’équilibre économique de cette offre.

Le modèle économique de GitHub

GitHub génère ses revenus essentiellement grâce à l’hébergement de code et à l’éventail de services qui y sont associés. La plateforme propose plusieurs formules – gratuites ou payantes (Pro, Team, Enterprise) – ainsi que des services complémentaires comme :

GitHub Codespaces : un environnement de développement dans le cloud.
GitHub Advanced Security : un outil de détection de failles et de gestion de vulnérabilités.
Intégration avec Microsoft Azure : une offre cloud permettant de déployer ou d’héberger des applications.

La fidélité de la communauté GitHub est cruciale, car la plateforme doit éviter la dispersion du code vers d’autres systèmes de gestion de versions. Le maintien d’une masse critique de projets hébergés contribue à la stabilité et à la croissance de son modèle économique.

Source : GitHub

Pourquoi Microsoft propose-t-il GitHub Copilot gratuit ?

La décision de rendre GitHub Copilot gratuit repose principalement sur l’objectif de protéger et renforcer la base d’utilisateurs de GitHub. Deux éléments majeurs ressortent :

Concurrence sur le terrain de l’IA

Un assistant IA devenu payant et jugé « indispensable » pourrait inciter des développeurs à explorer d’autres plateformes ou solutions, surtout si celles-ci offraient de meilleures performances ou des prix compétitifs. En proposant Copilot gratuitement, Microsoft réduit l’attrait potentiel de ces concurrents.

Portée réelle de la complétion de code

Certaines études internes et retours de développeurs mettent en avant des bénéfices variables. Il arrive que Copilot génère du code obsolète ou inadapté, imposant une validation supplémentaire. Offrir cet outil sans coût limite les risques de voir des utilisateurs se tourner vers d’autres services, par simple curiosité ou insatisfaction.

Dans tous les cas, le résultat reste le même : la gratuité de Copilot contribue à maintenir les développeurs au sein de l’écosystème GitHub.

Efficacité et limites de GitHub Copilot gratuit

Des retours d’expérience confirment que GitHub Copilot peut fournir des suggestions utiles pour accélérer l’écriture de code, mais il arrive aussi qu’il propose des extraits hors contexte ou erronés. Parmi les points de vigilance fréquemment mentionnés :

Qualité inégale des suggestions : le modèle peut générer du code incorrect ou incomplet, nécessitant une relecture.
Hallucination de code : comme d’autres IA, Copilot peut produire des solutions plausibles mais inexactes.
Licences et sécurité : les développeurs doivent vérifier la conformité des extraits proposés, ainsi que l’absence de vulnérabilités.

D’après les chiffres communiqués par Google, 25 % de leur nouveau code est généré par des IA avant d’être révisé par des ingénieurs, ce qui montre un usage relativement massif de ce type d’assistants. Toutefois, Microsoft souligne l’importance du contrôle humain pour valider chaque contribution.

Stratégies pour optimiser l’usage de GitHub Copilot gratuit

Pour profiter pleinement de Copilot, plusieurs pratiques sont recommandées :

Vérification des suggestions : contrôler la qualité et la pertinence du code généré.
Recoupement avec des sources fiables : utiliser, par exemple, le principe du Retrieval-Augmented Generation (RAG), qui confronte les propositions de l’IA à des bases de connaissances solides.
Processus de revue : privilégier l’analyse par les pairs ou par des outils d’inspection automatique pour limiter les erreurs et les failles de sécurité.
Utilisation ciblée : dans les domaines hautement réglementés comme la santé ou la finance, il peut être utile de définir un périmètre fonctionnel restreint pour les suggestions de l’IA.

Implications à long terme pour GitHub

En proposant Copilot à titre gratuit, Microsoft favorise le maintien et l’expansion de la communauté GitHub. La plateforme, qui compte plus de 150 millions d’utilisateurs, repose largement sur l’hébergement et le partage de code pour assurer ses revenus. Les compléments comme GitHub Advanced Security ou l’intégration Azure élargissent le panel de services proposés aux entreprises et créent des synergies commerciales pour Microsoft.

La gratuité de Copilot peut ainsi être vue comme un atout de fidélisation, encouragée par la volonté de conserver la place prépondérante de GitHub dans le monde du développement. Le service agit également comme une porte d’entrée vers d’autres offres potentiellement payantes, garantissant la croissance du chiffre d’affaires via des solutions plus spécialisées.

Conclusion sur GitHub Copilot gratuit

Le passage de GitHub Copilot à la gratuité s’inscrit dans une stratégie visant à consolider la présence de Microsoft sur le marché du développement logiciel. En supprimant tout frein financier, la plateforme réduit les incitations à migrer vers d’autres services d’autocomplétion de code et renforce son attractivité auprès de millions de développeurs.

Bien que l’efficacité des outils d’IA varie selon les contextes et les projets, les retours d’expérience confirment que GitHub Copilot peut, dans de nombreux cas, accélérer la production de code et simplifier l’apprentissage de nouveaux langages ou frameworks. La nécessité de valider et de tester manuellement les suggestions demeure néanmoins un point essentiel pour garantir la fiabilité et la sécurité des applications.

Au final, la gratuité de Copilot soutient la stratégie globale de GitHub en préservant sa base d’utilisateurs et en ouvrant la voie à d’éventuelles synergies avec d’autres produits Microsoft. Cette initiative illustre l’importance grandissante de l’IA dans les environnements de développement et met en évidence les adaptations permanentes des acteurs du secteur pour conserver leur position dominante.

Hallucinations LLM : quelle est cette dérive de l’IA générative ?

Sébastien Gaitte — Wed, 04 Dec 2024 10:22:35 +0000

D’où viennent les hallucinations LLM ?

Les modèles de langage de grande taille (LLM), tels que GPT-4, ont révolutionné la manière dont nous interagissons avec la technologie. Ils sont capables de générer du texte cohérent, de traduire des langues et même de créer du code informatique.

Cependant, malgré leurs avancées impressionnantes, ces modèles présentent un phénomène connu sous le nom d’hallucinations ou de confabulation. Ces hallucinations LLM se manifestent lorsque le modèle génère des informations incorrectes ou inventées, tout en les présentant de manière convaincante. Cet article explore les causes de ces hallucinations LLM, leurs implications et les stratégies pour les atténuer.

Source : Wikipedia

Origine du terme « hallucination » en Intelligence Artificielle

Le terme « hallucination » a été introduit dans le domaine de l’Intelligence Artificielle, et plus spécifiquement dans les LLM, pour décrire les situations où les modèles génèrent des réponses fausses ou trompeuses présentées comme des faits avérés. Cette analogie avec le phénomène psychologique de l’hallucination chez les humains est utilisée pour illustrer comment les modèles peuvent produire des informations injustifiées ou sans rapport avec la réalité.

Contrairement aux hallucinations humaines, qui sont généralement associées à des perceptions sensorielles erronées, les hallucinations des IA concernent des réponses ou des croyances sans fondement. Le terme a gagné en popularité vers 2022, parallèlement au déploiement de modèles de langage basés sur l’apprentissage profond, tels que ChatGPT.

Qu’est-ce qu’une hallucination dans les LLM ?

Dans le contexte des modèles de langage, une hallucination se produit lorsque le modèle produit une sortie qui n’est pas fondée sur les données d’entrée ou qui est factuellement incorrecte. Par exemple, un LLM pourrait affirmer que « Napoléon Bonaparte a découvert l’électricité en 1804 », ce qui est historiquement inexact. Ces erreurs peuvent être problématiques, surtout lorsque les utilisateurs s’appuient sur ces modèles pour obtenir des informations précises.

Causes des hallucinations LLM

1. Absence de compréhension véritable

Les LLM ne comprennent pas le langage de la même manière que les humains. Ils fonctionnent en prédisant le mot suivant dans une séquence, en se basant sur des probabilités apprises à partir de vastes ensembles de données textuelles. Cette approche statistique signifie qu’ils peuvent générer du texte qui semble plausible sans comprendre sa véracité.

2. Données d’entraînement biaisées ou incomplètes

Les modèles sont entraînés sur des données collectées sur Internet, qui peuvent contenir des informations incorrectes, obsolètes ou biaisées. Si le modèle n’a pas été exposé à certaines informations ou si les données sont erronées, il peut générer des réponses inexactes.

3. Optimisation pour la fluidité

Les LLM sont souvent optimisés pour produire du texte fluide et cohérent, ce qui peut les inciter à « inventer » des faits pour maintenir la cohérence narrative. Cette priorité donnée à la fluidité peut se faire au détriment de l’exactitude factuelle.

4. Limites dans le raisonnement et la mémoire

Bien que les LLM puissent traiter de grandes quantités d’informations, ils ont des limites en matière de mémoire à court et long terme. Ils peuvent oublier des détails importants ou ne pas être en mesure de relier efficacement des informations pertinentes, conduisant à des erreurs.

Stratégies pour atténuer les hallucinations LLM

Bien que la réduction des hallucinations soit un défi complexe qui nécessite des améliorations techniques, il existe des stratégies que le grand public peut utiliser pour atténuer les effets des hallucinations lors de l’utilisation des LLM.

1. Utilisation du RAG (Retrieval-Augmented Generation)

Le RAG (Génération Augmentée par Récupération) est une méthode qui combine les capacités des modèles de langage avec des bases de connaissances externes. Lorsqu’un utilisateur pose une question, le système recherche d’abord des informations pertinentes dans des sources fiables, puis utilise ces informations pour générer une réponse plus précise.

Comment cela aide-t-il ? En s’appuyant sur des données à jour et vérifiées, le modèle réduit le risque de générer des informations incorrectes ou obsolètes.
Comment l’utiliser ? Certains outils et plateformes intègrent déjà le RAG. Les utilisateurs peuvent choisir des applications ou des services qui offrent cette fonctionnalité pour obtenir des réponses plus fiables.

2. Vérification manuelle des informations

Les utilisateurs peuvent adopter une approche proactive en vérifiant les informations fournies par les LLM :

Rechercher des sources fiables : après avoir reçu une réponse, consulter des sites web réputés, des livres ou des articles scientifiques pour confirmer l’exactitude des informations.
Poser des questions de suivi : demander au modèle de citer ses sources ou de fournir plus de détails peut aider à identifier les informations potentiellement incorrectes.

3. Utiliser des modèles spécialisés

Certains modèles ou applications sont spécialement conçus pour des domaines particuliers et sont entraînés sur des données vérifiées :

Domaines spécifiques : pour des sujets comme la médecine, le droit ou la finance, utiliser des applications qui sont spécialisées dans ces domaines.
Avantages : ces modèles ont tendance à avoir des taux d’hallucination plus faibles dans leur domaine d’expertise.

Conclusion sur les hallucinations LLM

Les hallucinations des LLM représentent un défi important dans le développement de l’intelligence artificielle basée sur le langage. Bien que ces modèles aient le potentiel de transformer de nombreux aspects de la société, il est crucial de reconnaître et de traiter leurs limitations. En combinant des approches technologiques avec une supervision humaine et une utilisation responsable, nous pouvons espérer minimiser les effets des hallucinations et maximiser les avantages offerts par les LLM.

Fine-Tuning et Instruct Tuning LLM : adapter ses modèles de langage

Le Rhino — Wed, 27 Nov 2024 08:19:57 +0000

Le fine-tuning est une technique incontournable dans le domaine des grands modèles de langage (LLM) qui permet d’adapter des modèles pré-entraînés à des tâches ou domaines spécifiques. Le processus de fine-tuning LLM implique un entraînement supplémentaire d’un modèle pré-entraîné sur un ensemble de données plus petit et spécifique à une tâche pour affiner ses capacités et améliorer ses performances pour des applications particulières.

D’une certaine manière, le fine-tuning LLM est une voie pour créer un modèle personnalisé pour le cas d’usage d’une entreprise.

Fine-tuning LLM : pourquoi optimiser ses modèles de langage ?

Les avantages du fine-tuning LLM

L’utilité du fine-tuning provient de sa capacité à combler l’écart entre les LLM à usage général et les cas d’utilisation spécialisés. Bien que les modèles pré-entraînés comme Claude 3.5 ou GPT4o possèdent une large compréhension du langage, ils peuvent manquer de connaissances nuancées nécessaires pour des tâches spécifiques.

Le fine-tuning de LLM répond à cette limitation en permettant au modèle d’apprendre des motifs et des connaissances spécifiques à la tâche sans avoir besoin d’un entraînement à partir de zéro (ce qui est impossible financièrement pour une petite ou moyenne entreprise).

Le fine-tuning de LLM offre plusieurs avantages clés :

Personnalisation : il permet l’adaptation des LLM aux besoins uniques des entreprises, au jargon spécifique à l’industrie et aux domaines de connaissances spécialisées.
Performance améliorée : les modèles affinés surpassent souvent leurs homologues de base sur des tâches spécifiques, atteignant une meilleure précision et pertinence dans les résultats.
Efficacité des ressources : comparé à l’entraînement de modèles à partir de zéro, le fine-tuning nécessite significativement moins de ressources computationnelles et de données.
Développement plus rapide : il accélère le déploiement des solutions d’IA en exploitant les connaissances pré-existantes du modèle de base.
Atténuation des biais : le fine-tuning LLM peut aider à réduire les biais présents dans le modèle original en l’exposant à des ensembles de données plus diversifiés ou soigneusement sélectionnés.

Le processus de fine-tuning LLM implique généralement des techniques comme l’apprentissage par transfert, où les poids du modèle pré-entraîné sont mis à jour en utilisant un taux d’apprentissage plus faible. Cette approche permet au modèle de conserver sa compréhension générale du langage tout en s’adaptant à de nouvelles tâches.

Fine-tuning LLM : les avancées technologiques

Les avancées récentes dans les techniques de fine-tuning LLM, comme les méthodes de Fine-Tuning Efficace en Paramètres (PEFT) telles que LoRA (Low-Rank Adaptation), ont encore amélioré l’efficacité du processus. Ces méthodes permettent l’ajustement d’un petit sous-ensemble des paramètres du modèle, réduisant les besoins en calcul tout en maintenant les gains de performance.

Une façon simple d’en tirer parti est d’utiliser la bibliothèque Unsloth, qui est essentiellement une suite d’optimisations autour de l’utilisation de la mémoire et du calcul, rendant l’entraînement beaucoup plus simple et moins coûteux sans perdre en performance. La capacité d’Unsloth à accélérer le processus de fine-tuning jusqu’à 30 fois et à réduire l’utilisation de la mémoire de 60% permet d’affiner des modèles plus grands sur du matériel plus modeste, démocratisant ainsi l’accès à la personnalisation avancée des LLM.

Fine-tuning LLM : comment Unsloth facilite-t-il le processus ?

Unsloth emploie plusieurs techniques innovantes pour optimiser le fine-tuning de LLM :

L’autograd manuel et la multiplication matricielle chaînée réduisent les coûts de calcul en calculant précisément les gradients et en séquençant efficacement les opérations matricielles.
Les implémentations Flash Attention de xformers améliorent l’efficacité du modèle transformer.
Le calcul optimisé de la perte d’entropie croisée et la normalisation RMS utilisant Triton réduisent significativement la consommation de mémoire.
La quantification 4-bit et la précision bfloat16 permettent des lots plus importants et un entraînement plus rapide sur les GPU.

Compromis RAG vs Fine-Tuning

Nous avons déjà publié plusieurs articles sur le RAG (sur AWS et Azure) vous pouvez les consulter au cas où vous ne connaîtriez pas RAG.

Pour choisir entre fine-tuning et RAG pour améliorer les performances des LLM, plusieurs facteurs doivent être considérés :

Intégration des connaissances :

Le fine-tuning modifie les poids du modèle, intégrant directement les connaissances spécifiques au domaine dans le réseau neuronal.
Le RAG maintient une base de connaissances séparée, récupérant les informations pertinentes lors de l’inférence.

Adaptabilité :

Les modèles fine-tunés nécessitent un réentraînement pour intégrer de nouvelles informations, ce qui peut être coûteux en calcul.
Le RAG permet des mises à jour faciles de la base de connaissances sans réentraînement du modèle.

Vitesse d’inférence :

Les modèles fine-tunés offrent généralement une inférence plus rapide car toutes les connaissances sont encodées dans les poids.
Le RAG peut introduire une latence due à l’étape de récupération.

Empreinte mémoire :

Le fine-tuning peut augmenter la taille du modèle, particulièrement avec les approches de fine-tuning complet.
Le RAG garde le modèle de base inchangé mais nécessite un stockage supplémentaire pour la base de connaissances.

Spécialisation vs. généralisation :

Le fine-tuning excelle dans les domaines hautement spécialisés où un comportement cohérent est crucial.
Le RAG maintient les connaissances générales tout en les augmentant avec des informations spécifiques.

Exigences en données :

Le fine-tuning nécessite généralement une quantité substantielle de données étiquetées de haute qualité.
Le RAG peut exploiter plus facilement des données non structurées, nécessitant moins de pré-traitement.

Ressources computationnelles :

Le fine-tuning demande plus de puissance de calcul (même avec Unsloth, pour un entraînement à grande échelle).
Le RAG est généralement moins gourmand en ressources pour l’implémentation mais peut en demander plus lors de l’inférence.

Explicabilité :

Les modèles fine-tunés peuvent être moins interprétables car les connaissances sont intégrées dans les poids.
Le RAG offre une meilleure explicabilité en fournissant les sources des informations récupérées.

Cohérence :

Les modèles fine-tunés produisent des sorties plus cohérentes dans leur domaine spécialisé.
Les réponses RAG peuvent varier selon les informations récupérées.

Approches hybrides :

Le Retrieval-Augmented Fine-Tuning (RAFT) combine les deux méthodes, offrant potentiellement le meilleur des deux mondes.

Qu’est-ce que l’instruct tuning LLM ?

Instruct tuning LLM : adaptation de modèles basés sur les instructions

Le fine-tuning LLM par instructions, également connu sous le nom d’instruct tuning, est une forme spécialisée de fine-tuning qui vise à améliorer la capacité d’un grand modèle de langage à suivre des instructions en langage naturel et à effectuer des tâches spécifiques. Cette technique implique l’entraînement du modèle sur un ensemble de données de paires instruction-sortie, où chaque entrée consiste en une description de tâche ou une instruction, et la sortie correspondante démontre la réponse souhaitée.

La principale distinction entre l’instruct tuning et le fine-tuning LLM traditionnel réside dans la structure des données d’entraînement. Alors que le fine-tuning standard peut utiliser des paires entrée-sortie spécifiques à une tâche, l’instruct tuning LLM incorpore explicitement des instructions dans l’entrée, apprenant au modèle à interpréter et exécuter une grande variété de tâches basées sur des prompts en langage naturel.

Les étapes du processus d’instruct tuning LLM

Préparation des données : Création ou conservation d’un ensemble diversifié de paires instruction-sortie couvrant une gamme de tâches et domaines.
Ingénierie des prompts : Conception de formats d’instruction efficaces qui communiquent clairement les exigences de la tâche au modèle.
Entraînement : Fine-tuning du modèle pré-entraîné sur l’ensemble de données d’instructions.
Évaluation : Évaluation de la performance du modèle sur des instructions et tâches non vues pour mesurer la généralisation.

Les avantages de l’instruct tuning LLM par rapport au fine-tuning traditionnel

Meilleure généralisation des tâches : Les modèles peuvent s’adapter plus efficacement à de nouvelles tâches non vues en apprenant à interpréter les instructions.
Réduction de l’ingénierie des prompts : Le besoin de prompts complexes et spécifiques aux tâches est diminué car le modèle devient plus apte à suivre les instructions.
Apprentissage zéro-shot et few-shot amélioré : Les modèles instruits performent souvent mieux sur des tâches avec peu ou pas d’exemples fournis.
Polyvalence accrue : Un seul modèle peut gérer une plus grande variété de tâches sans nécessiter de fine-tuning spécifique.

Les avancées récentes dans l’instruct tuning LLM

Fine-Tuning par Instructions Phasé (Phased IFT) : Cette approche stratifie les données d’instruction en sous-ensembles de difficulté croissante, permettant un apprentissage progressif.
Génération de données synthétiques : Utilisation de modèles de langage plus grands pour créer des paires instruction-sortie diverses et de haute qualité.
Instruct tuning multi-tâches : Combinaison d’instructions de différents domaines pour créer des modèles plus polyvalents.
Prompting conscient des instructions : Développement de stratégies de prompting qui exploitent efficacement les capacités du modèle instruit.

L’efficacité de l’instruct tuning LLM est évidente dans les modèles d’usage quotidien. Chaque modèle avec lequel nous interagissons habituellement est un instruct finetuning ! Tous les grands modèles comme Claude 3.5, GPT4o, o1-preview etc sont entraînés par instructions. Leur contrepartie est le modèle « base », qui est le modèle initial entraîné uniquement pour compléter des phrases, et non pour répondre aux requêtes des utilisateurs. Ce modèle n’est généralement pas très utile pour les applications quotidiennes, mais ils sont le commencement de tous les LLM.

Démo d’instruct tuning LLM

Pour voir cela en action, utilisons un modèle assez petit mais puissant sorti récemment, Llama3.2 1B. Comme nous allons faire de l’instruct training LLM, nous devons utiliser le modèle de base. Heureusement, nous pouvons facilement le trouver sur la page Hugging Face de Meta, et pour un exemple simple, nous allons apprendre au modèle à répondre aux requêtes de l’utilisateur pour fournir du code Python pour une tâche donnée. La plupart des « connaissances Python » sont déjà présentes dans les poids du modèle, nous apprenons simplement au modèle à répondre effectivement avec du code Python, donc nous pouvons obtenir de bons résultats avec seulement 18k paires de questions -> réponses (que nous pouvons heureusement trouver dans ce jeu de données open-source avec des exemples Python).

Pour toutes les étapes du fine-tuning LLM et le modèle final créé, vous pouvez utiliser ce notebook Colab qui vous permet de réaliser l’entraînement complet en quelques minutes sans dépenser un centime !

RAG dans Azure : augmenter la puissance des modèles d’IA Générative

Sébastien Gaitte — Wed, 02 Oct 2024 14:04:41 +0000

Avec l’essor rapide de l’IA Générative, de nouvelles technologies émergent pour répondre aux besoins croissants en matière de gestion de données et de prise de décision. Parmi elles, les modèles de langage de grande taille (LLM) et les techniques d’optimisation comme le Retrieval Augmented Generation (RAG) jouent un rôle clé.

L’arrivée des LLM et essor du RAG

Les LLM, ou Large Language Model, sont des outils puissants d’IA, capables de comprendre et de générer du langage naturel pour des tâches comme la traduction, la rédaction ou les chatbots. Cependant, leur principale limite réside dans leur dépendance aux données sur lesquelles ils ont été entraînés, sans accès direct à des informations externes actualisées.

C’est là qu’intervient le Retrieval Augmented Generation (RAG). Cette approche combine la génération de texte par les LLM avec la récupération en temps réel d’informations depuis des bases de données externes. Cela permet d’enrichir les réponses fournies par les modèles en les rendant plus précises et contextualisées. Azure facilite cette intégration, offrant aux entreprises des solutions robustes pour exploiter pleinement le potentiel des LLM et du RAG.

Avec l’évolution rapide des technologies d’IA Générative, l’utilisation de techniques avancées comme le RAG (Retrieval Augmented Generation) devient de plus en plus courante pour résoudre des problématiques complexes liées à la gestion et à l’exploitation des données.

Dans cet article, nous explorerons comment la plateforme Azure permet de mettre en œuvre un système RAG, transformant ainsi la manière dont les entreprises peuvent exploiter leurs bases de connaissances pour améliorer leurs processus décisionnels.

Qu’est-ce que le RAG ?

Le Retrieval Augmented Generation (RAG) est un système dans lequel un modèle de génération de texte est assisté par une recherche externe d’informations pertinentes pour fournir des réponses plus précises et actualisées. Contrairement aux modèles classiques, qui s’appuient uniquement sur les données sur lesquelles ils ont été entraînés, un modèle RAG peut interroger une base de connaissances pour récupérer des informations pertinentes en temps réel, ce qui améliore la précision et la pertinence des réponses.

Par exemple, au lieu de se contenter de données statiques, un modèle RAG peut rechercher dans des documents externes, comme des PDF, des bases de données ou d’autres sources internes, pour répondre de manière plus précise aux requêtes des utilisateurs.

Le RAG permet ainsi d’obtenir un modèle de LLM qui s’appuie à la fois sur les données spécifiques qui lui ont été fournies et sur son modèle pré-entraîné.

Pour aller plus loin : IA RAG : un nouveau standard dans l’exploration des bases de connaissance

Cas d’usage IA du RAG dans Azure

La combinaison du RAG avec les services Azure permet d’apporter des solutions à un large éventail de cas d’utilisation.

Parmi les exemples les plus courants, on trouve :

Service client amélioré : Les entreprises peuvent utiliser des systèmes RAG pour répondre rapidement aux questions des clients, en accédant à des bases de données internes contenant des FAQ, des guides d’utilisation ou des politiques de garantie.
Conformité et réglementation : Dans des secteurs tels que la finance ou la santé, le RAG peut être utilisé pour aider les collaborateurs à rechercher et interpréter les politiques de conformité à partir de vastes bases de documents réglementaires.
Assistance interne : Les grandes entreprises peuvent déployer des systèmes RAG pour répondre aux questions des employés sur les politiques RH, les processus internes, ou pour fournir une assistance technique rapide.

RAG dans Azure : un écosystème de services intégrés

Azure, la plateforme cloud de Microsoft, offre une infrastructure robuste pour implémenter des systèmes RAG grâce à ses nombreux services IA, dont Azure OpenAI Service ou Cognitive Search. Voici les principales composantes pour construire un système RAG dans Azure :

Base de connaissances

Le fondement de tout système RAG repose sur une base de données contenant des documents qui doivent être consultés. Dans Azure, cela pourrait inclure des données stockées dans Azure Blob Storage, Azure SQL Database ou encore Azure Cosmos DB. Ces services permettent de stocker des informations variées telles que des documents texte, des images, des fichiers audio ou vidéo ou encore des bases de données. Dans le cas où vous souhaiteriez inclure des données stockées dans un storage account, les données prises en charge par Azure OpenAI sont les données en .md, .txt, .html, .pdf.

Modèle d’embedding

Le modèle d’embedding (de vectorisation) est un composant clé dans le processus de transformation des documents et des requêtes utilisateurs en vecteurs numériques. Azure propose des modèles de NLP (Natural Language Processing) via l’Azure OpenAI Service qui peuvent être utilisés pour générer ces embeddings à partir de documents ou de questions, en représentant le contenu sous forme de vecteurs mathématiques.

Moteur de recherche

Une fois les embeddings générés, il est crucial de les comparer efficacement aux vecteurs stockés dans la base de données. Azure propose Azure AI Search, un moteur de recherche puissant qui permet d’effectuer des recherches basées sur la similarité sémantique. En utilisant des techniques de recherche avancée, Azure AI Search trouve les documents qui sont les plus proches de la requête utilisateur en termes de signification.

Interface utilisateur

Une fois l’embedding et l’indexation réalisés, il ne vous reste plus qu’à interagir avec votre modèle. Pour cela, vous avez deux options : soit déployer un chat depuis le chat playground, soit connecter votre propre interface en utilisant l’API d’Azure OpenAI. Une fois vos données intégrées dans l’AI Search Index, Azure OpenAI réalise les étapes suivantes en recevant un prompt :

Réception du prompt.
Identification du contenu pertinent et de l’intention de la requête à partir du prompt utilisateur.
Interrogation de l’index de recherche avec ce contenu et cette intention.
Insertion du résultat de la recherche dans la requête Azure OpenAI, accompagné du message système et de la requête utilisateur.
Envoie de l’ensemble de la requête à Azure OpenAI. Le modèle traite l’information et génère une réponse.
Retour de la réponse et la référence des données (le cas échéant) à l’utilisateur.

Conclusion

L’intégration d’un système RAG dans Azure offre aux entreprises un moyen puissant de rendre leurs bases de connaissances plus accessibles et plus exploitables. En combinant des modèles de langage avancés avec des moteurs de recherche sémantique et des bases de données vectorielles, Azure fournit une plateforme robuste pour mettre en œuvre des solutions d’IA à grande échelle.

Alors que les entreprises cherchent de plus en plus à exploiter leurs vastes ensembles de données, la combinaison du RAG et des services cloud d’Azure représente une avancée significative dans l’amélioration de la précision des réponses, la gestion des connaissances et l’efficacité des processus métiers. Avec l’évolution continue des technologies d’IA, le potentiel de transformation qu’offre cette architecture est immense, ouvrant la voie à des applications plus intelligentes et personnalisées.

Microsoft Copilot en entreprise : déployez l’outil étape par étape

Le Rhino — Tue, 16 Jul 2024 12:36:32 +0000

Copilot pour Microsoft 365, avec ses capacités avancées d’intelligence artificielle et d’automatisation, représente une avancée majeure pour les entreprises utilisant Microsoft 365. Afin de garantir une adoption fluide et efficace et déployer Copilot pour une utilisation optimale, il est indispensable de suivre une préparation de mise en œuvre dans sur la partie technique qu’utilisateurs.

Déployer Copilot : préparez votre environnement technique Microsoft 365

Evaluation de l’environnement Microsoft 365

Avant de déployer Copilot, il est crucial de réaliser une évaluation approfondie de votre environnement Microsoft 365. Cette étape implique une analyse détaillée de l’infrastructure actuelle, des processus existants et des besoins spécifiques de votre organisation.

Pour commencer, il est essentiel d’effectuer un inventaire des licences pour vérifier que votre organisation dispose des licences Microsoft 365 adéquates pour utiliser Copilot. Sans les licences appropriées, certaines fonctionnalités de Copilot pourraient ne pas être disponibles, limitant ainsi l’efficacité de l’outil.

Ensuite, vérifiez que toutes les applications utilisées sont compatibles avec Copilot pour Microsoft 365. Cela peut nécessiter une mise à jour des applications existantes ou même l’installation de nouvelles versions. Une attention particulière doit être portée aux intégrations avec des applications tierces, car une incompatibilité pourrait entraîner des interruptions dans leur fonctionnement.

À la suite de cette évaluation, vous pourrez identifier les processus métier qui bénéficieront le plus de l’automatisation par l’IA Copilot. Analysez chaque processus pour déterminer comment Copilot peut être intégré dans les usages afin d’améliorer l’efficacité et la productivité des équipes. Cette analyse doit inclure la documentation des processus actuels et l’identification des points de friction ou des goulots d’étranglement.

Déployer Copilot : sécurité et gouvernance

La sécurité des données est une préoccupation majeure lorsque l’on souhaite déployer Copilot. Il est impératif de s’assurer que toutes les mesures de sécurité sont en place pour protéger vos informations et données sensibles.

Un audit de sécurité complet de votre environnement Microsoft 365 doit être réalisé pour identifier les vulnérabilités potentielles. Cet audit doit inclure une évaluation des paramètres de sécurité actuels, des configurations de réseau et des pratiques de gestion des accès. Les résultats de cet audit fourniront une base pour améliorer les mesures de sécurité avant le déploiement concret du déploiement de Copilot.

Assurez-vous que toutes les données sont chiffrées, tant au repos qu’en transit. Le chiffrement est crucial pour protéger les données sensibles contre les accès non autorisés. Des contrôles d’accès stricts doivent être mis en œuvre pour limiter l’accès à l’IA Copilot aux utilisateurs autorisés. Cela inclut la mise en place de politiques d’authentification multifactorielle (MFA) et l’utilisation de groupes de sécurité pour gérer les permissions. La gestion des identités et des accès (IAM) joue un rôle clé dans la protection des données et des applications, en veillant à ce que seuls les utilisateurs autorisés puissent accéder aux ressources critiques.

Définissez votre plan pour déployer Copilot

Il est essentiel de définir clairement les objectifs et les bénéfices attendus de cette intégration. Par exemple, un objectif pourrait être de réduire le temps de traitement des demandes de support client de 20 % en automatisant certaines tâches avec Copilot pour Microsoft 365.

Établissez un calendrier détaillé pour déployer Microsoft Copilot avec des étapes clés et des dates cibles. Ce calendrier doit inclure des phases de préparation, de déploiement, de test et de lancement. Il est également important de prévoir des périodes de formation pour les utilisateurs et des phases de suivi pour évaluer l’efficacité de Copilot après son déploiement.

Détaillez les rôles et responsabilités de chaque membre de l’équipe projet qui va déployer Copilot et assurez-vous que chaque tâche a un propriétaire clairement identifié. Cela inclut les responsables de la sécurité, les administrateurs système, les développeurs et les formateurs. Une bonne coordination entre les différents membres de l’équipe est essentielle pour éviter les retards et les erreurs.

Déployer Copilot : préparez les utilisateurs

Formez vos équipes à Copilot pour M365

Il est essentiel de sensibiliser et de former vos équipes aux nouvelles fonctionnalités et processus pour préparer au mieux votre organisation au déploiement de Copilot. Pensez donc à organiser des sessions de formation pour familiariser les utilisateurs avec Copilot pour Microsoft 365 et à informer régulièrement les équipes des avancées et des changements liés à son intégration.

Lorsque vous organisez des sessions de formation, pensez à les adapter aux différents niveaux de compétences et rôles de chacun. Ces formations doivent couvrir les fonctionnalités de base de Copilot, les meilleures pratiques pour son utilisation mais également les procédures de sécurité. Nous vous recommandons d’avoir des messages sont clairs, cohérents et accessibles à tous via différents canaux de communication.

Également, pensez à proposer une formation spécifique et personnalisée pour les groupes d’utilisateurs qui auraient besoin d’une formation plus approfondie. De même, il peut être intéressant de mettre en place un support technique dédié pour répondre aux questions et résoudre les problèmes liés à l’IA Copilot.

Gérez les autorisations et les licences Copilot

La gestion des autorisations et l’identification des rôles et responsabilités de chaque utilisateur sont capitales pour garantir une utilisation sécurisée et efficace de Copilot lors du déploiement.

Liste des actions pour préparer au mieux la gestion des autorisations Copilot :

En assignant les autorisations appropriées grâce aux fonctionnalités de gestion des permissions de Microsoft 365.
En configurant des groupes de sécurité et des rôles basés sur les responsabilités des utilisateurs.
En s’assurant que les utilisateurs ont uniquement accès aux données et fonctionnalités dont ils ont besoin.
En effectuant des revues régulières des autorisations (des changements peuvent survenir selon l’évolution de vos besoins, les changements organisationnels ou de nouvelles exigences de sécurité).
En mettant en place des processus pour apporter les ajustements nécessaires.

Préparer son organisation pour l’IA Copilot implique également de déployer des applications Microsoft 365 et d’affecter des licences adéquates. Assurez-vous que toutes les licences nécessaires sont disponibles et que les utilisateurs sont correctement provisionnés. En gérant les licences de manière proactive, vous vous évitez les interruptions de service et les dépassements de coûts.

Gardez à jour vos procédures et analysez les retombées en matière d’usage

Pour garantir un fonctionnement optimal de Copilot, il est essentiel de mettre en place un plan de gestion des services. Ce plan doit inclure des procédures de maintenance, des stratégies de résolution des incidents et des indicateurs de performance clés (KPI).

Maintenance régulière de Copilot

Définissez des procédures claires pour la maintenance régulière de Copilot. Cela doit inclure les mises à jour logicielles, les correctifs de sécurité et les sauvegardes des données. Nous vous recommandons de documenter et effectuer un suivi rigoureux de ces processus de maintenance.

Incidents techniques

En élaborant en amont des stratégies concernant la résolution des incidents, vous pourrez les gérer et les résoudre plus rapidement. Pour cela, pensez à identifier les types d’incidents potentiels, définissez des procédures pour les détecter, les signaler et les résoudre et mettez en place une équipe de support technique pour intervenir en cas de besoin.

Indicateurs de performance en matière d’IA

L’analyse des rapports d’utilisation de Copilot est cruciale pour comprendre comment l’outil est utilisé et pour identifier les opportunités d’amélioration. Microsoft met à disposition des rapports d’activité pour suivre l’utilisation de l’outil. Vous pouvez donc les paramétrer pour observer le niveau d’adoption, la fidélisation et l’engagement des utilisateurs. Ces tableaux de bord doivent inclure des KPI pertinents, tels que le nombre d’utilisateurs actifs, le taux d’utilisation des fonctionnalités clés et le temps moyen de résolution des tâches automatisées par Copilot.

En plus de cela, vous pouvez recueillir de votre côté les retours d’expérience de vos utilisateurs pour identifier les points forts et les axes d’amélioration.

Déployer Copilot : développez des plug-ins

Pour maximiser les capacités de Copilot, envisagez de développer des plug-ins personnalisés qui répondent aux besoins spécifiques de votre organisation. En identifiant ces besoins non couverts par les fonctionnalités de base de Copilot et en sondant les utilisateurs finaux et les parties prenantes pour comprendre leurs besoins, vous serez en mesure de recueillir des idées pour de nouveaux plug-ins.

Pour créer les plug-ins, vous avez à disposition les outils de développement Microsoft. En effet, Microsoft fournit une gamme d’outils et de ressources pour les développeurs, y compris des SDK, des bibliothèques de code et des environnements de développement intégrés. Pensez à former votre équipe de développement à l’utilisation de ces outils.

Une fois que vos plug-ins sont développés, vous pouvez les publier et les déployer dans votre environnement Microsoft 365. Comme tout nouvel outil développé, il est important de tester les plug-ins de manière approfondie avant leur déploiement pour vous assurer qu’ils fonctionnent correctement et qu’ils n’introduisent pas de problèmes de performance ou de sécurité. Vous pourrez ensuite déployer ces nouveautés progressivement, en commençant par un groupe pilote, puis en les étendant à l’ensemble de l’organisation.

Conclusion sur le déploiement de Copilot

La préparation technique et l’habilitation des utilisateurs sont des étapes cruciales pour garantir une intégration réussie et une utilisation optimale lorsque l’on souhaite déployer Copilot. En suivant les étapes de préparation, d’intégration, de mesure et de mise à l’échelle décrites dans cet article, vous pourrez tirer pleinement parti des avantages de l’IA Copilot.

Pour aller plus loin

Article – Sécurité Cloud : quels sont les outils et les bonnes pratiques ?

Article – AWS Bedrock : comment l’utiliser ?

Article – RGESN 2024 : quelles avancées en matière d’écoconception des services numériques ?

Comment utiliser Microsoft Copilot ?

Le Rhino — Wed, 26 Jun 2024 08:12:15 +0000

L’outil d’IA Générative Microsoft Copilot s’impose comme un outil révolutionnaire pour la productivité opérationnelle des équipes. Plusieurs grandes entreprises mondiales se sont lancées dans le déploiement à l’échelle de cet outil d’IA.

C’est le cas de TotalEnergies qui a communiqué publiquement en février 2024 sur le déploiement généralisé de Copilot, ou L’Oréal qui a réalisé un retour d’expérience lors des Universités du CRiP 2024 autour des premiers retours de leur projet Copilot interne.

Destiné à transformer les méthodes de travail, l’IA Copilot améliore la productivité et l’efficacité à divers niveaux de l’organisation, que celles-ci soient de grande ou petite taille. Après avoir exploré précédemment les prérequis nécessaires avant son déploiement, découvrez les avantages de l’IA Copilot pour les entreprises et nos conseils pour une mise en œuvre réussie.

Pourquoi et comment utiliser Copilot ?

IA Copilot améliore la productivité opérationnelle

Microsoft Copilot est conçu pour automatiser une variété de tâches répétitives, telles que la gestion des e-mails, la planification des réunions et la synthèse de documents. Par exemple, Copilot peut analyser le contenu des e-mails entrants et suggérer des réponses pertinentes, faire une synthèse de ceux que vous auriez pu manquer durant une absence ou bien simplement si vous travaillez avec des personnes sur d’autres fuseaux horaires.

Cette automatisation permet aux utilisateurs de se concentrer sur des tâches à plus haute valeur ajoutée, augmentant ainsi la productivité globale de l’entreprise. En réduisant le temps passé sur des tâches administratives, vos équipes se concentrent sur des activités stratégiques qui nécessitent réflexion et créativité.

De plus, l’IA Copilot propose des suggestions et des réponses contextuelles en temps réel. Lorsqu’un collaborateur rédige un rapport ou prépare une présentation, Copilot peut suggérer des améliorations de style, des informations pertinentes ou même des images et des graphiques à inclure. Cette fonctionnalité optimise non seulement le temps de travail mais réduit également les erreurs humaines, en fournissant des recommandations basées sur les meilleures pratiques et les données disponibles. Les suggestions en temps réel peuvent aider à résoudre des problèmes ou à répondre à des questions sans qu’il soit nécessaire de rechercher des informations supplémentaires, ce qui rend le travail plus fluide et plus efficace.

Microsoft Copilot : un outil accessible intégré à Microsoft 365

L’IA Copilot est nativement intégrée aux applications Microsoft 365, facilitant ainsi son adoption sans nécessiter une refonte complète des systèmes en place. Cette compatibilité signifie que les entreprises peuvent commencer à utiliser Copilot sans avoir à investir dans de nouvelles infrastructures ou logiciels. Les fonctionnalités de Copilot sont accessibles directement dans les interfaces des applications Microsoft 365, ce qui permet aux utilisateurs de tirer parti de l’IA sans quitter leur environnement de travail habituel. Cette intégration transparente assure une adoption rapide et minimise les interruptions de service pendant la transition.

L’interface utilisateur intuitive de Copilot rend son utilisation accessible à tous les niveaux de compétences techniques. En cas de besoin, Microsoft propose des supports de formation et des tutoriels pour aider les utilisateurs à se familiariser avec les fonctionnalités de Copilot, ce qui renforce son accessibilité.

IA Copilot : un outil personnalisable

L’IA de Copilot offre des recommandations adaptées aux tâches en cours et aux besoins spécifiques des utilisateurs. Par exemple, il peut suggérer des actions spécifiques, des documents à consulter ou des contacts pertinents.

Copilot permet aux utilisateurs de s’améliorer constamment dans leur utilisation des outils numériques. L’outil est capable d’apprendre des interactions passées et de s’adapter aux préférences des utilisateurs, offrant ainsi des recommandations et des fonctionnalités de plus en plus précises au fil du temps. Par exemple, si un utilisateur préfère un certain style de rédaction ou une méthode particulière pour analyser des données, Copilot ajustera ses suggestions en conséquence.

Quelques exemples concrets d’utilisation de l’IA Microsoft Copilot

Microsoft Copilot peut être perçu comme un assistant numérique. Son utilité se manifeste à travers de nombreux exemples concrets :

Synthèse des e-mails : Pour les salariés travaillant dans un contexte international, Copilot synthétise les e-mails reçus durant la nuit ou pendant les vacances. Par exemple, au réveil, un utilisateur peut demander à Copilot de résumer les messages importants reçus, facilitant ainsi une prise de décision rapide et informée dès le début de la journée.
Rédaction de contenus : Lors de la rédaction d’un e-mail ou d’un document, Copilot peut proposer une première trame. Cela permet de gagner du temps en offrant une structure initiale que l’utilisateur peut ensuite personnaliser et compléter.
Réunions Teams : Copilot résume les réunions Teams, en extrayant les points clés discutés, les décisions prises et les tâches assignées. Il peut également identifier les participants en accord ou en désaccord avec les propositions faites, offrant une vue d’ensemble précise et rapide de la réunion.
Gestion de projets : Pour les projets complexes, Copilot peut transformer un document de 50 pages en une présentation synthétique de 10 diapositives, facilitant ainsi la communication et la compréhension des points essentiels.
Analyse de données : Dans Excel, Copilot peut aider à analyser les données, simplifiant les processus décisionnels basés sur des informations chiffrées.
Diagnostic et dépannage IT : Avec les outils Intune, Copilot peut diagnostiquer des problèmes de déploiement de postes ou d’applications, générer des commandes PowerShell, voire des scripts complets, accélérant ainsi la résolution des problèmes techniques.
Illustrations et traduction : Pour les présentations ou les rapports, Copilot peut générer des illustrations pertinentes et traduire des documents, facilitant ainsi la communication visuelle.

A noter qu’en plus de son assistance générale, il est possible, grâce à l’écriture de prompts et scénarios spécifiques ainsi que par l’apprentissage de l’intelligence artificielle, de personnaliser l’aide de Copilot à un département spécifique dans l’entreprise.

Il est donc tout à fait possible d’entraîner Copilot à valoriser une marque pour le service marketing, gérer les ticketings et réaliser des synthèses d’opérations pour le service informatique, écrire des fiches de postes pour les ressources humaines, faire des synthèses sous forme de tableau pour des comptes-rendus commerciaux et bien plus encore…

Les bonnes pratiques pour utiliser l’IA Copilot efficacement

Pour tirer pleinement parti de Microsoft Copilot, voici quelques conseils pour l’utiliser au mieux :

Formation des utilisateurs et conduite du changement : Assurez-vous que les utilisateurs sont bien formés à l’utilisation de Copilot. Identifiez des personnes clés dans chaque département qui peuvent devenir des ambassadeurs/champions et accompagner le changement sur le terrain.
Définition de prompts clairs et précis : Lors de la création de prompts, soyez spécifique. Évitez les formulations vagues. Par exemple, plutôt que de demander « Donne-moi les dernières nouvelles de Michael », demandez plutôt « Quelles sont les dernières actions que Michael doit réaliser pour le projet d’implémentation de Copilot ? »
Utilisation des bibliothèques de prompts : Profitez des ressources disponibles sur le site de Microsoft. Ce site offre une large bibliothèque de prompts préconçus qui peuvent servir de base pour vos propres besoins.
Commentaires et précisions : N’hésitez pas à fournir des commentaires complémentaires à Copilot pour affiner les réponses. Par exemple, si une réponse initiale manque de précision, demandez des détails supplémentaires pour obtenir une réponse plus complète.
Éviter les acronymes et termes spécifiques : Si votre entreprise utilise des acronymes ou des termes spécifiques, enseignez-les à Copilot ou préférez des formulations plus générales au début pour assurer une meilleure compréhension.
Normes de ponctuation et de segmentation : Utilisez une ponctuation correcte et segmentez vos phrases pour que Copilot puisse comprendre et répondre plus précisément à vos demandes.
Vérification et validation : Copilot offre des suggestions mais il est crucial de vérifier et valider les informations fournies pour s’assurer de leur exactitude et pertinence par rapport à votre domaine d’activité.

Microsoft Copilot est un atout majeur pour les entreprises cherchant à optimiser leur productivité et leur efficacité. Avec une planification soignée, une formation adéquate, et une intégration sécurisée, Copilot peut transformer les opérations quotidiennes et offrir un avantage concurrentiel significatif.

Pour aller plus loin

Article – IA RAG : un nouveau standard dans l’exploration des bases de connaissance

Article – Green IT : comment l’IA aide les entreprises à adopter des pratiques plus durables ?

IA RAG : un nouveau standard dans l’exploration des bases de connaissance

Le Rhino — Fri, 14 Jun 2024 12:52:40 +0000

Dans un article précédent, nous avons parlé des bases d’AWS Bedrock et comment il peut être un outil utile pour vous permettre d’extraire la puissance de l’IA en quelques étapes faciles.

Dans ce post, nous allons explorer l’IA RAG car c’est un choix populaire par les entreprises, étant donné la facilité / rapidité de mise en œuvre et à expérimenter. Il permet en effet d’adapter un système en quelques clics, en modifiant les données auxquelles il a accès. Le fine tuning et le RAG peuvent également fonctionner ensemble, ce que nous explorerons plus en détail prochainement.

IA : le RAG transforme l’accès aux bases de connaissance

Il ne fait aucun doute que l’IA Générative a eu un impact conséquent sur les entreprises, créant de la valeur plus rapidement que jamais et explorant des possibilités qui n’étaient tout simplement pas possibles (ou pratiques) auparavant. La France ne fait pas exception puisque nous avons vu des entreprises françaises comme HuggingFace et Mistral prospérer dans cet espace. L’un des cas d’utilisation qui a été le plus transformateur dans toutes les industries est l’exploration des bases de connaissances.

Une base de connaissances se définit comme une agrégation de connaissances, qui peut se présenter sous la forme de PDF, fichiers audio, images, vidéos, FAQ, guides pratiques, conseils de dépannage, informations sur les produits, tutoriels, politiques internes, documentation sur la conformité, ou toute information propre à l’entreprise. Il est généralement difficile de rendre ce type d’information plus utile en raison de sa dimension, du moins pour un humain, mais le RAG et l’IA sont venus résoudre ce problème.

L’IA Générative a été rendue populaire par ChatGPT qui est un LLM (large langage model), et bien que cette application n’ait accès qu’aux données sur lesquelles elle a été entraînée et qu’elle réponde en fonction du texte que nous lui donnons, nous pouvons également aller plus loin en construisant des systèmes qui utilisent plus de données que nous leur donnons, et ainsi les rendre plus utiles pour nos cas d’utilisation spécifiques.

Au cœur de tout cela se trouvent les modèles fondamentaux. Ces modèles construits par des entreprises comme OpenAI, Meta, AWS, Mistral et Anthropic nécessitent des millions de dollars et des mois pour être entraînés, mais nous pouvons les spécialiser sur nos cas grâce à deux techniques : le fine-tuning et le RAG.

Qu’est-ce que le RAG dans l’IA ?

Retrieval Augmented Generation (ou RAG) est une technique puissante qui améliore la précision et la pertinence des réponses des LLM en récupérant des informations pertinentes à partir de sources de données externes.

En convertissant les documents et les requêtes des utilisateurs en vecteurs, l’IA RAG permet d’effectuer des recherches de similarité sémantique pour trouver les textes les plus pertinents, qui sont ensuite utilisés pour compléter la réponse du LLM. Sans RAG, nous avons un flux de travail qui semble aussi simple que celui-ci :

Afin d’utiliser le RAG pour résoudre certaines limitations de LLM, nous devons effectuer quelques étapes supplémentaires et ajouter des systèmes additionnels à notre architecture :

Une base de connaissances
Un modèle d’embedding
Un modèle de recherche
Une base de données vectorielle

Nous aurons donc quelque chose comme ceci :

Pour simplifier, nous devons d’abord faire passer nos documents par un modèle d’incorporation car le modèle de recherche ne comprend pas le texte pur. Le modèle d’intégration est chargé de transformer le texte de la base de connaissances en vecteurs, c’est-à-dire en une liste de nombres qui représentent le texte d’une manière compréhensible pour le modèle de recherche.

Une fois que nous avons les vecteurs pour un texte donné, nous les stockons dans une base de données vectorielle (dans notre cas, nous utiliserons AWS OpenSearch, un service géré qui nous permet de stocker des vecteurs et de les récupérer facilement), car il serait très coûteux et fastidieux d’exécuter le modèle d’incorporation chaque fois que nous voulons interroger notre base de connaissances.

Avec une base de données vectorielle remplie de nos données, nous pouvons envoyer notre message au modèle de recherche qui transformera notre message en vecteurs et le comparera aux données de la base de données vectorielle. Pour ce faire, ces systèmes utilisent généralement la similitude cosinus qui est une fonction mathématique simple qui compare deux vecteurs pour voir s’ils sont proches dans l’espace d’intégration, et si c’est le cas, cela signifie qu’ils sont similaires et peuvent nous aider à répondre à notre question.

Si c’est le cas, cela signifie qu’ils sont similaires et que cela peut nous aider à répondre à notre question :

Nous envoyons cette question au modèle : « Quand la société Y a-t-elle été fondée ? »

Le modèle de recherche comparera ce texte à de nombreux vecteurs stockés dans la base de données vectorielles, trouvera des vecteurs similaires et obtiendra leur texte, qui pourrait ressembler à ceci : « …la société Y a été fondée en 2003 ».

Nous pouvons ajuster le nombre de textes qu’il obtiendra de la base, de sorte que nous pouvons dire, par exemple, que nous voulons qu’il récupère les 5 morceaux de texte les plus similaires trouvés et qu’il les envoie au modèle.

Ainsi, le modèle disposera de toutes les données dont il a besoin pour répondre à notre question. Ce processus peut sembler compliqué et lent, mais il se déroule automatiquement et en quelques millisecondes ou secondes.

Orchestration avec LangChain

Afin de contrôler tout cela de manière plus organisée, nous pouvons utiliser un outil d’orchestration. Dans notre cas, nous avons utilisé LangChain, une bibliothèque Python qui comporte de nombreux modules permettant de se connecter à différent modèles et contrôler finement le système et ses résultats.

Le code de cette démo où LangChain est utilisé est disponible sur Github.

Démonstration du système RAG

Pour démontrer un système RAG, nous avons créé une application de questions réponses pour aider les utilisateurs à découvrir s’ils peuvent bénéficier d’une aide financière du gouvernement français pour rénover leurs maisons, en fonction de leur localisation et d’autres données. Nous avons alimenté le modèle avec un document du gouvernement datant de 2024.

Le processus diffère d’un cas d’utilisation à l’autre. Il est donc nécessaire d’explorer et de modifier les paramètres, les données, les méthodes d’extraction, etc. afin qu’il fonctionne bien pour chaque application. AWS Bedrock facilite la modification des modèles et l’ajout de nouveaux documents à notre base de connaissances, ce qui accélère le passage du concept à l’application déployée. Dans notre cas, nous avons expérimenté principalement avec Llama 3.

Conclusion sur le RAG et l’IA

En conclusion, l’utilisation d’AWS Bedrock et de la technique RAG peut considérablement améliorer la façon dont les entreprises extraient et utilisent les informations de leurs vastes bases de connaissances. En intégrant des modèles fondamentaux à des systèmes spécialisés tels que des modèles d’embedding, des extracteurs et des bases de données vectorielles, les entreprises peuvent créer des solutions pilotées par l’IA adaptées à leurs besoins et leurs données d’entreprise.

À mesure que nous continuons d’explorer et d’affiner ces techniques, le potentiel de transformation de divers secteurs par l’IA devient de plus en plus évident. Que vous traitiez des PDF, des fichiers audios ou toute autre forme de documentation, la combinaison d’AWS Bedrock et de RAG offre un ensemble d’outils puissants pour rendre vos données plus accessibles et exploitables.

Restez à l’écoute pour les prochains articles dans lesquels nous approfondirons le fine-tuning et d’autres techniques avancées afin d’optimiser davantage les applications d’IA pour vos besoins commerciaux. N’hésitez pas à nous contacter pour nous faire part des projets que vous souhaitez mettre en œuvre avec l’IA.

Les nouveautés AWS en 2024

Le Rhino — Mon, 22 Jan 2024 10:40:19 +0000

Nous vous proposons un récapitulatif des temps forts de l’AWS re:Invent 2023, la conférence annuelle d’Amazon Web Service qui a eu lieu dernièrement à Las Vegas.

Avec plus de 2000 sessions techniques et 5 keynotes, ce récap ne pourra bien entendu pas être exhaustif mais il a vocation à vous fournir une vision d’ensemble des ambitions d’AWS. Sans surprise, les efforts ont été mis sur l’Intelligence Artificielle avec la mise à disposition de nombreux services d’IA comme l’intégration du service Amazon Q dans de nombreux produits.

Qu’est-ce qu’Amazon Q ?

Amazon Q est l’assistant d’Amazon alimenté par l’IA (tout comme Microsoft Copilot). Amazon Q s’intègre nativement à de nombreux services AWS mais peut également se connecter aux services de l’entreprise avec des connecteurs déjà disponibles :

Jira
Salesforce
ServiceNow
Zendesk

En savoir plus : Configuring plugins with Amazon Q

Amazon Quicksight

Amazon Quicksight est le service décisionnel serverless d’AWS qu’on peut comparer à PowerBI chez Microsoft. Comme bien d’autres services AWS, il s’intègre nativement avec le service de stockage AWS S3, mais également avec les bases de données Oracle, MySQL ou SQL Server. Plusieurs connecteurs sont disponibles pour se connecter aux services SaaS comme Salesforce et bien d’autres.

L’assistant Amazon Q vient s’ajouter au service décisionnel pour faciliter la vie des utilisateurs dans le cadre de la création des rapports et de dashboards.

En savoir plus : Service d’informatique décisionnelle – Amazon Q dans QuickSight – AWS

Amazon Connect

Amazon Connect est le service de centre de contact cloud omnicanal qui permet aux entreprises de fournir un service client à moindre coût. Il offre une variété de canaux de communication tels que le chat et la voix, ainsi que des outils de routage, d’analyse d’historique et de suivi en temps réel. Amazon Connect est une plateforme ouverte qui peut être intégrée à d’autres applications d’entreprise telles que Salesforce.

L’assistant Amazon Q vient également s’ajouter à Amazon Connect pour aider les agents en leur proposant des réponses, actions ou informations en temps réel pour mieux répondre aux clients.

En savoir plus : Amazon Q in Connect – AWS

AWS Supply Chain

AWS Supply Chain permet de gérer les chaînes d’approvisionnement et les stocks.

Il fournit des informations exploitables alimentées par le Machine Learning (ML) pour aider les entreprises à :

Atténuer les risques de surstockage et de rupture de stock,
Gagner en visibilité sur l’ensemble de leur chaîne d’approvisionnement,
Rationaliser la collecte de données liées à la durabilité et la collaboration visant à planifier l’approvisionnement.

Le service profitera également de l’IA avec Amazon Q, comme précisé dans ces articles :

AWS Announces Four New Capabilities for AWS Supply Chain

AWS Supply Chain announces new upstream capabilities

AWS Toolkit

AWS Toolkit est l’extension AWS VS Code / Visual Studio qui permet de faciliter le développement et le déploiement des infrastructure sur AWS.

Il intègre désormais le service Amazon Q pour accompagner les entreprises dans l’analyse de code, l’auto-complétions et la génération automatique de code sur la base d’un descriptif en langage « naturel ».

En savoir plus : Amazon Q in the Toolkit for VS Code – AWS Toolkit for VS Code

Voici un exemple avec du code Terraform pour déployer une fonction Lambda.

Bedrock

Annoncé un peu avant le re:Invent, Amazon Bedrock est la solution d’IA générative d’AWS. La solution d’AWS utilise les différents modèles du marché pour faciliter les travaux d’IA avec l’usage des modèles AI21 Labs, Anthropic, Cohere, Meta, Stability AI et Amazon.

Il est possible d’interchanger les modèles pour les comparer et valider le modèle le plus adapté à l’usage attendu. Amazon Bedrock offre également la possibilité de créer son propre modèle sur la base de données de l’entreprise avec AWS Bedrock Knowledge Bases.

Pour éviter d’éventuelles dérives dans les retours de l’IA, AWS Bedrock propose Guardrail pour filtrer certaines catégories, mot clé…

Enfin, Bedrock propose également du fine tunning pour customiser ces modèles d’IA :

Customize models in Amazon Bedrock with your own data using fine-tuning and continued pre-training

PartyRock

Toujours sur la thématique de l’IA, AWS propose une solution Fun pour développer une application Web qui se base sur l’IA Bedrock sans aucune ligne de code. Nous vous invitons à tester : intégrez un simple descriptif de votre besoin et votre application est disponible quelques minutes après.

Nous avons fait un rapide test pour créer une application qui génère aléatoirement des questions techniques en fonction du profil et de la technologie, puis évalue la réponse du candidat : le retour est bluffant…

FinOps

Werner vogels, CTO d’AWS a souligné le fait qu’une démarche FinOps doit être itérative !

Les clés d’une démarche FinOps

AWS en a profité pour unifier les consoles Budget, Cost Explorer et propose également de nouvelle fonctionnalité.

Cost Optimization hub : Console unifié qui présente différents axes d’optimisations financières,
Free tier API : API disponible pour vérifier les usages des Free tier AWS.

Amazon Inspector

Dans la continuité des annonces précédentes, de nouveaux services de sécurités sont apparus ou ont été améliorés.

Amazon inspector, service managé / serverless d’analyse des vulnérabilités sur les instances EC2, images Docker…, s’intègre désormais au CI/CD afin d’identifier d’éventuelles vulnérabilités directement dans les pipelines.

Pour l’analyse des instances EC2, une version sans agent est également disponible ce qui permet de ne pas impacter les performances de vos instances. Il utilise pour cela les snapshots de vos instances : https://aws.amazon.com/fr/about-aws/whats-new/2023/11/amazon-inspector-agentless-assessments-ec2-preview/

Développement

En plus des fonctionnalités citées précédemment via l’IA et le service Amazon Q, d’autres fonctionnalité ont été apportées pour faciliter le travail des Développeurs / Ingénieurs DevOps.

AWS Application Composer apporte par exemple une meilleure intégration avec l’IDE et permet de créer simplement des templates SAM (fonctionnalité également disponible en mode Web).

En savoir plus : AWS re:Invent 2023 – Visualize and design your architecture with AWS Application Composer (SVS213)

Infrastructure

ALB MTLS

Les Application Load Balancer sont des répartiteurs de charge de niveau 7 sur AWS.

Ils permettent d’acheminer le trafic sur différentes instances, environnements dockers (ECS, EKS, Fargate) afin d’apporter plus de résilience aux applications ou pour absorber la charge. Ils permettent également de sécuriser les applications en assurant l’authentification, ce qui permet de soulager les backend.

Déjà compatible oAuth, il est désormais possible d’utiliser l’authentification par certificat, communément appelé méthode d’authentification mutuelle (MTLS). Nous vous partageons un article du blog AWS qui en décrit le principe et comment l’implémenter :

https://aws.amazon.com/fr/blogs/aws/mutual-authentication-for-application-load-balancer-to-reliably-verify-certificate-based-client-identities/

Pour ceux qui connaissent le CDN Cloudlare, cette nouvelle fonctionnalité d’AWS permet de sécuriser par certificat les échanges entre Cloudflare et l’ALB.

RDS DB2

Amazon RDS est le service managé (PaaS) pour les bases de données. Comme chez d’autres hyperscaler, AWS soulage les DBA avec la prise en charge des sauvegardes, du patching et de la résilience des moteurs de base de données. Déjà compatible avec de nombreux SGBD : Oracle, PostgreSQL, MariaDB, MySQL, SQL Server, AWS propose désormais le moteur de base de données d’IBM (DB2).

AWS Graviton 4

AWS Graviton est une gamme de processeur ARM développé par AWS afin de bénéficier d’un meilleur rapport prix / performance.

Cette nouvelle version d’instance ARM AWS, moins onéreuse et plus performante, permet dans une démarche FinOps / GreenOps d’optimiser les coûts et le bilan carbone.

S3 express One Zone

S3, l’un des premiers services AWS, est un service de stockage objet ultra résilient (11.9) qui fonctionne selon la classe de stockage. Une nouvelle génération de stockage, S3 Express One Zone, vient s’ajouter aux nombreuses autres classes.

Celle-ci est plus performance mais moins résiliente. Couplée à un Dataware ou Athena, c’est le bon cas d’usage.

EKS Pod Identity

EKS est le service managé Kubernetess d’AWS. Disponible depuis de nombreuses années, AWS apporte régulièrement de nouvelles fonctionnalités afin d’améliorer le produit. Avec EKS Pod Indentity, il est possible d’autoriser les pods, via un assume role, à consommer des services AWS.

AWS Backup

Il s’agit d’une solution managée serverless pour gérer le plan de sauvegarde. En plus d’une nouvelle interface, il est désormais possible de tester les restaurations.

L’annonce la plus intéressante concerne l’archivage des snapshots EBS automatique depuis AWS Backups car cela permet de limiter drastiquement les coûts.

Digital Workspace

Sur l’aspect Digital Workspace, Amazon a annoncé la disponibilité générale de leur client léger qui s’interface directement avec le poste virtuel Amazon Workspace : Amazon workspaces thin client. Amazon Workspace étant la solution de bureau virtuel (VDI) full managé d’AWS.

Pour aller plus loin

Article – IA RAG : un nouveau standard dans l’exploration des bases de connaissance

Article – AWS Bedrock : comment l’utiliser ?

Article – AWS pour le DevOps : tour d’horizon des outils et services

Article – Quelles sont les certifications et outils DevSecOps ?

Green IT : comment l’IA aide les entreprises à adopter des pratiques plus durables ?

Yoann Py — Fri, 12 Jan 2024 09:25:58 +0000

Qu’est-ce que le Green IT ?

Le Green IT, qu’on appelle aussi l’informatique durable, l’informatique verte ou encore le numérique éco-responsable est un ensemble de techniques visant à réduire l’empreinte sociale, économique et environnementale du numérique.

Effectivement, les technologies de l’information et de la communication (TIC) sont connues pour être de gros consommateurs d’énergie. D’où l’émergence de la démarche Green IT qui permet aux entreprises d’adopter concrètement des pratiques ayant un impact réduit sur la consommation environnementale :

Efficacité énergétique : améliorer l’efficacité énergétique des équipements informatiques et des centres de données pour réduire la consommation d’énergie.
Réduction des déchets : minimiser les déchets électroniques avec des pratiques telles que la réutilisation de matériel, ou la prolongation de la durée de vie des équipements.
L’éco-conception : développer des solutions qui ont un impact environnemental moindre, depuis leur fabrication jusqu’à leur fin de vie.
Gestion écoresponsable des ressources : utiliser de manière responsable les ressources, telles que l’énergie et les matières premières, dans les processus de fabrication et d’exploitation des équipements informatiques.
GreenOps : démarche visant à optimiser l’utilisation des ressources informatiques dans le cadre des services cloud.
Sensibilisation et formation des collaborateurs : acculturer et former les salariés aux enjeux environnementaux et aux pratiques durables.

Green IT et IA : quels impacts dans les datacenters ?

L’Intelligence Artificielle (IA) offre des possibilités significatives pour aider les entreprises à adopter des bonnes pratiques de Green IT.

Pour rappel, l’intelligence artificielle est un processus d’imitation de l’intelligence humaine qui repose sur la création et l’application d’algorithmes exécutés dans un environnement informatique dynamique.

Dans un contexte de crise énergétique, l’IA permet d’aider les entreprises à optimiser la consommation d’énergie dans les centres de données et à gérer de manière durable les déchets électroniques.

Un centre de données, ou datacenter, est un lieu physique où sont stockées et gérées les données informatiques d’une organisation ou d’une entreprise. Il est équipé de serveurs, de systèmes de stockage de données, de réseaux et de systèmes de sécurité pour protéger les informations stockées.

Les déchets électroniques représentent des objets électroniques en fin de vie qui ne peuvent plus être utilisés ou réparés, tel que des ordinateurs, des téléphones, des batteries, des cartes mères… Ces déchets contiennent souvent des matériaux dangereux tels que le plomb, le mercure, le cadmium et le beryllium, qui peuvent causer des dommages à la santé humaine.

L’utilisation de l’IA peut aider à réduire cette consommation en prévoyant la demande en énergie et en adaptant la consommation en conséquence. Les algorithmes d’apprentissage automatique peuvent être utilisés pour identifier les périodes de faible demande en énergie, et pour réduire la consommation d’énergie pendant ces périodes. Selon une étude du cabinet de conseil Accenture, l’utilisation de l’IA pourrait potentiellement réduire les émissions de CO2 de 16 % d’ici 2030 dans les secteurs de l’énergie, de la fabrication et de l’agriculture.

Les déchets électroniques représentent une source croissante de pollution, et leur gestion efficace est essentielle pour réduire leur impact environnemental. Selon une étude de l’Organisation des Nations Unies, le monde produit environ 50 millions de tonnes de déchets électroniques chaque année, et cette quantité devrait augmenter de 21 % d’ici 2030.

L’utilisation de l’IA peut aider à gérer de manière durable les déchets électroniques en triant les matériaux recyclables et en identifiant les composants qui peuvent être réutilisés grâce à des caméras sur les convoyeurs de tri des déchets et faire analyser ces images par l’IA pour identifier les différents matériaux et les diriger vers les flux de recyclage appropriés. Selon la même étude d’Accenture, l’utilisation de l’IA pourrait également réduire les émissions de CO2 de 8 % d’ici 2030dans le secteur du transport.

Cependant, il est important de considérer que l’IA ne peut pas résoudre tous les problèmes environnementaux liés aux TIC. Selon une étude de l’Agence de l’Environnement et de la Maîtrise de l’Energie, la consommation d’énergie des centres de données en France a augmenté de 21 % entre 2010 et 2015, malgré une amélioration de l’efficacité énergétique.

L’utilisation de l’IA pourrait potentiellement augmenter cette consommation d’énergie si elle est utilisée de manière inefficace. De plus, l’entraînement des réseaux de neurones pour l’IA peut consommer jusqu’à 300 fois plus d’énergie que l’exécution de l’IA elle-même, selon une étude de l’Université de Stanford. Cela souligne l’importance de l’optimisation de l’IA pour réduire sa consommation d’énergie.

Conclusion

En conclusion, l’IA offre des possibilités significatives pour aider les entreprises à adopter des pratiques plus durables dans le cadre du Green IT. Cependant, il est important de considérer l’IA comme un outil complémentaire aux pratiques durables existantes, plutôt que comme une solution unique aux problèmes environnementaux.

Les entreprises doivent continuer à adopter des pratiques durables en matière d’utilisation des équipements électroniques et de transport, tout en utilisant l’IA de manière responsable. Il est essentiel que les entreprises optimisent l’utilisation de l’IA pour réduire sa consommation d’énergie et minimiser son impact environnemental. En utilisant l’IA de manière stratégique, les entreprises peuvent contribuer à atteindre les objectifs de réduction des émissions de gaz à effet de serre et à assurer un avenir plus durable pour la planète.

Sources

« L’IA au service du Green IT : comment les entreprises peuvent réduire leur empreinte carbone grâce à l’automatisation » – Forbes : Cet article explique comment l’IA peut aider les entreprises à réduire leur empreinte carbone en optimisant la consommation d’énergie et en automatisant les processus de gestion de l’environnement.

« Comment l’IA peut aider à réduire l’empreinte carbone des centres de données » – ZDNet : Cet article met en évidence l’utilisation de l’IA pour optimiser la gestion de l’énergie dans les centres de données, qui sont connus pour être des consommateurs d’énergie élevés.

« L’IA, alliée des énergies renouvelables » – Le Monde Informatique : Cet article explore comment l’IA peut aider à maximiser l’utilisation de sources d’énergie renouvelables en prédisant les conditions météorologiques et en ajustant la production d’énergie en conséquence.

« L’IA au service de la gestion durable des déchets électroniques » – Green IT Magazine : Cet article met en avant l’utilisation de l’IA pour optimiser le processus de recyclage des déchets électroniques en identifiant les matériaux recyclables et en les triant efficacement.

« Comment l’IA peut aider à réduire l’impact environnemental des transports » – Futura Planète : Cet article explore comment l’IA peut aider à réduire l’impact environnemental des transports en optimisant les itinéraires et en réduisant les émissions de CO2.

Pour aller plus loin

Article – GreenOps : comment mesurer sa consommation ?

Les enjeux d’un projet d’Intelligence Artificielle

Le Rhino — Wed, 28 Jul 2021 12:54:00 +0000

L’IA fait aujourd’hui partie intégrante de notre quotidien. Nous l’utilisons dès le réveil via nos applications favorites comme Facebook Instagram, Twitter, etc.

Plus tard dans la journée, pour connaitre le chemin le plus court pour nous rendre sur notre lieu de rendez-vous, choisir un restaurant qui nous aura été préalablement suggéré en fonction de nos habitudes.

Et finalement, une fois la journée terminée, pour écouter de la musique, donner des ordres à notre assistant personnel connecté ou encore regarder nos vidéos favorites qui nous auront été suggérées.

L’Intelligence Artificielle : Définition

Mais pour commencer, quelle serait une définition de l’intelligence artificielle ?

Cédric Villani, le défini comme cela : L’intelligence artificielle, c’est toute technologie informative qui permet de résoudre des problèmes complexes qu’on aurait cru réservés à l’intelligence humaine.

Dans un futur proche, cette IA pourra être utilisée dans: le secteur de l’automobile pour conduire des véhicules autonomes, de la santé pour aider les professionnels à poser un diagnostic, ou dans beaucoup d’autres domaines pour analyser des quantités de données toujours plus importantes et prédire des modèles et anticiper les résultats.

La source

La source, c’est-à-dire la matière première utilisée par les algorithmes d’IA est la donnée. Elle peut prendre plusieurs formes et venir de sources multiples et variées.

Les données alors récupérées sont stockées et la quantité massive qu’elles représentent forment ce que l’on appelle le Big Data.

Des métiers ont aujourd’hui vu le jour autour du traitement de ces données et de leur analyse. Cette discipline s’appelle la Data science. L’objectif principal est alors de créer des modèles d’analyse des données et de faire apparaître des corrélations.

Pour aller plus loin, ces analyses peuvent être automatisées via 2 disciplines spécifiques de l’IA, le Machine learning et le Deep learning.

Le machine learning est un sous ensemble de l’IA et au même titre, le deep learning est un sous ensemble du machine learning.

Le principe du machine learning est d’apprendre à un programme informatique à réaliser une tâche et à l’automatiser tout en lui permettant de s’améliorer et de continuer à apprendre au cours de ses analyses.

Le deep learning quant à lui, s’appuie sur la mise en place d’un réseau neuronal. Chaque neurone sera responsable de réaliser un calcul pour fournir une donnée de sortie spécifique.

Vers la fin de l’humanité ?

Alors oui, lorsque l’on parle de l’IA, nous pensons rapidement à tous les films apocalyptiques tels que Terminator ou I-Robot dans lesquels, la machine prend le pas sur l’homme et cherche à l’anéantir.

En réalité, nous sommes encore très loin de ces scénarios de fin du monde.

Tout d’abord car l’IA et la robotique ne sont pas des synonymes. Il est possible d’intégrer de l’IA dans un robot mais les tâches qu’il réalise aujourd’hui sont pour la majorité séquentielles et donc ne s’appuient pas sur de l’IA mais aussi parce que les algorithmes qui existent aujourd’hui ont « appris à apprendre » et sont basés sur des formules mathématiques. En résumé, l’avènement des machines n’est pas encore pour demain et même si l’IA a un potentiel immense, elle reste aujourd’hui un programme informatique non motorisé sans sens critique et qui doit être programmée pour apprendre.

Quels enjeux pour l’avenir ?

L’IA vous l’aurez compris, a un potentiel extraordinaire si tant est qu’elle soit utilisée à bon escient. Elle permettra d’apporter une aide non négligeable aux médecins lors de l’analyse de données d’imagerie médicale, d’anticiper certaines catastrophes naturelles de façon beaucoup plus précise et donc de prévoir de manière plus efficace les ressources et les réponses à apporter.

De façon plus générale, l’IA pourra devenir une aide à la décision et à l’anticipation. Attention toutefois à ne pas se reposer entièrement sur les suggestions de ces algorithmes qui bien qu’intelligents ne doivent pas à terme remplacer l’humain et son esprit critique. L’Intelligence Artificielle est un outil et non pas une fin, gardons cela en tête.

Le devenir de nos données

Et les données dans tout ça ? La collecte des données, le devenir des données utilisées pour entrainer les algorithmes et à terme l’utilisation des données collectées par tous les acteurs du numérique est une question centrale.

D’où viennent ces données ? Quelles sont les données qui sont transmises ? Sont-elles monétisées ? Gardons simplement une chose en tête, une donnée qui se trouve sur internet, n’est plus une donnée qui nous appartient. Bien qu’elle reste une donnée personnelle, elle devient accessible et utilisable. Reste à savoir comment cette donnée sera traitée. Et sur ce point, la législation est assez jeune. La CNIL en France et la RGPD en Europe sont des régulateurs qui mettent petit à petit en place des verrous légaux pour limiter l’usage de ces données. Cependant, les acteurs du numérique tels qu’Amazon, Google, Twitter, Facebook, Microsoft etc. pour ne citer que les plus importants et les plus connus, ne sont pas nécessairement soumis aux législations locales puisque nos données transitent et peuvent être hébergées sur des serveurs qui ne sont pas sur le sol français et donc pas soumis au lois françaises/européennes.

La meilleure parade aujourd’hui consiste à contrôler les données que vous mettez en ligne et que vous partagez sur les réseaux et sur internet, sans toutefois tomber dans la paranoïa, auquel cas, il ne vous reste plus qu’à vous débarrasser de votre téléphone, ordinateur et de votre connexion internet.

Quid de l’environnement ?

Cette question peut paraître étonnante mais il faut savoir que les ressources nécessaires pour faire tourner un programme d’IA sont extrêmement importantes. En effet, la puissance de calcul pour réaliser les analyses est très consommatrice d’électricité. A terme, cette composante devra impérativement être prise en compte dans les projets d’IA puisque les ressources ne seront pas infinies.

Suivre un projet d’Intelligence Artificielle

Un projet d’IA se déroule selon des phases bien spécifiques décrites ci-dessous.

Pour que ce projet se déroule correctement, il faudra faire intervenir les profils suivant:

· Experts métiers : qui auront la connaissance du secteur auquel s’applique le projet et qui pourront apporter les données nécessaires et pointer les incohérences

· Experts du numérique : Développeur, Architecte logiciel

· Spécialistes de l’IA : Expert en IA et Data scientists

· Gouvernance : Chef de projet, Délégué à la protection des données et tout autre profil qui apportera sa compétence au projet

Vient ensuite le cadrage du besoin puis la réalisation et le traitement des données.

Il faudra commencer par nettoyer les données mises à disposition. C’est-à-dire, vérifier que les données fournies ne sont pas incohérentes, qu’elles ne présentent pas d’anomalies et qu’il ne manque pas certaines données.

Vient ensuite la phase d’exploration. L’objectif est de comprendre les données et d’essayer d’en tirer des observations et des corrélations. Des outils de visualisation des données tels qu’Excel ou Power BI entre autres peuvent être utilisés pour cela.

Modéliser les données. Une fois choisi l’outil d’IA qui sera utilisé et le modèle mathématique à appliquer à votre jeu de données, vous pourrez commencer à modéliser vos données et à essayer d’effectuer des prédictions grâce à votre système.

Dernière étape, l’évaluation et l’interprétation des données. Les résultats fournis par votre IA devront être étudiés, en les appliquant par exemple à un jeu de données existant que vous n’aurez pas utilisé pour vos tests afin de valider la prédiction.

La mise en production. Une fois le modèle validé, il ne reste plus qu’à l’utiliser en condition réelle et à vérifier que les prédictions de l’IA permettent bien de répondre aux objectifs fixés initialement.

Pour aller plus loin

Il existe différentes méthodes d’apprentissage pour l’IA.

Le Machine learning permet à un programme d’apprendre automatiquement et de faire évoluer ses résultats. Cet apprentissage peut être fait de 3 façons:

· Apprentissage supervisé, dans ce cas, on donne à l’algorithme le résultat attendu pour un certain échantillon de données, puis, on lui soumet de nouvelles données. Il devra se baser sur ce qu’il a déjà appris pour traiter les nouvelles données

· Apprentissage non supervisé, ici, on laisse l’algorithme effectuer des regroupements puis on valide ou non le résultat de ces regroupements

· Apprentissage par essai/erreur, dernière méthode, l’algorithme apprend au fur et à mesure des résultats. Il teste à chaque réponse si celle-ci est correcte ou non puis s’adapte en fonction du résultat. L’algorithme apprend par « tâtonnement »

Le Deep Learning est une sous discipline du machine learning et utilise un réseau de neurone artificiel.

Dans ce cas, les données de sortie attendues sont identifiées dès le départ. On introduit alors une donnée en entrée et chaque couche intermédiaire effectuera un calcul mathématique pour lequel elle a été programmée avant de la transmettre à la couche suivante jusqu’à la couche de sortie qui devra donner le résultat. En fonction de la véracité du résultat, le réseau adaptera ses calculs pour optimiser ses réponses et donner le bon résultat à coup sûr.

Bilan

J’espère que cet article vous aura permis d’y voir un peu plus clair dans ce vaste univers qu’est l’Intelligence Artificielle et de déconstruire les idées reçues qui ont encore la vie dure. Non l’IA n’est pas encore prête à remplacer l’homme mais on peut déjà identifier des avancées significatives grâce à elle.

Des questions éthiques sont posées et devront continuer à l’être. Par exemple la notion de biais qui peuvent être introduits dans les algorithmes si les données en entrée ne sont pas elles même neutres. Or à ce jour, les algorithmes d’IA ne sont pas capables de discernement et d’esprit critique. C’est donc l’homme qui doit être garant de la qualité et de la neutralité des données d’apprentissage. A qui la faute donc si une Intelligence Artificielle aura appris à favoriser certaines personnes ou un certain type de réponse car les données d’entrée lui auront appris cela ? J’ai mon avis, je vous laisse vous faire le vôtre. Il sera donc indispensable de mettre en place des gardes fous en particulier lorsque ces données traiteront de l’humain.

Dernier point, il faudra que les utilisateurs soient capables de conserver un esprit critique vis-à-vis des résultats et ne pas se reposer sur la machine. Nous sommes de plus en plus confrontés à ces outils qui facilitent notre prise de décision et notre vie de tous les jours. Alors prenons le bon chemin, utilisons cela comme ce que c’est, un outil qui nous permettra de libérer du temps pour d’autres tâches à plus forte valeur ajoutée et que l’IA « ne saura pas » traiter comme les relations humaines et investir notre temps gagné dans des actions plus utiles pour le bien commun. Si ce sujet vous intéresse, je vous conseil de suivre cette formation d’Openclassrooms dont je me suis inspiré pour écrire cet article.