Agent

Système d'intelligence artificielle qui perçoit son environnement et prend des mesures pour atteindre des objectifs spécifiques. Les agents peuvent être de simples systèmes basés sur des règles ou des systèmes d'apprentissage complexes qui s'adaptent à leur environnement.

Grand modèle de langage (LLM)

Classe de modèles d'IA formés sur des quantités massives de données textuelles pour comprendre et générer le langage humain. Les LLM utilisent souvent des architectures basées sur des transformateurs, qui excellent à capturer les relations contextuelles entre les mots et les phrases. En raison de leur taille et de leur complexité, les LLM peuvent être adaptés à diverses tâches de traitement du langage naturel, telles que la génération de texte, le résumé, la traduction et la réponse aux questions. Les exemples incluent GPT (Generative Pre-trained Transformer) et BERT (Bidirectional Encoder Representations from Transformers).

Algorithme

Ensemble spécifique de règles ou d'instructions qui définissent la manière dont un système d'intelligence artificielle traite les informations et prend des décisions. Les algorithmes constituent la base de tous les systèmes d'IA et déterminent leur comportement.

Intelligence artificielle (IA)

Le domaine de l'informatique se concentre sur la création de systèmes intelligents capables d'effectuer des tâches qui requièrent généralement l'intelligence humaine, telles que l'apprentissage, le raisonnement, la résolution de problèmes, la perception et la compréhension du langage.

Réseau neuronal (réseau neuronal artificiel)

Architecture informatique inspirée des réseaux neuronaux biologiques, composée de nœuds interconnectés (neurones) qui traitent et transmettent des informations. Les réseaux neuronaux sont à la base de nombreux systèmes d'IA modernes, en particulier dans le domaine de l'apprentissage profond.

Biais (dans l'IA)

Les erreurs systématiques dans les systèmes d'IA résultent de données d'entraînement déséquilibrées ou non représentatives ou de défauts de conception, ce qui peut conduire à des résultats injustes ou discriminatoires. La prise en compte des biais est cruciale pour un développement responsable de l'IA.

Vision par ordinateur

Ce domaine de l'IA vise à permettre aux ordinateurs de comprendre et de traiter les informations visuelles (images, vidéos). Les applications comprennent la reconnaissance faciale, les véhicules autonomes et l'analyse de l'imagerie médicale.

Ensemble de données

Ensemble de données utilisées pour former, valider et tester des modèles d'IA. Des ensembles de données diversifiés et de haute qualité sont essentiels pour développer des systèmes d'IA efficaces.

Apprentissage en profondeur

Sous-ensemble de l'apprentissage automatique utilisant des réseaux neuronaux à couches multiples, permettant aux systèmes d'apprendre des modèles et des représentations complexes directement à partir des données.

IA explicable (XAI)

Approches et technologies qui rendent les décisions des systèmes d'IA transparentes et interprétables pour les humains. Particulièrement important dans les secteurs réglementés comme les soins de santé et la finance.

Caractéristique

Une propriété ou une caractéristique individuelle mesurable utilisée comme entrée dans un modèle d'apprentissage automatique. Les caractéristiques sont les composants de base que les modèles utilisent pour faire des prédictions ou prendre des décisions.

IA générative

Systèmes capables de créer un nouveau contenu (texte, images, musique ou code) à partir de modèles appris à partir de données d'apprentissage. Il s'agit notamment de grands modèles de langage et de technologies de génération d'images.

Apprentissage machine (ML)

Un sous-ensemble de l'IA qui permet aux systèmes d'apprendre et de s'améliorer à partir de l'expérience sans programmation explicite. Les algorithmes d'apprentissage automatique identifient des modèles dans les données pour faire des prédictions ou prendre des décisions.

Modèle

Représentation mathématique d'un processus du monde réel créée par l'apprentissage à partir de données. Les modèles servent de moteur de prise de décision dans les systèmes d'IA.

Traitement du langage naturel (NLP)

Technologie qui permet aux ordinateurs de comprendre, d'interpréter et de générer du langage humain. Le NLP alimente des applications telles que la traduction automatique, les chatbots et l'analyse de texte.

Optimisation

Processus consistant à ajuster les paramètres d'un modèle d'IA afin d'améliorer ses performances dans des tâches spécifiques, souvent en minimisant une fonction de perte ou en maximisant une récompense.

Apprentissage par renforcement (RL)

Un type d'apprentissage automatique dans lequel un agent apprend des comportements optimaux par le biais d'interactions essai-erreur avec un environnement, en recevant des récompenses ou des pénalités pour ses actions.

Apprentissage supervisé

Approche de l'apprentissage automatique dans laquelle les modèles sont formés sur des données étiquetées, apprenant à faire correspondre des entrées à des sorties connues. Couramment utilisé pour des tâches telles que la classification et la régression.

Formation (formation au modèle)

Processus consistant à apprendre à un modèle d'intelligence artificielle à effectuer des tâches spécifiques en l'exposant à des exemples et en ajustant ses paramètres (poids) en fonction de ses performances.

Apprentissage par transfert

Technique selon laquelle les connaissances acquises dans le cadre d'une tâche sont appliquées à une tâche différente mais connexe, ce qui améliore l'efficacité et réduit la nécessité de disposer de vastes ensembles de données de formation.

Apprentissage non supervisé

Approche de l'apprentissage automatique dans laquelle les modèles apprennent des schémas et des structures à partir de données non étiquetées, sans résultats prédéfinis. Utile pour le regroupement, la réduction de la dimensionnalité et la détection des anomalies.

Surajustement

Lorsqu'un modèle apprend des modèles trop spécifiques aux données d'apprentissage, ce qui se traduit par des performances médiocres sur de nouvelles données inédites.

Sous-ajustement

Lorsqu'un modèle est trop simple ou n'a pas été entraîné assez longtemps et ne parvient pas à capturer les tendances sous-jacentes des données, ce qui entraîne de mauvaises performances à la fois sur les ensembles d'entraînement et de test.

Hyperparamètres

Variables de configuration définies avant la formation (par exemple, taux d'apprentissage, nombre de couches, taille du lot). Ces variables ne sont pas apprises à partir des données d'apprentissage et doivent être réglées pour obtenir des performances optimales.

Fonction d'activation

Fonction appliquée à la sortie d'un neurone dans un réseau neuronal pour introduire une non-linéarité (par exemple, ReLU, Sigmoïde, Tanh).

Fonction de perte (fonction de coût)

Mesure de la distance entre les prédictions d'un modèle et les valeurs correctes. La formation vise généralement à minimiser cette fonction pour améliorer la précision du modèle.

Descente de gradient

Un algorithme d'optimisation est utilisé pour minimiser la fonction de perte en ajustant itérativement les poids du modèle dans la direction opposée au gradient de la perte.

Backpropagation

Un algorithme qui calcule le gradient de la fonction de perte par rapport à chaque poids dans un réseau neuronal en propageant les erreurs vers l'arrière, ce qui permet de mettre à jour les poids.

Époque

Un passage complet à travers l'ensemble des données de formation. Plusieurs époques sont utilisées pour affiner les paramètres du modèle de manière itérative.

Lot (mini-lot)

Un sous-ensemble des données d'apprentissage est utilisé dans une itération de mise à jour du modèle. La formation peut utiliser des lots complets (descente de gradient par lots) ou des mini-lots plus petits (descente de gradient par mini-lots).

Réseau neuronal convolutif (CNN)

Classe de réseaux neuronaux profonds principalement utilisés pour l'analyse d'images visuelles, utilisant des opérations de convolution pour extraire des caractéristiques spatiales.

Réseau neuronal récurrent (RNN)

Classe de réseaux neuronaux conçus pour les données séquentielles (par exemple, séries temporelles, texte). Les RNN maintiennent un état caché interne qui capture des informations sur les entrées précédentes.

Mémoire à long terme (LSTM)

Un type spécialisé de RNN qui traite les gradients d'évanouissement/explosion avec des mécanismes de gating, permettant aux modèles de capturer les dépendances à long terme dans les données séquentielles.

Réseau adversarial génératif (GAN)

Un cadre composé de deux modèles - un générateur et un discriminateur - qui s'affrontent. Les GAN sont largement utilisés pour des tâches telles que la génération d'images réalistes.

Big Data

Ensemble de données extrêmement volumineuses et complexes qui nécessitent des outils avancés pour le stockage, le traitement et l'analyse. Le Big Data et l'IA se recoupent souvent, car de vastes ensembles de données peuvent améliorer considérablement les capacités de l'IA.

Edge Computing

Traitement des données au plus près de la source de données (sur des appareils ou des serveurs locaux) plutôt que de s'appuyer uniquement sur des serveurs centralisés dans le nuage. Dans l'IA, cela réduit la latence et l'utilisation de la bande passante et permet une inférence en temps réel.

Test de Turing

Proposé par Alan Turing, il teste la capacité d'une machine à faire preuve d'une intelligence indiscernable de celle d'un humain. Si un évaluateur ne peut pas distinguer de manière fiable une machine d'un humain, on dit que la machine a réussi le test de Turing.