Skip to content

Latest commit

 

History

History
111 lines (53 loc) · 3.44 KB

IA-ML-basics.md

File metadata and controls

111 lines (53 loc) · 3.44 KB

Intelligence artificielle et Machine learning - basics

ressources

Concepts

Concept IA définition
IA simule l'intelligence humaine à partir du ML
ML Machine learning, Apprentissage et modèles prédictifs / probabilistes
IA générative Sous-ensemble axé sur la création de contenu (texte, image...)
LLM Large Language Model, entrainé sur un large ensemble de données pour simuler un langage humain
SLM Petit modèle de donnée
Data Analyse et Statistiques
Word Embedding Méthode de représentation des mots pour l’apprentissage automatique

Cycle de vie

  1. Entrainement : création du modèle, affinage, tests, etc.

  2. Déploiement : Test et Audit de sécurité, build, intégration, mise en prod

  3. Production : MCO/MCS (Maintien en conditions opérationnelles et de sécurité)

Principe du Word Embedding

  • Initialisation: Chaque mot unique dans le corpus de texte est associé à un vecteur de nombres aléatoires.

  • Contexte: L’algorithme examine ensuite chaque mot dans le contexte des mots qui l’entourent dans le corpus.

  • Ajustement: Les vecteurs sont ajustés de manière à ce que les mots qui apparaissent dans des contextes similaires aient des vecteurs plus proches les uns des autres.

  • Résultat: À la fin de ce processus, chaque mot est représenté par un vecteur qui encode quelque chose de son sens.

Attaques et vulnérabilités

  • Porter atteinte aux Critères D.I.C.T.

  • Injections classiques (Saisies utilisateurs non nettoyées, XSS, CSRF prompt injection, etc.)

  • Infection, corruption du modèle, data poisonning, Injection de contexte. Par exemple : faire lire au serveur le contenu d'un fichier sensible ou malveillant qui sera ajouté au modèle et modifiera les réponses de l'IA.

  • Manipulation du modèle / fonctionnalité non prévue. Par exemple faire compléter des mots ou des listes, jusqu'a obtenir des informations ou un comportement non prévu par le modèle.

  • Fuite de données sensibles ou protegées du fait du Modèle ou de l'absence de restriction

protection du modèle pour des requêtes éfficaces

  • Informer de spécificité de la mission / requete

  • Préciser répondre/agir en tant que <metier> ou <outil de traduction python vers .NET>

  • rester en anglais : act as <...>

  • Donner des tâches 1. <...>, 2. <...>, 3. <...>

Chat GPT - OpenAI & Microsoft - Copilot

  • Questions generalistes

  • Faire vérifier un bout de code

  • toujours besoin de vérifier les infos

Copilot

  • Info de session : /id

Github Copilot

  • Disponible pour Visual Studio Code, Visual Studio, Neovim, JetBrains

ML.NET - Technologie .NET pour le Machine Learning

  • Pour les projets .NET / C#

  • Repose sur ML builder (AutoML) qui facilite l'utilisation pour un projet simple

  • On met en forme les données, et donne notre objectif

  • la feature nous propose l'algorithme le plus adéquat

Azure ML et Azure AI services

  • ML -> permet notamment de publier une API à partir du modèle ML entrainé

  • IA -> dont la recherche cognitive qui permet d'indexer et rechercher des données (notamment à partir de texte afin de sortir le sentiment global et les mots clés)

  • Bots et applications C# / Python

Mistral AI