How They Work
Understanding LLMs Deeper
What LLMs Are Good At
-
✓
Explaining physics, math, and engineering concepts in multiple ways
-
✓
Generating practice problems and quiz questions tailored to your syllabus
-
✓
Debugging code and suggesting targeted fixes
-
✓
Drafting lab reports and technical documentation
-
✓
Brainstorming project architectures and research directions
-
✓
Translating technical documentation between languages
When NOT to Trust LLMs
-
✗
Blindly copying unverified code into production or assignments
-
✗
Assuming citations are real — hallucinated references are still common
-
✗
Using outdated information without cross-checking training cutoffs
-
✗
Submitting AI-generated text as your own work (academic integrity!)
-
✗
Trusting LLMs for critical engineering calculations — use Wolfram Alpha
-
✗
Trusting "reasoning" models for guaranteed correct answers
// What's New in 2026
LLMs have transitioned from standalone chat tools to core infrastructure — they now power agentic workflows, tool-calling pipelines, MCP servers, and multi-step autonomous systems far beyond simple Q&A. Multimodality is now standard — top models handle text, images, audio, and video in a single prompt. Reasoning models are a new category entirely: they spend "thinking time" before answering, trading latency for accuracy on hard problems.
How LLMs Actually Work (Updated)
- Trained on billions to trillions of parameters across text, code, images, and audio
- Support 100,000–1,000,000+ token context windows — entire textbooks in one prompt
- Multimodality is now standard across top models
- Reasoning models differ fundamentally: they reason internally before outputting
- Fine-tuning is now cheap — LoRA/QLoRA adapt models in days without supercomputer access
- Chain-of-thought prompting improves performance by up to 61 percentage points on math benchmarks — but only on models with 100B+ parameters
- CoT on reasoning models gives only marginal benefit — they already reason internally; forcing CoT adds 20–80% latency with little gain
- Open-source models (Llama 4, DeepSeek, Qwen3) now rival closed models on many benchmarks
- RAG (Retrieval-Augmented Generation) lets LLMs answer from your own documents
Reasoning Models: A New Category
Standard and reasoning models are now two distinct classes:
Standard LLMs
- Examples: GPT-5.3, Gemini Flash, Mistral
- Speed: Fast, generates immediately
- Best for: Writing, summarization, chat
- CoT prompting: Helps significantly
- Thinking visible? No
Reasoning LLMs
- Examples: o3, DeepSeek R1, Gemini 2.5 Pro, Qwen3
- Speed: Slower (thinks before answering)
- Best for: Math, code, logic, multi-step problems
- CoT prompting: Marginal gain, adds latency
- Thinking visible? Yes — blocks exposed
Local LLMs — Run Offline
You can run powerful models entirely on your own machine, with no subscriptions and full privacy:
Ollama
One command to pull and run 100+ models. Cross-platform. OpenAI-compatible API. ollama run llama3
LM Studio
Best GUI for beginners. Model discovery, easy quantization settings, local API server.
GPT4All
Desktop app, beginner-friendly. Includes local RAG — chat with your own files.
Top Local Models
Llama 4, DeepSeek V3.2, Qwen3-80B, Mistral Large 3, Gemma 3, NVIDIA Nemotron 3.
Popular Tools Compared (April 2026)
| Tool |
Best For |
Free Tier (2026) |
Student Edge |
| ChatGPT |
Tutoring, summarization, agentic tasks |
GPT-5.3, ~10 msgs/5 hrs |
File uploads, image gen (2–3/day on free) |
| Google Gemini |
Research, Docs/Slides integration |
Gemini 2.5 Flash |
Up to 12 months AI Pro for verified students |
| GitHub Copilot |
AI code completion & debugging |
Free for everyone since 2024 |
Integrated in VS Code, JetBrains, Neovim |
| Cursor |
AI-first IDE, deep codebase context |
50 premium completions/mo |
VS Code fork; GPT-4, Claude, Gemini, Grok |
| Perplexity |
Research with citations |
5 Pro + 3 Deep Research/day |
Source-linked answers, literature reviews |
| Claude |
Long documents, code analysis, writing |
Free tier available |
200K context window; free is limited |
| DeepSeek |
Coding, math, reasoning |
Free — no account needed |
Most capable fully-free reasoning model |
| Claude Code |
Complex agentic coding, architecture |
$20/mo (Pro required) |
CLI agentic tool; 200K context; native terminal |
| NotebookLM |
Studying from your own PDFs/notes |
Free |
Upload lectures; AI answers from your sources |
| Wolfram Alpha |
Math, physics, verified calculations |
Free (limited) |
Do NOT use LLMs for safety-critical math |
Prompting Tips
Core Techniques
- Add
"think step by step" to improve reasoning in standard models
- Few-shot prompting: give 2–3 examples — often more effective than long instructions
- Specify your role:
"You are an expert thermodynamics professor"
- Ask for multiple approaches to see trade-offs
- Iterative refinement beats single-shot — start broad, then refine
- Break complex problems into subtasks — one prompt per subtask
Advanced Tips
- Use negative constraints:
"Don't use recursion" sharpens code generation
- For code, always specify language, framework version, and constraints
- Ask the model to explain its reasoning after giving an answer
"What are common mistakes when doing X?" often beats "How do I do X?"
- DeepSeek is particularly strong at competitive-programming-style algorithm problems
- Use AI to document existing code — paste a function, ask for full docstrings
50 Additional Facts & Tips
Understanding LLMs Deeper
- LLMs don't "look things up" — they generate text based on learned patterns
- Temperature controls creativity: 0 = deterministic, 1+ = creative
- Context window = the LLM's working memory; anything outside is forgotten
- Model size ≠ model quality; training data quality and RLHF matter equally
- RLHF is why models feel helpful and safe, not just fluent
- Hallucination remains unsolved even in 2026 frontier models
Coding with AI
- Scaffold, then understand — let AI generate structure, you fill in understanding
- GitHub Copilot now has Agent Mode for multi-step tasks in VS Code
- Always run AI-generated code in a sandbox first, never on production
- LLMs are excellent for writing regex — notoriously hard to write manually
- Use AI to generate test cases — better at edge cases than expected
- Ask AI to review code for security: SQL injection, XSS, etc. as a first pass
Academic Use — Do's & Don'ts
Do
- Use LLMs to understand, not replace — ask it to explain the concept, then solve the problem yourself
- Generate practice problems and immediately attempt them before checking solutions
- Use NotebookLM to chat with your own lecture slides and PDFs
- Cross-check any citation with Google Scholar before submitting
- Use Wolfram Alpha or MATLAB for physics/math calculations — not ChatGPT
- Disclose AI assistance according to your institution's policy
Don't
- Use an LLM to write your lab report — write it yourself, use AI only for clarity
- Use AI for exam simulations you plan to submit — that's cheating
- Blindly trust code solutions — understand every line before using it
- Paste API keys or personal data into public LLM interfaces
- Assume "reasoning" models are always correct — confident, detailed, wrong answers exist
- Trust free tier data privacy — check training opt-out settings
→ The Future (What's Coming)
Agentic AI is the 2026 paradigm shift — models that plan, use tools, browse, write code, and execute autonomously. MCP (Model Context Protocol) is the new standard letting LLMs persistently access your apps, CRMs, and databases. The competitive landscape means free tiers keep improving — GPT-5.3 is now on ChatGPT's free plan, unthinkable a year ago. The bottleneck is no longer capability — it's consistency, reliability, and system design.
Comment ils fonctionnent
Mieux comprendre les LLMs
Ce que les LLMs savent bien faire
-
✓
Expliquer la physique, les mathématiques et l'ingénierie sous plusieurs angles
-
✓
Générer des exercices et quiz adaptés à ton programme
-
✓
Déboguer le code et proposer des corrections ciblées
-
✓
Rédiger des rapports de laboratoire et de la documentation technique
-
✓
Brainstormer des architectures de projets ou des pistes de recherche
-
✓
Traduire de la documentation technique entre différentes langues
Quand ne pas faire confiance aux LLMs
-
✗
Copier du code non vérifié dans la production ou dans tes devoirs
-
✗
Supposer que les citations sont réelles — les références inventées sont encore fréquentes
-
✗
Utiliser des informations obsolètes sans vérifier les dates d'entraînement
-
✗
Soumettre du texte généré par IA comme ton propre travail (intégrité académique !)
-
✗
Faire confiance aux LLMs pour des calculs d'ingénierie critiques — utilise plutôt Wolfram Alpha
-
✗
Croire que les modèles de "raisonnement" garantissent toujours la justesse des réponses
// Nouveautés en 2026
Les LLMs sont passés d'outils de chat isolés à une infrastructure centrale — ils propulsent désormais des flux de travail agentiques, des pipelines d'appel d'outils, des serveurs MCP, et des systèmes autonomes multi-étapes bien au-delà du simple Q&R.
La multimodalité est désormais standard : les meilleurs modèles traitent texte, images, audio et vidéo dans une seule invite.
Les modèles de raisonnement constituent une nouvelle catégorie : ils prennent un temps de réflexion avant de répondre, privilégiant la précision à la vitesse pour les problèmes complexes.
Comment les LLMs fonctionnent réellement (mise à jour)
- Entraînés sur des milliards à des trillions de paramètres à travers texte, code, images et audio
- Contextes de 100 000 à 1 000 000+ jetons — un manuel entier dans une seule invite
- Multimodalité désormais standard sur les meilleurs modèles
- Les modèles de raisonnement réfléchissent en interne avant de produire une réponse
- Le fine-tuning est devenu abordable — LoRA/QLoRA adaptent un modèle en quelques jours sans supercalculateur
- Le chain-of-thought prompting améliore les performances jusqu'à +61 points sur les benchmarks de math (sur modèles >100B paramètres)
- Sur les modèles de raisonnement, le CoT n'apporte que peu de bénéfices et augmente la latence (20–80%)
- Les modèles open-source (Llama 4, DeepSeek, Qwen3) rivalisent désormais avec les modèles fermés
- La génération augmentée par récupération (RAG) permet aux LLMs de répondre à partir de vos propres documents
Modèles de raisonnement : une nouvelle catégorie
Deux classes distinctes existent maintenant :
LLMs standard
- Exemples : GPT-5.3, Gemini Flash, Mistral
- Vitesse : Rapide, commence à générer immédiatement
- Idéal pour : Rédaction, résumé, discussion
- Chain-of-thought : Amélioration significative
- Réflexion visible : Non
LLMs de raisonnement
- Exemples : o3, DeepSeek R1, Gemini 2.5 Pro, Qwen3
- Vitesse : Plus lente (réfléchit avant de répondre)
- Idéal pour : Math, code, logique, problèmes multi-étapes
- Chain-of-thought : Gain marginal, ajoute de la latence
- Réflexion visible : Oui — blocs visibles
LLMs locaux — utilisation hors ligne
Vous pouvez exécuter des modèles puissants sur votre propre machine, sans abonnement et avec une confidentialité totale :
Ollama
Une commande pour télécharger et exécuter 100+ modèles. Multiplateforme. API compatible OpenAI. ollama run llama3
LM Studio
Meilleure interface graphique pour débutants, gestion facile des modèles et du quantization, serveur API local.
GPT4All
Application de bureau conviviale. Inclut le RAG local — discutez avec vos propres fichiers.
Meilleurs modèles locaux
Llama 4, DeepSeek V3.2, Qwen3-80B, Mistral Large 3, Gemma 3, NVIDIA Nemotron 3.
Comparatif des outils populaires (avril 2026)
| Outil |
Idéal pour |
Gratuité (2026) |
Avantage étudiant |
| ChatGPT |
Tutoriel, résumé, tâches agentiques |
GPT-5.3, ~10 messages / 5 h |
Téléversement de fichiers, génération d'images (2–3/jour) |
| Google Gemini |
Recherche, Docs/Slides |
Gemini 2.5 Flash |
Jusqu'à 12 mois d'accès AI Pro pour étudiants vérifiés |
| GitHub Copilot |
Complétion et débogage de code |
Gratuit pour tous depuis 2024 |
Intégré à VS Code / JetBrains / Neovim |
| Cursor |
IDE axé sur l'IA, contexte profond |
50 complétions premium/mois |
Bifurcation VS Code avec GPT-4, Claude, Gemini, Grok |
| Perplexity |
Recherche avec sources citées |
5 Pro + 3 Deep Research/jour |
Réponses sourcées, veille scientifique |
| Claude |
Longs documents, analyse de code |
Gratuit (limité) |
Fenêtre de contexte 200K |
| DeepSeek |
Code, maths, raisonnement |
Gratuit, sans compte |
Modèle de raisonnement le plus performant en libre accès |
| Claude Code |
Codage agentique complexe |
20$/mois (Pro requis) |
Outil CLI, 200K contexte, terminal natif |
| NotebookLM |
Révision de ses propres notes |
Gratuit |
Analyse intelligente de PDFs/conférences |
| Wolfram Alpha |
Calculs vérifiés, physique, maths |
Gratuit (limité) |
Ne pas utiliser les LLMs pour math critique |
Conseils de prompting
Techniques de base
- Ajoutez « pense étape par étape » pour améliorer le raisonnement
- Donnez 2–3 exemples (few-shot prompting) plutôt qu'un long texte
- Spécifiez un rôle (« Tu es un professeur expert en thermodynamique »)
- Demandez plusieurs approches pour comparer
- Utilisez un raffinement itératif : commencez large, puis affinez
- Divisez les problèmes complexes en sous-tâches
Astuces avancées
- Ajoutez des contraintes négatives (« Ne pas utiliser de récursion »)
- Pour le code, précisez langage, framework et version
- Demandez au modèle d'expliquer son raisonnement après la réponse
- Privilégiez les questions du type « erreurs courantes »
- DeepSeek excelle dans les problèmes d'algorithmie compétitive
- Faites documenter votre code par l'IA : collez une fonction, demandez une docstring complète
50 faits et conseils supplémentaires
Mieux comprendre les LLMs
- Les LLMs ne "cherchent" pas d'informations, ils génèrent à partir de modèles appris
- Temperature contrôle la créativité (0 = déterministe, 1+ = créatif)
- Fenêtre de contexte = mémoire de travail du modèle
- Taille ≠ qualité : la qualité des données et le RLHF sont tout aussi cruciaux
- Le RLHF rend les modèles utiles et sûrs, pas seulement fluides
- Les hallucinations persistent, même en 2026
IA et code
- Laisse l'IA générer la structure, comprends toujours le fond
- Copilot dispose désormais d'un Agent Mode pour tâches multi-étapes
- Exécute le code IA uniquement dans un bac à sable
- Les LLMs excellent pour écrire des regex
- Utilise l'IA pour générer des tests, surtout pour cas extrêmes
- Demande une analyse de sécurité (SQLi, XSS, etc.) avant exécution
Usage académique — à faire / à éviter
À faire
- Utiliser les LLMs pour comprendre, pas remplacer
- Générer des exercices et les résoudre soi-même
- Utiliser NotebookLM pour discuter avec ses supports de cours
- Vérifier toutes les citations avec Google Scholar
- Utiliser Wolfram Alpha/MATLAB pour les calculs de physique et math
- Déclarer l'usage de l'IA selon la politique de son établissement
À ne pas faire
- Ne pas laisser l'IA rédiger ton rapport de labo complet
- Ne pas tricher avec des simulateurs d'examens
- Ne jamais utiliser du code que tu ne comprends pas
- Ne pas coller de clés API ou données privées dans les modèles publics
- Ne pas supposer qu'un modèle de raisonnement a toujours raison
- Vérifier les paramètres de confidentialité avant d'utiliser la version gratuite
→ L'avenir (ce qui arrive bientôt)
L'ère 2026 est celle de l'IA agentique — des modèles capables de planifier, utiliser des outils, naviguer, coder et exécuter de manière autonome.
Le MCP (Model Context Protocol) est la nouvelle norme permettant aux LLMs d'accéder en continu à vos applications, CRM et bases de données.
Les offres gratuites continuent de s'améliorer — GPT-5.3 est désormais sur le plan gratuit de ChatGPT.
Le problème n'est plus la capacité, mais la cohérence, la fiabilité et la conception système.