À contre-courant
Un chercheur cherche. J'ai choisi de chercher à contre-courant.
L'intelligence artificielle de cette décennie n'avance que dans un sens : plus gros, plus loin du sol. Des modèles qui doublent de taille d'une année sur l'autre, entraînés sur des continents de données, hébergés dans des salles de calcul que personne ne visite, et à qui l'on confie de plus en plus le soin de dire le vrai. J'ai pris l'autre route, et ce texte explique pourquoi.
Chercher à rebours, ici, c'est viser quatre choses que la course à l'échelle a reléguées au second plan. La frugalité d'abord : un système qui tient sur une machine ordinaire et calcule peu, au lieu d'un appétit sans fond. La souveraineté ensuite : la donnée et le moteur restent chez celui à qui ils appartiennent, ils ne partent pas se faire juger ailleurs. La vie privée, qui découle de la précédente et cesse d'être une promesse pour devenir une propriété du montage. Et surtout, la plus mal comprise : rendre au modèle de langage le seul travail qu'il fait vraiment bien, la langue et la voix, en lui retirant celui qu'on lui confie à tort, dire ce qui est vrai.
Le fil qui relie ces quatre visées ne vient pas de l'informatique. Il vient des neurosciences de la mémoire. L'idée tient en une image que j'assume : transposer ce que le vivant fait d'une trace mnésique dans un algorithme au déterminisme froid, et n'ajouter le modèle de langage que par-dessus, comme la voix chaude de l'outil. Le froid tient la vérité ; le chaud la met en mots. Tout ce qui suit découle de cette séparation.
Le constat
Nous avons donné à des machines la parole avant de leur donner la vérité.
Un grand modèle de langage formule admirablement et ne sait rien. Posez-lui un fait précis, un numéro, une date, une clause, une décision prise il y a huit mois, et il rend la suite de mots la plus plausible, sans aucun moyen de savoir si elle est vraie. Sur des données publiques, cela passe le plus souvent. Sur les vôtres, un dossier client, un numéro réglementé, un engagement contractuel, un résultat médical, la même plausibilité se retourne : elle prend l'apparence d'une réponse et vous ment.
L'industrie répond à ce défaut par le RAG : retrouver des passages proches et les tendre au modèle. Retrouver un texte voisin, ce n'est pourtant pas se souvenir, et le voisinage n'a jamais fait la vérité. Un tel montage ignore ce qui fait une mémoire : la contradiction, la décision qui en annule une autre, le fait corroboré qu'on distingue du fait vu une seule fois, le dossier qui se referme, la valeur qu'un calcul peut vérifier. Il déplace le problème sans le résoudre. Le modèle n'hallucine plus sur sa mémoire, il hallucine sur le contexte qu'on lui a servi. Le juge reste le modèle.
C'est le péché originel des systèmes d'IA posés sur la donnée d'entreprise : le modèle est au centre. C'est lui qui décide de ce qui est vrai, à l'instant où on le lit. Tant que cette place ne bouge pas, aucun prompt, aucun fine-tuning, aucun garde-fou ne rend le système fiable sur un fait. On ne corrige pas une architecture avec une consigne.
La thèse
Sur de la donnée privée ou d'entreprise, le modèle de langage ne doit jamais être la source de vérité, ni le juge au moment de la lecture. On construit un moteur déterministe qui possède la vérité, la provenance et la confiance. Le modèle n'est que l'interface en langage naturel : la voix. Jamais le juge.
Le déplacement est plus profond qu'une optimisation : il change la main qui décide. La vérité se calcule en amont, par du code qu'on peut auditer, tester, rejouer. Quand la question arrive, le modèle reçoit un fait déjà établi, avec sa confiance et sa source, et il n'a qu'une chose à faire, le dire bien. Il ne tranche rien au moment où l'utilisateur l'interroge.
C'est ici que la métaphore devient technique. Le moteur déterministe est la part froide du système : une trace calculée, vérifiée, qui ne change pas d'avis entre deux lectures, à l'image de l'engramme que les neurosciences décrivent comme le substrat physique d'un souvenir. Le modèle est la part chaude : la parole, souple, sensible au contexte, qui donne au fait une forme humaine. Le froid garantit ; le chaud accueille. Séparer les deux, c'est refuser que la parole se fasse passer pour de la mémoire.
De ce renversement découle une discipline. Elle tient en sept principes, et ces principes sont agnostiques de la technologie : ils valent pour un ERP, un CRM, un outil métier interne autant que pour un assistant personnel.
Les sept principes
- 1
La vérité se calcule, elle ne se génère pas.
Les faits sont établis dès l'entrée, en clair et en structuré, puis relus tels quels sans que rien ne soit réinventé à la volée. Quand un modèle aide à les extraire, il n'a pas le droit d'en garder un seul qu'il ne puisse pointer dans le document d'origine ; ce qu'il ne peut pas montrer, il le laisse tomber. On ne sert jamais un fait deviné.
- 2
Un identifiant se prouve avant d'être cru.
Un numéro national, un IBAN, une référence de dossier ne comptent pour ce qu'ils prétendent être qu'une fois passé le calcul qui les valide. Un numéro d'acte pris à tort pour un numéro national échoue à ce contrôle, et ne sera donc jamais affiché comme tel. Là où le modèle devinerait, le calcul décide.
- 3
Chaque fait porte sa source, son état et sa confiance.
Rien ne s'affiche nu. Chaque fait montre d'où il vient, où il en est de son cycle de vie, proposé, en vigueur, remplacé, clos, et à quel point on peut s'y fier. La machine annonce sa confiance, et le modèle n'a pas le droit de la gonfler. Le cerveau tient déjà ce registre : il garde côte à côte le contenu d'un souvenir et sa provenance, et c'est en perdant le fil de cette provenance qu'il se met à fabriquer de faux souvenirs (Johnson, Hashtroudi et Lindsay, 1993). Savoir à qui appartient un fait relève de l'honnêteté.
- 4
Les contradictions se règlent par le calcul, à l'écart de la lecture.
Quand deux faits se contredisent, la résolution est calculée, pas négociée sur le moment. Si un cas subtil demande l'avis d'un modèle, il le donne à l'écart, à l'écriture, et son verdict est rangé comme une donnée parmi d'autres. À la lecture, plus aucun modèle ne juge : on sert un verdict déjà rendu.
- 5
La mémoire a une structure.
Se souvenir, c'est bien plus que remettre la main sur du texte voisin. C'est tenir ensemble ce qui va ensemble, laisser vif ce qui compte et laisser pâlir le reste sans l'effacer tout à fait, traiter une contradiction ou une décision comme des objets de première classe. Le vivant a montré la voie : ce qui s'active ensemble finit par se lier (Hebb, 1949), et ce qu'on ne revoit pas s'estompe selon une courbe qu'on connaît depuis plus d'un siècle (Ebbinghaus, 1885). On vise une mémoire, là où l'index se contente de retrouver.
- 6
La frontière de confiance vit dans le code.
Un contenu d'origine douteuse, un e-mail, une page web, tout ce que n'importe qui peut fabriquer, est marqué comme tel et ne peut déclencher aucune action. Le moindre effet sur le monde, écrire, envoyer, modifier, passe par une confirmation humaine et laisse une trace. La règle ne souffre pas d'exception : on ne place jamais dans le champ du modèle une donnée ou un pouvoir qu'il n'a pas le droit d'émettre. L'interdiction est dans le code, pas dans le prompt.
- 7
La confiance commande le comportement.
« Je ne sais pas » est une réponse de plein droit. La psychologie du témoignage l'a montré il y a un demi-siècle : on peut être sûr de soi, précis dans le moindre détail, et se tromper d'un bout à l'autre (Loftus et Palmer, 1974). Qu'une réponse soit assurée ne dit rien de sa justesse. Quand la certitude manque, la valeur n'est même pas remise au modèle : l'abstention n'est pas espérée d'une consigne, elle est rendue inévitable par ce que le code choisit de taire. Un système digne de confiance sait se taire, et il aime mieux décliner que d'induire en erreur.
Ce que gagne une organisation
Ce montage n'a pas été pensé pour une démo, mais pour les endroits où une erreur se paie. Côté conformité, il offre sans détour ce que le RGPD, l'AI Act et les métiers réglementés réclament : une source sur chaque assertion, des actions auditables, une abstention qui laisse une trace. Un système qu'on peut certifier, là où le modèle-au-centre reste, au mieux, probable.
Vient ensuite la confiance ordinaire, celle de l'usage quotidien. La machine affirme ce qu'elle a calculé et le montre ; quand elle doute, elle le dit ; quand elle ignore, elle se tait ; et jamais elle ne cache d'où elle tient ce qu'elle avance. C'est ce qui la rend utilisable là où le plausible-mais-faux coûte cher.
Le froid a aussi un prix, au bon sens du terme. À la lecture, une réponse factuelle est un calcul, pas un appel au modèle : plus rapide, moins chère, et surtout reproductible, la même question rendant la même réponse. L'inférence redevient ce qu'elle aurait dû rester, une commodité qu'on ne sollicite qu'aux frontières. C'est la frugalité tenue par la construction, pas promise dans un slogan.
Reste la souveraineté, qui était le point de départ. Le moteur de vérité vit chez vous. Le modèle, lui, est interchangeable et peut ne jamais quitter la machine. Ce qui prend de la valeur avec le temps, le tissu de faits, de décisions et de contradictions, vous appartient et s'épaissit à mesure que vous l'utilisez.
La preuve d'existence
Cette thèse n'est pas restée sur le papier. Elle est implémentée, déployée et auditée dans Hygur, un double numérique local-first qui absorbe la vie informationnelle d'une personne, ses mails, son agenda, ses documents, et répond sur ses faits sans jamais inventer.
La démonstration tient en une minute. Demandez à Hygur un numéro précis : il rend la valeur, sourcée, assortie de sa confiance, ou il refuse honnêtement quand l'attribution reste ambiguë. Coupez ensuite le modèle de langage. Hygur continue de chercher, de retrouver, de répondre sur ses faits. La vérité, elle, n'avait pas bougé, parce qu'elle ne dépendait pas du modèle. Le moteur tenait la vérité ; le modèle n'était que la voix qu'on vient de faire taire.
Le cœur d'Hygur porte d'ailleurs déjà ce nom : l'Engram. En neurosciences, l'engramme est la trace physique d'un souvenir, le substrat où une mémoire s'inscrit et se retrouve. Le mot est de Richard Semon, qui le forge en 1904 pour nommer la marque durable qu'un stimulus laisse dans le vivant. Un siècle plus tard, l'équipe de Susumu Tonegawa l'a rendu observable, puis manipulable : en rallumant chez la souris les neurones d'un souvenir, on fait revenir le souvenir lui-même (Liu, Ramirez et al., Nature, 2012). L'engramme a cessé d'être une image vague pour devenir une trace qu'on va rechercher et qu'on retrouve. C'est très exactement ce que nous opposons à l'hallucination du modèle : une trace vérifiée, sourcée, calculée. Recall, not hallucinate : rappeler un fait inscrit plutôt qu'inventer un fait plausible.
Hygur est l'implémentation de référence, la preuve que la thèse tient debout hors du tableau blanc. La méthode, elle, voyage. C'est elle que ce texte défend, et c'est elle qu'une organisation peut porter dans son propre outil, son ERP, son CRM, son ITSM, sa base métier, sans avoir à recoder Hygur.
L'appel
Si vous avez déployé un modèle de langage sur vos données, vous connaissez déjà le mur : il est brillant, et il ment sur vos faits. Le gain viendra d'un meilleur partage des rôles, pas d'un modèle plus gros. Rendez la vérité à un moteur déterministe. Gardez le modèle pour ce qu'il réussit, parler.
Construisez le moteur. Confiez-lui la vérité, la provenance, la confiance. Laissez le modèle être la voix, et jamais le juge. C'est plus exigeant qu'un habillage d'API, et c'est justement là que ça devient tenable : un système qu'on peut auditer et certifier, et qui dure.
Le moteur est la vérité. Le modèle est la voix. Recall, not hallucinate.
Sources : les neurosciences qui inspirent Engram AI
La catégorie Engram AI tire son nom d'un siècle de recherche sur la mémoire, une recherche qui a décrit, mesuré, parfois filmé ce que nous demandons à une machine : retenir une trace vérifiée au lieu de produire une suite plausible. Ce sont ces travaux qui éclairent chacun des mécanismes d'Hygur.
- Richard Semon (1904), Die Mneme. Forge le terme « engramme » : la trace mnésique durable qu'un stimulus laisse dans le vivant. Il donne son nom et sa métaphore à Engram AI.
- Susumu Tonegawa (Liu, Ramirez et al.), 2012, Nature, « Optogenetic stimulation of a hippocampal engram activates fear memory recall ». Rend l'engramme observable et manipulable par optogénétique : réactiver les neurones d'un souvenir suffit à le faire revenir. L'engramme cesse d'être une image floue ; c'est une trace qu'on retrouve, ce qu'Hygur oppose à l'hallucination.
- Donald Hebb (1949), The Organization of Behavior. Formule la plasticité qui porte son nom : des neurones qui s'activent ensemble finissent par se lier, avec une insistance sur la causalité temporelle. Fondement de l'association entre souvenirs (principe 5).
- Hermann Ebbinghaus (1885), Über das Gedächtnis (trad. Memory: A Contribution to Experimental Psychology). Décrit la courbe de l'oubli et l'effet d'espacement : la pratique distribuée retient mieux que le bachotage. Inspire la rétention, ce qui reste vif et ce qui s'estompe (principe 5).
- Diekelmann & Born (2010), Nature Reviews Neuroscience, 11:114-126, « The memory function of sleep ». Montrent que le sommeil consolide la mémoire : rejeu de l'hippocampe pendant les ondes lentes, puis redistribution vers le néocortex. Inspire la consolidation nocturne, ce qu'Hygur appelle « quand Hygur rêve ».
- Johnson, Hashtroudi & Lindsay (1993), Psychological Bulletin, 114:3-28, « Source monitoring ». Établissent que le cerveau garde le contenu d'un souvenir et sa source, et que l'erreur de source (dont la cryptomnésie) est une cause majeure de faux souvenirs. Inspire l'honnêteté d'attribution : savoir à qui appartient un fait (principe 3).
- Loftus & Palmer (1974), Journal of Verbal Learning and Verbal Behavior, « Reconstruction of Automobile Destruction ». Décrivent l'effet de désinformation : une information reçue après l'événement déforme le souvenir, et l'on peut être confiant, précis et faux. Inspire la règle « décliner plutôt qu'induire en erreur » (principe 7).