<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="fr">
	<id>https://datafranca.org/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Patrickdrouin</id>
	<title>DataFranca - Contributions [fr]</title>
	<link rel="self" type="application/atom+xml" href="https://datafranca.org/wiki/api.php?action=feedcontributions&amp;feedformat=atom&amp;user=Patrickdrouin"/>
	<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/Sp%C3%A9cial:Contributions/Patrickdrouin"/>
	<updated>2026-06-15T15:40:21Z</updated>
	<subtitle>Contributions</subtitle>
	<generator>MediaWiki 1.39.5</generator>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Puits_d%27attention&amp;diff=128227</id>
		<title>Puits d&#039;attention</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Puits_d%27attention&amp;diff=128227"/>
		<updated>2026-06-09T19:21:57Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Phénomène présent dans tous les &#039;&#039;&#039;[[Grand modèle de langues (GML)| grands modèles de langues]]&#039;&#039;&#039; &#039;&#039;&#039;[[Modèle autorégressif|autorégressifs]]&#039;&#039;&#039;, dans lesquels les premiers [[jeton textuel|jetons textuels]] représentent une part extrêmement importante du score d&#039;attention, même s&#039;ils ne sont pas importants sur le plan sémantique. &lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Ce terme peut désigner le phénomène ou le type de &#039;&#039;&#039;[[jeton textuel]]&#039;&#039;&#039; concerné par le phénomène. &lt;br /&gt;
&lt;br /&gt;
Le phénomène apparaît à la suite d&#039;une optimisation efficace sur une quantité suffisante de &#039;&#039;&#039;[[données d&#039;entraînement]]&#039;&#039;&#039;. &lt;br /&gt;
&lt;br /&gt;
La raison pour laquelle les [[jeton textuel|jetons textuels]] initiaux sont considérés comme des « jetons puits » est intuitive : ils sont visibles par presque tous les [[jeton textuel|jetons]] suivants en raison de la nature autorégressive du modèle, ce qui les rend plus aptes à servir de « puits d&#039;attention ».&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; puits d&#039;attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; attention sink&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;This term can refer to the phenomenon or to the type of token concerned by the phenomenon. This phenomenon is present in all autoregressive large language models, in which the first few tokens make up for a shockingly large amount of the attention score, even if the tokens are not semantically important. It emerges after effective optimization on sufficient training data. &#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;The reason behind initial tokens as “sink tokens” is intuitive: initial tokens are visible to almost all subsequent tokens because of the autoregressive language modeling nature, making them more readily trained to serve as “attention sinks”.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;This phenomenon has been widely adopted in applications such as streaming/long context generation, KV cache optimization, inference acceleration, model quantization, and others.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2309.17453   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2410.10781   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://huggingface.co/blog/tomaarsen/attention-sinks   Source : Hugging Face Blog]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=%C3%89chantillonnage_%C3%A0_troncature_k_fixe&amp;diff=128222</id>
		<title>Échantillonnage à troncature k fixe</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=%C3%89chantillonnage_%C3%A0_troncature_k_fixe&amp;diff=128222"/>
		<updated>2026-06-09T19:14:16Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
&lt;br /&gt;
Stratégie d&#039;échantillonnage qui prélève un élément parmi un nombre fixe &#039;&#039;k&#039;&#039; des meilleurs éléments d&#039;un ensemble. La valeur de &#039;&#039;k&#039;&#039; reste constante, &lt;br /&gt;
&lt;br /&gt;
Ceci signifie que la méthode ne s&#039;adapte pas au contexte, ce qui a conduit à l&#039;&#039;&#039;&#039;[[échantillonnage à troncature de masse p]]&#039;&#039;&#039;.&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Cette stratégie d&#039;échantillonnage est utilisée par les [[Grand modèle de langues|grands modèles de langues]] pour choisir aléatoirement un jeton parmi un nombre fixe &#039;&#039;k&#039;&#039; de &#039;&#039;&#039;[[jeton textuel|jetons textuels]]&#039;&#039;&#039;. La valeur de &#039;&#039;k&#039;&#039; reste constante, ce qui signifie que la méthode ne s&#039;adapte pas au contexte du texte généré. &lt;br /&gt;
&lt;br /&gt;
Une valeur &#039;&#039;k&#039;&#039; plus petite rendra le résultat plus ciblé mais moins créatif, tandis qu&#039;une valeur &#039;&#039;k&#039;&#039; plus grande rendra le résultat plus diversifié mais potentiellement moins pertinent.&lt;br /&gt;
&lt;br /&gt;
Cette limitation a conduit à l&#039;&#039;&#039;&#039;[[échantillonnage à troncature de masse p]]&#039;&#039;&#039;.&lt;br /&gt;
&amp;lt;hr&amp;gt;&lt;br /&gt;
Le terme « échantillonnage à troncature &#039;&#039;k&#039;&#039; fixe » est plus exact que terme « échantillonnage des &#039;&#039;k&#039;&#039; meilleurs » car elle définit l&#039;action algorithmique (la troncature) plutôt que simplement le résultat.&lt;br /&gt;
&amp;lt;hr&amp;gt;&lt;br /&gt;
Attention: À ne pas confondre avec la &#039;&#039;&#039;[[température]]&#039;&#039;&#039; d&#039;un grand modèle de langues.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;Échantillonnage à troncature k fixe&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Échantillonnage parmi les k meilleurs&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Échantillonnage Top-k&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; Top-k sampling&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Sampling strategy that always samples from a fixed number of tokens, which may be too restrictive or too broad depending on the context. The value of K remains constant, meaning the method isn&#039;t adaptive to the context of the text being generated, which led to top-p sampling.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;A smaller K will make the output more focused but less creative, while a larger K will make the output more diverse but potentially less relevant.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://medium.com/thinking-sand/the-top-k-and-top-p-parameters-explained-bfaecc8cd342   Source : Medium - Top-k sampling, Top-p sampling]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/Top-p_sampling#Top-k_sampling  Wikipedia - Top-k sampling]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=%C3%89chantillonnage_%C3%A0_troncature_k_fixe&amp;diff=128221</id>
		<title>Échantillonnage à troncature k fixe</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=%C3%89chantillonnage_%C3%A0_troncature_k_fixe&amp;diff=128221"/>
		<updated>2026-06-09T19:11:51Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
&lt;br /&gt;
Stratégie d&#039;échantillonnage qui prélève un élément parmi un nombre fixe &#039;&#039;k&#039;&#039; des meilleurs éléments d&#039;un ensemble. La valeur de &#039;&#039;k&#039;&#039; reste constante, &lt;br /&gt;
&lt;br /&gt;
Ceci signifie que la méthode ne s&#039;adapte pas au contexte, ce qui a conduit à l&#039;&#039;&#039;&#039;[[échantillonnage à troncature de masse p]]&#039;&#039;&#039;.&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Cette stratégie d&#039;échantillonnage est utilisée par les [[Grand modèle de langues|grands modèles de langues]] pour choisir aléatoirement un jeton parmi un nombre fixe &#039;&#039;k&#039;&#039; de &#039;&#039;&#039;[[jeton textuel|jetons textuels]]&#039;&#039;&#039;. La valeur de &#039;&#039;k&#039;&#039; reste constante, ce qui signifie que la méthode ne s&#039;adapte pas au contexte du texte généré. &lt;br /&gt;
&lt;br /&gt;
Une valeur &#039;&#039;k&#039;&#039; plus petite rendra le résultat plus ciblé mais moins créatif, tandis qu&#039;une valeur &#039;&#039;k&#039;&#039; plus grande rendra le résultat plus diversifié mais potentiellement moins pertinent.&lt;br /&gt;
&lt;br /&gt;
Cette limitation a conduit à l&#039;&#039;&#039;&#039;[[échantillonnage à troncature de masse p]]&#039;&#039;&#039;.&lt;br /&gt;
&amp;lt;hr&amp;gt;&lt;br /&gt;
Le terme « échantillonnage à troncature &#039;&#039;k&#039;&#039; fixe » est plus exact que terme « échantillonnage des &#039;&#039;k&#039;&#039; meilleurs » car elle définit l&#039;action algorithmique (la troncature) plutôt que simplement le résultat.&lt;br /&gt;
&amp;lt;hr&amp;gt;&lt;br /&gt;
Attention: À ne pas confondre avec la &#039;&#039;&#039;[[température]]&#039;&#039;&#039; d&#039;un grand modèle de langues.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;Échantillonnage à troncature k fixe&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Échantillonnage parmi les k meilleurs&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Échantillonnage Top-k&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; Top-k sampling&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Sampling strategy that always samples from a fixed number of tokens, which may be too restrictive or too broad depending on the context. The value of K remains constant, meaning the method isn&#039;t adaptive to the context of the text being generated, which led to top-p sampling.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;A smaller K will make the output more focused but less creative, while a larger K will make the output more diverse but potentially less relevant.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://medium.com/thinking-sand/the-top-k-and-top-p-parameters-explained-bfaecc8cd342   Source : Medium - Top-k sampling, Top-p sampling]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/Top-p_sampling#Top-k_sampling  Wikipedia - Top-k sampling]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Attention_clairsem%C3%A9e&amp;diff=128220</id>
		<title>Attention clairsemée</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Attention_clairsem%C3%A9e&amp;diff=128220"/>
		<updated>2026-06-09T19:10:44Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Technique d&#039;optimisation d&#039;une [[Réseau autoattentif|architecture auto-attentive]] qui vise à réduire le nombre de calculs nécessaires au mécanisme d&#039;auto-attention. &lt;br /&gt;
&lt;br /&gt;
== Compléments == &lt;br /&gt;
Au lieu de comparer tous les [[jeton textuel|jetons textuels]] entre eux, un processus de sélection concentre l&#039;attention sur certains jetons en particulier selon différentes heuristiques. Par exemple, es heuristiques exploitent une largeur de fenêtre, la position d&#039;un jeton dans une phrase, la similarité des jetons, etc.&lt;br /&gt;
&lt;br /&gt;
Cette technique d&#039;optimisation a été mise de l&#039;avant par la société DeepSeek-AI. &lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;attention clairsemée&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention parcimonieuse&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention creuse&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention clairsemée native&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;sparse attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;native sparse attention&#039;&#039;&#039;&lt;br /&gt;
 &lt;br /&gt;
Long-context modeling is crucial for next-generation language models, yet the high computational cost of standard attention mechanisms poses significant computational challenges. Sparse attention offers a promising direction for improving efficiency while maintaining model capabilities. We present NSA, a Natively trainable Sparse Attention mechanism that integrates algorithmic innovations with hardware-aligned optimizations to achieve efficient long-context modeling. NSA employs a dynamic hierarchical sparse strategy, combining coarse-grained token compression with fine-grained token selection to preserve both global context awareness and local precision. Our approach advances sparse attention design with two key innovations: (1) We achieve substantial speedups through arithmetic intensity-balanced algorithm design, with implementation optimizations for modern hardware. (2) We enable end-to-end training, reducing pretraining computation without sacrificing model performance.&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://espace.etsmtl.ca/id/eprint/3299/ Aroosa Hameed (2023) - attention clairsemée ]&lt;br /&gt;
&lt;br /&gt;
[https://fr.wikipedia.org/wiki/Attention_(apprentissage_automatique) Wikipedia - attention clairsemée]&lt;br /&gt;
&lt;br /&gt;
[https://aarnphm.xyz/thoughts/papers/DeepSeek_V3_2.pdf  DeepSeek - sparse attention]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Attention_clairsem%C3%A9e&amp;diff=128219</id>
		<title>Attention clairsemée</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Attention_clairsem%C3%A9e&amp;diff=128219"/>
		<updated>2026-06-09T19:10:21Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Technique d&#039;optimisation d&#039;une [[Réseau autoattentif|architecture auto-attentive]] qui vise à réduire le nombre de calculs nécessaires au mécanisme d&#039;auto-attention. &lt;br /&gt;
&lt;br /&gt;
== Compléments == &lt;br /&gt;
Au lieu de comparer tous les [[jeton textuel|jetons textuels]] entre eux, un processus de sélection concentre l&#039;attention sur certains jetons en particulier selon différentes heuristiques. Par exemple, es heuristiques exploitent une largeur de fenêtre, la position d&#039;un jeton dans une phrase, la similarité des jetons, etc.&lt;br /&gt;
&lt;br /&gt;
Cette technique d&#039;optimisation a été mise de l&#039;avant par la société DeepSeek-AI. &lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;attention clairsemée&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention parcimonieuse&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention creuse&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention clairsemée native&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;sparse attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;native sparse attention&#039;&#039;&#039;&lt;br /&gt;
 &lt;br /&gt;
Long-context modeling is crucial for next-generation language models, yet the high computational cost of standard attention mechanisms poses significant computational challenges. Sparse attention offers a promising direction for improving efficiency while maintaining model capabilities. We present NSA, a Natively trainable Sparse Attention mechanism that integrates algorithmic innovations with hardware-aligned optimizations to achieve efficient long-context modeling. NSA employs a dynamic hierarchical sparse strategy, combining coarse-grained token compression with fine-grained token selection to preserve both global context awareness and local precision. Our approach advances sparse attention design with two key innovations: (1) We achieve substantial speedups through arithmetic intensity-balanced algorithm design, with implementation optimizations for modern hardware. (2) We enable end-to-end training, reducing pretraining computation without sacrificing model performance.&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://espace.etsmtl.ca/id/eprint/3299/ Aroosa Hameed (2023) - attention clairsemée ]&lt;br /&gt;
&lt;br /&gt;
[https://fr.wikipedia.org/wiki/Attention_(apprentissage_automatique) Wikipedia - attention clairsemée]&lt;br /&gt;
&lt;br /&gt;
[https://aarnphm.xyz/thoughts/papers/DeepSeek_V3_2.pdf  DeepSeek - sparse attention]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publications]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Puits_d%27attention&amp;diff=128216</id>
		<title>Puits d&#039;attention</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Puits_d%27attention&amp;diff=128216"/>
		<updated>2026-06-09T19:08:52Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Ce terme peut désigner le phénomène ou le type de &#039;&#039;&#039;[[jeton textuel]]&#039;&#039;&#039; concerné par le phénomène. &lt;br /&gt;
&lt;br /&gt;
Phénomène présent dans tous les &#039;&#039;&#039;[[Grand modèle de langues (GML)| grands modèles de langues]]&#039;&#039;&#039; &#039;&#039;&#039;[[Modèle autorégressif|autorégressifs]]&#039;&#039;&#039;, dans lesquels les premiers [[jeton textuel|jetons textuels]] représentent une part extrêmement importante du score d&#039;attention, même s&#039;ils ne sont pas importants sur le plan sémantique. &lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Ce phénomène apparaît à la suite d&#039;une optimisation efficace sur une quantité suffisante de &#039;&#039;&#039;[[données d&#039;entraînement]]&#039;&#039;&#039;. &lt;br /&gt;
&lt;br /&gt;
La raison pour laquelle les [[jeton textuel|jetons textuels]] initiaux sont considérés comme des « jetons puits » est intuitive : ils sont visibles par presque tous les [[jeton textuel|jetons]] suivants en raison de la nature autorégressive du modèle, ce qui les rend plus aptes à servir de « puits d&#039;attention ».&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; puits d&#039;attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; attention sink&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;This term can refer to the phenomenon or to the type of token concerned by the phenomenon. This phenomenon is present in all autoregressive large language models, in which the first few tokens make up for a shockingly large amount of the attention score, even if the tokens are not semantically important. It emerges after effective optimization on sufficient training data. &#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;The reason behind initial tokens as “sink tokens” is intuitive: initial tokens are visible to almost all subsequent tokens because of the autoregressive language modeling nature, making them more readily trained to serve as “attention sinks”.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;This phenomenon has been widely adopted in applications such as streaming/long context generation, KV cache optimization, inference acceleration, model quantization, and others.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2309.17453   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2410.10781   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://huggingface.co/blog/tomaarsen/attention-sinks   Source : Hugging Face Blog]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Attention_clairsem%C3%A9e&amp;diff=128215</id>
		<title>Attention clairsemée</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Attention_clairsem%C3%A9e&amp;diff=128215"/>
		<updated>2026-06-09T19:07:51Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Technique d&#039;optimisation d&#039;une [[Réseau autoattentif|architecture auto-attentive]] qui vise à réduire le nombre de calculs nécessaires au mécanisme d&#039;auto-attention. &lt;br /&gt;
&lt;br /&gt;
== Compléments == &lt;br /&gt;
Au lieu de comparer tous les [[jeton textuel|jetons textuels]] entre eux, un processus de sélection concentre l&#039;attention sur certains segments en particulier selon différentes heuristiques. Par exemple, es heuristiques exploitent une largeur de fenêtre, la position d&#039;un jeton dans une phrase, la similarité des jetons, etc.&lt;br /&gt;
&lt;br /&gt;
Cette technique d&#039;optimisation a été mise de l&#039;avant par la société DeepSeek-AI. &lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;attention clairsemée&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention parcimonieuse&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention creuse&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention clairsemée native&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;sparse attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;native sparse attention&#039;&#039;&#039;&lt;br /&gt;
 &lt;br /&gt;
Long-context modeling is crucial for next-generation language models, yet the high computational cost of standard attention mechanisms poses significant computational challenges. Sparse attention offers a promising direction for improving efficiency while maintaining model capabilities. We present NSA, a Natively trainable Sparse Attention mechanism that integrates algorithmic innovations with hardware-aligned optimizations to achieve efficient long-context modeling. NSA employs a dynamic hierarchical sparse strategy, combining coarse-grained token compression with fine-grained token selection to preserve both global context awareness and local precision. Our approach advances sparse attention design with two key innovations: (1) We achieve substantial speedups through arithmetic intensity-balanced algorithm design, with implementation optimizations for modern hardware. (2) We enable end-to-end training, reducing pretraining computation without sacrificing model performance.&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://espace.etsmtl.ca/id/eprint/3299/ Aroosa Hameed (2023) - attention clairsemée ]&lt;br /&gt;
&lt;br /&gt;
[https://fr.wikipedia.org/wiki/Attention_(apprentissage_automatique) Wikipedia - attention clairsemée]&lt;br /&gt;
&lt;br /&gt;
[https://aarnphm.xyz/thoughts/papers/DeepSeek_V3_2.pdf  DeepSeek - sparse attention]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Puits_d%27attention&amp;diff=128214</id>
		<title>Puits d&#039;attention</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Puits_d%27attention&amp;diff=128214"/>
		<updated>2026-06-09T19:05:39Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Ce terme peut désigner le phénomène ou le type de &#039;&#039;&#039;[[jeton textuel]]&#039;&#039;&#039; concerné par le phénomène. &lt;br /&gt;
&lt;br /&gt;
Phénomène présent dans tous les &#039;&#039;&#039;[[Grand modèle de langues (GML)| grands modèles de langues]]&#039;&#039;&#039; &#039;&#039;&#039;[[Modèle autorégressif|autorégressifs]]&#039;&#039;&#039;, dans lesquels les premiers [[jeton textuel|jetons textuels]] représentent une part extrêmement importante du score d&#039;attention, même s&#039;ils ne sont pas importants sur le plan sémantique. &lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Ce phénomène apparaît à la suite d&#039;une optimisation efficace sur une quantité suffisante de &#039;&#039;&#039;[[données d&#039;entraînement]]&#039;&#039;&#039;. &lt;br /&gt;
&lt;br /&gt;
La raison pour laquelle les [[jeton textuel|jetons textuels]] initiaux sont considérés comme des « segments puits » est intuitive : ils sont visibles par presque tous les [[jeton textuel|jetons]] suivants en raison de la nature autorégressive du modèle, ce qui les rend plus aptes à servir de « puits d&#039;attention ».&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; puits d&#039;attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; attention sink&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;This term can refer to the phenomenon or to the type of token concerned by the phenomenon. This phenomenon is present in all autoregressive large language models, in which the first few tokens make up for a shockingly large amount of the attention score, even if the tokens are not semantically important. It emerges after effective optimization on sufficient training data. &#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;The reason behind initial tokens as “sink tokens” is intuitive: initial tokens are visible to almost all subsequent tokens because of the autoregressive language modeling nature, making them more readily trained to serve as “attention sinks”.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;This phenomenon has been widely adopted in applications such as streaming/long context generation, KV cache optimization, inference acceleration, model quantization, and others.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2309.17453   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2410.10781   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://huggingface.co/blog/tomaarsen/attention-sinks   Source : Hugging Face Blog]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Puits_d%27attention&amp;diff=128210</id>
		<title>Puits d&#039;attention</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Puits_d%27attention&amp;diff=128210"/>
		<updated>2026-06-09T19:04:58Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Ce terme peut désigner le phénomène ou le type de &#039;&#039;&#039;[[jeton textuel]]&#039;&#039;&#039; concerné par le phénomène. &lt;br /&gt;
&lt;br /&gt;
Phénomène présent dans tous les &#039;&#039;&#039;[[Grand modèle de langues (GML)| grands modèles de langues]]&#039;&#039;&#039; &#039;&#039;&#039;[[Modèle autorégressif|autorégressifs]]&#039;&#039;&#039;, dans lesquels les premiers [[jeton textuel|jetons textuels]] représentent une part extrêmement importante du score d&#039;attention, même s&#039;ils ne sont pas importants sur le plan sémantique. &lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Ce phénomène apparaît à la suite d&#039;une optimisation efficace sur une quantité suffisante de &#039;&#039;&#039;[[données d&#039;entraînement]]&#039;&#039;&#039;. &lt;br /&gt;
&lt;br /&gt;
La raison pour laquelle les [[jeton textuel|jetons textuels]] initiaux sont considérés comme des « segments puits » est intuitive : ils sont visibles par presque tous les [[jeton textuel|jetons]] suivants en raison de la nature autorégressive du modèle, ce qui les rend plus aptes à servir de « puits d&#039;attention ».&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; puits d&#039;attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; attention sink&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;This term can refer to the phenomenon or to the type of token concerned by the phenomenon. This phenomenon is present in all autoregressive large language models, in which the first few tokens make up for a shockingly large amount of the attention score, even if the tokens are not semantically important. It emerges after effective optimization on sufficient training data. &#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;The reason behind initial tokens as “sink tokens” is intuitive: initial tokens are visible to almost all subsequent tokens because of the autoregressive language modeling nature, making them more readily trained to serve as “attention sinks”.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;This phenomenon has been widely adopted in applications such as streaming/long context generation, KV cache optimization, inference acceleration, model quantization, and others.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2309.17453   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2410.10781   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://huggingface.co/blog/tomaarsen/attention-sinks   Source : Hugging Face Blog]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Encodage_positionnel&amp;diff=128209</id>
		<title>Encodage positionnel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Encodage_positionnel&amp;diff=128209"/>
		<updated>2026-06-09T18:54:10Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Méthode des &#039;&#039;&#039;[[Réseau autoattentif|réseaux autoattentifs]]&#039;&#039;&#039; qui aide à préserver l’ordre séquentiel des &#039;&#039;&#039;[[jeton textuel|jetons textuels]]&#039;&#039;&#039; (tokens) en ajoutant des informations sur la position de chaque &#039;&#039;&#039;[[jeton textuel|segment]]&#039;&#039;&#039; dans la séquence, ce qui leur permet d’avoir une meilleure compréhension &#039;&#039;&#039;[[Fenêtre contextuelle|contextuelle]]&#039;&#039;&#039; et d’éviter les problèmes de symétrie.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; encodage positionnel &#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;positional encoding&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; PE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--Positional encoding refers to a method in transformer models that helps to maintain the sequential order of words. This is a crucial component for understanding the context within a sentence and between sentences.--&amp;gt;&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://www.kdnuggets.com/generative-ai-key-terms-explained    Source : kdnuggets]&lt;br /&gt;
&lt;br /&gt;
[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-eng.html?lang=eng&amp;amp;i=1&amp;amp;srchtxt=POSITIONAL+ENCODING&amp;amp;index=alt&amp;amp;codom2nd_wet=1#resultrecs   Source : TERMIUM Plus]&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Attention_%C3%A9clair&amp;diff=128207</id>
		<title>Attention éclair</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Attention_%C3%A9clair&amp;diff=128207"/>
		<updated>2026-06-09T18:53:04Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Définition==&lt;br /&gt;
&lt;br /&gt;
Ce concept regroupe différentes approches algorithmiques pour augmenter la performance en temps d&#039;exécution et/ou en mémoire du [[mécanisme d&#039;attention]] original. &lt;br /&gt;
&lt;br /&gt;
Sur le plan technique, il existe différentes implémentations qui dépendent entre autres de l&#039;organisation matérielle des processeurs graphiques, souvent pour un fabricant de puces en particulier.&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
&lt;br /&gt;
Les [[Réseau autoattentif|couches d&#039;auto-attention]] permettent de comprendre les relations contextuelles entre les données d&#039;entrée. Cependant, la consommation maximale de mémoire des [[processeur graphique|processeurs graphiques]] pour les [[Réseau autoattentif|couches d&#039;auto-attention]] augmente de manière quadratique avec la longueur de la séquence d’entrée. Ainsi, l&#039;[[Réseau autoattentif|algorithme d&#039;auto-attention classique]] devient rapidement prohibitif en termes de mémoire pour les longs contextes d&#039;entrée.&lt;br /&gt;
&lt;br /&gt;
Afin de résoudre ce problème, Tri Dao et al. ont inventé en 2022 l&#039;algorithme d&#039;attention éclair (FlashAttention) dont le coût en mémoire n&#039;augmente que linéairement avec la longueur de la séquence d&#039;entrée. Évidemment, l’algorithme d’attention éclair est un peu plus lent. En contrepartie,  l&#039;attention-éclair est plus rapide en inférence que l&#039;attention classique car elle réduit considérablement les accès mémoires plus lents du processeur graphique en se concentrant plutôt sur la mémoire vive statique (SRAM) qui est plus rapide.&lt;br /&gt;
&lt;br /&gt;
Le mécanisme d&#039;attention éclair proposé par Qin &amp;amp; al. en 2023, appelé &#039;&#039;&#039;lightning attention&#039;&#039;&#039;, fait appel à une approximation qui s&#039;exécute en temps linéaire alors que le mécanisme d&#039;attention original s&#039;exécute en temps quadratique. Cette amélioration est basée sur la [[normalisation du gradient]] pour lutter contre l&#039;[[explosion du gradient]] et l&#039;utilisation privilégiée de la diagonale de la matrice d&#039;attention c.-à-d. les [[jeton textuel|jetons textuels]] voisins pour lutter contre l&#039;[[évanescence du  gradient]].&lt;br /&gt;
&lt;br /&gt;
==Français==&lt;br /&gt;
&#039;&#039;&#039;attention éclair&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;attention flash&#039;&#039;&#039; &amp;lt;small&amp;gt;&#039;&#039;Calque de l&#039;anglais&#039;&#039;&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Anglais==&lt;br /&gt;
&#039;&#039;&#039;FlashAttention&#039;&#039;&#039; &amp;lt;small&amp;gt;&#039;&#039; Proposition originale de Tri Dao et al. (2022)&#039;&#039;&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;flash attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;lightning attention&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/pdf/2407.08608v2 - arxiv - Jay Shah &amp;amp; al. 2024 - FlashAttention-3]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/pdf/2307.14995v1 - arxiv - Qin &amp;amp; al. 2023 - Lightning Attention]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2205.14135  - arxiv - Tri Dao et al. (2022) - FlashAttention]&lt;br /&gt;
&lt;br /&gt;
[https://gordicaleksa.medium.com/eli5-flash-attention-5c44017022ad Source: Medium]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Suppression_de_segment_textuel&amp;diff=128206</id>
		<title>Suppression de segment textuel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Suppression_de_segment_textuel&amp;diff=128206"/>
		<updated>2026-06-09T18:49:13Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page Suppression de segment textuel vers Suppression de jeton textuel&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;#REDIRECTION [[Suppression de jeton textuel]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Suppression_de_jeton_textuel&amp;diff=128205</id>
		<title>Suppression de jeton textuel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Suppression_de_jeton_textuel&amp;diff=128205"/>
		<updated>2026-06-09T18:49:12Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page Suppression de segment textuel vers Suppression de jeton textuel&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Technique utilisée pour le &#039;&#039;&#039;[[préentraînement]]&#039;&#039;&#039; d’un &#039;&#039;&#039;[[modèle de langue|modèle]]&#039;&#039;&#039; où les &#039;&#039;&#039;[[jeton textuel|jetons textuels]]&#039;&#039;&#039; sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les jetons à partir desquels les positions sont supprimées.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; suppression de jeton textuel&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; destruction de jeton textuel&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; token deletion&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--&#039;&#039;Token deletion takes the original sentence and randomly deletes a token from the sequence. Tokens are randomly removed from the documents. The model is pre-trained to determine tokens at which positions are removed.&#039;&#039;--&amp;gt;&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2405.12630   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://yangyutu.github.io/llm_book.github.io/docs/chapter_foundation/t5.html   Source : GitHub]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND_LEXIQUE_FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Suppression_de_jeton_textuel&amp;diff=128203</id>
		<title>Suppression de jeton textuel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Suppression_de_jeton_textuel&amp;diff=128203"/>
		<updated>2026-06-09T18:47:48Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Technique utilisée pour le &#039;&#039;&#039;[[préentraînement]]&#039;&#039;&#039; d’un &#039;&#039;&#039;[[modèle de langue|modèle]]&#039;&#039;&#039; où les &#039;&#039;&#039;[[jeton textuel|jetons textuels]]&#039;&#039;&#039; sont retirés de manière aléatoire des documents afin de permettre au modèle de déterminer les jetons à partir desquels les positions sont supprimées.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; suppression de jeton textuel&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; destruction de jeton textuel&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; token deletion&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--&#039;&#039;Token deletion takes the original sentence and randomly deletes a token from the sequence. Tokens are randomly removed from the documents. The model is pre-trained to determine tokens at which positions are removed.&#039;&#039;--&amp;gt;&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2405.12630   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://yangyutu.github.io/llm_book.github.io/docs/chapter_foundation/t5.html   Source : GitHub]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND_LEXIQUE_FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Tokenmaxxing&amp;diff=128198</id>
		<title>Tokenmaxxing</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Tokenmaxxing&amp;diff=128198"/>
		<updated>2026-06-09T18:43:11Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Définition==&lt;br /&gt;
Action de dépenser délibérément un maximum de [[jeton textuel|jetons textuels]] alloué à un [[Grand modèle de langues (GML)|grand modèle de langues (GLM)]].&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
La surconsommation de jetons est souvent le résultat de l&#039;exécution de plusieurs agents dédiés à différents sous-tâches (typiquement de programmation) simultanément. &lt;br /&gt;
&lt;br /&gt;
==Français==&lt;br /&gt;
&#039;&#039;&#039;surconsommation de jetons&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;surconsommation de jetons textuels&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;maximisation de jetons&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;maximisation de jetons textuels&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Anglais==&lt;br /&gt;
&#039;&#039;&#039;tokenmaxxing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;token maxxing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;token maxing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://en.wikipedia.org/wiki/Token_maxxing Forbes - tokenmaxxing]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/Token_maxxing Wikipedia - token maxxing]&lt;br /&gt;
&lt;br /&gt;
[https://www.lesaffaires.com/mon-entreprise/management-et-rh/tokenmaxxing-quand-lia-cree-de-nouvelles-inegalites-rh/ Les affaires]&lt;br /&gt;
&lt;br /&gt;
[https://www.01net.com/actualites/comment-le-tokenmaxxing-transforme-lusage-de-lia-en-competition-chez-les-geants-de-la-tech.html 01net]&lt;br /&gt;
&lt;br /&gt;
[[Categorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Tokenmaxxing&amp;diff=128196</id>
		<title>Tokenmaxxing</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Tokenmaxxing&amp;diff=128196"/>
		<updated>2026-06-09T18:41:29Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Définition==&lt;br /&gt;
Action de dépenser délibérément un maximum de [[jeton textuel|jetons textuels]] alloué à un [[Grand modèle de langues (GML)|grand modèle de langues (GLM)]].&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
La surconsommation de jetons est souvent le résultat de l&#039;exécution de plusieurs agents dédiés à différents sous-tâches (typiquement de programmation) simultanément. &lt;br /&gt;
&lt;br /&gt;
==Français==&lt;br /&gt;
&#039;&#039;&#039;surconsommation de jetons&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;maximisation de jetons&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Anglais==&lt;br /&gt;
&#039;&#039;&#039;tokenmaxxing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;token maxxing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;token maxing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://en.wikipedia.org/wiki/Token_maxxing Forbes - tokenmaxxing]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/Token_maxxing Wikipedia - token maxxing]&lt;br /&gt;
&lt;br /&gt;
[https://www.lesaffaires.com/mon-entreprise/management-et-rh/tokenmaxxing-quand-lia-cree-de-nouvelles-inegalites-rh/ Les affaires]&lt;br /&gt;
&lt;br /&gt;
[https://www.01net.com/actualites/comment-le-tokenmaxxing-transforme-lusage-de-lia-en-competition-chez-les-geants-de-la-tech.html 01net]&lt;br /&gt;
&lt;br /&gt;
[[Categorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Tokenmaxxing&amp;diff=128195</id>
		<title>Tokenmaxxing</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Tokenmaxxing&amp;diff=128195"/>
		<updated>2026-06-09T18:40:56Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Page créée avec « ==Définition== Action de dépenser délibérément un maximum de jetons textuels alloué à un grand modèle de langues (GLM).  == Compléments == La surconsommation de jetons est souvent le résultat de l&amp;#039;exécution de plusieurs agents dédiés à différents sous-tâches (typiquement de programmation) simultanément.   ==Français== &amp;#039;&amp;#039;&amp;#039;surconsommation de jetons&amp;#039;&amp;#039;&amp;#039;  &amp;#039;&amp;#039;&amp;#039;maximisation de jetons&amp;#039;&amp;#039;&amp;#039;  ==Anglais== &amp;#039;... »&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Définition==&lt;br /&gt;
Action de dépenser délibérément un maximum de [[jeton textuel|jetons textuels]] alloué à un [[Grand modèle de langues (GML)|grand modèle de langues (GLM)]].&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
La surconsommation de jetons est souvent le résultat de l&#039;exécution de plusieurs agents dédiés à différents sous-tâches (typiquement de programmation) simultanément. &lt;br /&gt;
&lt;br /&gt;
==Français==&lt;br /&gt;
&#039;&#039;&#039;surconsommation de jetons&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;maximisation de jetons&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Anglais==&lt;br /&gt;
&#039;&#039;&#039;tokenmaxxing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;token maxxing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;token maxing&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://en.wikipedia.org/wiki/Token_maxxing Forbes - tokenmaxxing]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/Token_maxxing Wikipedia - token maxxing]&lt;br /&gt;
&lt;br /&gt;
[https://www.lesaffaires.com/mon-entreprise/management-et-rh/tokenmaxxing-quand-lia-cree-de-nouvelles-inegalites-rh/ Les affaires]&lt;br /&gt;
&lt;br /&gt;
[https://www.01net.com/actualites/comment-le-tokenmaxxing-transforme-lusage-de-lia-en-competition-chez-les-geants-de-la-tech.html 01net]&lt;br /&gt;
&lt;br /&gt;
[[Categorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Segment_textuel&amp;diff=128191</id>
		<title>Segment textuel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Segment_textuel&amp;diff=128191"/>
		<updated>2026-06-09T18:32:51Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page Segment textuel vers Jeton textuel&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;#REDIRECTION [[Jeton textuel]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Jeton_textuel&amp;diff=128190</id>
		<title>Jeton textuel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Jeton_textuel&amp;diff=128190"/>
		<updated>2026-06-09T18:32:51Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page Segment textuel vers Jeton textuel&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Définition==&lt;br /&gt;
En &#039;&#039;&#039;[[traitement automatique de la langue naturelle]]&#039;&#039;&#039;, le jeton est l&#039;unité de base pour l&#039;analyse de textes produite par un &#039;&#039;&#039;[[segmenteur]]&#039;&#039;&#039; (en anglais &#039;&#039;tokenizer&#039;&#039;).&lt;br /&gt;
&lt;br /&gt;
==Compléments==&lt;br /&gt;
Un jeton textuel peut correspondre à un mot, à une partie de mot, une suite de caractères ou même parfois à une seule lettre ou symbole.&lt;br /&gt;
&lt;br /&gt;
Traditionnellement, en &#039;&#039;&#039;[[Traitement automatique de la langue naturelle|TALN]]&#039;&#039;&#039;, les algorithmes travaillaient au niveau du mot ou des unités lexicales, mais depuis l&#039;arrivée des techniques d&#039;apprentissage profond, la segmentation s&#039;effectue plutôt au niveau sous-lexical. Un atout important du traitement sous-lexical est d&#039;éviter les mots &#039;&#039;hors-vocabulaire&#039;&#039;, puisqu&#039;on peut plus facilement créer de nouvelles unités lexicales à partir d&#039;éléments sous-lexicaux. &lt;br /&gt;
&lt;br /&gt;
&amp;lt;hr/&amp;gt;&lt;br /&gt;
Attention, on appelle les unités résultant de la segmentation des &#039;&#039;&#039;jetons&#039;&#039;&#039;, mais le terme &#039;&#039;&#039;jeton&#039;&#039;&#039; est aussi utilisé en cybersécurité et dans les réseaux de communication. &lt;br /&gt;
&lt;br /&gt;
&amp;lt;hr/&amp;gt;&lt;br /&gt;
Pour la suite du traitement, le jeton résultant est souvent converti en un nombre entier. On dit alors que le jeton est encodé. Le processus inverse, le décodage part de la représentation par un nombre entier vers un jeton.&lt;br /&gt;
&lt;br /&gt;
==Français==&lt;br /&gt;
&#039;&#039;&#039;jeton textuel&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;jeton&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;segment textuel&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;segment de texte&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;symbole&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;unité sous-lexicale&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;unité lexicale&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;partie de mot&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Anglais==&lt;br /&gt;
&#039;&#039;&#039;token&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
&lt;br /&gt;
[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&amp;amp;i=1&amp;amp;srchtxt=tokenizer&amp;amp;index=alt&amp;amp;codom2nd_wet=1#resultrecs &#039;&#039;Termium - Tokenizer&#039;&#039;]&lt;br /&gt;
&lt;br /&gt;
[https://www.culture.gouv.fr/content/download/365680/pdf_file/50_termes_cl%C3%A9s_de_l%27IA-2025.pdf?inLanguage=fre-FR&amp;amp;version=2  &#039;&#039;50 termes clés de l&#039;intelligence artificielle&#039;&#039;, Ministère de la culture, Commission d&#039;enrichissement de la langue française (2025). - Jeton textuel]&lt;br /&gt;
&lt;br /&gt;
[https://fr.wikipedia.org/wiki/Analyse_lexicale  Wikipedia - &#039;&#039;Analyse lexicale&#039;&#039;]&lt;br /&gt;
&lt;br /&gt;
[https://www.sciencedirect.com/science/article/pii/S0167865518303271 &#039;&#039;A unified multilingual handwriting recognition system using multigrams sub-lexical units&#039;&#039;, Swaileh et al. 2019]&lt;br /&gt;
&lt;br /&gt;
[https://link.springer.com/chapter/10.1007/978-3-319-77113-7_1, &#039;&#039;Overview of Character-Based Models for Natural Language Processing&#039;&#039;, Adel et al. 2018]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/Lexical_analysis  Wikipedia - Lexical Analysis]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Jeton_textuel&amp;diff=128188</id>
		<title>Jeton textuel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Jeton_textuel&amp;diff=128188"/>
		<updated>2026-06-09T18:28:29Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Définition==&lt;br /&gt;
En &#039;&#039;&#039;[[traitement automatique de la langue naturelle]]&#039;&#039;&#039;, le jeton est l&#039;unité de base pour l&#039;analyse de textes produite par un &#039;&#039;&#039;[[segmenteur]]&#039;&#039;&#039; (en anglais &#039;&#039;tokenizer&#039;&#039;).&lt;br /&gt;
&lt;br /&gt;
==Compléments==&lt;br /&gt;
Un jeton textuel peut correspondre à un mot, à une partie de mot, une suite de caractères ou même parfois à une seule lettre ou symbole.&lt;br /&gt;
&lt;br /&gt;
Traditionnellement, en &#039;&#039;&#039;[[Traitement automatique de la langue naturelle|TALN]]&#039;&#039;&#039;, les algorithmes travaillaient au niveau du mot ou des unités lexicales, mais depuis l&#039;arrivée des techniques d&#039;apprentissage profond, la segmentation s&#039;effectue plutôt au niveau sous-lexical. Un atout important du traitement sous-lexical est d&#039;éviter les mots &#039;&#039;hors-vocabulaire&#039;&#039;, puisqu&#039;on peut plus facilement créer de nouvelles unités lexicales à partir d&#039;éléments sous-lexicaux. &lt;br /&gt;
&lt;br /&gt;
&amp;lt;hr/&amp;gt;&lt;br /&gt;
Attention, on appelle les unités résultant de la segmentation des &#039;&#039;&#039;jetons&#039;&#039;&#039;, mais le terme &#039;&#039;&#039;jeton&#039;&#039;&#039; est aussi utilisé en cybersécurité et dans les réseaux de communication. &lt;br /&gt;
&lt;br /&gt;
&amp;lt;hr/&amp;gt;&lt;br /&gt;
Pour la suite du traitement, le jeton résultant est souvent converti en un nombre entier. On dit alors que le jeton est encodé. Le processus inverse, le décodage part de la représentation par un nombre entier vers un jeton.&lt;br /&gt;
&lt;br /&gt;
==Français==&lt;br /&gt;
&#039;&#039;&#039;jeton textuel&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;jeton&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;segment textuel&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;segment de texte&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;symbole&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;unité sous-lexicale&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;unité lexicale&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;partie de mot&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Anglais==&lt;br /&gt;
&#039;&#039;&#039;token&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
&lt;br /&gt;
[https://www.btb.termiumplus.gc.ca/tpv2alpha/alpha-fra.html?lang=fra&amp;amp;i=1&amp;amp;srchtxt=tokenizer&amp;amp;index=alt&amp;amp;codom2nd_wet=1#resultrecs &#039;&#039;Termium - Tokenizer&#039;&#039;]&lt;br /&gt;
&lt;br /&gt;
[https://www.culture.gouv.fr/content/download/365680/pdf_file/50_termes_cl%C3%A9s_de_l%27IA-2025.pdf?inLanguage=fre-FR&amp;amp;version=2  &#039;&#039;50 termes clés de l&#039;intelligence artificielle&#039;&#039;, Ministère de la culture, Commission d&#039;enrichissement de la langue française (2025). - Jeton textuel]&lt;br /&gt;
&lt;br /&gt;
[https://fr.wikipedia.org/wiki/Analyse_lexicale  Wikipedia - &#039;&#039;Analyse lexicale&#039;&#039;]&lt;br /&gt;
&lt;br /&gt;
[https://www.sciencedirect.com/science/article/pii/S0167865518303271 &#039;&#039;A unified multilingual handwriting recognition system using multigrams sub-lexical units&#039;&#039;, Swaileh et al. 2019]&lt;br /&gt;
&lt;br /&gt;
[https://link.springer.com/chapter/10.1007/978-3-319-77113-7_1, &#039;&#039;Overview of Character-Based Models for Natural Language Processing&#039;&#039;, Adel et al. 2018]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/Lexical_analysis  Wikipedia - Lexical Analysis]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Nettoyage_de_donn%C3%A9es&amp;diff=124418</id>
		<title>Nettoyage de données</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Nettoyage_de_donn%C3%A9es&amp;diff=124418"/>
		<updated>2026-04-28T18:45:14Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;==Définition==&lt;br /&gt;
Le nettoyage de données est l&#039;opération de détection et de correction d&#039;erreurs présentes dans des jeux de données brutes stockées dans des bases de données ou dans des fichiers. Ces données peuvent avoir plusieurs types d&#039;erreurs comme des erreurs de frappe, de format, de syntaxe etc. &lt;br /&gt;
&lt;br /&gt;
Le processus de nettoyage, ou « prétraitement des données », identifie les données erronées et les corrige automatiquement avec un programme informatique. Une fois traitées, ces données peuvent être présentées dans un format normalisé, ce qui aide les humains et les ordinateurs à les interpréter. Les nettoyeurs de type &#039;&#039;&#039;[[ETL]]&#039;&#039;&#039; ont été les premiers à voir le jour.&lt;br /&gt;
&lt;br /&gt;
==Français==&lt;br /&gt;
&#039;&#039;&#039;nettoyage de données&#039;&#039;&#039;  &lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;traitement des données&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;curation des données&#039;&#039;&#039; &amp;lt;small&amp;gt;calque de l&#039;anglais&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Anglais==&lt;br /&gt;
&#039;&#039;&#039;data cleansing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;data cleaning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;data scrubbing&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;data curation&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;data cooking&#039;&#039;&#039;    &amp;lt;small&amp;gt;(familier)&amp;lt;/small&amp;gt;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
&lt;br /&gt;
[https://fr.wikipedia.org/wiki/Nettoyage_de_donn%C3%A9es   Source : Wikipedia, &#039;&#039;Nettoyage de données&#039;&#039;.]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/Data_cleansing   Source : Wikipedia, &#039;&#039;Data cleansing&#039;&#039;.]&lt;br /&gt;
&lt;br /&gt;
[https://www.techopedia.com/definition/14676/cooked-data   Source : Techopedia, &#039;&#039;Cooked Data&#039;&#039;.]&lt;br /&gt;
&lt;br /&gt;
[http://gdt.oqlf.gouv.qc.ca/ficheOqlf.aspx?Id_Fiche=8873874   Source : GDT - Traitement des données ]&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
{{Modèle:GDT}}&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Traitement de données]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=LightMem&amp;diff=124412</id>
		<title>LightMem</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=LightMem&amp;diff=124412"/>
		<updated>2026-04-28T18:26:21Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Nom propre, cadre de gestion de la mémoire des &#039;&#039;&#039;[[Grand modèle de langues (GML)|grands modèles de langues]]&#039;&#039;&#039; qui minimise la redondance tout en préservant les informations et en réduisant les coûts de calcul grâce à la création d&#039;une mémoire externe des interactions des utilisateurs.&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Cependant, ce cadre de gestion de la mémoire pose des défis éthiques majeurs en matière de confidentialité des utilisateurs. De plus, la mémoire peut également absorber et perpétuer les préjugés ou les informations erronées provenant des données saisies par les utilisateurs.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;LightMem&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;LightMEM&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;LightMem&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;LightMEM&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; Lightweight and Efficient Memory-Augmented Generation&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Memory management framework that minimizes redundancy while preserving information and reducing computational costs of LLMs by creating an external memory of user interactions.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;It introduces critical ethical challenges to user privacy and the memory can also absorb and perpetuate biases or misinformation from user input.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://arxiv.org/abs/2510.18866   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/zjunlp/LightMem   Source : GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://huggingface.co/papers/2510.18866  Source :  huggingface]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Rappel&amp;diff=120839</id>
		<title>Rappel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Rappel&amp;diff=120839"/>
		<updated>2026-04-21T19:29:52Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Capacité d&#039;un système à retrouver l&#039;ensemble des réponses pertinentes dans un ensemble de réponses donné. &lt;br /&gt;
&lt;br /&gt;
Voir [[précision]]&lt;br /&gt;
&lt;br /&gt;
== Francais ==&lt;br /&gt;
&#039;&#039;&#039;rappel&#039;&#039;&#039; &lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;recall&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://developers.google.com/machine-learning/glossary/  Source : Google machine learning glossary ]&lt;br /&gt;
&lt;br /&gt;
[https://www.leslibraires.ca/livres/l-apprentissage-profond-ian-goodfellow-9791097160432.html    Source : L&#039;APPRENTISSAGE PROFOND]&lt;br /&gt;
&lt;br /&gt;
[[Category:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Category:Apprentissage profond]]&lt;br /&gt;
[[Category:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Pr%C3%A9cision&amp;diff=120838</id>
		<title>Précision</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Pr%C3%A9cision&amp;diff=120838"/>
		<updated>2026-04-21T19:27:22Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Nombre de réponses pertinentes parmi l&#039;ensemble des réponses fournies par un système. &lt;br /&gt;
&lt;br /&gt;
Voir aussi [[justesse]] et [[rappel]].&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;précision&#039;&#039;&#039;   &lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;precision&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://developers.google.com/machine-learning/glossary/  Source : Google machine learning glossary ]&lt;br /&gt;
&lt;br /&gt;
[[Category:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Category:Apprentissage profond]]&lt;br /&gt;
[[Category:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Pr%C3%A9cision&amp;diff=120837</id>
		<title>Précision</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Pr%C3%A9cision&amp;diff=120837"/>
		<updated>2026-04-21T19:26:26Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Nombre de réponses pertinentes parmi l&#039;ensemble des réponses fournies par un système. &lt;br /&gt;
&lt;br /&gt;
Voir aussi &#039;&#039;&#039;[[justesse]]&#039;&#039;&#039;.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;précision&#039;&#039;&#039;   &lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;precision&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://developers.google.com/machine-learning/glossary/  Source : Google machine learning glossary ]&lt;br /&gt;
&lt;br /&gt;
[[Category:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Category:Apprentissage profond]]&lt;br /&gt;
[[Category:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Rappel&amp;diff=120836</id>
		<title>Rappel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Rappel&amp;diff=120836"/>
		<updated>2026-04-21T19:24:47Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Capacité d&#039;un système à retrouver l&#039;ensemble des réponses pertinentes. &lt;br /&gt;
&lt;br /&gt;
Voir [[précision]]&lt;br /&gt;
&lt;br /&gt;
== Francais ==&lt;br /&gt;
&#039;&#039;&#039;rappel&#039;&#039;&#039; &lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;recall&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://developers.google.com/machine-learning/glossary/  Source : Google machine learning glossary ]&lt;br /&gt;
&lt;br /&gt;
[https://www.leslibraires.ca/livres/l-apprentissage-profond-ian-goodfellow-9791097160432.html    Source : L&#039;APPRENTISSAGE PROFOND]&lt;br /&gt;
&lt;br /&gt;
[[Category:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Category:Apprentissage profond]]&lt;br /&gt;
[[Category:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Rappel&amp;diff=120835</id>
		<title>Rappel</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Rappel&amp;diff=120835"/>
		<updated>2026-04-21T19:24:11Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Capacité d&#039;un système à retrouver l&#039;ensemble des réponses pertinentes. &lt;br /&gt;
&lt;br /&gt;
== Francais ==&lt;br /&gt;
&#039;&#039;&#039;rappel&#039;&#039;&#039; &lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;recall&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://developers.google.com/machine-learning/glossary/  Source : Google machine learning glossary ]&lt;br /&gt;
&lt;br /&gt;
[https://www.leslibraires.ca/livres/l-apprentissage-profond-ian-goodfellow-9791097160432.html    Source : L&#039;APPRENTISSAGE PROFOND]&lt;br /&gt;
&lt;br /&gt;
[[Category:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Category:Apprentissage profond]]&lt;br /&gt;
[[Category:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=ROUGE&amp;diff=120834</id>
		<title>ROUGE</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=ROUGE&amp;diff=120834"/>
		<updated>2026-04-21T19:22:13Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Ensemble de mesures ou métriques de similarité qui se basent sur les [[N-grammes|n-grammes]] utilisées pour évaluer les logiciels de [[génération automatique de texte]] et de [[traduction automatique]] dans le domaine du [[traitement automatique de la langue naturelle]]. &lt;br /&gt;
&lt;br /&gt;
Voir aussi &#039;&#039;&#039;[[BLEU]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Dans le cadre d&#039;une tâche de génération automatique de texte, la reprise des idées principales ([[rappel]]) est plus importante que d&#039;obtenir une formulation exacte ([[précision]]), ainsi ROUGE est calculé en comptant le nombre de mots ou de &#039;&#039;&#039;[[N-gramme|n-grammes]]&#039;&#039;&#039; qui se recoupent.&lt;br /&gt;
&lt;br /&gt;
*ROUGE est l&#039;acronyme de « Recall-Oriented Understudy for Gisting Evaluation ».&lt;br /&gt;
*ROUGE peut être calculé à l&#039;aide de bibliothèque (&#039;&#039;library&#039;&#039;) &#039;&#039;&#039;[[SacreBLEU]]&#039;&#039;&#039;. &lt;br /&gt;
*En raison des points faibles de ROUGE, ROUGE 2.0 à été proposé en 2018. &lt;br /&gt;
*Même s&#039;il s&#039;agit d&#039;un ensemble de métriques, on retrouve souvent la mention &#039;&#039;ROUGE score&#039;&#039; dans les textes.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; ROUGE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; ROUGE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Recall-Oriented Understudy for Gisting Evaluation&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
ROUGE stands for &amp;quot;&#039;&#039;Recall-Oriented Understudy for Gisting Evaluation&#039;&#039;&amp;quot; and it is a set of metrics and a software package used for evaluating automatic summarization and machine translation software in natural language processing. It is computed by counting the number of overlapping words or n-grams since capturing key ideas and recall is more important than exact wording for the summarization task.&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://aclanthology.org/W04-1013/   Source : ACL Anthology]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/1803.01937   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://www.geeksforgeeks.org/nlp/understanding-bleu-and-rouge-score-for-nlp-evaluation/   Source : Geeks for Geeks]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/ROUGE_(metric)  Source : Wikipedia]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=ROUGE&amp;diff=120833</id>
		<title>ROUGE</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=ROUGE&amp;diff=120833"/>
		<updated>2026-04-21T19:20:51Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Ensemble de mesures ou métriques de similarité qui se basent sur les [[N-grammes|n-grammes]] utilisées pour évaluer les logiciels de [[génération automatique de texte]] et de [[traduction automatique]] dans le domaine du [[traitement automatique de la langue naturelle]]. &lt;br /&gt;
&lt;br /&gt;
Voir aussi &#039;&#039;&#039;[[BLEU]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Dans le cadre d&#039;une tâche de génération automatique de texte, la reprise des idées principales est plus importante que d&#039;obtenir une formulation exacte, ainsi ROUGE est calculé en comptant le nombre de mots ou de &#039;&#039;&#039;[[N-gramme|n-grammes]]&#039;&#039;&#039; qui se recoupent.&lt;br /&gt;
&lt;br /&gt;
*ROUGE est l&#039;acronyme de « Recall-Oriented Understudy for Gisting Evaluation ».&lt;br /&gt;
*ROUGE peut être calculé à l&#039;aide de bibliothèque (&#039;&#039;library&#039;&#039;) &#039;&#039;&#039;[[SacreBLEU]]&#039;&#039;&#039;. &lt;br /&gt;
*En raison des points faibles de ROUGE, ROUGE 2.0 à été proposé en 2018. &lt;br /&gt;
*Même s&#039;il s&#039;agit d&#039;un ensemble de métriques, on retrouve souvent la mention &#039;&#039;ROUGE score&#039;&#039; dans les textes.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; ROUGE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; ROUGE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Recall-Oriented Understudy for Gisting Evaluation&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
ROUGE stands for &amp;quot;&#039;&#039;Recall-Oriented Understudy for Gisting Evaluation&#039;&#039;&amp;quot; and it is a set of metrics and a software package used for evaluating automatic summarization and machine translation software in natural language processing. It is computed by counting the number of overlapping words or n-grams since capturing key ideas and recall is more important than exact wording for the summarization task.&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://aclanthology.org/W04-1013/   Source : ACL Anthology]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/1803.01937   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://www.geeksforgeeks.org/nlp/understanding-bleu-and-rouge-score-for-nlp-evaluation/   Source : Geeks for Geeks]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/ROUGE_(metric)  Source : Wikipedia]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=ROUGE&amp;diff=120832</id>
		<title>ROUGE</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=ROUGE&amp;diff=120832"/>
		<updated>2026-04-21T19:19:55Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Ensemble de mesures ou métriques de similarité qui se basent sur les [[N-grammes|n-grammes]] utilisées pour évaluer les logiciels de [[génération automatique de texte]] et de &#039;&#039;&#039;[[traduction automatique]]&#039;&#039;&#039; dans le domaine du &#039;&#039;&#039;[[traitement automatique de la langue naturelle]]&#039;&#039;&#039;. &lt;br /&gt;
&lt;br /&gt;
Voir aussi &#039;&#039;&#039;[[BLEU]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Dans le cadre d&#039;une tâche de génération automatique de texte, la reprise des idées principales est plus importante que d&#039;obtenir une formulation exacte, ainsi ROUGE est calculé en comptant le nombre de mots ou de &#039;&#039;&#039;[[N-gramme|n-grammes]]&#039;&#039;&#039; qui se recoupent.&lt;br /&gt;
&lt;br /&gt;
*ROUGE est l&#039;acronyme de « Recall-Oriented Understudy for Gisting Evaluation ».&lt;br /&gt;
*ROUGE peut être calculé à l&#039;aide de bibliothèque (&#039;&#039;library&#039;&#039;) &#039;&#039;&#039;[[SacreBLEU]]&#039;&#039;&#039;. &lt;br /&gt;
*En raison des points faibles de ROUGE, ROUGE 2.0 à été proposé en 2018. &lt;br /&gt;
*Même s&#039;il s&#039;agit d&#039;un ensemble de métriques, on retrouve souvent la mention &#039;&#039;ROUGE score&#039;&#039; dans les textes.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; ROUGE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; ROUGE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Recall-Oriented Understudy for Gisting Evaluation&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
ROUGE stands for &amp;quot;&#039;&#039;Recall-Oriented Understudy for Gisting Evaluation&#039;&#039;&amp;quot; and it is a set of metrics and a software package used for evaluating automatic summarization and machine translation software in natural language processing. It is computed by counting the number of overlapping words or n-grams since capturing key ideas and recall is more important than exact wording for the summarization task.&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://aclanthology.org/W04-1013/   Source : ACL Anthology]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/1803.01937   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://www.geeksforgeeks.org/nlp/understanding-bleu-and-rouge-score-for-nlp-evaluation/   Source : Geeks for Geeks]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/ROUGE_(metric)  Source : Wikipedia]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=ROUGE&amp;diff=120831</id>
		<title>ROUGE</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=ROUGE&amp;diff=120831"/>
		<updated>2026-04-21T19:17:35Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Ensemble de mesures ou métriques utilisées pour évaluer les logiciels de [[génération automatique de texte]] et de &#039;&#039;&#039;[[traduction automatique]]&#039;&#039;&#039; dans le domaine du &#039;&#039;&#039;[[traitement automatique de la langue naturelle]]&#039;&#039;&#039;. &lt;br /&gt;
&lt;br /&gt;
Voir aussi &#039;&#039;&#039;[[BLEU]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Dans le cadre d&#039;une tâche de génération automatique de texte, la reprise des idées principales (&#039;&#039;&#039;&#039;recall&#039;&#039; ou rappel&#039;&#039;) et la précision (&#039;&#039;&#039;&#039;precision&#039;&#039;&#039;&#039;) sont plus importantes que d&#039;obtenir une formulation exacte, ainsi ROUGE est calculé en comptant le nombre de mots ou de &#039;&#039;&#039;[[N-gramme|n-grammes]]&#039;&#039;&#039; qui se recoupent.&lt;br /&gt;
&lt;br /&gt;
*ROUGE est l&#039;acronyme de « Recall-Oriented Understudy for Gisting Evaluation ».&lt;br /&gt;
*ROUGE peut être calculé à l&#039;aide de bibliothèque (&#039;&#039;library&#039;&#039;) &#039;&#039;&#039;[[SacreBLEU]]&#039;&#039;&#039;. &lt;br /&gt;
*En raison des points faibles de ROUGE, ROUGE 2.0 à été proposé en 2018. &lt;br /&gt;
*Même s&#039;il s&#039;agit d&#039;un ensemble de métriques, on retrouve souvent la mention &#039;&#039;ROUGE score&#039;&#039; dans les textes.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; ROUGE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; ROUGE&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;Recall-Oriented Understudy for Gisting Evaluation&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
ROUGE stands for &amp;quot;&#039;&#039;Recall-Oriented Understudy for Gisting Evaluation&#039;&#039;&amp;quot; and it is a set of metrics and a software package used for evaluating automatic summarization and machine translation software in natural language processing. It is computed by counting the number of overlapping words or n-grams since capturing key ideas and recall is more important than exact wording for the summarization task.&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://aclanthology.org/W04-1013/   Source : ACL Anthology]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/1803.01937   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://www.geeksforgeeks.org/nlp/understanding-bleu-and-rouge-score-for-nlp-evaluation/   Source : Geeks for Geeks]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/ROUGE_(metric)  Source : Wikipedia]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=GML_comme_juge&amp;diff=120830</id>
		<title>GML comme juge</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=GML_comme_juge&amp;diff=120830"/>
		<updated>2026-04-21T19:09:23Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Ensemble de techniques de &#039;&#039;&#039;[[traitement automatique de la langue naturelle]]&#039;&#039;&#039; qui utilise un &#039;&#039;&#039;[[grand modèle de langues (GML)]]&#039;&#039;&#039; pour évaluer le travail d&#039;un autre GML. &lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Une &#039;&#039;&#039;[[requête générative|requête]]&#039;&#039;&#039; effectuée dans le cadre d&#039;une évaluation par un GML comporte en général les trois éléments suivants: le contexte de la tâche et les textes à évaluer, une explication des critères d&#039;évaluation et un format de réponse qui encode la décision du « GML juge ».&lt;br /&gt;
&lt;br /&gt;
*Important: Cette technique ne supprime pas la nécessité du jugement humain.&lt;br /&gt;
*Les GML (comme juge) performants peuvent établir une corrélation étroite avec les jugements humains sur de nombreuses tâches. Cependant, ils présentent des biais systématiques et des défaillances. &lt;br /&gt;
*Dans certains cas, on peut donner au GML qui sert de juge un ou plusieurs textes de référence. &lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; GML comme juge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; GML en tant que juge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; LLM-as-a-judge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;A (family of) technique(s) in natural language processing that uses one large language model (LLM) to evaluate another LLM’s work. A typical LLM-as-a-Judge setup consists of three elements: an input that contains the task context and candidate outputs to be evaluated, a prompt that explains the evaluation criteria, and a response format that encodes the judge&#039;s decision.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Strong LLM (judges) can correlate closely with human judgments on many tasks. However, it has systematic biases and failure modes. The task can have reference(s) or not. But most importantly, it doesn’t eliminate the need for human judgment.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://hal.science/hal-04782667v1/file/Techniques%20d%27audit%20des%20LLM%20VF%20HAL.pdf  Duprieu et Berkouk (2024) - GML comme juge]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2411.15594   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://towardsdatascience.com/llm-as-a-judge-a-practical-guide/   Source : towards data science]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/LLM-as-a-Judge   Source : Wikipedia]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=GML_comme_juge&amp;diff=120829</id>
		<title>GML comme juge</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=GML_comme_juge&amp;diff=120829"/>
		<updated>2026-04-21T19:08:19Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Une (famille de) technique(s) de &#039;&#039;&#039;[[traitement automatique de la langue naturelle]]&#039;&#039;&#039; qui utilise un &#039;&#039;&#039;[[grand modèle de langues (GML)]]&#039;&#039;&#039; pour évaluer le travail d&#039;un autre GML. &lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Une &#039;&#039;&#039;[[requête générative|requête]]&#039;&#039;&#039; effectuée dans le cadre d&#039;une évaluation par un GML comporte en général les trois éléments suivants: le contexte de la tâche et les textes à évaluer, une explication des critères d&#039;évaluation et un format de réponse qui encode la décision du « GML juge ».&lt;br /&gt;
&lt;br /&gt;
*Important: Cette technique ne supprime pas la nécessité du jugement humain.&lt;br /&gt;
*Les GML (comme juge) performants peuvent établir une corrélation étroite avec les jugements humains sur de nombreuses tâches. Cependant, ils présentent des biais systématiques et des défaillances. &lt;br /&gt;
*Dans certains cas, on peut donner au GML qui sert de juge un ou plusieurs textes de référence. &lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; GML comme juge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; GML en tant que juge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; LLM-as-a-judge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;A (family of) technique(s) in natural language processing that uses one large language model (LLM) to evaluate another LLM’s work. A typical LLM-as-a-Judge setup consists of three elements: an input that contains the task context and candidate outputs to be evaluated, a prompt that explains the evaluation criteria, and a response format that encodes the judge&#039;s decision.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Strong LLM (judges) can correlate closely with human judgments on many tasks. However, it has systematic biases and failure modes. The task can have reference(s) or not. But most importantly, it doesn’t eliminate the need for human judgment.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://hal.science/hal-04782667v1/file/Techniques%20d%27audit%20des%20LLM%20VF%20HAL.pdf  Duprieu et Berkouk (2024) - GML comme juge]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2411.15594   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://towardsdatascience.com/llm-as-a-judge-a-practical-guide/   Source : towards data science]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/LLM-as-a-Judge   Source : Wikipedia]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=GML_en_tant_que_juge&amp;diff=120828</id>
		<title>GML en tant que juge</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=GML_en_tant_que_juge&amp;diff=120828"/>
		<updated>2026-04-21T19:06:42Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page GML en tant que juge vers GML comme juge par-dessus une redirection&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;#REDIRECTION [[GML comme juge]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=GML_comme_juge&amp;diff=120827</id>
		<title>GML comme juge</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=GML_comme_juge&amp;diff=120827"/>
		<updated>2026-04-21T19:06:41Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page GML en tant que juge vers GML comme juge par-dessus une redirection&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Une (famille de) technique(s) de &#039;&#039;&#039;[[traitement automatique de la langue naturelle]]&#039;&#039;&#039; qui utilise un &#039;&#039;&#039;[[grand modèle de langues (GML)]]&#039;&#039;&#039; pour évaluer le travail d&#039;un autre GML. &lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Une &#039;&#039;&#039;[[requête générative|requête]]&#039;&#039;&#039; effectuée dans le cadre d&#039;une évaluation par un GML comporte en général les trois éléments suivants: le contexte de la tâche et les textes à évaluer, une explication des critères d&#039;évaluation et un format de réponse qui encode la décision du « GML juge ».&lt;br /&gt;
&lt;br /&gt;
*Important: Cette technique ne supprime pas la nécessité du jugement humain.&lt;br /&gt;
*Les GML (comme juge) performants peuvent établir une corrélation étroite avec les jugements humains sur de nombreuses tâches. Cependant, ils présentent des biais systématiques et des défaillances. &lt;br /&gt;
*Dans certains cas, on peut donner au GML qui sert de juge un ou plusieurs textes de référence. &lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; GML comme juge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; GML en tant que juge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; LLM-as-a-judge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;A (family of) technique(s) in natural language processing that uses one large language model (LLM) to evaluate another LLM’s work. A typical LLM-as-a-Judge setup consists of three elements: an input that contains the task context and candidate outputs to be evaluated, a prompt that explains the evaluation criteria, and a response format that encodes the judge&#039;s decision.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Strong LLM (judges) can correlate closely with human judgments on many tasks. However, it has systematic biases and failure modes. The task can have reference(s) or not. But most importantly, it doesn’t eliminate the need for human judgment.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://hal.science/hal-04782667v1/file/Techniques%20d%27audit%20des%20LLM%20VF%20HAL.pdf  Duprieu et Berkouk 2024 - GML comme juge]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2411.15594   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://towardsdatascience.com/llm-as-a-judge-a-practical-guide/   Source : towards data science]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/LLM-as-a-Judge   Source : Wikipedia]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=GML_comme_juge&amp;diff=120826</id>
		<title>GML comme juge</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=GML_comme_juge&amp;diff=120826"/>
		<updated>2026-04-21T19:06:23Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Une (famille de) technique(s) de &#039;&#039;&#039;[[traitement automatique de la langue naturelle]]&#039;&#039;&#039; qui utilise un &#039;&#039;&#039;[[grand modèle de langues (GML)]]&#039;&#039;&#039; pour évaluer le travail d&#039;un autre GML. &lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Une &#039;&#039;&#039;[[requête générative|requête]]&#039;&#039;&#039; effectuée dans le cadre d&#039;une évaluation par un GML comporte en général les trois éléments suivants: le contexte de la tâche et les textes à évaluer, une explication des critères d&#039;évaluation et un format de réponse qui encode la décision du « GML juge ».&lt;br /&gt;
&lt;br /&gt;
*Important: Cette technique ne supprime pas la nécessité du jugement humain.&lt;br /&gt;
*Les GML (comme juge) performants peuvent établir une corrélation étroite avec les jugements humains sur de nombreuses tâches. Cependant, ils présentent des biais systématiques et des défaillances. &lt;br /&gt;
*Dans certains cas, on peut donner au GML qui sert de juge un ou plusieurs textes de référence. &lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; GML comme juge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; GML en tant que juge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; LLM-as-a-judge&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;A (family of) technique(s) in natural language processing that uses one large language model (LLM) to evaluate another LLM’s work. A typical LLM-as-a-Judge setup consists of three elements: an input that contains the task context and candidate outputs to be evaluated, a prompt that explains the evaluation criteria, and a response format that encodes the judge&#039;s decision.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;Strong LLM (judges) can correlate closely with human judgments on many tasks. However, it has systematic biases and failure modes. The task can have reference(s) or not. But most importantly, it doesn’t eliminate the need for human judgment.&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://hal.science/hal-04782667v1/file/Techniques%20d%27audit%20des%20LLM%20VF%20HAL.pdf  Duprieu et Berkouk 2024 - GML comme juge]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2411.15594   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://towardsdatascience.com/llm-as-a-judge-a-practical-guide/   Source : towards data science]&lt;br /&gt;
&lt;br /&gt;
[https://en.wikipedia.org/wiki/LLM-as-a-Judge   Source : Wikipedia]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=DAPO&amp;diff=120825</id>
		<title>DAPO</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=DAPO&amp;diff=120825"/>
		<updated>2026-04-21T18:57:47Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page DAPO vers Algorithme d&amp;#039;optimisation DAPO&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;#REDIRECTION [[Algorithme d&#039;optimisation DAPO]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Algorithme_d%27optimisation_DAPO&amp;diff=120824</id>
		<title>Algorithme d&#039;optimisation DAPO</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Algorithme_d%27optimisation_DAPO&amp;diff=120824"/>
		<updated>2026-04-21T18:57:46Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page DAPO vers Algorithme d&amp;#039;optimisation DAPO&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
&#039;&#039;&#039;[[Algorithme]]&#039;&#039;&#039; d&#039;&#039;&#039;&#039;[[apprentissage par renforcement]]&#039;&#039;&#039; qui utilise une approche découplée pour augmenter la limite supérieure de la plage de l&#039;échantillonnage dynamique. &lt;br /&gt;
&lt;br /&gt;
Voir aussi &#039;&#039;&#039;[[optimisation de la politique proximale]]&#039;&#039;&#039;, &#039;&#039;&#039;[[optimisation de la politique relative au groupe]]&#039;&#039;&#039;, &#039;&#039;&#039;[[échantillonnage des p-meilleurs]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Complément==&lt;br /&gt;
L’échantillonnage dynamique favorise les données apportant un meilleur apprentissage. &lt;br /&gt;
&lt;br /&gt;
L&#039;un de ses avantages est qu&#039;il n&#039;affecte pas de manière significative la durée totale de l&#039;&#039;&#039;&#039;[[entraînement]]&#039;&#039;&#039;.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;algorithme d&#039;optimisation DAPO&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;optimisation de la politique d’échantillonnage dynamique et seuillage découplé&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;OPEDD&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; DAPO&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; Decoupled Clip and Dynamic Sampling Policy Optimization&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--A reinforcement learning algorithm that reinforces reasoning patterns and also gives rise to new modes of reasoning that facilitate correct problem-solving. One of its advantages is that it does not significantly affect the overall training time.--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2503.14476   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://dapo-sia.github.io/   Source : DAPO, GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://verl.readthedocs.io/en/latest/algo/dapo.html   Source : verl]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Algorithme_d%27optimisation_DAPO&amp;diff=120823</id>
		<title>Algorithme d&#039;optimisation DAPO</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Algorithme_d%27optimisation_DAPO&amp;diff=120823"/>
		<updated>2026-04-21T18:57:33Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
&#039;&#039;&#039;[[Algorithme]]&#039;&#039;&#039; d&#039;&#039;&#039;&#039;[[apprentissage par renforcement]]&#039;&#039;&#039; qui utilise une approche découplée pour augmenter la limite supérieure de la plage de l&#039;échantillonnage dynamique. &lt;br /&gt;
&lt;br /&gt;
Voir aussi &#039;&#039;&#039;[[optimisation de la politique proximale]]&#039;&#039;&#039;, &#039;&#039;&#039;[[optimisation de la politique relative au groupe]]&#039;&#039;&#039;, &#039;&#039;&#039;[[échantillonnage des p-meilleurs]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Complément==&lt;br /&gt;
L’échantillonnage dynamique favorise les données apportant un meilleur apprentissage. &lt;br /&gt;
&lt;br /&gt;
L&#039;un de ses avantages est qu&#039;il n&#039;affecte pas de manière significative la durée totale de l&#039;&#039;&#039;&#039;[[entraînement]]&#039;&#039;&#039;.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;algorithme d&#039;optimisation DAPO&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;optimisation de la politique d’échantillonnage dynamique et seuillage découplé&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;OPEDD&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; DAPO&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; Decoupled Clip and Dynamic Sampling Policy Optimization&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--A reinforcement learning algorithm that reinforces reasoning patterns and also gives rise to new modes of reasoning that facilitate correct problem-solving. One of its advantages is that it does not significantly affect the overall training time.--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2503.14476   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://dapo-sia.github.io/   Source : DAPO, GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://verl.readthedocs.io/en/latest/algo/dapo.html   Source : verl]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Algorithme_d%27optimisation_DAPO&amp;diff=120822</id>
		<title>Algorithme d&#039;optimisation DAPO</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Algorithme_d%27optimisation_DAPO&amp;diff=120822"/>
		<updated>2026-04-21T18:55:55Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
&#039;&#039;&#039;[[Algorithme]]&#039;&#039;&#039; d&#039;&#039;&#039;&#039;[[apprentissage par renforcement]]&#039;&#039;&#039; qui utilise une approche découplée pour augmenter la limite supérieure de la plage de l&#039;échantillonnage dynamique. &lt;br /&gt;
&lt;br /&gt;
Voir aussi &#039;&#039;&#039;[[optimisation de la politique proximale]]&#039;&#039;&#039;, &#039;&#039;&#039;[[optimisation de la politique relative au groupe]]&#039;&#039;&#039;, &#039;&#039;&#039;[[échantillonnage des p-meilleurs]]&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Complément==&lt;br /&gt;
L’échantillonnage dynamique favorise les données apportant un meilleur apprentissage. &lt;br /&gt;
&lt;br /&gt;
L&#039;un de ses avantages est qu&#039;il n&#039;affecte pas de manière significative la durée totale de l&#039;&#039;&#039;&#039;[[entraînement]]&#039;&#039;&#039;.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;optimisation de la politique d’échantillonnage dynamique et seuillage découplé&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;OPEDD&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;algorithme d&#039;optimisation DAPO&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; DAPO&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; Decoupled Clip and Dynamic Sampling Policy Optimization&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--A reinforcement learning algorithm that reinforces reasoning patterns and also gives rise to new modes of reasoning that facilitate correct problem-solving. One of its advantages is that it does not significantly affect the overall training time.--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://arxiv.org/abs/2503.14476   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://dapo-sia.github.io/   Source : DAPO, GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://verl.readthedocs.io/en/latest/algo/dapo.html   Source : verl]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Mod%C3%A8le_%C3%A9tudiant&amp;diff=120820</id>
		<title>Modèle étudiant</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Mod%C3%A8le_%C3%A9tudiant&amp;diff=120820"/>
		<updated>2026-04-21T18:29:34Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Page créée avec « == Définition == En apprentissage automatique, un modèle étudiant est petit réseau neuronal entraîné par un réseau plus vaste, nommé modèle enseignant, qui le guide à reproduire ses performances grâce à un processus appelé distillation de modèles.  == Compléments == Attention à ne pas confondre avec un modèle étudiant pour la formation assistée par ordinateur destiné aux humains.  == Français == &amp;#039;&amp;#039;&amp;#039;modèle étudiant&amp;#039;&amp;#039;&amp;#039;  &amp;#039;&amp;#039;&amp;#039;mod... »&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
En apprentissage automatique, un modèle étudiant est petit [[réseau neuronal]] entraîné par un réseau plus vaste, nommé [[modèle enseignant]], qui le guide à reproduire ses performances grâce à un processus appelé [[distillation de modèles]].&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Attention à ne pas confondre avec un modèle étudiant pour la [[formation assistée par ordinateur]] destiné aux humains.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;modèle étudiant&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;modèle élève&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;student model&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://hal.science/hal-04446898/file/Strat%C3%A9gies_de_Compression_et_d_Optimisation_des_Mod%C3%A8les_d_Intelligence_Artificielle.pdf Moez Krichen (2024) - modèle étudiant]&lt;br /&gt;
&lt;br /&gt;
[https://yassinechabli.substack.com/p/les-modeles-distilles  Yassine Chabli (2025) - modèle élève]&lt;br /&gt;
&lt;br /&gt;
[https://www.ibm.com/think/topics/knowledge-distillation IBM - student model]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Mod%C3%A8le_enseignant&amp;diff=120819</id>
		<title>Modèle enseignant</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Mod%C3%A8le_enseignant&amp;diff=120819"/>
		<updated>2026-04-21T18:24:40Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
En apprentissage automatique, un modèle enseignant est un vaste [[réseau neuronal]] pré-entraîné qui guide un [[Modèle étudiant|modèle étudiant]] plus petit à reproduire ses performances grâce à un processus appelé [[distillation de modèles]].&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Attention à ne pas confondre avec un modèle d&#039;enseignement pour la [[formation assistée par ordinateur]] destiné aux humains.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;modèle enseignant&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;modèle d&#039;apprentissage enseignant&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;teacher model&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;teaching model&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://yassinechabli.substack.com/p/les-modeles-distilles  Yassine Chabli (2025) - modèle enseignant]&lt;br /&gt;
&lt;br /&gt;
[https://hal.science/hal-04446898/file/Strat%C3%A9gies_de_Compression_et_d_Optimisation_des_Mod%C3%A8les_d_Intelligence_Artificielle.pdf Moez Krichen (2024) - modèle enseignant]&lt;br /&gt;
&lt;br /&gt;
[https://www.ibm.com/think/topics/knowledge-distillation IBM - teacher model]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=BLEU&amp;diff=120328</id>
		<title>BLEU</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=BLEU&amp;diff=120328"/>
		<updated>2026-04-14T19:29:06Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
BLEU (bilingual evaluation understudy) est un algorithme d’évaluation de la qualité du texte qui a été traduit automatiquement d’une langue naturelle à une autre. &lt;br /&gt;
&lt;br /&gt;
BLEU a été l’une des premières métriques à revendiquer une corrélation élevée avec les jugements humains de qualité, et reste l’une des métriques automatisées les plus populaires et les moins coûteuses.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; BLEU&#039;&#039;&#039;   &amp;lt;small&amp;gt; nom propre &amp;lt;/small&amp;gt;&lt;br /&gt;
  &lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; BLEU&#039;&#039;&#039; &#039;&#039;(bilingual evaluation understudy) &#039;&#039;&lt;br /&gt;
==Sources==&lt;br /&gt;
&lt;br /&gt;
[https://fr.wikipedia.org/wiki/BLEU_(algorithme)  Source : Wikipedia ]&lt;br /&gt;
&lt;br /&gt;
[https://www.accenture.com/us-en/applied-intelligence-glossary    Source : Accenture - applied intelligence glossary ]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:GRAND LEXIQUE FRANÇAIS]]&lt;br /&gt;
[[Catégorie:ENGLISH]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Mod%C3%A8le_enseignant&amp;diff=120327</id>
		<title>Modèle enseignant</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Mod%C3%A8le_enseignant&amp;diff=120327"/>
		<updated>2026-04-14T19:22:29Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Page créée avec « == Définition == En apprentissage automatique, un modèle enseignant est un vaste réseau neuronal pré-entraîné qui guide un modèle « élève » plus petit à reproduire ses performances grâce à un processus appelé distillation de modèles.  == Compléments == Attention à ne pas confondre avec un modèle d&amp;#039;enseignement pour la formation assistée par ordinateur destiné aux humains.  == Français == &amp;#039;&amp;#039;&amp;#039;modèle enseignant&amp;#039;&amp;#039;&amp;#039;  &amp;#039;&amp;#039;&amp;#039;modèle d&amp;#039;app... »&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
En apprentissage automatique, un modèle enseignant est un vaste [[réseau neuronal]] pré-entraîné qui guide un modèle « élève » plus petit à reproduire ses performances grâce à un processus appelé [[distillation de modèles]].&lt;br /&gt;
&lt;br /&gt;
== Compléments ==&lt;br /&gt;
Attention à ne pas confondre avec un modèle d&#039;enseignement pour la [[formation assistée par ordinateur]] destiné aux humains.&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039;modèle enseignant&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;modèle d&#039;apprentissage enseignant&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039;teacher model&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039;teaching model&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
==Sources==&lt;br /&gt;
[https://yassinechabli.substack.com/p/les-modeles-distilles  Yassine Chabli (2025) - modèle enseignant]&lt;br /&gt;
&lt;br /&gt;
[https://hal.science/hal-04446898/file/Strat%C3%A9gies_de_Compression_et_d_Optimisation_des_Mod%C3%A8les_d_Intelligence_Artificielle.pdf Moez Krichen (2024) - modèle enseignant]&lt;br /&gt;
&lt;br /&gt;
[https://www.ibm.com/think/topics/knowledge-distillation IBM - teacher model]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120326</id>
		<title>Peaufinage par auto-jeu</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120326"/>
		<updated>2026-04-14T19:05:04Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Algorithme de &#039;&#039;&#039;[[peaufinage]]&#039;&#039;&#039; pour les &#039;&#039;&#039;[[Grand modèle de langues (GML)|grands modèles de langues (GML)]]&#039;&#039;&#039; qui utilise un mécanisme qui lui permet de jouer contre lui-même (&#039;&#039;self-play mechanism&#039;&#039;) en utilisant les versions précédentes du modèle.  &lt;br /&gt;
&lt;br /&gt;
Voir aussi [[Optimisation de la politique relative au groupe]] et [[Apprentissage par curriculum auto-évolutif]]&lt;br /&gt;
&lt;br /&gt;
== Complément ==&lt;br /&gt;
Cette technique réduit la dépendance vis-à-vis des &#039;&#039;&#039;[[Jeu de données|jeux de données]]&#039;&#039;&#039; externes ou des [[Modèle enseignant|modèles enseignants]].&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; peaufinage par auto-jeu&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; self-play fine-tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; self-play fine tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; SPIN&#039;&#039;&#039;&lt;br /&gt;
&amp;lt;!--A language model finetuning algorithm for large language models that utilizes a self-play mechanism, allowing LLMs to improve themselves by playing against their previous iterations. This techinique reduces reliance on external preference datasets or stronger teacher models.--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://theses.hal.science/tel-05430689v1/file/154915_XU_2025_archivage.pdf Zhuofan Xu (2025) - Auto-jeu]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2401.01335   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/uclaml/SPIN  Source : GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://verl.readthedocs.io/en/latest/algo/spin.html   Source: verl]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120325</id>
		<title>Peaufinage par auto-jeu</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120325"/>
		<updated>2026-04-14T19:03:37Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Algorithme de &#039;&#039;&#039;[[peaufinage]]&#039;&#039;&#039; pour les &#039;&#039;&#039;[[Grand modèle de langues (GML)|grands modèles de langues (GML)]]&#039;&#039;&#039; qui utilise un mécanisme qui lui permet de jouer contre lui-même (&#039;&#039;self-play mechanism&#039;&#039;) en utilisant les versions précédentes du modèle.  &lt;br /&gt;
&lt;br /&gt;
Voir aussi [[Optimisation de la politique relative au groupe]] et [[Apprentissage par curriculum auto-évolutif]]&lt;br /&gt;
&lt;br /&gt;
== Complément ==&lt;br /&gt;
Cette technique réduit la dépendance vis-à-vis des &#039;&#039;&#039;[[Jeu de données|jeux de données]]&#039;&#039;&#039; externes ou des [[Modèles enseignants|modèles enseignants]].&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; peaufinage par auto-jeu&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; self-play fine-tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; self-play fine tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; SPIN&#039;&#039;&#039;&lt;br /&gt;
&amp;lt;!--A language model finetuning algorithm for large language models that utilizes a self-play mechanism, allowing LLMs to improve themselves by playing against their previous iterations. This techinique reduces reliance on external preference datasets or stronger teacher models.--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
[https://theses.hal.science/tel-05430689v1/file/154915_XU_2025_archivage.pdf Zhuofan Xu (2025) - Auto-jeu]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2401.01335   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/uclaml/SPIN  Source : GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://verl.readthedocs.io/en/latest/algo/spin.html   Source: verl]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120324</id>
		<title>Peaufinage par auto-jeu</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120324"/>
		<updated>2026-04-14T19:03:09Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Algorithme de &#039;&#039;&#039;[[peaufinage]]&#039;&#039;&#039; pour les &#039;&#039;&#039;[[Grand modèle de langues (GML)|grands modèles de langues (GML)]]&#039;&#039;&#039; qui utilise un mécanisme qui lui permet de jouer contre lui-même (&#039;&#039;self-play mechanism&#039;&#039;) en utilisant les versions précédentes du modèle.  &lt;br /&gt;
&lt;br /&gt;
Voir aussi [[Optimisation de la politique relative au groupe]] et [[Apprentissage par curriculum auto-évolutif]]&lt;br /&gt;
&lt;br /&gt;
== Complément ==&lt;br /&gt;
Cette technique réduit la dépendance vis-à-vis des &#039;&#039;&#039;[[Jeu de données|jeux de données]]&#039;&#039;&#039; externes ou des [[Modèles enseignants|modèles enseignants]].&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; peaufinage par auto-jeu&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; self-play fine-tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; self-play fine tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; SPIN&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--A language model finetuning algorithm for large language models that utilizes a self-play mechanism, allowing LLMs to improve themselves by playing against their previous iterations. This techinique reduces reliance on external preference datasets or stronger teacher models.--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
&lt;br /&gt;
[https://theses.hal.science/tel-05430689v1/file/154915_XU_2025_archivage.pdf Zhuofan Xu (2025) - Auto-jeu]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2401.01335   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/uclaml/SPIN  Source : GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://verl.readthedocs.io/en/latest/algo/spin.html   Source: verl]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Self-play_fine-tuning&amp;diff=120323</id>
		<title>Self-play fine-tuning</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Self-play_fine-tuning&amp;diff=120323"/>
		<updated>2026-04-14T19:02:27Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page Self-play fine-tuning vers Peaufinage par auto-jeu&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;#REDIRECTION [[Peaufinage par auto-jeu]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120322</id>
		<title>Peaufinage par auto-jeu</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120322"/>
		<updated>2026-04-14T19:02:26Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : Patrickdrouin a déplacé la page Self-play fine-tuning vers Peaufinage par auto-jeu&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Algorithme de &#039;&#039;&#039;[[peaufinage]]&#039;&#039;&#039; pour les &#039;&#039;&#039;[[Grand modèle de langues (GML)|grands modèles de langues (GML)]]&#039;&#039;&#039; qui utilise un mécanisme qui lui permet de jouer contre lui-même &#039;&#039;self-play mechanism&#039;&#039; en utilisant les versions précédentes du modèle.  &lt;br /&gt;
&lt;br /&gt;
Voir aussi [[Optimisation de la politique relative au groupe]] et [[Apprentissage par curriculum auto-évolutif]]&lt;br /&gt;
&lt;br /&gt;
== Complément ==&lt;br /&gt;
Cette technique réduit la dépendance vis-à-vis des &#039;&#039;&#039;[[Jeu de données|jeux de données]]&#039;&#039;&#039; externes ou des [[Modèles enseignants|modèles enseignants]].&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; peaufinage par auto-jeu&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; self-play fine-tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; self-play fine tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; SPIN&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--A language model finetuning algorithm for large language models that utilizes a self-play mechanism, allowing LLMs to improve themselves by playing against their previous iterations. This techinique reduces reliance on external preference datasets or stronger teacher models.--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
&lt;br /&gt;
[https://theses.hal.science/tel-05430689v1/file/154915_XU_2025_archivage.pdf Zhuofan Xu (2025) - Auto-jeu]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2401.01335   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/uclaml/SPIN  Source : GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://verl.readthedocs.io/en/latest/algo/spin.html   Source: verl]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
	<entry>
		<id>https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120321</id>
		<title>Peaufinage par auto-jeu</title>
		<link rel="alternate" type="text/html" href="https://datafranca.org/wiki/index.php?title=Peaufinage_par_auto-jeu&amp;diff=120321"/>
		<updated>2026-04-14T19:02:09Z</updated>

		<summary type="html">&lt;p&gt;Patrickdrouin : &lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;== Définition ==&lt;br /&gt;
Algorithme de &#039;&#039;&#039;[[peaufinage]]&#039;&#039;&#039; pour les &#039;&#039;&#039;[[Grand modèle de langues (GML)|grands modèles de langues (GML)]]&#039;&#039;&#039; qui utilise un mécanisme qui lui permet de jouer contre lui-même &#039;&#039;self-play mechanism&#039;&#039; en utilisant les versions précédentes du modèle.  &lt;br /&gt;
&lt;br /&gt;
Voir aussi [[Optimisation de la politique relative au groupe]] et [[Apprentissage par curriculum auto-évolutif]]&lt;br /&gt;
&lt;br /&gt;
== Complément ==&lt;br /&gt;
Cette technique réduit la dépendance vis-à-vis des &#039;&#039;&#039;[[Jeu de données|jeux de données]]&#039;&#039;&#039; externes ou des [[Modèles enseignants|modèles enseignants]].&lt;br /&gt;
&lt;br /&gt;
== Français ==&lt;br /&gt;
&#039;&#039;&#039; peaufinage par auto-jeu&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
== Anglais ==&lt;br /&gt;
&#039;&#039;&#039; self-play fine-tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; self-play fine tuning&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&#039;&#039;&#039; SPIN&#039;&#039;&#039;&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!--A language model finetuning algorithm for large language models that utilizes a self-play mechanism, allowing LLMs to improve themselves by playing against their previous iterations. This techinique reduces reliance on external preference datasets or stronger teacher models.--&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== Sources ==&lt;br /&gt;
&lt;br /&gt;
[https://theses.hal.science/tel-05430689v1/file/154915_XU_2025_archivage.pdf Zhuofan Xu (2025) - Auto-jeu]&lt;br /&gt;
&lt;br /&gt;
[https://arxiv.org/abs/2401.01335   Source : arxiv]&lt;br /&gt;
&lt;br /&gt;
[https://github.com/uclaml/SPIN  Source : GitHub]&lt;br /&gt;
&lt;br /&gt;
[https://verl.readthedocs.io/en/latest/algo/spin.html   Source: verl]&lt;br /&gt;
&lt;br /&gt;
[[Catégorie:Publication]]&lt;/div&gt;</summary>
		<author><name>Patrickdrouin</name></author>
	</entry>
</feed>