<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom">
  <channel>
    <title>Gemma on Yves Rougy - Expertise Linux &amp; Radiocommunications</title>
    <link>https://www.rougy.net/tags/gemma/</link>
    <description>Recent content in Gemma on Yves Rougy - Expertise Linux &amp; Radiocommunications</description>
    <generator>Hugo</generator>
    <language>fr-fr</language>
    <lastBuildDate>Tue, 07 Apr 2026 00:00:00 +0000</lastBuildDate>
    <atom:link href="https://www.rougy.net/tags/gemma/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>Les Benchmarks</title>
      <link>https://www.rougy.net/labo/ai/ai-bench/</link>
      <pubDate>Tue, 07 Apr 2026 00:00:00 +0000</pubDate>
      <guid>https://www.rougy.net/labo/ai/ai-bench/</guid>
      <description>&lt;h1 id=&#34;notes-brutes&#34;&gt;Notes brutes&lt;/h1&gt;&#xA;&lt;p&gt;ATTENTION CE N&amp;rsquo;EST PAS ENCORE UN BENCHMARK&lt;/p&gt;&#xA;&lt;h2 id=&#34;synthèse-dun-run-limité-à-50-tests&#34;&gt;Synthèse d&amp;rsquo;un run limité à 50 tests:&lt;/h2&gt;&#xA;&lt;p&gt;&lt;em&gt;Note to myself: le mauvais score de Gemma doit être dû à un mauvais formatage ou de mauvais paramètres, c&amp;rsquo;est pas cohérents sinon&lt;/em&gt;&lt;/p&gt;&#xA;&lt;table&gt;&#xA;  &lt;thead&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;th&gt;Modèle&lt;/th&gt;&#xA;          &lt;th style=&#34;text-align: right&#34;&gt;Quantisation&lt;/th&gt;&#xA;          &lt;th&gt;GSM8K&lt;/th&gt;&#xA;          &lt;th style=&#34;text-align: right&#34;&gt;Winogrande&lt;/th&gt;&#xA;          &lt;th style=&#34;text-align: right&#34;&gt;MMLU&lt;/th&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/thead&gt;&#xA;  &lt;tbody&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;Qwen 3.5 35B A3B&lt;/td&gt;&#xA;          &lt;td style=&#34;text-align: right&#34;&gt;Q4_K_S&lt;/td&gt;&#xA;          &lt;td&gt;88/86&lt;/td&gt;&#xA;          &lt;td style=&#34;text-align: right&#34;&gt;56&lt;/td&gt;&#xA;          &lt;td style=&#34;text-align: right&#34;&gt;68.32&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;      &lt;tr&gt;&#xA;          &lt;td&gt;Gemma 4 26 A4B&lt;/td&gt;&#xA;          &lt;td style=&#34;text-align: right&#34;&gt;Q4_K_XL&lt;/td&gt;&#xA;          &lt;td&gt;38&lt;/td&gt;&#xA;          &lt;td style=&#34;text-align: right&#34;&gt;52&lt;/td&gt;&#xA;          &lt;td style=&#34;text-align: right&#34;&gt;76.88&lt;/td&gt;&#xA;      &lt;/tr&gt;&#xA;  &lt;/tbody&gt;&#xA;&lt;/table&gt;&#xA;&lt;h2 id=&#34;gsm8k&#34;&gt;GSM8K&lt;/h2&gt;&#xA;&lt;h3 id=&#34;qwen-35-35b-a3b-en-q4_k_s&#34;&gt;Qwen 3.5 35B A3B en Q4_K_S&lt;/h3&gt;&#xA;&lt;p&gt;Test gsm8k avec Qwen 3.5 35B A3B en Q4_K_S&lt;/p&gt;</description>
    </item>
    <item>
      <title>La stack logicielle</title>
      <link>https://www.rougy.net/labo/ai/ai-stack/</link>
      <pubDate>Mon, 06 Apr 2026 00:00:00 +0000</pubDate>
      <guid>https://www.rougy.net/labo/ai/ai-stack/</guid>
      <description>&lt;h1 id=&#34;la-stack-logicielle&#34;&gt;La stack logicielle&lt;/h1&gt;&#xA;&lt;p&gt;Le matériel ne fait pas tout. Le choix du moteur d&amp;rsquo;inférence impacte directement les performances, la flexibilité et la facilité d&amp;rsquo;expérimentation. Voici comment ma stack a évolué.&lt;/p&gt;&#xA;&lt;h2 id=&#34;les-drivers&#34;&gt;Les drivers&lt;/h2&gt;&#xA;&lt;p&gt;La machine est sous Ubuntu 22.04.5 LTS avec les drivers 550.163.01 et Cuda 12.4&lt;/p&gt;&#xA;&lt;p&gt;Ce n&amp;rsquo;est pas un oubli de ma part, c&amp;rsquo;est pour avoir un système stable. Avec des drivers plus récents, j&amp;rsquo;ai régulièrement des plantages au niveau des drivers ou du système.&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
