Simon Willison's Weblogモデル・技術動向重要度:

IBM Granite 4.1 LLMファミリー発表とモデルサイズ別SVG生成実験

IBM Granite 4.1 LLMファミリー発表とモデルサイズ別SVG生成実験

要約

IBMが数日前にGranite 4.1 LLMファミリーをリリースした。このモデルはApache 2.0ライセンスで提供され、3B、8B、30Bの3つのサイズが用意されている。GraniteチームメンバーのYousaf Shahによる詳細な訓練プロセスの解説も公開されている。Unslothは3BモデルのGGUF量子化バリアントコレクションをリリースし、1.2GBから6.34GBまでの21種類のモデルファイルを提供している。これらすべてのファイルの合計サイズは51.3GBに達する。著者はこれを機に、以前から試したかった実験を実施した。同一モデルの異なるサイズの量子化バリアントに対して「自転車に乗るペリカンのSVG画像を生成して」というプロンプトを送り、結果を比較した。しかし実験結果は期待していたほど興味深いものではなく、サイズと品質の間に明確な関係性は見られず、すべてのバリアントで生成品質は低かった。

洞察・気づき

この実験は、LLMの量子化における興味深い側面を示している。一般的には、モデルサイズが大きいほど性能が良いと考えられがちだが、SVG生成のような特定のタスクにおいては、単純にサイズと品質が比例するわけではないことが確認された。これは、量子化技術の複雑さや、特定のタスクに対するモデルの適性が、単純なパラメータ数だけでは決まらないことを示唆している。IBM Granite 4.1のオープンソース化は、研究者や開発者にとって新たな選択肢を提供するものの、実際の活用においては用途に応じた慎重な評価が必要であることを物語っている。また、この種の体系的な実験は、モデル選択の指針となる貴重なデータを提供する。