“o4-mini”に匹敵！？｜OpenAIのOSSモデル”gpt-oss”を試す

Aru

2025年8月5日にOpenAIからオープンウェイトのAIモデル”gpt-oss”が発表されました。同日、LM Studioも0.3.22にアップグレードされ、gpt-ossに対応したため、早速使ってみました。

Contents

gpt-ossとは

“gpt-oss”は、OpenAIが発表したオープンウェイトの大規模言語モデルです［公式リリース］。

モデルは、1,170億パラメータのgpt-oss-120bと、210億パラメータのgpt-oss-20bがあります。これらはダウンロードすればローカルで動作させることができ、gpt-oss-20bは16GBのメモリで動作するとされています。

MacBook Air（M2, 16GB）では、そのままではダウンロード画面に「モデルが大きすぎる」警告が出ました。Macの場合、24GBか32GBくらいはメモリが必要そうです。

また、同日LM Studioもgpt-ossをサポートしたバージョン（0.3.22）の提供を開始しました。

gpt-oss-120bのサイズが63.39 GB、gpt-oss-20bのサイズが12.11 GBということで、どちらのモデルも手持ちのMacBook Pro（M4 Max 128GB）で動作しそうだったので、早速試してみました。

モデルも手持ちのMacBook Pro（M4 Max 128GB）で動作するようなので早速試してみました。

コンテストでは、生成AIの使用は禁止されていますので注意してください（AtCoder生成AI対策ルール – 20250718版）

私は、過去問を解く時に生成AIと同時に解いて競争しています（笑）

リンク

公式ページによると、gpt-oss-120bとgpt-oss-20bのモデルサイズ等は以下の通りです。

MoE（Mixture-Of-Experts）モデルで、一度にアクティブになるパラメータ数がそれぞれ51億、36億と小さいのが特徴で、高速な動作が期待できます。エキスパートが128、32と多いのもポイントかもしれません。

LM Studioでダウンロードしたモデルをみると、以下のような表示になります。MXFP4というのも独自の量子化手法のようです。モデルもgpt-ossと独自です。

gpt-oss-120b

チャット品質や性能に関してはYouTubeなどで様々な動画が出ているため、この記事では、MacBook Proでの動作速度について、実際に動かした結果を報告したいと思います。

手持ちのMacBook Proは、M4MAX, 128GBのモデルになります。一応、MacBook Proとしては最大までメモリを搭載しているモデルです。

PCスペック： MacBook Pro（M4MAX 128GB）

モデル設定：

コンテキストサイズ128K
Reasoning EffortはLow, Mid, Highの３設定
Reasoning Effortは、推論の深さを設定するパラメータです。Highにすると長考するようになります。

ロードすると12GB弱のメモリを使います。16GBのモデルでもギリギリ実行できるレベルかもしれません。

80tok/秒は、このサイズのモデルの中ではかなり高速です。Qwen3-30B-A3Bと同等の印象を受けました。メモリ使用量も少ないため、LM Studioを常時起動しておいて、使いたい時にすぐに使うといった使い方が可能だと感じました。

応答速度も高速なので、ローカルLLMとしては使いやすいと感じます。

会話を続けたり、プロンプトとして与えるテキストの量が多くなると速度は低下します。私が使った範囲では、50tok/秒程度は維持している印象でした。

なお、いくつかのAtCoderの問題を解かせてみましたが、実力的にはQwen3-30B-A3Bと同程度だと感じます。ABC問題の難しめの問題に関しては、惜しいところまでいくものの、あと一歩及ばない回答を出力する傾向がありました。

ロードすると約80GBのメモリを使用します。他のアプリケーションも実行している私の環境では、ロードすると10GB程度しかメモリが残りませんでした。