
Microsoft は、深く構造化された推論をサポートできる、Phi-4-reasoning plus と呼ばれる 140 億パラメータの高密度デコーダ専用の Transformer モデルをリリースしました。
このモデルは、合成および Web ベースのデータセットから抽出された 160 億のトークンを使用してトレーニングされ、ベンチマーク テストのパフォーマンスが向上しました。
さらに、サイズは小さいが精度が高い、DeepSeek R1 のような大型のオープンウェイト モデルよりも優れた性能を発揮しました。


コメント