0%

2025-01-15-insights

MiniMax-01: Scaling Foundation Models with Lightning Attention

今天的顶流,还得是MiniMax-01: 作者搞了个400B,激活45B的MoE模型,VL和Textonly两个版本。尤其是把context搞到了4M。

大家都在年前冲业绩……