1.58-bit FLUX
量化的风吹到了flux……作者搞了个[-1,0,1]那套量化措施的flux模型,发现在省了5倍内存的同时,效果不怎么掉。
OS-Genesis: Automating GUI Agent Trajectory Construction via Reverse Task Synthesis
zhiyong老师新出的一个工作,作者发现自顶向下构造query的方式,很难scaling,依赖于先有很多多步的任务。作者想到另外一种方案,能不能让一个agent在电脑里随机游走,然后用另一个rm来判断游走出来的数据是一个真实query的概率有多大?筛出来好的数据,由此产生一大堆多步sft数据。作者发现这样搞,效果还不错