HunyuanWorld 1.0: Generating Immersive, Explorable, and Interactive 3D Worlds from Words or Pixels
hunyuan的新工作,主要是把他们之前的3d生成、mesh-gen、t2i这些能力合版统一了,提供了3d相关的各种服务
Meta CLIP 2: A Worldwide Scaling Recipe
meta的新工作,作者解决了一个clip领域scaling的问题:在多语言数据上训练clip,在英文上的效果反而比english-only的训练要差。作者设计了receipt来解决这个问题,让clip可以从多语言训练中受益
讲道理,llm领域好像就没有这个问题,一般训得多了就是好?