世界通讯!最大CLIP!LAION发布CLIP的扩增定律
2022-12-22 15:45:09


(相关资料图)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

近日,LAION等机构在Reproducible scaling laws for contrastive language-image learning发布了CLIP的扩增定律(scaling law),其中最大的CLIP为ViT-H/14,基于LAION-2B数据集训练,可以在ImageNet1K数据集上到78.0%的zero-shot准确度,性能超过OpenAI目前开源的CLIP L/14,和Meta AI的FLIP Huge模型性能相当,但是模型已经开源在https://github.com/LAION-AI/scaling-laws-openclip。

论文的实验采用开源数据集LAION-400M和LAION-2B数据集,训练框架采用开源的OpenCLIP,所以论文的实验是可以复现的。训练在1520 NVIDIA A100 GPUs上进行,采用PyTorch DDP分布式训练策略,采用混合精度(但是fp16会不稳定,所以采用bf16,或者基于TF32的float32),训练的batch size在 86-88K之间。实验的总体结论是:扩增定律也明显适用CLIP,当扩增模型,训练数据和算力时,模型在下游任务上有一致性的提升。但是不同的训练数据集表现出不同的扩增系数:OpenCLIP的模型(基于LAION-2B数据集)在图文检索任务上有较大的扩增系数,而OpenAI CLIP模型(基于私有的WebImageText 400M数据集)在zero-shot分类任务上有较强的扩增系数。这个结论和FLIP的结论比较吻合,这说明训练数据集对CLIP的性能确实有比较大的影响。用论文结论的一句话来说就是:Scaling behavior depends on task type and pre-training dataset。更多内容可见论文:https://arxiv.org/abs/2212.07143

热门推荐

文章排行

  1. 2022-12-22世界通讯!最大CLIP!LAION发布CLIP的扩增定律
  2. 2022-12-22【独家焦点】让海口绿色发展 底色更亮成色更足
  3. 2022-12-21业务流程建模,细到几层?
  4. 2022-12-21天天关注:第八次青浦圆桌会议南陵峰会成功举办
  5. 2022-12-21天天信息:新华制药:感谢您的关心与支持!
  6. 2022-12-20明月镜片(301101):东方证券承销保荐有限公司关于明月镜片股份有限公司首次公开发行前已发行部分股份上市流通的核查意见
  7. 2022-12-20焦点快报!持续关注消费者具体需求,什么值得买用“礼物指南”解答“送礼难”
  8. 2022-12-20非遗“冀”忆丨方寸瓷盘雕出大千世界 视讯
  9. 2022-12-19全球热门:赫美集团(002356):独立董事提名人声明(李玉敏)
  10. 2022-12-19蓝帆医疗:公司生产线停工的主要原因是阶段停车检修、产能出清及部分地区疫情影响
  11. 2022-12-19中国联通:12月16日获融资买入1.88亿元,占当日流入资金比例17.5%
  12. 2022-12-18全球要闻:永利澳门(01128.HK)附属WRM获授予博彩批给
  13. 2022-12-17中国开放式公募基金三季度净销售超700亿美元-每日快看
  14. 2022-12-17天天新消息丨中通国脉(603559)12月16日主力资金净卖出210.02万元
  15. 2022-12-16天天即时看!新冠保险又现“理赔难” :从火爆到下架,“幸存”产品数量锐减门槛提高
  16. 2022-12-16平价挡不住中国海上风电大爆发_环球报道
  17. 2022-12-16光刻机(胶)板块12月15日涨1.28%,赛微电子领涨,主力资金净流出2879.1万元
  18. 2022-12-15环球热头条丨中旗新材: 关于特定股东减持股份的预披露公告
  19. 2022-12-15热点评!鹭燕医药:公司下属厦门燕来福制药有限公司、亳州市中药饮片厂从事中药饮片的生产和销售
  20. 2022-12-15环球短讯!变更合同价款的原则有哪些