GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型 世界热议

来源:程序员客栈 2023-04-03 18:44:22


(资料图)

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/
x

热门推荐

港股生物医药股集体走强 康诺亚、科济药业涨超5%

2022-08

基石药业-B(02616.HK)涨幅扩大至11.11% 总市值57亿港元

2022-08

盲盒市场有望不再盲 建立健全企业质量保障体系

2022-08

海南推动农贸市场全面落实禁塑 加强违禁塑料制品源头治理

2021-12

柴犬登登拍卖记:动物是如何被司法拍卖的

2021-12

江西:到2025年鄱阳湖区断面水质优良比例达到50%以上

2021-12

西藏森林消防:锻造雪域救援尖兵 打造高海拔山岳救援队伍

2021-12

加强人才融通发展 第10届海峡两岸水利青年工程交流营成功举办

2021-12

四川:空手夺刀救人的“95后”女民警捐献万元奖金传递爱心

2021-12

中国食品名市临沂坚持“三化融合” 争做“食安”守望者

2021-12

推荐阅读

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型 世界热议

2023-04

环球快消息!破发股中红医疗跌3.69% IPO募20亿元海通证券赚1亿

2023-04

教育部要求各地打通政策堵点 加快非学科类培训机构审批登记工作-世界通讯

2023-04

环球报道:同日,两品牌终止与张继科合作

2023-04

环球播报:中国红楼梦学会副会长俞晓红:研究红楼梦需要开放包容的心态|封面专访

2023-04

【世界速看料】和讯个股快报:2023年04月03日 恒久科技(002808)14:41分,股价快速拉升

2023-04

月亮圆缺是怎么产生的_月亮圆缺 当前消息

2023-04

全球热点!4面锦旗4个故事 赤壁春日里最美“警”色

2023-04

【报资讯】中金公司:美国经济下行周期仍未结束 未来或是“滞胀”

2023-04

奥飞数据拟收购成都万达电子

2023-04