Imagen – Google Research

Google Brain team 推出的文本到图像生成模型，具有前所未有的写实主义程度和深度的语言理解。

我们提出了Imagen，一个文本到图像的扩散模型，具有前所未有的写实主义程度和深度的语言理解。Imagen建立在理解文本的大型变压器语言模型的基础上，并依赖于在高保真图像生成中扩散模型的强度。我们的关键发现是，在纯文本语料库上进行预训练的通用大型语言模型(例如T5)在编码用于图像合成的文本方面惊人地有效:在Imagen中增加语言模型的大小比增加图像扩散模型的大小更能提高样本保真度和图像-文本对齐。

数据统计

特别声明

本站AI工具导航提供的Imagen – Google Research来源于网络，不保证外部链接的准确性和完整性，同时，对于该外部链接的指向，不由AI工具导航实际控制，在2023年4月10日下午6:33收录时，该网页上的内容，都属于合规合法，后期网页的内容如出现违规，可以直接联系网站管理员进行删除，AI工具导航不承担任何责任。

AI工具导航致力于优质、实用的AI网站资源收集与分享！本文地址 https://www.aig123.com/sites/408.html