AI人工智能

智谱开源AI文生图模型CogView4

2025-03-04  本文已影响0人  小辣椒高效Office

智谱开源AI文生图模型CogView4


CogView4的发布标志着中文AI图像生成技术的重大突破,其开源策略与技术普惠理念将加速AI在广告、教育、娱乐等领域的落地。通过支持汉字生成、灵活的分辨率适配及高效的训练框架,CogView4不仅填补了中文开源文生图模型的空白,也为全球开发者提供了低成本、高灵活性的创新工具

该模型有60亿参数,支持原生中文输入和中文文本到图像生成。其主要更新在于,CogView4可以理解中英文双语提示词,且将中英文字符融入图像之中,并支持上百字复杂提示词输入。

与CogView3-Plus-3B相比,CogView4的提示词长度上限从224 Tokens增加到了1024 Tokens

添加图片注释,不超过 140 字(可选)

CogView4在文生图基准测试DPG-Bench中综合评分排名第一。

目前,CogView4-6B-0304版本已经开源,将于3月13日上线智谱清言(chatglm.cn)。

这也是是首个遵循Apache 2.0协议的图像生成模型,后续智谱会陆续增加ControlNet、ComfyUI等生态支持,并即将推出全套的微调工具包。

添加图片注释,不超过 140 字(可选)

GitHub地址:

https://github.com/THUDM/CogView4/blob/main/README_zh.md

 

上一篇 下一篇

猜你喜欢

热点阅读