《花雕学AI》03:我最早接触的人工智能应用,还是要从AI绘画说
AI绘画是指利用人工智能技术,根据输入的文本或图片,生成逼真或有创意的图像的过程。AI绘画有很多不同的软件和平台,可以让用户体验到AI的魅力和趣味。
AI绘画的历史可以追溯到上世纪70年代,当时一位艺术家哈罗德·科恩开发了一个电脑程序AARON,可以进行绘画创作。4 随着计算机技术和深度学习的发展,AI绘画也出现了很多突破和创新,例如Google的DeepDream,OpenAI的DALL-E,以及最近火爆的Stable Diffusion和Disco Diffusion等。
我偶然接触到的AI绘画,是在ModelScope平台(https://modelscope.cn/home)上发现的,然后不经意就会简单使用了。

ModelScope是一个开源的模型即服务共享平台,旨在为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单。ModelScope基于“模型即服务”的概念,将AI社区中最先进的机器学习模型集成在一起,并简化了在实际应用中利用AI模型的过程。ModelScope的核心库提供了接口和实现,让用户可以轻松地加载、调用、优化和部署各种AI模型。ModelScope还提供了一个在线的社区平台,让用户可以在线体验、下载和分享各种AI模型,包括NLP、CV、Audio等多领域的SOTA模型,以及行业领先的多模态大模型。如果你想了解更多关于ModelScope的信息,你可以访问官方网站或者GitHub仓库,或者加入ModelScope魔搭社区,与其他AI爱好者交流和学习。
ModelScope有以下一些优势:
1、它是开源的,这意味着任何人都可以免费使用、修改和贡献ModelScope的代码和模型。
2、它是灵活的,它支持多种深度学习框架,例如PyTorch、TensorFlow等,让用户可以根据自己的喜好和需求选择合适的框架。
3、它是易用的,它提供了简单的Python SDK,让用户可以用一行代码实现模型推理,或者用十几行代码实现对预训练模型的调优训练。
4、它是低成本的,它提供了免费的GPU计算资源,让用户可以在云端运行各种AI模型,无需担心硬件限制或成本问题。
5、它是共享的,它提供了一个在线的社区平台,让用户可以在线体验、下载和分享各种AI模型,促进了AI知识和技术的传播和交流。
同时ModelScope也有以下几点劣势:
1、它是新兴的,它目前还处于开发阶段,可能存在一些bug或不稳定的情况,需要不断完善和改进。
2、它是有限的,它目前还不能涵盖所有的AI领域和任务,需要不断扩充和更新模型库,满足更多用户的需求。
3、它是依赖的,它目前还依赖于Google Colab或者ModelScope魔搭平台来运行模型,需要用户有一定的网络条件和账号权限,可能存在一些使用障碍或限制。
下面让我们打开ModelScope的创空间,可以看到里面有许多项目。

找到AI作画项目,注册登录后就能使用了。这里示范案例输入:蒸汽朋克 半机械兔子,其他选择生成4张图,选择分辨率1024X1024,选择语言:自动选择,点立即生成后,大约一分钟前后,就可出图四张了

再点立即生成按钮,就会生成不同的四张图片,这说明了AI绘图不是从网上搜来的图片,而是人工智能根据输入的自然语言提示(这里是:蒸汽朋克 半机械兔子)自动生成的,是AI即时编出来的东东,呵呵。

遇到自己满意的AI绘图出图,可以在图片上点鼠标右键,选择在新的页面打开,这样就能得到大规格的图片(我使用32寸显示器)


下面试试输入英文提示,A man that is 65% African, 20% Chinese and 15% Mexican wearing alternative clothing, portrait, 35mm f/1.2,我使用谷歌和新必应分别翻译了一下。
谷歌翻译为:一个65%的非洲人,20%的中国人和15%的墨西哥人穿着替代服装,肖像,35mm f/1.2
新必应翻译为:一个65%非洲血统,20%中国血统,15%墨西哥血统的男人,穿着另类服装,肖像,35mm f/1.2

不到一分钟,出来四张图,选了二张输出大规格



重复点击生成按钮,又选出几张大规格图片



在AI绘图中,有个特别的注意事项,就是在同一自热语言提示中生成的图片,每次都是不一样的,也就是说每张图片都是一次性的独一无二,看中的图片需要马上保存下来,因为过后就永远没有了。
我修改了输入的自然语言提示:A 18-year-old girl who is 65% Native American, 20% Chinese and 15% Mexican, beautiful and elegant, smiling happily, wearing alternative clothing, portrait photography, 35mm f/1.2
翻译成中文:翻成英文 一个65%印第安血统,20%中国血统,15%墨西哥血统的十八岁女孩,美丽大方,开心微笑,穿着另类服装,肖像摄影,35mm f/1.2,输出图片


尝试又生成了几组图片,只能说是效果一般般,难得的是使用非常简单,有文字输入就会有输出结果。


输入简单的一行字:江南水乡,阳春三月,风景画,细致,8K





同样简单的提示:受中国古代建筑影响的古老法国村庄





复杂一些的提示:3d毛茸茸的小鹿,特写可爱可爱,可爱的圆形反光大眼睛,长长的模糊毛皮,皮克斯渲染,不真实的引擎电影般流畅,复杂的细节,电影般的


下面附录了一些其他风格ModelScope的的AI作品供欣赏。










怎么样?通过上面这些实际案例,相信大家都能熟练掌握了吧!
