神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)
神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)
2024-06-29 03:35:21  作者:牵迩左手  网址:https://m.xinb2b.cn/know/xdx442583.html

既然你诚心诚意的发问了,我们就大发慈悲的告诉你!

为了防止世界被破坏,为了守护世界的和平,贯彻爱与真实的邪恶,可爱又迷人的反派角色....

听到这段台词,相信很多朋友都会不由自主地接上一句.......

我们是穿梭在银河的火箭队!白洞!白色的明天在等着我们!

就这样~喵~

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(1)

没错,它就是《神奇宝贝》中火箭队每次出场都让人忍不住发笑的经典台词。

1997年上映的《神奇宝贝》已经陪伴了我们二十年之久,给不少80、90后的童年留下了美好的回忆,尤其是那800多只宠物小精灵。

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(2)

会放电的皮卡丘、经常酣睡的妙蛙种子、不好惹的小火龙,还有喵喵、超梦、可达鸭。

这些可可爱爱又奇奇怪怪的动漫小精灵让人记忆犹新,相信很多人小时候都幻想过拥有一支属于自己的精灵宝贝。

最近,一位名为Matthew Rayfield的程序员就满足了自己的愿望。他用《神奇宝贝》中的788只动漫形象作为原型,通过AI生成了3000个全新的宠物小精灵。

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(3)

而这个AI正是自然语言模型GPT-2.

GPT-2:「精灵制造机」

提到NLP模型,我们印象最深的可能是GPT-3。今年该模型因1750亿超大参数量和超强应用,在各大媒体平台频频刷屏。GPT-2,与GPT-3师出同门,都是OpenAI研发的自然语言处理模型,两个模型最大的不同是它的参数量,GPT-2仅为15亿。

但这并不影响它的应用范围。与GPT-3类似,GPT-2也可以用来写故事、画图表,或者玩国际象棋。

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(4)

最近Rayfield受到GPT-2在国际象棋和民间音乐上应用的启发,也想来搞点不一样的事情。

他突发奇想决定用GPT-2来生成全新的宠物精灵形象,结果效果还不错。Rayfield从3000个生成图像中挑选出了6个,如图:

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(5)

emm...看起来,小精灵原型还不错,但就是清晰度太差。Rayfield又邀请了业内知名动漫设计师雷切尔•布里格斯(Rachel Briggs)来帮他完成这些精灵的“重绘”工作。

最终,基于GPT-2生成的原型,这些宠物小精灵就变成了这样:

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(6)

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(7)

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(8)

感觉第二个和第六个可以直接成为《神奇宝贝》的一员了,你觉得呢?

Rayfield简单介绍了他利用GPT-2创建这些精灵的实现过程。大致就是:搜寻了788张小精灵图片(均为64x64像素)作为数据源,然后:

将图像转换为基于文本的格式。

用输入文本训练GPT-2模型。

使用经过训练的模型生成图像。

将基于文本的图像格式转换为PNG。

在这个过程中也出现了一些问题。比如在文本格式转换时,出现了很多嘈杂的像素,因此最终调整成了如下格式。

不过,用文字训练GPT-2的过程还相对简单,最棘手的环节是通过代码将输出结果变成规范化的图像格式。这部分代码Rayfield已将其在GitHub开源,感兴趣的朋友可以了解一下。

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(9)

github/MatthewRayfield/pokemon-gpt-2

Image GPT:语言模型处理图像任务

需要说明的是,上述Rayfield用GPT-2语言模型来学习图像表征的方法,早已被OpenAI验证。

无监督和自监督的学习,或没有人为标记的数据的学习,在自然语言处理领域取得了令人瞩目的成功,因为像BERT、GPT-2、RoBERTa、T5 等 Transformer 模型,在广泛的语言任务中取得了最佳成绩,但同类的模型在图像分类任务中,不能生成较为有用的特征。

出于这一目的,OpenAI尝试利用GPT-2处理图像分类任务,以探究用 Transformer 模型在学习图像表征方面的可行性。

他们发现,当用展开成像素序列——被称为 iGPT(image GPT) 的图像来训练 GPT-2 模型时,模型似乎能够捕捉二维图像特征,并且能够在没有人类提供的数据标注下,自动生成各种逻辑连续的图像样本。实验结果如图:

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(10)

人类提供上半图(第一列),GPT-2自动补全下半图,右侧为原始图像

同时,该模型的特征在多个分类任务的数据集上也取得了不错的成绩,尤其是在 ImageNet 上取得了接近于最优的成绩,如下图。

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(11)

在自然语言处理中,依赖于单词预测的无监督学习算法(如 GPT-2 和 BERT)之所以成功,一个可能的原因是下游语言任务的实例出现在训练用的文本中。但相比之下,像素序列并不直接地包含它们所属的图像的标签。

而即使没有明确的监督,图像上的 GPT-2 仍然起作用。OpenAI研究团队认为其原因是足够大的 Transformer 模型,通过训练来预测下一个像素,最终它能够学会根据清晰可识别对象来生成具有多样性的样本。

神奇宝贝最好用的最强平民精灵(我用GPT-2创造了3000个宠物小精灵)(12)

他们采用一种通用的无监督学习算法—生成序列建模进行了测试。具体来说,他们在 ImageNet 上分别训练包含 76M、455M 和 1.4B 参数的 iGPT-S、iGPT-M 和 iGPT-L Transformer;还在来自 ImageNet 和互联网的图像的混合数据集上训练 iGPT-XL ——一个 68 亿参数的 Transformer。由于对长序列采用密集注意力(dense attention)的建模计算成本高,他们用 32x32、48x48 和 64x64 的低分辨率进行了训练。

最终实验结果表明,通过计算量来代替二维知识,以及通过从网络中选择的特征,序列 Transformer 可以与最优的卷积网竞争,实现无监督图像分类。此外,通过将 GPT-2 语言模型直接应用于图像生成的结果,也进一步表明由于其简单性和通用性,序列 Transformer 在足够的计算量下,有可能成为学习到不同领域的特征的有效方法。

更多OpenAI团队实验内容可参见论文:cdn.openai/papers/Generative_Pretraining_from_Pixels_V2.pdf

引用链接:

reddit/r/MachineLearning/comments/jyh0h4/p_generating_pokemon_sprites_with_gpt2/

matthewrayfield/articles/ai-generated-pokemon-sprites-with-gpt-2/

openai/blog/image-gpt/

雷锋网雷锋网雷锋网

  • 莲子银耳羹最简单的做法(银耳莲子羹立夏)
  • 2024-06-29银耳莲子羹立夏很久以前,日子都过得很慢,没有城市的喧嚣,没有人来人往的车速马龙,一生只够爱一个人,一整天也只够煲汤一小碗即将进入立夏的我们,是否准备好了迎接夏日的燥热,是否给自己心爱的人置办好了抗暑的良药呢?银耳莲。
  • 生死两茫茫故事(接连三人在深夜死亡)
  • 2024-06-29接连三人在深夜死亡本故事已由作者:眉似煤,授权每天读点故事app独家发布,旗下关联账号“深夜奇谭”获得合法转授权发布,侵权必究1今明市的夏季是由浸满热汗的背心,除不尽的霉菌,与过境的台风组成的罗春抵达今明市这一天,台风。
  • 女性理想体重计算公式和判断标准(女性152-176cm体重对照表)
  • 2024-06-29女性152-176cm体重对照表对于女性而言,都希望自己能够拥有完美的身材,这样能够提高自己的外在形象,身体也会变得更加健康其实大部分女性对于减肥特别的执着,而且采取的减肥方法也是比较多的,比如减肥药,节食,运动等女性减肥是希望自己。
  • 宫斗剧后宫角色的排名(英宫斗剧另一个波琳家的女孩)
  • 2024-06-29英宫斗剧另一个波琳家的女孩#玩的就是历史#从什么时候开始,贪婪不是一种罪恶,反倒成了一种美德玛丽·博林:我们是姐妹安妮·博林:所以我们从生下来就注定成为对手01开始当亨利八世因为皇后凯瑟琳生不出儿子对她不满的时候,托马斯·博林。
  • 鼻翼两侧不脱妆的方法(鼻翼两侧不脱妆的4个技巧)
  • 2024-06-29鼻翼两侧不脱妆的4个技巧在上妆之前,要做好保湿工作如果皮肤很干或者很油的话都很容易脱妆如果是皮肤爱出油,可以使用控油产品粉底干性皮肤最好选择粉底液,粉饼的话也最好湿用尤其是在秋冬容易浮粉的季节蜜粉这个很重要上完妆以后一定要扑。
  • 8090后玩具简单自制(8090后自制玩具每个人的儿时回忆)
  • 2024-06-298090后自制玩具每个人的儿时回忆【中外玩具网讯】遇烦心事的时候总是想起童年的快乐时光,想起小伙伴、简单的玩具,但离开家乡越久便觉越孤单,越长大越不安那些年玩过的玩具早已不见,但记忆不曾忘记,一起跟着中外玩具网小编回忆儿时的经典玩具吧。
  • 中式上衣搭配(你学会搭配了吗)
  • 2024-06-29你学会搭配了吗粉色的中式碎花小上衣,毛绒的针织温暖雅致,勾勒着女子的温婉与灵气,粉色调甜美又浪漫,清新的刺绣小碎花自然温润,妩媚生姿,古典深邃的民国风采,搭配墨绿色的半裙,别有情致,文艺浪漫的优雅情怀,将都市女人的。
  • 广电192号段什么手机可以用(继移动电信联通后)
  • 2024-06-29继移动电信联通后湖北日报记者邓云作为国内新晋的“电信运营商”,中国广电5G方面的布局一直备受关注9月27日上午,“广电5G 192业务规模商用”新闻发布会在宜昌举行,宜昌正式启动广电5G&n。
  • 剥壳的鸡蛋怎么保存(如何保存剥壳的鸡蛋)
  • 2024-06-29如何保存剥壳的鸡蛋冰箱冷藏,煮熟的蛋可以直接放入可密封的保鲜袋或保鲜碗中,放到冰箱3—7度的冷藏室存储3天左右,如还需保存更久,可以将鸡蛋剥壳后,加入盐等调味料煮制一下,利用其杀菌抑菌的作用延长其保鲜时间1个星期左右冷。
  • 小兵张嘎电视剧每一集的介绍(又到了放假季节)
  • 2024-06-29又到了放假季节这两年,很多抗日剧被观众吐槽,动不动就特效,或者主演技能太强大等,使得抗日剧都被称为神剧,“手撕鬼子”也成为横店的一道名菜据了解,一般喜欢看抗日剧的估计都是爸爸级的但是接下来说的这部剧,相信很多年轻人。