想象一(yī)下,星团、星云和其他星际现象都是由计算机(jī)在无人监督的情况下凭空生(shēng)成的(de)。这听起(qǐ)来可(kě)能像是对未来(lái)全息技术的描(miáo)述,但是爱丁堡大学感知(zhī)研究所(suǒ)和(hé)天(tiān)文学研(yán)究所的研究(jiū)人员,就在人工智能的帮助下设计了这(zhè)样一(yī)个系统。
研究人员描述了一种人工智能模型(xíng),该模型(xíng)能够生成合成星系的高分(fèn)辨率图像,这些图(tú)像遵循(xún)了真实的星系分布。
“21世纪的天(tiān)文学发现(xiàn)自己拥有(yǒu)大(dà)量数据(jù),大部分数据在捕(bǔ)获(huò)时会被过滤掉,以节省内存(cún)存储,”他们写道。“对于深度(dù)学习等现代技术来说,进(jìn)入这一(yī)领域的时机已经(jīng)成熟。星系在(zài)这类应用中起了关键作(zuò)用,我们探索了利用人工智能来生成星系图像的可能性。”
该团队机器学习架(jià)构的核心是生成对抗性网络(GAN)——由(yóu)生成样(yàng)本(běn)的生成(chéng)器和(hé)试(shì)图区分(fèn)生成样本和真实样本的鉴别器组成的两部分神经网络。将GAN描述(shù)为AI算(suàn)法中的“神(shén)童”并不夸张(zhāng);它们被用来(lái)发现新(xīn)药,制作(zuò)令人信服(fú)的汉堡和(hé)蝴蝶照片,甚至生(shēng)成脑癌(ái)的人(rén)工扫描图。
这一星系(xì)生(shēng)成系统由两(liǎng)个五(wǔ)层GANs组成:阶段一GAN和阶段二GAN。第一个生成(chéng)低分辨率图像(64x64像素),而(ér)第(dì)二个使(shǐ)用一种叫做超分辨率的技术将它(tā)们转换(huàn)成高分辨率图像(128x128像(xiàng)素)。研究人员(yuán)指出(chū),在实际(jì)过程中,阶段二(èr)GAN会自我填(tián)充(chōng)缺失的像素,更加(jiā)注重现实性而非(fēi)准确性。
为了(le)“鼓励(lì)”阶段二GAN中的生成器生成类似(sì)于放(fàng)大实像对应物的(de)合成星系图像(xiàng),该论文作者引入了一个“双目标(biāo)函数”,该函数计算了分辨率增强图像和实像之间(jiān)的误差标准。其结果是(shì)生(shēng)成了大(dà)量保留星(xīng)系“更稀有”特征的样(yàng)本,如(rú)旋臂。
研究人员使用(yòng)英伟达GTX 1060 GPU在PC上训练人(rén)工智能系统(tǒng),并为其提供来自Galaxy Zoo 2数据集的恒星和行星体的全色(sè)图像,Galaxy Zoo 2是(shì)一个众(zhòng)包天(tiān)文学(xué)项目。他们在评(píng)估结果时考虑了四个属性:椭圆度,或偏离圆形度的程度(dù);与(yǔ)水平面(miàn)的(de)仰角;总流量;以(yǐ)及(jí)半(bàn)长轴(zhóu)(椭(tuǒ)圆最(zuì)长(zhǎng)直径的(de)一半)的(de)尺寸测量。
在(zài)论文的最(zuì)后,研(yán)究人员(yuán)写道,该(gāi)模型(xíng)生成了(le)非常类(lèi)似真实(shí)星系“物理真实”的图像。他们(men)认为,这一系统(tǒng)可以被用来扩充真实样本的(de)数(shù)据库,实(shí)际上这也是深度学(xué)习模(mó)型的数据(jù)源(yuán)。
“能够创建物理真实的星系图像生(shēng)成模型有许多实际用途,”他们写道。“我们的工作展示了GAN架(jià)构作为现(xiàn)代天文学宝贵工具的潜力。”