国产免费一级精品视频|久久久久亚洲日日精品|虎白女粉嫩在线播放网站|国产亚洲精aa在线观看|国产在线欧美一区二区三区|国产免费av片无码免费看|一夲道无码人妻精品一区二区|人妻少妇精品无码一区二区三已

微軟亞洲研究院與首都師大合作開(kāi)發(fā)甲骨文校重助手Div

2022-11-28 14:00 來(lái)源:環(huán)球網(wǎng) 閱讀數(shù):1324

【環(huán)球網(wǎng)科技綜合報(bào)道】甲骨文是迄今為止中國(guó)發(fā)現(xiàn)的年代最早的成熟文字系統(tǒng),對(duì)中國(guó)歷史乃至世界文化的發(fā)展研究具有非凡意義。因?yàn)槭詹亍⒘鬓D(zhuǎn)的緣故,大部分的甲骨都留下了多張拓本圖像,被稱為“重片”。甲骨重片數(shù)量繁多,效果互有參差,對(duì)其整理成為了一項(xiàng)重要的基礎(chǔ)性研究工作,稱作“校重”。然而,人工校重只能一一對(duì)照,費(fèi)時(shí)費(fèi)力,是甲骨文研究的一大痛點(diǎn)。

近期,微軟亞洲研究院主管研究員武智融與首都師范大學(xué)甲骨文研究中心莫伯峰教授團(tuán)隊(duì)合作開(kāi)發(fā)甲骨文校重助手Diviner,第一次將自監(jiān)督 AI 模型引入到甲骨文“校重”工作中,大幅提升了甲骨文校重工作的效率。

這項(xiàng)研究系統(tǒng)窮盡比對(duì)了18萬(wàn)幅拓本,輔助甲骨學(xué)家在上百個(gè)甲骨文數(shù)據(jù)庫(kù)中發(fā)現(xiàn)了大量甲骨重片,不僅復(fù)現(xiàn)了專家過(guò)去所發(fā)現(xiàn)的數(shù)萬(wàn)組重片,而且經(jīng)過(guò)初步整理,已發(fā)現(xiàn)了三百多組未被前人發(fā)現(xiàn)的校重新成果,為甲骨文整理領(lǐng)域開(kāi)創(chuàng)了人工智能與人類(lèi)專家協(xié)作(AI+HI)的全新研究范式。

近兩年,不依賴人工標(biāo)注數(shù)據(jù)的自監(jiān)督學(xué)習(xí)是 AI 研究的熱門(mén)方向,但很多前沿技術(shù)仍停留在研究階段。武智融表示,“盡管自監(jiān)督研究熱度很高,但是很多問(wèn)題最終還是要通過(guò)人工數(shù)據(jù)標(biāo)注來(lái)解決。我們一直希望使用完全無(wú)標(biāo)注的數(shù)據(jù)進(jìn)行自監(jiān)督學(xué)習(xí),甚至是人工根本上無(wú)法標(biāo)注的數(shù)據(jù)。甲骨文校重需要兩兩比對(duì)十八萬(wàn)張數(shù)據(jù)庫(kù)中的所有拓片,這為基于完全無(wú)標(biāo)注數(shù)據(jù)的自監(jiān)督學(xué)習(xí)模型應(yīng)用提供了一個(gè)絕佳的落地場(chǎng)景。”

據(jù)介紹,計(jì)算兩張拓片的視覺(jué)相似度,通常的方法會(huì)從全局特征出發(fā)。然而,在甲骨文的研究中,即使是重片,外觀上也可能有很大差異,這是由于拓印范圍、拓印方式、磨損等多方面原因造成的??紤]到一塊完整的甲骨可能會(huì)碎裂成多片,校重時(shí)經(jīng)常需要從大骨片中找出小骨片。因此,基于全局外觀表示的傳統(tǒng)方法并不能很好地發(fā)揮作用。面對(duì)這一挑戰(zhàn),研究員想到了甲骨拓片的特性,因其是從同一塊甲骨而來(lái),重片之間存在著精確的點(diǎn)與點(diǎn)的對(duì)應(yīng)關(guān)系。基于這一特性,校重助手 Diviner 從局部尋找匹配關(guān)系,再拓展到全局。

其中,在局部匹配方面,Diviner 使用的局部描述符是經(jīng)過(guò)自監(jiān)督訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò),模型應(yīng)用了對(duì)比學(xué)習(xí)的自監(jiān)督技術(shù),使用圖像增強(qiáng),讓特征在訓(xùn)練時(shí)不受甲骨拓片上清晰度、對(duì)比度、噪音、旋轉(zhuǎn)等因素的影響。在甲骨圖像上訓(xùn)練的局部描述符能夠檢測(cè)和匹配局部塊之間的關(guān)鍵點(diǎn),并進(jìn)行點(diǎn)對(duì)點(diǎn)匹配。

隨后在全局優(yōu)化方面,基于密集的點(diǎn)與點(diǎn)的匹配結(jié)果,通過(guò)使用魯棒的優(yōu)化算法 RANSAC 估計(jì)全局的幾何仿射變換,仿射變換允許模型在內(nèi)容重復(fù)的情況下拼合或拼接已有圖像,這種局部到全局的方法對(duì)檢測(cè)大量的甲骨碎片至關(guān)重要。

值得一提的是,Diviner 模型一個(gè)特點(diǎn)是具有強(qiáng)大的泛化能力,這歸功于其自監(jiān)督學(xué)習(xí)的匹配算法。模型通過(guò)圖像增強(qiáng)技術(shù)模擬同一塊甲骨在不同時(shí)期制作成拓片或者因年深日久造成的圖像變化,例如磨損、模糊等。在大規(guī)模無(wú)標(biāo)注數(shù)據(jù)上獲取的密集的自我監(jiān)督,比稀疏的基于整體的人工監(jiān)督更有效。

此外,Diviner 模型另一個(gè)特點(diǎn)在于能夠精確地預(yù)測(cè)出重片之間點(diǎn)對(duì)點(diǎn)的對(duì)應(yīng)關(guān)系,并將重片拼合或拼接在一起。這種可以被專家快速解讀的結(jié)果大大方便了人類(lèi)與人工智能的協(xié)同合作。對(duì)于甲骨文這樣的科學(xué),人機(jī)合作尤為重要。在校重結(jié)果中,專家可以看到局部匹配細(xì)節(jié)和重疊圖,極大地幫助并加速了他們驗(yàn)證的過(guò)程。

針對(duì)該項(xiàng)研究,莫伯峰表示,“甲骨學(xué)是一個(gè)系統(tǒng)性的科學(xué),一方面它是一種語(yǔ)言文字研究資料,另一方面它是一種歷史研究資料,其研究涉及方方面面,研究者需要了解文字在古代的形、音、義等等,因此我們解決一個(gè)問(wèn)題也要從不同維度探討。此次與微軟亞洲研究院的合作只是甲骨文和人工智能交叉研究的一個(gè)小序幕,推開(kāi)了甲骨學(xué)研究的一扇新大門(mén),為后續(xù)的研究起到了示范作用。未來(lái),人工智能與古文字研究的結(jié)合將具有更廣闊的前景?!?

武智融表示,“我們很高興看到人工智能模型 Diviner 能夠?yàn)榧坠菍W(xué)專家節(jié)省用于甲骨文數(shù)據(jù)整理的時(shí)間,讓他們更專注于其他方面的研究。甲骨文是兼具象形圖像屬性和文字屬性的神秘語(yǔ)言,多模態(tài)的人工智能在甲骨文研究上有著廣闊天地。未來(lái),我們希望能夠與甲骨文專家一起探索更多有趣的課題?!?

0.079175s