當古代石碑上的字不完整,我們通常只能靠歷史學家一字一字地推敲、比對,耗時又困難。Google DeepMind 推出的 Aeneas 系統,試著用 AI 協助處理這些碎裂的拉丁銘文。它可以幫助學者修補破損文字、估算撰寫時間,甚至判斷地理來源。
研究中提到,Aeneas 的模型結合了文字資料和圖片,屬於一種「多模態生成神經網路」(Multimodal Generative Neural Network)架構。這表示它不只是看文字,還能從石碑圖像中學習格式和風格,用來判斷這段文字可能來自哪個地區、哪個年代。這樣的應用對於處理過去難以解讀的史料,提供了一種新的可能性。
(Source:Aeneas,下同)
歷史學者在處理銘文時,最常遇到的問題就是「缺字」,而且有時候連缺了幾個字都無法確定。這種情況被稱為「不確定長度的文本復原」(arbitrary-length restoration),過去幾乎只能靠經驗猜測。
Aeneas 模型的一個重要設計是,它能夠同時預測「缺了幾個字」和「可能的內容」,並透過上下文來做推測。這背後是語言模型中的「序列預測」(sequence prediction)概念,也就是根據前後語境來預測中間可能出現的字。研究結果指出,Aeneas 在這類復原任務中,即使在不知道缺字長度的情況下,準確率仍超過五成,顯示這項技術有實際應用的潛力。
除了補字,Aeneas 還能從資料庫中找出「平行文本」(parallel texts),也就是與目前碑文內容或格式相似的其他銘文。在歷史研究裡,這叫做「上下文比對」或「平行分析」,是用來建立歷史脈絡的一種方法。
Aeneas 的做法是將每段文字轉換成「向量表示」(embedding),再計算它和其他碑文的距離,從中找出最接近的幾筆資料。這不只是找類似句子,而是綜合了用語、風格、時間與地點的綜合比對。這樣的設計可以幫助學者省下大量比對資料的時間,也有助於發現過去未注意到的關聯。
這套系統實際測試過後的成果值得注意。研究團隊找來 23 位歷史學者,讓他們在沒有使用 AI 的情況下先做一次任務,再加入 Aeneas 的協助後重新進行比較。
結果發現,當學者可以參考 AI 提供的平行碑文和推測建議時,他們在「地點判斷」、「時間預測」以及「文字修復」這三個任務中的表現都顯著提升。這顯示人與AI的「協同合作」可以讓研究成果更可靠,也更有效率。比起單靠 AI 或單靠人力,兩者搭配能發揮更大的價值,這也為未來的學術合作模式提供了新的方向。
AI 的應用讓許多原本曠日費時的研究流程變得更快速,但它並不是要取代人類學者。Aeneas 模型的任務是「提供建議」,而非「給出結論」。歷史學的基本工作仍需要人來判斷、解釋,尤其是文化背景與語意變化。
研究中也指出,AI 模型的判斷主要根據已有資料,因此仍會受到資料偏誤的影響。這提醒我們,AI 是一種輔助工具,而不是最終答案。只要善用這些工具,學者可以把時間花在更關鍵的思考與詮釋上,讓歷史研究走得更遠,也更深入。
從補字、比對到定位時間與地點,Aeneas 展現了AI在歷史研究中的多種可能。它不是神奇魔法,也不是要取代人,而是一套能大幅提升研究效率與品質的輔助系統。透過語言模型與資料庫的整合,它能幫助學者從碎片中找出線索,從看似零散的文字中重建歷史的脈絡。這樣的技術應用,也提醒我們,人文研究並非排斥科技,而是可以善用科技工具,做出更扎實、更廣闊的分析。
未來,當資料越來越多、工具越來越成熟,AI 可能會是歷史研究最有力的搭檔之一。不過,科技再強,也仍需人來判斷、來解釋,才能真正理解歷史的意義。AI 負責「找出可能性」,人類負責「做出選擇」──這樣的分工,或許才是未來人文與科技真正的合作方式。
(首圖來源:AI 生成)
文章看完覺得有幫助,何不給我們一個鼓勵
請我們喝杯咖啡您的咖啡贊助將是讓我們持續走下去的動力
總金額共新臺幣 0 元 《關於請喝咖啡的 Q & A》 取消 確認(责任编辑:郭品超)
对于很多创业公司来说,这并不是好消息,但是对于内容创业者来讲是非常好的消息,因为我们第一次有一个覆盖面非常广泛的统一的平台,无论是在微信上还是在头条上,每个人都可以轻松做内容,而且流量分发的形式是...[详细]
这次,他是想搞一个将文人、学者、艺术家和有钱有闲的富人阶层连接起来的平台“让中国的富人受些文化熏陶”。...[详细]
因为他们可能有很好的用户口碑,掌握了一个相对稳定的市场,员工有比较好的职业荣誉感和美誉度,也学到了一些东西,但请注意一点,这类公司因为对资金没有太多渴求,创始人较少受到外部压力,会坚定按照自己的价值观...[详细]
” 目前,和百度联盟对接的风行网工作人员只有两名,而且还身兼数职,“百度联盟的生态体系已经非常成熟了,如果没有百度联盟,需要销售部门亲自去找广告客户,那会相当痛苦且低效&rd...[详细]
“小马过河”失败原因是什么? 从小马过河自身来说,公司确实存在经验不善的问题。...[详细]
接着,张兰在北京国贸的高档写字楼里,开了一家以川剧变脸脸谱为Logo的餐厅,这就是后来大家熟知的“俏江南”。...[详细]
“我当时那个年纪是非常积级主动的。...[详细]
抗战曾经是八年,现在是十四年,以后是几年要靠民主集中制决定...[详细]
王涛认为,今年是体育短视频行业塑形的一年,明年世界杯可能真正迎来爆发。...[详细]
正所谓有有阳光的地方就必会有阴影相伴。...[详细]