


2025年,故宮博物院迎來建院百年。
這一百年,是實物守護的百年——從戰(zhàn)火中南遷萬里護送國寶,到一代代匠人在紅墻內(nèi)對《五牛圖》的精心修復,守護的是文物之“身”,是文明賴以依存的有形載體。
這一百年,也是傳承方式不斷演進的百年。當時間的指針指向新的世紀,守護的命題已悄然延伸:在數(shù)字時代,如何讓凝固的歷史重新流動?如何讓沉默的文物再度“開口”?如何讓千年的文明真正走進下一代的心靈?
2025年12月29日,故宮博物院與火山引擎聯(lián)合推出的“聽寶貝說”AI互動播客,為這場百年守護提供了嶄新的答案。在技術(shù)的賦能下,AI讓文物“開口說話”,一場跨越時空的對話正在發(fā)生。
賦能
從“被動聽講”到“主動創(chuàng)造”
故宮的百年史,核心是守護。上世紀三四十年代那場世界文物保護史上罕見的壯舉——文物南遷,保護的是民族文化的根脈免于戰(zhàn)火。此后數(shù)十年,修復、整理、研究,無不是圍繞文物本體展開。
然而,真正的傳承,遠不止于將器物安全地陳列在玻璃柜中。文化的生命力,在于它能否在不同時代的人的心中激起回響,能否被理解、被講述、被再次創(chuàng)造。傳統(tǒng)的博物館教育,多以“關(guān)于文物”的第三方解說為主,觀眾與歷史之間,始終隔著一層知識的“玻璃”。
“聽寶貝說”項目的出現(xiàn),正在打破這層“玻璃”。項目精選30件院藏文物,依托火山引擎豆包大模型的技術(shù)能力,創(chuàng)造了一種前所未有的互動模式:用戶只需簡單跟讀,AI即可復刻其聲音,生成由用戶“親自配音”的文物故事視頻。孩子可以選擇成為“小歷史學家”或“小科普家”,用自己的聲音,讓金甌永固杯訴說家國祈愿,讓桐蔭仕女圖山子講述匠心巧思。
這次創(chuàng)新的核心突破在于,它實現(xiàn)了文化傳承從“教育解說”到“沉浸互動”的本質(zhì)進化。過去,知識是被告知的;現(xiàn)在,故事是被“扮演”和“經(jīng)歷”的。當孩子聽到自己的聲音化為文物的“自述”,一種深刻的情感連接與身份代入便自然發(fā)生。技術(shù)在此刻扮演的,不再僅僅是展示工具,而是移情的橋梁,讓千年之隔在聲音的共鳴中消弭。
磨合
當通用AI遇見垂直文博
合作過程,也是技術(shù)與人文深度碰撞、互相“培養(yǎng)”的過程。將前沿的AI互動技術(shù)與擁有六百年宮城史、百年院史的故宮相結(jié)合,本身就是一次充滿張力的挑戰(zhàn)。最大的難點,在于如何在故宮所代表的歷史嚴謹性與面向兒童所需的敘事趣味性之間,找到精準的平衡點。
對此,技術(shù)團隊面臨著多方面的挑戰(zhàn)。首先,是內(nèi)容生成的準確性。AI生成的每一句腳本,都必須經(jīng)得起歷史考據(jù)。這要求模型不僅要有強大的語言生成能力,更需在訓練中深度“學習”故宮提供的權(quán)威文物資料,確保輸出的故事框架扎實、細節(jié)無誤。其次,是互動體驗的自然度。兒童互動充滿不可預測性,AI需具備強大的上下文理解和靈活應對能力,使對話流暢自然,而非機械問答。此外,團隊還要考慮技術(shù)實現(xiàn)的普惠性。最終落地的H5產(chǎn)品需要足夠輕量化、易操作,讓任何用戶都能在幾分鐘內(nèi)完成聲音復刻與故事生成,技術(shù)復雜度必須隱藏于極致簡單的交互之后。
公開信息顯示,項目背后的豆包聲音復刻模型2.0,已從早期的聲線模仿,進化到具備深度語義理解和情感表達的能力。而豆包角色扮演模型,則負責賦予AI不同的講述人格。兩者的協(xié)同,通過扣子平臺進行智能體編排,最終實現(xiàn)了既生動又可控的文物敘事。
2025年中秋節(jié),雙方合作的AIGC視頻《故宮寶貝團圓夜》已讓文物在月夜下“動”了起來,完成了視覺上的活化。此次“聽寶貝說”則深入聽覺與交互層面,完成了從“活化”到“對話”的躍升。這兩次嘗試共同勾勒出一條清晰的路徑:AI技術(shù)正從文物展示的外圍工具,逐步走向文化闡釋與傳承的核心環(huán)節(jié)。
守護
讓百年回響成為未來啟蒙
從物理空間的“櫛風沐雨”,到數(shù)字世界的開拓創(chuàng)新,故宮的百年守護,其內(nèi)核始終如一:讓中華文明最好的遺產(chǎn),不僅存于廟堂,更活在當下,傳向未來。
此次AI播客項目,是故宮在“AI+文化”路徑上邁出的更深入一步。相比此前《故宮寶貝團圓夜》側(cè)重節(jié)日氛圍與視覺呈現(xiàn),“聽寶貝說”直接切入博物館的核心職能——知識的教育與傳播,探索如何將深奧的學術(shù)成果轉(zhuǎn)化為青少年喜聞樂見的形式。它解決的不僅是“如何讓文物活下去”的物理命題,更是“如何讓文物活起來”的文化命題。
面向未來,故宮博物院展現(xiàn)出積極擁抱技術(shù)的開放姿態(tài)。從早期的文物數(shù)字化采集,到數(shù)字展廳,再到如今的AI應用,每一個技術(shù)階段都有其探索身影。而“聽寶貝說”項目不僅在內(nèi)容層面探索了兒童文化教育的創(chuàng)新形式,更在技術(shù)層面驗證了“通用人工智能大模型”與“垂直專業(yè)領(lǐng)域”深度融合的可能性。這個過程,是技術(shù)適應文化領(lǐng)域嚴謹要求的再訓練,也是文化借助技術(shù)煥發(fā)活力的再表達。它證明了AI并非文博領(lǐng)域的闖入者,而是可以通過深度磨合,成為文化傳承的賦能者。
從“讓文物活起來”到“讓文物會說話”,再延伸到未來可能的“讓文物會交流”,這一演進過程體現(xiàn)了博物館傳播理念的持續(xù)升級。技術(shù)的每一次介入,都在拓展文化傳承的邊界,讓文物從靜態(tài)的展品,逐漸成為可互動、可對話、可共創(chuàng)的文化伙伴。這一轉(zhuǎn)變的深層意義在于,它讓文化傳承從單向的知識傳遞,轉(zhuǎn)變?yōu)殡p向的情感連接和價值觀認同,讓每個參與者都能在互動中找到自己的文化坐標。
未來
科技企業(yè)的文脈擔當
火山引擎與故宮的合作,也正是科技企業(yè)以創(chuàng)新技術(shù)履行文化傳承社會責任的生動縮影:用AIGC繪制“非遺百景圖”,讓傳統(tǒng)技藝可視化;與北京大學共建“識典古籍”平臺,讓數(shù)萬部古籍實現(xiàn)數(shù)字化閱覽與智能整理;利用數(shù)字活化技術(shù)復原古戲樓,打造“虛擬直播間”,讓傳統(tǒng)戲劇在數(shù)字空間重煥生機……每一次嘗試,都是對“技術(shù)如何賦能文化”這一時代命題的答卷。
而“聽寶貝說”項目,則意味著這條探索之路進入了更深的層次——從對文化遺產(chǎn)的數(shù)字化保存,轉(zhuǎn)向?qū)ζ鋬?nèi)在價值的創(chuàng)造性轉(zhuǎn)化與傳播。它試圖解決的,不僅是“如何讓文物活下來”,更是“如何讓文物所承載的精神活進下一代心里”。它象征著在技術(shù)時代,我們有了全新的工具去完成那場跨越千年的對話;象征著文化傳承,可以從單向的灌輸,變?yōu)殡p向的互動與共創(chuàng);更象征著,面向未來的兒童傳統(tǒng)文化啟蒙,可以如此自然、親切且充滿樂趣。
當冰冷的文物被賦予溫暖的聲音,當厚重的歷史通過游戲般的互動輕盈觸達童心,當古老文物借由最新技術(shù),在孩童耳畔發(fā)出專屬于他們的“新聲”時,我們看到的,不僅是一件創(chuàng)新產(chǎn)品的誕生,更是一條傳統(tǒng)與現(xiàn)代、文化與科技雙向奔赴、融合新生的路徑,是一根跨越百年的文化接力棒,正以一種前所未有的方式,被穩(wěn)穩(wěn)地傳遞下去。這或許就是科技賦予這個時代,最深沉也最動人的文化浪漫,是故宮的百年守護,正在AI的助力下,譜寫出“讓文物發(fā)聲,讓文明續(xù)寫”的嶄新篇章。(文/北京青年報記者 溫婧 實習生 趙涵萱)
(責任編輯:盧相汀)