輪播

專(zhuān)訪(fǎng)騰訊云副總裁答治茜：大模型時(shí)代下，知識(shí)庫(kù)是企業(yè)的基礎(chǔ)設(shè)施

2025-10-27 22:12:46

在實(shí)體經(jīng)濟(jì)與數(shù)字經(jīng)濟(jì)日益融合的背景下，企業(yè)積極擁抱大模型，但金融行業(yè)因其特殊性，通用大模型難以滿(mǎn)足需求。騰訊云副總裁答治茜認(rèn)為，“大模型+企業(yè)知識(shí)庫(kù)”是AI落地最佳路徑，知識(shí)庫(kù)是企業(yè)的基礎(chǔ)設(shè)施，金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”安全性、準(zhǔn)確性要求高，更關(guān)注員工知識(shí)沉淀。他同時(shí)還分享了避免大模型“杜撰”的方法。

每經(jīng)記者｜潘婷每經(jīng)編輯｜陳旭

在實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)日益深度融合的大背景下，越來(lái)越多企業(yè)正積極擁抱大模型。不過(guò)，對(duì)于安全性、準(zhǔn)確性要求極高的金融行業(yè)來(lái)說(shuō)，通用大模型往往無(wú)法滿(mǎn)足其需求。

“在實(shí)際落地過(guò)程中，‘大模型+企業(yè)知識(shí)庫(kù)’成為AI落地的最佳路徑。”近日，騰訊云副總裁答治茜在接受《每日經(jīng)濟(jì)新聞》（以下簡(jiǎn)稱(chēng)NBD）記者專(zhuān)訪(fǎng)時(shí)坦言，金融機(jī)構(gòu)普遍面臨著知識(shí)孤島化、非結(jié)構(gòu)化數(shù)據(jù)海量、合規(guī)成本高企等知識(shí)管理的困境。

如何破解金融行業(yè)知識(shí)管理困境？金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”的關(guān)注點(diǎn)呈現(xiàn)怎樣的特點(diǎn)？如何看待大模型落地過(guò)程中出現(xiàn)的“杜撰”“錯(cuò)配”等現(xiàn)象？圍繞這一系列話(huà)題，答治茜為記者進(jìn)行了詳細(xì)的解答。

大模型是“大腦”，知識(shí)庫(kù)是“課本”

當(dāng)前，大模型技術(shù)正惠及千行百業(yè)，金融行業(yè)也在探索符合金融規(guī)律的AI（人工智能）知識(shí)庫(kù)建設(shè)路徑。AI知識(shí)庫(kù)作為連接數(shù)據(jù)、算法與場(chǎng)景的核心樞紐，是金融機(jī)構(gòu)實(shí)現(xiàn)“從技術(shù)到價(jià)值”轉(zhuǎn)化的關(guān)鍵抓手。

NBD：大模型時(shí)代，企業(yè)的“知識(shí)庫(kù)”扮演了什么角色？金融領(lǐng)域?qū)倌Ｐ秃屯ㄓ么竽Ｐ陀惺裁床顒e？

答治茜圖片來(lái)源：受訪(fǎng)者

答治茜：在大模型時(shí)代下，我們認(rèn)為知識(shí)庫(kù)是企業(yè)的一種基礎(chǔ)設(shè)施。大模型是“大腦”，知識(shí)庫(kù)是“課本”，大腦智力再高，如果沒(méi)有學(xué)習(xí)過(guò)相關(guān)的知識(shí)，也無(wú)法很好地解決問(wèn)題。

“通用大模型+專(zhuān)業(yè)領(lǐng)域知識(shí)庫(kù)”的研發(fā)類(lèi)似“大腦+課本”模式。首先，需要投入巨大資源訓(xùn)練一個(gè)“萬(wàn)事通”基座模型，或者直接采用市面上已有的效果最優(yōu)的模型，使其具備強(qiáng)大的語(yǔ)言理解、邏輯推理和代碼能力。然后，通過(guò)RAG（Retrieval-augmented Generation檢索增強(qiáng)生成）技術(shù)，為這個(gè)“通才”配備一個(gè)龐大的、實(shí)時(shí)更新的金融知識(shí)庫(kù)，如行業(yè)研報(bào)、公司公告、實(shí)時(shí)新聞、風(fēng)控規(guī)則等。這種模式的優(yōu)勢(shì)是靈活性高、迭代快、成本相對(duì)可控。

而“金融領(lǐng)域?qū)倌Ｐ汀钡难邪l(fā)類(lèi)似“科班出身”模式，從模型訓(xùn)練的第一天起，就使用海量且高質(zhì)量的金融領(lǐng)域私有數(shù)據(jù)進(jìn)行從零開(kāi)始的預(yù)訓(xùn)練，讓模型從“基因”里就深刻理解金融術(shù)語(yǔ)、市場(chǎng)邏輯和專(zhuān)業(yè)范式。

允許員工個(gè)人創(chuàng)建知識(shí)庫(kù)空間

對(duì)銀行、證券、保險(xiǎn)等企業(yè)的從業(yè)者而言，企業(yè)知識(shí)庫(kù)早已不是簡(jiǎn)單的文檔管理系統(tǒng)，而是承載著風(fēng)險(xiǎn)管控、合規(guī)審查、客戶(hù)服務(wù)等核心職能的“智能大腦”。

NBD：金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”的關(guān)注點(diǎn)呈現(xiàn)怎樣的特點(diǎn)？

答治茜：首先，金融行業(yè)對(duì)于知識(shí)庫(kù)安全與合規(guī)的要求更高。

由于金融行業(yè)監(jiān)管的特殊性，數(shù)據(jù)安全、監(jiān)管要求、信創(chuàng)適配等成為數(shù)字化建設(shè)底線(xiàn)。所以，為了更好滿(mǎn)足金融企業(yè)的需求，我們AI知識(shí)庫(kù)建設(shè)需要有更專(zhuān)業(yè)化的能力，比如精細(xì)化的多級(jí)權(quán)限管理體系、防泄露的頁(yè)面水印、嚴(yán)謹(jǐn)?shù)膶徲?jì)能力和內(nèi)容風(fēng)控體系等。

其次，金融行業(yè)對(duì)知識(shí)問(wèn)答準(zhǔn)確性和嚴(yán)謹(jǐn)性的要求極高。

金融是非常嚴(yán)謹(jǐn)?shù)男袠I(yè)，員工每天都在跟數(shù)字和知識(shí)打交道，所以知識(shí)內(nèi)容非常豐富，也很復(fù)雜，而且大家對(duì)于知識(shí)庫(kù)的期待很高，如希望多表格數(shù)據(jù)的計(jì)算、財(cái)報(bào)里多模態(tài)數(shù)據(jù)的解讀、銀行理財(cái)產(chǎn)品推薦等等，這對(duì)我們提出很大的挑戰(zhàn)。為此，我們專(zhuān)門(mén)在AI出圖、表格計(jì)算、知識(shí)溯源等方面下了很多功夫，并取得了階段性突破。

再次，金融行業(yè)更關(guān)注員工個(gè)人知識(shí)的沉淀。在與銀行、資管企業(yè)溝通過(guò)程中，我們發(fā)現(xiàn)很多金融企業(yè)非常希望員工個(gè)人的經(jīng)驗(yàn)知識(shí)能沉淀下來(lái)，把個(gè)人經(jīng)驗(yàn)變成企業(yè)知識(shí)。另外，我們發(fā)現(xiàn)很多金融企業(yè)員工日常需要的知識(shí)內(nèi)容也是有差異的，所以“個(gè)人知識(shí)庫(kù)”的概念今年被廣泛關(guān)注，我們?cè)谥R(shí)庫(kù)中設(shè)計(jì)了允許員工個(gè)人創(chuàng)建知識(shí)庫(kù)空間的功能，同時(shí)打通微信、騰訊文檔、企業(yè)微信等。

NBD：數(shù)據(jù)安全是企業(yè)發(fā)展過(guò)程中非常重要的環(huán)節(jié)，對(duì)于金融企業(yè)來(lái)說(shuō)尤其如此，您如何看待數(shù)據(jù)安全問(wèn)題？

答治茜：金融行業(yè)對(duì)于監(jiān)管、數(shù)據(jù)運(yùn)營(yíng)等有非常高的數(shù)據(jù)安全和隱私保護(hù)的要求。我們要從兩個(gè)方面思考：

一是技術(shù)和產(chǎn)品層面，從應(yīng)用到數(shù)據(jù)、算力等所有的基礎(chǔ)設(shè)施，要實(shí)現(xiàn)私有化部署和全鏈路的安全。

另一個(gè)層面是運(yùn)營(yíng)層面，綜合考慮管理和技術(shù)。比如說(shuō)金融機(jī)構(gòu)內(nèi)部某團(tuán)隊(duì)有兩三百人時(shí)，內(nèi)部如何協(xié)同、如何按層級(jí)劃分權(quán)限，哪些信息能讓哪些人看到，這就是管理要求，要滿(mǎn)足多級(jí)的授權(quán)管理。

如何避免幻覺(jué)：不亂說(shuō)、能溯源、有效管理知識(shí)

在使用AI助手咨詢(xún)某個(gè)問(wèn)題時(shí)，經(jīng)常得到錯(cuò)誤的回復(fù)，這種現(xiàn)象在AI圈被稱(chēng)為“幻覺(jué)”，“幻覺(jué)”問(wèn)題困擾著所有使用大語(yǔ)言模型的人。

NBD：個(gè)人使用大模型問(wèn)答的時(shí)候會(huì)出現(xiàn)一些杜撰錯(cuò)誤。如何看待大模型落地過(guò)程中出現(xiàn)的“杜撰”“錯(cuò)配”等問(wèn)題？

答治茜：ChatGPT出來(lái)后，我們就在思考大模型時(shí)代下行業(yè)會(huì)有什么樣的變化。2024年開(kāi)始，樂(lè)享就轉(zhuǎn)型聚焦做AI知識(shí)庫(kù)，目前在產(chǎn)品功能、問(wèn)答準(zhǔn)確性上應(yīng)該是比較領(lǐng)先的。

當(dāng)前大模型“杜撰”的情況還比較普遍，我認(rèn)為破解的關(guān)鍵在于三方面：答案模糊的時(shí)候拒答不亂說(shuō)、輸出能有效溯源、企業(yè)內(nèi)部知識(shí)實(shí)現(xiàn)有效治理（比如有效性和及時(shí)更新等）?？紤]到樂(lè)享定位為企業(yè)級(jí)知識(shí)庫(kù)，我們做了非常多的工作去提高準(zhǔn)確性。主要是以下幾方面：

第一，對(duì)文檔、知識(shí)進(jìn)行理解。我們自研OCR（Optical Character Recognition,光學(xué)字符識(shí)別）大模型，對(duì)復(fù)雜的圖文混排文檔解析準(zhǔn)確率提升30%以上。

第二，理解后按照一定的規(guī)則對(duì)文檔、知識(shí)進(jìn)行切片存儲(chǔ)。我們自研業(yè)界首個(gè)基于語(yǔ)義切分的模型，保障切分片段語(yǔ)義的完整性。

第三，當(dāng)用戶(hù)通過(guò)AI助手來(lái)問(wèn)答時(shí)，我們會(huì)結(jié)合上下文對(duì)用戶(hù)的問(wèn)題進(jìn)行理解后并改寫(xiě)，從而提升檢索精度。

第四，基于改寫(xiě)后的用戶(hù)問(wèn)題，使用向量檢索和關(guān)鍵詞檢索的混合檢索模式，找到最相關(guān)的內(nèi)容。

第五，上一步可能檢索到大量?jī)?nèi)容，但并非所有內(nèi)容都與問(wèn)題緊密相關(guān)，因此需要對(duì)這些內(nèi)容進(jìn)行重新排序與過(guò)濾。

第六，基于重排后的內(nèi)容調(diào)用大模型生成最終的答案。

經(jīng)過(guò)以上程序，目前我們的準(zhǔn)確率超過(guò)92%，我們會(huì)持續(xù)投入精力去提升準(zhǔn)確率。

封面圖片來(lái)源：受訪(fǎng)者

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán)，嚴(yán)禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線(xiàn)：4008890008

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

信邦智能：擬28.56億元購(gòu)買(mǎi)英迪芯微100%股權(quán) 構(gòu)成重大資產(chǎn)重組

返回每經(jīng)網(wǎng)首頁(yè)

下一篇文章

震?？萍加?jì)劃在浙江寧海投建人形機(jī)器人精密模組等項(xiàng)目，江蘇太倉(cāng)新能源汽車(chē)相關(guān)項(xiàng)目已終止

相關(guān)文章

熱文精選

點(diǎn)擊排行

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

99re6在线视频,a级国产乱理伦片在线观看,欧美亚洲免费,亚洲伊人久久大香线蕉影院,国产女精品视频在ktv,18禁黄色网站入口,成人一级毛片免费在线视频

專(zhuān)訪(fǎng)騰訊云副總裁答治茜：大模型時(shí)代下，知識(shí)庫(kù)是企業(yè)的基礎(chǔ)設(shè)施

大模型是“大腦”，知識(shí)庫(kù)是“課本”

允許員工個(gè)人創(chuàng)建知識(shí)庫(kù)空間

如何避免幻覺(jué)：不亂說(shuō)、能溯源、有效管理知識(shí)

專(zhuān)訪(fǎng)騰訊云副總裁答治茜：大模型時(shí)代下，知識(shí)庫(kù)是企業(yè)的基礎(chǔ)設(shè)施

大模型是“大腦”，知識(shí)庫(kù)是“課本”

如何避免幻覺(jué)：不亂說(shuō)、能溯源、有效管理知識(shí)