2025-10-27 22:12:46
在實(shí)體經(jīng)濟(jì)與數(shù)字經(jīng)濟(jì)日益融合的背景下,企業(yè)積極擁抱大模型,但金融行業(yè)因其特殊性,通用大模型難以滿(mǎn)足需求。騰訊云副總裁答治茜認(rèn)為,“大模型+企業(yè)知識(shí)庫(kù)”是AI落地最佳路徑,知識(shí)庫(kù)是企業(yè)的基礎(chǔ)設(shè)施,金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”安全性、準(zhǔn)確性要求高,更關(guān)注員工知識(shí)沉淀。他同時(shí)還分享了避免大模型“杜撰”的方法。
每經(jīng)記者|潘婷 每經(jīng)編輯|陳旭
在實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)日益深度融合的大背景下,越來(lái)越多企業(yè)正積極擁抱大模型。不過(guò),對(duì)于安全性、準(zhǔn)確性要求極高的金融行業(yè)來(lái)說(shuō),通用大模型往往無(wú)法滿(mǎn)足其需求。
“在實(shí)際落地過(guò)程中,‘大模型+企業(yè)知識(shí)庫(kù)’成為AI落地的最佳路徑。”近日,騰訊云副總裁答治茜在接受《每日經(jīng)濟(jì)新聞》(以下簡(jiǎn)稱(chēng)NBD)記者專(zhuān)訪(fǎng)時(shí)坦言,金融機(jī)構(gòu)普遍面臨著知識(shí)孤島化、非結(jié)構(gòu)化數(shù)據(jù)海量、合規(guī)成本高企等知識(shí)管理的困境。
如何破解金融行業(yè)知識(shí)管理困境?金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”的關(guān)注點(diǎn)呈現(xiàn)怎樣的特點(diǎn)?如何看待大模型落地過(guò)程中出現(xiàn)的“杜撰”“錯(cuò)配”等現(xiàn)象?圍繞這一系列話(huà)題,答治茜為記者進(jìn)行了詳細(xì)的解答。
當(dāng)前,大模型技術(shù)正惠及千行百業(yè),金融行業(yè)也在探索符合金融規(guī)律的AI(人工智能)知識(shí)庫(kù)建設(shè)路徑。AI知識(shí)庫(kù)作為連接數(shù)據(jù)、算法與場(chǎng)景的核心樞紐,是金融機(jī)構(gòu)實(shí)現(xiàn)“從技術(shù)到價(jià)值”轉(zhuǎn)化的關(guān)鍵抓手。
NBD:大模型時(shí)代,企業(yè)的“知識(shí)庫(kù)”扮演了什么角色?金融領(lǐng)域?qū)倌P秃屯ㄓ么竽P陀惺裁床顒e?

答治茜 圖片來(lái)源:受訪(fǎng)者
答治茜:在大模型時(shí)代下,我們認(rèn)為知識(shí)庫(kù)是企業(yè)的一種基礎(chǔ)設(shè)施。大模型是“大腦”,知識(shí)庫(kù)是“課本”,大腦智力再高,如果沒(méi)有學(xué)習(xí)過(guò)相關(guān)的知識(shí),也無(wú)法很好地解決問(wèn)題。
“通用大模型+專(zhuān)業(yè)領(lǐng)域知識(shí)庫(kù)”的研發(fā)類(lèi)似“大腦+課本”模式。首先,需要投入巨大資源訓(xùn)練一個(gè)“萬(wàn)事通”基座模型,或者直接采用市面上已有的效果最優(yōu)的模型,使其具備強(qiáng)大的語(yǔ)言理解、邏輯推理和代碼能力。然后,通過(guò)RAG(Retrieval-augmented Generation檢索增強(qiáng)生成)技術(shù),為這個(gè)“通才”配備一個(gè)龐大的、實(shí)時(shí)更新的金融知識(shí)庫(kù),如行業(yè)研報(bào)、公司公告、實(shí)時(shí)新聞、風(fēng)控規(guī)則等。這種模式的優(yōu)勢(shì)是靈活性高、迭代快、成本相對(duì)可控。
而“金融領(lǐng)域?qū)倌P汀钡难邪l(fā)類(lèi)似“科班出身”模式,從模型訓(xùn)練的第一天起,就使用海量且高質(zhì)量的金融領(lǐng)域私有數(shù)據(jù)進(jìn)行從零開(kāi)始的預(yù)訓(xùn)練,讓模型從“基因”里就深刻理解金融術(shù)語(yǔ)、市場(chǎng)邏輯和專(zhuān)業(yè)范式。
對(duì)銀行、證券、保險(xiǎn)等企業(yè)的從業(yè)者而言,企業(yè)知識(shí)庫(kù)早已不是簡(jiǎn)單的文檔管理系統(tǒng),而是承載著風(fēng)險(xiǎn)管控、合規(guī)審查、客戶(hù)服務(wù)等核心職能的“智能大腦”。
NBD:金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”的關(guān)注點(diǎn)呈現(xiàn)怎樣的特點(diǎn)?
答治茜:首先,金融行業(yè)對(duì)于知識(shí)庫(kù)安全與合規(guī)的要求更高。
由于金融行業(yè)監(jiān)管的特殊性,數(shù)據(jù)安全、監(jiān)管要求、信創(chuàng)適配等成為數(shù)字化建設(shè)底線(xiàn)。所以,為了更好滿(mǎn)足金融企業(yè)的需求,我們AI知識(shí)庫(kù)建設(shè)需要有更專(zhuān)業(yè)化的能力,比如精細(xì)化的多級(jí)權(quán)限管理體系、防泄露的頁(yè)面水印、嚴(yán)謹(jǐn)?shù)膶徲?jì)能力和內(nèi)容風(fēng)控體系等。
其次,金融行業(yè)對(duì)知識(shí)問(wèn)答準(zhǔn)確性和嚴(yán)謹(jǐn)性的要求極高。
金融是非常嚴(yán)謹(jǐn)?shù)男袠I(yè),員工每天都在跟數(shù)字和知識(shí)打交道,所以知識(shí)內(nèi)容非常豐富,也很復(fù)雜,而且大家對(duì)于知識(shí)庫(kù)的期待很高,如希望多表格數(shù)據(jù)的計(jì)算、財(cái)報(bào)里多模態(tài)數(shù)據(jù)的解讀、銀行理財(cái)產(chǎn)品推薦等等,這對(duì)我們提出很大的挑戰(zhàn)。為此,我們專(zhuān)門(mén)在AI出圖、表格計(jì)算、知識(shí)溯源等方面下了很多功夫,并取得了階段性突破。
再次,金融行業(yè)更關(guān)注員工個(gè)人知識(shí)的沉淀。在與銀行、資管企業(yè)溝通過(guò)程中,我們發(fā)現(xiàn)很多金融企業(yè)非常希望員工個(gè)人的經(jīng)驗(yàn)知識(shí)能沉淀下來(lái),把個(gè)人經(jīng)驗(yàn)變成企業(yè)知識(shí)。另外,我們發(fā)現(xiàn)很多金融企業(yè)員工日常需要的知識(shí)內(nèi)容也是有差異的,所以“個(gè)人知識(shí)庫(kù)”的概念今年被廣泛關(guān)注,我們?cè)谥R(shí)庫(kù)中設(shè)計(jì)了允許員工個(gè)人創(chuàng)建知識(shí)庫(kù)空間的功能,同時(shí)打通微信、騰訊文檔、企業(yè)微信等。
NBD:數(shù)據(jù)安全是企業(yè)發(fā)展過(guò)程中非常重要的環(huán)節(jié),對(duì)于金融企業(yè)來(lái)說(shuō)尤其如此,您如何看待數(shù)據(jù)安全問(wèn)題?
答治茜:金融行業(yè)對(duì)于監(jiān)管、數(shù)據(jù)運(yùn)營(yíng)等有非常高的數(shù)據(jù)安全和隱私保護(hù)的要求。我們要從兩個(gè)方面思考:
一是技術(shù)和產(chǎn)品層面,從應(yīng)用到數(shù)據(jù)、算力等所有的基礎(chǔ)設(shè)施,要實(shí)現(xiàn)私有化部署和全鏈路的安全。
另一個(gè)層面是運(yùn)營(yíng)層面,綜合考慮管理和技術(shù)。比如說(shuō)金融機(jī)構(gòu)內(nèi)部某團(tuán)隊(duì)有兩三百人時(shí),內(nèi)部如何協(xié)同、如何按層級(jí)劃分權(quán)限,哪些信息能讓哪些人看到,這就是管理要求,要滿(mǎn)足多級(jí)的授權(quán)管理。
在使用AI助手咨詢(xún)某個(gè)問(wèn)題時(shí),經(jīng)常得到錯(cuò)誤的回復(fù),這種現(xiàn)象在AI圈被稱(chēng)為“幻覺(jué)”,“幻覺(jué)”問(wèn)題困擾著所有使用大語(yǔ)言模型的人。
NBD:個(gè)人使用大模型問(wèn)答的時(shí)候會(huì)出現(xiàn)一些杜撰錯(cuò)誤。如何看待大模型落地過(guò)程中出現(xiàn)的“杜撰”“錯(cuò)配”等問(wèn)題?
答治茜:ChatGPT出來(lái)后,我們就在思考大模型時(shí)代下行業(yè)會(huì)有什么樣的變化。2024年開(kāi)始,樂(lè)享就轉(zhuǎn)型聚焦做AI知識(shí)庫(kù),目前在產(chǎn)品功能、問(wèn)答準(zhǔn)確性上應(yīng)該是比較領(lǐng)先的。
當(dāng)前大模型“杜撰”的情況還比較普遍,我認(rèn)為破解的關(guān)鍵在于三方面:答案模糊的時(shí)候拒答不亂說(shuō)、輸出能有效溯源、企業(yè)內(nèi)部知識(shí)實(shí)現(xiàn)有效治理(比如有效性和及時(shí)更新等)??紤]到樂(lè)享定位為企業(yè)級(jí)知識(shí)庫(kù),我們做了非常多的工作去提高準(zhǔn)確性。主要是以下幾方面:
第一,對(duì)文檔、知識(shí)進(jìn)行理解。我們自研OCR(Optical Character Recognition,光學(xué)字符識(shí)別)大模型,對(duì)復(fù)雜的圖文混排文檔解析準(zhǔn)確率提升30%以上。
第二,理解后按照一定的規(guī)則對(duì)文檔、知識(shí)進(jìn)行切片存儲(chǔ)。我們自研業(yè)界首個(gè)基于語(yǔ)義切分的模型,保障切分片段語(yǔ)義的完整性。
第三,當(dāng)用戶(hù)通過(guò)AI助手來(lái)問(wèn)答時(shí),我們會(huì)結(jié)合上下文對(duì)用戶(hù)的問(wèn)題進(jìn)行理解后并改寫(xiě),從而提升檢索精度。
第四,基于改寫(xiě)后的用戶(hù)問(wèn)題,使用向量檢索和關(guān)鍵詞檢索的混合檢索模式,找到最相關(guān)的內(nèi)容。
第五,上一步可能檢索到大量?jī)?nèi)容,但并非所有內(nèi)容都與問(wèn)題緊密相關(guān),因此需要對(duì)這些內(nèi)容進(jìn)行重新排序與過(guò)濾。
第六,基于重排后的內(nèi)容調(diào)用大模型生成最終的答案。
經(jīng)過(guò)以上程序,目前我們的準(zhǔn)確率超過(guò)92%,我們會(huì)持續(xù)投入精力去提升準(zhǔn)確率。
封面圖片來(lái)源:受訪(fǎng)者
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線(xiàn):4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
填補(bǔ)公共數(shù)據(jù)運(yùn)營(yíng)制度空白,四川為數(shù)據(jù)要素市場(chǎng)化“探路”
沖擊千億元營(yíng)收目標(biāo),成都集成電路產(chǎn)業(yè)如何乘勢(shì)而上?
文旅經(jīng)濟(jì)再創(chuàng)新高,四川文旅強(qiáng)縣如何讓產(chǎn)業(yè)“多點(diǎn)開(kāi)花”?
四川集中啟動(dòng)“人大與青春同行”系列活動(dòng),讓人大制度“可感、可觸、可參與”
“產(chǎn)投28計(jì)劃”今日啟航!成都千億基金集群首發(fā):5億投資鎖定15家未來(lái)企業(yè)
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP