99re6在线视频,a级国产乱理伦片在线观看,欧美亚洲免费,亚洲伊人久久大香线蕉影院,国产女精品视频在ktv,18禁黄色网站入口,成人一级毛片免费在线视频

每日經(jīng)濟(jì)新聞
輪播

每經(jīng)網(wǎng)首頁(yè) > 輪播 > 正文

專(zhuān)訪(fǎng)騰訊云副總裁答治茜:大模型時(shí)代下,知識(shí)庫(kù)是企業(yè)的基礎(chǔ)設(shè)施

2025-10-27 22:12:46

在實(shí)體經(jīng)濟(jì)與數(shù)字經(jīng)濟(jì)日益融合的背景下,企業(yè)積極擁抱大模型,但金融行業(yè)因其特殊性,通用大模型難以滿(mǎn)足需求。騰訊云副總裁答治茜認(rèn)為,“大模型+企業(yè)知識(shí)庫(kù)”是AI落地最佳路徑,知識(shí)庫(kù)是企業(yè)的基礎(chǔ)設(shè)施,金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”安全性、準(zhǔn)確性要求高,更關(guān)注員工知識(shí)沉淀。他同時(shí)還分享了避免大模型“杜撰”的方法。

每經(jīng)記者|潘婷    每經(jīng)編輯|陳旭    

在實(shí)體經(jīng)濟(jì)和數(shù)字經(jīng)濟(jì)日益深度融合的大背景下,越來(lái)越多企業(yè)正積極擁抱大模型。不過(guò),對(duì)于安全性、準(zhǔn)確性要求極高的金融行業(yè)來(lái)說(shuō),通用大模型往往無(wú)法滿(mǎn)足其需求。

“在實(shí)際落地過(guò)程中,‘大模型+企業(yè)知識(shí)庫(kù)’成為AI落地的最佳路徑。”近日,騰訊云副總裁答治茜在接受《每日經(jīng)濟(jì)新聞》(以下簡(jiǎn)稱(chēng)NBD)記者專(zhuān)訪(fǎng)時(shí)坦言,金融機(jī)構(gòu)普遍面臨著知識(shí)孤島化、非結(jié)構(gòu)化數(shù)據(jù)海量、合規(guī)成本高企等知識(shí)管理的困境。

如何破解金融行業(yè)知識(shí)管理困境?金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”的關(guān)注點(diǎn)呈現(xiàn)怎樣的特點(diǎn)?如何看待大模型落地過(guò)程中出現(xiàn)的“杜撰”“錯(cuò)配”等現(xiàn)象?圍繞這一系列話(huà)題,答治茜為記者進(jìn)行了詳細(xì)的解答。

大模型是“大腦”,知識(shí)庫(kù)是“課本”

當(dāng)前,大模型技術(shù)正惠及千行百業(yè),金融行業(yè)也在探索符合金融規(guī)律的AI(人工智能)知識(shí)庫(kù)建設(shè)路徑。AI知識(shí)庫(kù)作為連接數(shù)據(jù)、算法與場(chǎng)景的核心樞紐,是金融機(jī)構(gòu)實(shí)現(xiàn)“從技術(shù)到價(jià)值”轉(zhuǎn)化的關(guān)鍵抓手。

NBD:大模型時(shí)代,企業(yè)的“知識(shí)庫(kù)”扮演了什么角色?金融領(lǐng)域?qū)倌P秃屯ㄓ么竽P陀惺裁床顒e?

答治茜 圖片來(lái)源:受訪(fǎng)者

答治茜:在大模型時(shí)代下,我們認(rèn)為知識(shí)庫(kù)是企業(yè)的一種基礎(chǔ)設(shè)施。大模型是“大腦”,知識(shí)庫(kù)是“課本”,大腦智力再高,如果沒(méi)有學(xué)習(xí)過(guò)相關(guān)的知識(shí),也無(wú)法很好地解決問(wèn)題。

“通用大模型+專(zhuān)業(yè)領(lǐng)域知識(shí)庫(kù)”的研發(fā)類(lèi)似“大腦+課本”模式。首先,需要投入巨大資源訓(xùn)練一個(gè)“萬(wàn)事通”基座模型,或者直接采用市面上已有的效果最優(yōu)的模型,使其具備強(qiáng)大的語(yǔ)言理解、邏輯推理和代碼能力。然后,通過(guò)RAG(Retrieval-augmented Generation檢索增強(qiáng)生成)技術(shù),為這個(gè)“通才”配備一個(gè)龐大的、實(shí)時(shí)更新的金融知識(shí)庫(kù),如行業(yè)研報(bào)、公司公告、實(shí)時(shí)新聞、風(fēng)控規(guī)則等。這種模式的優(yōu)勢(shì)是靈活性高、迭代快、成本相對(duì)可控。

而“金融領(lǐng)域?qū)倌P汀钡难邪l(fā)類(lèi)似“科班出身”模式,從模型訓(xùn)練的第一天起,就使用海量且高質(zhì)量的金融領(lǐng)域私有數(shù)據(jù)進(jìn)行從零開(kāi)始的預(yù)訓(xùn)練,讓模型從“基因”里就深刻理解金融術(shù)語(yǔ)、市場(chǎng)邏輯和專(zhuān)業(yè)范式。

允許員工個(gè)人創(chuàng)建知識(shí)庫(kù)空間

對(duì)銀行、證券、保險(xiǎn)等企業(yè)的從業(yè)者而言,企業(yè)知識(shí)庫(kù)早已不是簡(jiǎn)單的文檔管理系統(tǒng),而是承載著風(fēng)險(xiǎn)管控、合規(guī)審查、客戶(hù)服務(wù)等核心職能的“智能大腦”。

NBD:金融行業(yè)對(duì)“大模型+知識(shí)庫(kù)”的關(guān)注點(diǎn)呈現(xiàn)怎樣的特點(diǎn)?

答治茜:首先,金融行業(yè)對(duì)于知識(shí)庫(kù)安全與合規(guī)的要求更高。

由于金融行業(yè)監(jiān)管的特殊性,數(shù)據(jù)安全、監(jiān)管要求、信創(chuàng)適配等成為數(shù)字化建設(shè)底線(xiàn)。所以,為了更好滿(mǎn)足金融企業(yè)的需求,我們AI知識(shí)庫(kù)建設(shè)需要有更專(zhuān)業(yè)化的能力,比如精細(xì)化的多級(jí)權(quán)限管理體系、防泄露的頁(yè)面水印、嚴(yán)謹(jǐn)?shù)膶徲?jì)能力和內(nèi)容風(fēng)控體系等。

其次,金融行業(yè)對(duì)知識(shí)問(wèn)答準(zhǔn)確性和嚴(yán)謹(jǐn)性的要求極高。

金融是非常嚴(yán)謹(jǐn)?shù)男袠I(yè),員工每天都在跟數(shù)字和知識(shí)打交道,所以知識(shí)內(nèi)容非常豐富,也很復(fù)雜,而且大家對(duì)于知識(shí)庫(kù)的期待很高,如希望多表格數(shù)據(jù)的計(jì)算、財(cái)報(bào)里多模態(tài)數(shù)據(jù)的解讀、銀行理財(cái)產(chǎn)品推薦等等,這對(duì)我們提出很大的挑戰(zhàn)。為此,我們專(zhuān)門(mén)在AI出圖、表格計(jì)算、知識(shí)溯源等方面下了很多功夫,并取得了階段性突破。

再次,金融行業(yè)更關(guān)注員工個(gè)人知識(shí)的沉淀。在與銀行、資管企業(yè)溝通過(guò)程中,我們發(fā)現(xiàn)很多金融企業(yè)非常希望員工個(gè)人的經(jīng)驗(yàn)知識(shí)能沉淀下來(lái),把個(gè)人經(jīng)驗(yàn)變成企業(yè)知識(shí)。另外,我們發(fā)現(xiàn)很多金融企業(yè)員工日常需要的知識(shí)內(nèi)容也是有差異的,所以“個(gè)人知識(shí)庫(kù)”的概念今年被廣泛關(guān)注,我們?cè)谥R(shí)庫(kù)中設(shè)計(jì)了允許員工個(gè)人創(chuàng)建知識(shí)庫(kù)空間的功能,同時(shí)打通微信、騰訊文檔、企業(yè)微信等。

NBD:數(shù)據(jù)安全是企業(yè)發(fā)展過(guò)程中非常重要的環(huán)節(jié),對(duì)于金融企業(yè)來(lái)說(shuō)尤其如此,您如何看待數(shù)據(jù)安全問(wèn)題?

答治茜:金融行業(yè)對(duì)于監(jiān)管、數(shù)據(jù)運(yùn)營(yíng)等有非常高的數(shù)據(jù)安全和隱私保護(hù)的要求。我們要從兩個(gè)方面思考:

一是技術(shù)和產(chǎn)品層面,從應(yīng)用到數(shù)據(jù)、算力等所有的基礎(chǔ)設(shè)施,要實(shí)現(xiàn)私有化部署和全鏈路的安全。

另一個(gè)層面是運(yùn)營(yíng)層面,綜合考慮管理和技術(shù)。比如說(shuō)金融機(jī)構(gòu)內(nèi)部某團(tuán)隊(duì)有兩三百人時(shí),內(nèi)部如何協(xié)同、如何按層級(jí)劃分權(quán)限,哪些信息能讓哪些人看到,這就是管理要求,要滿(mǎn)足多級(jí)的授權(quán)管理。

如何避免幻覺(jué):不亂說(shuō)、能溯源、有效管理知識(shí)

在使用AI助手咨詢(xún)某個(gè)問(wèn)題時(shí),經(jīng)常得到錯(cuò)誤的回復(fù),這種現(xiàn)象在AI圈被稱(chēng)為“幻覺(jué)”,“幻覺(jué)”問(wèn)題困擾著所有使用大語(yǔ)言模型的人。

NBD:個(gè)人使用大模型問(wèn)答的時(shí)候會(huì)出現(xiàn)一些杜撰錯(cuò)誤。如何看待大模型落地過(guò)程中出現(xiàn)的“杜撰”“錯(cuò)配”等問(wèn)題?

答治茜:ChatGPT出來(lái)后,我們就在思考大模型時(shí)代下行業(yè)會(huì)有什么樣的變化。2024年開(kāi)始,樂(lè)享就轉(zhuǎn)型聚焦做AI知識(shí)庫(kù),目前在產(chǎn)品功能、問(wèn)答準(zhǔn)確性上應(yīng)該是比較領(lǐng)先的。

當(dāng)前大模型“杜撰”的情況還比較普遍,我認(rèn)為破解的關(guān)鍵在于三方面:答案模糊的時(shí)候拒答不亂說(shuō)、輸出能有效溯源、企業(yè)內(nèi)部知識(shí)實(shí)現(xiàn)有效治理(比如有效性和及時(shí)更新等)??紤]到樂(lè)享定位為企業(yè)級(jí)知識(shí)庫(kù),我們做了非常多的工作去提高準(zhǔn)確性。主要是以下幾方面:

第一,對(duì)文檔、知識(shí)進(jìn)行理解。我們自研OCR(Optical Character Recognition,光學(xué)字符識(shí)別)大模型,對(duì)復(fù)雜的圖文混排文檔解析準(zhǔn)確率提升30%以上。

第二,理解后按照一定的規(guī)則對(duì)文檔、知識(shí)進(jìn)行切片存儲(chǔ)。我們自研業(yè)界首個(gè)基于語(yǔ)義切分的模型,保障切分片段語(yǔ)義的完整性。

第三,當(dāng)用戶(hù)通過(guò)AI助手來(lái)問(wèn)答時(shí),我們會(huì)結(jié)合上下文對(duì)用戶(hù)的問(wèn)題進(jìn)行理解后并改寫(xiě),從而提升檢索精度。

第四,基于改寫(xiě)后的用戶(hù)問(wèn)題,使用向量檢索和關(guān)鍵詞檢索的混合檢索模式,找到最相關(guān)的內(nèi)容。

第五,上一步可能檢索到大量?jī)?nèi)容,但并非所有內(nèi)容都與問(wèn)題緊密相關(guān),因此需要對(duì)這些內(nèi)容進(jìn)行重新排序與過(guò)濾。

第六,基于重排后的內(nèi)容調(diào)用大模型生成最終的答案。

經(jīng)過(guò)以上程序,目前我們的準(zhǔn)確率超過(guò)92%,我們會(huì)持續(xù)投入精力去提升準(zhǔn)確率。

封面圖片來(lái)源:受訪(fǎng)者

如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線(xiàn):4008890008

特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟(jì)新聞APP

每經(jīng)經(jīng)濟(jì)新聞官方APP

1

0