面向中文科學(xué)數(shù)據(jù)集的句子級(jí)語(yǔ)義匹配模型
鄭州大學(xué)學(xué)報(bào)(工學(xué)版)
頁(yè)數(shù): 9 2024-01-10
摘要: 針對(duì)現(xiàn)有以詞為粒度的語(yǔ)義匹配模型難以理解句子級(jí)科學(xué)數(shù)據(jù)集元數(shù)據(jù)的問題,提出了一個(gè)面向中文科學(xué)數(shù)據(jù)集的句子級(jí)語(yǔ)義匹配(CSDSM)模型。該模型使用CSL數(shù)據(jù)集對(duì)SimCSE和CoSENT進(jìn)行訓(xùn)練生成CoSENT預(yù)訓(xùn)練模型?;贑oSENT模型,引入多頭自注意力機(jī)制進(jìn)行特征提取,通過余弦相似度與KNN分類結(jié)果加權(quán)求和得到最終輸出。以國(guó)家地球系統(tǒng)科學(xué)數(shù)據(jù)中心開放的語(yǔ)義元數(shù)據(jù)信息作為自...