融合領(lǐng)域知識(shí)圖譜的跨境民族文本聚類(lèi)方法
中文信息學(xué)報(bào)
頁(yè)數(shù): 9 2024-03-15
摘要: 跨境民族文本聚類(lèi)任務(wù)旨在建立跨境民族不同文本間的關(guān)聯(lián)關(guān)系,為跨境民族文本檢索、事件關(guān)聯(lián)分析提供支撐。但是跨境民族間文化文本表達(dá)差異大,加上文化表達(dá)背景缺失,導(dǎo)致跨境民族文本聚類(lèi)困難。基于此,該文提出了融合領(lǐng)域知識(shí)圖譜的跨境民族文本聚類(lèi)方法,首先融入跨境民族領(lǐng)域知識(shí)圖譜,實(shí)現(xiàn)對(duì)跨境民族文本數(shù)據(jù)的文化背景知識(shí)補(bǔ)充及實(shí)體語(yǔ)義關(guān)聯(lián),從而獲得文本的增強(qiáng)局部語(yǔ)義;同時(shí)考慮到跨境民族文本數(shù)據(jù)...