面向不平衡數(shù)據(jù)的機械設(shè)備故障命名實體識別
計算機工程
頁數(shù): 9 2024-01-05
摘要: 命名實體識別作為構(gòu)建知識圖譜的基礎(chǔ)任務(wù),其識別效果直接影響知識圖譜的質(zhì)量。在實際生產(chǎn)中,機械故障數(shù)據(jù)通常包含大量的領(lǐng)域?qū)I(yè)詞匯,同時實體類型普遍存在分布不平衡的問題,這對準(zhǔn)確識別故障實體構(gòu)成了挑戰(zhàn)。通用領(lǐng)域?qū)嶓w識別方法在這一領(lǐng)域效果欠佳,從而降低了知識圖譜的質(zhì)量。為應(yīng)對上述問題,提出一種融合焦點損失(Focal Loss)函數(shù)和專業(yè)詞典的實體識別方法。該方法使用Focal Lo...