基于大語言模型的中文科技文獻標注方法
計算機工程
頁數(shù): 8 2024-01-19
摘要: 高質(zhì)量的標注數(shù)據(jù)是中文科技文獻領域自然語言處理任務的重要基石。針對目前缺乏中文科技文獻的高質(zhì)量標注語料以及人工標注質(zhì)量參差不齊且效率低下的問題,提出一種基于大語言模型的中文科技文獻標注方法。首先,制定適用于多領域中文科技文獻的細粒度標注規(guī)范,明確標注實體類型以及標注粒度;其次,設計結構化文本標注提示模板和生成解析器,將中文科技文獻標注任務設置成單階段單輪問答過程,將標注規(guī)范和帶...