基于多語言-視覺公共空間學(xué)習(xí)的多語言文本-視頻跨模態(tài)檢索模型
計(jì)算機(jī)學(xué)報(bào)
頁數(shù): 16 2024-06-17
摘要: 本文針對(duì)具有挑戰(zhàn)性的多語言文本-視頻跨模態(tài)檢索問題進(jìn)行研究.傳統(tǒng)文本-視頻跨模態(tài)檢索模型通常針對(duì)單一語言進(jìn)行設(shè)計(jì),比如英語,模型僅支持某一特定語言的文本查詢.如果有不同語言檢索需求,則需另收集目標(biāo)語言的訓(xùn)練數(shù)據(jù)并重新訓(xùn)練構(gòu)建新的檢索模型,這使得模型很難快速有效地適用于其他語言的檢索任務(wù).近年來,針對(duì)多語言問題的研究逐漸深入,這為多語言跨模態(tài)檢索的實(shí)現(xiàn)打下了良好的基石.為了解決多...