面向聯(lián)邦學(xué)習(xí)激勵(lì)優(yōu)化的演化博弈模型
小型微型計(jì)算機(jī)系統(tǒng)
頁(yè)數(shù): 8 2023-02-07
摘要: 針對(duì)聯(lián)邦學(xué)習(xí)中參與者虛報(bào)訓(xùn)練成本導(dǎo)致激勵(lì)不匹配的現(xiàn)象,提出了面向聯(lián)邦學(xué)習(xí)激勵(lì)優(yōu)化的演化博弈模型.首先在聯(lián)邦學(xué)習(xí)系統(tǒng)中建立了聯(lián)邦參與者-聯(lián)邦組織者演化博弈模型,設(shè)計(jì)模型質(zhì)量評(píng)估算法對(duì)參與者提交的模型進(jìn)行質(zhì)量評(píng)估,去除低質(zhì)量模型的同時(shí)量化參與者訓(xùn)練成本.然后結(jié)合信譽(yù)度指標(biāo)提出優(yōu)化的激勵(lì)分配方法,通過(guò)求解演化博弈的穩(wěn)定策略得到不同初始狀態(tài)下的最優(yōu)收益策略.最后仿真實(shí)驗(yàn)表明參與者激勵(lì)收...