近日,安徽工業(yè)大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院屈喜文博士在人工智能領(lǐng)域權(quán)威期刊《Applied Soft Computing》(中科院一區(qū)Top期刊,影響因子8.7)和《Expert Systems with Applications》(中科院一區(qū)Top期刊,影響因子8.5)發(fā)表空中手寫軌跡生成及識別最新研究成果。安徽工業(yè)大學(xué)為論文第一單位,屈喜文博士為論文第一作者和通訊作者,碩士研究生葉明紅等為課題的順利完成做出了積極貢獻(xiàn)。研究工作得到國家自然科學(xué)基金、安徽省信息材料與智能感知實驗室開放基金等項目的支持。
多尺度通道注意力網(wǎng)絡(luò)
空中手寫樣本示例
基于單目視覺的空中手寫是一種新穎且有前景的人機(jī)交互方式,具有廣泛的潛在應(yīng)用價值。由于指尖的尺寸非常小并且具有非常少的辨別特征,現(xiàn)有的基于單目視覺的空中手寫系統(tǒng)在使用單目攝像頭獲取的二維圖像中確定指尖的位置方面遇到挑戰(zhàn)。課題組提出了一種多尺度通道注意力網(wǎng)絡(luò),通過對多尺度通道進(jìn)行加權(quán),促進(jìn)了目標(biāo)檢測模型在高分辨率、小尺度通道上的集中,從而有效提高了指尖檢測精度。實驗結(jié)果表明所完成的空中手寫系統(tǒng)允許用戶自由流暢地書寫。
基于非負(fù)表達(dá)分類的判別字典學(xué)習(xí)算法流程
訓(xùn)練樣本與學(xué)習(xí)得到的原子分布示例
為有效識別空中手寫字符/文本,課題組結(jié)合現(xiàn)有識別模型的優(yōu)缺點,展開了廣泛的研究?;诒磉_(dá)的分類模型算法原理簡單、可解釋性強(qiáng),然而現(xiàn)有的基于表達(dá)的分類模型對訓(xùn)練樣本中噪聲不具有魯棒,且直接使用訓(xùn)練樣本作為字典原子,忽略了學(xué)習(xí)更具鑒別性的字典原子。此外,為了提高表達(dá)能力和識別精度,現(xiàn)有的基于表達(dá)的分類模型往往需要擴(kuò)展字典原子的數(shù)量,導(dǎo)致存儲和計算成本激增。為了獲得更具鑒別性和緊湊的字典,課題組提出了基于非負(fù)表達(dá)分類的判別字典學(xué)習(xí)算法,利用非負(fù)約束來獲得字典上每個訓(xùn)練樣本的非負(fù)表示。在字典學(xué)習(xí)階段,對于訓(xùn)練樣本,課題組提出的算法最小化訓(xùn)練樣本的類內(nèi)重構(gòu)誤差,同時擴(kuò)大訓(xùn)練樣本與對類間重建誤差影響最大的原子之間的距離,在空中手寫字符識別、人臉識別等多種模式識別應(yīng)用領(lǐng)域以更小的存儲消耗,更快的識別速度,獲得更高的識別精度。上述研究將推進(jìn)空中手寫人機(jī)交互技術(shù)走向?qū)嵱谩?/span>
論文鏈接:
https://doi.org/10.1016/j.asoc.2024.111801
https://doi.org/10.1016/j.eswa.2024.123998
新聞鏈接:https://www.ahut.edu.cn/info/1226/24615.htm
網(wǎng)站內(nèi)容來源于互聯(lián)網(wǎng),由網(wǎng)絡(luò)編輯負(fù)責(zé)審查,目的在于傳遞信息,提供專業(yè)服務(wù),不代表本網(wǎng)站平臺贊同其觀點和對其真實性負(fù)責(zé)。如因內(nèi)容、版權(quán)問題存在異議的,請與我們?nèi)〉寐?lián)系,我們將協(xié)調(diào)給予處理(按照法規(guī)支付稿費(fèi)或刪除),聯(lián)系方式:ahos@aiofm.ac.cn 。網(wǎng)站平臺將加強(qiáng)監(jiān)控與審核,一旦發(fā)現(xiàn)違反規(guī)定的內(nèi)容,按國家法規(guī)處理,處理時間不超過24小時。