貴大新聞網(wǎng)訊(計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院)近日,貴州大學(xué)文本計(jì)算與認(rèn)知智能教育部工程研究中心科研團(tuán)隊(duì)題為 Exclusion of Thought: Mitigating Cognitive Load in Large Language Models for Enhanced Reasoning in Multiple-Choice Tasks 的研究論文被自然語(yǔ)言處理領(lǐng)域頂級(jí)國(guó)際會(huì)議ACL 2025 (The 63nd Annual Meeting of the Association for Computational Linguistics,CCF-A類(lèi)) 錄用。這是我省高校及科研機(jī)構(gòu)首篇被ACL錄用的論文,也是我省大語(yǔ)言模型(Large Language Models, LLMs)領(lǐng)域首篇國(guó)際頂級(jí)會(huì)議論文,標(biāo)志著貴州大學(xué)在認(rèn)知智能與自然語(yǔ)言理解研究方面取得了重要突破。論文第一作者為我校計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院2023級(jí)研究生付啟航,通訊作者為秦永彬教授和黃瑞章教授。
隨著以GPT-4、DeepSeek等為代表的大語(yǔ)言模型技術(shù)迅速發(fā)展,LLMs已成為當(dāng)前人工智能領(lǐng)域的核心研究方向之一。依托海量參數(shù)與強(qiáng)大的語(yǔ)言建模能力,LLMs在文本生成、問(wèn)答、翻譯等多個(gè)自然語(yǔ)言處理任務(wù)中展現(xiàn)出卓越表現(xiàn)。然而在面對(duì)多項(xiàng)選擇題任務(wù)時(shí)LLMs往往會(huì)受到錯(cuò)誤選項(xiàng)的影響,錯(cuò)誤的選項(xiàng)會(huì)對(duì)模型的理解和推理能力產(chǎn)生“認(rèn)知負(fù)擔(dān)”,導(dǎo)致LLMs時(shí)常給出看似正確但實(shí)則錯(cuò)誤的答案。為應(yīng)對(duì)這一難題,本文提出了模擬人類(lèi)思維方式的大語(yǔ)言模型推理方法,簡(jiǎn)稱(chēng)Exclusion of Thought(EoT),該方法通過(guò)引導(dǎo)大語(yǔ)言模型主動(dòng)排除錯(cuò)誤選項(xiàng),從而有效降低外部干擾對(duì)模型推理路徑的影響,顯著減輕其“認(rèn)知負(fù)擔(dān)”。同時(shí),EoT策略通過(guò)記錄模型的排除過(guò)程,增強(qiáng)了其推理過(guò)程的透明性與可解釋性,為解決當(dāng)前人工智能“黑盒問(wèn)題”提供了新的思路。EoT作為一種即插即用的方法,可以與現(xiàn)有的任何一種提示策略相結(jié)合。本文在6個(gè)多項(xiàng)選擇題數(shù)據(jù)集和5個(gè)熱門(mén)的LLM上進(jìn)行了廣泛而全面的實(shí)驗(yàn)。結(jié)果顯示,EoT顯示出一致的性能提升,在傳統(tǒng)方法表現(xiàn)欠缺的復(fù)雜推理任務(wù)上提升更為明顯。
此次論文成功入選ACL主會(huì),充分展示了貴州大學(xué)在人工智能領(lǐng)域、特別是認(rèn)知智能與語(yǔ)言推理方面的科研實(shí)力,也彰顯了近年來(lái)學(xué)校強(qiáng)化計(jì)算機(jī)科學(xué)學(xué)科及人工智能科研團(tuán)隊(duì)建設(shè)的成效。貴州大學(xué)文本計(jì)算與認(rèn)知智能科研團(tuán)隊(duì)最早組建于2008年,經(jīng)過(guò)十幾年的建設(shè)與發(fā)展,形成了從事文本挖掘與分析、自然語(yǔ)言處理、知識(shí)融合、認(rèn)知智能、醫(yī)學(xué)影像、數(shù)據(jù)智能等相關(guān)研究的特色科研團(tuán)隊(duì),2022年獲批文本計(jì)算與認(rèn)知智能教育部工程研究中心,目前聚焦互聯(lián)網(wǎng)文本分析、認(rèn)知分析、法律大模型、智慧法院、智慧司法、醫(yī)學(xué)影像分析與精準(zhǔn)診斷等人工智能的交叉領(lǐng)域開(kāi)展研究與應(yīng)用。
編輯:張蟬
責(zé)編:李旭鋒
編審:丁龍