中新網(wǎng)包頭2月23日電 題:人大代表閆宏偉:當稀土遇到DeepSeek
記者 李愛平
輕啟筆記本電腦,倒上一杯熱水,在內(nèi)蒙古自治區(qū)包頭稀土研究院,閆宏偉的一天這樣開始了。
蛇年春節(jié)過后,他在日常工作中多了一個“朋友”——DeepSeek(深度求索)。過去20多天,他將其運用到“稀土通用語料庫及其系統(tǒng)的設(shè)計和研發(fā)”(簡稱稀土語料庫)項目中,頗有成就感。
“在研究中,若有不懂之處,請教DeepSeek,很快就能獲得啟發(fā)!遍Z宏偉近日在接受中新網(wǎng)記者專訪時表示,DeepSeek助力了研發(fā)項目,堪稱自己的“左膀右臂”。
作為全國人大代表,閆宏偉是在2024年全國兩會結(jié)束后開始擁抱人工智能的。彼時,他深感在稀土領(lǐng)域,融入人工智能,已是未來必然趨勢。
“但那時DeepSeek還未橫空出世,我只能通過購買各類專著,一點點學(xué)起!痹陂Z宏偉的辦公室內(nèi),他學(xué)習(xí)過的《線性代數(shù)》《數(shù)據(jù)有道》等書籍上都留下了他標記的勾勾畫畫。
學(xué)習(xí)一段時間后,閆宏偉開始主動介入人工智能。他最先運用到的是ChatGPT!斑\用ChatGPT的第一感覺是,這款人工智能模型不僅能答疑解惑,還節(jié)省研發(fā)時間,但尚有美中不足之處。”
閆宏偉認為,在人工智能的助力下構(gòu)建稀土語料庫項目,能填補包頭稀土研究院在該項目上的空白。“在稀土行業(yè)內(nèi)使用各類大語言模型、人工智能模型和機器學(xué)習(xí)模型進行訓(xùn)練,時不我待!
“現(xiàn)在DeepSeek-R1的中文理解能力大幅度提高,推理能力更是達到了全球領(lǐng)先水平!遍Z宏偉認為,必須對DeepSeek給予重新理解,找出更好的解決方案。
為此,他開始嘗試引入DeepSeek-R1作為助手,解決沒有資源、人手的困難。他力爭在6月份前完成稀土語料庫的研發(fā)。
“這個項目研發(fā)成功,也意味著一個標準稀土語料庫宣告建設(shè)完成!遍Z宏偉認為,這是自己這個人工智能領(lǐng)域“小白”努力至今做的最正確的事情。
稀土遇到DeepSeek,在閆宏偉的手中到底能碰撞出什么樣的火花?他認為,開發(fā)稀土語料庫,首要是為了訓(xùn)練和微調(diào)自己的機器學(xué)習(xí)模型與大語言模型,這個應(yīng)用場景直觀但是需要專注細節(jié),通過不斷增加語料庫,可以為行業(yè)參與者提供持續(xù)的人工智能基礎(chǔ)支持。
當下,閆宏偉在研發(fā)稀土語料庫的過程中,還開發(fā)了稀土語料庫管理系統(tǒng)。
“實際上這是一個語料庫生產(chǎn)系統(tǒng),利用它,可以不斷地將行業(yè)和組織的私有文獻加工成易于訓(xùn)練和微調(diào)的數(shù)據(jù)集,并且將原始資料和語料庫視為某種廣義標記數(shù)據(jù)集!遍Z宏偉認為,此舉對探索跨文本(含音視頻等)資料語料化的技術(shù)路線和實現(xiàn)具有重大意義,也對他所從事的稀土行業(yè)有著重大意義。(完)