• 1

                                                                        • 2

                                                                        • 3

                                                                        • 4

                                                                        齊魯工業大學

                                                                        當前位置:考研招生在線 > 考研調劑  > 推免生招生

                                                                        南京大學2023年優秀大學生夏令營報名通知:自然語言處理研究組

                                                                        時間:2023-05-19     編輯:考研招生在線

                                                                        南京大學自然語言處理研究組(NJUNLP)是國內最早從事NLP領域科研工作的團隊之一,先后承擔國家科技攻關項目、863項目、國家自然科學基金、江蘇省自然科學基金等20項,獲國家七五科技攻關重大成果獎1次、教育部科技進步獎2次、江蘇省科技進步二等獎、三等獎各一次;近3年在自然語言處理和人工智能頂級會議上(ACL、AAAI、IJCAI、EMNLP等)發表論文四十余篇,累計發表論文200+篇;多次參與自然語言處理相關的比賽和評測,并獲得第一(情感分析CCF-BDCI2018、分詞NLPCC12、命名實體識別SIGHAN06)。

                                                                        研究組開展的本科生NLP Summer Camp活動旨在為本科生提供了解自然語言處理及運用自然語言處理技術解決實際問題的平臺。該活動設置若干自然語言處理領域的前沿課題,每個課題由本組優秀博士生負責。在報名開始時,同學們可以自愿選擇感興趣的課題。在報名結束后,研究組將根據課題方向組織面試選拔,優秀的同學能夠正式參與活動。完整參與活動的學員在活動結束后將獲得結題證書,后期申請保研至NLP研究組時也會被優先考慮。

                                                                        一、項目計劃

                                                                        舉辦形式:本次夏令營采用線上模式。

                                                                        項目周期:6月26日-8月7日,為期6周,前2周集中培訓,后4周自主學習,并跟隨組長進行項目實戰。

                                                                        項目內容:共有7個課題,后期設有通識講座、基礎課程以及學術論壇。

                                                                        招募人數:計劃每個課題招募3-5名學員。

                                                                        * 注意:該夏令營與計算機系以及人工智能學院的推免夏令營無關。

                                                                        二、項目要求

                                                                        申請對象:原則上僅限大三及以下的在校本科生報名,優先考慮具有自然語言處理或機器學習基礎知識的大一、大二在校本科生。

                                                                        時間安排:本次夏令營是為期六周的全程跟進學習,請有意參加夏令營的同學提前安排好時間,避免出現安排沖撞、時間精力不足以及中途退出等情況。

                                                                        三、申請流程

                                                                        網上申請

                                                                        即日起,可登錄:https://wj.qq.com/s2/12303068/e305/,填寫報名信息,申請截止時間為:5月30日23:59。

                                                                        資格初審

                                                                        申請截止后,工作小組對申請者提供的報名信息進行資格初審,面試名單,預計在6月2日以公眾號以及郵箱形式發布。面試時間初定于:6月3日-6月4日。

                                                                        結果發布

                                                                        面試結束后,工作小組結合學員信息以及面試情況,確定夏令營入圍名單,預計在6月5日公布。

                                                                        以上項目流程公布日期均為擬定,具體時間以后續通知為準,請對夏令營感興趣的同學按照初步擬定的日期安排規劃好自己的時間,并在此期間及時關注自己的郵箱以及我們的公眾號,避免出現錯過通知的情況。

                                                                        四、課題名稱

                                                                        深度神經網絡局部解釋算法的質量評估

                                                                        近年來,深度神經網絡(DNNs)在廣泛的任務中取得了最先進的性能。然而,可解釋性方面的限制阻礙了它們在現實世界中的應用。局部解釋算法是一系列旨在回答以下問題的技術:為什么模型會做出這個特定的預測?這個特定的特征值對預測有什么影響?

                                                                        目前已有的工作提出了一系列局部解釋算法為模型在單個樣本上的預測生成解釋。然而,目前沒有一個良好的指標用于評估不同算法生成的解釋的質量和可信度,以及這些解釋與人類理解的相關性。針對以上問題,本課題將帶領營員復現主流的局部解釋算法,從人類理解的角度上對比不同算法之間的差異,評估不同算法的解釋能力。

                                                                        非自回歸神經機器翻譯

                                                                        目前神經機器翻譯模型大多采用自回歸(Autoregressive)的解碼方式,在解碼時自左向右逐詞輸出。雖然自回歸解碼方式具備優異的解碼性能,但逐詞解碼也會產生較高的解碼時延,進而降低了解碼效率。

                                                                        為此,研究人員提出了基于非自回歸(Non-Autoregressive)解碼方式的翻譯模型,在解碼時并行輸出所有詞,大幅提高了解碼效率。然而,伴隨著解碼速度的提升,模型解碼質量也有著一定程度的下滑。因此,目前研究人員致力于在保持高效解碼的前提下,改善非自回歸解碼質量,以達到“更快,更好”的目標。在本次夏令營中...將帶領營員回顧并復現近年來具有代表性的增強非自回歸解碼質量的幾類方案,評估比較不同方案之間的優劣差異,理解非自回歸解碼目前存在的問題。

                                                                        社交媒體計算與分析

                                                                        社交媒體已經深入到了我們生活的方方面面,網絡語言在社交領域的溝通中得到了越來越廣泛的應用,而數據的實時性、形式的多樣性及復雜的關聯也帶來了不少機遇與挑戰。本課題通過結合語言學、社會學、傳播學、心理學等多學科,探索將計算和分析方法運用在社會科學領域的問題中,研究方向包括語言行為(例如抱怨、吹牛、冒犯等)、謠言檢測、心理健康等。在社交媒體中,如何結合社會理論,量化指標,對數據進行分析與應用將是本課題重點探討的問題。

                                                                        結合大語言模型的個性化文本生成

                                                                        個性化文本生成旨在通過分析用戶需求、喜好和行為特征,為用戶提供量身定制的文本生成服務。盡管ChatGPT此類基于大規模語言模型的對話系統近期為用戶帶來了顛覆性的體驗,但其在個性化生成方面仍有所欠缺,難以滿足不同用戶在各種場景下的需求。事實上,關于大規模語言模型個性化生成能力的研究仍然非常有限。本課題擬回顧并復現近年來在個性化文本生成領域的代表性成果,探索當前開源的大規模語言模型在個性化文本生成上的潛力,并嘗試進行一些改進。

                                                                        分子表征學習

                                                                        分子表征是人工智能交叉生命科學的熱點研究領域,主要關注如何將分子的結構和性質信息表示為適合深度學習模型處理的形式。在這個任務中,通常需要從分子結構中提取有意義的特征,并將這些特征轉換為數值或向量形式以便在藥物設計、材料科學等領域進行預測和分析?,F有的分子表征手段主要有三種維度:基于1D smiles序列輸入的序列模型、基于2D分子圖的圖神經網絡模型以及基于3D結構坐標的模型。如何在深度學習模型的基礎上充分利用結構信息進行分子表征學習是大家探究的難點。本課題將帶領營員復現各種最前沿的分子表征方案,系統的對比不同表征方法之間的差別,探索分子表征過程中遇到的困難與問題以及體會人工智能交叉生命科學的意義。

                                                                        探究AI作畫模型的推理能力

                                                                        推理能力是人類智能的核心之一,對于一段文本,人類可以很容易從中推斷出文本中沒有顯示表達的知識。例如,人類可以很容易從描述“一種黑白相間、喜歡吃竹子的中國特有哺乳動物”中推斷出描述對象是熊貓。本課題提出這樣的問題:現有AI作畫模型是否具備人類這種推理能力?具體而言,本課題將重點關注上述例子中展示的基于屬性的推理能力,即輸入針對某一特定類別標簽的描述性文本,觀察AI作畫模型是否可以生成合理的圖片。構建數據集、量化評價指標將是本課題的研究重點。

                                                                        多模態信息指導的開放世界小樣本圖像識別

                                                                        傳統的小樣本圖像識別模型大多基于封閉世界的假設,即目標域測試集必屬于訓練類別。但是,實際應用場景往往不服從這個假設,在開放世界的假設下,模型需要處理測試集中的未知樣本(例如小樣本開放集識別和小樣本類別增量式識別等)。在測試階段,模型需要偵測出未知類別的樣本,同時也要正確區分已知類別的樣本,甚至再進一步學習未知類別的樣本。如何利用多模態數據(圖像,文本等)提升模型對未知類別樣本的偵測能力和對已知類別樣本的區分能力,同時避免災難性遺忘是本課題探究的重點問題。

                                                                        五、聯系方式

                                                                        如有任何疑問,請聯系郵箱:見官網

                                                                        原標題:2023南大NLP夏令營招募公告

                                                                        文章來源:https://mp.weixin.qq.com/s/QmuYVNNsqqfZ66pG6VvB0A

                                                                        在線報名申請表
                                                                        上傳

                                                                        上傳格式要求:jpg、png、zip、docx、、doc、xlsx、xls、pptx、pdf(100MB),最多上傳10個文件