古漢語難度自然語言(NLP)分析
由於我對於自然語言及古漢文相當有興趣,再加上學弟曾經參與國際語言奧林匹亞之訓練,具有語言學的基本認識,因此我們決定以古漢語難度自然語言(NLP)分析進行研究,希望藉由本研究了解不同類型及文體,有哪些適合閱讀文本。
本研究之研究方法分為兩部分,分別對於古漢文文本進行字義分析及繪製句法樹,將兩者分析之成果相互修正,取得更精確之句法與詞向量。詳細之研究方法如下圖所示:
由於古漢語相關研究之資料相當少,所有包括語料庫建構、分詞工具、文白翻譯之工具均需要自行開發程式。本研究需橫越中文系、語研所、資工系等相關領域,因此進行本研究時,牽涉語料庫建構、語意識別、命名實體識別(NER)、自然語言理解(NLU),我們試著主動與各個領域之教授聯繫,希望取得教授們的協助與指導,後來很幸運獲得台中一中資訊科柳佩君老師及成功大學資工系盧文祥教授指導本研究。本研究所觸及之層面相當廣泛,無法於我高中畢業之前完成所有研究。本團隊應會在研究一部分後,先發表部分論文,其餘未完成之研究,等待我進入大學後再繼續進行研究。
本研究之參考投影片網址 https://s.yam.com/6yn2F
podcast https://anchor.fm/wason-peng/episodes/007-ekrp8v
留言
張貼留言