其實這條韌帶是在2016年才被比利時魯文大學醫院的兩名醫生證實存在。
它的發現經過了長達一個世紀的困惑,最近才被最終搞定和確認。
這條韌帶在前交叉韌帶(Anterior cruciate ligament, ACL)撕裂的患者康復中可能起著重要的作用。
這些研究成果發表在《解剖學雜誌》(Journal of Anatomy)上。
這兩名醫生第一次確定韌帶存在時用了肉眼解剖技術,97%的人都擁有這條韌帶。這證實了100多年前Segond論文中的的假設是正確的。
https://drbao.org/knee-anterior-lateral-ligament/
同時也有6部Youtube影片,追蹤數超過165的網紅Wear Black and Dance,也在其Youtube影片中提到,My third time in Sapa and second time running the 10k mountain race. Last year I did not sign up for the run because of ACL injury. Having no idea how...
「acl 2016」的推薦目錄:
- 關於acl 2016 在 Facebook 的最讚貼文
- 關於acl 2016 在 李開復 Kai-Fu Lee Facebook 的最讚貼文
- 關於acl 2016 在 小人物上籃 Facebook 的最佳貼文
- 關於acl 2016 在 Wear Black and Dance Youtube 的最佳解答
- 關於acl 2016 在 ぷあたんアカデミー Youtube 的精選貼文
- 關於acl 2016 在 Wear Black and Dance Youtube 的精選貼文
- 關於acl 2016 在 ACL 2016 - Claudia Hauff 的評價
- 關於acl 2016 在 Melanie Martinez At ACL 2016 - YouTube 的評價
- 關於acl 2016 在 ACL-2016-Neural Relation Extraction with Selective Attention ... 的評價
- 關於acl 2016 在 The ACL Fest... - Austin City Limits Music Festival (ACL) 的評價
acl 2016 在 李開復 Kai-Fu Lee Facebook 的最讚貼文
來自創新工場大灣區人工智慧研究院的兩篇論文入選了自然語言處理領域(NLP)頂級學術會議 ACL 2020 。
這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各資料集上的分數全部刷至新高,在工業中也有著可觀的應用前景。
本文來自創新工場公眾號
……………………………………………………………………
創新工場兩篇論文入選ACL 2020,將中文分詞性能刷至新高
“土地,我的金箍棒在哪裡?”
“大聖,你的金箍,棒就棒在,特別配你的髮型。”
感謝神奇的中文分詞,給我們帶來了多少樂趣。豐富多變的中文行文,給人的理解造成歧義,也給AI分詞帶來挑戰。
近日,自然語言處理領域(NLP)頂級學術會議 ACL 2020 (https://acl2020.org/)正在火熱舉行。
令人振奮的是,來自創新工場大灣區人工智慧研究院的兩篇論文入選。這兩篇論文均聚焦中文分詞領域,是深度學習引入知識後的有益嘗試,將該領域近年來廣泛使用的各資料集上的分數全部刷至新高,在工業中也有著可觀的應用前景。
分詞及詞性標注是中文自然語言處理的基本任務,尤其在工業場景對分詞有非常直接的訴求,但當前沒有比較好的一體化解決方案,而且中文分詞普遍存在歧義和未登錄詞的難題。
基於此,兩篇論文各自提出了“鍵-值記憶神經網路的中文分詞模型”和“基於雙通道注意力機制的分詞及詞性標注模型”,將外部知識(資訊)創造性融入分詞及詞性標注模型,有效剔除了分詞“噪音”誤導,大幅度提升了分詞及詞性標注效果。
兩篇文章的作者有:華盛頓大學博士研究生、創新工場實習生田元賀,創新工場大灣區人工智慧研究院執行院長宋彥,創新工場科研合夥人張潼,創新工場CTO兼人工智慧工程院執行院長王詠剛等人。
ACL(The Association for ComputationalLinguistics)國際計算語言學協會是自然語言處理領域影響力最大、最具活力的國際學術組織之一,自1962年創立以來已有58年歷史,其每年夏天舉辦的年會是該領域學術頂會。
與往年不同的是,受新冠疫情影響,ACL2020全部轉為線上進行,不過這絲毫沒有減弱熱度。根據之前公佈的資料,今年大會投稿數量超過3000篇,共接收 779 篇論文,包括 571 篇長論文和 208 篇短論文,接收率為 25.2%,在全球疫情衝擊下反而是有史以來最盛大的一屆ACL會議,創新工場的技術大牛們也頂著時差連續數晚熬夜參會。
▌利用記憶神經網路,將中文分詞性能刷到歷史新高
中文分詞目的是在中文的字序列中插入分隔符號,將其切分為詞。例如,“我喜歡音樂”將被切分為“我/喜歡/音樂”(“/”表示分隔符號)。
中文語言因其特殊性,在分詞時面臨著兩個主要難點。一是歧義問題,由於中文存在大量歧義,一般的分詞工具在切分句子時可能會出錯。例如,“部分居民生活水準”,其正確的切分應為“部分/居民/生活/水準”,但存在“分居”、“民生”等歧義詞。“他從小學電腦技術”,正確的分詞是:他/從小/學/電腦技術,但也存在“小學”這種歧義詞。
二是未登錄詞問題。未登錄詞指的是不在詞表,或者是模型在訓練的過程中沒有遇見過的詞。例如經濟、醫療、科技等科學領域的專業術語或者社交媒體上的新詞,或者是人名。這類問題在跨領域分詞任務中尤其明顯。
對此,《ImprovingChinese Word Segmentation with Wordhood Memory Networks》這篇論文提出了基於鍵-值記憶神經網路的中文分詞模型。
該模型利用n元組(即一個由連續n個字組成的序列,比如“居民”是一個2元組,“生活水準”是一個4元組)提供的每個字的構詞能力,通過加(降)權重實現特定語境下的歧義消解。並通過非監督方法構建詞表,實現對特定領域的未標注文本的利用,進而提升對未登錄詞的識別。
例如,在“部分居民生活水準”這句話中,到底有多少可能成為詞的組塊?單字可成詞,如“民”;每兩個字的組合可能成詞,如“居民”;甚至四個字的組合也可能成詞,例如“居民生活”。
把這些可能成詞的組合全部找到以後,加入到該分詞模型中。通過神經網路,學習哪些詞對於最後完整表達句意的幫助更大,進而分配不同的權重。像“部分”、“居民”、“生活”、“水準”這些詞都會被突出出來,但“分居”、“民生”這些詞就會被降權處理,從而預測出正確的結果。
在“他從小學電腦技術” 這句話中,對於有歧義的部分“從小學”(有“從/小學”和“從小/學”兩種分法),該模型能夠對“從小”和“學”分配更高的權重,而對錯誤的n元組——“小學”分配較低的權重。
為了檢驗該模型的分詞效果,論文進行了嚴格的標準實驗和跨領域實驗。
實驗結果顯示,該模型在5個資料集(MSR、PKU、AS、CityU、CTB6)上的表現,均達了最好的成績(F值越高,性能越好)。(注:所選擇的五個資料集是中文分詞領域目前全世界唯一通用的標準資料集)
創新工場大灣區人工智慧研究院執行院長宋彥表示,與前人的模型進行比較發現,該模型在所有資料集上的表現均超過了之前的工作,“把中文分詞領域廣泛使用的標準資料集上的性能全部刷到了新高。”
在跨領域實驗中,論文使用網路博客資料集(CTB7)測試。實驗結果顯示,在整體F值以及未登陸詞的召回率上都有比較大提升。
▌“雙通道注意力機制”,有效剔除“噪音”誤導
第二篇論文《Joint ChineseWord Segmentation and Part-of-speech Tagging via Two-way Attentions ofAuto-analyzed Knowledge》提供了一種基於雙通道注意力機制的分詞及詞性標注模型。
中文分詞和詞性標注是兩個不同的任務。詞性標注是在已經切分好的文本中,給每一個詞標注其所屬的詞類,例如動詞、名詞、代詞、形容詞。詞性標注對後續的句子理解有重要的作用。
在詞性標注中,歧義仍然是個老大難的問題。例如,對於“他要向全班同學報告書上的內容”中,“報告書”的正確的切分和標注應為“報告_VV/書_N”。但由於“報告書”本身也是一個常見詞,一般的工具可能會將其標注為“報告書_NN”。
句法標注本身需要大量的時間和人力成本。在以往的標注工作中,使用外部自動工具獲取句法知識是主流方法。在這種情況下,如果模型不能識別並正確處理帶有雜音的句法知識,很可能會被不準確的句法知識誤導,做出錯誤的預測。
例如,在句子“他馬上功夫很好”中,“馬”和“上”應該分開(正確的標注應為“馬_NN/上_NN”)。但按照一般的句法知識,卻可能得到不準確的切分及句法關係,如“馬上”。
針對這一問題,該論文提出了一個基於雙通道注意力機制的分詞及詞性標注模型。該模型將中文分詞和詞性標注視作聯合任務,可一體化完成。模型分別對自動獲取的上下文特徵和句法知識加權,預測每個字的分詞和詞性標籤,不同的上下文特徵和句法知識在各自所屬的注意力通道內進行比較、加權,從而識別特定語境下不同上下文特徵和句法知識的貢獻。
這樣一來,那些不準確的,對模型預測貢獻小的上下文特徵和句法知識就能被識別出來,並被分配小的權重,從而避免模型被這些有噪音的資訊誤導。
即便在自動獲取的句法知識不準確的時候,該模型仍能有效識別並利用這種知識。例如,將前文有歧義、句法知識不準確的句子(“他馬上功夫很好”),輸入該雙通道注意力模型後,便得到了正確的分詞和詞性標注結果。
為了測試該模型的性能,論文在一般領域和跨領域分別進行了實驗。
一般領域實驗結果顯示,該模型在5個資料集(CTB5,CTB6,CTB7,CTB9,Universal Dependencies)的表現(F值)均超過前人的工作,也大幅度超過了斯坦福大學的 CoreNLP 工具,和伯克利大學的句法分析器。
即使是在與CTB詞性標注規範不同的UD資料集中,該模型依然能吸收不同標注帶來的知識,並使用這種知識,得到更好的效果。
而在跨領域的實驗中,和斯坦福大學的CoreNLP 工具相比,該模型也有近10個百分點的提升。
▌主動引入和分辨知識,實現中文分詞技術突破
中文分詞在中國科研領域已經有幾十年的歷史。最初的中文分詞是基於詞典構建,詞典的好壞會直接影響到最後分析的效果。如果某個新詞在詞典裡沒有,那麼模型是死活都分不出來的。
這種方式的局限性還在於,詞典和分詞兩件事情中間始終有一條鴻溝,儘管詞典可以編撰得非常全面,但在處理分詞的時候,因為每一句話都有上下文語境,往往會產生多種不同的切分方法,從而無法有效地在當前語境下對分詞結構進行恰當的指導。
從2003年開始,分詞方法出現了新的突破。研究人員提出了打標籤的方式,通過給每一個字打詞首、詞尾、詞中的標籤,不再需要構建詞典,大幅度提升了未登錄詞的召回效果。
到了2014年左右,深度學習和神經網路開始被廣泛應用到中文分詞中,打標籤的模型從之前的淺層學習變成了深度學習,但演算法本質沒有發生變化,所以提升作用並不太大。
近兩年,學界開始研究怎麼在打標籤的過程中加入外部知識和資訊。創新工場的這兩篇文章就是沿著這個路徑,用記憶神經網路的方式記錄對分詞結果有影響的 n元組,並引入對詞性標注有影響的句法知識,將分詞結果和自動獲得的知識銜接起來,既發揮了神經網路的優勢,也把知識的優勢用上,實現了分詞技術上小而有效的改進和突破。
宋彥表示,“從技術創新的角度,我們的貢獻主要有兩點。一是在現有技術的基礎上,建立了一個一體化的模型框架,使用非監督方法構建詞表,並把知識(資訊)融入進來,使用更高層次的句法知識,來幫助詞性標注,起到'他山之石,可以攻玉’的效果。”
“二是主動吸收和分辨不同的外部知識(資訊)。通過鍵-值記憶神經網路和雙通道注意力機制,進行動態權重的分配,能夠有效分辨知識,區分哪些是有效的,哪些是無效的。雖然這些知識是自動獲取的、不準確的,但‘三個臭皮匠,頂個諸葛亮’,經過有效利用,總能湊出一些有用的資訊。如何實現模型的主動吸收和分辨,就變得更加重要。”
據瞭解,今年的ACL大會,在分詞領域一共收錄了18篇論文,創新工場人工智慧工程院同時有2篇入選,也表現出ACL官方對這一貢獻的認可。
▌具備跨領域分詞能力,提升工業應用效率
中文分詞和詞性標注是最底層的應用,對於接下來的應用和任務處理非常重要。例如對於文本分類、情感分析,文本摘要、機器翻譯等,分詞都是不可或缺的基本“元件”。
宋彥表示,做此項研究的目的是主要為了拓展其工業場景的應用,正確的分詞能夠平衡公司應用開發的效率和性能,同時方便人工干預及(預)後處理。
這也是創新工場人工智慧工程院的努力方向之一。工程院成立於2016年9月,宗旨是銜接科技創新和行業賦能,做嫁接科研和產業應用的橋樑,為行業改造業務流程、提升業務效率。
工程院下設北京總部、南京研究院和大灣區研究院。大灣區研究院再下設資訊感知和理解實驗室,專注于對自然語言處理(NLP)領域的研究。執行院長宋彥本人也有超過15年的NLP領域的科研經驗。
“在工業場景使用的時候,跨領域的模型能力是一個非常直接的訴求。”宋彥表示,在某個領域的訓練模型,大概率也需要應用到其他領域。
“如何在新領域缺少資料,或者新領域只有少量未標注資料的情況下,實現模型的冷開機,依然是項巨大的挑戰。如果能利用外部知識,提高模型性能,就能有效地召回很多在訓練集中沒有出現過的新詞。”
例如搜尋引擎的廣告系統,最初也是通過組詞匹配的方式,在某個特定領域訓練其分詞模型,但在進入一個新的領域時,例如從新聞領域進入醫療領域或體育領域,效果往往會大打折扣,甚至頻頻出錯。
而使用跨領域特性後,廣告系統在進入新領域時,便無需額外的資料,就可以對它進行比較準確的分詞和標注,從而有效匹配廣告和客戶,大大提升系統運行的效率和穩定性。
目前,這兩篇論文的工具都已經開源,在下面兩個連結中,可以找到對應的所有代碼和模型,各位朋友可按需自取:
分詞工具:https://github.com/SVAIGBA/WMSeg
分詞及詞性標注工具:https://github.com/SVAIGBA/TwASP
acl 2016 在 小人物上籃 Facebook 的最佳貼文
誰是當代NBA曹操?
小人物們對於曹操的形容:
"治世之能臣 亂世之梟雄" - Wesley Chang
"身材矮小、脾氣很差、政治能力很強、好色、文才很高" - 余青晏
"梟雄的意像" - 장준상
Derrick Rose, 台灣媒體稱之飆風玫瑰,在還沒進入NBA前其實就同時展現了他卓越的統治力和政治能力。在Memphis大學一年就直接帶領球隊創下有史以來最佳的成績;同時,也因請槍手考入學考SAT,讓NCAA後來直接沒收Memphis男籃2008年球季。
Rose進入NBA的時期要說是聯盟的亂世也不為過。那是後Shaq的Kobe湖人時代,也是KG Rondo波士頓時代,甚至可以說是熱火LBJ Wade Bosh的時代。在2011年小牛終於拿下冠軍那年,Rose也稱霸聯盟拿下MVP。
當然,Rose最有名的敗仗就是他2012年季後賽的ACL膝傷。但是這沒有停止Adidas 在暑假和他簽了 "14年" 的延長合約。如同曹操經歷赤壁之戰大敗後,一路退到紐約,最後得依靠前教頭Thibs在明州給籃球生涯最後一次機會,再度重生。這一代梟雄從高峰跌入谷底再爬起的故事,都記錄在玫瑰新書中。
曾經說過"生子當如喬諾亞"的Rose, 身材矮小,政治(賺錢)能力卓越,能夠在亂世中稱霸聯盟,經歷過如赤壁之戰的谷底,卻也能夠從明州最後機會中重生。需要槍手考SAT入學或許文才不高,但是還是出過新書;踏著整個Memphis大學名譽銷毀的代價卻獨身以狀元的姿態進入NBA,可稱之正港的當代NBA梟雄曹操。
#至於好色請看2016年被指控的民訴案件 #小人物三國系列 #NBA曹操Rose #再度感謝小人物MaxMao #繼續玩下去
第三問 : 當代NBA的三顧茅廬事件為何?
acl 2016 在 Wear Black and Dance Youtube 的最佳解答
My third time in Sapa and second time running the 10k mountain race. Last year I did not sign up for the run because of ACL injury. Having no idea how tough the trail was, I followed my friends to take pictures of them and ended up crawling through the whole thing on my own, legs went numb. This year I am back to officially complete my run and set my new goals for VMM 2017.
Our deepest thanks to the organizers and the VMM crew for making everything safe and convenient for the runners and for always reminding us that we are doing this for a good cause. To me running is more than just a physical activity, I am proud to have finished the race 8 months post knee operation and motivated to always challenge my limits and getting stronger everyday - mind, body and soul.
Music:
https://www.youtube.com/watch?v=N9_l7er67hQ
Find me on social media:
Instagram: @wearblackanddance
Blog: http://wearblackanddance.blogspot.com/
Facebook: https://www.facebook.com/wearblackanddance
Nếu bỏ qua sự buồn và hụt hẫng khi thấy cảnh thị trấn Sapa biến thành công trường khổng lồ, chuyến đi năm nay của Phương và các bạn không thể tuyệt vời hơn. Đúng giờ này hai tuần trước, cả nhóm vừa rời ga Trần Quý Cáp, nằm giường tầng nói 1000 câu chuyện trên chuyến tàu đêm.
VMM năm ngoái, với đôi chân đi còn mỏi đừng nói đến chạy, Phương theo chân các bạn chụp ảnh, "bị lừa" bởi đoạn dốc đầu tiên rất dễ đi để rồi mon men trèo đèo lội suối 10 kilomet một mình trong điều kiện bùn lầy trơn trượt. Năm nay để kỷ niệm đôi chân đã trộm vía hồi lại được chút chút 8 tháng sau mổ, quyết tâm cùng chạy với các bạn một lần nữa được ngắm cảnh ruộng bậc thang mùa gặt và lấy được huy chương Finisher.
Ngoài việc các runners được vượt qua bản thân, giao lưu gặp gỡ, ngắm cảnh đẹp, hiểu về văn hóa địa phương..., một phần số tiền đăng ký của mỗi vận động viên sẽ được đóng góp trở lại cho cộng đồng và môi trường địa phương. Đây là điều làm mình cảm thấy có ý nghĩa nhất khi tham gia VMM.
Bọn mình đều hoàn thành chặng đường, với người về đầu tiên của nhóm chạy mất 1 giờ 20 phút, xếp thứ 55/406 và người chốt đoàn là mình, 2 giờ 13 phút xếp hạng 233/406 finishers (không tính những runners dừng cuộc sớm).
Chặng 10km so với các chặng khác (21, 42, 70, 100 km) như kiểu là người ta đi bộ một vòng Hồ Gươm thôi ạ, nhưng đối với những người không có kinh nghiệm chạy địa hình tự nhiên như bọn mình thì không phải là dễ dàng. Hẹn gặp Vietnam Mountain Marathon 2017 với half marathon đầu tiên của nhóm.
Find me on Social Media:
Blog: https://wearblackanddance.wordpress.com/
Instagram: @wearblackanddance
acl 2016 在 ぷあたんアカデミー Youtube 的精選貼文
チャンネル登録&好評価おねがいします(・ω・)
FIFA17にJリーグ収録!その予習のためウイイレ2014・蒼き侍の挑戦で、横浜FMを率いて最強クラブを目指します!
タイvs日本、Thai Japan PES/ウイイレ2016シミュレーション
https://www.youtube.com/watch?v=27nZX...
Jリーグでアジアの頂点を目指せ!
https://www.youtube.com/playlist?list...
日本代表で最強マスターリーグ/Master Leagueに挑戦!
https://www.youtube.com/playlist?list...
日本代表で最強ユーロに挑戦!
https://www.youtube.com/playlist?list...
ぷあたんツイッター https://twitter.com/poordent
ウイイレブログ http://poordent.com/
acl 2016 在 Wear Black and Dance Youtube 的精選貼文
Hello ACL warriors! Thank you for watching the second episode of "MY ACL STORY" .Background story: I stretched my right knee's ACL in July 2015. I tried non-operative treatment first, doing rehab exercises however my knee just did not feel right when dancing. I finally had a reconstruction surgery on 28 January 2016 at the Central Military Hospital, Hanoi. Follow my Youtube Channel and my blog for regular updates on my recovery (in both Vietnamese and English).
Sau một thời gian chấn thương giãn dây chằng chéo trước đầu gối, Phương quyết định mổ tái tạo dây chằng tại khoa phâu thuật khớp, bệnh viện Quân Đội 108. Phương hi vọng những cập nhật của mình trên blog và Youtube có thể giúp những ai sắp trải qua hành trình phục hồi chấn thương có thêm động lực và niềm tin để quay lại với lối sống nắng động chúng ta vốn có :). Các bài viết của mình trên mạng xã hội sẽ được viết bằng cả tiếng Anh và tiếng Việt; cảm ơn mọi người đã luôn ủng hộ mình trong chặng đường này.
Music:
https://soundcloud.com/thevibeguide/deep-asleep-vibes-ft-sophie-ray
Find me on social networks:
Instagram: @wearblackanddance
Facebook: https://www.facebook.com/wearblackandance
Blog: https://wearblackanddance.wordpress.com/
Youtube: https://www.youtube.com/user/wearblackanddance
acl 2016 在 Melanie Martinez At ACL 2016 - YouTube 的推薦與評價
Singer/songwriter Melanie Martinez visited the GRAMMY Pro tent backstage at Austin City Limits Festival to talk about her perspective of ... ... <看更多>
acl 2016 在 ACL-2016-Neural Relation Extraction with Selective Attention ... 的推薦與評價
ACL -2016-Neural Relation Extraction with Selective Attention over Instances #106. Open. BrambleXu opened this issue on Apr 11, ... ... <看更多>
acl 2016 在 ACL 2016 - Claudia Hauff 的推薦與評價
ACL 2016. Posted on August 12, 2016. In this post, I have collected the 15 most interesting papers I came across when attending the 2016 Association for ... ... <看更多>