国产成人精品综合在线观看,欧美成a人片在线观看久,亚洲αv在线精品糸列,国产美女露脸口爆吞精

全部

讓機器“讀懂”醫療 天衍實驗室獲CHIP2020評測兩大獎項

來源:中國網科學

作者:

2020-12-24 16:33:12

日前,第六屆中國健康信息處理大會(CHIP 2020)舉辦的中文醫學信息處理評測競賽圓滿結賽,騰訊天衍實驗室依托其在醫學領域的長期技術積累和創新探索,一舉獲得“中文醫學文本命名實體識別”賽道冠軍、“中文醫學文本實體關系抽取”賽道亞軍。

信息抽取(IE)技術方案突破升級

對于醫學領域的自然語言文獻,例如醫學教材、醫學百科、臨床病例、醫學期刊、入院記錄、檢驗報告等,這些文本中蘊含大量醫學專業知識和醫學術語。將實體識別技術與醫學專業領域結合,利用機器讀取醫學文本,可以顯著提高臨床科研的效率和質量,并且可服務于下游子任務。但要想讓機器“讀懂”醫學數據,核心在于讓計算機在大量醫學文本中準確的提取出關鍵信息,這就涉及到了命名實體識別、關系抽取等自然語言處理技術。

命名實體識別(Named Entity Recognition, NER)和關系抽取(Relation Extraction, RE)是信息抽取(Information Extraction,IE)的兩大核心任務。命名實體識別旨在抽取所需實體,以醫療領域為例,需要從非結構化醫學文本中找出醫學實體,如疾病、癥狀的過程;實體關系抽取則需要同時提取出醫學實體及實體間的關系信息,即實體關系三元組 [頭實體 (subject),關系(predicate),尾實體(object)]。

實體關系三元組示意

在兩大評測任務中,騰訊天衍實驗室從數據和模型層面做出了針對性設計。在命名實體識別任務中,天衍實驗室使用的數據集由北京大學等院校及科研單位智慧醫療課題組聯合構建。基于醫療領域對專業性、準確性的高標準要求,及目前命名實體識別任務存在的實體頻次稀疏和實體長度偏長問題,天衍實驗室采用指針解碼的特殊方式,對單個實體的頭尾位置進行解碼,經過試驗證明,該方法在較長實體中的表現確有明顯提升。同時,天衍實驗室基于自身在醫療領域的經驗,嘗試結合大量醫療文本訓練領域自適應的新預訓練模型,進一步提升了模型表現。最終在評比測試集上,結合多種不同策略,天衍實驗室以F1值68.35獲得第一名。

實體關系抽取評測任務的數據來源于中文醫學信息抽取數據集CMeIE,也是目前最大的中文醫學關系數據集。因該數據中存在大量實體重疊和關系重疊的現象,天衍實驗室則采用了層疊指針網絡的基礎架構。首先通過兩個二值分類器提取頭實體的首尾位置,繼而采用Conditional layer normalization的方式融入頭實體信息,再針對每種關系,分別預測對應的尾實體。此外,為了更好地利用醫療詞匯的語義信息,天衍實驗室在輸入層融入領域詞向量,有效提升了實體邊界預測的準確率。最終在測試集上取得單模型第一(F1 61.70),融合模型(F1 63.87)第二的成績。

騰訊天衍實驗室基于自身NLP能力和相關科研成果,不斷通過一系列信息抽取相關競賽測試、突破,不僅累積了豐富場景應用經驗與方法,也將更好的輔助醫療行業技術升級和科研進步。

技術創新助力AI更“懂醫”

在醫療領域,電子病歷、生物醫療文獻中存在大量的非結構化文本,采用信息抽取技術對醫療文本進行結構化,提取其中的疾病,癥狀,部位等實體,并對實體之間的關系進行判斷,進而利用這些信息構建醫療知識圖譜,不僅有利于人工智能更好地學到領域內的專業知識,更進一步提升導診、輔診、疾病預測等下游醫療任務的性能。

具體來說,醫生在疾病診斷的過程中,不僅要知道患者的癥狀,而且要了解患者不同癥狀所對應的具體屬性,例如癥狀發生的時間、部位、變化情況。天衍實驗室AI導診和疾病預測功能,正是采用了上述信息抽取技術,可模擬醫生診斷過程,并提供循證路徑和一定的可解釋性。

如在AI導診場景中,當用戶輸入主訴,AI導診小程序可以返回推薦科室。用戶主訴中可能包含多個癥狀,不同癥狀的時間、部位、嚴重程度、病因誘因可能對應不同的疾病,通過關系抽取技術,可以捕捉到不同癥狀的具體屬性,從而有助于更精準的疾病預測和科室推薦。對于下圖中的患者主訴,首先采用ner技術提取癥狀、檢查等實體,繼而采用關系抽取技術對不同癥狀的具體屬性進行判斷,例如癥狀“腹脹不適”,對應的部位為“上腹”,時間為“3月余”,變化條件為“進食后明顯”,理解了癥狀的一系列細粒度屬性,才能進一步判斷可能的疾病和對應科室。

騰訊天衍實驗室致力于長期在自然語言基礎、語言理解、信息抽取、知識圖譜構建等進行研究創新,并將成果運用到落地的醫療自然語言等場景,目前已構建醫療行業大規模知識圖譜,支持了數百家醫院的輔診、導診、疾病輔助診斷、智能用藥等產品,助力醫保、醫院、疾控中心和其他醫療機構的智能化知識挖掘和管理難題,實現知識化轉型。

騰訊天衍實驗室專注于醫療健康領域AI算法研究及落地,旨在依托NLP、知識圖譜、大數據、醫療影像等技術系統,將算法能力輸出到騰訊健康小程序、QQ瀏覽器、微信搜一搜等終端應用。與此同時,騰訊天衍實驗室還與鐘南山院士以及復旦腫瘤醫院等頭部醫院建立聯合實驗室,與牛津大學、佐治亞大學、天津大學、微眾銀行AI部門等單位建立長期科研合作關系,目前已發表包括NIPS、KDD等多篇頂級學術論文,通過聯合社會各界進行技術深入研究,騰訊天衍實驗室將進一步加速科研應用落地,以服務于臨床應用。

[責任編輯:楊凡、崔中連]

想爆料?請登錄《陽光連線》( https://minsheng.iqilu.com/)、撥打新聞熱線0531-66661234或96678,或登錄齊魯網官方微博(@齊魯網)提供新聞線索。齊魯網廣告熱線0531-81695052,誠邀合作伙伴。

《立功受獎軍人家庭送喜報工作辦法》政策解讀

《立功受獎軍人家庭送喜報工作辦法》政策解讀。近日,退役軍人事務部、中央軍委政治工作部、中央軍委國防動員部聯合印發《立功受獎軍人家庭...[詳細]
新華網 2020-12-24

從“煤”到“布”:煤省山西布局紡織新材料產業鏈

2020年中國紡織大會于12月22日—23日在山西召開。中新網太原12月24日電從“煤”到“布”,煤省山西積極布局紡織新材料產業鏈,實現了由“黑...[詳細]
中國新聞網 2020-12-24

三江源生態法庭啟動新規:被告人參與生態修復代替經濟賠償

青海省高級人民法院供圖。中新網西寧12月24日電記者24日從青海省高級人民法院獲悉,三江源生態法庭與玉樹市檢察院等有關單位達成一致,自今...[詳細]
中國新聞網 2020-12-24

吸煙會使人變窮?報告:吸煙人群家庭貧困概率增高

中新網客戶端北京12月24日電煙草使用和貧困之間有何聯系。越貧困的家庭吸煙率越高嗎。24日,在北京發布的一則調查報告顯示,吸煙人群的家庭...[詳細]
中國新聞網 2020-12-24

沈陽對確診病例開展新冠病毒核酸全基因組序列測定工作

中新網沈陽12月24日電沈陽市疾病預防控制中心副主任王萍在24日召開的沈陽市新型冠狀病毒肺炎疫情防控工作第八場新聞發布會上通報說,為準確...[詳細]
中國新聞網 2020-12-24

“北大學子弒母案”今日開庭審理 一審宣布擇期宣判

中新網福州12月24日電2020年12月24日,福建省福州市中級人民法院一審公開開庭審理了被告人吳謝宇故意殺人、詐騙、買賣身份證件案,一審宣布...[詳細]
中國新聞網 2020-12-24

思政大賽頒獎盛典“落地”高校大屏!山東百萬余學子共饗思政文化盛宴

山東省首屆高校思政短視頻大賽雖已圓滿落幕,但賽事影響仍在持續。近日,本次大賽的頒獎盛典通過山東高校思政聯播平臺(線下戶外LED大屏+線...[詳細]
人民日報客戶端山東頻道 2020-12-24

上海一小區半夜著火 9歲男孩“教科書式”救人

【上海一小區半夜著火9歲男孩教科書式救人 下樓敲鄰居門,路上攔車報警】近日,上海金山某小區一居民樓半夜突然失火。家住302室的9歲男孩小...[詳細]
人民網微博 2020-12-24

練好制造“基本功” 我國加快提升產業鏈競爭力

新華社北京12月24日電(記者張辛欣)中國制造加快升級,練好“基本功”尤為重要。工信部副部長王志軍24日在國新辦發布會上說,“十四五”期...[詳細]
新華網 2020-12-24

70歲以上老人可考駕照后 記者探訪上海駕校

中新網上海12月24日電掛擋踩油門、打死方向盤、把邊線、倒車入庫……在位于上海浦東新區的一家駕校訓練基地,71歲的學員徐國強老人有條不紊...[詳細]
中國新聞網 2020-12-24

交通運輸部:研究解決老年人出行的“數字鴻溝”問題

今日,全國交通運輸工作會在京召開。同時,明年將實現20個省份普及道路客運電子客票服務,推進實現“刷臉”進站乘車。客運持續穩定恢復,11...[詳細]
北京日報客戶端 2020-12-24

《吳天一高原醫學》在青海西寧首發

中新網西寧12月24日電記者24日從青海省心腦血管病專科醫院獲悉,由中國工程院院士吳天一著的《吳天一高原醫學》當天在青海西寧首發。《吳天...[詳細]
中國新聞網 2020-12-24
版權所有: 齊魯網 All Rights Reserved
魯ICP備09062847號-1 網上傳播視聽節目許可證1503009 互聯網新聞信息服務許可證37120170002
通訊地址:山東省濟南市經十路18567號  郵編:250062
技術支持:山東廣電信通網絡運營有限公司