您現在的位置是:首頁 > 人文

全網“最醜”驗證碼上線 網民助力醫學影像標註

由 北京日報客戶端 發表于 人文2022-05-05
簡介目前,在騰訊防水牆官網灰度上線後,已有近萬名使用者體驗了MedCAPTCHA醫學影象驗證碼,累計貢獻了近2萬條正確標註的醫學影象資料,專案也在持續迭代最佳化中

sid醫學影像上什麼意思

數字、英文、加減法、拼圖……在登入各種系統時,我們時常會遇見各式各樣的驗證碼。而如今,醫學影像竟然也成為了驗證碼,而且當你每次驗證時,還能有助於影像標註和診斷,一舉兩得。

2月3日,騰訊聯合深圳大學研發並上線了一批“特殊”的驗證碼。與其他常見的圖片驗證碼不同,它們全部由清一色的黑白灰圖片構成。驗證中所用到的圖片,全部來自於臨床上真實的脫敏醫學影象,透過驗證碼的形式開放給廣大網民自願體驗及參與標註。

這批驗證碼全名為“MedCAPTCHA 醫學影象驗證碼”,由騰訊安全平臺部和深圳大學生物醫學工程學院合作研發。目前,在騰訊防水牆官網灰度上線後,已有近萬名使用者體驗了MedCAPTCHA醫學影象驗證碼,累計貢獻了近2萬條正確標註的醫學影象資料,專案也在持續迭代最佳化中。由於選取了醫學影像標記中較為簡單的場景,即便是沒有專業知識的普通網民,只要參照示例也可以“照貓畫虎”完成標註。

全網“最醜”驗證碼上線 網民助力醫學影像標註

圖1:MedCAPTCHA醫學影象驗證碼已在騰訊防水牆官網灰度上線,使用者“照貓畫虎”可完成標註。

醫學影像標註費時缺人成痛點

為啥要上線醫學影像作為驗證碼?這與當下醫學影像標註費時費力、人力不足的普遍痛點有關。

在醫學上,90%的臨床診斷需要藉助經過標註的醫學影像。被標註的醫學影象,融入了專家的經驗知識與判斷,能夠縮減廣大醫務人員的重複工作和勞動時間,還可以應用在AI輔助醫學診斷等領域,有效推動醫學研究和臨床診療的高效開展。

但現階段對於有限的醫務人力資源而言,醫學影象的勾畫標註,是一項相當龐大而繁雜的工作。僅僅是針對單個病人的一組醫學影象,簡單的需要半小時完成勾畫,複雜的則要花上一兩小時。

在過去的四十年中,學術界和工業界的研究人員研發了大量基於人工智慧輔助的半自動甚至全自動的標註演算法,但是這些演算法模型,往往需要經過足夠多的標註醫學影象資料訓練,才能達到普適性更強、準確度更高的分類或診斷效果。因此,快速獲取海量的、具有準確標註的醫學影象資料,對醫療領域來說困難且迫切,僅僅依靠少數專業醫務者或醫學研究人員的力量遠遠不夠。

安全驗證技術與醫學跨界融合

驗證碼是一種人機識別手段,其主要作用是防止垃圾註冊、刷量刷票、論壇灌水等惡意行為。公開資料顯示,全球網民每日累計輸入驗證碼近2億次,而我國網民規模超過9。4億。按照這一資料估算,如果藉助龐大網民群體的力量,就能夠在1小時內勾畫完成4家大型醫院整整一年所需的醫學影象標註量。

基於這一想法,騰訊安全平臺部防水牆團隊與深圳大學醫學工程學院高毅教授團隊合作研發並灰度上線了“MedCAPTCHA醫學影象驗證碼”公益實踐專案,供廣大網民自願體驗。研發人員把深圳大學提供的未經標註的海量脫敏醫學影象,以圖片驗證碼的形式上線防水牆官網。

全網“最醜”驗證碼上線 網民助力醫學影像標註

圖2MedCAPTCHA線上驗證模式

但是,沒有醫學專業知識的普通網民,是否可以完成醫學影像標註這樣專業度高的工作?騰訊相關負責人介紹,在這個自願體驗的安全驗證環節中,使用者只需要參照給出的圖片示例“照貓畫虎”,移動滑鼠在圖片上進行簡單勾畫,就能完成線上驗證,併成功提供了一次醫學影象標註答案。

“我們選取的是比較簡單的標註場景,是讓廣大網民參與到醫學影象標註的初篩工作中來。”這位負責人介紹,即使是不具備任何專業醫學知識的普通網民,也可以參照之前的示例完成標註。而對於收集到的影象標註資訊,專業醫學研究人員會在後臺對收集到的影象標註資訊進行融合和篩選處理,最終將質量最優的資料提供給大資料工作者和醫生群體。

人工識別標註的結果,將為公共醫療統計、精準醫療分析提供可靠的、核心的影像特徵基礎,還可以作為機器學習的訓練樣本,促進人工智慧在醫療領域的更多應用。該公益專案也正在聯合騰訊使用者研究與體驗設計團隊(CDC)持續迭代最佳化中。

圖片來源:騰訊

推薦文章