改進基礎要素,解放醫療AI生產力
改進基礎要素,解放醫療AI生產力
南京都昌信息科技有限公司 袁永福 2025-9-9
■■ 前言
在AI時代,算力、數據、算法是三大核心基礎要素,同時還必須滿足合規性。在中國的HIT領域中,要解放AI的生產力,就需要在這些核心要素上做足功夫,否則基礎不牢,地動山搖。本文就對上述基礎要素進行討論。
■■ 要素一,算力
對于算力資源,中國在底層硬件上遭遇了卡脖子的問題,目前只能緩慢解決。因此在未來較長的時間內,中國的算力資源總體是短缺的。
為此,2023年12月26號,中國正式啟動“全國算力一張網”的建設,由國家發展改革委、國家數據局等部門聯合推動,旨在構建全國范圍的算力資源協同調度體系。算力一張網能宏觀調控,減少重復建設,并在地理上更適配中國電網分布,幫助實現碳中和的目標。
筆者可以想象,未來可能會出現“中國國家算力網公司”,調度全國算力;各個IT大廠的數據處理中心則類似一個個發電廠,聯網提供計算服務;各個用戶接入算力網來消費算力資源并向算力網公司支付費用,而算力網公司則和各個數據中心結算費用。算力網和電力網有很多相似之處。比如電力網有“西電東送”,而算力網有“東數西算”,目前電網中的潮汐處理、削峰填谷之類的操作也可能會出現在算力網中。
當算力資源成為社會公共服務資源時,大多數醫院由于經費有限,無力自購算力服務器,此時可以考慮使用公共的算力資源。但是醫療數據是需要強監管的,在條件允許的情況下可以建設小型算力網。比如衛健委可以牽頭建立區域算力中心,通過網絡專線連接轄區內的醫院,讓多家醫院共享這個區域算力網,順帶完成互聯互通,實現“數據不出域,算力可流動”。
■■ 要素二,數據
中國醫院中存在大量的病歷數據,這些數據蘊藏著巨大的價值,但長期躺在“數據冷宮”中而不能帶來價值。要讓這些數據得到充分應用,需要解決三個問題:
第一,數據可以被機器識別。筆者觀察到,一些廠家出于商業利益而對其原始病歷文件進行加密,僅僅提供PDF文件對外共享數據。雖然目前的技術手段能從PDF這種二進制文件中提取數據,但效率低下,這種方式不能普及。而此時行業內新應用的國產OFD技術能解決這個問題,OFD的文件格式被設計成能非常方便的被機器閱讀識別,并且受到國家衛健委的大力支持。
目前筆者觀察到,有些醫院實現了“病歷文檔→PDF→OFD”,這不是最優實現路徑,因為“病歷文檔→PDF”的過程中已經讓大量的信息永久丟失,此時“PDF→OFD”過程中被迫需要補錄大量的信息,這增加了系統復雜度。如果病歷編輯器能直接生成OFD文件,沒有“中間商層層轉包”,就不會有這些麻煩了。
第二,敏感數據。醫療數據中包含了大量的敏感數據,這導致病歷數據無法離開醫院內網,為此醫院不得不花錢自建算力服務器。而特別設計的OFD文件是支持自動脫敏的。脫敏可以降低網絡安全事故造成的損失,當這個損失小于醫院使用公共算力網帶來的效益時,則可以考慮讓病歷數據運行在公共算力網中。畢竟醫院也是一個社會組織機構,不應有太多的特殊性。
另外,筆者建議新增一個病歷書寫質控規則,那就是在病歷正文中不得出現敏感信息,否則扣分,這能幫助自動脫敏。
為此,我們南京都昌公司的病歷編輯器軟件新增了“流版一體化”技術,無需依賴任何第三方軟件即可生成OFD文件;并通過特定標記,使得OFD文件可以自動脫敏。都昌編輯器已經在全國數萬家醫院運行使用,估計每天產生數百萬頁的病歷文檔。當全面升級后,則能為AI應用源源不斷的提供大量優質的原始數據。
第三,結構化數據。經過和南京圖靈研究院AI底層算法專家的深入溝通,筆者認為,盡管AI能識別自然文本,但結構化數據仍然具有明顯優勢:1.它能顯著降低AI的總體擁有成本,并減少幻覺;2.對于醫院管理來說,結構化電子病歷有利于醫療行為同質化,提高醫療體系綜合運行效率;3.在AI能力范圍之外,傳統軟件處理結構化數據更方便。
為此我們特別新推出了《都昌醫療文書工具集》,內置了國家衛健委的數據元標準,幫助醫院產生符合行業標準的結構化病歷文檔,既滿足管理和臨床要求,又能為AI提供高品質的數據礦石。
■■ 要素三,算法
筆者對AI底層算法了解不多,目前只能等待IT科技大廠和各種獨角獸傳出好消息。
■■ 合規性
合規性在AI應用有一票否決權,是一根不可觸碰的高壓線。另外國家衛健委要求居民健康檔案要向個人開放共享。為此筆者構思了一種應用架構,在居民健康檔案共享平臺的基礎上二次共享給AI,用于降低合規性的難度。以下是實現步驟:
第一步,衛健委把居民健康檔案分享平臺做扎實。醫院的各種醫療服務記錄盡可能多的匯總到平臺中。另外要統一平臺中的文件格式,將PDF轉換為OFD格式,并且加上自動脫敏的功能。
第二步,在平臺上添加面向AI的數據接口,讓AI可以讀取平臺中的各種數據,數據出平臺必須自動脫敏。
第三步,AI數據接口上添加授權控制。讓自然人或者監護人可以自行對AI進行讀取授權控制。AI讀取數據時發送告知消息給個人。
第四步,AI廠家可以進行金融補貼(現金或醫藥費補貼)刺激自然人共享其個人數據。當大量的自然人共享其個人數據時,AI廠家就能獲得足量多的數據來支持其業務發展。
在這種模式下,各方訴求都得到兼顧:
- 對于平臺,將很大一部分責任和風險轉嫁給個人,合規難度降低。
- 對于個人,可以零售自己的私人數據獲利,這是自己的個人民事行為,也比較容易合規。
- 對于AI廠家,終于有一種合規花錢購買真實數據的方式,可以滿足“數據饑渴”。而且可以根據所需病種、地區等精確過濾條件,只獲取最小數據集,也有利于數據安全。數據價格是由AI廠家和大量的個體之間的博弈動態設置,能自我調節,更符合市場經濟規律。
- 對于醫院或醫生,也可以參與利益分成,這也能刺激其改善上傳數據的質量。
- 對于衛健委,以前只有衛健委一方在勞心勞力的建設這個平臺。經過筆者設計,個人、醫院、AI廠家等都有動力來參與建設這個平臺,形成各方合力。商業模式上也能閉環,形成滾動發展。
- 對于數據資產,醫院想要把病歷數據打包成數據資產對外銷售時,理論上可能需要挨個獲得患者個人的簽名授權,而且醫院獲利后應當精準回饋患者個人,這使得操作很復雜,難于普及。而這種由患者個人主導零售數據,各方分成的模式,操作簡單,便于普及,創造了一種新的數據資產的商業模式。
總之,筆者構思的這種應用架構,實現了權益共享,風險平攤,過程透明,定價合理。為大范圍合規數據共享利用提供了一個新的選項。
■■ 小結
算力、數據、算法這三個基本要素加上合規性,這構成了整個醫療AI生態體系的根基。只有把這些根基做扎實,才能更好的解放醫療AI的生產力,使其更好的幫助中國醫療行業的價值最大化。
posted on 2025-09-09 07:21 袁永福 電子病歷,醫療信息化 閱讀(551) 評論(0) 收藏 舉報
浙公網安備 33010602011771號