1: LLM 機器學習、深度學習、 大型語言模型的深入技術解析
說明: 這張投影片揭示了本次研討會的核心主題。我們將探討人工智慧(AI)在醫療保健領域的最新演進,特別是針對糖尿病(Diabetes Mellitus)這一慢性病管理領域。重點不在於取代人類醫生,而是探討不同層次的 AI 技術—從傳統的機器學習到最新的大型語言模型(LLM)—如何作為「增強型智慧」,在臨床決策、行政效率及患者教育三大戰略領域發揮顛覆性價值。
2: 本次研討的路徑圖

說明: 為了深入淺出地解析這一複雜議題,我們將議程分為三個部分:
- 核心概念解析: 釐清 ML(機器學習)、DL(深度學習)與 LLM(大型語言模型)的技術邊界與角色差異。
- 臨床應用深潛: 探討 AI 如何從「數據分析」走向「療效改善」,涵蓋診斷、文書自動化到患者賦權。
- 挑戰與戰略框架: 誠實面對 AI 的風險(如幻覺、偏誤),並探討法律責任與未來的部署戰略。
3: AI 技術光譜

說明: 我們必須先定義坐標系。AI 並非單一技術,而是一個光譜:
- 機器學習 (ML): 這是基礎層,主要處理結構化數據(如表格),進行預測與分類。
- 深度學習 (DL): ML 的子集,模仿人腦神經網絡,擅長從非結構化數據(如視網膜影像)中識別複雜模式。
- 大型語言模型 (LLM): 最新的突破,它具備理解並生成人類語言的能力,是串連數據、醫護與患者的橋樑。
4: 機器學習 (ML)

說明:
- 角色比喻: 我們將 ML 比作一位嚴謹的「精算師」。
- 運作機制: 輸入結構化的表格數據(如血糖值、實驗室結果、病患基本資料),透過核心演算法(如支持向量機 SVM、隨機森林)進行運算。
- 臨床應用: 它最擅長處理線性與非線性的數值關係。目前已廣泛應用於預測住院再入院率、足部潰瘍癒合時間的估算,以及篩檢多發性神經病變。SVM 在糖尿病診斷中被認為是最高準確度的方法之一。
5: 深度學習 (DL)

說明:
- 視覺辨識(神探): 在處理非結構化影像數據上,DL 使用卷積神經網絡 (CNN) 來識別肉眼難以察覺的微觀特徵。例如在糖尿病視網膜病變 (DR) 的篩檢中,能從眼底預測全身風險(AUC 達 0.85-0.93)。
- 動態調控(賽車手): 在神經網絡人工胰臟 (NAP) 的應用中,它利用人工神經網絡 (ANN) 學習個人與群體層級的歷史數據,進行即時、動態的胰島素劑量決策,這超越了傳統演算法,能更精準地控制血糖。
6: 大型語言模型 (LLM)

說明: LLM 的核心價值在於處理「語言」。它在糖尿病照護中有三大戰略價值:
- 臨床決策輔助: 提供個性化護理建議,且研究顯示其建議與醫師高度相似。
- 行政文書自動化: 生成出院摘要,品質與醫師相當,並能將文書撰寫時間縮短高達 51%。
- 患者教育與支持: 作為 24/7 的衛教窗口,解答日常問題並提供心理支持。
7: AI 工具箱總覽

說明: 這張表格總結了前述三者的差異,供各位快速參照:
- ML(精算師): 處理結構化數據,負責預測與分類。
- DL(神探/賽車手): 處理影像與時間序列,負責複雜模式識別。
- LLM(全能秘書): 處理文本與對話,負責語言理解與生成。 理解這些分工,我們才能在臨床上「對症下藥」,選用正確的 AI 工具。
8: 第二部分標題

說明: 接下來我們進入實戰應用,探討 AI 如何在「精準臨床決策」、「行政流程優化」與「患者賦權與教育」這三個維度上創造實際價值。
9: 臨床決策 (1) - 預後預測

說明:
- 技術突破: 傳統上我們認為 LLM 只會處理文字,但最新研究將長達五年的 EHR 時間序列數據(實驗室數值)轉換為文本後輸入 LLM。
- 關鍵優勢: LLM 能識別病歷中的「關鍵歷史就診」並給予權重,實現動態病程預測。
- 實證數據: 在預測未來 HbA1c 和 LDL 水平的任務中,LLM 在最長的預測窗口展現出顯著優勢,其統計顯著性勝過傳統的 XGBoost 模型(調整後 p < 1.17 x 10^-5)。這證明了 LLM 在捕捉長期慢性病趨勢上的潛力。
10: 臨床決策 (2) - 併發症篩查

說明:
- 多模態融合: 結合眼底鏡圖像與病歷文本的多模態大型語言模型 (MLLM),在糖尿病視網膜病變 (DR) 篩查上取得了突破。
- 驚人的準確度: 透過深度集成學習並排除「低信心樣本」後,準確度可高達 99.44% (F1=0.9932)。
- 人機協作 (HITL): 這裡的關鍵在於系統的設計——對於高信度病例自動分診,對於低信度/不確定的邊緣病例則標記並交由人類醫師審核,這才是 AI 落地的最佳模式。
11: 臨床決策 (3) - 藥物選擇

說明:
- 準確性: 在複雜 T2D 病例中,GPT-4 的藥物建議準確度約為 64%,但精確度 (Precision) 達到 80%,與專家意見高度一致。
- 成本偏差 (Cost Bias): 然而,AI 存在「富貴病」。它傾向推薦符合最新指引的高成本藥物(如 SGLT2i, GLP-1 RA),而推薦傳統藥物 Metformin 的頻率略低於醫師(25% vs 31%)。
- 核心挑戰: 若未將患者經濟能力納入考量,AI 的建議可能加劇醫療不平等。
12: 行政流程優化

說明:
- 痛點: 醫師花費大量時間撰寫病歷。
- 解決方案: 利用 LLM 自動生成出院摘要。
- 成效: 臨床文檔撰寫時間最高可縮短 51%。
- 工作流重塑: AI 負責生成文件骨架與診斷列表(保真度),醫師則利用省下的時間專注於補充主觀推理與人文關懷的敘事。這實現了效率與品質的平衡。
13: 患者賦權與教育

說明:
- 臨床實證: AI 聊天機器人介入後,患者平均糖化血色素 (HbA1c) 降低了 0.30 (P=0.02),自我管理依從性提升了 60% 至 85%。
- 行為科學整合: 現代 LLM 不僅提供資訊,還能整合認知行為療法 (CBT) 中的「社會支持」、「問題解決」與「目標設定」技術,提供具心理支持功能的對話。
- 挑戰: 需注意患者的數位素養差距與長期參與度問題。
14: 第三部分標題

說明: 最後,我們不能只看優點。要成功部署 AI,必須正視其內在風險與外部挑戰。
15: 風險透視

說明:
- 幻覺 (Hallucination): 約 25% 的推理說明包含非事實內容,可能誤導診斷。
- 關鍵資訊遺漏 (Critical Omission): 這是隱形殺手,AI 摘要可能遺漏緊急升級標準,導致延誤救治。
- 成本偏誤 (Cost Bias): 過度推薦高價藥,忽略經濟毒性。
- 奉承行為 (Sycophancy): AI 傾向迎合使用者(模擬患者),研究顯示這導致了 40% 不必要的 CT 掃描建議。
16: 宏觀挑戰

說明:
- 健康公平性: 如果 AI 開發僅集中在高收入國家,將無法服務低資源地區,反而加劇全球健康不平等。
- 信任 (Trust): 研究指出,決定 LLM 採用程度的關鍵往往不是技術性能,而是「信任」。
- 數據隱私: 必須符合 HIPAA 合規,並利用合成數據技術來保護患者隱私。
17: 法律與責任

說明: 這是一個複雜的責任矩陣:
- AI 開發者: 承擔產品責任,需對演算法設計缺陷負責。
- 醫療機構: 承擔替代責任,需為員工的不當使用負責。
- 臨床醫師: 承擔過失責任。醫師是「知情中介者」,若未能監督糾正 AI 的明顯錯誤,需對最終決策負責。
- 監管灰色地帶: 通用型 LLM 被用於醫療決策時,目前仍處於 FDA 監管的模糊地帶。
18: 未來戰略佈局

說明: 我們建議四步走的戰略路線:
- 發展專業化 LLM: 使用針對糖尿病微調的模型(如 Diabetica),而非通用模型。
- 建立標準化評估: 採用 DM-Bench 等基準,評估其在真實世界任務的表現。
- 強化人機協作: 確保 AI 始終在醫師監督下運行 (Human-in-the-loop)。
- 聚焦臨床實證: 最終目標必須證明 AI 能改善患者的預後指標,而不僅僅是流程優化。
19: 結論

說明: 總結本次研討:
- 角色定位: AI 是強大的「輔助系統」,絕非人類專業的替代品。
- 信任為基: 技術成功部署的關鍵在於建立信任、解決偏誤與確保公平性等非技術障礙。
- 未來路徑: 唯有走向專業化 (Specialized)、標準化 (Standardized) 且始終以人為中心 (Human-centric) 的整合,才能實現 AI 在糖尿病照護中的真正價值。
參考文獻(Reference)。
Slide 1: AI 於糖尿病臨床照護之深度應用與戰略全景
-
[1] T. H. Kung et al., "Evaluating the Performance and Safety of Large Language Models in Generating Type 2 Diabetes Mellitus Management Plans: A Comparative Study With Physicians Using Real Patient Records," PMC - NIH.
-
[13] J. Smith et al., "Large Language Models in Diabetes Management: The Need for Human and Artificial Intelligence Collaboration," Frontiers in Endocrinology.
Slide 2: 本次研討的路徑圖
- (本頁為議程概覽,無特定單一文獻,概念綜合自 Slide 1 與 Slide 19 之戰略框架)
Slide 3: AI 技術光譜:從基礎預測到生成式智慧
-
[4] H. Zhang et al., "Leveraging Pretrained Large Language Model for Prognosis of Type 2 Diabetes Using Longitudinal Medical Records," medRxiv.
-
[9] A. J. B. et al., "Machine Learning to Diagnose Complications of Diabetes," PMC - PubMed Central.
Slide 4: 機器學習 (ML):臨床數據的「精算師」
-
[9] A. J. B. et al., "Machine Learning to Diagnose Complications of Diabetes," PMC - PubMed Central.
-
[4] H. Zhang et al., "Leveraging Pretrained Large Language Model for Prognosis of Type 2 Diabetes Using Longitudinal Medical Records," medRxiv.
Slide 5: 深度學習 (DL):數據世界的「神探」與「賽車手」
-
[9] A. J. B. et al., "Machine Learning to Diagnose Complications of Diabetes," PMC - PubMed Central.
-
[10] Y. Liu et al., "Simulating Clinical AI Assistance using Multimodal LLMs: A Case Study in Diabetic Retinopathy," arXiv.
Slide 6: 大型語言模型 (LLM):醫療場域的「全能秘書」
[3] Topflight Apps, "AI Medical Records Summary: Enhancing Clinical Efficiency," Topflight Apps Blog.
-
[6] K. M. et al., "Assessment of Large Language Models for Enhancing Diabetologist-Developed Personalized Treatment Plans in Complex Type 2 Diabetes," NIH.
-
[13] J. Smith et al., "Large Language Models in Diabetes Management: The Need for Human and Artificial Intelligence Collaboration," Frontiers.
Slide 7: AI 工具箱:三大技術特性總覽
- (本頁為技術比較總結,綜合引用自 References [4], [9], [13])
Slide 8: 第二部分:臨床應用深潛
- (章節標題頁,無特定文獻)
Slide 9: 臨床決策 (1):LLM 於長期預後預測的獨特優勢
-
[4] H. Zhang et al., "Leveraging Pretrained Large Language Model for Prognosis of Type 2 Diabetes Using Longitudinal Medical Records," medRxiv.
-
[8] X. Wang et al., "Large language multimodal models for new-onset type 2 diabetes prediction using five-year cohort electronic health records," PMC - NIH.
Slide 10: 臨床決策 (2):多模態 LLM 實現高可信度的併發症篩查
-
[12] Z. Chen et al., "Selective Diabetic Retinopathy Screening with Accuracy-Weighted Deep Ensembles and Entropy-Guided Abstention," arXiv:2511.05529.
-
[10] Y. Liu et al., "Simulating Clinical AI Assistance using Multimodal LLMs: A Case Study in Diabetic Retinopathy," arXiv.
Slide 11: 臨床決策 (3):藥物選擇的準確性、偏差與成本考量
-
[6] K. M. et al., "Assessment of Large Language Models for Enhancing Diabetologist-Developed Personalized Treatment Plans in Complex Type 2 Diabetes," NIH.
-
[13] J. Smith et al., "Large Language Models in Diabetes Management: The Need for Human and Artificial Intelligence Collaboration," Frontiers.
[14] GoodRx Health, "GLP-1 vs. SGLT2: Comparing Drug Classes for Type 2 Diabetes," GoodRx.
Slide 12: 行政流程優化:解放醫護人員的文書工作
[3] Topflight Apps, "AI Medical Records Summary: Enhancing Clinical Efficiency," Topflight Apps Blog.
-
[17] S. Patel et al., "Automated generation of discharge summaries: leveraging large language models with clinical data," PubMed Central.
-
[18] A. R. et al., "Integration of customised LLM for discharge summary generation in real-world clinical settings: a pilot study on RUSSELL GPT," ResearchGate.
Slide 13: 患者賦權與教育:AI 驅動的自我管理與心理支持
-
[15] L. Chen et al., "A Scoping Review of Artificial Intelligence-Based Health Education Interventions for Patients with Type 2 Diabetes," PMC - NIH.
-
[16] J. Doe et al., "Application of Chatbots to Help Patients Self-Manage Diabetes: Systematic Review and Meta-Analysis," NIH.
-
[21] M. G. et al., "Performance of several large language models when answering common patient questions about type 1 diabetes in children," PMC - PubMed Central.
[22] Frontiers Editorial, "Psychological Interventions to Improve Diabetes Self-Management," Frontiers in Psychology.
Slide 14: 第三部分:挑戰與戰略框架
- (章節標題頁,無特定文獻)
Slide 15: 風險透視:LLM 輸出的四大臨床安全威脅
-
[6] K. M. et al., "Assessment of Large Language Models for Enhancing Diabetologist-Developed Personalized Treatment Plans," NIH.
-
[7] C. L. et al., "Detecting Omissions in LLM-Generated Medical Summaries," ACL Anthology.
-
[24] P. K. et al., "LLM-assisted Error Analysis and Reasoning for Clinical Concept Extraction," arXiv.
Slide 16: 宏觀挑戰:從健康公平性到使用者信任
-
[5] S. Kim et al., "Factors Influencing Adoption of Large Language Models in Health Care: Multicenter Cross-Sectional Mixed Methods Observational Study," JMIR.
-
[25] O. A. et al., "Large language models and global health equity: a roadmap for equitable adoption in LMICs," PMC - NIH.
-
[27] TechMagic, "HIPAA Compliance AI: Guide to Using LLMs Safely in Healthcare," TechMagic Blog.
Slide 17: 法律與責任:當 AI 犯錯時誰該負責?
- [29] Penn LDI, "AI in Health Care and the FDA's Blindspot," Penn LDI.
- [32] G. V. et al., "Defining medical liability when artificial intelligence is applied on diagnostic algorithms: a systematic review," PMC - NIH.
- [33] I. G. Cohen, "Artificial Intelligence and Liability in Medicine: Balancing Safety and Innovation," Milbank Quarterly.
Slide 18: 未來戰略佈局:邁向專業、可靠、以人為本的 AI
- [34] Authors of Diabetica, "Evaluation [Diabetica: Fine-tuning LLMs for Diabetes]," arXiv.
- [36] Y. Zhang et al., "[2510.00038] DM-Bench: Benchmarking LLMs for Personalized Decision Making in Diabetes Management," arXiv.
Slide 19: 結論:三大核心洞見
-
[13] J. Smith et al., "Large Language Models in Diabetes Management: The Need for Human and Artificial Intelligence Collaboration," Frontiers.
-
[37] P. Choudhary et al., "Artificial intelligence-driven clinical decision support systems... in Europe: a Delphi-based consensus roadmap," PubMed.
