开篇 · 医疗讲法律听,底层逻辑通用
这是一套给法律行业的跨领域思考与分享的开篇。医疗和法律是 AI 时代最相似的两个专业行业——都高度专业化、都强合规、都依赖专家判断、都怕 AI 出错有代价。
关于 AI 时代的医疗、关于战略与执行、关于驾驭工程。把判断写下来,接受时间的检验。
一套面向法律行业的跨领域思考与分享:从范式跃迁、数据角色变迁、9 维度高质量标准,到五类 AI 场景的数据生产、数据飞轮、Palantir 本体路,最终落到法律行业映射与行动框架。
这是一套给法律行业的跨领域思考与分享的开篇。医疗和法律是 AI 时代最相似的两个专业行业——都高度专业化、都强合规、都依赖专家判断、都怕 AI 出错有代价。
2026 年的 AI 跟前两年完全不是一回事。从 2022 前的传统深度学习,到 2022 的 GPT 时刻,再到 2026 的推理 + 多模态 + 智能体——三代要的"数据形态"完全不同。
谈数据建设之前,先把"数据"这个词讲清楚——元数据、数据集、数据资产、知识图谱、本体到底是什么。再讲三组容易混淆的概念,避免治理治错对象。
第一代要标注样本、第二代要海量语料、第三代要推理轨迹+对齐数据+评测集。数据的角色从"训练燃料"升级为"能力载体"——这是整套分享的核心论点。
国家电子病历评级口径的 4 维度(完整、一致、整合、及时)只解决"业务能跑",AI 时代需要再加 5 个维度——标准化可计算、代表性、标注质量、知识密度、合规可追溯。
数据治理、数据中台、边用边治——三件套是入场券。AI 时代要补的新内涵:从管业务数据到管 AI 训练资产;从 BI 中台到 Data+AI 中台;从被动发现到主动闭环。最后抛出三件套解决不了的三大难题。
医疗 AI 应用按"能力本质"分五大类——知识型吃知识库、数据型吃训练集、推理型吃推理链、工作流型吃飞轮、具身型吃多模态轨迹。每一类对数据的诉求差异巨大。
高质量数据集不是治理出来的,而是生产出来的。知识型、数据型、推理型、智能体型、具身型应用,各自需要不同的数据生产线。
过去数据用来看清现状,现在数据用来训练智能,未来数据会定义 AI 的临床和法律边界。真正重要的不是数据存量,而是能否形成飞轮。
数据治理不是目的,业务胜利才是目的。AI 时代的数据建设要从业务闭环、AI 角色、数据资产和治理深度反推,而不是先做全院数据治理大工程。
法律和医疗是 AI 时代最相似的两个专业行业。法律行业 80% 的 AI 应用先吃知识库,真正的长期金矿则是裁判理由、专家论证和智能体反馈飞轮。
AI 时代的数据建设不是技术议题,而是战略议题。最后一章把整套课程收束为核心金句、三类听众建议和一份可执行行动清单。