全部思考

思考

关于 AI 时代的医疗、关于战略与执行、关于驾驭工程。把判断写下来，接受时间的检验。

系列

12 章 · 约 76 min

AI 时代医疗高质量数据集的建设模式与路径

一套面向法律行业的跨领域思考与分享：从范式跃迁、数据角色变迁、9 维度高质量标准，到五类 AI 场景的数据生产、数据飞轮、Palantir 本体路，最终落到法律行业映射与行动框架。

查看系列 →

第 00 章

开篇 · 医疗讲法律听，底层逻辑通用

这是一套给法律行业的跨领域思考与分享的开篇。医疗和法律是 AI 时代最相似的两个专业行业——都高度专业化、都强合规、都依赖专家判断、都怕 AI 出错有代价。

4 min

第 01 章

什么是 AI 时代（2026 视角）

2026 年的 AI 跟前两年完全不是一回事。从 2022 前的传统深度学习，到 2022 的 GPT 时刻，再到 2026 的推理 + 多模态 + 智能体——三代要的"数据形态"完全不同。

6 min

第 02 章

把"数据"讲清楚（概念栈）

谈数据建设之前，先把"数据"这个词讲清楚——元数据、数据集、数据资产、知识图谱、本体到底是什么。再讲三组容易混淆的概念，避免治理治错对象。

5 min

第 03 章

数据角色变了 · 从燃料到智商

第一代要标注样本、第二代要海量语料、第三代要推理轨迹+对齐数据+评测集。数据的角色从"训练燃料"升级为"能力载体"——这是整套分享的核心论点。

5 min

第 04 章

什么是高质量数据 · 4+5 维度

国家电子病历评级口径的 4 维度（完整、一致、整合、及时）只解决"业务能跑"，AI 时代需要再加 5 个维度——标准化可计算、代表性、标注质量、知识密度、合规可追溯。

8 min

第 05 章

高质量数据怎么形成 · 三件套 + 三大难题

数据治理、数据中台、边用边治——三件套是入场券。AI 时代要补的新内涵：从管业务数据到管 AI 训练资产；从 BI 中台到 Data+AI 中台；从被动发现到主动闭环。最后抛出三件套解决不了的三大难题。

6 min

第 06 章

不同场景要不同数据 · 五类燃料分类

医疗 AI 应用按"能力本质"分五大类——知识型吃知识库、数据型吃训练集、推理型吃推理链、工作流型吃飞轮、具身型吃多模态轨迹。每一类对数据的诉求差异巨大。

9 min

第 07 章

高质量数据集怎么生产

高质量数据集不是治理出来的，而是生产出来的。知识型、数据型、推理型、智能体型、具身型应用，各自需要不同的数据生产线。

7 min

第 08 章

数据未来演进 · 从分析数据到 AI 大脑

过去数据用来看清现状，现在数据用来训练智能，未来数据会定义 AI 的临床和法律边界。真正重要的不是数据存量，而是能否形成飞轮。

6 min

第 09 章

从业务核心竞争力反推数据建设

数据治理不是目的，业务胜利才是目的。AI 时代的数据建设要从业务闭环、AI 角色、数据资产和治理深度反推，而不是先做全院数据治理大工程。

8 min

第 10 章

法律行业映射 · 最像医疗的专业行业

法律和医疗是 AI 时代最相似的两个专业行业。法律行业 80% 的 AI 应用先吃知识库，真正的长期金矿则是裁判理由、专家论证和智能体反馈飞轮。

7 min

第 11 章

行动框架 · 从明天能做的事开始

AI 时代的数据建设不是技术议题，而是战略议题。最后一章把整套课程收束为核心金句、三类听众建议和一份可执行行动清单。

5 min