Aaron 乐

思考

关于 AI 时代的医疗、关于战略与执行、关于驾驭工程。把判断写下来,接受时间的检验。

系列
12 章 · 约 76 min

AI 时代医疗高质量数据集的建设模式与路径

一套面向法律行业的跨领域思考与分享:从范式跃迁、数据角色变迁、9 维度高质量标准,到五类 AI 场景的数据生产、数据飞轮、Palantir 本体路,最终落到法律行业映射与行动框架。

查看系列 →
第 00 章

开篇 · 医疗讲法律听,底层逻辑通用

这是一套给法律行业的跨领域思考与分享的开篇。医疗和法律是 AI 时代最相似的两个专业行业——都高度专业化、都强合规、都依赖专家判断、都怕 AI 出错有代价。

4 min
第 01 章

什么是 AI 时代(2026 视角)

2026 年的 AI 跟前两年完全不是一回事。从 2022 前的传统深度学习,到 2022 的 GPT 时刻,再到 2026 的推理 + 多模态 + 智能体——三代要的"数据形态"完全不同。

6 min
第 02 章

把"数据"讲清楚(概念栈)

谈数据建设之前,先把"数据"这个词讲清楚——元数据、数据集、数据资产、知识图谱、本体到底是什么。再讲三组容易混淆的概念,避免治理治错对象。

5 min
第 03 章

数据角色变了 · 从燃料到智商

第一代要标注样本、第二代要海量语料、第三代要推理轨迹+对齐数据+评测集。数据的角色从"训练燃料"升级为"能力载体"——这是整套分享的核心论点。

5 min
第 04 章

什么是高质量数据 · 4+5 维度

国家电子病历评级口径的 4 维度(完整、一致、整合、及时)只解决"业务能跑",AI 时代需要再加 5 个维度——标准化可计算、代表性、标注质量、知识密度、合规可追溯。

8 min
第 05 章

高质量数据怎么形成 · 三件套 + 三大难题

数据治理、数据中台、边用边治——三件套是入场券。AI 时代要补的新内涵:从管业务数据到管 AI 训练资产;从 BI 中台到 Data+AI 中台;从被动发现到主动闭环。最后抛出三件套解决不了的三大难题。

6 min
第 06 章

不同场景要不同数据 · 五类燃料分类

医疗 AI 应用按"能力本质"分五大类——知识型吃知识库、数据型吃训练集、推理型吃推理链、工作流型吃飞轮、具身型吃多模态轨迹。每一类对数据的诉求差异巨大。

9 min
第 07 章

高质量数据集怎么生产

高质量数据集不是治理出来的,而是生产出来的。知识型、数据型、推理型、智能体型、具身型应用,各自需要不同的数据生产线。

7 min
第 09 章

从业务核心竞争力反推数据建设

数据治理不是目的,业务胜利才是目的。AI 时代的数据建设要从业务闭环、AI 角色、数据资产和治理深度反推,而不是先做全院数据治理大工程。

8 min
第 10 章

法律行业映射 · 最像医疗的专业行业

法律和医疗是 AI 时代最相似的两个专业行业。法律行业 80% 的 AI 应用先吃知识库,真正的长期金矿则是裁判理由、专家论证和智能体反馈飞轮。

7 min
第 11 章

行动框架 · 从明天能做的事开始

AI 时代的数据建设不是技术议题,而是战略议题。最后一章把整套课程收束为核心金句、三类听众建议和一份可执行行动清单。

5 min