从业务核心竞争力反推数据建设
第九章 · 战略锚与 Palantir 的本体路
这一章是整套分享的战略锚。
前面讲了 AI 时代、数据概念、高质量维度、生产方法、飞轮演进。但如果不锚回业务价值,听起来仍然像一套技术方案。
真正的问题是:
我们不是为了治理数据而治理数据,是为了让 AI 跑通业务闭环,最终提升核心竞争力和生产力。
行业最大的误区,是先治理数据,再想 AI 能做什么。这是十年前 BI 时代的思路,在 AI 时代会浪费海量预算。
数据到竞争力的价值链
正确的价值链应该反过来看:
核心竞争力和生产力提升,决定业务闭环;
业务闭环,决定需要什么 AI 能力;
AI 能力,决定需要什么高质量数据。
所以起点不是”我们有什么数据”,而是:
我们要打造什么样的 AI 驱动业务闭环?
以医疗集团为例,业务闭环可能是:患者来源、筛查、诊断、治疗、随访、保险协同、健康管理、再就诊。
每个环节都可以 AI 化,但每个环节需要的数据完全不同。
四步反推法
Step 1:业务诊断。
先画出 AI 化业务闭环,不要先盘数据库。问清楚业务要赢在哪里,AI 要插进哪个环节。
Step 2:AI 角色二分法。
判断这个 AI 是赚生产力,还是赚核心竞争力。
- 生产力 AI:提高效率、降低成本,通常可以外购
- 核心竞争力 AI:沉淀独有能力、形成业务差异,必须自建或联建
Step 3:数据反推。
回到第六章的五类燃料分类。生产力 AI 多是知识型或工作流型,主要需要外部知识库和内部 SOP;核心竞争力 AI 多是数据型、推理型、工作流型混合,必须自建数据资产。
Step 4:精准治理。
不是全院数据全治理,而是 AI 要用的数据重点治理。不是等数据治理完才能上 AI,而是用 AI 上线倒逼数据治理。
外购 vs 自建
外购不是退而求其次,自建也不是越多越好。它是策略选择。
该自建的东西:
- 核心竞争力相关:专科推理、患者档案、专家偏好、临床反馈
- 高敏感数据:患者隐私、商业机密、客户专属材料
- 别人没有的数据:自家专科队列、MDT 推理链、律所方法论
该外购的东西:
- 行业通用知识:医保政策、临床指南、药品说明书、法规库、合同模板
- 算法模型层:诊断 AI、CDSS 引擎、通用大模型
- 算力和基础设施
- 标注服务和通用平台能力
金句很简单:
决定竞争力的自己干,决定生产力的尽量买。
法律行业完全同理。法规库、合规库、合同模板库外购性价比最高;专家论证库、客户专属 Agent、律所方法论沉淀必须自建。
给 CIO / CTO 的三条建议
第一年不要做”全院数据治理大工程”。
选 3-5 个 AI 业务闭环立项,用真实业务倒逼数据治理优先级。
生产力 AI 用 3 个月跑出来。
先做知识型、办公型、流程型应用,快速建立 AI 信心,争取下一年预算。
核心竞争力 AI 给 2-3 年战略耐心。
专科数据资产、推理链生产线、领域本体,不可能一个季度见效。
这三条对律所合伙人和法务负责人也成立。
Palantir 的本体路
台下很多人知道 OpenAI / Anthropic,但未必理解 Palantir 对专业行业的启发。
OpenAI 走的是通用智能路线。Palantir 走的是另一条路:本体路。
Palantir 的本体 (Ontology),就是把企业里的所有业务对象、属性、关系和动作,建成一张活的语义图谱:
- 对象:飞机、零件、订单、患者、病历、合同、判例、当事人
- 关系:属于、隶属、引发、组合、引用、援引
- 动作:采购、调度、诊断、转科、起草、审查、判决
LLM 不直接看原始数据,而是在这张本体图谱上查询、推理、执行动作。这解决了大模型”不懂企业业务”的根本问题。
为什么专业行业更该学 Palantir
医院和律所不可能自己训练 OpenAI 级别的基座模型。那条路走不通。
但 Palantir 路是可学的:
- 不需要训练通用大模型
- 需要建自己的领域本体:医疗本体、法律本体、专科本体、业务本体
- 通用大模型可以外购,本体必须掌握在自己手里
这也是第二章埋下”本体”概念的原因。
专业行业不卷大模型,卷领域本体。
本体之上,模型可换,Agent 可变,业务闭环不变。
这才是数据资产真正的护城河。
本章收口
先想清楚 AI 要支撑什么业务闭环,再想清楚 AI 是赚生产力还是赚竞争力,最后再决定数据怎么治、自建还是外购。
治理数据是手段,赢得业务是目的。别把手段当目的。
下一章,专门把这套逻辑映射给法律行业听众。
留言
欢迎留言,匿名也可以。填邮箱能收到我的回复通知。