當(dāng)前位置:首頁 >  科技 >  IT業(yè)界 >  正文

數(shù)睿數(shù)據(jù)·數(shù)據(jù)通:Palantir“本體論”的輕量級敏捷實(shí)踐?

 2025-11-25 10:13  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  阿里云優(yōu)惠券 先領(lǐng)券再下單

近期,大數(shù)據(jù)獨(dú)角獸Palantir憑借其在國防領(lǐng)域的深度應(yīng)用引發(fā)行業(yè)關(guān)注,其核心的“本體論”方法論體現(xiàn)了一種追求規(guī)范與統(tǒng)一的工程思想。

Palantir的“本體論”方法論為數(shù)據(jù)應(yīng)用提供了重要的理論基礎(chǔ)。該方法論強(qiáng)調(diào)通過預(yù)先定義完整的業(yè)務(wù)實(shí)體、關(guān)系與規(guī)則,構(gòu)建統(tǒng)一的數(shù)據(jù)語義框架,確保數(shù)據(jù)的準(zhǔn)確性與一致性。這種“精密工程”式的approach,在業(yè)務(wù)邏輯相對穩(wěn)定、對數(shù)據(jù)一致性要求極高的場景(如國防、金融風(fēng)控等)中展現(xiàn)出獨(dú)特價值。

數(shù)睿數(shù)據(jù)于2024年發(fā)布的「數(shù)據(jù)通」是基于smardaten構(gòu)建的面向數(shù)據(jù)工程的產(chǎn)品解決方案。它與Palantir的核心理念驚人的相似,承襲并通過方法論進(jìn)化與實(shí)踐創(chuàng)新,實(shí)現(xiàn)更輕量、更敏捷的本土化實(shí)踐。

今天,我們就來做一個詳細(xì)的拆解!

一、承襲核心理念 以“模型”理解世界

Palantir 本體論不是簡單的對數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、加載,而是先構(gòu)建一個能夠精準(zhǔn)描述企業(yè)業(yè)務(wù)運(yùn)作的抽象數(shù)據(jù)模型。這個模型定義了:

·實(shí)體:如客戶、供應(yīng)商、訂單、設(shè)備

·實(shí)體之間的關(guān)系:如“客戶” “創(chuàng)建了”“訂單”

·實(shí)體的屬性:如“客戶”有“名稱”、“ID”、“行業(yè)”等屬性

數(shù)據(jù)通所倡導(dǎo)的“讓數(shù)據(jù)快速使用”的方法,在理念上與“本體論”不謀而合,并體現(xiàn)在專家知識庫的構(gòu)建中。同樣是先構(gòu)建一個抽象的行業(yè)模型庫,通過沉淀算法庫、標(biāo)準(zhǔn)庫、字段庫與模型庫,將行業(yè)專業(yè)知識系統(tǒng)化封裝。數(shù)據(jù)通用戶手冊中“專家?guī)斓臉?gòu)建方法”相關(guān)章節(jié),可以看出其構(gòu)成要素與Palantir本體論高度對應(yīng)。

兩者都堅(jiān)信,有效的數(shù)據(jù)治理和分析必須始于對業(yè)務(wù)本身的深刻理解和模型化抽象,而不是始于原始數(shù)據(jù)的粗暴處理。 這解決了傳統(tǒng)數(shù)據(jù)治理中“業(yè)務(wù)含義不清、數(shù)據(jù)模型設(shè)計(jì)與物理表開發(fā)斷鏈”的根本痛點(diǎn)。

Palantir本體論與數(shù)據(jù)通建模概念的對應(yīng)關(guān)系

二、進(jìn)化方法論 從“專家訪談”到“產(chǎn)品化輕量實(shí)踐”

1.實(shí)體識別方法的智慧

Palantir 的實(shí)施通常從與業(yè)務(wù)專家的大量訪談開始,以提取業(yè)務(wù)本體。數(shù)據(jù)通則更非常具體地給出了兩種構(gòu)建實(shí)體的方法,這可以看作是Palantir方法的流程化和工具化:

方式1:圍繞業(yè)務(wù)場景設(shè)計(jì) 這類似于Palantir的“逆向工程”,從業(yè)務(wù)流程(如“客戶下單”)中提取實(shí)體(“客戶”、“訂單”)和事件(“下單事件”)。

方式2:圍繞分析場景設(shè)計(jì) 即從分析目標(biāo)(如“銷售指標(biāo)”)反推需要的明細(xì)數(shù)據(jù)(“銷售記錄”)和維度實(shí)體(“商品”、“員工”),這是一種更符合數(shù)據(jù)倉庫建設(shè)思維的方法。

這種結(jié)合兩種思路的方法,使得數(shù)據(jù)通既具備了Palantir的業(yè)務(wù)洞察深度,又兼顧了傳統(tǒng)數(shù)據(jù)分析的需求,實(shí)用性更強(qiáng)。

數(shù)據(jù)通實(shí)體識別方法

2.專家規(guī)則——自動化的基石

這是兩者最精彩的交匯點(diǎn)。Palantir 的強(qiáng)大之處在于一旦本體建立,它能自動發(fā)現(xiàn)數(shù)據(jù)源中的實(shí)體并與本體映射,實(shí)現(xiàn)“快速找數(shù)”。數(shù)據(jù)通的“主動數(shù)據(jù)治理”理念,其“主動”性就體現(xiàn)在這里:

·專家規(guī)則:“映射規(guī)則”、“識別規(guī)則”(如身份證識別算法),就是Palantir中用于自動化映射的“規(guī)則”或“插件”的體現(xiàn)

·AI技術(shù):利用識別算法通過數(shù)據(jù)內(nèi)容來判斷字段含義,這比單純依賴元數(shù)據(jù)匹配更智能,與Palantir使用的技術(shù)類似

·復(fù)用與沉淀:即實(shí)施了一個或多個項(xiàng)目后,轉(zhuǎn)換算法就會逐步沉淀下來,供后續(xù)建模時復(fù)用。這正是在構(gòu)建一個不斷成長的、行業(yè)化的“專家知識庫”,這與Palantir在不同項(xiàng)目(如政府、金融、醫(yī)療)中積累的行業(yè)本體庫思路完全一致

可以說,數(shù)據(jù)通的“專家知識庫”不僅僅是數(shù)據(jù)模型的定義,更包含了實(shí)現(xiàn)自動化治理的“規(guī)則和算法”,這與Palantir本體論驅(qū)動的自動化數(shù)據(jù)集成理念不謀而合。

3.關(guān)鍵差異與數(shù)睿數(shù)據(jù)·數(shù)據(jù)通的特色

盡管理念與方法同源,但兩者仍有一定區(qū)別:

·受眾轉(zhuǎn)變:Palantir更像一個“專家”平臺,由數(shù)據(jù)科學(xué)家和工程師主導(dǎo),通過代碼進(jìn)行高級別的本體定義和集成,靈活性強(qiáng),但門檻高。數(shù)據(jù)通更偏向“具備數(shù)據(jù)思維的業(yè)務(wù)人員”。相較于Palantir的代碼驅(qū)動模式,數(shù)據(jù)通通過可視化建模、自然語言交互等產(chǎn)品化設(shè)計(jì),使業(yè)務(wù)專家也能主導(dǎo)數(shù)據(jù)模型構(gòu)建——這正是其“輕量級”實(shí)踐的核心體現(xiàn)。數(shù)據(jù)通產(chǎn)品手冊中有大量詳細(xì)工具的使用指引,充分體現(xiàn)了這種“開箱即用”的產(chǎn)品化思路。

·范圍聚焦:Palantir本體論貫穿從數(shù)據(jù)集成、治理到分析應(yīng)用的整個鏈條,尤其擅長處理復(fù)雜、異構(gòu)的關(guān)系網(wǎng)絡(luò)數(shù)據(jù)。數(shù)據(jù)通則明確其范圍“以數(shù)據(jù)模型為基石,向分析應(yīng)用延伸”,更側(cè)重于為數(shù)據(jù)倉庫/數(shù)據(jù)中臺的底層建設(shè)提供一種先進(jìn)的、自動化的模型設(shè)計(jì)方法,是數(shù)據(jù)治理流程的上游環(huán)節(jié)。

專家知識庫在數(shù)據(jù)治理中的應(yīng)用邏輯

三、數(shù)睿數(shù)據(jù)模式創(chuàng)新,漸進(jìn)式敏捷與智能閉環(huán)

1.漸進(jìn)式敏捷構(gòu)建:邊用邊建,快速見效

與傳統(tǒng)“大而全”的模型先行不同,數(shù)據(jù)通倡導(dǎo)從核心場景切入,邊使用邊完善知識庫。

這里面有兩個點(diǎn)值得強(qiáng)調(diào):一是基于數(shù)據(jù)通自動建模能力,用戶可以提問并不斷追問,在各類分析場景中穿梭,最終達(dá)成用戶滿意的問數(shù)意圖。二是數(shù)據(jù)通還會拆解意圖然后告訴你他是怎么分析的邏輯,用戶在過程中也能判斷數(shù)據(jù)通的分析邏輯和思維鏈?zhǔn)欠裾_。如果發(fā)現(xiàn)數(shù)據(jù)缺失,他也會告訴你,引導(dǎo)反向補(bǔ)全數(shù)據(jù)源。

這樣即便在初期數(shù)據(jù)基礎(chǔ)薄弱的場景之下,依然有較好的可用性。隨著專家知識庫的持續(xù)學(xué)習(xí)和完善,分析的準(zhǔn)確性與覆蓋度將快速提升。

智能問數(shù)意圖拆解

這種邊用邊建的優(yōu)勢也很突出:初始門檻低,無需前期巨大投入,快速啟動并見到一定成效;伴隨業(yè)務(wù)持續(xù)補(bǔ)充。這種模式使得數(shù)據(jù)通更加適合快速變化的業(yè)務(wù)環(huán)境,如工業(yè)制造、數(shù)字營銷等行業(yè)領(lǐng)域。

2.Data Agent與自然語言理解:智能響應(yīng)閉環(huán)

數(shù)據(jù)通采用AI智能體和自然語言對話,驅(qū)動數(shù)據(jù)快速使用的過程。這讓用戶的使用和維護(hù)都更加簡單。

·Data Agent:實(shí)現(xiàn)“智能取數(shù)—主動治理—智能問數(shù)”全流程閉環(huán),能根據(jù)場景動態(tài)獲取信息并生成數(shù)據(jù)分析模型。

·自然語言理解: 徹底降低使用門檻,用戶直接以“分析工廠缺陷率趨勢”等自然語言下達(dá)指令,系統(tǒng)精準(zhǔn)解析并直接交付結(jié)果。

四、實(shí)踐印證,數(shù)睿數(shù)據(jù)敏捷響應(yīng)正在釋放巨大價值

目前在衛(wèi)健、電力、制造等行業(yè)的領(lǐng)先企業(yè)已經(jīng)開始擁抱“敏捷響應(yīng)”的新模式。

以某市衛(wèi)健委項(xiàng)目為例,其成功關(guān)鍵在于漸進(jìn)式策略。項(xiàng)目并未在一開始追求構(gòu)建完美而龐大的數(shù)據(jù)模型,而是聚焦于“醫(yī)療質(zhì)量監(jiān)測”等關(guān)鍵場景,快速梳理并沉淀了覆蓋診療、藥品、病種等60+項(xiàng)醫(yī)療領(lǐng)域數(shù)據(jù)模型,每個模型統(tǒng)一定義所有數(shù)據(jù)字段和標(biāo)準(zhǔn),構(gòu)建于數(shù)據(jù)通的專家知識庫中。

專家知識庫模型在數(shù)據(jù)通中的配置效果

在此基礎(chǔ)上,數(shù)據(jù)通逐步開始接入轄區(qū)醫(yī)院的異構(gòu)數(shù)據(jù)源,完成超過20萬張數(shù)據(jù)表的整合與治理,形成了統(tǒng)一規(guī)范的醫(yī)療數(shù)據(jù)中心。依托專家知識庫的支撐,平臺已能夠?qū)Σ糠謭鼍皩?shí)現(xiàn)自動化映射和智能匹配推薦,從而抽取出目標(biāo)數(shù)據(jù),將跨院數(shù)據(jù)獲取從被動轉(zhuǎn)為主動,將原本耗時三個月的人工比對工作,壓縮至短短一周。

主動數(shù)據(jù)治理智能匹配推薦

在項(xiàng)目成功上線后,隨著接入醫(yī)院數(shù)量增加至40個及業(yè)務(wù)場景的不斷擴(kuò)展,平臺內(nèi)沉淀的專家數(shù)據(jù)模型從初始聚焦核心場景的60余個,逐步豐富至200余個,顯著提升了AI大模型對醫(yī)療業(yè)務(wù)語義的理解能力,智能治理與分析的場景覆蓋面日趨全面。

現(xiàn)在,只需像聊天般輸入需求,曾經(jīng)需要專業(yè)團(tuán)隊(duì)耗時數(shù)周完成的"慢性病監(jiān)測報告"、"就診趨勢分析"、"疾病流行趨勢預(yù)測"等復(fù)雜任務(wù),如今彈指間就能躍然屏上。這一過程充分體現(xiàn)了“數(shù)據(jù)越流動越智慧,越使用越增值”的平臺進(jìn)化價值。

結(jié)語

如果Palantir的本體論是構(gòu)建企業(yè)“數(shù)據(jù)大腦”的尖端哲學(xué),那么數(shù)睿數(shù)據(jù)·數(shù)據(jù)通就是一套成熟可操作的本土化工程藍(lán)圖。它承襲了模型驅(qū)動的核心理念,進(jìn)化出更輕量、產(chǎn)品化的方法論,并通過漸進(jìn)式敏捷與智能閉環(huán)實(shí)現(xiàn)了規(guī)?;桓?。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
Palantir

相關(guān)文章

熱門排行

信息推薦