今天,第四范式發布了先知AIOS 5.0,一款全新的行業大模型平臺。
大語言模型的原理是根據歷史單詞去不斷預測下一個單詞,換一句常見的話:Predict the Next “Word”。
當前對于行業大模型的普遍認知就是沿用這種邏輯,用大語言模型去 fine-tune 行業數據,預測下一個字。
但各行各業的場景往往面對的不是簡單的文字格式,行業需要的往往也不是預測下一個字,而是Predict the Next“X”,這里的“X”可能包含水文數據、健康報告、設備監測數值、設計推演等。
先知AIOS 5.0 進一步升級預測下一個X的能力。其核心特點是基于各行各業場景的X模態數據,構建行業基座大模型。
先知AIOS 平臺是第四范式的核心產品,時至今日已經發展近10年, 通過先知AI平臺1.0到5.0的進化,持續降低AI門檻,實現對更多場景的規?;采w。2015年,先知AIOS 1.0版本首次發布,通過高維、實時、自學習框架大幅提升模型精度;2017年,先知AIOS 2.0版本利用自動建模工具HyperCycle,大幅降低了模型開發門檻;2020年發布的先知AIOS 3.0版本規范AI數據治理和上線投產,完成建模到落地應用“最后一公里”;2022年,先知AIOS 4.0版本引入北極星指標,最大化發揮AI應用價值,提升企業核心競爭力。今天發布的先知AIOS 5.0版本,旨在幫助各行各業構建行業基座大模型。
全新升級后的先知AIOS 5.0,解決了當前行業大模型只能將行業文本數據喂給大語言模型、生成下一個字的問題,讓大模型能來到的領域更加廣泛。以健康管理領域為例,如果把大量的專業醫學及健康相關的語料投喂給大語言模型,大語言模型可以理解相關的術語和指標;但如果你把自己近三年的體檢報告中的某些指標發給大模型,并詢問明年自己的身體狀況,它并不能夠預測給出答案,因為這個問題超出了“語言“的范疇。所以這樣的行業大模型并不是一個真正的健康管理大模型。
如何才能構建真正的健康管理大模型呢?如果“X“的模態從“文字Word”變成了“體檢報告數據”,模型如果可以不斷地根據歷史體檢報告數據去預測下一個體檢報告。這就是AIOS 5.0平臺上構建的一個健康管理大模型。
使用Predict the Next “X”的技術原理,第四范式已經與客戶一起打造了一系列的行業大模型。
例如在健康管理領域,X是體檢報告數據,我們基于歷史上的體檢報告數據,構建了健康管理大模型。它會基于過去5年你的體檢報告,依次“生成”未來第1年、第2年、第3年的體檢報告,供醫生給出專業的健康管理建議。

又例如在水電管理領域,X是設備檢測數據,我們基于歷史上的設備檢測數據,構建了水電設備大模型。它會基于過去7天機組子部件的運行狀態,依次“生成”未來 3 天小時級的定轉子部件報告,供運維人員給出維修方案。

在水務領域,X是水文數據,我們基于歷史上的水文數據,構建了水務大模型。它會基于歷史水文數據和未來7天的氣象數據,依次“生成”未來第1天、第2天……至第7天的水文數據報告,供水文監測人員識別發生洪水及相關次生災害險情、采取應急預案。

在聲學領域,X是射線分布圖,我們基于這些歷史數據,構建了聲學大模型。它可以基于音樂廳的幾何模型和房間數據,從聲源發射5000Hz頻率射線,生成射線在10ms,20ms,30ms,40ms的位置分布圖。供專業人員評估當前音源擺放位置是否給觀眾提供高品質的聽覺體驗。

以上的行業大模型都是基于先知AIOS 5.0構建的。企業用戶可以基于“X模態”的數據,在該平臺上構建行業大模型,解決行業的高價值問題。