2018年11月28日,清華大學(xué)大數(shù)據(jù)研究中心舉辦“2018清華工業(yè)大數(shù)據(jù)技術(shù)論壇”,安筱鵬博士在論壇上就數(shù)字+算法定義的世界進(jìn)行了發(fā)言。下面是安筱鵬博士演講的重點(diǎn)摘錄:
幾千年來,人類如何進(jìn)行決策?
幾千年來,人類社會一直面臨的重大挑戰(zhàn)是,如何在不確定性的環(huán)境中進(jìn)行決策?兩千年前,夏商周的首領(lǐng)要開打一場戰(zhàn)爭(猶如當(dāng)年的貿(mào)易戰(zhàn)),是通過占卜來進(jìn)行決策。面對一觸即發(fā)的部落戰(zhàn)爭,出征前面對戰(zhàn)爭結(jié)果的無常,部落首領(lǐng)、諸侯國王們,求助龜殼裂紋、星象占卜,以預(yù)測等各種重大事件的走向,指導(dǎo)重大決策。
五百多年前,西歐封建制度開始解體,宗教改革步伐不斷加快。馬克斯·韋伯在《新教倫理與資本主義精神》指出,企業(yè)家認(rèn)為世俗經(jīng)濟(jì)行為的成功不是為了創(chuàng)造可供于享受和揮霍的財(cái)富,而是為了證明自己是上帝的一個選民。
在這一種情況下,當(dāng)企業(yè)家們面對各種不確定性進(jìn)行決策的時(shí)候,他們的依據(jù)是什么,是新教思想影響著他們的決策,宗教是人類面在不確定性的環(huán)境中進(jìn)行選擇的依靠。
一百年前,愛迪生經(jīng)過幾千次試驗(yàn)發(fā)明了電燈,1969年美國人把人類送到了月球,同年也研發(fā)出波音747并實(shí)現(xiàn)首飛。人類送上月球的每一個決策、飛機(jī)研發(fā)的每一次重大決策的背后是基于什么?是科學(xué)。
今天,我們有了認(rèn)識世界和進(jìn)行決策的新的方法論。
我們清華大學(xué)工業(yè)大數(shù)據(jù)中心在青海有一個風(fēng)電功率預(yù)測項(xiàng)目,能夠?qū)ξ磥恚魈臁⒑筇欤╋L(fēng)機(jī)的風(fēng)力發(fā)電量進(jìn)行準(zhǔn)確預(yù)測;美國Uptake公司,需要對卡特彼勒工程機(jī)械運(yùn)行狀態(tài)進(jìn)行預(yù)估,實(shí)現(xiàn)產(chǎn)品全生命周期的服務(wù);新零售企業(yè)盒馬鮮生,它只賣當(dāng)天新鮮的產(chǎn)品;我們的手機(jī)用戶,每天瀏覽的今日頭條、淘寶看到的首頁都是千人千面。這是一種新的決策方式,這種決策方式叫做“數(shù)據(jù)+算法”。
“數(shù)據(jù)+算法”的決策機(jī)制,不是對已有決策機(jī)制的一種替代,是增加了一種新的決策方式。
并非因?yàn)橛辛俗诮蹋覀兙筒蝗フ疾罚ㄔS多現(xiàn)代人仍在用占卜的方式進(jìn)行決策),占卜的方法在今天仍然很適用。我們用科學(xué)方法、科技的規(guī)律指導(dǎo)人們決策,但是宗教在很多時(shí)候仍然在發(fā)揮很重要的作用。現(xiàn)在我們又有了一種新的應(yīng)對不確定性的方式,就是“數(shù)據(jù)+算法”。
應(yīng)對不確定性是人類永恒的挑戰(zhàn),關(guān)于如何理解和認(rèn)識不確定性,我們有三個基本結(jié)論:一是只有深刻認(rèn)識不確定性,才能理解數(shù)字經(jīng)濟(jì)的本質(zhì);二是對不確定性的恐懼是人類社會認(rèn)知的動力;三是不確定性源于信息約束條件下人們有限的認(rèn)知能力。
化解不確定性需要經(jīng)過“三部曲”
我們都面臨著在不確定性的環(huán)境中如何進(jìn)行決策的問題。這些決策正確與否會導(dǎo)致事情的成敗、得失、利弊、對錯、好壞、優(yōu)劣等結(jié)果。而這些結(jié)果又會影響我們個人的幸福(我跟他結(jié)婚我是不是很幸福我不知道),部落的興衰,企業(yè)的成長,國家的繁榮,歷史的走向。
那么,如何來化解這些不確定性,需要經(jīng)過“三部曲”。第一,我們首先要理解這個世界,理解和認(rèn)知這個規(guī)律,這是我們化解不確定性的邏輯起點(diǎn);第二,理解之后我們要預(yù)測將會發(fā)生什么,這是做出決策的基礎(chǔ)和依據(jù);第三,我們要去控制,是將決策付諸行動的具體路徑。所以我們剛才講的所有,無論是占卜也好,科學(xué)、宗教、哲學(xué)、科學(xué)也好,從本質(zhì)上來說,都是來告訴我們?nèi)绾位庠跊Q策的時(shí)候面對的種種不確定性。
對不確定性認(rèn)知的分野:從哲學(xué)到科學(xué)
我們?nèi)绾蝸碚J(rèn)知不確定性,從哲學(xué)來看,在古希臘一開始就分成了兩種不同的學(xué)派,到了近代形成了以笛卡爾為代表的確定性世界,認(rèn)為這個世界是有序的、統(tǒng)一的、必然的、精確的及可預(yù)見的;而尼采、康德認(rèn)為這個世界是無序的、差異的、隨機(jī)的、模糊的不確定性世界。
從科學(xué)來看,由哥白尼“日心說”到伽利略再到牛頓三大定律,近現(xiàn)代科學(xué)成就不斷強(qiáng)化人們基于確定性邏輯規(guī)律的認(rèn)知,使得我們認(rèn)為所有的世界,都可以用確定性據(jù)描述。然而,海森堡的“測不準(zhǔn)”原理、哥德爾的不完全定理,阿羅社會選擇理論不可能性定理,并稱為二十世紀(jì)不確定性的三大發(fā)現(xiàn)。我們發(fā)現(xiàn)很多時(shí)候,這個世界并不是像牛頓定律所描述的那樣是確定可預(yù)測的。
從經(jīng)濟(jì)學(xué)來看,對于不確定性的認(rèn)知,始于芝加哥學(xué)派創(chuàng)始人奈特,將不確定性引入到經(jīng)濟(jì)學(xué),打破了經(jīng)濟(jì)學(xué)研究中此前一般均衡分析為核心的對確定性環(huán)境的假設(shè)。對不確定性我們認(rèn)為是信息經(jīng)濟(jì)學(xué)、行為經(jīng)濟(jì)學(xué)、制度經(jīng)濟(jì)學(xué)、演化經(jīng)濟(jì)學(xué)的一個基礎(chǔ)理論。
最后我們大家熟悉的,從信息論來看,信息是干什么的,克勞德·香農(nóng)定義“信息是用來減少隨機(jī)不確定性的東西,信息的價(jià)值是確定性的增加”,信息最重要就是要減少不確定性而增加確定性。
什么是企業(yè)?企業(yè)的本質(zhì)是什么?
我們今天討論的是工業(yè)大數(shù)據(jù),那么我們回到企業(yè),什么是企業(yè)?企業(yè)的本質(zhì)是什么?我認(rèn)為在不確定性的世界中進(jìn)行決策是企業(yè)最本質(zhì)的屬性。
面臨這些問題,企業(yè)有各種各樣的決策,在信息不完備、不確定性的環(huán)境中決策,包括:新品開發(fā)是決策,客戶定位是決策,營銷策略是決策,研發(fā)組織是決策,供應(yīng)鏈選擇是決策,交付周期是決策,庫存管理是決策,排產(chǎn)計(jì)劃是決策,商業(yè)模式是決策,所有的都是決策。
那么企業(yè)如何進(jìn)行決策,對于應(yīng)用工業(yè)大數(shù)據(jù)來說,怎么支撐企業(yè)決策?就是要將正確的數(shù)據(jù),在正確的時(shí)間,以正確的方式傳遞給正確的人和機(jī)器。這就是基于工業(yè)大數(shù)據(jù),在不確定性的環(huán)境中如何形成決策。
談一個紅領(lǐng)的例子,青島紅領(lǐng)是一家個性化定制服裝企業(yè),是國家智能制造的試點(diǎn)示范企業(yè),有些企業(yè)高管參觀后感到非常失望,因?yàn)闆]有想象中一排排機(jī)器人、一條條先進(jìn)生產(chǎn)線、忙亂而有序的AGV小車,而是一排排的工人在用手工的方式加工衣服,是一個典型的勞動密集型企業(yè)生產(chǎn)場景。
企業(yè)家們感到困惑的是,這樣一個典型的勞動密集型企業(yè)為什么是智能制造的試點(diǎn)示范企業(yè)?有人說他跟富士康沒有區(qū)別,不是沒有區(qū)別,而是根本就比不上富士康,富士康的自動化生產(chǎn)線、切片機(jī)、機(jī)器人是非常先進(jìn),紅領(lǐng)跟富士康有什么不同呢?
我認(rèn)為自動化分為兩種。一種自動化是生產(chǎn)裝備自動化,叫做看得見自動化,機(jī)器換人,立體倉庫,忙碌而有序的AGV小車。還有一種叫做看不見的自動化,就是數(shù)據(jù)融合在物理世界里面自動地去流動,把正確的數(shù)據(jù)在正確的時(shí)間傳遞給正確的人和機(jī)器。當(dāng)你采集一個人上身的18個部位,22個指標(biāo)之后,這一個指標(biāo)首先自動生成一個適合這個人體型的一個版形,自動生成一個數(shù)控機(jī)床的加工指令,自動生成200個工序的加工工藝,定制化生產(chǎn)跟規(guī)模化生產(chǎn)相比,其復(fù)雜度、面臨的不確定性遠(yuǎn)遠(yuǎn)地超出幾個量級。
算法:將不確定性轉(zhuǎn)化為確定性的最優(yōu)路徑
軟件如何解決這一個問題,我想最基本的一個語言就是“if…then…”,將不確定性轉(zhuǎn)化為確定性。“if:A”“if:B”是不確定性的,而“Then A1”“Then B1”就變成了一個確定性,這一轉(zhuǎn)變過程就需要算法。那么把不確定性轉(zhuǎn)變?yōu)榇_定性是否準(zhǔn)確呢?這取決于你的數(shù)據(jù)及時(shí)性、準(zhǔn)確性、完整性。
在過去的一兩百年已經(jīng)完美地解決了產(chǎn)品的成本質(zhì)量效率問題,而個性化定制出現(xiàn)的時(shí)候,過去已經(jīng)解決了成本質(zhì)量效率問題又重新冒出來的。不確定性又重新增加了,怎么解決?需要“數(shù)據(jù)+算法”。美國國家標(biāo)準(zhǔn)與技術(shù)研究院,對智能制造有一個定義,這個定義的核心詞,我認(rèn)為就是要對不確定性系統(tǒng)增加它的確定性。
做一個總結(jié),如何能夠把正確的數(shù)據(jù)在正確的時(shí)間,以正確的方式傳遞給正確的人和機(jī)器,需要具備兩個條件:一是隱性數(shù)據(jù)的顯性化,實(shí)現(xiàn)數(shù)據(jù)的完整性、及時(shí)性、準(zhǔn)確性,把大量蘊(yùn)含在生產(chǎn)制造過程、經(jīng)營管理、客戶行為、全生命周期服務(wù)的隱性數(shù)據(jù)不斷被采集、匯聚、加工。二是隱性知識的顯性化,就是對工業(yè)研發(fā)技術(shù)、生產(chǎn)工藝、業(yè)務(wù)流程、員工技能、管理理念等知識的邏輯化、數(shù)字化和模型化,使得大量隱性工業(yè)知識被固化在各類軟件和信息系統(tǒng)中。
一方面,我們有及時(shí)、完整、準(zhǔn)確的數(shù)據(jù),另一方面,我們有大量的隱性知識顯性化的軟件,不斷將這些數(shù)據(jù)輸送到這些軟件中間,進(jìn)而將數(shù)據(jù)轉(zhuǎn)化為信息、信息轉(zhuǎn)化為知識、知識轉(zhuǎn)化為決策,再用決策去優(yōu)化我們所看到的物理世界。
在這一過程中軟件是核心。那么,軟件是什么?軟件的本質(zhì)是事物運(yùn)行規(guī)律的代碼化,構(gòu)造了數(shù)據(jù)自動流動的一套規(guī)則體系,無論是愛因斯坦的質(zhì)能方程,還是牛頓的三大規(guī)律,都是我們認(rèn)識這個物理世界的方式。我們把規(guī)律模型化、模型算法化、算法代碼化、代碼軟件化,再用軟件化去優(yōu)化,我們構(gòu)建了三個世界,物理世界、意識世界、數(shù)字世界。
過去,人類直接面對這一個物理世界,而今天,我們找了一個代理人,這一個代理人是誰呢?就是賽博空間。就像無人駕駛,過去我們要自己開車,現(xiàn)在你不需要自己開,你找一個代理人,這一個人叫無人駕駛,幫助你去感知、決策、執(zhí)行。
數(shù)字經(jīng)濟(jì)的本質(zhì):數(shù)據(jù)+模型=服務(wù)
兩年多前,我曾去過達(dá)索公司,達(dá)索公司有一個科學(xué)家給我們講心臟的構(gòu)造,講心臟中離子濃度梯度穿過心肌細(xì)胞的脈沖變化,講心臟的某一塊肌肉的拉力極限是多少。
這樣一個我們認(rèn)為的軟件公司,跟很多醫(yī)院一起研究心臟的構(gòu)造、機(jī)理,他們要研究心臟的運(yùn)動規(guī)律,物理的、化學(xué)的、生物的運(yùn)動規(guī)律,他們把這一個運(yùn)動規(guī)律模型化、模型算法化、算法代碼化,最終是要構(gòu)建一個數(shù)字心臟。
研發(fā)這一個數(shù)字心臟的科學(xué)家就是達(dá)索公司的部門高級總監(jiān)(Steve Levine)史蒂夫·勒溫博士,原因是他的女兒杰西(Jesse),一出生就被發(fā)現(xiàn)主動脈和心室存在異位的情況。在她兩歲時(shí),由于心臟生理系統(tǒng)發(fā)生故障,杰西便安裝了心臟起搏器,并且每年需要做心臟手術(shù)。每次手術(shù)之前,醫(yī)生都需要讓史蒂夫簽字,并告訴他你的女兒推進(jìn)手術(shù)室之后有可能會失去生命,史蒂夫每一次都深受煎熬,他夢想有一天能研發(fā)這樣一個數(shù)字心臟。
這一個數(shù)字心臟有什么價(jià)值呢?用我的話說,就是“數(shù)據(jù)+算法=服務(wù)”,構(gòu)建了一個數(shù)字心臟,首先對心臟做了一個造影,造影是干什么?采集數(shù)據(jù),建立了一個數(shù)字模型,實(shí)現(xiàn)四類功能:一是描述,這一個物理世界發(fā)生了什么在虛擬世界去描述,心臟的血管哪一個地方堵了,堵了多少,可以360度去觀察。二是診斷,為什么會堵,是什么樣的原因造成了心臟血管堵塞;三是預(yù)測,如果沒有人為去干預(yù),半年之后、一年之后、兩年之后,這一個血管從堵到30%發(fā)展到70%,另外一個旁支血管也會堵,它會告訴你將會發(fā)生什么;四是決策,最后怎么辦,是采取保守治療,還是去做搭橋手術(shù),給醫(yī)生提供一個解決方案供參考。
在這一過程中,數(shù)字心臟可以幫助我們改進(jìn)醫(yī)療設(shè)備的研發(fā)效率、預(yù)測器械植入心臟的功能、進(jìn)行心臟復(fù)雜醫(yī)學(xué)教學(xué)、加快科研創(chuàng)新轉(zhuǎn)化為臨床醫(yī)學(xué)實(shí)踐。
所以“數(shù)據(jù)+模型”,或者“數(shù)據(jù)+算法”構(gòu)造了我們認(rèn)識這一個世界新的方法。
如果說我們把過去人類社會認(rèn)識客觀世界的方法論做一個總結(jié)的話,可以有四個階段。一是理論推理,天才科學(xué)家通過“觀察+抽象”去認(rèn)識這個世界,比如牛頓的定律,愛因斯坦的相對論;二是實(shí)驗(yàn)驗(yàn)證,愛迪生發(fā)明電燈泡,我們現(xiàn)在發(fā)明汽車做二三十次碰撞實(shí)驗(yàn),飛機(jī)做風(fēng)洞實(shí)驗(yàn)驗(yàn)證;三是模擬擇優(yōu),在虛擬世界里面去實(shí)驗(yàn)發(fā)現(xiàn)物理世界的規(guī)律,再反饋到現(xiàn)實(shí)世界指導(dǎo)人們的實(shí)踐,高鐵、飛機(jī)不用做幾千幾萬小時(shí)的風(fēng)洞試驗(yàn),汽車不用做幾十次碰撞實(shí)驗(yàn),這些都可以在虛擬世界去完成,通過數(shù)字世界的模擬選擇最優(yōu)化的結(jié)果;四是大數(shù)據(jù)分析,就是通過大數(shù)據(jù)發(fā)現(xiàn)物理世界新的規(guī)律。無論是模擬還是大數(shù)據(jù)分析,它背后的邏輯都在用“數(shù)據(jù)+算法”的模式。
過去你整天在實(shí)驗(yàn)室做實(shí)驗(yàn),現(xiàn)在有一部分實(shí)驗(yàn)可以在計(jì)算機(jī)里面去做。對于制造業(yè)也是一樣,過去架飛機(jī)從立項(xiàng)到交付需要二十多年的設(shè)計(jì)制造過程,現(xiàn)在只需要五六年的時(shí)間,因?yàn)槿藗儤?gòu)建了一個新的認(rèn)識和改造世界方法論。高鐵可以通過虛擬的高鐵在虛擬的京滬線上跑起來,運(yùn)行到兩百公里、三百公里、五百公里時(shí)速,來測它的穩(wěn)定性,通過快速迭代,構(gòu)造了一個改造和認(rèn)識世界的方法論即“數(shù)據(jù)+模型”這一新方法論。
數(shù)字化的邏輯殊途同歸:數(shù)字孿生
可以設(shè)想一下,未來十年、二十年、三十年之后,或者我們思考一個問題:數(shù)字化的終極版圖是什么?從未來看現(xiàn)在,我們今天所看到的物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算、人工智能、工業(yè)軟件等技術(shù),都是未來數(shù)字化終極版圖的一個碎片,ICT技術(shù)發(fā)展及應(yīng)用的過程,就是我們不斷把這個碎片化的模塊拼一個幅完整版圖過程,我們都是拼圖人。
那么形成的最終圖景是什么呢?答案就是數(shù)字孿生,就是我們不斷地把碎片化物理世界數(shù)字化后,在CYBER空間構(gòu)造成一個碎片化的數(shù)字孿生體,然后把這個碎片化的孿生體拼成一個完整的數(shù)字孿生體,直至構(gòu)造一個數(shù)字孿生的世界,從我剛才講的數(shù)字孿生的心臟,數(shù)字孿生的飛機(jī),數(shù)字孿生的建筑,到數(shù)字孿生的城市,我們都走在構(gòu)造數(shù)字孿生世界的大道上。
我們在虛擬世界構(gòu)造一個數(shù)字孿生,并且不斷的與物理世界進(jìn)行交互、優(yōu)化,這樣的一個過程將會經(jīng)歷三個階段,即局部的數(shù)字的孿生階段,靜態(tài)的數(shù)字孿生階段和動態(tài)的數(shù)字孿生階段。
那么動態(tài)的數(shù)字卵生階段需要什么時(shí)候?qū)崿F(xiàn),可能需要二十年或者更長的時(shí)間,現(xiàn)在我們僅僅處于一個局部的數(shù)字孿生階段,而靜態(tài)的數(shù)字孿生,就是在虛擬世界里構(gòu)造一個物理世界,但數(shù)據(jù)不是實(shí)時(shí)的,需要一個周期。
最后做一個總結(jié),數(shù)字經(jīng)濟(jì)的本質(zhì),就是“數(shù)據(jù)+算法=服務(wù)”。這數(shù)據(jù)來自于機(jī)器數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、產(chǎn)品模型數(shù)據(jù),需要物聯(lián)網(wǎng)、傳感器等不斷獲取。算法部署在云端,包括兩種形式。一種是機(jī)理模型、一種是人工智能模型或者叫做大數(shù)據(jù)模型。“數(shù)據(jù)+”,“+”是什么?“+”就是網(wǎng)絡(luò),5G、NB-IoT、TSN、以太網(wǎng)等等,數(shù)據(jù)+算法帶來了服務(wù),這個服務(wù)包括四個層次:一是描述這個世界(發(fā)生了什么?),二是診斷這個世界(為什么發(fā)生),三是預(yù)測這個世界(將會發(fā)生什么?),四是進(jìn)行決策(應(yīng)該怎么辦?),最后實(shí)現(xiàn)優(yōu)化資源配置效率。這是一種全新的認(rèn)識和改造這個世界的方法論。
2025-04-21 12:14
2025-04-21 12:11
2025-04-18 08:54
2025-04-18 08:53
2025-04-17 08:16
2025-04-17 08:13
2025-04-16 10:55
2025-04-16 08:50
2025-04-14 14:57
2025-04-14 14:53