5月26日上午,2023中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會在貴陽開幕。在2023數(shù)博會開幕式上,中國工程院副院長、院士吳曼青以《數(shù)據(jù)空間引領(lǐng)數(shù)字技術(shù)體系創(chuàng)新》為主題發(fā)表主旨演講。他將數(shù)據(jù)空間未來的特征歸結(jié)為四句話“數(shù)據(jù)一切,計算賦能,引領(lǐng)變革,定義未來”。吳曼青表示,發(fā)展數(shù)據(jù)空間,形成創(chuàng)新共識,構(gòu)建技術(shù)體系,引領(lǐng)產(chǎn)業(yè)發(fā)展,是數(shù)字中國建設(shè)的重大技術(shù)需要,也是實現(xiàn)科技自立自強(qiáng)的戰(zhàn)略抓手。
以下來源于《數(shù)據(jù)空間引領(lǐng)數(shù)字技術(shù)體系創(chuàng)新》
今天,我匯報的題目是《數(shù)據(jù)空間引領(lǐng)數(shù)字技術(shù)體系創(chuàng)新》。大家都知道,我們經(jīng)歷了農(nóng)業(yè)社會、工業(yè)社會,到了信息社會,迎來了信息革命的偉大時代。信息革命應(yīng)該始于1958年第一塊集成電路的發(fā)明,在這樣一個發(fā)展過程中,有一些標(biāo)志性的重大事件值得我們記憶。第一個是1958年發(fā)明集成電路,第二個是1965年4月19日摩爾提出了著名的摩爾定律。摩爾定律改變了我們的世界,也必將改變我們的未來。第三個是1991年《科學(xué)美國人》雜志發(fā)表的一篇或者一期???,題目就是《網(wǎng)絡(luò)空間:人類未來將在其中生活、奮斗或成長》。大家可以看到,預(yù)言變成了今天的現(xiàn)實。2008年發(fā)生了三件偉大的事件,第一件事是城市人口首次超過農(nóng)村人口,這是人類文明的重大變化;第二個是機(jī)器連接數(shù)量超過了人上網(wǎng)的數(shù)量;第三個是移動連接的數(shù)量超過了固定上網(wǎng)的數(shù)量,由于這樣的連接,將給我們社會帶來很大變化。
同時,在同一天也發(fā)生了三件大事,第一件就是1965年4月19日,摩爾提出了著名的摩爾定律,第二件大事就是2016年習(xí)近平總書記親自主持召開網(wǎng)絡(luò)安全和信息化工作座談會,在這次會議上提出了著名的論斷,網(wǎng)信事業(yè)代表著新的生產(chǎn)力、新的發(fā)展方向,應(yīng)該也能夠在踐行新發(fā)展理念上先行一步。2018年4月20日召開了網(wǎng)絡(luò)安全和信息化工作會議,習(xí)近平總書記在這次會議上提出了網(wǎng)絡(luò)強(qiáng)國戰(zhàn)略思想。
我想,同一年發(fā)生的三件大事、同一天發(fā)生的三件大事,必將載入信息革命的史冊。因為這樣的變化,我們社會將變成人、機(jī)、物互聯(lián)的世界,這個世界將是一個端到端的數(shù)字連接復(fù)雜的網(wǎng)絡(luò)空間,其背后更多彰顯了節(jié)點和連接的力量。我經(jīng)常講,節(jié)點更多強(qiáng)調(diào)自主性、競爭力和獨特價值,連接更多強(qiáng)調(diào)協(xié)同性,由于節(jié)點和連接存在,使得我們未來社會呈現(xiàn)出復(fù)雜的一體化的世界,我自己把這個世界定義有這樣幾個特征:網(wǎng)絡(luò)一切、虛實交融、時空壓縮、協(xié)同共享、深入智能。
這樣一個機(jī)會給中華民族帶來千載難逢的歷史機(jī)遇。習(xí)近平總書記指出,“當(dāng)今時代,數(shù)字技術(shù)作為世界科技革命和產(chǎn)業(yè)變革的先導(dǎo)力量,日益融入經(jīng)濟(jì)社會發(fā)展各領(lǐng)域全過程,深刻改變著生產(chǎn)方式、生活方式和社會治理方式。”我們學(xué)習(xí)習(xí)近平總書記的重要講話,就在思考中國需要創(chuàng)造什么樣的數(shù)字技術(shù)、實現(xiàn)自立自強(qiáng)、成為先導(dǎo)力量,引領(lǐng)深刻變革?今天主要是匯報這樣一些學(xué)習(xí)的體會。
大家都知道,信息革命來臨以后,信息技術(shù)蓬勃發(fā)展,數(shù)字技術(shù)像雨后春筍般出現(xiàn),各種各樣技術(shù)層出不窮,我個人把它叫做云里霧里,更重要的是不成體系,要抓的時候無從下手,一個東西沒有抓好,Chat GPT就來了??墒俏矣衷谙?,在變化大背景下是不是有一些不變的東西呢?我們要回歸到事物本質(zhì),變或不變?nèi)匀粴w結(jié)這樣幾個大要素:網(wǎng)絡(luò)、數(shù)據(jù)、計算、安全和服務(wù),這是永遠(yuǎn)不會變的,而變的是網(wǎng)絡(luò)技術(shù)的演變,比如從面向鏈接到面向業(yè)務(wù),再面向多個多元應(yīng)用,協(xié)議也在變,但是,網(wǎng)絡(luò)的根本,連接各種要素和連接功能是不會變的。
第二個是數(shù)據(jù)組織變化,過去可能把數(shù)據(jù)變成知識,我們把它叫做符號化的知識,后來是結(jié)構(gòu)化、半結(jié)構(gòu)化的數(shù)據(jù),到了這個時代,我們還很難對數(shù)據(jù)下一個定義,是叫非結(jié)構(gòu)化嗎?是不是可以叫做數(shù)據(jù)鍵等等?大家都有不同看法,但是數(shù)據(jù)組織在悄然發(fā)生變化,過去從規(guī)則、邏輯、方程到數(shù)據(jù)庫,到了現(xiàn)在,我個人把它定義叫做數(shù)據(jù)場,我后面會匯報我們的學(xué)習(xí)體會。同時,我覺得數(shù)據(jù)抽象結(jié)果也是不一樣的,從文件到網(wǎng)頁,到數(shù)據(jù)要素,到廣普關(guān)聯(lián),都在發(fā)生深刻變化。
第三個是計算處理的變化,剛才杰克·唐加拉先生發(fā)表了非常好的演講,我們看到,過去我們的計算更多的是對知識的計算,這種知識更多地沉淀在某一個公式、某一個理論當(dāng)中,我們就是計算這樣一個東西,到了后來,我們計算產(chǎn)生的更多的信息,到了現(xiàn)在,我們可能更多的是對數(shù)據(jù)的計算,所以我覺得,計算經(jīng)歷了從計算知識——計算信息——計算數(shù)據(jù)的不斷演化,當(dāng)然,我覺得這里面很有意思,要讓計算機(jī)懂得一個公式,第二步是讓計算機(jī)懂得信息是什么,而現(xiàn)在在數(shù)據(jù)要素流通過程中我們要讓計算機(jī)懂得信息數(shù)據(jù)有什么價值。
剛才我們特別看到杰克·唐加拉先生的演講是在數(shù)值計算方面取得了很大的成就,他的另外一個貢獻(xiàn)就是對世界的高性能計算機(jī)進(jìn)行排名并發(fā)布了一個標(biāo)準(zhǔn),這當(dāng)然也會讓我們感到既有欣慰的一面,我們中國有很多臺計算機(jī)都在全球的十強(qiáng)之中,我們注意到,我們不同的超算應(yīng)對計算的單元是不一樣的,從太湖之光用的是自己的CPU,自己定義的互連結(jié)構(gòu),到國防科技大學(xué)是英特爾的CPU自己定義的互聯(lián),其實這些都是不斷創(chuàng)新的過程。
再一個是安全范式的變化,從“物理安全+功能安全”,到“網(wǎng)絡(luò)安全+信息安全”,現(xiàn)在我們要關(guān)注“網(wǎng)絡(luò)安全+數(shù)據(jù)本身”的安全。我們需要人機(jī)互聯(lián),需要面向多元應(yīng)用,需要讓數(shù)據(jù)流通起來,需要讓數(shù)據(jù)場把數(shù)據(jù)管理起來,同時要實現(xiàn)智能化服務(wù)計算,這些是不是構(gòu)建了當(dāng)代綠色數(shù)字技術(shù)的基因,需要我們自由創(chuàng)造,實現(xiàn)中國方案。那什么是不變的呢?人、機(jī)、物在互聯(lián)過程當(dāng)中,數(shù)據(jù)產(chǎn)生自人、機(jī)、物,也將最終作用于人、機(jī)、物,當(dāng)然,這個過程當(dāng)中是對數(shù)據(jù)的深度技術(shù),作用于人、機(jī)、物的數(shù)據(jù)已經(jīng)發(fā)生了根本變化。
我在想,在這樣一個相互作用過程當(dāng)中是不是有一個數(shù)據(jù)場的存在,如果實體空間有引力場的話,電磁空間有電磁場的話,那么數(shù)據(jù)空間是不是有一個數(shù)據(jù)場的存在?我們也在組織一批科學(xué)家在研究什么叫數(shù)據(jù)場,什么叫場,什么叫空間,等等,這些都是值得我們研究的重大議題。我個人試圖把數(shù)字空間做一個空間,人機(jī)物品德國網(wǎng)絡(luò)互聯(lián),產(chǎn)生了大量的數(shù)據(jù),形成了復(fù)雜的網(wǎng)絡(luò)空間,由于數(shù)據(jù)的產(chǎn)生、流通、聚合、使用,最終在數(shù)據(jù)場的作用下形成了數(shù)據(jù)間,數(shù)據(jù)空間具備新型的本體、結(jié)構(gòu)、運(yùn)算和要素價值體系,在數(shù)據(jù)空間內(nèi)容的數(shù)據(jù)對象廣譜廣聯(lián)、數(shù)據(jù)要素有序流通、數(shù)據(jù)價值聚變釋放。
我對數(shù)據(jù)空間未來的特征歸結(jié)為四句話,叫“數(shù)據(jù)一切,計算賦能,引領(lǐng)變革,定義未來”。我覺得一切都可以用數(shù)據(jù)表達(dá),其實我們身處數(shù)據(jù)的海洋,所以我把它定義為數(shù)據(jù)一切。在這個過程當(dāng)中,剛才杰克·唐加拉先生也說到,頂部有足夠的空間,底部有更大的作用,我個人覺得,網(wǎng)絡(luò)空間有更大的發(fā)展空間。在這個過程當(dāng)中價值創(chuàng)造有一點不太一樣,如果說網(wǎng)絡(luò)空間價值涌現(xiàn)是裂變這種方式來描述的話,其實就是我們追求無限擴(kuò)大信息可達(dá)空間,就是把信息送到更多用戶當(dāng)中,遵循的梅特卡夫定律,網(wǎng)絡(luò)空間價值與用戶數(shù)平方呈正比,我發(fā)現(xiàn)數(shù)據(jù)空間價值涌現(xiàn)有很大的不同,它可能叫做聚變,我大膽地預(yù)測,數(shù)據(jù)空間的價值與數(shù)據(jù)要素廣譜關(guān)聯(lián)數(shù)平方呈正比。
某種意義上,我們對數(shù)據(jù)的聚變、對數(shù)據(jù)計算是希望有更多發(fā)現(xiàn),產(chǎn)生更多的智慧。同時,在數(shù)據(jù)空間當(dāng)中可能會有這樣一個效應(yīng),一方面是高性能計算的不斷演進(jìn),從過去加速芯片到TPU到現(xiàn)在的GPU,另外一方面,我們可以看到,深藍(lán)系統(tǒng)到現(xiàn)在的Chat GPT,其實都是在不斷循環(huán),在互相交織,中間流淌的是數(shù)據(jù)。由此我們可以看到,計算能力的創(chuàng)新和新型智能的涌現(xiàn)將變成一個雙螺旋效應(yīng)。
那何以能支撐數(shù)據(jù)空間的存在呢?我們注意到,國家剛剛發(fā)布了數(shù)據(jù)要素基礎(chǔ)制度二十條,我認(rèn)為這是一個偉大的變革,偉大時代的來臨,從制度層面對數(shù)據(jù)要素流通提供很好的環(huán)境,我們作為工程科技者思考的一個問題,支撐基礎(chǔ)數(shù)據(jù)要素制度改革或者執(zhí)行、發(fā)展的工程技術(shù)體系是什么樣的體系呢?這里我想講一個有趣的創(chuàng)新,大家都知道現(xiàn)在比較火爆的ChatG PT大模型,有一位首席科學(xué)家叫艾力克斯,它用顯卡推動計算,由此就推動了TPU、GPU的發(fā)展,這是一個非常有趣的現(xiàn)象。我們老是在說CPU計算東西,美國有CPU之后,我們復(fù)制一個,其實不同于CPU的PU是什么,這是值得我們關(guān)注的。
剛剛在比利時開了一個會議,是Imec公司召開的,他們的標(biāo)題講“那個時代一去不復(fù)返”,我改為了“一個新的開始”,現(xiàn)在保持計算速度呈指數(shù)級增長唯一方法是一種稱為系統(tǒng)技術(shù)協(xié)同優(yōu)化的方案,它能夠?qū)⑿酒纸獬伤鼈兊墓δ芙M件,為每個功能使用最佳的晶體管和互聯(lián)網(wǎng)技術(shù)并將它們重新拼接在一起,以創(chuàng)建一個功耗更低、功能更好的整體。其實這就是一個面向未來需求的系統(tǒng)觀念整體解決方案,由此構(gòu)建完整的技術(shù)體系。我想表達(dá)的是,變之不變,我們能不能在變之不變的過程中找到或者創(chuàng)新出中國自主的技術(shù)體系。
數(shù)據(jù)空間需要研究的問題包括基本內(nèi)涵、數(shù)理基礎(chǔ)、工程科技、體系構(gòu)建、基礎(chǔ)設(shè)施、賦能服務(wù)、數(shù)據(jù)之治等。我們工程院就這個重大問題在開展戰(zhàn)略咨詢研究,也主辦的一次首屆數(shù)據(jù)空間大會,最終想支撐數(shù)字中國基礎(chǔ)設(shè)施、基礎(chǔ)制度的全面建設(shè)。最后我想用這段話結(jié)束我的發(fā)言。發(fā)展數(shù)據(jù)空間,形成創(chuàng)新共識,構(gòu)建技術(shù)體系,引領(lǐng)產(chǎn)業(yè)發(fā)展,是數(shù)字中國建設(shè)的重大技術(shù)需要,也是實現(xiàn)科技自立自強(qiáng)的戰(zhàn)略抓手。我們一直在努力,謝謝各位。