Skip to main content

零點有數解析算法產業化發展之道

2021-07-21 由【】發表於 科技

本文整理自零點有數董事長袁嶽博士基於零點有數在算法領域上的探索,在“2020世界人工智能大會”上的發言。

今天我不僅是講算法,而是講算法的產業化。如今人工智能已經構成瞭一個巨大的產業,人工智能領域中間產生瞭領先企業、配套企業、跟隨企業、應用企業。在人工智能的三個要素中,數據行業已經構成瞭行業化,有規模的企業和規模的投入,我們講的大數據、數據源領域實際上就是指以數據源為核心開展的開發工作,上海是比較早在政務領域開展數據整理、匯融、開發、開放的地區,在商業領域中,上海擁有大量的互聯網企業,尤其是互聯網服務企業,所以在大數據的應用開發方面也走在瞭前面。算力也形成瞭一個規模的行業,但是算法在今天得到的重視程度依然不夠,還沒有真正行業化的發展。今天我們探討的算法,的確在整個人工智能行業中間是一個非常重要、值得強調的因素。

算法本身不是很新鮮的東西,但算法決定瞭我們的商業機會和成敗。從人的學習過程中可以看出最早的學習是從模仿開始,然後人會形成獨立的想法,有瞭想法之後便開始實踐,其中一些好的做法反復實踐構成瞭經驗,經驗進行抽象可以建模變成模型,模型進一步構建為一個可以自動化計算的軟件化模式,就構成瞭算法。人類從一個小孩去學習到最後腦子很靈光,看到一個東西馬上就能反應出來的過程,其實就是自動化的算法,無論從個體成長還是文明發展的角度來說,本身是一個很自然的過程。

算法告訴我們為瞭解決一個問題,可以把過去的經驗、模式、做法變成一系列指令,使你不需要按照傳統的工作模式去做。舉例來說,我們如何讓3000傢連鎖店都能做到最好的100傢的做法,我們把最優秀的100傢連鎖店好的做法數據化,然後把數據應用起來,把100傢的優秀做法變成指令,讓另外3000傢門店在不需要學習、不需要培訓的情況下,直接按照指令行使就可以達到中等以上的經營水平。它用算法來進行管理,是以智能指令為特點的。

算力也非常重要。因為有巨大數據量的時候,如果用傳統的方式計算運行,服務器是轉不動的,機器學習以上海為例,有幾萬個群眾打進“12345”的電話,當我們需要把熱線數據知識圖譜化,讓機器去學習的時候,機器可以24小時進行學習,但是我們傳統的服務器轉不動,一定要在雲端用雲計算的方法才可以帶動計算,所以算力非常重要。但是解決算力的最終目的是為瞭達到我們的目標,無論是工業領域、政務領域還是商業領域,算法才是我們人的應用目的。

算法聽起來很懸,算法到底是什麼樣的東西?首先,算法的分佈模式:算法將來的載體不光是我們想象的那樣,好像是一個看不見的公式,沒錯,它現在是一個公式,它現在既可以放在網絡端,也可以放在設備裡,也可以放在互聯網或者是物聯網裡面,比如機器人裡面就嵌入瞭算法的硬件,所以算法是可以分佈在各個不同的載體上的。其次,算法應用的領域非常廣泛。從行業上來說非常廣,另外從微觀生活、中觀生活和宏觀生活當中都有算法的存在,比如上海推的政務一網通辦。將來每一個領域都將有一串算法來解決這個領域的問題。算法大致可以分成三層:基礎算法、通用算法和行業算法。基礎算法是從大量的網絡開發經驗中間提煉出來的,所以一些互聯網公司貢獻得非常多。在這個基礎上開發通用算法,比如人臉識別。然後在基礎算法和通用算法的模塊中間,針對某個領域的特點問題開發垂直的行業應用。比如現在因為疫情原因,加上上海到處搞傳感器探頭,小偷就很難做生意瞭,於是小偷轉行去做詐騙,所以詐騙是增長最多的違法犯罪活動,以前四到五個月才會出現一波新的詐騙形式,但是現在幾天就可以出來一種新的詐騙方式,我們要通過算法反詐騙,新型詐騙方式在網上一旦冒頭,就能快速識別、快速幹預。把技術運用在解決一個特定問題上,這就是行業算法的發展。目前來說,行業算法是目前我們最有機會大規模發展的領域。算法到底是什麼神奇的東西呢?其實算法也不神奇,一個老警察要退休瞭,他抓罪犯的方法就隨著他一起退休瞭,但是他有很棒的經驗,這種經驗你讓他總結出來,就能夠作為算法構建的基礎,能夠開發出很多東西。把他總結出來的經驗和技術實現的能力,兩相結合構成瞭模型,而我們通過數據訓練集不斷地優化,最後形成算法。從這個意義上來說,算法就是業務經驗和技術實現的整合,很多普通人都可以去實現。

一個智能化領域是如何構成的?無論是政務、城市運行、警務還是產業,下面可以細分成更多的垂直領域,警察可以分很多警種,每個領域中間有很多具體的場景,這就是一個社會的樣子。比如未來在工業領域中間,控制機器人或者生產流程等等,每個領域都會有大量的垂直應用算法的使用,這就是未來數字社會的樣子,我們感知的就是機器智能在算法中間的表現。

當然,我們今天講的信息技術的時候,無論是什麼技術,無論是硬的、軟的還是新型網、新型設備,基本上都是以算法的高地作為核心。算法不僅僅重要,還有明顯的優劣。美國在四年以前通過瞭算法責任法,就是說你說這個算法很棒,那就用這個算法,結果搞砸瞭,那算誰的?某一個領域可以有大量的算法,實際上用不同的算法產生的成效是不同的,你要對你推薦的算法負責,所以有算法責任。在英國議會中間也通過瞭算法治理的法案,對算法的開發、算法的應用、算法的責任提出瞭明確的要求。

今天很多地方會建設人工智能產業,會推動雲計算的發展、大數據的發展,但是很少有地方講我們要推動算法的發展,而且沒有相關政策,也沒有專項的資金投入,算法領域中間也沒有真正的人才。構建算法產業就說明我們要圍繞算法有專門的獎項來讓你們知道,它是人工智能上的明珠,讓算法有足夠的亮度;為瞭吸引人們成為算法領域的創業者,要有算法孵化器;算法應用者聯盟各個領域都會用,因為隻有有應用場景才能轉化為算法;一些研究者或有經驗的人要能夠進行分享,要建立算法的政策叢,從人才政策、投資政策、稅收政策等等培養真正搞算法的人才;大學講大數據課、計算機課,基本上沒有算法課,我們希望有講基礎算法的課程。

最後,算法的八大命題,算法應該幹什麼?第一,在數字新基建達到瞭當前水平後,算法水平已然成為智能經濟的瓶頸與突破關鍵,算法是最具備凝聚活躍技術創造力、邏輯構造力、經驗洞察力的創新領域。

第二,算法來源於想法尤是活躍的好想法,但算法作用於做法尤其是持續的最好做法。

第三,數據與算力取決於掌握核心資源的巨頭,而算法則可能有豐富多彩的創造者。

第四,算法有優劣,優質算法等於業務技術邏輯和強大開發能力的組合,並在持續的訓練應用中優化。

第五,算法將數據完成瞭優化的邏輯處理,具有自動化應用的最大優勢,從而內置於系統,賦予工作系統以更新的能量。

第六,重視知識圖譜的價值,借助於知識計算引擎,知識圖譜的持續開發使應用算法具有機器學習與深度學習的垂直提升能力。

第七,算法池的大小和算法配置高低,顯示出瞭智能化生產力和管理力的水平高低。和人工智能水平的真正高低就看有多少算法,有多少高智商人才的道理是一樣的。

第八,豐富應用算法將賦予政務和商業以更大的活力,並因此而建立優化和創造新通用算法和新基礎算法的條件。目前,國內對通用算法和基礎算法做出的創新貢獻很小,我們的方法跟我們很多其他領域的路徑一樣,將來真正地前進和突破是在應用中間有更豐富的場景和更多的應用,然後我們就會發現過去的某些應用算法和基礎算法是不夠的,從而激勵我們在那兩個領域中間進行創造和累積資源的可能性。