近日,第15屆環太平洋國際人工智能會議(The Pacific Rim International Conference on Artificial Intelligence,簡稱PRICAI)在南京召開。作為亞太地區重要的AI綜合性學術會議,PRICAI每兩年舉辦一次,與會者們圍繞人工智能理論、前沿技術及其在應用在環太平洋國家經濟重要性等議題進行深入探討。今年,最為引人關注的就是由“AI技術領導者”第四范式發起,南京大學LAMDA(Learning And Mining from DatA)實驗室、ChaLearn、北京大學、INAOE共同組織的AutoML Workshop。
據悉,第四范式資深機器學習架構師涂威威作為本次的Workshop的聯合主席,邀請了墨西哥INAOE科學家Hugo Jair Escalante、荷蘭埃因霍溫科技大學教授Joaquin Vanschore、美國懷俄明大學教授Lars Kotthoff、葡萄牙波爾圖大學Pavel Brazdil、南京大學俞揚教授、南京大學李宇峰教授等多位權威學者,針對AutoML領域的前沿趨勢及技術進行了分享,其中南京大學李宇峰教授分享了與第四范式王海,涂威威共同合作的自動半監督學習(AutoSSL)的前沿進展,第四范式胡毅奇分享了第四范式與南京大學非梯度優化(Derivative-Free Optimization)方面的一些工作。
近年來,機器學習雖然已在推薦系統、在線廣告、金融市場分析等諸多領域取得了很多成功,但在這些成功的應用中,人類專家參與了機器學習的所有階段,包括:定義問題、收集數據、特征工程、調整模型超參數,模型評估等。然而,這些任務的復雜性往往超出了非機器學習專家的能力范圍。機器學習技術使用門檻高、專家成本高昂等問題成為制約AI普及的關鍵。因此,自動化機器學習技術AutoML應運而生,該技術讓沒有機器學習背景的人同樣可以輕松使用。
第四范式從很早便開始關注并深耕AutoML領域,通過從解決客戶業務核心增長的角度出發,構建了反欺詐、個性化推薦等業務場景下的AutoML,并將其賦能給企業的普通開發人員,取得了接近甚至超過數據科學家的業務效果,目前已研發了自動特征組合(FeatureGo)、自動時序特征(TemporalGo)、自動深度稀疏網絡DSN(Deep Sparse Network)等AutoML支撐技術。其中,FeatureGo算法,實現了機器自動組合特征的功能,有效解決了人為添加組合特征門檻高、耗時長等問題。FeatureGo也增加了模型的可解釋性,提升易用性,進一步降低了機器學習的應用門檻。
與專注于圖像、語音、翻譯、視頻、NLP等領域的Google AutoML相比,第四范式的AutoML除了支持語音、圖像、NLP等領域的應用外,更為注重通過AutoML技術,使機器具備商業智能決策的能力。與此同時,第四范式還通過在NIPS、PAKDD等頂級學術會議舉辦AutoML數據挖掘大賽的方式,吸引更多的研究人員和業界同行關注AutoML這一重要的研究方向,降低機器學習過程對于AI專家的依賴,解決因人才緊缺造成的AI應用高門檻。而比賽關注的焦點也從“人肉找到最優參數”轉移到“設計出最佳自動機器學習程序”。