近日,第四范式與某海關事務管理信息服務商攜手,共同為海關有關部門建設低成本、高效率的人工智能基礎設施及業務應用。雙方基于第四范式AI算力平臺“4Paradigm SageOne”及OCR軟硬一體方案,打造海關單證智能識別系統,通過優化識別準確率與識別速度,大幅提升海關通關效率,進一步加強我國對外互聯互通的能力。
隨著國際化經濟貿易的高速發展,我國進出口通關規模早已邁入世界前列,面對與日俱增的需求,中國海關積極尋求創新技術解決業務發展瓶頸。近年來,中國海關以打造“智慧海關”為目標,通過人工智能等技術重構海關服務體系,優化內部流程,提升服務效率,支撐海關業務飛速發展。
海關清關報關主要以海關單證作為憑證,采用OCR進行單證識別是海關業務一直以來的重要場景。然而海關單證種類繁多、每頁字符多版面復雜、中英文混排,而且業務一直處于動態變化中,即使是業界成熟的OCR方案,遇到這樣復雜多變的業務場景時也無法應對,其效果及響應速度難以達到業務預期——普通的OCR方案僅能達到80%的識別準確率;更重要的是,隨著業務發展以及復雜度提升,方案效果也呈持續下降趨勢。
基于AI軟硬一體集成能力與技術優勢,第四范式為海關部門構建了快、準、穩的海關單證識別系統。該系統通過業界領先的深度學習注意力機制技術以及自研高維深度學習引擎,充分利用業務場景中的海量特征,使特征維度達千萬級,將OCR模型識別準確率從80%提升至98%以上;此外,第四范式從軟件定義算力的角度深度優化資源配置,通過充沛的算力性能以及定制化的計算框架,全面提升系統大批量工作的承載量與響應速度。優化后的方案在2秒內即可處理每頁近3000字符的報關單,一天可處理8000張海關單證,可節約該業務環節80%的人力成本。
針對識別效果隨著業務變化不斷下降這一棘手問題,“第四范式先知Sage”平臺特有的閉環自學習能力,確保了模型可持續利用業務反饋數據、進行自我更新與優化,迅速適應業務發展與變化。最終,該OCR模型支持上百個海關單證模版,面對新格式、新字符等越來越復雜的業務場景也可輕松應對,持續提升模型效果。
此外,面對數據安全及隱私問題,第四范式的OCR方案提供私有化部署交付服務,保障數據安全可靠,符合海關部門嚴格的數據安全標準。并通過開箱即用的軟硬一站式交付方式,大幅縮短交付周期,滿足客戶快速進行場景落地、實現業務價值的需求。
未來,第四范式將持續為海關部門智能化建設提供優質的產品和服務,加速AI技術在海關領域的賦能,助力海關智能管理水平和服務質量雙重增長,推動“智慧海關”建設進程。