什么是AI
AI(人工智能)是通過機器來模擬人類認識能力的一種科技能力。AI最核心的能力就是根據(jù)給定的輸入做出判斷或預測。
AI開發(fā)的目的是什么
AI開發(fā)的目的是將隱藏在一大批數(shù)據(jù)背后的信息集中處理并進行提煉,從而總結得到研究對象的內(nèi)在規(guī)律。
對數(shù)據(jù)進行分析,一般通過使用適當?shù)慕y(tǒng)計、機器學習、深度學習等方法,對收集的大量數(shù)據(jù)進行計算、分析、匯總和整理,以求最大化地開發(fā)數(shù)據(jù)價值,發(fā)揮數(shù)據(jù)作用。
AI開發(fā)的基本流程
AI開發(fā)的基本流程通??梢詺w納為幾個步驟:確定目的、準備數(shù)據(jù)、訓練模型、評估模型、部署模型。
圖1 AI開發(fā)流程
確定目的
在開始AI開發(fā)之前,必須明確要分析什么?要解決什么問題?商業(yè)目的是什么?基于商業(yè)的理解,整理AI開發(fā)框架和思路。例如,圖像分類、物體檢測等等。不同的項目對數(shù)據(jù)的要求,使用的AI開發(fā)手段也是不一樣的。
準備數(shù)據(jù)
數(shù)據(jù)準備主要是指收集和預處理數(shù)據(jù)的過程。
按照確定的分析目的,有目的性的收集、整合相關數(shù)據(jù),數(shù)據(jù)準備是AI開發(fā)的一個基礎。此時最重要的是保證獲取數(shù)據(jù)的真實可靠性。而事實上,不能一次性將所有數(shù)據(jù)都采集全,因此,在數(shù)據(jù)標注階段你可能會發(fā)現(xiàn)還缺少某一部分數(shù)據(jù)源,反復調(diào)整優(yōu)化。
訓練模型
俗稱“建模”,指通過分析手段、方法和技巧對準備好的數(shù)據(jù)進行探索分析,從中發(fā)現(xiàn)因果關系、內(nèi)部聯(lián)系和業(yè)務規(guī)律,為商業(yè)目的提供決策參考。訓練模型的結果通常是一個或多個機器學習或深度學習模型,模型可以應用到新的數(shù)據(jù)中,得到預測、評價等結果。
業(yè)界主流的AI引擎有TensorFlow、PyTorch、MindSpore等,大量的開發(fā)者基于主流AI引擎,開發(fā)并訓練其業(yè)務所需的模型。
評估模型
訓練得到模型之后,整個開發(fā)過程還不算結束,需要對模型進行評估和考察。往往不能一次性獲得一個滿意的模型,需要反復的調(diào)整算法參數(shù)、數(shù)據(jù),不斷評估訓練生成的模型。
一些常用的指標,如準確率、召回率、AUC等,能幫助您有效的評估,最終獲得一個滿意的模型。
部署模型
模型的開發(fā)訓練,是基于之前的已有數(shù)據(jù)(有可能是測試數(shù)據(jù)),而在得到一個滿意的模型之后,需要將其應用到正式的實際數(shù)據(jù)或新產(chǎn)生數(shù)據(jù)中,進行預測、評價、或以可視化和報表的形式把數(shù)據(jù)中的高價值信息以精辟易懂的形式提供給決策人員,幫助其制定更加正確的商業(yè)策略。