機(jī)器學(xué)習(xí)常見(jiàn)的分類有3種:

  • 監(jiān)督學(xué)習(xí):利用一組已知類別的樣本調(diào)整分類器的參數(shù),使其達(dá)到所要求性能的過(guò)程,也稱為監(jiān)督訓(xùn)練或有教師學(xué)習(xí)。常見(jiàn)的有回歸和分類。

  • 非監(jiān)督學(xué)習(xí):在未加標(biāo)簽的數(shù)據(jù)中,試圖找到隱藏的結(jié)構(gòu)。常見(jiàn)的有聚類。

  • 強(qiáng)化學(xué)習(xí):智能系統(tǒng)從環(huán)境到行為映射的學(xué)習(xí),以使獎(jiǎng)勵(lì)信號(hào)(強(qiáng)化信號(hào))函數(shù)值最大。

回歸

回歸反映的是數(shù)據(jù)屬性值在時(shí)間上的特征,產(chǎn)生一個(gè)將數(shù)據(jù)項(xiàng)映射到一個(gè)實(shí)值預(yù)測(cè)變量的函數(shù),發(fā)現(xiàn)變量或?qū)傩蚤g的依賴關(guān)系,其主要研究問(wèn)題包括數(shù)據(jù)序列的趨勢(shì)特征、數(shù)據(jù)序列的預(yù)測(cè)以及數(shù)據(jù)間的關(guān)系等。它可以應(yīng)用到市場(chǎng)營(yíng)銷的各個(gè)方面,如客戶尋求、保持和預(yù)防客戶流失活動(dòng)、產(chǎn)品生命周期分析、銷售趨勢(shì)預(yù)測(cè)及有針對(duì)性的促銷活動(dòng)等。

分類

分類是找出一組數(shù)據(jù)對(duì)象的共同特點(diǎn)并按照分類模式將其劃分為不同的類,其目的是通過(guò)分類模型,將數(shù)據(jù)項(xiàng)映射到某個(gè)給定的類別。它可以應(yīng)用到客戶的分類、客戶的屬性和特征分析、客戶滿意度分析、客戶的購(gòu)買趨勢(shì)預(yù)測(cè)等。

聚類

聚類是把一組數(shù)據(jù)按照相似性和差異性分為幾個(gè)類別,其目的是使得屬于同一類別的數(shù)據(jù)間的相似性盡可能大,不同類別中的數(shù)據(jù)間的相似性盡可能小。它可以應(yīng)用到客戶群體的分類、客戶背景分析、客戶購(gòu)買趨勢(shì)預(yù)測(cè)、市場(chǎng)的細(xì)分等。

與分類不同,聚類分析數(shù)據(jù)對(duì)象,而不考慮已知的類標(biāo)號(hào)(一般訓(xùn)練數(shù)據(jù)中不提供類標(biāo)號(hào))。聚類可以產(chǎn)生這種標(biāo)號(hào)。對(duì)象根據(jù)最大化類內(nèi)的相似性、最小化類間的相似性的原則進(jìn)行聚類或分組。對(duì)象的聚類是這樣形成的,使得在一個(gè)聚類中的對(duì)象具有很高的相似性,而與其它聚類中的對(duì)象很不相似。