az ügyfelek lemorzsolódásának előrejelzése A H2O

az ügyfelek lemorzsolódásának előrejelzése ésszerűen ismert probléma az Ügyfélkapcsolat-kezelés (CRM) területén, és a modern marketingstratégiák kulcsfontosságú eleme. Az ügyfelek megtartása nagyon fontos a szervezetek számára, és látni fogjuk, hogy a H2O hogyan játszhat létfontosságú szerepet az adattudományi folyamatban azáltal, hogy gyorsan prediktív modelleket hoz létre, majd az insights segítségével növeli az ügyfelek megtartását.

a felhasznált adatkészlet a 2009-es KDD Cup Challenge-hez tartozik. Ez a Flow felületen a Examples > Browse installed packs > examples > KDDCup 2009_Churn.flow alatt is elérhető. Alternatív megoldásként használja a következő linkeket a képzési, illetve az érvényesítési adatok eléréséhez :

  • képzési adatok
  • validációs adatok

itt látható az áramlási folyamat, amelyet a képzés és az előrejelzések elvégzéséhez használunk.

gépi tanulási folyamat

Adatok importálása /feltöltése

írja be a fájl elérési útját a keresés automatikus kitöltése mezőbe, majd nyomja meg az Enter billentyűt. Válassza ki a fájlt a keresési eredmények közül, majd erősítse meg a Add All linkre kattintva. Feltölthetünk egy helyi fájlt is, vagy közvetlenül megemlíthetjük az adatkészlet url-jét.

lássuk, hogyan tudjuk importálni a képzési adatokat a flow interfészbe.

adatok elemzése

a következő lépés az importált adatok elemzése. Kiválaszthatjuk az elemzők típusát, de a legtöbb esetben a H2O automatikusan kitalálja számunkra. Az elemzési beállítási oldal során kiválaszthatjuk az oszlopneveket, valamint az oszloptípusokat. A lemorzsolódás oszlopnál változtassuk meg az adattípust numerikusról enumra, amely kategorikus változót jelent. A lemorzsolódás oszlop a válasz oszlop, így a modellépítési folyamat során ez az oszlop automatikusan kibővül a dummy változókká.

ezután, amikor megnyomja a parse gombot, az adatok elemzésre kerülnek, és .hex formátumba konvertálódnak.

az egyes címkeadatok megjelenítésére a megfelelő oszlopra kattintva is lehetőség van. Vizualizáljuk a lemorzsolódás oszlopot és annak különböző eloszlásait.

építési modellek

mielőtt folytatnánk a modellépítési folyamatot, két alapvető dolgot kell tennünk:

  • a hiányzó adatok Imputálása

kattintson a Data lapon található Imputálás lehetőségre, és válassza ki az imputálás kritériumát az adatkészlet kiválasztott oszlopain.

  • az adatok felosztása képzési és tesztelési készletbe.

a felosztási adatok a felosztási Arány megadásával érhetők el, és ennek megfelelően egy képzési és tesztelési keret jön létre. Kattintson az adatok legördülő menüre, és válassza az osztott keret lehetőséget.

  • GBM modell építése

miután végzett az adatok feltárásával, elkezdheti a prediktív modell felépítését, amely a gyártásba kerül. Kattintson a Model fülre, és a Flow megjeleníti az összes elérhető algoritmus listáját.A H2O számos algoritmust támogat a GLM-től a GBM-en át az AutoML-ig a DeepLearning-ig. Itt van a teljes lista:

a cikk kedvéért egy általános növelő gépet(GBM) építünk, amely egy előre tanulási együttes módszer. Válassza ki az adatkészleteket és a válasz oszlopot, hagyja alapértelmezettként az összes többi beállítást, majd készítse el a modellt.

modellek megtekintése

megtekinthetjük a modell eredményeit is, amelyek segítenek gyorsan megítélni, hogy a modell hogyan teljesített. Megkapjuk a pontozási előzményeket, a ROC görbéket, a változó fontosságot és sok más releváns információt, amelyek nagyon hasznosak lehetnek modellünk teljesítményének megítéléséhez.

Kategória: Articles

0 hozzászólás

Vélemény, hozzászólás?

Avatar placeholder

Az e-mail-címet nem tesszük közzé.