data mining examples
Tento výukový program zahrnuje nejoblíbenější příklady těžby dat v reálném životě. Další informace o aplikaci pro dolování dat v oblasti financí, marketingu, zdravotnictví a CRM:
V tomhle Série školení pro těžbu dat zdarma , podívali jsme se na Proces dolování dat v našem předchozím tutoriálu. Dolování dat, známé také jako Zjišťování znalostí v databázích (KDD), je proces zjišťování vzorů ve velké sadě dat a datových skladů.
K identifikaci užitečných výsledků se na data používají různé techniky, jako je regresní analýza, asociace a shlukování, klasifikace a odlehlá analýza. Tyto techniky používají software a backendové algoritmy, které analyzují data a ukazují vzory.
nejlepší nástroj pro ořezávání pro Windows 10
Mezi známé metody těžby dat patří analýza rozhodovacích stromů, Bayesova věta, těžba častých položek atd. Softwarový trh má mnoho otevřených i placených nástrojů pro těžbu dat, jako jsou Weka, Rapid Miner a Oranžové nástroje pro dolování dat.
Proces dolování dat začíná poskytnutím určitého vstupu dat do nástrojů pro dolování dat, které používají statistiky a algoritmy k zobrazení zpráv a vzorů. Výsledky lze vizualizovat pomocí těchto nástrojů, které lze pochopit a dále použít k provádění obchodních úprav a vylepšení.
Dolování dat široce využívají organizace při vytváření marketingové strategie, nemocnice pro diagnostické nástroje, eCommerce pro křížový prodej produktů prostřednictvím webových stránek a mnoha dalšími způsoby.
Některé příklady dolování dat jsou uvedeny níže pro vaši potřebu.
Co se naučíte:
- Příklady dolování dat v reálném životě
- Příklady dolování dat ve financích
- Aplikace dolování dat v marketingu
- Příklady aplikací pro dolování dat ve zdravotnictví
- Systémy pro dolování dat a doporučení
- Data Mining for CRM (Customer Relationship Management)
- Těžba dat pomocí příkladu rozhodovacího stromu
- Nejoblíbenější příklad dolování dat: marketing a prodej
- Velké společnosti využívající dolování dat
- Závěr
- Doporučené čtení
Příklady dolování dat v reálném životě
Důležitost těžby a analýzy dat v našem reálném životě každým dnem roste. Dnes většina organizací používá dolování dat pro analýzu velkých dat.
Podívejme se, jak nám tyto technologie prospívají.
# 1) Poskytovatelé mobilních služeb
Poskytovatelé mobilních služeb používají dolování dat k navrhování svých marketingových kampaní ak udržení zákazníků v přechodu k jiným prodejcům.
Z velkého množství dat, jako jsou fakturační údaje, e-maily, textové zprávy, přenos dat z webu a služby zákazníkům, mohou nástroje pro dolování dat předpovědět „churn“, který řekne zákazníkům, kteří chtějí změnit dodavatele.
S těmito výsledky je dáno skóre pravděpodobnosti. Poskytovatelé mobilních služeb jsou poté schopni poskytovat pobídky a nabídky zákazníkům, u kterých je vyšší riziko střetu. Tento druh těžby často využívají hlavní poskytovatelé služeb, jako jsou širokopásmové připojení, telefon, poskytovatelé plynu atd.
(obraz zdroj )
# 2) Maloobchodní sektor
Data Mining pomáhá majitelům supermarketů a maloobchodu poznat možnosti zákazníků. Při pohledu na historii nákupu zákazníků ukazují nástroje pro dolování dat nákupní preference zákazníků.
S pomocí těchto výsledků navrhují supermarkety umístění produktů na regálech a přinášejí nabídky na zboží, jako jsou kupóny na odpovídající produkty a speciální slevy na některé produkty.
Tyto kampaně jsou založeny na seskupení RFM. RFM je zkratka pro aktuálnost, frekvenci a peněžní seskupení. Propagační a marketingové kampaně jsou přizpůsobeny pro tyto segmenty. Se zákazníkem, který utrácí hodně, ale velmi méně často, se bude zacházet jinak než se zákazníkem, který nakupuje každé 2–3 dny, ale v menším množství.
Data Mining lze použít pro doporučení produktů a křížové odkazy na položky.
Těžba dat v maloobchodě z různých zdrojů dat.
(obraz zdroj )
# 3) Umělá inteligence
Systém je vytvořen uměle inteligentní tím, že jej napájí příslušnými vzory. Tyto vzory pocházejí z výstupů dolování dat. Výstupy uměle inteligentních systémů jsou také analyzovány z hlediska jejich relevance pomocí technik dolování dat.
Systémy doporučujícího používají techniky dolování dat k vytváření osobních doporučení při interakci zákazníka se stroji. Umělá inteligence se používá na vytěžených datech, jako je poskytování doporučení produktů na základě minulé nákupní historie zákazníka v Amazonu.
# 4) Elektronický obchod
Mnoho webů elektronického obchodování využívá dolování dat k tomu, aby nabídlo křížový prodej a prodej svých produktů. Nákupní weby jako Amazon, Flipkart ukazují „Lidé si také prohlíželi“, „Často nakupovali společně“ zákazníkům, kteří s webem komunikují.
Tato doporučení jsou poskytována pomocí dolování dat v průběhu historie nákupu zákazníků webových stránek.
# 5) Věda a inženýrství
S příchodem dolování dat nyní vědecké aplikace přecházejí od statistických technik k technikám „shromažďování a ukládání dat“ a poté provádějí těžbu na nových datech, vydávají nové výsledky a experimentují s procesem. Velké množství dat se shromažďuje z vědeckých oblastí, jako je astronomie, geologie, satelitní senzory, globální poziční systém atd.
Data mining v počítačové vědě pomáhá sledovat stav systému, zlepšovat jeho výkon, zjišťovat chyby softwaru, objevovat plagiátorství a zjišťovat chyby. Dolování dat také pomáhá při analýze zpětné vazby uživatelů ohledně produktů a článků, z nichž lze odvodit názory a sentiment názorů.
# 6) Prevence kriminality
Data Mining detekuje odlehlé hodnoty v obrovském množství dat. Trestní údaje zahrnují všechny podrobnosti o trestném činu, který se stal. Data Mining bude studovat vzorce a trendy a předpovídat budoucí události s vyšší přesností.
Agentury mohou zjistit, která oblast je více náchylná k trestné činnosti, kolik policejního personálu by mělo být nasazeno, na kterou věkovou skupinu by se mělo cílit, počty vozidel, které by se měly zkoumat atd.
# 7) Výzkum
Výzkumníci používají nástroje pro dolování dat k prozkoumání souvislostí mezi parametry výzkumu, jako jsou podmínky prostředí, jako je znečištění ovzduší, a šíření nemocí, jako je astma, mezi lidmi v cílových regionech.
# 8) Zemědělství
Zemědělci pomocí dolování dat zjišťují výtěžek zeleniny s množstvím vody, kterou rostliny potřebují.
# 9) Automatizace
Pomocí dolování dat se počítačové systémy učí rozpoznávat vzory mezi parametry, které jsou ve srovnání. Systém bude ukládat vzorce, které budou v budoucnu užitečné pro dosažení obchodních cílů. Toto učení je automatizace, protože pomáhá při plnění cílů pomocí strojového učení.
# 10) Dynamické ceny
Dolování dat pomáhá poskytovatelům služeb, jako jsou kabinové služby, dynamicky účtovat zákazníkům na základě poptávky a nabídky. Je to jeden z klíčových faktorů úspěchu společností.
# 11) Doprava
Data Mining pomáhá při plánování přesunu vozidel ze skladů do prodejen a analyzuje vzorce načítání produktů.
# 12) Pojištění
Metody dolování dat pomáhají předpovídat zákazníky, kteří kupují zásady, analyzují společně použitá lékařská tvrzení, zjišťují podvodné chování a riskantní zákazníky.
Příklady dolování dat ve financích
( obraz zdroj )
Finanční sektor zahrnuje banky, pojišťovny a investiční společnosti. Tyto instituce shromažďují obrovské množství dat. Data jsou často úplná, spolehlivá a vysoce kvalitní a vyžadují systematickou analýzu dat.
K ukládání finančních dat jsou zkonstruovány datové sklady, které ukládají data ve formě datových kostek. K analýze těchto dat se používají pokročilé koncepty datových krychlí. Při analýze a těžbě finančních dat se používají metody dolování dat, jako je shlukování a analýza odlehlých hodnot, charakterizace.
Níže jsou uvedeny některé případy ve financích, kde se používá dolování dat.
# 1) Predikce splátek půjčky
Metody dolování dat, jako je výběr atributů a pořadí atributů, budou analyzovat platební historii zákazníka a vybírají důležité faktory, jako je poměr plateb k příjmům, kreditní historie, doba trvání půjčky atd. Výsledky pomohou bankám rozhodnout se o její politice poskytování úvěrů a také poskytovat půjčky zákazníkům podle faktorové analýzy.
# 2) Cílený marketing
Klastrování a klasifikace metod dolování dat pomohou najít faktory, které ovlivňují rozhodnutí zákazníka vůči bankovnictví. Podobná identifikace zákazníků na základě chování usnadní cílený marketing.
# 3) Odhalte finanční trestné činy
Bankovní údaje pocházejí z mnoha různých zdrojů, z různých měst a z různých míst bank. Ke studiu a detekci neobvyklých trendů, jako jsou transakce s vysokou hodnotou, je nasazeno několik nástrojů pro analýzu dat. K identifikaci vztahů a vzorců akce se používají nástroje pro vizualizaci dat, nástroje pro odlehlou analýzu, nástroje pro shlukování atd.
Na následujícím obrázku je studie společnosti Infosys, která ukazuje ochotu zákazníka bankovnictví online v různých zemích. Společnost Infosys pro tuto studii použila analýzu velkých dat.
(obraz zdroj )
Aplikace dolování dat v marketingu
Dolování dat podporuje marketingovou strategii společnosti a podporuje podnikání. Je to jeden z klíčových faktorů úspěchu společností. Shromažďuje se obrovské množství údajů o prodeji, nakupování zákazníků, spotřebě atd. Tato data se každým dnem zvyšují díky elektronickému obchodování.
Dolování dat pomáhá identifikovat nákupní chování zákazníků, zlepšit služby zákazníkům, zaměřit se na udržení zákazníků, zvýšit prodej a snížit náklady podniků.
Některé příklady dolování dat v marketingu jsou:
# 1) Forecasting Market
K předpovědi trhu budou marketingoví profesionálové používat techniky dolování dat, jako je regrese, ke studiu chování zákazníků, změn a návyků, reakce zákazníků a dalších faktorů, jako je marketingový rozpočet, další vznikající náklady atd. V budoucnu to bude pro profesionály jednodušší předvídat zákazníky v případě jakýchkoli změn faktorů.
# 2) Detekce anomálií
K detekci jakýchkoli abnormalit v datech, které by mohly způsobit jakoukoli chybu v systému, jsou nasazeny techniky dolování dat. Systém provede tuto operaci skenováním tisíců komplexních záznamů.
# 3) Zabezpečení systému
Nástroje pro dolování dat detekují průniky, které mohou poškodit databázi, a nabízejí tak větší zabezpečení celému systému. Tyto útoky mohou být ve formě duplicitních záznamů, virů ve formě dat hackerů atd.
Příklady aplikací pro dolování dat ve zdravotnictví
(obraz zdroj )
Ve zdravotnictví je těžba dat stále populárnější a zásadní.
Údaje generované zdravotní péčí jsou složité a objemné. Aby se předešlo lékařským podvodům a zneužití, používají se nástroje pro dolování dat k odhalování podvodných položek, a tím ke ztrátě.
znak na int c ++
Některé příklady dolování dat ve zdravotnickém průmyslu jsou uvedeny níže pro vaši potřebu.
# 1) Řízení zdravotní péče
Metoda dolování dat se používá k identifikaci chronických onemocnění, sledování vysoce rizikových oblastí náchylných k šíření nemocí, navrhování programů ke snížení šíření nemocí. Zdravotničtí pracovníci budou analyzovat nemoci, regiony pacientů s maximálním počtem hospitalizací.
S těmito daty navrhnou kampaně pro region, aby informovali lidi o této nemoci a zjistili, jak se jí vyhnout. Tím se sníží počet pacientů přijatých do nemocnic.
# 2) Efektivní léčba
Pomocí dolování dat lze vylepšit zpracování. Neustálým srovnáváním příznaků, příčin a léků lze provádět analýzu dat za účelem účinné léčby. Dolování dat se také používá k léčbě konkrétních nemocí a sdružování vedlejších účinků léčby.
# 3) Podvodná a zneužívající data
Aplikace pro dolování dat se používají k nalezení neobvyklých vzorců, jako jsou laboratoře, výsledky lékařů, nevhodné předpisy a podvodná lékařská tvrzení.
Systémy pro dolování dat a doporučení
Systémy doporučení poskytují zákazníkům doporučení produktů, která by mohla uživatele zajímat.
Doporučené položky jsou buď podobné položkám dotazovaným uživatelem v minulosti, nebo prohlížením dalších předvoleb zákazníka, které mají podobný vkus jako uživatel. Tento přístup se vhodně nazývá přístup založený na obsahu a přístup založený na spolupráci.
V doporučovacích systémech se používá mnoho technik, jako je získávání informací, statistiky, strojové učení atd.
Systémy doporučení doporučují hledat klíčová slova, uživatelské profily, uživatelské transakce, společné funkce mezi položkami a odhadovat položku pro uživatele. Tyto systémy také najdou ostatní uživatele, kteří mají podobnou historii nákupu, a předpovídají položky, které tito uživatelé mohli koupit.
Tento přístup má mnoho výzev. Systém doporučení musí prohledávat miliony dat v reálném čase.
Doporučovací systémy způsobují dva typy chyb:
Falešné negativy a falešná pozitiva.
Falešné negativy jsou produkty, které systém nedoporučil, ale zákazník by je chtěl. Falešně pozitivní jsou produkty, které systém doporučil, ale zákazník je nechtěl. Další výzvou je doporučení pro uživatele, kteří jsou noví bez jakékoli historie nákupu.
K analýze dotazu a poskytnutí zobecněných souvisejících informací souvisejících s dotazem se používá technika inteligentního zodpovězení dotazu. Například: Zobrazování recenzí restaurací namísto pouze adresy a telefonního čísla hledané restaurace.
Data Mining for CRM (Customer Relationship Management)
Řízení vztahů se zákazníky lze posílit pomocí dolování dat. Dobré vztahy se zákazníky lze vybudovat přilákáním vhodnějších zákazníků, lepším křížovým prodejem a up-sellem, lepší retencí.
Data Mining může vylepšit CRM pomocí:
- Dolování dat může pomoci podnikům vytvářet cílené programy pro vyšší odezvu a lepší návratnost investic.
- Podniky mohou nabízet více produktů a služeb podle přání zákazníků prostřednictvím up-sell a cross-sell, čímž se zvyšuje spokojenost zákazníků.
- Díky dolování dat může podnik zjistit, kteří zákazníci hledají další možnosti. S využitím těchto informací mohou společnosti vytvářet nápady, jak zabránit zákazníkovi v odchodu.
Dolování dat pomáhá CRM v:
- Databázový marketing: Marketingový software umožňuje společnostem odesílat zprávy a e-maily zákazníkům. Tento nástroj spolu s dolováním dat dokáže cílený marketing. Díky dolování dat lze provádět automatizaci a plánování úloh. Pomáhá to při lepším rozhodování. Pomůže také při technických rozhodnutích ohledně toho, jaký druh zákazníků má zájem o nový produkt, která oblast trhu je pro uvedení produktu na trh dobrá.
- Kampaň na získání zákazníka: Díky dolování dat bude odborník na trhu schopen identifikovat potenciální zákazníky, kteří nevědí o produktech nebo nových kupujících. Budou schopni navrhnout nabídky a iniciativy pro takové zákazníky.
- Optimalizace kampaně: Společnosti využívají dolování dat pro efektivitu kampaně. Může modelovat reakce zákazníků na marketingové nabídky.
Těžba dat pomocí příkladu rozhodovacího stromu
Algoritmy rozhodovacího stromu se nazývají CART (Classification and Regression Trees). Je to metoda učení pod dohledem. Stromová struktura je postavena na zvolených funkcích, podmínkách rozdělení a kdy přestat. Rozhodovací stromy se používají k předpovědi hodnoty proměnných tříd na základě učení z předchozích tréninkových dat.
Interní uzel představuje atribut a listový uzel představuje popisek třídy.
(obraz zdroj )
K vytvoření struktury rozhodovacího stromu se používají následující kroky:
- Umístěte nejlepší atribut do horní části stromu (root).
- Podmnožiny se vytvářejí takovým způsobem, že každá podmnožina představuje data se stejnou hodnotou pro atribut.
- Opakujte stejné kroky a najděte listové uzly všech větví.
Aby bylo možné předpovědět označení třídy, porovná se atribut záznamu s kořenem stromu. Při porovnání je vybrána další větev. Interní uzly jsou také srovnávány stejným způsobem, dokud nedosáhne uzel listu předpovídá proměnnou třídy.
Některé algoritmy používané pro indukci rozhodovacích stromů zahrnují Huntův algoritmus, CART, ID3, C4.5, SLIQ a SPRINT.
Nejoblíbenější příklad dolování dat: marketing a prodej
Marketing a prodej jsou domény, ve kterých mají společnosti velké objemy dat.
# 1) Banky jsou prvními uživateli technologie dolování dat, protože jim pomáhá s hodnocením úvěrů. Data mining analyzuje, jaké služby nabízené bankami zákazníci využívají, jaký typ zákazníků používá bankomatové karty a co si obecně pomocí svých karet kupují (pro křížový prodej).
Banky používají dolování dat k analýze transakcí, které zákazník provede dříve, než se rozhodne změnit banku, aby snížil opotřebení zákazníků. Některé odlehlé hodnoty v transakcích jsou také analyzovány z hlediska detekce podvodů.
# 2) Mobilní telefon Společnosti používat techniky dolování dat, aby se zabránilo stloukání. Churning je opatření ukazující počet zákazníků opouštějících služby. Detekuje vzory, které ukazují, jak mohou zákazníci těžit ze služeb pro udržení zákazníků.
# 3) Analýza tržního koše je technika k vyhledání skupin položek, které se kupují společně v obchodech. Analýza transakcí ukazuje vzorce, jako například to, které věci se kupují společně, například chléb s máslem, nebo které položky mají v určitých dnech vyšší objem prodeje, například v pátek pivo.
Tyto informace pomáhají při plánování rozvržení obchodu, nabízejí speciální slevu na položky, které jsou méně žádané, vytvářejí nabídky jako „koupit 2, získat 1 zdarma“ nebo „získat 50% za druhý nákup“ atd.
(obraz zdroj )
Velké společnosti využívající dolování dat
Níže jsou uvedeny některé online společnosti využívající techniky dolování dat:
- AMAZONKA: Amazon používá textovou těžbu k nalezení nejnižší ceny produktu.
- MC Donald's: Společnost McDonald’s využívá těžbu velkých dat k vylepšení své zákaznické zkušenosti. Studuje vzor objednávání zákazníků, čekací doby, velikost objednávek atd.
- NETFLIX: Netflix pomocí informací o dolování dat zjistí, jak udělat film nebo seriál mezi zákazníky populární.
Závěr
Data mining se používá v různých aplikacích, jako je bankovnictví, marketing, zdravotnictví, telekomunikační průmysl a mnoho dalších oblastí.
Techniky dolování dat pomáhají společnostem získávat znalé informace a zvyšovat jejich ziskovost prováděním úprav v procesech a operacích. Jedná se o rychlý proces, který pomáhá podnikání v rozhodování prostřednictvím analýzy skrytých vzorů a trendů.
Podívejte se na náš nadcházející výukový program a dozvíte se více o algoritmu dolování dat z rozhodovacího stromu !!
Výukový program PREV | DALŠÍ výuka
Doporučené čtení
- Těžba dat: Proces, techniky a hlavní problémy v analýze dat
- Techniky dolování dat: Algoritmus, metody a nejlepší nástroje pro dolování dat
- Proces dolování dat: zúčastněné modely, procesní kroky a výzvy
- Data Mining vs. Machine Learning vs. Artificial Intelligence vs. Deep Learning
- 10+ nejlepších nástrojů pro správu dat k naplnění vašich datových potřeb v roce 2021
- Top 14 NEJLEPŠÍCH nástrojů pro správu dat testování v roce 2021
- Top 15 nejlepších bezplatných nástrojů pro dolování dat: nejkomplexnější seznam
- Top 10 konferencí o velkých datech, které musíte dodržet v roce 2021