Poradenství 

Datová analýza a byznys: Jakých chyb se novopečení analytici nejčastěji dopouštějí?

Stále více firem se ve svém byznysu snaží využívat síly dat, poptávka po datových vědcích a analyticích proto neustále roste. A spolu s ní roste i nabídka – na trhu práce se objevuje více a více datových vědců-absolventů nebo kandidátů, kteří opustili svou původní profesi a rozhodli se prostřednictvím různých kurzů přeškolit na analytiky. Jakých chyb se tito nováčci ve svých oborech nejčastěji dopouštějí? Podívejte se, s jakými nástrahami se musí (nejen) nováčci v datové analytice denně potýkat.

Každý zaměstnavatel by si přál, aby zaměstnanec, kterého najímá, měl co nejvíce zkušeností. Ne vždy je však možné najít takového pracovníka, a u mladých oborů to platí dvojnásob. Je pak potřeba počítat s tím, že se dotyčný nováček může občas dopustit určitých přešlapů. Obor datové analytiky je pro nováčky plný různých nástrah, s naším přehledem se však alespoň těm základním můžete snadno vyhnout.

Co konkrétně trápí novopečené datové analytiky?

  • Není asi nic horšího než strávit desítky hodin prací na úloze, která se nakonec ukáže jako nerelevantní pro řešení daného problému. Pro úspěšný datově-analytický projekt je klíčové v prvním kroku jednoznačně vymezit, jaký je jeho cíl a jaká jsou očekávání spojená s dodaným řešením. Často se za tímto opomenutím skrývá nedostatečná komunikace s klíčovými stakeholdery.
  • Nováčci často přeceňují důležitost algoritmů a podceňují důležitost kvality dat. Jak dokládá řada soutěžních projektů na Kaggle, „feature enegineering“ (přidávání, ubírání a transformace dat) často posune vaše skóre daleko výrazněji než změna algoritmu.
  • S předchozím bodem úzce souvisí podceňování role znalostí domény, ze které pochází naše data. Právě tyto znalosti umožňují vytvářet nové kvalitní prediktory a adekvátně posuzovat kvalitu a byznysovou relevanci analytických výstupů. Analytik by si měl tyto znalosti opatřit prostřednictvím nějakého experta, samostudiem a detailním obeznámením se s daty.
  • Lepšímu porozumění datům často brání nováčkovská netrpělivost s modelováním a nedostatečné množství času věnovaného explorační analýze a vizualizaci dat.
  • Stejně jako v mnoha jiných oblastech života i v datové vědě platí, že je třeba dělat věci co možná nejjednodušší, ale ne více, než je nutné. Nováček v oboru má často tendenci volit zbytečně komplexní modely, které si na nových datech vedou stejně dobře nebo i hůře než jednodušší modely typu logistické nebo lineární regrese.
  • Při interpretaci analytických výstupů nováčci často zapomínají na to, že korelace ještě neznamená kauzalitu. Ignorování tohoto faktu může vést k tomu, že si klient z našich výstupů vyvodí špatné závěry a zaváže se k neadekvátním akcím.
  • Statistická signifikance ještě neznamená praktickou signifikanci a pobídku k akci. Často se zapomíná, že p-hodnota by neměla být jediným kritériem pro posouzení důležitosti a relevantnosti našich zjištění.

Jak těmto chybám a mnohým dalším předcházet? Nezastupitelnou roli bezesporu hrají praktické zkušenosti a odborný dohled zkušenějších kolegů – jen skrze ně se člověku dostane potřebné zpětné vazby, která ho naučí, na co si dávat pozor, čeho se vyvarovat, co a jakým způsobem ošetřit apod. Získat dostatečné množství relevantních zkušeností ale nějakou dobu trvá. Co dělat mezitím?

Jako užitečná se ukazuje být velice jednoduchá metoda „checklistu“. Stačí si vytvořit seznam nejdůležitějších potenciálních „failů“ (vstupem zde mohou být informace od zkušenějších kolegů), a potom tento seznam pravidelně procházet při plánování a revizi projektů a zvažovat, zda náhodou některý z uvedených „failů“ není pro naši aktuální situaci relevantní. Přes svou jednoduchost je tato metoda překvapivě účinná. Jak dokládá řada příkladů z oblasti medicíny nebo letecké dopravy, tato metoda dokáže zachraňovat i lidské životy. Novopečeným datovým analytikům potom může pomoct ušetřit nejeden bolestivý střet s realitou datově-analytických projektů.

Potřebujete pomoct s využíváním firemních dat k řešení vašich byznysových problémů? Potom neváhejte a obraťte se na náš tým pokročilé analytiky nebo vyzkoušejte Data Science Academy.

Datová analytika

Nadcházející akce

Semináře, webcasty, pracovní snídaně a další akce pořádané společností Deloitte.

    Zobrazit vícearrow-right