Termen als data science, machine learning en AI worden steeds vaker gezien en gehoord. Toen de AI-tekstgeneratietool ChatGPT werd uitgebracht, werd het al snel de snelstgroeiende applicatie ooit. Het kostte de tool van OpenAI slechts 5 dagen om 1 miljoen gebruikers te bereiken. Om dat in perspectief te plaatsen: het kostte Facebook 10 maanden en Twitter 2 jaar!
Waar data science al jaren een spannend onderwerp is voor de meer technisch onderlegde mensen, heeft AI eindelijk het grote publiek aanzienlijk bereikt. Deze nieuwe golf van AI-populariteit heeft de belangstelling van het bedrijfsleven aangewakkerd om meer te leren over Data Science, AI en de mogelijkheden ervan. Met deze blog geven we je informatie die je kan helpen je eerste data science-project een vliegende start te geven, zodat deze buzz woorden werkelijkheid worden voor jouw organisatie.
Voordat we ingaan op wat je met data science kunt doen en hoe je een project moet aanpakken, bespreken we eerst kort wat data science is.
Data science is het proces waarbij kennis en inzichten uit ruwe data worden gehaald. Het bedrijf kan deze informatie vervolgens gebruiken om de besluitvorming te versterken en goed geïnformeerde actie te ondernemen. Data Science is in wezen het proces waarbij waarde uit je gegevens wordt gehaald. Data Science combineert wiskunde en statistiek, informatica en domeinexpertise. Data Science kent veel verschillende manieren om gegevens te verwerken en waardevol te maken. Deze omvatten datavisualisatie, statistische analyses, text mining, outlier detectie, machine learning, computer vision en nog veel meer.
De International Data Corporation (IDC) voorspelde in 2017 dat de hoeveelheid data die wordt geanalyseerd exponentieel zou groeien en binnen acht jaar met een factor 50 zou toenemen. We hebben nu enkele metingen tot ongeveer 2022, en de groei die IDC in 2017 voorspelde, was correct. Er worden steeds meer data gegenereerd. En dit is interessant voor de data scientist. Zoals hierboven besproken, kunnen gegevens waardevol zijn als we deze slim en effectief gebruiken.
Data Science vormt de kern van het begrijpen van de enorme hoeveelheden gegevens die we dagelijks genereren, en zet deze om in bruikbare inzichten die de besluitvorming kunnen verbeteren, de klantervaring kunnen verbeteren en zelfs kritieke problemen kunnen oplossen. Het is een superkracht in de huidige datagestuurde wereld, en als je dit begrijpt, rust je jezelf uit met de kennis om echt een verschil te maken.
Data Science begint een revolutie teweeg te brengen in meerdere wetenschapsgebieden. Om een paar voorbeelden te noemen: op medisch gebied heeft AI geholpen bij het vouwen van eiwitten en bij het sneller en nauwkeuriger opsporen van kanker. Extreme weersomstandigheden, zoals tornado’s, kunnen eerder door AI-systemen worden voorspeld dan voorheen mogelijk was. En in de toekomst zullen zelfrijdende auto’s de wegen voor iedereen veiliger maken.
Voor bedrijven kan Data Science echter ook impact hebben. Uit onderzoek van Forrester (2020), een wereldwijd marktonderzoeksbureau, bleek dat datagestuurde bedrijven 58% meer kans hadden om hun omzetdoelstellingen te behalen dan hun niet-datagestuurde branchegenoten. De adoptie van data science in jouw bedrijf kan een echte impact hebben.
De mogelijkheden van data science zijn vrijwel onbeperkt en raken vrijwel elke denkbare sector. Afhankelijk van de (soort) beschikbare data en het gestelde doel voor het project wordt gekozen voor een specifieke data science aanpak. Enkele voorbeelden van wat mogelijk is met data science:
Data Science kan de klantervaring aanzienlijk verbeteren door interacties te personaliseren op basis van klantgegevens. Detailhandelaren kunnen bijvoorbeeld data science gebruiken om producten aan klanten aan te bevelen op basis van hun browse- en aankoopgeschiedenis. Dit verhoogt niet alleen de klanttevredenheid, maar verhoogt ook de omzet.
Via voorspellende analyses en machine learning-modellen kunnen bedrijven de vraag voorspellen, de voorraad efficiënter beheren en de bedrijfsvoering stroomlijnen. Deze optimalisatie kan leiden tot kostenbesparingen en een verbeterde klantenservice door ervoor te zorgen dat producten en diensten betrouwbaarder en efficiënter worden geleverd.
Financiële instellingen maken gebruik van data science om frauduleuze transacties in realtime te detecteren, waardoor de verliezen aanzienlijk worden verminderd. Op dezelfde manier kunnen verzekeringsmaatschappijen het gebruiken om risico’s nauwkeuriger in te schatten, door premies vast te stellen die beter aansluiten bij het werkelijke risico dat het verzekeren van een persoon of bedrijf met zich meebrengt.
Data Science stelt bedrijven in staat beslissingen te nemen op basis van data in plaats van op basis van intuïtie. Door trends en patronen te analyseren, kunnen bedrijven nieuwe marktkansen identificeren, de voorkeuren van klanten begrijpen en sneller reageren op veranderingen in de markt. En dit is nog maar een kleine greep uit de mogelijkheden van data science use cases!
Het starten van jouw eerste data science-project kan een grote taak lijken. Om je hierbij te helpen, volgen hier enkele stappen die we graag volgen tijdens het uitvoeren van een project.
Begin met het duidelijk definiëren van het doel van jouw project. Denk na over wat we proberen te doen en waarom we dat doen. Denk ook na over wie we proberen te helpen en betrek hen bij het stellen van doelen. Een specifiek doel zal je helpen jouw inspanningen te sturen en je in staat te stellen jouw succes te meten.
Begin met het verzamelen van gegevens die kunnen worden gebruikt voor het doel dat je stelt. Dit kunnen gegevens zijn die intern beschikbaar zijn, zoals gegevens over financiën, bedrijfsvoering of klanten. Of gegevens uit externe bronnen zoals weergegevens, gegevens over de wereldmarkten of informatie die van websites is gehaald. Bedenk ook welke gegevens nu niet direct beschikbaar zijn, maar wel waardevol kunnen zijn, en begin met het verzamelen van deze gegevens.
Nadat we onze gegevens hebben verzameld, kunnen we onze gegevens voorbereiden op de volgende stappen. Dit kan het opschonen van de gegevens inhouden, het omgaan met ontbrekende waarden en het transformeren van variabelen.
Voordat je in complexe Data Science benaderingen duikt, voer je EDA uit om inzicht te krijgen in jouw gegevens, de patronen, afwijkingen of spannende relaties ervan. Deze kennis zal je helpen bij de volgende stappen.
Afhankelijk van het doel van jouw project selecteer je de juiste data science-aanpak en -tool(s). Zoals hierboven besproken, biedt data science veel manieren om waarde uit jouw gegevens te halen. Dit kan variëren van regressieanalyse voor het voorspellen van numerieke waarden tot clustertechnieken voor segmentatietaken of statistische analyse. De juiste aanpak is afhankelijk van het gestelde doel en de beschikbare data. Doe hier wat onderzoek; er is vaak een eenvoudige en effectieve manier om je doel te bereiken.
Bedenk ook in welke tool je wilt werken. Wil je een eenvoudige tool zonder (veel) codering of een tool die je veel geavanceerde mogelijkheden geeft? Moet de tool cloudgebaseerd zijn of lokaal worden uitgevoerd? Als je al over een solide data-infrastructuur beschikt, overweeg dan de compatibiliteit met jouw huidige systeem. Het kiezen van het juiste gereedschap is afhankelijk van de situatie en het project. Wil je inspiratie over hoe je deze interne kennis naar een hoger niveau krijgt? Lees hier hoe Greenchoice haar kennis van Data Science heeft vergroot
Na het uitvoeren van jouw data science-project evalueer je de prestaties ervan met behulp van de juiste statistieken. Gebruik de doelen die in het begin zijn gesteld en beoordeel of deze met de huidige resultaten kunnen worden bereikt. Wees bereid om jouw model te herhalen op basis van feedback en resultaten om de nauwkeurigheid ervan te verbeteren.
Nadat we het data science project hebben uitgevoerd en tevreden zijn met de resultaten, willen we de uitkomsten gaan gebruiken binnen onze organisatie. Het proces van het operationeel maken van jouw data science-oplossing kan variëren van eenvoudig tot meer geavanceerd en is wederom afhankelijk van het type aanpak, de gebruikte tool en hoe de oplossing zal worden gebruikt. Daarom is het betrekken van de eindgebruiker bij het stellen van doelen erg belangrijk.
Data Science kan een krachtig hulpmiddel zijn als het effectief wordt gebruikt, waardoor jouw bedrijf een voordeel krijgt. Hopelijk heb je iets geleerd over data science en wat dit voor jouw bedrijf kan betekenen, en weet je hoe je jouw data science project een vliegende start kunt geven! Heb je vragen of wil je brainstormen over hoe je data science binnen jouw bedrijf kunt gaan inzetten, neem dan contact met ons op! Ook kunnen wij je helpen bij de eerste stap bij het definiëren van de juiste use cases met behulp van onze templates en kennis.
Wil je geïnspireerd worden welke tools er op de markt beschikbaar zijn? Tijdens ons gratis online evenement genaamd de Data & Automation Line Up op 16 mei bespreken we de laatste ontwikkelingen rond data & automatiseringsoplossingen. De keuze is aan jou, van datavisualisatie tot data-engineering en van low-coding tot data science! Of je nu op zoek bent naar iets nieuws of meer uit jouw bestaande oplossing wilt halen. In één middag ben je up-to-date en zie je de nieuwste functionaliteiten en oplossingen live in actie.
Woon het hele programma bij of alleen de sessies die op dit moment voor jou relevant zijn. Het is aan jou! Meer informatie over het evenement? Bekijk hier het volledige programma.
Een ambitieuze data-strategie, toekomstbestendige data-architectuur én een snelgroeiend aantal eindgebruikers van de datavisualisatie-omgeving: er zijn al flinke stappen gezet door groene energieleverancier Greenchoice. Om de volgende stap te zetten naar datavolwassenheid heeft Greenchoice in samenwerking met Rockfeather een in-company Data Science training ontwikkeld. Hoofddoel van deze training: Data Science use cases identificeren, ontwikkelen en uitvoeren. Alex Janssen, Manager Development Consument en Data & Analytics vertelt wat deze training heeft opgeleverd.
Voor voetbalclubs die uitkomen op het hoogste niveau zijn seizoenkaarten een van de belangrijkste inkomstenstromen. Een club heeft er dan ook baat bij om het aantal opzeggingen zo laag mogelijk te houden. Het is voor veel clubs echter moeilijk om in te schatten wie er nou precies weggaat. In deze casus laten wij zien hoe wij bij ADO Den Haag met een voorspellend model hebben gezorgd voor inzicht in mogelijke opzeggingen.