[0]

Data, maar waar?

​In de digitale wereld van vandaag groeit data snel, héél snel. Een rapport van een groot Amerikaans IT bedrijf laat zien dat elk 2 jaar de hoeveelheid data verdubbeld. En toch is mijn stelling dat het lastig is om goede data te vinden om een specifiek vraagstuk op te lossen, zeker als het vraagstuk geen terugkerend fenomeen is.

 
Het hangt ook af hoe hoog je de lat legt, vaak kan je een dataset vinden die in de goede richting zit van de te beantwoorden vraagstuk.
 
Het lijkt mij leuk om voor de komende blogs een vraagstuk op te pakken en om met een concreet voorbeeld te illustreren waarover ik het heb. Stel je voor dat je wilt weten hoe muziek over de tijd is veranderd en je wilt dit fact based met data onderbouwen. Wat nu?
 
Een eerste stap is om te analyseren waar je het vraagstuk uit opgebouwd is. Deze bestaat uit 3 delen:
1.      Muziek
2.      Tijd
3.      Verandering
 
Deze 3 delen zijn brede termen, de kunst is dit concreet te maken zodat je dit fact based kan analyseren en met de zoektocht op de goede weg te zitten.
 
Wat is muziek? Dat heeft vele dimensies: de muziekinstrumenten, de vocalisten, muziekgenre, het tempo, de muziekteksten, etc..
Tijd, is dit een vergelijking tussen muziek van de jaren 90 met nu?
En de verandering in muziek, dit zou je kunnen hangen aan de verandering in muziekgenre.
 
En dan heb je het bedacht, maar hoe kom aan deze data. De uitdaging in de wereld van Big Data wordt ineens lastig. Hoe zou jij dit aanpakken?
 
De volgende keer doe ik een poging om hier iets leuks van te maken, stay tuned!

Opmerkingen

Er zijn geen opmerkingen bij dit bericht.

Opmerking toevoegen

Titel


Hoofdtekst *


Bijlagen

CAPTCHA
Change the CAPTCHA codeSpeak the CAPTCHA code