Correlatie versus oorzakelijk verband: begrijp het verschil voor uw product (2023)

Correlatie en oorzakelijk verband kunnen bedrieglijk vergelijkbaar lijken, maar het herkennen van hun verschillen is cruciaal voor het begrijpen van relaties tussen variabelen. In dit artikel geven we je een duidelijke definitie van het verschil tussen causaliteit en correlatie.

Vervolgens zullen we ons richten op correlatie en oorzakelijk verband, specifiek voor het bouwen van digitale producten en begripgebruikersgedrag. Productmanagers, datawetenschappers en analisten zullen dit nuttig vinden om de juiste inzichten te benutten om de productgroei te vergroten, bijvoorbeeld of bepaalde functies van invloed zijn opklantenbehoudof verloving. Het begrijpen van correlatie versus oorzakelijk verband kan het verschil zijn tussen het verspillen van moeite aan functies met een lage waarde en het creëren van een product waar uw klanten niet mee kunnen stoppen.

En zelfs als u zich niet in de productwereld bevindt, denken we dat u er baat bij zult hebben als u begrijpt hoe u het verschil kunt zien tussen correlatie en oorzakelijk verband.

Na het lezen van dit artikel zult u:

  • Begrijp wat correlatie is
  • Begrijp wat causaliteit is
  • Ken de belangrijkste verschillen tussen correlatie en oorzakelijk verband
  • Ken twee robuuste oplossingen die u kunt gebruiken om te testen op oorzakelijk verband

Wat is het verschil tussen correlatie en oorzakelijk verband?

Hoewel oorzakelijk verband en correlatie tegelijkertijd kunnen bestaan, impliceert correlatie geen oorzakelijk verband.Oorzakelijk verband betekent dat het een het ander veroorzaakt - met andere woorden, actie Aoorzakenresultaat B. Aan de andere kant,correlatie is gewoon een relatie waarbij actie Aheeft te maken metactie B- maar de ene gebeurtenis veroorzaakt niet noodzakelijkerwijs de andere gebeurtenis.

Correlatie versus oorzakelijk verband: begrijp het verschil voor uw product (1)

In dit voorbeeld is er eencorrelatietussen ijs eten en verbranden omdat de twee gebeurtenissen met elkaar verband houden. Maar geen van beide evenementen eigenlijkoorzakende andere. In plaats daarvan worden beide gebeurtenissen veroorzaakt door iets anders: zonnig weer.

Correlatie en oorzakelijk verband worden vaak verward omdat de menselijke geest graag verklaringen vindt voor ogenschijnlijk gerelateerde gebeurtenissen, zelfs als ze niet bestaan. We verzinnen deze verklaringen vaak wanneer twee variabelen zo nauw met elkaar verbonden lijken te zijn dat de ene afhankelijk is van de andere. Dat zou een oorzaak-en-gevolgrelatie impliceren, waarbij de ene gebeurtenis het resultaat is van een andere gebeurtenis.

We kunnen echter niet zomaar een oorzakelijk verband aannemen, zelfs niet als we twee gebeurtenissen schijnbaar samen voor onze ogen zien gebeuren. Waarom? Ten eerste zijn onze observaties puur anekdotisch. Ten tweede zijn er verschillende andere mogelijkheden voor een vereniging, waaronder:

  • Het tegenovergestelde is waar: B veroorzaakt eigenlijk A.
  • De twee zijn gecorreleerd, maar er is meer aan de hand: A en B zijn gecorreleerd, maar worden in feite veroorzaakt door C.
  • Er is nog een variabele bij betrokken: A veroorzaakt B, zolang D maar gebeurt.
  • Er is een kettingreactie: A veroorzaakt E, waardoor E B veroorzaakt (maar je zag alleen dat A B veroorzaakt met je eigen ogen).

Een voorbeeld van correlatie versus oorzakelijk verband inproductanalyse

U zou kunnen verwachten dat er een oorzakelijk verband in uw product zit, waarbij specifieke acties of gedragingen van gebruikers resulteren in een bepaald resultaat.

Stel je dit voor: je hebt zojuist een nieuwe versie van je mobiele app voor het streamen van muziek gelanceerd. U veronderstelt dat klantbehoud voor uw product gekoppeld is aan sociaal gedrag in de app. Je vraagt ​​je team om een ​​nieuwe functie te ontwikkelen waarmee gebruikers lid kunnen worden van 'communities'.

Een maand nadat u uw nieuwe communityfunctie heeft uitgebracht, bedraagt ​​de acceptatie ongeveer 20% van alle gebruikers. Je bent benieuwd of community's van invloed zijn op retentie, dus maak je twee even grote groepen (cohorten) met willekeurig geselecteerde gebruikers. Eén cohort heeft alleen gebruikers die lid zijn geworden van een community, en de andere heeft alleen gebruikers diedeed nietlid worden van een gemeenschap.

Uw analyse onthult een schokkende bevinding: gebruikers die zich bij ten minste één community hebben aangesloten, hebben een hogere retentie dan degenen die zich niet bij een community hebben aangesloten.

Correlatie versus oorzakelijk verband: begrijp het verschil voor uw product (2)

Amplitude'sGrafiek voor retentie-analyse. Probeer er zelf een te maken met onze gratiszelfbedieningsdemo.

In de bovenstaande grafiek is bijna 95% van degenen die lid zijn geworden van een community (blauw) nog aanwezig in week 2, vergeleken met 55% van degenen die dat niet hebben gedaan (groen). In week 7 zie je 85% retentie voor degenen die lid zijn geworden van een community en 25% retentie voor degenen die dat niet hebben gedaan. Deze resultaten lijken op een enorme staatsgreep.

Maar wacht even. Het logische deel van jou weet dat je niet genoeg informatie hebt om te concluderen of je lid wordt van communitiesoorzakenbetere retentie. Alles wat je weet is dat de twee zijngecorreleerd. In feite kunnen ze allebei worden veroorzaakt door een andere onbekende factor.

Correlatie versus oorzakelijk verband: begrijp het verschil voor uw product (3)

In dit voorbeeld zijn deelname aan communities en hogere retentie dat welgecorreleerdmaar er kan nog een derde factor zijnveroorzakenbeide.

Hoe u kunt testen op oorzakelijk verband in uw product

Causale relaties ontstaan ​​niet per ongeluk.

Het kan verleidelijk zijn om twee variabelen te associëren met 'oorzaak en gevolg'. Maar als u dit doet zonder de causaliteit in een robuuste analyse te bevestigen, kan dit leiden tot een fout-positief, een oorzakelijk verbandlijktbestaan ​​maar niet isEigenlijkdaar. Er kan een fout-positief optreden als u de relatie tussen een afhankelijke en een onafhankelijke variabele niet uitgebreid test.

Valse positieven zijn problematisch voor productinzichten, omdat u ten onrechte denkt dat u het verband begrijpt tussen belangrijke resultaten en gebruikersgedrag. U zou bijvoorbeeld kunnen denken dat u weet welkesleutelactiveringsgebeurtenisresulteert in langdurig gebruikersbehoud, maar zonder rigoureuze tests loopt u het risico cruciale productbeslissingen te nemen op basis van verkeerd gebruikersgedrag.

Voer robuuste experimenten uit om het oorzakelijk verband te bepalen

Als je eenmaal een correlatie hebt gevonden, kun je testen op oorzakelijk verband door experimenten uit te voeren die "controleer de andere variabelen en meet het verschil.”

U kunt deze twee experimenten of analyses gebruiken om oorzakelijk verband binnen uw product te identificeren:

  • Hypothese testen
  • A/B/n-experimenten

1. Hypothese testen

De meest basale hypothesetest omvat eenH0 (nulhypothese)en eenH1 (uw primaire hypothese). U kunt ook een secundaire hypothese, een tertiaire hypothese, enzovoort hebben.

De nulhypothese is het tegenovergestelde van je primaire hypothese. Waarom? Terwijl je dat niet kuntbewijzenuw primaire hypothese met 100% zekerheid (het dichtst dat u kunt krijgen is 99%), kunt uweerleggenje nulhypothese.

De primaire hypothese wijst op het oorzakelijk verband dat u onderzoekt en zou eenoorzaak (onafhankelijke variabele of blootstellingsvariabele)en eeneffect (afhankelijke variabele of uitkomstvariabele).

Het is het beste om eerst uw H1 te maken, vervolgens het tegenovergestelde te specificeren en dat voor uw H0 te gebruiken. Uw H1 zou de relatie moeten identificeren die u verwacht tussen uw onafhankelijke en afhankelijke variabelen.

Als we het vorige voorbeeld gebruiken en kijken naar de impact van in-app sociale functies op retentie, zou uw onafhankelijke variabele "lid worden van een community" zijn en uw afhankelijke variabele zou "retentie" zijn. Uw primaire hypothese zou kunnen zijn:

H1: Als een gebruiker in de eerste maand lid wordt van een community binnen ons product, dan blijft hij langer dan een jaar klant.

Negeer vervolgens je H1 om je nulhypothese te genereren:

H0: Er is geen relatie tussen het lid worden van een community en het behouden van gebruikers.

Het doel is om te observeren of er een werkelijk verschil is tussen uw verschillende hypothesen. Als je de nulhypothese kunt verwerpen metstatistische significantie(idealiter met een betrouwbaarheid van minimaal 95%), bent u dichter bij het begrijpen van de relatie tussen uw onafhankelijke en afhankelijke variabelen.

In het bovenstaande voorbeeld van muziekstreaming, als je de nulhypothese kunt verwerpen door te ontdekken dat lid worden van een gemeenschap resulteerde in een hoger resultaatRetentie percentages(terwijl u zich aanpast voor verstorende variabelen die uw resultaten kunnen beïnvloeden), kunt u waarschijnlijk concluderen dat er een verband bestaat tussen deelname aan een community en gebruikersbehoud.

Om deze hypothese te testen, ontwikkelt u een vergelijking die nauwkeurig de relatie weergeeft tussen uw verwachte oorzaak (onafhankelijke of blootstellingsvariabele) en effect (afhankelijke of uitkomstvariabele). Als u met uw model een waarde voor uw blootstellingsvariabele kunt invoeren en consistent een uitkomst kunt retourneren die de werkelijk waargenomen gegevens weerspiegelt, bent u waarschijnlijk iets op het spoor.

Wanneer hypothesetesten gebruiken

Het testen van hypothesen is nuttig wanneer u probeert vast te stellen of er een verband bestaat tussen twee variabelen, in plaats van te kijken naar anekdotisch bewijs. Misschien wilt u historische gegevens bekijken om eenlongitudinale analysevan veranderingen in de tijd. U kunt bijvoorbeeld onderzoeken of first adopters voorproductlanceringenzijn je grootste promotors. U kunt verwijzingspatronen bekijken en deze relatie ook vergelijken met productlanceringen in de loop van de tijd.

Of misschien voer je eentransversale analysedie een momentopname van gegevens analyseert. Deze analyse is nuttig bij het bekijken van de effecten van een specifieke blootstelling en uitkomst, in plaats van trendveranderingen over een periode. U kunt bijvoorbeeld de relatie onderzoeken tussen vakantiespecifieke promoties en verkopen.

2. A/B/n-experimenten

A/B/n-testen, of split-testen, kan u van correlatie naar oorzakelijk verband brengen. Kijk naar elk van je variabelen, verander er een zodat je verschillende versies hebt (variant AEnvariant B), en kijk wat er gebeurt. Als uw uitkomst consequent verandert (met dezelfde trend), heeft u de variabele gevonden die het verschil maakt.

Correlatie versus oorzakelijk verband: begrijp het verschil voor uw product (4)

Twee varianten voor de lay-out van een website: variant A en variant B

Wanneer u aantoont dat deelname aan een community leidt tot hogere retentiepercentages, moet u alle andere variabelen elimineren die de uitkomst kunnen beïnvloeden. Gebruikers hadden bijvoorbeeld een andere weg kunnen inslaan die uiteindelijk van invloed was op de retentie.

Om te testen of er een oorzakelijk verband is, moet u een directe link vinden tussen gebruikers die lid worden van een community en uw app langdurig gebruiken.

Begin met uw onboardingstroom. Splits de volgende 1.000 gebruikers die zich aanmelden in twee groepen. Dwing de eerste helft om lid te worden van een community als ze zich aanmelden (variant A) en de andere helft niet (variant B). Voer het experiment 30 dagen uit met behulp van een experimenteertool zoalsAmplitude-experiment, vergelijk vervolgens de retentiepercentages tussen de twee groepen.

Stel dat u merkt dat de groep die gedwongen wordt om lid te worden van een gemeenschap een relatief hoger retentiepercentage heeft. In dat geval heeft u het bewijs om een ​​causaal verband tussen deelname aan een gemeenschap en retentie te bevestigen. Deze relatie is waarschijnlijk de moeite waard om in te graven met een tool voor productanalyse zoalsAmplitude-analysebegrijpenWaaromgemeenschappen zorgen voor retentie.

Je kunt pas zeker zijn van een oorzakelijk verband als je dit soort experimenten uitvoert.

Wanneer gebruik je A/B/n-testen?

A/B/n is ideaal bij het vergelijken van de impact van verschillende variaties (variant A en variant B) voor campagnes, productkenmerken, contentstrategieën en meer. Een gesplitste test van de onboardingstroom van uw product kan bijvoorbeeld vergelijken hoe verschillendproductstrategieënpresteren op basis van bepaalde kenmerken, waaronder:

  • Variaties kopiëren
  • Afbeeldingen (stockfoto's vs. aangepaste illustraties)
  • Vermindering van het aantal velden in een aanmeldingsformulier
  • Personalisatie (naam, bedrijf en branchegegevens)

Nadat u meerdere variaties op productonboarding hebt uitgevoerd, kunt u de resultaten bekijken en statistieken vergelijken, zoals uitvalpercentage, conversie en retentie.

Meer informatie over statistieken die u kunt bijhoudenDe Amplitude-gids voor productstatistieken.

Handel op de juiste correlaties voor duurzame productgroei

We zoeken altijd naar verklaringen om ons heen en proberen te interpreteren wat we zien. Tenzij u echter duidelijk een oorzakelijk verband kunt identificeren, moet u ervan uitgaan dat u alleen een verband ziet.

Gebeurtenissen die op basis van gezond verstand met elkaar in verband lijken te staan, kunnen niet als causaal worden beschouwd, tenzij u een duidelijk en direct verband kunt aantonen. En hoewel oorzakelijk verband en correlatie tegelijkertijd kunnen bestaan, betekent correlatie niet oorzakelijk verband.

Hoe bedrevener u wordt in het identificeren van echte correlaties binnen uw product, hoe beter u uw productinvesteringen kunt prioriteren en de retentie kunt verbeteren. Lees onzeMastering Retentie Playbookvoor deskundig advies over tools, strategieën en voorbeelden uit de praktijk om uw product te laten groeien met een sterke retentiestrategie.

Referenties

FAQs

Wat geeft een correlatie aan? ›

Wat is een correlatie? Een correlatie laat zien of er een verband is tussen twee of meerdere variabelen. Een correlatiecoëfficiënt kan de richting van het verband (positief, negatief) laten zien en geeft ook aan hoe sterk het verband is. Een positieve correlatie betekent dat beide variabelen samen toenemen of afnemen.

Wat is het verschil tussen relatie en correlatie? ›

Een correlatie houdt in dat twee variabelen op een ordelijke manier een bepaalde samenhang vertonen. Echter, een correlatie betekent niet hetzelfde als causaliteit (i.e. oorzaak-gevolg relatie). In andere woorden, correlaties vertellen ons niet of er een oorzaak en gevolg relatie tussen twee variabelen bestaat.

Wat is een correlatie analyse? ›

Correlatieanalyse is een bivariate statistische methode om de sterkte van de lineaire relatie tussen twee variabelen te meten en hun relatie te berekenen. Simpel gezegd, correlatieanalyse berekent de hoeveelheid verandering in de ene variabele als gevolg van de verandering in de andere.

Hoe toon je causaal verband aan? ›

Causaal onderzoek effectief inzetten
  1. De oorzaak-en-gevolg-relatie wordt bewezen of ontkracht door het experiment. ...
  2. Geef duidelijk aan welke variabelen als onafhankelijk (ze hebben gevolgen) en welke als afhankelijk (ze zijn het gevolg) worden getest.

Wat is goede correlatie? ›

Correlatie is de (rekenkundige) maat voor samenhang. De maat ligt altijd tussen -1 en +1. Bij -1 of +1 is er een perfecte relatie. Is de waarde 0 dan is er helemaal geen relatie tussen de variabelen.

Hoe beschrijf je een correlatie? ›

Een correlatie laat zien of er een verband is tussen twee of meerdere variabelen. Een correlatiecoëfficiënt kan de richting van het verband (positief, negatief) laten zien en geeft ook aan hoe sterk het verband is. Een positieve correlatie betekent dat beide variabelen samen toenemen of afnemen.

Wat zegt de correlatiecoëfficiënt? ›

Een correlatiecoëfficiënt kan negatief, positief of 0 zijn. De coëfficiënt van negatieve correlatie valt tussen de 0 en de -1 en geeft een negatief verband aan. De coëfficiënt van positieve correlatie valt tussen de 0 en de 1 in en geeft een positief verband aan. Een coëfficiënt van 0 betekent dat er geen samenhang is.

Wat is een ander woord voor correlatie? ›

correlatie (zn) : betrekking, interdependentie, samenhang, verband.

Hoe hoger de correlatie? ›

Als de correlatiecoëfficiënt 0 is bestaat er geen verband, een waarde van -1 of +1 duidt op een perfect (lineair) verband (met een negatieve helling -1 en met een positieve helling +1). Hoe hoger de correlatie, des te beter kan de waarde van de tweede observatie uit de eerste worden voorspeld.

Is correlatie altijd lineair? ›

Correlatiemaat. De mate van correlatie tussen twee variabelen wordt uitgedrukt in de correlatiecoëfficiënt. De waarde daarvan kan variëren tussen –1 en +1. Daarbij betekent 0: geen lineaire samenhang, +1: een perfecte positieve lineaire samenhang en –1: een perfecte negatieve lineaire samenhang.

Kan een correlatie negatief zijn? ›

Vuistregels. Als y groter wordt als x groter wordt, dan spreek je van een positieve correlatie. Als y kleiner wordt als x groter wordt, dan spreek je van een negatieve correlatie. Als y niet per se groter of kleiner wordt als x groter wordt, dan betekent dat geen samenhang tussen x en y en dus geen correlatie.

Waarom Correlatieanalyse? ›

Je gebruikt de correlatie als je wilt weten of twee variabelen met elkaar samenhangen, zonder dat je zegt dat er sprake is van een causaal verband (dat de ene variabele invloed heeft op de andere). Daarnaast gebruik je correlaties ook vaak om je data te beschrijven en te checken op assumpties.

Wat is een oorzakelijk Tekstverband? ›

Een oorzakelijk verband is een zins- of alineaverband dat een oorzaak tussen zinnen of alinea's aanduidt. Signaalwoorden die zo'n verband kunnen aanduiden zijn: daardoor, hierdoor, doordat, zodat, waardoor. Voorbeeld: "Er brak brand uit in het stadion, waardoor de wedstrijd niet kon doorgaan."

Welke signaalwoorden horen bij een oorzakelijk verband? ›

Overzicht structuuraanduiders/signaalwoorden
tekstverbandstructuuraanduider, signaalwoord
oorzakelijkdoordat, waardoor, daardoor
toelichtend (geven van een voorbeeld)zo, zoals, bijvoorbeeld
voorwaardelijkals, indien, tenzij, mits
vergelijkendzoals, evenals, beter dan, net als
8 more rows
Jul 3, 2015

Wat zijn de noodzakelijke voorwaarden om te kunnen spreken van een causaal verband? ›

5.1 De definitie van causaliteit

In de praktijk wordt causaliteit aangenomen als aan de volgende drie voorwaarden wordt voldaan: De oorzaak gaat in de tijd vooraf aan het gevolg. De oorzaak en het gevolg hangen samen. De samenhang tussen de oorzaak en het gevolg kan niet worden verklaard door iets anders.

Wat zegt een Pearson correlatie? ›

De Pearson correlatie is een beschrijvende statistiek, wat betekent dat de correlatie de kenmerken van een dataset samenvat. De Pearson correlatie beschrijft de sterkte en de richting van het lineaire verband tussen twee kwantitatieve variabelen.

Wat is een sterke correlatie? ›

Met behulp van correlatie-toetsen kunnen we bepalen hoe sterk een verband tussen twee kenmerken is. Een correlatie kan een waarde krijgen van -1 tot +1. Wanneer er geen verband bestaat is de correlatie 0 en hoe dichter bij de 1 (of -1) hoe sterker het verband.

References

Top Articles
Latest Posts
Article information

Author: Pres. Lawanda Wiegand

Last Updated: 10/09/2023

Views: 6487

Rating: 4 / 5 (71 voted)

Reviews: 86% of readers found this page helpful

Author information

Name: Pres. Lawanda Wiegand

Birthday: 1993-01-10

Address: Suite 391 6963 Ullrich Shore, Bellefort, WI 01350-7893

Phone: +6806610432415

Job: Dynamic Manufacturing Assistant

Hobby: amateur radio, Taekwondo, Wood carving, Parkour, Skateboarding, Running, Rafting

Introduction: My name is Pres. Lawanda Wiegand, I am a inquisitive, helpful, glamorous, cheerful, open, clever, innocent person who loves writing and wants to share my knowledge and understanding with you.