Hierarkisk klustring är den mest populära och mest använda metoden för att analysera sociala nätverksdata. I denna metod jämförs noder med varandra baserat på deras likhet. Större grupper skapas genom att sammanfoga grupper av noder baserat på deras likhet.
När ska man använda hierarkisk klustring mot K-medel?
En hierarkisk klustring är en uppsättning kapslade kluster som är arrangerade som ett träd. K betyder att klustring har visat sig fungera bra när strukturen av klustren är hypersfärisk (som cirkel i 2D, sfär i 3D). Hierarkisk klustring fungerar inte lika bra som, k betyder när formen på klustren är hypersfärisk.
När ska jag använda hierarkisk klustring?
Hierarkisk klustring är en kraftfull teknik som låter dig bygga trädstrukturer från datalikheter. Du kan nu se hur olika underkluster relaterar till varandra och hur långt ifrån datapunkterna är från varandra.
När skulle du inte använda hierarkisk klustring?
Svagheterna är att det sällan ger den bästa lösningen, det involverar massor av godtyckliga beslut, det fungerar inte med saknad data, det fungerar dåligt med blandade datatyper, det fungerar inte bra på mycket stora datamängder, och dess huvudutgång, dendrogrammet, tolkas ofta fel.
Vilka är fördelarna med hierarkisk klustring?
Hierarkiska klusterfördelar
- Det är detatt förstå och implementera.
- Vi behöver inte i förväg specificera något särskilt antal kluster. …
- De kan motsvara meningsfull klassificering.
- Lätt att bestämma antalet kluster genom att bara titta på dendrogrammet.