Cosinuslikhet används vanligtvis som ett mått för mätning av avstånd när storleken på vektorerna inte spelar någon roll. Detta händer till exempel när man arbetar med textdata som representeras av ordantal.
När ska jag använda cosinuslikhet?
Cosinuslikhet mäter likheten mellan två vektorer i ett inre produktutrymme. Den mäts med cosinus för vinkeln mellan två vektorer och avgör om två vektorer pekar i ungefär samma riktning. Det används ofta för att mäta dokumentlikhet i textanalys.
Varför använda cosinuslikhet istället för euklidiskt avstånd?
Cosinuslikheten är fördelaktig eftersom även om de två liknande dokumenten är långt ifrån varandra på det euklidiska avståndet på grund av storleken (som ordet "syrsa" förekom 50 gånger i ett dokument och 10 gånger i ett annat) kan de har fortfarande en mindre vinkel mellan dem. Mindre vinkel, högre likhet.
Vad är skillnaden mellan cosinuslikhet och euklidiskt avstånd?
I den här artikeln har vi studerat de formella definitionerna av euklidiskt avstånd och cosinuslikhet. Det euklidiska avståndet motsvarar L2-normen för en skillnad mellan vektorer. Cosinuslikheten är proportionell mot prickprodukten av två vektorer och omvänt proportionell mot produkten av deras storlek.
Vad är skillnaden mellan cosinuslikhet och cosinusavstånd?
Vanligtvis använder människor cosinuslikheten som ett likhetsmått mellan vektorer. Nu kan avståndet definieras som 1-cos_similarity. Intuitionen bakom detta är att om 2 vektorer är helt lika är likheten 1 (vinkel=0) och därför är avståndet 0 (1-1=0).