Clustering-baseret k-nærmeste nabo klassificering for store data med neurale koder repræsentation

Mens stående som en af de mest almindeligt anset og vellykket superviseret klassifikation af algoritmer, k-nærmeste Nabo (kNN) klassificeringen generelt viser en dårlig effektivitet på grund af at være et eksempel-baseret metode., I denne forstand, tilnærmede lighed søgning (ASS) står som et muligt alternativ til at forbedre disse effektivitetsproblemer på bekostning af typisk sænke ydeevnen af klassifikatoren. I dette papir tager vi som første punkt en RØVSTRATEGI baseret på klyngedannelse. Vi forbedrer derefter dens ydeevne ved at løse problemer, der er relateret til forekomster placeret tæt på klyngegrænserne ved at udvide deres størrelse og overveje brugen af dybe neurale netværk til at lære en passende repræsentation til den aktuelle klassificeringsopgave., Resultater ved hjælp af en samling af otte forskellige datasæt viser, at den kombinerede brug af disse to strategier indebærer en betydelig forbedring i nøjagtigheden performance, med en betydelig reduktion i antallet af afstande, der er nødvendige for at klassificere en prøve i forhold til de grundlæggende kNN regel.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *