Stap 9: Ontwikkeling van algoritme (deel 2): toepassing van logistische regressie
Zoals ik al heb gezegd, is ML (Machine learning) een soort van patroon erkenning ding. Het scheidt 2 of meerdere groepen afhankelijk van hun kenmerken. Bijvoorbeeld als ik heb heleboel gepaarde getallen {(1,4),(6,3),(5,2)... (X, Y)}, ik wil om ze te scheiden in twee groepen, één met paar met aantal som minder dan 6 en andere groep de rest bevatten. Een eenvoudige lijn met vergelijking X + Y < 6 zullen ons werk doen.
In ons geval X en Y zullen dominante frequentie en gemiddelde absolute piekwaarden. In het script visualiseren, die ik gekoppeld in de vorige stap, naast enkel het visualiseren van gegevens, helpt het in de gegevensverwerking van deze twee parameters ook.
Dominante frequentie wordt berekend met behulp van FFT algoritme. (https://en.wikipedia.org/wiki/Fast_Fourier_transfo...)
Voor het uitvoeren van visualiseren script krijgt u resultaten voor dominante frequentie en de gemiddelde absolute piekwaarden. Deze kopiëren en plakken in een tekstbestand, In de volgende indeling.
Dominant_frequency_1, average_absolute_peak_values_1, 0/1...
0/1 in de plaats na tweede komma de logistische regressie-methode of de kenmerken zijn vertelt van wandelen van gegevens of het uitvoeren van gegevens. 1 om te wandelen en 0 voor hardlopen.
Bekijk het voorbeeldbestand dat ik heb bijgevoegd voor de juiste opmaak.
Welke logistische regressie doet is dat het probeert te scheiden van dit wandelen en lopen van gegevens met behulp van een rechte lijn. U ziet in afbeelding. Hoe weet de Raad dat deze regel deze twee gegevensset scheiden zal?. Hier springt de WISKUNDE. Het is een beetje moeilijk uit te leggen het schriftelijk, maar ik ben verbonden een videozelfstudie over logistische regressie door Andrew Ng, die een expert op dit gebied is.
In de volgende stap zal ik praten over scripts, die u op uw eigen gegevens, gebruiken kunt om het algoritme dat is niets anders dan een rechte lijn die scheidt deze 2 sets van gegevens.