机器学习实践之男女声分类
2022-01-19 本文已影响0人
刘小白DOER
今天测试一个很经典的案例,算是对最近的几个算法的复习。下面就是使用SVC、KNeighborsClassifier、DecisionTreeClassifier、RandomForestClassifier、GradientBoostingClassifier、GridSearchCV来进行测试,并获得score分值。
可以参考这里,里面有数据和代码。Gender Recognition by Voice | Kaggle
1、数据探索
voice的csv文件是3168*21,最后一列是标签男女,且所有数据没有空值。
![](https://img.haomeiwen.com/i24447700/b07ed57d84ca0588.png)
2、数据转换
将末尾的标签转为数值1、0,1代表male,0代表female。
![](https://img.haomeiwen.com/i24447700/03a6e1d7030c437a.png)
3、数据处理
将特征转为标准正态分布,使用train_test_split对数据进行训练测试分离。
![](https://img.haomeiwen.com/i24447700/015b2337011c33c5.png)
4、逻辑回归分类LogisticRegression()
![](https://img.haomeiwen.com/i24447700/79bd95ef68b432e4.png)
5、SVC分类SVC()
![](https://img.haomeiwen.com/i24447700/50af0597904e1e57.png)
6、KNN分类KNeighborsClassifier()
![](https://img.haomeiwen.com/i24447700/d22cf389f1c8a561.png)
7、决策树分类DecisionTreeClassifier()
![](https://img.haomeiwen.com/i24447700/53d6e8285872b37c.png)
8、随机森林分类RandomForestClassifier()
![](https://img.haomeiwen.com/i24447700/505c5042c44a94da.png)
9、GradientBoosting分类GradientBoostingClassifier()
![](https://img.haomeiwen.com/i24447700/1f954d44eeedf8a4.png)
10、GridSearchCV分类GridSearchCV()
![](https://img.haomeiwen.com/i24447700/36d14d66075d5095.png)
分数统计如下。
![](https://img.haomeiwen.com/i24447700/5c4fb88706cfe3f7.png)