ARI指标计算
2022-04-01 本文已影响0人
倪桦
image.png
ARI∈[−1,1] 。值越大意味着聚类结果与真实情况越吻合。从广义的角度来将,ARI是衡量两个数据分布的吻合程度的。负值代表两列聚类标签相对独立,正值代表两列聚类标签很相似,1 代表两列聚类标签完全相同;。
image.png
from sklearn import metrics
metrics.adjusted_rand_score(df.pre_type,df.pre_type_2)
image.png
计算两列一致性
df['bool'] = np.where(df['pre_type'] == df['pre_type_2'], 1, 0)
print(df['bool'].sum())
image.png