机器学习笔试选择题:题组1
题目
1.(多选)关于K-means聚类算法说法正确的是
A. 是一种无监督学习方法
B. 对大数据集有较高的效率并且具有可伸缩性
C. 初始聚类中心的选择对聚类结果影响不大
D. K值无法白动获取,初始聚类中心随机选择
解答
1.【答案】ABD
【解析】
选项A:是一种无监督学习方法
K-means聚类算法不需要标签数据,用于将数据分成聚类,因此属于无监督学习。该选项正确。
选项B:对大数据集有较高的效率并且具有可伸缩性
K-means的时间复杂度为O(nki),其中n是样本数,k是聚类数,i是迭代次数。它对大规模数据集处理效率较高,且易于扩展。该选项正确。
选项C:初始聚类中心的选择对聚类结果影响不大
K-means对初始聚类中心的选择非常敏感,不同的初始中心可能导致不同的聚类结果。因此,该选项错误。
选项D:k值无法自动获取,初始聚类中心随机选择
K-means需要用户预先指定聚类数k,算法本身无法自动确定k值。初始聚类中心通常随机选择(尽管有改进方法如K-means++,但标准K-means使用随机选择)。该选项正确。
因此,正确选项是A、B、D。