博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
人工智能教程:PCA降维 维度 样本数 feature数
阅读量:2381 次
发布时间:2019-05-10

本文共 612 字,大约阅读时间需要 2 分钟。

这期给大家讲人工智能,上次有伙伴要教程,这两天给大家总结好了视频教程!

问题:PCA降维后的feature数如果少于样本数,为什么会报错把n_components一旦改为超过230后,会有截图中的错误,即:

ValueError: n_components=250 must be between 0 and min(n_samples, n_features)=230 with svd_solver='full'

 

Answer:

PCA降维实现的依旧是对features的减少,而不是样本数,这个你要记住。因此降维之后的样本数量是不变的,feature数量会变少。

为什么pca降维后feature数量多余样本数量会报错?这是算法本身决定的,要求降维后的feature数量少于样本数:

思考pca降维的原理,如果要降到n维,那就需要构建一个n维德投影空间,而这个投影空间是要通过n+1个样本数量决定的,如果样本数量太少,那就无法得到一个有效的投影空间。举个最简单的例子:

把数据点投影到一条直线上,理解为投影到一维空间,那就需要有两个或两个以上的点,这样才能确定一条直线,使样本到直线德距离之和最小,如果只有一个点,那是有无数条直线的。因此需要样本数量大于一。

人工智能教程:PCA降维 维度 样本数 feature数

 

不清楚的地方,伙伴们可以留言,想学习人工智能,可以关注一下更新,更多的教程也会继续更新,伙伴们也可以跟着全套视频教程学,要视频教程的,可以评论回复:人工智能!

转载地址:http://wdkab.baihongyu.com/

你可能感兴趣的文章
SpringCloud Config 配置管理
查看>>
CNNs在图像压缩领域的运用——An End-to-End Compression Framework Based on Convolutional Neural Networks
查看>>
Win7下的一些EXE文件图标莫名奇妙丢失
查看>>
[ZZ]变速齿轮作者的文章--绝杀反外挂方案
查看>>
了解内核的装入地址和入口地址,vmlinux.bin与vmlinux
查看>>
内核里面对大小写字符的转换
查看>>
eclipse的奇怪的更新方式
查看>>
MIPS技术公司官方对linux的支持信息
查看>>
openflow简介
查看>>
windows7配置虚拟AP的脚本
查看>>
CompilationUnit
查看>>
日本用大数据技术预测流感 预测与分析结果精确
查看>>
我们为什么需要大数据技术?
查看>>
大数据使超级计算机迎来第二春
查看>>
多地政府探索“大数据”惠民之道 信息垄断须打破
查看>>
民营经济的支撑不可或缺
查看>>
共赢安全大数据 SIEM助企业准确识别威胁
查看>>
社会化媒体营销发展报告发布 大数据受重视
查看>>
大数据促使云计算行业向规模化发展
查看>>
融合广播或成电台发展新方向 进军大数据
查看>>