对于机器学习的理解,我相信不少人还没法作到简单、易懂的将其思想描述出来,好比这里提到的一个基本概念:数据的维度,以及算法应用中为什么升维和降维。web
对于初学者来讲,这些都是难以理解的,在前期可能只能套用固有的模型和算法进行机械化的“炼丹”,这时就会致使即便得出不错的结果,但仍不知其因此然。算法
维度的诅咒shell
全都与孤独有关微信
In a nutshell, the curse of dimensionality is all about loneliness.机器学习
咱们能够经过下面这个小案例来理解下若将范式类的内容进行具象化、可视化并阐述,会对理解算法提供多大的帮助。
学习
维度越多,数据越稀疏人工智能
一维空间spa
想象一下,你坐在一个大教室里,周围被好友们包围着。.net
二维空间设计
为了给你更加温馨的空间,咱们添加一个维度,在这个空间中,你和你的朋友更加分散。
三维空间
咱们继续增长维度,忽然之间,您再也不被朋友所包围,你感到有点寂寞。
四维空间
当咱们添加了时间的维度,你与朋友可贵碰到一次,因而,你在社交上与外界保持了足够的距离。
若是你有足够多的数据,增长维度便有利于区分开数据。
但反过来思考下,维度的不断增多,对数据量的要求也会迅速增加,进而让咱们不得不去寻找其余办法来辅助解决问题。




本文分享自微信公众号 - 无界社区mixlab(mix-lab)。
若有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一块儿分享。