数据科学家要做的事情-对机器学习本质的思考

数据科学 数据科学 扯白了说就是拿到数据后,如何最有效利用这些数据去解决一个问题,使用数据来解决一个实际问题的学问就称之为数据科学。 数据科学主要牵扯到这几个方面:        (1)数据获取:主要利用爬虫和数据库技术找到和存储数据。        (2)数据处理:识别出脏数据、填充空缺数据、将数据形式进行转化成模型能接受的输入。        (3)特征工程:根据原始数据【原始数据每一项称为一
相关文章
相关标签/搜索