Mathematica数据处理(3)

今天,咱们来说一下在数据处理中,比较经常使用的两个函数,还有一个功能很强大的函数dom


Rescale函数

好了,第一个函数是Rescale,他可使数据归一化spa

工做原理: x - min/max - min.net

简单一点说就是能够把数字变到0--1之间code

咱们来看一个例子:orm

Rescale[{1, 2, 3, 4}, {0, 10}]

获得
{1/10, 1/5, 3/10, 2/5}



Tally
第二个函数是来统计一个数字的重复次数的
例如
Tally[{1, 1, 2, 2, 3, 3, 3, 4, 5, 5, 5}]
返回
{{1, 2}, {2, 2}, {3, 3}, {4, 1}, {5, 3}}

这是一个很是有用的函数

咱们再来看一个例子
x = NormalDistribution[1, 4];
data = Table[IntegerPart[Random[x]], 1000];
datause = Sort@Tally[data]
BarChart[Labeled[#2, #1, Above] & @@@ datause, BarSpacing -> None]
第一句话是 产生一个服从正态分布的数
第二句话是 产生1000个随机数,服从上述正态分布
第三句话是 统计出现的频数并排序
第四句话是 将获得的数据画成条形图

获得以下的图




下面就来看一下我以为很是强大的函数 Import
相信你们都已经用过了,这个函数不只能够导入文件,也是能够解析网页的


Import["http://blog.csdn.net/WMN7Q/article/category/6357421","Elements"]
这句话能够返回网页中有的元素
<span style="font-size:18px;">{"Data", "FullData", "Hyperlinks", "ImageLinks", "Images","Plaintext", "Source", "Title", "XMLObject"}
这是返回的值

那咱们来看一下这个网页中的图片有哪些呢

Import["http://blog.csdn.net/WMN7Q/article/category/6357421","Images"]

因而获得返回值


要是用这个写爬虫,会不会方便不少呢


今天就讲这三个函数。

这篇文徵原本是昨天写的,昨天在作了些其余的,就今天补上,应该一会还会再发一篇的。


2016/8/10

以上,全部。
相关文章
相关标签/搜索