管理统计学第一次做业

1、软件简介html

1 .SPSSlinux

SPSS简介:SPSS全称Statistical Product and Service Solutions,是一款"统计产品与服务解决方案"软件。最初软件全称为"社会科学统计软件包"(SolutionsStatistical Package for the Social Sciences),可是随着SPSS产品服务领域的扩大和服务深度的增长,SPSS公司已于2000年正式将英文全称更改成"统计产品与服务解决方案",标志着SPSS的战略方向正在作出重大调整。为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称SPSS,有Windows和Mac OS X等版本。android

SPSS发展历史:

1968年:斯坦福大学三位学生建立了SPSS正则表达式

1968年:诞生第一个用于大型机的统计软件算法

1975年:在芝加哥成立SPSS总部数据库

1984年:推出用于我的电脑的SPSS/PC+编程

1992年:推出Windows版本,同时全球自SPSS 11.0起,SPSS全称为"Statistical Product and Service Solutions",即"统计产品和服务解决方案"数组

2009年:SPSS公司宣布从新包装旗下的SPSS产品线,定位为预测统计分析软件(Predictive Analytics Software)PASW,包括四部分:浏览器

PASW Statistics (formerly SPSS Statistics):统计分析网络

PASW Modeler (formerly Clementine) :数据挖掘

Data Collection family (formerly Dimensions):数据收集

PASW Collaboration and Deployment Services (formerly Predictive Enterprise Services):企业应用服务

2010年:随着SPSS公司被IBM公司并购,各子产品家族名称前面再也不以PASW为名,修改成统一加上IBM SPSS字样

SPSS页面一览:

 

2.R语言

R语言简介:R是用于统计分析、绘图的语言和操做环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

R语言发展历史:R是统计领域普遍使用的诞生于1980年左右的S语言的一个分支。能够认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和做图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman和Ross Ihaka及其余志愿人员开发了一个R系统。由"R开发核心团队"负责开发。 R是基于S语言的一个GNU项目,因此也能够看成S语言的一种实现,一般用S语言编写的代码均可以不做修改的在R环境下运行。 R的语法是来自Scheme。R的使用与S-PLUS有不少相似之处,这两种语言有必定的兼容性。S-PLUS的使用手册,只要稍加修改就可做为R的使用手册。因此有人说:R,是S-PLUS的一个"克隆"。

R语言功能:

R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤为强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。贝尔实验室贝尔实验室

与其说R是一种统计软件,还不如说R是一种数学计算的环境,由于R并非仅仅提供若干统计程序、使用者只需指定数据库和若干参数即可进行一个统计分析。R的思想是:它能够提供一些集成的统计工具,但更大量的是它提供各类数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合须要的新的统计计算方法。

该语言的语法表面上相似 C,但在语义上是函数设计语言(functional programming language)的变种而且和Lisp以及APL有很强的兼容性。特别的是,它容许在"语言上计算"(computing on the language)。这使得它能够把表达式做为函数的输入参数,而这种作法对统计模拟和绘图很是有用。

R是一个免费的自由软件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是能够免费下载和使用的。在那儿能够下载到R的安装程序、各类外挂程序和文档。在R的安装程序中只包含了8个基础模块,其余外在模块能够经过CRAN得到。

R的原代码可自由下载使用,亦有已编译的执行档版本能够下载,可在多种平台下运行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。 R主要是以命令行操做,同时有人开发了几种图形用户界面。

R内含多种统计学及数字分析功能。由于S的血缘,R比其余统计学或数学专用的编程语言有更强的物件导向(面向对象程序设计)功能。

R的另外一强项是绘图功能,制图具备印刷的素质,也可加入数学符号。

虽然R主要用于统计分析或者开发统计相关的软体,但也有人用做矩阵计算。其分析速度可媲美GNU Octave甚至商业软件MATLAB。

R的功能可以经过由用户撰写的套件加强。增长的功能有特殊的统计技术、绘图功能,以及编程界面和数据输出/输入功能。这些软件包是由R语言、LaTeX、Java及最经常使用C语言和Fortran撰写。下载的执行档版本会连同一批核心功能的软件包,而根据CRAN纪录有过千种不一样的软件包。其中有几款较为经常使用,例如用于经济计量、财经分析、人文科学研究以及人工智能。

3.STATA

STATA简介:新版本的STATA采用最具亲和力的窗口接口,使用者自行创建程序时,软件能提供具备直接命令式的语法。Stata提供完整的使用手册,包含统计样本创建、解释、模型与语法、文献等超过一万余页的出版品。

除此以外,Stata软件能够透过网络实时更新天天的最新功能,更能够得知世界各地的使用者对于STATA公司提出的问题与解决之道。使用者也能够透过Stat软件logo软件logoa Journal得到许许多多的相关讯息以及书籍介绍等。另一个获取庞大资源的管道就是Statalist,它是一个独立的listserver,每个月交替提供使用者超过1000个讯息以及50个程序。

STATAS功能:1.STATA统计功能很强,除了传统的统计分析方法外,还收集了近20年发展起来的新方法,如Cox比例风险回归,指数与Weibull回归,多类结果与有序结果的logistic回归,Poisson回归,负二项回归及广义负二项回归,随机效应模型等。具体说, Stata具备以下统计分析能力:

数值变量资料的通常分析:参数估计,t检验,单因素和多因素的方差分析,协方差分析,交互效应模型,平衡和非平衡设计,嵌套设计,随机效应,多个均数的两两比较,缺项数据的处理,方差齐性检验,正态性检验,变量变换等。

分类资料的通常分析:参数估计,列联表分析 ( 列联系数,确切几率 ) ,流行病学表格分析等。

等级资料的通常分析:秩变换,秩和检验,秩相关等

相关与回归分析:简单相关,偏相关,典型相关,以及多达数十种的回归分析方法,如多元线性回归,逐步回归,加权回归,稳键回归,二阶段回归,百分位数 ( 中位数 ) 回归,残差分析、强影响点分析,曲线拟合,随机效应的线性回归模型等。

其余方法:质量控制,整群抽样的设计效率,诊断试验评价, kappa等。

                    2.Stata的做图功能,主要提供以下八种基本图形的制做 : 直方图(histogram),条形图(bar),百分条图 (oneway),百分圆图(pie),散点图(two way),散点图矩阵(matrix),星形图(star),分位数图。这些图形的巧妙应用,能够知足绝大多数用户的统计做图要求。在有些非绘图命令中,也提供了专门绘制某种图形的功能,如在生存分析中,提供了绘制生存曲线图,回归分析中提供了残差图等。

                    3.Stata的矩阵运算功能。矩阵代数是多元统计分析的重要工具, Stata提供了多元统计分析中所需的矩阵基本运算,如矩阵的加、积、逆、 Cholesky分解、 Kronecker内积等;还提供了一些高级运算,如特征根、特征向量、奇异值分解等;在执行完某些统计分析命令后,还提供了一些系统矩阵,如估计系数向量、估计系数的协方差矩阵等。

4.PYTHON

Python简介:是一种面向对象、解释型计算机程序设计语言,由Guido van Rossum于1989年末发明,第一个公开发行版发行于1991年,Python 源代码一样遵循 GPL(GNU General Public License)协议。Python语法简洁而清晰,具备丰富和强大的类库。它常被昵称为胶水语言,可以把用其余语言制做的各类模块(尤为是C/C++)很轻松地联结在一块儿。常见的一种应用情形是,使用Python快速生成程序的原型(有时甚至是程序的最终界面),而后对其中有特别要求的部分,用更合适的语言改写,好比3D游戏中的图形渲染模块,性能要求特别高,就能够用C/C++重写,然后封装为Python能够调用的扩展类库。须要注意的是在您使用扩展类库时可能须要考虑平台问题,某些可能不提供跨平台的实现。

Phtyon特色:1简单:Python是一种表明简单主义思想的语言。阅读一个良好的Python程序就感受像是在读英语同样。它使你可以专一于解决问题而不是去搞明白语言自己。

易学:Python极其容易上手,由于Python有极其简单的语法。

                       2免费、开源:Python是FLOSS(自由/开放源码软件)之一。使用者能够自由地发布这个软件的拷贝、阅读它的源代码、对它作改动、把它的一部分用于新的自由软件中。FLOSS是基于一个团体分享知识的概念。

                       3高层语言:用Python语言编写程序的时候无需考虑诸如如何管理你的程序使用的内存一类的底层细节。

                       4可移植性:因为它的开源本质,Python已经被移植在许多平台上(通过改动使它可以工做在不一样平台上)。这些平台包括Linux、Windows、FreeBSD、Macintosh、Solaris、OS/二、Amiga、AROS、AS/400、BeOS、OS/390、z/OS、Palm OS、QNX、VMS、Psion、Acom RISC OS、VxWorks、PlayStation、Sharp Zaurus、Windows CE、PocketPC、Symbian以及Google基于linux开发的android平台。

                       5解释性:一个用编译性语言好比C或C++写的程序能够从源文件(即C或C++语言)转换到一个你的计算机使用的语言(二进制代码,即0和1)。这个过程经过编译器和不一样的标记、选项完成。

运行程序的时候,链接/转载器软件把你的程序从硬盘复制到内存中而且运行。而Python语言写的程序不须要编译成二进制代码。你能够直接从源代码运行 程序。

在计算机内部,Python解释器把源代码转换成称为字节码的中间形式,而后再把它翻译成计算机使用的机器语言并运行。这使得使用Python更加简单。也使得Python程序更加易于移植。

                    6面向对象:Python既支持面向过程的编程也支持面向对象的编程。在“面向过程”的语言中,程序是由过程或仅仅是可重用代码的函数构建起来的。在“面向对象”的语言中,程序是由数据和功能组合而成的对象构建起来的。

                    7可扩展性:若是须要一段关键代码运行得更快或者但愿某些算法不公开,能够部分程序用C或C++编写,而后在Python程序中使用它们。

                     8可嵌入性:能够把Python嵌入C/C++程序,从而向程序用户提供脚本功能。

                    9丰富的库:Python标准库确实很庞大。它能够帮助处理各类工做,包括正则表达式、文档生成、单元测试线程、数据库、网页浏览器、CGI、FTP、电子邮件、XML、XML-RPC、HTML、WAV文件、密码系统、GUI(图形用户界面)、Tk和其余与系统有关的操做。这被称做Python的“功能齐全”理念。除了标准库之外,还有许多其余高质量的库,如wxPython、Twisted和Python图像库等等。

                      10规范的代码:Python采用强制缩进的方式使得代码具备较好可读性。而Python语言写的程序不须要编译成二进制代码。

 

2、操做演示

1打开文件

2排序

3新增变量

4合并文件

5使用函数

相关文章
相关标签/搜索