数据分析工具类软件,好用的有哪些?

AI大数据社区2018-12-05 15:46:04

SPSS、SAS都是用于统计分析,围绕统计学知识的一些基本应用,包括描述统计,方差分析,因子分析,主成分分析,基本的回归,分布的检验等等。SPSS用于市场研究较多,SAS银行金融和医学统计较多,有一些难度。

R语言像是综合性较强的一类数据分析工具,集统计分析、数据挖掘,数据可视化。

这些数据分析工具的使用还是看需求,每个企业应用的选择和方式都不同。数据分析的概念很广,站在IT的角度,实际应用中可以把数据分析工具分成两个维度:

第一维度:数据存储层——数据报表层——数据分析层——数据展现层

第二维度:用户级——部门级——企业级——BI级

1、数据存储层

数据存储设计到数据库的概念和数据库语言,这方面不一定要深钻研,但至少要理解数据的存储方式,数据的基本结构和数据类型。SQL查询语言必不可少,精通最好。可从常用的selece查询,update修改,delete删除,insert插入的基本结构和读取入手。

Access2003、Access07等,这是最基本的个人数据库,经常用于个人或部分基本的数据存储;MySQL数据库,这个对于部门级或者互联网的数据库应用是必要的,这个时候关键掌握数据库的库结构和SQL语言的数据查询能力;

SQL Server2005或更高版本,对中小企业,一些大型企业也可以采用SQL Server数据库,其实这个时候本身除了数据存储,也包括了数据报表和数据分析了,甚至数据挖掘工具都在其中了;

DB2,Oracle数据库都是大型数据库,主要是企业级,特别是大型企业或者对数据海量存储需求的就是必须的了,一般大型数据库公司都提供非常好的数据整合应用平台;

BI级别,实际上这个不是数据库,而是建立在前面数据库基础上的,企业级应用的数据仓库。Data Warehouse,建立在DW机上的数据存储基本上都是商业智能平台,整合了各种数据分析,报表、分析和展现,BI级别的数据仓库结合BI产品也是近几年的大趋势。

2、报表/BI层

企业存储了数据需要读取,需要展现,报表工具是最普遍应用的工具,尤其是在国内。过去传统报表大多解决的是展现问题,如今像帆软报表FineReport也会和其他应用交叉,做数据分析报表,通过接口开放功能、填报、决策报表功能,能够做到打通数据的进出,涵盖了早期商业智能的功能。

Tableau、Qlikview、FineBI这类BI工具,可分在报表层也可分为数据展现层,涵盖了数据整合、数据分析和数据展现。FineBI和Tableau同属于近年来非常棒的软件,可作为可视化数据分析软件,可常用FineBI从数据库中取数进行报表和可视化分析。相对而言,可视化Tableau更优,但FineBI又有另一种身份——商业智能,所以在大数据处理方面的能力更胜一筹。

3、数据分析层

这个层其实有很多分析工具,当然我们最常用的就是Excel。

Excel软件,首先版本越高越好用这是肯定的;当然对excel来讲很多人只是掌握了5%Excel功能,Excel功能非常强大,甚至可以完成所有的统计分析工作!但是我也常说,有能力把Excel玩成统计工具不如专门学会统计软件;

SPSS软件:当前版本是18,名字也改成了PASW Statistics;我从3.0开始Dos环境下编程分析,到现在版本的变迁也可以看出SPSS社会科学统计软件包的变化,从重视医学、化学等开始越来越重视商业分析,现在已经成为了预测分析软件;

SAS软件:SAS相对SPSS其实功能更强大,SAS是平台化的,EM挖掘模块平台整合,相对来讲,SAS比较难学些,但如果掌握了SAS会更有价值,比如离散选择模型,抽样问题,正交实验设计等还是SAS比较好用,另外,SAS的学习材料比较多,也公开,会有收获的!

JMP分析:SAS的一个分析分支

XLstat:Excel的插件,可以完成大部分SPSS统计分析功能

4、表现层

表现层也叫数据可视化,以上每种工具都几乎提供了一点展现功能。FineBI和Tableau的可视化功能上文有提过。其实,近年来Excel的可视化越来越棒,配上一些插件,使用感更佳。

PPT:办公常用,用来写数据分析报告;

Xmind&百度脑图:梳理流程,帮助思考分析,展现数据分析的层次;

Xcelsius软件:Dashboard制作和数据可视化报表工具,可以直接读取数据库,在Excel里建模,互联网展现,最大特色还是可以在PPT中实现动态报表。

大数据分析,不管是会excel,还是会sql,多多少少要有点基础的。大数据分析的工具很多,以下就列举了不同技术背景的人士,在大数据分析工具方面的进修技术路径:

一、Excel起步

作为一个入门级工具,Excel是快速分析数据的理想工具,也能创建供内部使用的数据图。如果在众多数据分析工具中您只了解最基本的Excel,以下是最好的进阶路线

二、SQL起步

如果你了解SQL,说明你已经具备了更快提升的基础,建议如下进阶路线:

三、R语言起步

作为用来分析大数据集的统计组件包,R是一个非常复杂的工具,掌握R意味着你比其他IT专业人士可以更快上手一些专业分析工具和服务。

四、Python起步

五、MySQL起步

六、微软SQL Server起步

七、Tableau/FineBI起步

作为大数据前端分析工具,Tableau和FineBI都很容易上手

九、PostgreSQL起步

十、Visual Basic起步


Copyright © 古田计算器虚拟社区@2017