对学习数据挖掘的学生来说,学习哪种统计分析软件更好? r语言、sas、stata、spss 或者其他更好的推荐?


达芬奇密码提问于 2018-07-23 11:52
1 个回答
  • 常用的数据挖掘软件还是有很多的,各有千秋。对学习数据挖掘的学生来说,如何选择确实是道难题,下面就介绍一下几种常用的挖掘软件的特点,供大家参考。

    数据挖掘软件首推R,它的优点在于函数都给你写好了,你只需要知道参数的形式就行了,有时候即使参数形式不对,R也能“智能地”帮你适应。这种简单的软件适合想要专注于业务的人。

    R作为一款用于统计分析和图形化的计算机语言及分析工具,为了保证性能,其核心计算模块是用C、C++和Fortran编写的。同时为了便于使用,它提供了一种脚本语言,即R语言。R支持一系列分析技术,包括统计检验、预测建模、数据可视化等等。

    R软件的首选界面是命令性界面,通过编写脚本来调用分析功能。如果缺乏编程技能,也可使用图形界面,比如使用R Commander。

    其次是Python,Python几乎都可以做(通用性语言),函数比R多,比R快。但是缺点是比R难学一点。它是一门语言,R更像是一种软件,所以python更能开发出flexible的算法。它的语言简单易懂,做分析方便,而且可以开发大型软件。

    其它数据挖掘软件用的并不是很多,但是可以结合知友的回答推荐几款,常用的数据挖掘软件还是有很多的,各有千秋。

    • SAS Data Mining:

    发掘数据集的模式,其描述性和预测性模型为用户更深入的理解数据提供了基础。用户不需要写任何代码,它们提供易于使用的GUI,并提供从数据处理、集群到最终环节的自动化工具,用户可以从中得出最佳结果做出正确决策。

    • WEKA:

    一款非常复杂的数据挖掘工具,也可能是名气最大的开源机器学习和数据挖掘软件。其原生的非Java版本主要是为了分析农业领域数据而开发的。该工具基于Java版本,支持多种标准数据挖掘任务,包括数据预处理、收集、分类、回归分析、可视化和特征选取。高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面。

    同时它还支持几种经典的数据挖掘任务,显著的数据预处理,集群,分类,回归,虚拟化,以及功能选择。其技术基于假设数据是以一种单个文件或关联的,每个数据点都被许多属性标注。 Weka 使用Java的数据库链接能力可以访问SQL数据库,并可以处理一个数据库的查询结果。高级用户可以通过Java编程和命令行来调用其分析组件。同时,Weka也为普通用户提供了图形化界面。和R相比,Weka在统计分析方面较弱,但在机器学习方面要强得多。

    更多详细内容可参考:你经常使用的数据挖掘软件/软件包有哪些?有什么优点?


    在使用数据挖掘软件/软件包的过程中,若能结合大数据分析处理平台,

    并能将经常使用的软件包嵌入其中,分析处理数据必会事倍功半。

    利益相关:网易的猛犸大数据平台是一站式的数据开发平台,支持各种常用的数据挖掘软件/软件包,敏捷的开发模式,简单的拖拽节点即可进行任务开发,支持数据库传输节点、SQL、Cube、MR、Spark、Script等多种节点任务,内嵌的软件包简化了数据开发人员和数据分析人员冗余的工作环境,使他们更加关注业务本身。

    欢迎点击这里免费试用网易猛犸。

    <strike></strike>