可以看看相关回答以及百度百科:
https://www.zhihu.com/question/35697551
https://blog.csdn.net/k_zer0/article/details/74360498
简单说,大数据其实是在提醒人们,如今数据量是巨大的,远远超过以往的数据量;
数据挖掘是指从海量数据中发现有价值的信息,也指对应的技术;
机器学习是人工智能中的一项技术,旨在提高机器的学习能力;
数据挖掘与机器学习的基础都是海量数据,数据挖掘与机器学习都会用到经典的算法
可以认为大数据、数据挖掘和机器学习是三个平行的概念。大数据侧重描述数据,数据挖掘侧重描述应用,机器学习侧重描述方法。当然,数据是基础,是挖掘和学习的“燃料”(Ng说深度学习像火箭,计算是引擎,数据是燃料)。
大数据的内涵,是从数据量、数据类型和数据增长速度的角度描述数据。由于这些特点,数据的存储、传输、计算、处理、分析等,都是传统方式难以应对的,相关的技术就要升级,新的技术栈通常基于分布式架构解决,而分布式架构又带来一致性、资源调度、性能优化等多种问题,由此批处理、流计算、图计算、即席查询等方向都有发展。
数据挖掘是指从大量数据中挖掘出有价值的潜藏规律和知识。数据挖掘渴望完整而真实的原始数据,去噪和样本平衡很重要。实施过程涉及机器学习、模式识别、统计学、分布式存储、分布式计算、可视化等,还需要掌握领域专业知识。
机器学习是从数据中获取经验进而改善系统性能的一类重要方法,“学习”的意义就是求解最逼近真相的经验,理论基础主要是统计学。数据挖掘经常需要采用机器学习方法,但目前机器学习主要是想实现某种程度的人工智能。
* 版权声明 :社区问答内容由互联网用户编辑提交,本社区不拥有所有权,也不承担相关法律责任。如果您发现本社区中有涉嫌侵权、暴力、色情、反
动等言论,欢迎发送邮件至: 进行举报并提供初步证明,一经查实,本社区将立刻删除相关内容。