全站文章列表 | 收藏本站 | RSS订阅 SPSS教程|答疑|案例|训练营
小兵专栏大型数据挖掘案例推荐(第一期)

大型数据挖掘案例推荐(第一期)
时间:2016年01月30日 | 栏目:小兵专栏 | 评论:0 | 点击: 1652


  • 为回馈读者的支持,数据小兵博客特整理收集大型数据挖掘案例,供读者阅读交流。点击链接即可进入相关网页,如有疑问,可以返回本文文末在评论框内留言。


    1、药物选择决策支持

    》》》点击进入网页开始阅读 ★

    该案例来自医药卫生行业,参照CRISP-DM的标准流程进行数据挖掘,采用神经网络、C5.0、Logistic回归等主要模型建模。治疗XX病有A、B、C、X、Y5种药物,不同的药物对病人有不同的疗效。医院往往根据医生的经验去判断针对特定的病人应该选择何种药物。但是由于新医生的加入,这种仅仅靠经验判断的做法造成了很多误诊。为了改变以上局面,也为了更好的利用历史数据和专家经验,该医院决定通过数据挖掘技术对历史数据进行分析研究,确定病人选择何种药物对治疗疾病最为有效,并期望能够建立一套有效的药物选择决策支持系统。

    案例作者:钟云飞老师,代表性出版物有《IBM SPSS数据分析与挖掘实战案例精粹》


    2失联搜救中的统计数据分析

    》》》点击进入网页开始阅读 ★

    大数据时代如何活用数据可视化、大数据与众包、群体智慧、贝叶斯方法等为失联搜救出谋献策?请看下文。

    “MH370”作为航班代码,是近日震惊世界的马来西亚航空公司客机失去联络事件(后简称“马航事件”)留给公众最深刻的数字印象。时至今日,有关马航事件的调查和搜救工作仍在继续。遗憾的是直到截稿时间,MH370航班的残骸仍未找到。

    在历史上的多次飞机船只等交通工具出现失联情况的突发事件中,数据的收集、分析以及信息的及时发布都在搜寻中起到过关键的作用。比如在2009年,法国航空公司曾有一架民航客机失去联络和踪迹。当时,有不少基于数据分析的文献为失事飞机的搜寻提供了援助。前事不忘,后事之师。本文旨在基于统计学领域的相关知识结合大众可以获知的信息来对马航事件进行了解和分析。本文秉持科普视角,试图阐述在应对马航事件过程中数据收集和数据分析所起到的作用,继而为寻找失联飞机提供一些思路。我们将以寻找失事飞机和船只的事件为线索,来梳理其中涉及到的数据分析思路,以试图减少大家的猜疑和困惑。

    案例来源:统计之都创作小组(邓一硕,关菁菁,刘辰昂,邱怡轩,施涛,熊熹,周祺)


    3、社会网络分析:中国统计之网

    》》》点击进入网页开始阅读 ★

    本文使用的数据全部来自互联网公开数据,数据分析工具主要是R软件,其中的关系网络分析与作图主要使用tnet包和igraph包完成。

    作者从中国知网抓取中文统计核心期刊《中国统计》《统计研究》以及《数理统计与管理》十年左右的数据,包括3617篇论文,去重的作者总数4293人,主要研究的是统计学论文合著关系网络。主要内容包括基本统计与网络分析、社群挖掘分析,重点展示了权的定义与合著关系网络的构建、合著社群及其可视化。

    案例作者:范建宁,中国人民大学统计学院,原文发表在统计之都。



    请关注,持续更新。


    同类荐读:数据挖掘  案例 

    本文来自:数据小兵博客

    本文地址:http://datasoldier.net/post/datamining.html

    版权说明:如非注明,本站文章均为 数据小兵博客 原创,转载请注明出处和附带本文链接。

  • 额 本文暂时没人评论 来添加一个吧

    发表评论

    必填

    选填

    选填

    必填

    ◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。