| 1,602 | 49 | 50 |
| 下载次数 | 被引频次 | 阅读次数 |
本文对大家最为熟悉的概念"统计数据"进行了专门的讨论。论文首先基于对数据的理解,讨论了统计数据的内涵特征及其变化过程,认为一切被记录的事实都是数据,一切可用统计方法处理的数据都是统计数据;然后以历史上著名的关于父母酗酒是否影响后代身心健康的皮尔逊论战,来说明在现实统计分析研究中我们所面临的统计数据困惑,认为统计学的构成要素就是问题、数据和方法,方法围着数据转,数据跟着问题走;接着讨论了什么是大数据思维,什么是小数据以及为什么要研究小数据等问题,认为要基于大数据研究小数据、基于小数据挖掘大数据;最后指出充分挖掘数据价值是统计学的发展方向,归纳了大数据分析的基本路径,提出大数据分析要着力克服统计测度、数据孤岛、半随机性、异常值和归纳法与演绎法相结合等一系列复杂的问题。
Abstract:This paper focused on the discussion of the widely-known concept of "Statistical Data". Based on understanding the data,this paper discusses the meaning of Statistical Data and its evolution,and holds that all recorded events as data and all data that can be processed through the statistical method are Statistical Data.Taking the well-known Pearson Debate on alcoholism and offspring as an example to reflect the confusion brought about by Statistical Data in analysis and research using statistical methods,it argues that the main components of statistics is problem,data and method. Whereas method revolves round data,data is oriented by problem. Then,addressing a few questions-what is Big Data Thinking,what is Small Data and why Small Date should be studied-this paper indicates that while Small Data needs to be studied based on Big Data,Big Data needs to be mined through Small Data. Finally,it concludes that the trend in which statistics is developing is such that the value of data needs to be fully mined. Categorizing the fundamental routes of Big Data analysis,this paper proposes the analysis of Big Data should be focus on a series of complicated questions,such as statistical measurement,data silos,semi-random,outlier and the integration of induction and deduction.
[1]M K Jensen,N Wirth.The Concept of Data[M].Berlin:Springer,1975.
[2]B Langefors,K Samuelson.Information and Data in Systems[M].New York:Petrocelli,Charter,1976.
[3]C H Davis,J E Rush.Guide to Information Science[M].Westport:Greenwood Press,1979.
[4]P H Dorn.Business Information in the Eighties[J].Business Information System,INFOTECH State of the Art Report,Series,1981,9(7):245-260.
[5]M C Yovits.Information and Data.Encyclopedia of Computer Science and Engineering[M].New York:Van Nostrand Reinhold,1983.
[6]J G Burch,F R Strater and G Grudnitski.Information Systems:Theory and Practice[M].New York:John Wiley&Sons,1983.
[7]H D Hoskins.Information from Data-computer Assisted Techniques[J].OPHTHALMOLOG.1983(7):33A-38A.
[8]F J Ohlhorst.大数据分析-点“数”成金[M].王伟军等译.北京:人民邮电出版社,2013.
[9]H Whitney.洞悉数据-用可视化方法发掘数据真义[M].刘云涛译.北京:人民邮电出版社,2016.
[10]中国百科大辞典编委会.中国百科大辞典[M].北京:华夏出版社,1990.
[11]温浩宇等.数据的概念及其质量要素[J].情报科学,2001(10):1046-1047.
[12]张凤琴.数据结构[M].北京:清华大学出版社,北京交通大学出版社,2005.
[13]熊岳山.数据结构(C++描述)[M].北京:清华大学出版社,2012.
[14]邹疆.大学计算机基础教程[M].北京:清华大学出版社,2015.
[15]张小艳,李占利.数据结构与算法设计[M].西安:西安电子科技大学出版社,2015.
[16]朝乐门.数据科学[M].北京:清华大学出版社,2016.
[17]张延松等.大数据分析计算机基础[M].北京:中国人民大学出版社,2016.
[18]李军.数据说服力-菜鸟学数据分析[M].北京:人民邮电出版社,2016.
[19]S.M.Stigler.统计探源—统计概念和方法的历史[M].李金昌等译.杭州:浙江工商大学出版社,2014.
[20]李金昌.大数据与统计新思维[J].统计研究,2014(1):10-15.
[21]李金昌.基于大数据思维的统计学若干理论问题[J].统计研究,2016(11):3-10.
[22]Viktor Mayer-Schǒnberger,Kenneth Cukier.大数据时代[M].盛杨燕等译.杭州:浙江人民出版社,2013.
[23]王成文.数据力:“大数据”PK“小数据”[J].中国传媒科技,2013(19):68-70.
[24]徐立军.数据时代的未来大数据与小数据融合的价值与路径[J].新闻与写作,2015(11):11-15.
[25]于久贺.小数据:玩转数据与精准营销[M].北京:人民邮电出版社,2016.
[26]李金昌.统计测度:统计学迈向数据科学的基础[J].统计研究,2015(8):3-9.
基本信息:
DOI:10.19343/j.cnki.11-1302/c.2017.11.001
中图分类号:C81
引用信息:
[1]李金昌.关于统计数据的几点认识[J].统计研究,2017,34(11):3-14.DOI:10.19343/j.cnki.11-1302/c.2017.11.001.
基金信息:
国家社科重大招标项目“基于大数据的跨境电子商务统计监测、评估与监督体系研究”(16ZDA053);; 浙江财经大学省一流建设学科(统计学)的子课题成果之一
2017-11-25
2017-11-25