张锐 中共中央党校研究生院 北京 100741
近年来,大数据技术成为科技前沿和社会热点,“大数据”迹象遍布社会各个领域,掀起一股大数据的研究热潮。数据是近代科学兴起后的重要概念,它进入哲学视野却是近些年的事情,因此当大数据时代的来临,数据在产生、处理、表征及应用上形成了不同以往的逻辑,这就不得不让人们重新审视大数据的本质内涵,探究深层的数据规律,把握和构建其社会治理的创新逻辑。
一、大数据的发展和作用
(一)大数据的兴起与认知
随着传感器、互联网、物联网技术等的相继出现,数据的作用显得越来越重要。而当数据的存储量达到一定规模时,甚至是当时人类科技所不能处理的数据量时,这样的数据处理技术就被称为“大数据技术”。经过后来的技术演进,“大数据”逐渐从单一的数据量级表达,变迁成为代表技术方法、思维方法、价值理念的综合性概念,并为人类社会带来众多新奇。上个世纪八十年代,著名未来学家阿尔文·托夫勒在其著作《第三次浪潮》一书中评价大数据为“第三次浪潮的华丽乐章”。关于大数据的特征,尽管说法纷纭,但是不外乎体现了数量(Volume)、速度(Velocity)、价值(Value)和种类(Variety)等特征。当然,业界也有学者将大数据的特征扩展,增加了可视化(Visualization)和有效性(Validity)。
(二)大数据的重要作用
大数据之所以能引发社会的重点关注,主要因为大数据对于人类社会发展的重要作用。首先,大数据为人个性化的发展创造条件。通过获取人们行为的大数据,经算法建模分析后,会得出人的喜好和行为习惯,当企业掌握这些规律,就可以为用户提供更加个性化和贴心的服务。其次,大数据为科学进步提供重要工具。运用数据分析的方法是近代科学的重要特征,而传统科学拘泥于实验室,分析处理的数据是小数据,验证的结果具有一定的局限性,而当科学家掌握了大数据的方法,科学的范式将迎来变革。关系型数据库鼻祖吉姆·格雷(Jim Gray)在 “科学方法的革命”的演讲中,提出了科学研究的四类范式分类方法——模型推演、实验归纳、仿真模拟和数据密集型科学发现,其中数据密集型科学发现正是我们现在所称之的“科学大数据”。最后,大数据降低了沟通成本。大数据有与生俱来的沟通作用,当硬件设施成本不断廉价化,围绕数据为核心的数字通信,让部门之间的联系得到加强,提高了整个管理链条和产业链条的效率。而技术是一把“双刃剑”,无数的历史证明,技术在满足人们需要的同时,很有可能在另一方向人类索取“回报”。核技术的滥用、战争的威胁、环境的污染,都是技术两面性的具体体现。当然大数据技术也未能例外,近年来爆发的网络诈骗、隐私泄露,都是大数据应用过程中给人类社会带来的困境。这说明,大数据技术作为一种技术工具,其作用取决于人类把握的逻辑。因此,必须从人文社会科学出发,加强对大数据技术的研究,更好地实现利用大数据服务人类社会发展目标。
二、数据、大数据及其本质
数据在人类社会发展过程中处于重要的角色。有人说,人类科技的进步史也是处理数据的进步史。信息技术,特别是现代信息技术出现计算机技术出现以来,为数据处理提供了自动化的方法手段,也就推进数据或者信息成为继物质能源之后的第三大战略资源。信息技术的广泛应用深刻地影响和改变了人类社会,而且这种作用正在加剧,无处不在的信息技术应用正在对人类社会结构进行重构。近代实验科学兴起以来,数据的产生主要为人为所设计和采集,比如牛顿在实验中通过设计得到的观察结果,化学家在实验中得到的观测数据。而到了计算机时代,特别是在互联网出现以后,数据的产生不再仅仅是人类行为的产生。计算机、互联网及各类传感器以及云计算技术、分布式计算与高容量存储技术的广泛应用,使得数据在每个环节可以被产出,数据的概念也逐渐被大数据的概念所替代。数据量也达到了前所未有的高度。有研究表明,过去两年产生的数据量,相当于此前人类社会产生数据量的综合。这样的数据量给人类处理能力带来了前所未有的挑战。这也是大数据概念的由来,对于大数据概念的理解,不光要从量的大小上去理解,更突出体现的是人类处理数据能力的不足。
如果仅从以大为中心的静态特征理解大数据未免过于机械,同时也使大数据的价值范畴大大缩小,甚至无法利用其演绎到社会治理的逻辑当中。因此相应地,大数据还具有它的广义的定义。毕达哥拉斯学派的经典哲学世界观认为“万物皆数”,可以说是蕴含着大数据理念的最早思想。日本野村综合研究认为,大数据是一个内涵范畴极其广泛的概念,除了以上所论及的侠义内涵外,还涉及相关的数据意义、数据规律甚至包括数据研究的组织以及人员的研究。该定义类似于科学,既指自然规律的知识,也包含着体制和道德等等。其将数据的使用主体纳入到大数据概念范畴,在一定程度上拓展了大数据的研究领域,丰富了大数据的内涵。另外,有人认为大数据代表一种方法和理念,即通过对海量数据的分析,来挖掘出其中有价值的信息或判断,这种“无中生有”的方法和理念,被认为是目前大数据应用较为广泛的一种概念定义。因为这种定义突破了科学领域,可以拓展到经济、金融、教育等社会的各个方面,进而形成自己独特的社会逻辑。
因此,数据与大数据的关系,是我们认识大数据形成及本质的有效路径。首先,大数据不单指海量的数据,而是数据关系的一种高级形态。通过这种数据关系,人们可以探究不同要素之间的相关性可能,进一步展开了因果概念的中心刻画,让相关关系提供过了由因素创构结果的广阔空间。另外,大数据既是一个技术概念,优势一个商业概念,它的出现建立在信息技术发展到一定程度的基础之上,但是其未满足于限制在技术领域演绎。而是以一种哲学包容性的气质,包揽了人类认识世界和社会的所有途径,酝酿着哲学研究和科学方法一个全新时代的来临。而这种气质将最终在社会治理逻辑中得以显现。