6月5日,,,,,,“大数据起源处理的盘算机基础——解决大数据剖析的生涯自理问题”钻研会在安博电竞2号楼乐成举行。。。本次钻研会由安博电竞商务统计与经济计量系和北京大学商务智能中心联合主理。。。钻研会以大数据的起源处理为驻足点,,,,,,旨在通过简朴的数据库使用和python编程使数据剖析者能越发快速和利便的实现用户对数据的差别需求,,,,,,从而解决数据剖析者在自力完成数据处理使命和盘算机处理上的相关难题。。。
本次钻研会的主讲人是中国人民大学统计学院的本科生陈昱。。。作为中国人民大学数据挖掘中心HADOOP集群认真人和北京大学商务智能研究中心基础数据认真人,,,,,,陈昱善于网络数据抓取、python编程和集群运算,,,,,,尤其是在数据处理方面履历富厚。。。在为期一天的钻研会上,,,,,,他详细介绍了有关SQL数据库处理,,,,,,Linux操作和python编程语言的相关知识。。。
(图一:主讲人陈昱介绍SQL数据库处理,,,,,,Linux操作和python编程语言等相关知识)
上午的钻研会主要涉及“使用SQL盘问处理结构化数据”和“使用linux服务器”两个专题。。。陈昱首先以一个产品销售链数据为情景,,,,,,详细解说了SQL语句的用法。。。用法主要包括怎样使用SQL举行数据的盘问、过滤、提取,,,,,,怎样对数据举行简朴盘算以及某些高级盘问语句。。。随后,,,,,,陈昱还解说了怎样操作Linux服务器。。。他首先介绍的是shell剧本语言的基础用法,,,,,,然后详细概述了怎样毗连远程服务器以及在服务器上举行大规模运算处理。。。上午的专题钻研会让与会者们越创造确怎样提取数据并举行预处理,,,,,,同时凭证自己的需求熟练的使用服务器举行高性能的运算。。。

(图二:主讲人在为与会者解说怎样现实操作提取数据并举行预处理)
下昼的钻研会的关注点在“怎样用python语言处理非结构化数据和重大数据”。。。专题中,,,,,,陈昱首先以新浪微博数据为例子为各人系统解说了python的基本操作语言。。。然后他介绍了重大数据名堂的构建,,,,,,以及对中文文本数据的处理。。。最后,,,,,,陈昱介绍了在大规模数据下对文件举行批量处理,,,,,,从而高效的实现种种各样的数据需求对数据剖析者的主要性。。。
天下规模内的信息革命已经成为本世纪最大的主题,,,,,,大数据时代的到来将为社会带来刷新和生长。。。同时,,,,,,重大的数据资源也为高效盘算带来了新的挑战。。。本次钻研会通过对SQL数据库,,,,,,Linux服务器和Python语言的介绍,,,,,,使与会者能越发快速、利便的实现种种数据需求,,,,,,解决大数据剖析中的生涯自理问题并资助他们更好的集中于数据剖析建模事情,,,,,,告竣了预期的目的。。。我们相信,,,,,,在钻研会的启示和资助下,,,,,,更多的数据剖析事情者将更关注应用盘算机手艺举行大数据的处理及剖析,,,,,,从而更好的应对大数据时代的挑战!
行政办公室会务与活动部供稿