中國大數(shù)據(jù)產(chǎn)業(yè)峰會(huì)日前正式開幕,李克強(qiáng)總理出席并致辭,致辭中提及中國經(jīng)濟(jì)發(fā)展方式應(yīng)從過度依賴自然資源轉(zhuǎn)向更多依靠人力資源開發(fā)。因自然資源是有限的,但人力資源是無限的,蘊(yùn)藏著無窮的創(chuàng)造力。
所以發(fā)展大數(shù)據(jù)產(chǎn)業(yè)要有人才,有能力,有創(chuàng)新。有創(chuàng)新意識(shí)的人才雖不多得,但發(fā)展大數(shù)據(jù)產(chǎn)業(yè)所需要提升的能力卻可以進(jìn)行培養(yǎng),這里就“提升數(shù)據(jù)利用能力”與大家作個(gè)分享。
峰會(huì)中,總理也特別說到了自己的一個(gè)小故事。他說自己所穿的西裝,是中國企業(yè)為他做的。他當(dāng)時(shí)問這家企業(yè),說你們進(jìn)行了數(shù)據(jù)采集過程沒有,企業(yè)回答說我們?cè)谥袊呀?jīng)采集了兩百五十萬個(gè)樣本,但同時(shí)他告訴總理,如果他能做到兩千萬個(gè)樣本的采集,他為總理所做的西裝一定會(huì)做得更好。
一個(gè)小故事,透露著大數(shù)據(jù)讓整個(gè)時(shí)代走上了一個(gè)全新的臺(tái)階,同時(shí)也體現(xiàn)出我國傳統(tǒng)行業(yè)對(duì)數(shù)據(jù)的利用能力還有待提高。提升數(shù)據(jù)利用能力,要從數(shù)據(jù)資源挖掘入手,對(duì)于許多傳統(tǒng)行業(yè)來說,數(shù)據(jù)挖掘是一個(gè)新興詞匯,似乎永遠(yuǎn)和IT、計(jì)算機(jī)、云計(jì)算綁定在一起,與傳統(tǒng)行業(yè)關(guān)聯(lián)不大。
然而現(xiàn)代經(jīng)濟(jì)中,信息化浪潮席卷各行各業(yè),大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等的大力崛起,使得發(fā)展新經(jīng)濟(jì)、新動(dòng)能成為把握市場(chǎng)機(jī)遇的必然選擇。為推進(jìn)產(chǎn)業(yè)轉(zhuǎn)型,推動(dòng)信息化與實(shí)體經(jīng)濟(jì)深度融合發(fā)展,傳統(tǒng)行業(yè)也開始了信息化建設(shè),甚至是攜手大數(shù)據(jù)大力發(fā)展創(chuàng)新。但傳統(tǒng)行業(yè)面臨的最大問題就是技術(shù)的短缺,網(wǎng)頁抓取工具在培養(yǎng)數(shù)據(jù)利用能力方面則做出了較大貢獻(xiàn)。
網(wǎng)頁抓取工具被廣泛用來抓取網(wǎng)絡(luò)中公開的數(shù)據(jù)信息,比如交通記錄、醫(yī)療健康數(shù)據(jù)、社交數(shù)據(jù)等,擁有數(shù)據(jù)資源,才有下一步利用過程的實(shí)施。在不具備專業(yè)IT知識(shí)的情況下,以火車采集器為代表的網(wǎng)頁抓取工具能夠幫助和引導(dǎo)我們進(jìn)行簡(jiǎn)單的采集配置,并實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)化高效抓取。
火車采集器為我們呈現(xiàn)的是完全可視化的操作流程,而非冗雜的源代碼,所以網(wǎng)頁抓取工具對(duì)操作人員的技術(shù)要求并不高,自動(dòng)化運(yùn)行又可以節(jié)省大量的時(shí)間,不需要傳統(tǒng)企業(yè)花費(fèi)大量人力和精力去完成數(shù)據(jù)挖掘的高難度任務(wù)。
數(shù)據(jù)挖掘得以輕松解決,擁有數(shù)據(jù)就擁有決策權(quán),就能夠與傳統(tǒng)業(yè)務(wù)結(jié)合思考數(shù)據(jù)能帶來哪些創(chuàng)新,怎樣才能更好的被利用,這正是李克強(qiáng)總理所強(qiáng)調(diào)的“大數(shù)據(jù)創(chuàng)新意識(shí)與傳統(tǒng)工匠精神相結(jié)合”。
減少數(shù)字鴻溝,打破信息孤島,人在干、數(shù)在轉(zhuǎn)、云在算!正如總理所說,有些企業(yè)今天還是“小個(gè)子”,未來就可能產(chǎn)生一些“小巨人”,甚至享譽(yù)世界。