當我們經歷一段特殊的時刻,或者完成一項重要的任務時,我們會通過反思和總結來獲取心得體會。心得體會對于我們是非常有幫助的,可是應該怎么寫心得體會呢?下面是小編幫大家整理的心得體會范文大全,供大家參考借鑒,希望可以幫助到有需要的朋友。
大數據心得體會篇一
大數據講座學習心得
大數據時代已經悄然到來,如何應對大數據時代帶來的挑戰(zhàn)與機遇,是我們當代大學生特別是我們計算機類專業(yè)的大學生的一個必須面對的嚴峻課題。大數據時代是我們的一個黃金時代,對我們的意義可以說就像是另一個“80年代”。在講座中秦永彬博士由一個電視劇《大太監(jiān)》中情節(jié)來深入淺出的簡單介紹了“大數據”的基本概念,并由“塔吉特”與“犯罪預測”兩個案例讓我們深切的體會到了“大數據”的對現今這樣一個信息時代的不可替代的巨大作用。
在前幾年本世紀初的時候,世界都稱本世紀為“信息世紀”。確實在計算機技術與互聯網技術的飛速發(fā)展過后,我們面臨了一個每天都可以“信息爆炸”的時代。打開電視,打開電腦,甚至是在街上打開手機、pda、平板電腦等等,你都可以接收到來自互聯網從世界各地上傳的各類信息:數據、視頻、圖片、音頻……這樣各類大量的數據累積之后達到了引起量變的臨界值,數據本身有潛在的價值,但價值比較分散;數據高速產生,需高速處理。大數據意味著包括交易和交互數據集在內的所有數據集,其規(guī)模或復雜程度超出了常用技術按照合理的成本和時限捕捉、管理及處理這些數據集的能力。遂有了“大數據”技術的應運而生。
現在,當數據的積累量足夠大的時候到來時,量變引起了質變。“大數據”通過對海量數據有針對性的分析,賦予了互聯網“智商”,這使得互聯網的作用,從簡單的數據交流和信息傳遞,上升到基于海量數據的分析,一句話“他開始思考了”。簡言之,大數據就是將碎片化的海量數據在一定的時間內完成篩選、分析,并整理成為有用的資訊,幫助用戶完成決策。借助大數據企業(yè)的決策者可以迅速感知市場需求變化,從而促使他們作出對企業(yè)更有利的決策,使得這些企業(yè)擁有更強的創(chuàng)新力和競爭力。這是繼云計算、物聯網之后it產業(yè)又一次顛覆性的技術變革,對國家治理模式、對企業(yè)的決策、組織和業(yè)務流程、對個人生活方式都將產生巨大的影響。后工業(yè)社會時代,隨著新興技術的發(fā)展與互聯網底層技術的革新,數據正在呈指數級增長,所有數據的產生形式,都是數字化。如何收集、管理和分析海量數據對于企業(yè)從事的一切商業(yè)活動都顯得尤為重要。大數據時代是信息化社會發(fā)展必然趨勢,我們只有緊緊跟隨時代發(fā)展的潮流,在技術上、制度上、價值觀念上做出迅速調整并牢牢跟進,才能在接下來新一輪的競爭中擺脫受制于人的弱勢境地,才能把握發(fā)展的方向。
首先,“大數據”究竟是什么?它有什么用?這是當下每個人初接觸“大數據”都會有的疑問,而這些疑問在秦博士的講座中我們都了解到了?!按髷祿钡摹按蟆辈粌H是單單純純指數量上的“大”,而是在諸多方面上闡釋了“大”的含義,是體現在數據信息是海量信息,且在動態(tài)變化和不斷增長之上。同時“大數據”在:速度(velocity)、多樣性(variety)、價值密度(value)、體量(volume)這四方面(4v)都有體現。其實“大數據”歸根結底還是數據,其是一種泛化的數據描述形式,有別于以往對于數據信息的表達,大數據更多地傾向于表達網絡用戶信息、新聞信息、銀行數據信息、社交媒體上的數據信息、購物網站上的用戶數據信息、規(guī)模超過tb級的數據信息等。
一、學習總結
1. 大數據的定義
采用某些技術,從技術中獲得洞察力,也就是bi或者分析,通過分析和優(yōu)化實現
對企業(yè)未來運營的預測。
二、心得體會
在如此快速的到來的大數據革命時代,我們還有很多知識需要學習,許多思維需要轉變,許多技術需要研究。職業(yè)規(guī)劃中,也需充分考慮到大數據對于自身職業(yè)的未來發(fā)展所帶來的機遇和挑戰(zhàn)。當我們掌握大量數據,需要考慮有多少數字化的數據,又有哪些可以通過大數據的分析處理而帶來有價值的用途?在大數據時代制勝的良藥也許是創(chuàng)新的點子,也許可以利用外部的數據,通過多維化、多層面的分析給我們日后創(chuàng)業(yè)帶來價值。借力,順勢,合作共贏。
一、什么是大數據?
百度百科中是這么解釋的:大數據(big data),指無法在可承受的時間范圍內用常規(guī)軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力來適應海量、高增長率和多樣化的信息資產。我最開始了解大數據是從《大數據時代》了解到的。
大數據在幾年特別火爆,不知道是不是以前沒關注的原因,從各種渠道了解了大數據以后,就決定開始學習了。
二、開始學習之旅
在科多大數據學習這段時間,覺得時間過的很快,講課的老師,是國家大數據標準制定專家組成員,也是一家企業(yè)的大數據架構師,老師上課忒耐心,上課方式也很好,經常給我們講一些項目中的感受和經驗,果然面對面上課效果好!
如果有問題,老師會一直講到你懂,這點必須贊。上課時間有限,我在休息時間也利用他們的仿真實操系統(tǒng)不斷的練習,剛開始確實有些迷糊,覺得很難學,到后來慢慢就入門了,學習起來就容易多了,堅持練習,最重要的就是堅持。
大數據心得體會篇二
2021年6月26日,北京舉行了一場大數據行業(yè)盛會——大數據之夜。作為一名大數據從業(yè)者,我參加了這次盛會并對其進行了深刻的思考和反思。
二、現狀
當前,大數據正在成為推動各行業(yè)發(fā)展的重要力量,其綜合應用涉及人工智能、云計算、5G等眾多方面。而在這一趨勢下,大數據產業(yè)也正在得到迅猛的發(fā)展,成為了各大公司的熱門招聘領域。
三、心得
參加這次大數據之夜,最深刻的感受便是——大數據從業(yè)者一直在探索和實踐著怎么讓數據更好地“為所用”。會上展示了各行業(yè)根據大數據分析的能力,不斷推出新的產品和服務,具有可持續(xù)發(fā)展的生態(tài)和良好的社會價值。
在這樣的大環(huán)境下,我們大數據從業(yè)者實際上扮演著“挖掘機”的角色,通過對數據進行清洗、分析和應用,不斷挖掘其中的價值,進而助推各行各業(yè)的創(chuàng)新和發(fā)展。
在會上,各家企業(yè)代表分享了自己公司關于大數據、人工智能的實踐經驗,更多的探討了數據安全、流程管理、數據分析與應用等話題。而我在聽取這些分享和交流的過程中,深深地感受到了自己作為一名大數據從業(yè)者的使命和責任。
四、思考
當然,大數據產業(yè)在發(fā)展過程中也面臨著一系列挑戰(zhàn)和問題,例如數據安全問題、數據滲透風險、算法黑盒等,這些問題還需要我們不斷地探索和解決。
同時,我們作為大數據從業(yè)者,還應當注重教育和普及大數據相關知識,更加注重大數據產業(yè)的社會責任和倫理問題,力求在這一領域中做出更多的貢獻。
五、結尾
總的來說,這次大數據之夜對我影響很深,它讓我更加深入地理解了大數據產業(yè)的價值和意義,更加堅定了我在這個領域持續(xù)努力的決心和信念。相信隨著技術的不斷進步,大數據將持續(xù)成為推動創(chuàng)新和發(fā)展的重要力量,我們也將會在這一領域中不斷成長和發(fā)展。
大數據心得體會篇三
這本書里主要介紹的是大數據在現代商業(yè)運作上的應用,以及它對現代商業(yè)運作的影響。
《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現的問題提出自己看法與對策。
下面來重點介紹《大數據時代》這本書的主要內容。
《大數據時代》開篇就講了google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20__年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關的數據。同時google的預測與政府數據的相關性高達97%,這也就意味著google預測數據的置信區(qū)間為3%,這個數字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數據將無限的趨近于事件本身的性質。而之前采取的“樣本總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯系google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求并不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。
之后,維克托又預測了一個在大數據時代催生的重要職業(yè)——數據科學家,這是一群數學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業(yè)部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。
無論如何,大數據時代將會到來,不管我們接受還是不接受!
我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關的社交網站發(fā)表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現了一個新的世界。
大數據的心得體會篇2
大數據心得體會篇四
這本書里主要介紹的是大數據在現代商業(yè)運作上的應用,以及它對現代商業(yè)運作的影響。
《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現的問題提出自己看法與對策。
下面來重點介紹《大數據時代》這本書的主要內容。
《大數據時代》開篇就講了google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關的數據。同時google的預測與政府數據的相關性高達97%,這也就意味著google預測數據的置信區(qū)間為3%,這個數字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數據將無限的趨近于事件本身的性質。而之前采取的“樣本總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯系google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求并不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。
之后,維克托又預測了一個在大數據時代催生的重要職業(yè)——數據科學家,這是一群數學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業(yè)部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。
無論如何,大數據時代將會到來,不管我們接受還是不接受!
我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關的社交網站發(fā)表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現了一個新的世界。
大數據心得體會篇五
近年來,“大數據”這個概念突然火爆起來,成為業(yè)界人士舌尖上滾燙的話題。所謂“大數據”,是指數據規(guī)模巨大,大到難以用我們傳統(tǒng)信息處理技術合理擷取、管理、處理、整理?!按髷祿备拍钍恰靶畔ⅰ备拍畹?.0版,主要是對新媒體語境下信息爆炸情境的生動描述。
我們一直有這樣的成見:信息是個好東西。對于人類社會而言,信息應該多多益善。這種想法是信息稀缺時代的產物。由于我們曾吃盡信息貧困和蒙昧的苦頭,于是就拼命追逐信息、占有信息。我們甚至還固執(zhí)地認為,占有的信息越多,就越好,越有力量。但是,在“大數據’時代,信息不再稀缺,這種成見就會受到沖擊。信息的失速繁衍造成信息的嚴重過剩。當超載的信息逼近人們所能承受的極限值時,就會成為一種負擔,我們會不堪重負。
信息的超速繁殖源自于信息技術的升級換代。以互聯網為代表的新媒體技術打開了信息所羅門的瓶子,數字化的信息失速狂奔,使人類主宰信息的能力遠遠落在后面。美國互聯網數據中心指出,互聯網上的數據每兩年翻一番,目前世界上的90%以上數據是近幾年才產生的。,數字存儲信息占全球數據量的四分之一,另外四分之三的信息都存儲在報紙、膠片、黑膠唱片和盒式磁帶這類媒介上。,只有7%是存儲在報紙、書籍、圖片等媒介上的模擬數據,其余都是數字數據。到,世界上存儲的數據中,數字數據超過98%。面對數字數據的大量擴容,我們只能望洋興嘆。
“大數據”時代對人類社會的影響是全方位的。這種影響究竟有多大,我們現在還無法預料。哈佛大學定量社會學研究所主任蓋瑞·金則以“一場革命”來形容大數據技術給學術、商業(yè)和政府管理等帶來的變化,認為“大數據”時代會引爆一場“哥白尼式革命”:它改變的不僅僅是信息生產力,更是信息生產關系;不僅是知識生產和傳播的內容,更是其生產與傳播方式。
我們此前的知識生產是印刷時代的產物。它是15世紀古登堡時代的延續(xù)。印刷革命引爆了人類社會知識生產與傳播的“哥白尼式革命”,它使得知識的生產和傳播突破了精英、貴族的壟斷,開啟了知識傳播的大眾時代,同時,也確立了“機械復制時代”的知識生產與傳播方式。與印刷時代相比,互聯網新媒體開啟的“大數據”時代,則是一場更為深廣的革命。在“大數據”時代,信息的生產與傳播往往是呈幾何級數式增長、病毒式傳播。以互聯網為代表的媒介技術顛覆了印刷時代的知識生產與傳播方式。新媒體遍地開花,打破了傳統(tǒng)知識主體對知識生產與傳播的壟斷。新媒體技術改寫了靜態(tài)、單向、線性的知識生產格局,改變了自上而下的知識傳播模式,將知識的生產與傳播拋入空前的不確定之中。在“大數據”時代,我們的知識生產若再固守印刷時代的知識生產理念,沿襲此前的知識生產方式,就會被遠遠地甩在時代后面。
(節(jié)選自2013.2.22《文匯讀書周報》,有刪改)
大數據心得體會篇六
近年來,隨著信息技術的迅猛發(fā)展,大數據概念逐漸走入大眾視野,成為各行各業(yè)追求創(chuàng)新和發(fā)展的熱點話題。為了加深對大數據的理解和分享最新的研究成果,許多大數據相關的會議應運而生。我近日參加了一場大數據會議,收獲頗豐,以下是我對大數據會議的心得體會。
第二段:會議的內容與分享
這次大數據會議的主題涵蓋了大數據的理論與實踐,研究成果的應用以及行業(yè)中的案例分析等多個方面。與會嘉賓來自大數據領域的頂尖企業(yè)、知名大學以及研究機構。他們通過演講、小組討論和展覽等形式,詳細介紹了大數據的最新動態(tài)和應用案例,讓人對大數據的前沿研究有了直觀的認識。同時,與會者還有機會與各界精英進行交流、互動,增進了相互之間的溝通與合作。
第三段:對大數據會議的感悟
此次大數據會議給我留下了深刻的印象。首先,大數據的概念已經深入到各個領域,無論是醫(yī)療、金融、教育還是制造業(yè),都在努力將大數據應用于解決實際問題,推動行業(yè)的發(fā)展。其次,大數據分析的核心是對數據的細致分析和解讀,只有具備豐富的數據處理和建模技術,才能從大數據中發(fā)現隱藏的規(guī)律和價值。最后,數據的安全與隱私保護是大數據發(fā)展的重要議題,各個企業(yè)和機構需要加強隱私保護的技術手段,確保大數據的安全使用。
第四段:對個人的啟發(fā)與收獲
通過參加大數據會議,我對大數據的應用、挑戰(zhàn)與前景有了更深刻的認識。在今后的學習和工作中,我會更加關注大數據領域的研究,并提升自己的數據分析能力。此外,我還結識了許多志同道合的朋友,他們來自不同的領域,但對大數據的熱情和追求相似。與他們的交流和合作不僅擴展了我的視野,也提供了更多學習和成長的機會。
第五段:總結與展望
參加這次大數據會議,讓我對大數據的深度理解和應用前景有了新的認識。大數據的發(fā)展勢頭迅猛,已經成為引領行業(yè)創(chuàng)新發(fā)展的重要驅動力。然而,大數據的發(fā)展還面臨著一些挑戰(zhàn),如數據安全和隱私保護等。在未來的發(fā)展中,我們應當注重技術的創(chuàng)新和應用的實踐,以更好地應對這些挑戰(zhàn)。同時,我們也要加強與其他領域的合作和交流,促進大數據的跨界融合,實現更廣闊的發(fā)展空間。
在這次大數據會議中,我收獲了知識和啟發(fā),同時也感受到了大數據領域的熱情和朝氣。我相信,在大數據的助推下,我們能夠更好地應對未來的挑戰(zhàn),并取得更大的創(chuàng)新和發(fā)展。
大數據心得體會篇七
在數字化時代,大數據已成為眾多企業(yè)和組織不可或缺的工具。大數據能夠幫助企業(yè)做出更準確的商業(yè)決策,提高效率和競爭力。在我的工作中,我也深刻感受到了大數據的重要性。下面我將分享我在大數據分析方面的心得體會。
第二段:對大數據的初步認識
一開始,我對于大數據只有一些模糊的概念,主要是基于科幻小說和電影中的場景想象的。然而,在我的第一個大數據項目中,我才真正理解到大數據的意義和價值。首先,大數據能夠收集、存儲和處理大量的數據;其次,大數據能夠分析和挖掘數據,提供有價值的信息;最后,大數據在實際應用中能夠幫助企業(yè)做出更準確的商業(yè)決策。
第三段:大數據項目中的挑戰(zhàn)和解決方法
當我參與到大數據項目中時,我遇到的最大困難是如何處理大量的數據。不同的數據來源和格式,清理和整合起來非常困難。但在實踐過程中,我找到了一些解決方案。首先,我使用了一些現有的數據處理工具和技術,例如Hadoop,Spark和Python;其次,我和我的團隊利用數據科學的方法研究數據,了解數據的模式和規(guī)律;最后,我積極尋找和分析外部數據,加以比較和引用,以獲得更完整和準確的數據分析結果。
第四段:大數據給我?guī)淼氖斋@和成就
盡管在大數據項目中遇到了一些挑戰(zhàn),我也收獲了不少成就。通過對大量數據的分析,我更好地了解市場趨勢和客戶需求,并為企業(yè)提供了更準確和有價值的信息。我的工作和分析結果得到了客戶的認可和表揚,這使我在團隊中的地位和影響力得到了提升。同時,我也發(fā)現自己在數據分析和科學方面的能力得到了很大提升,這有助于我在未來更好地應對相關項目。
第五段:總結
總之,在數字化時代,大數據已經成為企業(yè)和組織不可或缺的工具。我的工作體驗和體會告訴我,大數據能夠為企業(yè)提供更準確、有價值和可操作的信息,提高企業(yè)的效率和競爭力。在未來,我會繼續(xù)深入研究和學習這一領域,以便更好地應對相關挑戰(zhàn)和機遇。
大數據心得體會篇八
大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關系和不同,也試圖說明,為什么信息時代轉變?yōu)榱舜髷祿r代?大數據時代帶給了我們什么?下面是本站小編為大家收集整理的大數據時代
心得體會
,歡迎大家閱讀。這本書里主要介紹的是大數據在現代商業(yè)運作上的應用,以及它對現代商業(yè)運作的影響。
《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這一現象的解釋。然后在通過解釋在對未來進行預測,并對未來可能出現的問題提出自己看法與對策。
下面來重點介紹《大數據時代》這本書的主要內容。
《大數據時代》開篇就講了google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20xx年美國的h1n1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。google的預測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關的數據。同時google的預測與政府數據的相關性高達97%,這也就意味著google預測數據的置信區(qū)間為3%,這個數字遠遠小于傳統(tǒng)統(tǒng)計學上的常規(guī)置信區(qū)間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數據時代“樣本=總體”的思想。我們都知道當樣本無限趨近于總體的時候,通過計算得到的描述性數據將無限的趨近于事件本身的性質。而之前采取的“樣本總體”的做法很大程度上無法做到更進一步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的“樣本=總體”的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。
接下來,維克多又通過了ibm追求高精確性的電腦翻譯計劃的失敗與google只是將所有出現過的相應的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯系google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求并不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。
之后,維克托又預測了一個在大數據時代催生的重要職業(yè)——數據科學家,這是一群數學家、統(tǒng)計學與編程家的綜合體,這一群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的一切外在的與內在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數據為商業(yè)部門服務,而另一群人則負責審查這一些人是否合法的獲得與應用數據,是否侵犯了個人隱私。
無論如何,大數據時代將會到來,不管我們接受還是不接受!
我覺得《大數據時代》這本書寫的很好,很值得一讀。因為會給我們很多啟發(fā),比如你在相關的社交網站發(fā)表的言論或者照片都很有可能被“數據科學家”們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心你在網上留下的痕跡。
我喜歡這本書是因為它給我展現了一個新的世界。
讀了《大數據時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰(zhàn)栗起來。
“在小數據時代,我們會假象世界是怎樣運作的,然后通過收集和分析數據來驗證這種假想。”“隨著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計學的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學的理論已經脫離實際”來“終結”量子力學。對此我很高興,因為統(tǒng)計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了“很可能認為”這樣的保護傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數據是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。
當我們人類的數據收集和處理能力達到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調查為基礎的統(tǒng)計學了。但是由統(tǒng)計學和量子力學以及其他很多“我們也很可能認為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔心了!
《大數據時代》第16頁“大數據的核心就是預測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關系規(guī)則。兩者似乎是做同一件事??纱髷祿摹安皇且蚬P系,而是相關關系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——歸納邏輯、溯因邏輯和演繹邏輯都是基于因果關系。兩者好像又是對立的。在同一件事上兩種方法對立,應該只有一個結果,就是要否定掉其中之一。這就是讓我很擔心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學搞了一百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那么大數據會不會通過正視混雜性,放棄因果關系最后反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區(qū)別在于人有邏輯思維而機器沒有。《大數據時代》也擔心“最后做出決策的將是機器而不是人”。如果真的那一天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。
所以想向《大數據時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數據時代的邏輯思維。
在《大數據時代》一書中,大數據時代與小數據時代的區(qū)別:1、思維慣例。大數據時代區(qū)別與轉變就是,放棄對因果關系的渴求,而取而代之關注相關關系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質區(qū)別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利于預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭并進,理論來創(chuàng)立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而并非相離互斥。
數據未來的故事。數據的發(fā)展,給我們帶來什么預期和啟示?銀行業(yè)天然有大數據的潛質??蛻魯祿?、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰(zhàn)也隨之而來,適應變革,適者生存。我們可以有更廣闊的業(yè)務發(fā)展空間、可以有更精準的決策判斷能力、可以有更優(yōu)秀的經營管理能力??可以這些都基于數據的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設“數據倉庫”,培養(yǎng)“數據思維”,養(yǎng)成“數據治理”,創(chuàng)造“數據融合”,實現“數據應用”才能擁抱“大數據”時代,從數據中攫取價值,笑看風云變換,穩(wěn)健贏取未來。
【本文地址:http://mlvmservice.com/zuowen/18441131.html】