摘要:
源代碼: a=open("a.txt","r",encoding="utf-8")b=a.readlines()print(b)We_word='We'We_count=0No_word='No'No_count=0Androids_word='Androids'Androids_count=0fo
閱讀全文
摘要:
1.理解HBase表模型及四維坐標:行鍵、列族、列限定符和時間戳。 HBase是一個開源可伸縮的針對海量數據存儲的分布式nosql數據庫,它根據Google Bigtable數據模型來建模并構建在hadoop的hdfs存儲系統之上。它和關系型數據庫Mysql, Oracle等有明顯的區別,HBase
閱讀全文
摘要:
hadoop的起源和發展 Hadoop最早起源于lucene下的Nutch。設計目的是是構建一個強大的的全網搜索引擎,包括網頁抓取、索引、查詢等功能。 hadoop的發展則是再遠基礎上修復了一些bug以及添加了新的架構,引入了其他平臺,hadooop自身也日漸完善。 用圖與自己的話,簡要描述名稱節點
閱讀全文
摘要:
1.安裝LINUX系統: 2.安裝mysql數據庫: 3.安裝Hadoop,查看ip:
閱讀全文
摘要:
cd命令 ls命令 mkdir命令 rmdir命令 cp命令 mv命令 rm命令 cat命令 tac命令 more命令 head命令 tail命令 chown命令 Vim/gedit/文本編輯器:新建文件 輸入文本: 保存退出: tar命令 解壓縮 Mysql show databases 進入庫和
閱讀全文
摘要:
1.為什么產生大數據技術? 互聯網的發展以及數據庫技術的成長都相應地產生了許多非結構化的數據,數據的產生方式由以往的被動產生逐漸發展成了主動產生。而這種產生方式的轉變直接使得我們的數據呈指數型增長,但目前我們所掌握的技術還不足以高效率處理這些龐大的非結構化數據。因此我們需要一種新的數據技術以保證我們
閱讀全文