初始人工智能和機器學習
一、初始人工智能
1.人工智能是一個抽象的概念,它不是任何具體的機器或算法。任何類似于人的智能或高于人的智能的機器或算法都可以稱為人工智能。應用:機器人等。
2.機器學習是AI系統需要具備自我學歷的能力,即從原始數據中獲取有用的知識;機器學習算法是智能算法的統稱。應用:推薦系統、人臉識別、語音助手等。
3.神經網絡是一種受人腦結構啟發的計算模型,其基本組成單元是“神經元”。它的核心思想是通過大量相互連接的簡單處理單元(神經元),以分層的方式來處理信息。應用:圖像識別、語音識別等。
4.深度學習是機器學習的一個特定分支,它專門使用包含多個隱藏層的深度神經網絡來進行學習。應用:自動駕駛、機器翻譯等。
二、初始機器學習
1.定義:機器學習是從數據中自動分析獲得規律模型并利用規律對未知數進行預測。
2.價值體現
價值體現在各個方面:醫療、航空、教育、物流、電商......
讓機器學習程序替換手動的步驟,減少企業的成本也提高企業的效率。
3.機器學習的算法分類
3.1有監督學習(有標簽數據,通常用于分類和回歸問題)
算法:決策樹、支持向量機、樸素貝葉斯、k最近鄰算法、線性回歸、隨機森林、深度算法學習。
3.2無監督學習(無數據標簽,用于聚類、降維、關聯分析等問題)
算法:k均值聚類、層次聚類、主成分分析、關聯規則挖掘。
3.3分類算法
決策樹、支持向量機、樸素貝葉斯、k最近鄰算法、邏輯回歸。
3.4回歸算法
線性回歸、多項式回歸、支持向量機回歸、決策樹回歸、隨機森林回歸。
3.5集成方法
主要分為Stacking和Boosting兩個主要子類。
4.分類和回歸問題
分類算法基于的是標簽數據為離散型數據。
回歸算法基于的是標簽數據為連續型數據。
5.分類問題的應用
在銀行業務中,構建一個客戶分類模型,對客戶的貸款風險大小進行分類。
在手寫識別中,分類可以用于手寫的數字。
6.回歸問題的應用
房價預測、股票分析等。
7.聚類問題
聚類問題屬于無監督學習,即數據集沒有任何標簽,即在沒有預先標記的數據中發現模式。
聚類可用于識別社交網絡中的社群和群體,幫助理解社交網絡中的關系和用戶行為,可用于對文本進行主題建模、文檔分類等。
三、數據挖掘的標準流程
理解業務目標→數據收集→數據清洗和預處理→探索性數據分析→特征工程→數據建模→模型評估→模型優化→結果解釋和報告

浙公網安備 33010602011771號