第五章:內容安全基礎
##教材學習總結
思維導圖:總攬全局

各個小節思維導圖及簡介

第一節:信息內容安全概述
*數據內容成為互聯網的中心關注點
*正面影響:大數據正在逐步演變為生產力
*負面影響:不良信息的大量傳播,不正當行為泛濫
*產生原因:
(1)在互聯網爆炸性發展的同時,相關方面的規范和管理措施未能同步發展
(2)互聯網在為人們提供遍歷獲取與發布信息的同時,制造了前所未有的思想碰撞場所

第二節:內容安全威脅
*內容威脅的兩個方面:
(1)內容安全所面臨的威脅有泄露、欺騙、破壞和篡改的風險
*互聯網中有大量的公開信息
*互聯網的開放性和自主性導致信息有各個組織自發生成并共享到互聯網中,帶來欺騙
*信息會被非法傳播
(2)惡意用戶產生的惡意內容會在網上傳播
*個人由信息的接收者變為信息的創造者與傳播者
*水軍用戶的惡意行為
*內容中心網絡緩存容易受到不同類型的攻擊,會污染破壞緩存系統

第三節:網絡信息內容獲取
1. 網絡信息內容獲取技術
*早期:網絡交互過程編程重構機制
*發展:基于瀏覽器模擬技術實現網絡媒體信息獲取
*理想:URL集合——信息“種子”集合
2. 信息內容獲取的典型工具
網絡爬蟲
*分類:服務于搜索引擎的網絡爬蟲、服務于進行針對性信息收集的應用網絡爬蟲
*用途:輿情分析,智能手持設備及相關應用的發展
3. 信息內容特征抽取與選擇
3.1文本內容的特征抽取與選擇
*方式:對文本內容進行:過濾和分類、類聚處理、自動摘要、用戶興趣模式發現、知識發現
3.2音頻信息內容的特征抽取與選擇
*方式:基于幀的特征,基于片段的特征
*基于幀的特征:
(1)MFCC
(2)頻域能量
(3)子帶能量比
(4)過零率
(5)基音頻率
*基于片段的音頻特征
(1)靜音幀率
(2)高過零幀率
(3)低能量幀率
(4)譜通量
(5)和諧度
3.3圖像信息的特征抽取與選擇
(1)圖像顏色特征提?。侯伾狈綀D、顏色聚合矢量、顏色矩
(2)圖像紋理特征提?。夯叶裙采仃?、Gabor小波特征、Tamura等根據人類視覺感知系統的特點
(3)其他圖像特征:邊緣特征、輪廓特征

第四節:信息內容分析與處理
1. 信息內容分類
(1)線性分類器:完全依賴于線性判別函數
(2)最近鄰分類法:分類結果取決于測試樣本與各類訓練樣本點之間的距離
(3)支持向量機:能夠最小化經驗誤差和最大化集合邊緣區
2.信息內容過濾
*常見的應用
(1) internet搜索結果的過濾
(2) 用戶電子郵件過濾
(3) 服務器/新聞組過濾
(4) 瀏覽器過濾
(5) 專為未成年人過濾
(6) 為客戶過濾

第五節:網絡輿情內容監測與預警
1. 網絡輿情系統的背景與應用范圍
*網絡輿情監測技術的發展趨勢:
(1)針對信息源的深入信息采集
(2)異構信息的融合分析
(3)非結構信息的結構化表達
2. 網絡輿情系統的功能分解
(1)高仿真網絡信息深度提取技術
*重點研究智能化、高效率的遠程網絡互動式動態信息的全面提取
(2)基于語義的海量媒體內容特征快速提取與分類技術
*重點研究針對網絡文本媒體
(3)非結構信息自組合聚合表達技術
*重點研究針對海量非結構化信息庫
3. 互聯網輿情內容分析
*深度挖掘技術
*在提取信息發布作者、發布時間、URL、主題等關鍵信息的基礎上,進而歸一化存儲來自異構站點的發布內容

第六節:內容中心網絡及安全
1. 內容中心網絡架構
(1)內容信息對象
*包括但不僅限于:網頁、文檔、電影、照片、歌曲以及流媒體和互動媒體
(2)命名
*具有全局性和唯一性
(3)路由
*北榮信息分發依賴于內容發布與訂閱的異步機制
(4)緩存
*原則:統一的、民主的
(5)應用程序編程接口
發布和獲取兩個操作都使用內容信息對象的名稱作為組織參數
2. 面向內容中心網絡的攻擊分類
(1)命名相關攻擊
允許攻擊者審查和過濾內容,獲取有關內容流行性和用戶興趣的私人信息
(2)路由相關攻擊
分為:分布式拒絕任務、欺騙攻擊
(3)緩存相關攻擊
內容中心網絡中的緩存相關攻擊可能引發拒絕服務、隱私泄露、緩存污染
(4)其他攻擊
其他攻擊包括攻擊者試圖獲取受限訪問內容,攻擊者試圖破壞簽名者的密鑰并充當和法的發布者,攻擊者嘗試修改、刪除或重播內容
##教材中的問題及解決過程
問:在內容安全基礎領域,有哪些挑戰是需要克服的?
答:
1. 大量異構數據處理:內容安全涉及到大量的文本、圖片、音視頻等多種數據格式,處理這些異構數據需要高效的技術手段。
-
實時性要求:對于內容安全的檢測和處理,往往需要快速響應。實時性是內容安全領域需要克服的一個重要挑戰。
-
智能惡意攻擊:隨著人工智能技術的發展,惡意攻擊者可以制作出更加難以察覺的惡意內容。應對這些智能惡意攻擊是內容安全領域的另一大挑戰。
-
多樣化的惡意行為識別:內容安全領域需要對各種惡意行為進行識別,包括詐騙、網絡暴力、謠言傳播等。這需要開發出多樣化的識別算法和技術。
-
隱私保護:在處理內容安全問題時,需要平衡隱私保護和公共利益之間的關系。如何在保障用戶隱私的同時,有效地識別和處理惡意內容,是一個亟待解決的挑戰。
-
法律法規約束:內容安全領域需要遵循不同國家和地區的法律法規,這為內容安全技術的發展帶來了一定的限制和挑戰。
-
跨平臺和跨領域協作:內容安全問題涉及到多個平臺和領域,如社交網絡、電商平臺、在線教育等。實現跨平臺和跨領域的協作,共同應對內容安全挑戰是必要的。
-
不斷更新的惡意手段:惡意攻擊者會不斷更新攻擊手段,內容安全領域需要不斷學習和適應這些新手段,以保持防護能力的有效性。
##基于AI的學習





## 參考資料
-[《網絡空間安全導論》](https://book.douban.com/subject/35743742/)
- [網絡空間安全導論書單](https://weread.qq.com/misc/booklist/3107758_7iPt5qwTA)
- [使用博客園進行學習](http://www.rzrgm.cn/rocedu/p/5145864.html)
- [MarkDown/Mermaid排版教程](http://www.rzrgm.cn/math/p/se-tools-001.html)

浙公網安備 33010602011771號