主要記錄疑惑點(diǎn)和容易混淆的地方
doc_value可以和倒排索引放一起理解,他是一種數(shù)據(jù)結(jié)構(gòu),按列存儲(chǔ),這樣設(shè)計(jì)適合聚合、排序等操作。7版本中字段默認(rèn)開(kāi)啟了,沒(méi)開(kāi)啟并且沒(méi)開(kāi)fielddata,如果使用了聚合查詢或者排序會(huì)報(bào)錯(cuò)。
segment翻譯為段,是lecene的核心概念,可以理解成搜索引擎的最小單位,因?yàn)槊總€(gè)segment都包含了一個(gè)倒排索引,搜索最終都是落到segment上,查詢有相關(guān)索引的segment,然后對(duì)結(jié)果進(jìn)行匯集。
指的是緩存刷新時(shí)間,可以理解為新增的數(shù)據(jù)要隔多久才能被搜索到。默認(rèn)1s,每隔一秒把內(nèi)存中的buffer(增刪改)寫(xiě)入到文件系統(tǒng)的緩存并啟用segment,當(dāng)啟用后表示數(shù)據(jù)可以被查到,在開(kāi)啟之前是搜索不到的,所以refresh可以控制搜索的實(shí)時(shí)性。
寫(xiě)入文件系統(tǒng)的緩存中的segment,通過(guò)flush可以異步寫(xiě)入磁盤,進(jìn)行持久化,es可以設(shè)置flush間隔
es8.x支持knn相似算法向量搜索,可以通過(guò)這個(gè)能力快速實(shí)現(xiàn)圖搜圖、文搜圖功能。