時(shí)間:2015-06-28 00:00:00 來源:IT貓撲網(wǎng) 作者:網(wǎng)管聯(lián)盟 我要評(píng)論(0)
高端內(nèi)存是指物理地址大于 896M 的內(nèi)存。
對(duì)于這樣的內(nèi)存,無法在"內(nèi)核直接映射空間"進(jìn)行映射。
為什么?
因?yàn)?內(nèi)核直接映射空間"最多只能從 3G 到 4G,只能直接映射 1G 物理內(nèi)存,對(duì)于大于 1G 的物理內(nèi)存,無能為力。
實(shí)際上,"內(nèi)核直接映射空間"也達(dá)不到 1G, 還得留點(diǎn)線性空間給"內(nèi)核動(dòng)態(tài)映射空間" 呢。
因此,Linux 規(guī)定"內(nèi)核直接映射空間" 最多映射 896M 物理內(nèi)存。
對(duì) 于高端內(nèi)存,可以通過 alloc_page() 或者其它函數(shù)獲得對(duì)應(yīng)的 page,但是要想訪問實(shí)際物理內(nèi)存,還得把 page 轉(zhuǎn)為線性地址才行(為什么?想想 MMU 是如何訪問物理內(nèi)存的),也就是說,我們需要為高端內(nèi)存對(duì)應(yīng)的 page 找一個(gè)線性空間,這個(gè)過程稱為高端內(nèi)存映射。
高端內(nèi)存映射有三種方式:
1、映射到"內(nèi)核動(dòng)態(tài)映射空間"
這種方式很簡單,因?yàn)橥ㄟ^ vmalloc() ,在"內(nèi)核動(dòng)態(tài)映射空間"申請(qǐng)內(nèi)存的時(shí)候,就可能從高端內(nèi)存獲得頁面(參看 vmalloc 的實(shí)現(xiàn)),因此說高端內(nèi)存有可能映射到"內(nèi)核動(dòng)態(tài)映射空間" 中。
2、永久內(nèi)核映射
如果是通過 alloc_page() 獲得了高端內(nèi)存對(duì)應(yīng)的 page,如何給它找個(gè)線性空間?
內(nèi)核專門為此留出一塊線性空間,從 PKMAP_BASE 到 FIXADDR_START ,用于映射高端內(nèi)存。在 2.4 內(nèi)核上,這個(gè)地址范圍是 4G-8M 到 4G-4M 之間。這個(gè)空間起叫"內(nèi)核永久映射空間"或者"永久內(nèi)核映射空間"
這個(gè)空間和其它空間使用同樣的頁目錄表,對(duì)于內(nèi)核來說,就是 swapper_pg_dir,對(duì)普通進(jìn)程來說,通過 CR3 寄存器指向。
通常情況下,這個(gè)空間是 4M 大小,因此僅僅需要一個(gè)頁表即可,內(nèi)核通過來 pkmap_page_table 尋找這個(gè)頁表。
通過 kmap(), 可以把一個(gè) page 映射到這個(gè)空間來
由于這個(gè)空間是 4M 大小,最多能同時(shí)映射 1024 個(gè) page。因此,對(duì)于不使用的的 page,及應(yīng)該時(shí)從這個(gè)空間釋放掉(也就是解除映射關(guān)系),通過 kunmap() ,可以把一個(gè) page 對(duì)應(yīng)的線性地址從這個(gè)空間釋放出來。
3、臨時(shí)映射
內(nèi)核在 FIXADDR_START 到 FIXADDR_TOP 之間保留了一些線性空間用于特殊需求。這個(gè)空間稱為"固定映射空間"
在這個(gè)空間中,有一部分用于高端內(nèi)存的臨時(shí)映射。
這塊空間具有如下特點(diǎn):
1、 每個(gè) CPU 占用一塊空間
2、 在每個(gè) CPU 占用的那塊空間中,又分為多個(gè)小空間,每個(gè)小空間大小是 1 個(gè) page,每個(gè)小空間用于一個(gè)目的,這些目的定義在 kmap_types.h 中的 km_type中。
當(dāng)要進(jìn)行一次臨時(shí)映射的時(shí)候,需要指定映射的目的,根據(jù)映射目的,可以找到對(duì)應(yīng)的小空間,然后把這個(gè)空間的地址作為映射地址。這意味著一次臨時(shí)映射會(huì)導(dǎo)致以前的映射被覆蓋。
通過 kmap_atomic() 可實(shí)現(xiàn)臨時(shí)映射。
下圖簡單簡單表達(dá)如何對(duì)高端內(nèi)存進(jìn)行映射
?。?/p>
高端內(nèi)存含義為:線性地址空間 PAGE_OFFSET + 896M 至4G的最后128M線性地址 <==映射==> 896M以上的物理頁框,非直接映射。有3種方法:非連續(xù)內(nèi)存區(qū)映射,永久內(nèi)核映射,臨時(shí)內(nèi)核映射(固定映射)
從 PAGE_OFFSET開始的線性地址區(qū)域?yàn)椋?/p>
PAGE_OFFSET(3G)|物理內(nèi)存映射 --8M-- vmalloc區(qū) --4K-- vmalloc區(qū) --8K-- 永久內(nèi)核映射--臨時(shí)內(nèi)核映射(固定映射)|4G
1. 非連續(xù)區(qū)映射
1.1 每個(gè)非連續(xù)內(nèi)存區(qū)都對(duì)應(yīng)一個(gè)類型為 vm_struct的描述符,通過next字段,這些描述符被插入到一個(gè)vmlist鏈表中。
1.2 三種非連續(xù)區(qū)的類型:
VM_ALLOC?? -- 物理內(nèi)存(調(diào)用alloc_page)和線性地址同時(shí)申請(qǐng),物理內(nèi)存是 __GFP_HIGHMEM類型(分配順序是HIGH, NORMAL, DMA )(可見vmalloc不僅僅可以映射__GFP_HIGHMEM頁框,它的主要目的是為了將零散的,不連續(xù)的頁框拼湊成連續(xù)的內(nèi)核邏輯地址空間...)
VM_MAP???? -- 僅申請(qǐng)線性區(qū),物理內(nèi)存另外申請(qǐng),是VM_ALLOC的簡化版
VM_IOREMAP -- 僅申請(qǐng)線性區(qū),物理內(nèi)存另外申請(qǐng)(這里的物理內(nèi)存一般都是高端內(nèi)存,大于896M的內(nèi)存)
2. 永久內(nèi)核映射
2.1 永久內(nèi)存映射允許建立長期映射。使用主內(nèi)核頁表中swapper_pg_dir的一個(gè)專門頁表。
pkmap_page_table: 專門的頁表。頁表表項(xiàng)數(shù)由LAST_PKMAP(512或1024)產(chǎn)生。
page_address_htable: 存放地址的
pkmap_count: 包含LAST_PKMAP個(gè)計(jì)數(shù)器的數(shù)組。
PKMAP_BASE: 頁表線性地址從PKMAP_BASE開始。
2.2 如果LAST_PKMAP個(gè)項(xiàng)都用完,則把當(dāng)前進(jìn)程置為 TASK_UNINTERRUPTIBLE,并調(diào)用schedule()
3. 臨時(shí)內(nèi)存映射
3.1 可以用在中斷處理函數(shù)和可延遲函數(shù)的內(nèi)部,從不阻塞。因?yàn)榕R時(shí)內(nèi)存映射是固定內(nèi)存映射的一部分,一個(gè)地址固定給一個(gè)內(nèi)核成分使用。
3.2 每個(gè)CPU都有自己的一個(gè)13個(gè)窗口(一個(gè)線性地址及頁表項(xiàng))的集合。
enum km_type {
KM_BOUNCE_READ,
KM_SKB_SUNRPC_DATA,
KM_SKB_DATA_SOFTIRQ,
KM_USER0,
KM_USER1,
KM_BIO_SRC_IRQ,
KM_BIO_DST_IRQ,
KM_PTE0,
KM_PTE1,
KM_IRQ0,
KM_IRQ1,
KM_SOFTIRQ0,
KM_SOFTIRQ1,
KM_TYPE_NR
};
所有固定映射的固定線性地址
enum fixed_addresses {
FIX_HOLE,
FIX_VSYSCALL,
....
#ifdef CONFIG_HIGHMEM
FIX_KMAP_BEGIN,??? /* reserved pte's for temporary kernel mappings */
FIX_KMAP_END = FIX_KMAP_BEGIN+(KM_TYPE_NR*NR_CPUS)-1,
#endif
.......
__end_of_permanent_fixed_addresses,
/* temporary boot-time mappings, used before ioremap() is functional */
#define NR_FIX_BTMAPS??? 16
FIX_BTMAP_END = __end_of_permanent_fixed_addresses,
FIX_BTMAP_BEGIN = FIX_BTMAP_END + NR_FIX_BTMAPS - 1,
FIX_WP_TEST,
__end_of_fixed_addresses
};
3.3 注意 fixed_addresses 的地址從上至下是倒著的,F(xiàn)IX_HOLE的地址等于 0xfffff000,是一個(gè)洞
#define __fix_to_virt(x)??? (FIXADDR_TOP - ((x) << PAGE_SHIFT))
#define __FIXADDR_TOP??? 0xfffff000
?。?/p>
VMALLOC_RESERVE和896M
LINUX 內(nèi)核虛擬地址空間到物理地址空間一般是固定連續(xù)影射的。
假定機(jī)器內(nèi)存為512M,
從 3G開始,到3G + 512M 為連續(xù)固定影射區(qū)。zone_dma, zone_normal為這個(gè)區(qū)域的。固定影射的VADDR可以直接使用(get a free page, then use pfn_to_virt()等宏定義轉(zhuǎn)換得到vaddr)或用kmalloc等分配. 這樣的vaddr的物理頁是連續(xù)的。得到的地址也一定在固定影射區(qū)域內(nèi)。
如果內(nèi)存緊張,連續(xù)區(qū)域無法滿足,調(diào)用vmalloc分配是必須的,因?yàn)樗梢詫⑽锢聿贿B續(xù)的空間組合后分配,所以更能滿足分配要求。vmalloc可以映射高端頁框,也可以映射底端頁框。vmalloc的作用只是為了提供邏輯上連續(xù)的地址。。。
但 vmalloc分配的vaddr一定不能與固定影射區(qū)域的vaddr重合。因?yàn)関addr到物理頁的影射同時(shí)只能唯一。所以vmalloc得到的 vaddr要在3G + 512m 以上才可以。也就是從VMALLOC_START開始分配。 VMALLOC_START比連續(xù)固定影射區(qū)大最大vaddr地址還多8-16M(2*VMALLOC_OFFSET)--有個(gè)鬼公式在
#define VMALLOC_OFFSET?? 8*1024
#define VMALLOC_START?? (high_memory - 2*VMALLOC_OFFSET) & ~(VMALLOC_OFFSET-1)
high_memory 就是固定影射區(qū)域最高處。
空開8-16M做什么? 為了捕獲越界的mm_fault.
同樣,vmalloc每次得到的VADDR空間中間要留一個(gè)PAGE的空(空洞),目的和上面的空開一樣。你vmalloc(100)2次,得到的2個(gè)地址中間相距8K。
如果連續(xù)分配無空洞,那么比如
p1=vmalloc(4096);
p2=vmalloc(4096);
如果p1使用越界到p2中了,也不會(huì)mm_falut. 那不容易debug.
下面說明VMALLOC_RESERVE和896M的問題。
上面假設(shè)機(jī)器物理512M的case. 如果機(jī)器有1G物理內(nèi)存如何是好?那vmalloc()的vaddr是不是要在3G + 1G + 8M 空洞以上分配?超過尋址空間了嗎。
這時(shí),4G 下面保留的VMALLOC_RESERVE 128m 就派上用場了。
也就是說如果物理內(nèi)存超過896M, high_memory也只能在3G + 896地方??蓪ぶ房臻g最高處要保留VMALLOC_RESREVE 128M給vmalloc用。
所以這128M的VADDR空間是為了vmalloc在物理超過了896M時(shí)候使用。如果物理僅僅有512M, 一般使用不到。因?yàn)閂MALLOC_START很低了。如果vmalloc太多了才會(huì)用到。
high_memory在arch/i386/kernel, mm的初始化中設(shè)置。根據(jù)物理內(nèi)存大小和VMALLOC_RESERVE得到數(shù)值.
所以說那128M的內(nèi)核線性地址僅僅是為了影
關(guān)鍵詞標(biāo)簽:Linux
相關(guān)閱讀
熱門文章 安裝紅帽子RedHat Linux9.0操作系統(tǒng)教程 Tomcat9.0如何安裝_Tomcat9.0環(huán)境變量配置方法 多種操作系統(tǒng)NTP客戶端配置 Linux操作系統(tǒng)修改IP
人氣排行 Linux下獲取CPUID、硬盤序列號(hào)與MAC地址 dmidecode命令查看內(nèi)存型號(hào) linux tc實(shí)現(xiàn)ip流量限制 安裝紅帽子RedHat Linux9.0操作系統(tǒng)教程 linux下解壓rar文件 lcx.exe、nc.exe、sc.exe入侵中的使用方法 Ubuntu linux 關(guān)機(jī)、重啟、注銷 命令 查看linux服務(wù)器硬盤IO讀寫負(fù)載