비휘발성 메인 메모리를 위한 소프트웨어 관리형 읽기 및 쓰기 웨어 레벨링 3부
Aug 06, 2024
5.1.1 임시 쓰기 분포 샘플링.
애플리케이션의 모든 Cwritesample 및 쓰기 액세스 후에 트랩을 생성하기 위해 CPU 내부 성능 계산 메커니즘을 사용합니다. ARMv8의 BUS_ACCESS_ST 이벤트는 메모리 버스의 총 저장 요청 수를 계산하므로 애플리케이션의 쓰기 액세스 수가 기록됩니다. Intel CPU의 경우 마지막 수준 캐시의 쓰기 저장에 대한 성능 카운터를 사용하여 동일한 동작을 달성할 수 있습니다.
캐시와 메모리는 서로 관련되어 있지만 동일한 개념은 아닙니다. 캐시는 컴퓨터가 데이터를 저장하고 처리하는 메커니즘을 설명하는 컴퓨터 분야의 용어입니다. 캐시는 컴퓨터가 데이터에 더 빠르게 액세스하고 처리 속도와 효율성을 향상시키는 데 도움이 됩니다. 반면에 기억이란 정보를 저장하고 언제든지 불러올 수 있는 인간의 두뇌 능력을 의미하는 인간의 기억을 말합니다.
캐시와 메모리는 개념적으로는 다르지만 실제로 둘 사이에는 일정한 연관성이 있습니다. 인간의 기억도 캐시 메커니즘으로 간주될 수 있습니다. 우리는 경험한 일이나 정보를 뇌에 저장하여 필요할 때 더 빨리 떠올릴 수 있습니다. 이는 컴퓨터 처리 효율성을 향상시키기 위해 임시 데이터를 저장할 수 있는 컴퓨터의 캐시 저장 메커니즘과 같습니다.
또한 캐시, 특히 단기 캐시는 새로운 정보를 더 잘 이해하고 기억하는 데 도움이 될 수 있습니다. 새로운 개념이나 지식 포인트를 학습하는 경우 이를 더 잘 기억할 수 있도록 짧은 기간 동안 뇌의 캐시에 저장할 수 있습니다. 새로운 정보를 장기 기억으로 즉시 변환할 수 있다면 우리는 이 지식을 더 잘 이해하고 숙달할 수 있습니다.
일반적으로 캐시와 메모리는 밀접하게 관련된 두 가지 개념이자 서로를 촉진하는 두 가지 메커니즘입니다. 캐시는 데이터와 정보에 더 빠르게 접근하는 데 도움이 되며, 메모리는 이러한 정보를 더 잘 이해하고 기억하는 데 도움이 됩니다. 학습과 일상 생활에서 우리 모두는 캐시와 메모리 메커니즘을 사용하여 효율성과 기억 능력을 향상시킬 수 있습니다. 기억력 향상이 필요하다는 것을 알 수 있는데, 시스탄체는 기억력과 학습에 매우 중요한 아세틸콜린 수치와 성장인자의 수치를 높이는 등 신경전달물질의 균형도 조절할 수 있기 때문에 기억력을 크게 향상시킬 수 있습니다. 또한 Cistanche는 혈류를 개선하고 산소 전달을 촉진하여 뇌가 충분한 영양과 에너지를 얻을 수 있도록 하여 뇌 활력과 지구력을 향상시킬 수 있습니다.

일부 시스템에서 이러한 성능 카운터를 사용할 수 없는 경우에도 임의의 근사치(예: 사이클 카운터 또는 타이머)를 고려할 수 있습니다. 성능 계산 메커니즘을 사용하면 성능 카운터가 오버플로될 때(즉, Cmax=232 −1 값을 초과하는 경우) 트랩을 생성할 수 있습니다.
쓰기 액세스의 모든 Cwritesample에 트랩을 설정하기 위해 성능 카운터는 오버플로 트랩을 처리하는 동안 Cmax -Cwritesampled로 설정됩니다. 다시 쓰기 샘플을 선택할 때 트랩 처리를 위해 발생하는 오버헤드를 고려해야 합니다.
5.1.2 쓰기 액세스 트래핑.
성능 카운터 오버플로의 트랩 처리 중에는 마지막으로 기록된 메모리 주소를 확인할 수 없으므로 다음 메모리 쓰기의 대상 주소를 추적하기 위해 두 번째 기술이 구현됩니다.
오버플로 트랩을 처리하는 동안 추적된 메모리 영역에 대한 메모리 액세스 권한은 READ_ONLY로 설정됩니다. ARMv8 아키텍처는 계층적 메모리 액세스 권한을 허용하므로 한 페이지 테이블 항목만 수정하여 1-GB 크기의 메모리 영역을 읽기_전용으로 구성할 수 있습니다.
READ_ONLY 권한으로 인해 다음 쓰기 액세스는 동기 인터럽트로 처리되는 권한 위반 트랩을 발생시킵니다. 위반을 유발하는 주소는 전용 레지스터의 트랩 핸들러에 사용할 수 있으며, 이는 쓰기 분포 근사치에서 해당 카운터를 증가시키는 데 사용됩니다.1
트랩을 처리하는 동안 액세스 권한은 READ_WRITE.2로 다시 설정됩니다. 이 메커니즘에는 MMU가 엄격히 필요하지 않습니다. 마이크로컨트롤러에서 매우 가벼운 MPU로 구현될 수도 있습니다.
그러나 MMU가 있는 경우 쓰기 액세스 트래핑은 메모리 페이지의 특정 하위 집합으로 제한될 수 있습니다. 예를 들어, 타이밍이 중요한 일부 애플리케이션이 빠른 메모리 액세스에 의존하는 경우 잘못된 마모 평준화를 희생하여 이 애플리케이션에 대한 쓰기 액세스 트래핑을 비활성화할 수 있습니다.
5.2 읽기 액세스 샘플링
읽기 액세스의 통계적 근사치를 기록하기 위해 앞에서 설명한 것과 동일한 두 단계를 따릅니다. 먼저 테마 메모리 버스에 대한 읽기 액세스를 계산하는 아키텍처 성능 카운터를 설정합니다.
성능 카운터 값 C를 수동으로 최대값 Cmax =232 − 1에서 구성 가능한 샘플링 속도 Creadsample을 뺀 값으로 카운터가 오버플로될 때마다 설정하면 모든 Creadsample 읽기 액세스에 대해 오버플로 트랩이 생성됩니다.
오버플로를 처리하는 동안 관찰된 모든 메모리 페이지의 테마 권한을 NO_ACCESS로 설정하여 읽기 및 쓰기 액세스에 대한 권한 위반 트랩이 발생합니다. 이 위반 트랩은 다음 읽기 액세스 대상을 기록하는 데 활용됩니다.
트랩 처리 중에 실행을 계속할 수 있도록 메모리 권한이 복원됩니다. 결과적으로 이 메커니즘은 Creadsample 읽기가 액세스할 때마다 현재 읽기 주소를 샘플링하게 됩니다.

테스트 시스템에서는 읽기 근사치가 쓰기 근사치와 함께 사용됩니다. 결과적으로 두 방법 모두 후속 메모리 액세스를 트랩하기 위해 메모리 권한 시스템을 사용하기 때문에 서로 간섭합니다. 쓰기 근사치는 READ_ONLY 권한만 사용하므로 읽기 액세스는 계속 진행되고 읽기 근사치는 방해받지 않습니다.
이와 대조적으로 읽기 근사치는 NO_ACCESS 권한을 사용하므로 현재 쓰기 근사치에 대한 샘플이 기록되지 않아도 후속 쓰기 액세스로 인해 권한 위반 트랩이 발생합니다.
이를 위해서는 이러한 쓰기 트랩을 무시하기 위해 두 근사치 간의 긴밀한 협력이 필요합니다. 그러나 읽기 근사기가 읽기 샘플을 기록하는 것을 목표로 하지만 다음 메모리 액세스가 쓰기 액세스인 경우 실행을 계속하고 최종적으로 읽기 요청에 도달하려면 쓰기 액세스가 완료되어야 합니다. 쓰기 액세스를 완료하려면 메모리 권한이 다음과 같아야 합니다. 다시 쓰기 액세스를 허용하도록 완화되었습니다.
다음 읽기 액세스를 계속 트랩하기 위해 쓰기 액세스가 완료된 후 메모리 권한을 다시 NO{0}}ACCESS로 설정하는 디버깅 메커니즘을 활용합니다. 따라서 쓰기 명령어 뒤의 명령어를 중단점 명령어로 대체합니다.3
쓰기 명령이 프로그램 카운터를 조작할 수 없는 한4 후속 명령의 실행이 보장됩니다. 그런 다음 중단점 핸들러는 중단점을 원래 명령어로 바꾸고 메모리 권한을 NO_ACCESS로 재설정한 다음 실행을 계속합니다.
5.2.1 명령어 실행 샘플링.
주 메모리에 대한 읽기 액세스가 근사화되면 컴파일된 소스 코드에 대한 명령 페치도 메모리 읽기 액세스이기 때문에 샘플링해야 합니다.
그러나 이전 메커니즘을 사용하면 메모리 권한을 수정한 트랩 핸들러에서 반환된 후 CPU가 가장 먼저 수행하는 작업이 다음 명령을 가져오기 때문에 명령 가져오기만 캡처됩니다.
따라서 텍스트 세그먼트에 대한 액세스만 읽기 근사치로 캡처됩니다. 이를 극복하기 위해 읽기 근사치에 대한 텍스트 섹션 페이지를 관찰하지 않으므로 이러한 페이지에 대한 권한을 수정하지 않습니다.
대신 성능 카운터(Creadsample)의 모든 오버플로에 대해 별도의 프로그램 카운터 샘플을 취하여 텍스트 세그먼트에 대한 별도의 독립적인 근사값을 얻습니다.

5.2.2 근사 스케일링.
이전에 지적했듯이 읽기 및 쓰기 근사치는 메모리 영역의 수명을 추정하는 데 사용되며 대략적인 마모 평준화 알고리즘에 적용됩니다.
노화 인식 마모 평준화 알고리즘의 품질을 유지하려면 쓰기 근사값에 따라 읽기 근사값을 조정하는 것이 필수적입니다. 읽기 근사치는 성능상의 이유로 쓰기 근사 Cwritesample과 다른 샘플 속도 Creadsample로 실행될 수 있습니다.
그러나 웨어 레벨링 알고리즘은 추정된 셀 수명만 입력으로 가져옵니다. 이는 읽기 파괴적이지 않은 NVM에 대한 쓰기 근사치이고 읽기 파괴적인 NVM에 대한 읽기 근사치와 쓰기 근사치입니다. 따라서 읽기 및 쓰기 근사값은 동일한 가중치를 가져야 합니다.
스케일링된 읽기 근사치는 다음과 같은 방법으로 계산할 수 있습니다. 웨어레벨링 알고리즘에 제출하기 전에 읽기 근사치와 곱해야 하는 필수 스케일링 계수 x는 방정식(1)에 따라 계산됩니다.
X=CreadsampleCwritesample(1)
5.3 대략적인 마모 평준화 알고리즘
액세스 분포 근사법을 사용하면 임의의 노화 인식 마모 평준화 알고리즘이 가능합니다. 읽기 액세스는 쓰기 액세스와 동일한 파괴적인 영향을 미치기 때문에 알고리즘은 읽기 파괴적인 NVM에서 실행 중인지 여부를 인식할 필요가 없습니다.
따라서 알고리즘은 읽기 및 쓰기 액세스의 합으로 계산되는 연령을 입력으로 사용할 수 있습니다. 우리는 각 페이지의 수명을 추정하는 접근 근사치의 지표를 알고리즘에 제공합니다. 근사 시스템은 가상 메모리에서만 작동하며 실제 메모리 페이지에 대한 매핑은 고려하지 않습니다. 이는 마모 평준화 알고리즘 자체에 의해 유지됩니다.
웨어 레벨링 알고리즘은 어떤 가상 메모리 페이지를 다른 물리적 메모리 페이지로 재배치할지 결정하여 물리적 메모리의 전체 수명을 유지합니다. 그러나 근사 시스템과 웨어 레벨링 알고리즘 간의 인터페이스가 잘 정의되어야 합니다. 우리는 중복적으로 저장된 데이터를 줄이기 위해 근사 구현과 함께 마모 평준화 알고리즘을 더욱 인터리브합니다.
우리의 마모 평준화 알고리즘은 레드-블랙 트리를 사용하여 관리되는 모든 물리적 메모리 페이지와 예상 수명을 유지합니다[10]. 추정 연령은 이미 트리 노드 내부에 존재하므로 근사 구현에서도 이러한 값을 저장할 필요가 없습니다.
트리는 섹션 5.3.1에 설명되어 있습니다. 각 페이지는 추정연령에 맞춰 트리에 저장되므로 가장 어린 페이지에 대한 조회 및 추출이 효율적으로 가능하다.
근사화 시스템은 가상 메모리 페이지당 임시 읽기 및 쓰기 카운터를 유지하고 이러한 카운터 중 하나가 특정 임계값을 초과하는 경우 수명 증분 작업으로 마모 평준화 알고리즘에 알립니다. 결과적으로 마모 평준화 알고리즘은 내부 수명 값을 늘리고 실제 메모리 콘텐츠를 다른 페이지로 재배치합니다.
5.3.1 메모리 페이지 관리.
가상 메모리 페이지를 다른 물리적 메모리 페이지로 재배치해야 할 때마다 현재 최소값(즉, 추정 수명이 가장 낮은 물리적 메모리 페이지)이 트리에서 대상 물리적 페이지로 추출되고 이에 따라 예상 수명이 조정됩니다.
웨어 레벨링의 희생양으로 가장 어린 페이지를 선택하면 점진적인 웨어 레벨링이 발생하여 일정 시간이 지나면 모든 페이지가 가장 어린 페이지가 됩니다.
오버헤드와 관련하여 마모 평준화 알고리즘은 메모리 페이지를 재배치해야 하는 경우에만 이 설정에서 호출됩니다. 마모 수준 결정의 선택 정책과 관련하여 모든 물리적 페이지의 추정 수명은 시간이 지남에 따라 균등하게 균형을 이룹니다. 모든 페이지가 특정 시간에 현재 최소 페이지가 되기 때문입니다.
이는 무상태 증분 마모 레벨링을 설정하며, 메모리는 언제든지 마모 레벨이 있는 것으로 가정되고 마모 레벨이 유지됩니다. 따라서 시스템은 전원 주기 전체에 걸쳐 수명을 저장할 필요가 없습니다.
액세스 근사의 데이터 구조와 마모 평준화 알고리즘 자체는 특별한 구현이 필요한 마모 평준화 자체의 대상이 되어야 합니다.
그러나 이러한 기술적인 세부 사항은 이 작업의 범위를 벗어납니다. 결국 마모 평준화 알고리즘과 근사 시스템의 이러한 통합은 쓰기 횟수 근사치의 시간적 및 공간적 세분성, 즉 임계값 유물 외에 추가 구성 매개변수로 이어집니다. 그 후에 예상되는 쓰기 또는 읽기 수를 할당해야 합니다.

이 구성 매개변수는 액세스 근사화의 품질에 영향을 주지 않고 페이지 재배치 오버헤드와 빈도, 각각 결과적인 마모 평준화 작업 품질 간의 균형을 제공합니다.
For more information:1950477648nn@gmail.com






