QPCR과 RNA‑seq의 비교를 통해 HLA 발현 정량화의 어려움이 드러남 파트 2
May 25, 2023
표준화
Salmon이 생성한 표준 정규화이며 샘플에서 주어진 전사체의 상대적인 양에 해당하는 TPM(transcripts per million)에서 표현 추정치를 사용했습니다. 주어진 유전자에 대해 추정치는 단순히 전사체에 대한 TPM의 합계입니다. 경우에 따라 표준 정규 변환 추정치를 표시할 때 GenABEL R 패키지(Aulchenko et al. 2007)를 사용하여 RNAseq 데이터의 순위 정규 변환을 수행했는데, 이는 예를 들어 eQTL 매핑의 선형 모델(Delaneau 외 2017).
QTL 매핑은 집단에서 유전자 발현과 유전자 다형성 간의 연관성을 비교하여 유전자 발현의 조절 메커니즘을 연구하는 방법입니다. 선형 모델은 일반적으로 사용되는 eQTL 매핑 방법으로 선형 회귀 모델을 사용하여 유전자 발현과 유전자 다형성 간의 상관 관계를 추정할 수 있습니다.
면역 체계는 암과 같은 감염 및 질병으로부터 신체를 보호하는 복잡한 생물학적 시스템입니다. 유전자 발현의 조절은 면역 체계에서 중요한 역할을 하며 면역 세포의 발달, 분화 및 기능에 영향을 미칠 수 있습니다.
따라서 eQTL 매핑의 선형 모델을 사용하여 유전자 발현 조절 메커니즘과 면역 간의 관계를 분석할 수 있습니다. 예를 들어, 모집단에서 특정 유전자형과 주요 면역 유전자의 발현 사이의 상관관계를 연구하면 면역 유전자 발현 조절에 있어 이 유전자형의 영향을 밝힐 수 있습니다. 이러한 연구는 면역 질환의 치료 및 예방에 중요한 계몽을 제공할 수 있습니다. 이것은 면역력의 중요성을 보여주므로 우리는 매일매일 면역력을 향상시켜야 합니다. 다진 고기는 또한 항 바이러스, 항암 및 기타 효과가있어 면역력을 강화할 수 있습니다. 신체의 면역력에 저항하고 향상시키는 시스템의 능력.

참조 게놈에 대한 읽기 정렬
그림 S7에 보고된 HLA 유전자의 읽기 범위 분석을 위해 Gencode v37 유전자 주석을 사용하여 참조 게놈 GRCh38에 대한 읽기를 STAR v2.7.3a(Dobin et al. 2013)와 정렬했습니다. HLA 유전자의 매핑 바이어스를 제어하기 위해 hlamapper v4.3으로 BAM 파일을 추가로 처리했습니다(Castelli et al. 2018).
시뮬레이션
실측 데이터
시뮬레이션 데이터를 생성하기 위해 먼저 실제 샘플 #66K00003에서 Salmon v1.3.0(Patro et al. 2017)을 실행하여 Gencode v37 전사의 표현 수준을 학습했습니다. 그런 다음 Polyester 패키지(v1.26.0)를 사용하여 HLA-A, -B 및 -C를 제외하고 전사체 전체 발현 수준이 동일한 50개의 합성 샘플을 생성했습니다. 이 유전자의 발현 수준은 실제 데이터(HLA 대립유전자 데이터가 있음)에서 무작위로 선택된 50명의 개체를 기반으로 합니다. 각 HLA 유전자에 대해 실제 데이터 세트(유전자당 1개의 전사만 생성됨)에서 실행한 Salmon에서 전체 단백질 코딩 전사 발현의 최소 90%를 차지하는 이소형을 선택하고 다음과 같은 전사 서열을 개인화했습니다. 각 개체에 의해 운반되는 HLA 대립유전자.
이 절차를 통해 우리는 동일한 배경 발현 수준을 가진 50명의 개인을 합성적으로 생성할 수 있었지만 가변 HLA 발현과 시뮬레이션된 읽기에 내장된 HLA 다형성이 있습니다.
실제 데이터를 미러링하기 위해 다른 폴리에스테르 매개변수(예: 단편 길이의 표준 편차=25 bp, 오류율=0.005, 균일한 읽기 분포, 편향 없음). 폴리에스터는 FASTA 파일을 출력하며, 여기에서 일정한 품질 점수(해당 기호 "F")로 FASTQ 파일을 생성했습니다.
정확도 측정항목
TPM은 전사 길이와 평균 조각 크기가 261bp인 경우 시뮬레이션된 카운트에서 계산되었습니다. "추정된 TPM/진정한 TPM" 비율은 시뮬레이션된 표현 수준을 복구하는 성능을 평가하는 데 사용되며 하향 또는 과대 평가를 관찰할 수 있습니다.
제도법
R에서 ggplot2 패키지 v3.3.2(Wickham 2016)를 사용하여 이 기사의 모든 플롯을 준비했습니다.

결과
RNA‑seq HLA 정량화의 정확도
RNA-seq 데이터로부터 HLA 발현 정량화를 위한 실험적 황금 표준으로 간주될 수 있는 방법이 없다는 점을 감안하여, 우리는 초기에 실제 발현 수준이 생성되기 때문에 알려진 시뮬레이션 데이터를 사용하여 HLA에 대한 RNA-seq 정량화 방법의 정확성을 평가했습니다. 컴퓨터에서 실제 실험을 에뮬레이트합니다. 이는 RNA-seq 기반 방법 중에서 최상의 계산적 접근 방식을 선택하여 non-RNA-seq 접근 방식과의 후속 대조를 허용하기 위해 수행되었습니다.
우리는 Polyester 패키지를 사용하여 50명의 개인에 대한 RNA-seq 실험을 시뮬레이션했습니다(Frazee et al. 2015). 이러한 합성 개체는 HLA-A, -B 및 -C를 제외하고 게놈의 모든 유전자에 대해 동일한 발현 수준을 가지며 발현 수준을 변경했습니다. 우리는 또한 Gencode v37에서 주석이 달린 HLA 전사체 서열을 개인화하여 96명의 개인 데이터 세트(아래에 설명된 Sanger 시퀀싱에 의해 HLA 유전자형이 지정됨)에서 무작위로 선택된 개인에서 관찰된 실제 유전 변이를 도입했습니다. 생성된 개인화 전사체는 모든 HLA 유전자좌에 대해 95%보다 큰 기준으로 중간 서열 동일성을 가졌습니다.
두 가지 생물정보학적 방법으로 얻은 HLA 발현 추정치를 비교했습니다. Salmon도 사용하지만 개인의 HLA 유전자형을 반영하여 읽기를 개인화된 HLA 성적표에 매핑합니다(그림 1). "맞춤형" 접근 방식은 개인이 보유한 각 대립유전자에 대한 단일 표준 코딩 시퀀스가 아닌 개인화된 전사를 사용하여 이전 전략(Aguiar et al. 2019)을 확장합니다.

"Ref transcriptome" 방법은 특히 참조 게놈과 관련된 서열 차이의 비율이 더 큰 대립유전자에 대해 발현 수준을 과소평가했습니다(그림 1). 이는 읽기와 참조 사이의 높은 불일치 비율이 정렬에 부정적인 영향을 미치기 때문에 예상됩니다(Brandt et al. 2015). 이 접근법은 또한 일부 개인의 HLA-C 발현을 과대평가했는데, 이는 HLA-B에서 읽은 결과가 HLA-C 참조 전사물에 매핑된 결과입니다(그림 S1). 반면에 "맞춤형" 접근 방식은 매핑 바이어스를 제어하고 최적의 정확도를 달성합니다.
우리의 시뮬레이션이 RNAseq를 사용한 HLA 발현의 정량화에 관한 고무적인 결과를 제공하지만 몇 가지 주의 사항을 고려해야 합니다. 우리는 주어진 HLA 유전자에서 모든 대립 유전자에 대한 단일 세트의 이소형을 사용하여 개인의 HLA 대립 유전자에 따라 주석이 달린 이소형의 서열을 수정했습니다. 이러한 시퀀스는 읽기 시뮬레이션과 표현의 정량화 모두에서 사용되었습니다. 따라서 최적의 정확도를 기대합니다. 실제 시나리오에서 다른 HLA 대립유전자는 다른 이소형과 연관될 수 있습니다. 이 백서의 뒷부분에서 우리는 HLA-A에 대해 관찰한 특정 예에 대해 논의하며 특정 이소형이 특정 대립유전자에만 배타적이라는 가설과 일치합니다. 그럼에도 불구하고 우리가 주로 유전자 수준 및 HLA 대립유전자 수준 발현 추정에 관심이 있다는 점을 감안할 때 개인화된 서열이 매핑 편향을 줄임으로써 단일 참조 전사체보다 개선을 나타낼 것으로 기대합니다.
실제 RNA‑seq 데이터에서 HLA 발현 추정
우리는 HLAA, -B 및 -C에 대한 qPCR과 HLA-C 표면 발현 수준이 이전에 추정된 96명의 개인에 대한 전체 전사체 RNA-seq 데이터에 대한 발현 추정을 수행했습니다(Kulkarni et al. 2013; Ramsuran et al. 2015, 2017), RNAseq 결과와 비교하는 데 사용할 수 있습니다(RNA-seq 데이터에 대한 QC 분석은 그림 S2 참조).
시뮬레이션에서 개인화된 접근 방식의 더 높은 정확도를 감안할 때, 우리는 이 RNA-seq 기반 발현 추정 방법을 다른 비 RNA-seq 접근 방식과 대조하지만 "보충 정보"에서 참조 transcriptome 기반 접근 방식에 대한 결과를 제공합니다. " 우리는 Sanger 시퀀싱으로 얻은 개별 HLA 유전자형이 주어진 전사 서열을 개인화했습니다. HLApers(Aguiar et al. 2019) 및 Kourami(Lee and Kingsford 2018)를 실행하여 RNA-seq 데이터에서 직접 대립유전자를 추론하고 Sanger 호출을 확인했습니다("재료 및 방법" 참조).
유전자 수준 발현 추정치는 HLA-B가 데이터 세트의 HLA 유전자좌 중에서 가장 높은 발현을 보였으며 HLA-C와 HLA-A가 그 뒤를 이었다(그림 2A). 이 순서는 GTEx 전혈 데이터 세트(GTEx Consortium 2020) 및 PBMC에 적용된 이전 HLA 캡처 RNAseq 방법(Yamamoto et al. 2020)과 일치합니다. 그러나 이 패턴은 Boegel et al(2018)이 관찰한 것과는 다릅니다. 그는 여러 유전자좌에 대한 읽기 매핑을 처리하기 위해 다른 전략을 사용하여 유전자 전체에서 유사한 수준을 관찰했으며, 이는 발현 수준 측면에서 유전자좌 간 구별 부족에 기여할 수 있습니다. ). 미래의 연구는 이러한 차이에 대한 방법론 또는 세포 유형 구성의 차이의 기여를 따로 분리해야 할 것입니다.

실제 데이터에서 RNA‑seq 및 qPCR 비교
다음으로 RNA-seq 발현 추정치를 qPCR로 얻은 것과 비교했습니다(그림 2B). RNA-seq과 qPCR 발현 간의 상관관계는 모든 유전자(p=0.024, 0.002, 0.000000016, HLA-A, -B 및 -C, 양의 연관성에 대한 Spearman의 테스트), 상관관계의 크기는 HLA-A 및 -B에서 보통이었고 -C에서 더 높았습니다. RNA-seq에 대한 개인화된 참조를 사용하면 표준 참조와 비교하여 qPCR과의 상관관계가 약간 증가했습니다(그림 S3). 이것은 유전자 수준 발현 추정치가 HLA 클래스 I 유전자에 대한 참조 게놈 기반 또는 개인화 접근법 간에 실질적으로 다르지 않다는 우리의 이전 관찰에 동의합니다(Aguiar et al. 2019). 아래에서 살펴보는 HLA 대립 유전자 수준. Salmon에서 편향 보정(GC 편향, 서열별 편향 및 위치별 편향)을 사용하면 qPCR과의 상관관계가 개선되고 HLA-B에 가장 큰 영향을 미칩니다(수정된 데이터와 수정되지 않은 데이터에 대해 그림 2B 및 S4 비교, 각기).

mRNA 수준과 표면 발현 비교
RNA 발현은 세포 신호 전달 및 자극에 대한 반응의 초기 단계에 대한 정보를 제공하기 때문에 다운스트림 분자 표현형(예: 세포 표면의 단백질 발현)과의 관계를 분석하면 전사 후 및 번역 후 조절의 역할을 이해하는 데 도움이 될 수 있습니다. HLA 발현. RNA와 단백질 풍부도의 차이는 서로 다른 조절 방식이 적용되기 때문에 예상됩니다. 기술적 효과는 또한 RNA 및 단백질 기술이 다르고 상관관계가 없는 오류 유형의 영향을 받기 때문에 차이를 가져올 수 있습니다(Li and Biggin 2015; Kaur et al. 2017; Carey et al. 2019). 또한, 본 연구의 경우 전체 PBMC에서 유전자 발현을 측정한 반면 분류된 CD3 플러스 세포에서 단백질 발현을 측정하였다. 이러한 차이를 염두에 두고 우리는 세포 표면의 HLA 단백질이 mRNA 발현에 의해 예측될 수 있는 정도를 측정했습니다. 이 분석은 동일한 친화도로 모든 대립유전자에 결합할 수 있는 항체가 이용 가능한 유일한 유전자좌이기 때문에 HLA-C에 대해서만 독점적으로 수행되었습니다. 흥미롭게도 HLAC에 대한 mRNA와 단백질 발현 사이에 높은 상관관계가 있었고 RNA-seq에 대한 상관관계가 약간 더 높았습니다(그림 2C).
HLA 대립유전자 수준 발현
HLA 유전자는 구성적 전사 및 동적으로 활성화된 전사와 관련된 조절 요소를 가지고 있습니다(René et al. 2016). 결과적으로 HLA 발현은 조직에 따라 다르며 다양한 자극에 의해 유발되는 규제 네트워크에 의해 조절될 수 있습니다(Anderson 2018; Carey et al. 2019). 별개의 HLA 대립유전자가 다른 기저 발현 수준 및 규제 프로그램과 관련이 있는지(Aguiar et al. 2019; Gutierrez-Arcelus et al. 2020), 그리고 이 변이가 질병 표현형 또는 이식 결과에 기여하는지(Petersdorf et al. 외 2014, 2015, René 외 2016, Bettens 외 2022, Johansson 외 2022). 따라서 qPCR과 RNA-seq에 대한 HLA 대립 유전자 수준 발현 추정치를 비교했습니다. 개별 대립유전자는 종종 데이터 세트에서 매우 드물기 때문에 대립유전자 계통(즉, 엑손의 관계에 의해 계통발생학적으로 정의되는 대립유전자 그룹)별로 그룹화했습니다(Elsner et al. 2002).
우리는 RNA-seq 및 qPCR 데이터를 기반으로 발현 수준에 따라 계보의 순위를 매겼고 여러 방법에 걸친 순위의 일치성을 평가했습니다(그림 3). 우리의 맞춤형 RNA-seq 접근법은 HLA 대립 유전자 서열이 정렬을 인덱싱하는 데 사용되기 때문에 대립 유전자 수준 추정치를 직접 제공하므로 중간 발현 수준에 따라 대립 유전자 계통을 주문했습니다. 우리의 qPCR 발현 추정치는 유전자 수준에 있고 대립유전자 수준 추정치를 직접 제공하지 않기 때문에 HLA 유전자형으로 설명되는 발현 수준의 선형 모델에서 그 효과에 따라 대립유전자 계통을 주문했습니다(Ramsuran et al. 2015 참조). 그림 3에서 개체의 각 allele에 대해 각 level별로 발현값을 2번 plot 하였고, qPCR의 경우 단순히 두 allele이 존재함을 반영하여 두 번 plot한 gene-level expression이다.

발현 추정치의 순서는 -A 및 -B보다 HLA-C에 대한 RNA-seq 및 qPCR 사이에서 더 유사합니다(평균 절대 차수 차이, 여기서 차수 차이는 발현 값의 순위 순서 내에서 관찰된 위치 차이를 나타냅니다. , RNA-seq와 qPCR 정량화 사이, HLA-C의 경우 2.3, -A의 경우 3.1, -B의 경우 3.9) HLA-C에 대한 RNA-seq와 qPCR 사이.
RNA-seq와 qPCR 사이에 가장 큰 차이가 있는 계보 중에는 A*11이 있습니다. 우리는 두 계통에 대해 동일한 친화도를 갖는 항체를 사용하여 A*03 또는 A*11에 대한 이형접합체의 하위 집합에서 표면 발현을 측정했으며 qPCR이 RNA-seq보다 이 두 알로타입의 세포 표면 발현과 더 강력하게 상관관계가 있음을 관찰했습니다(그림 1). S5). 다음으로 HLA mRNA 발현에 대한 이전 연구와의 비교를 통해 대립 유전자 순서에 대한 보다 광범위한 평가를 제시합니다.
HLA 대립유전자 간의 발현 차이를 비교하는 데 관심이 있지만, 다양한 연구에서 대립유전자 또는 대립유전자 혈통 내에서 발현의 변화가 종종 상당히 높고 다른 순위의 대립유전자 간의 차이는 종종 작고 중요하지 않다는 것을 보여줍니다. 결과적으로 여러 대립 유전자에 걸쳐 순위 유지를 기대하는 것은 비현실적일 수 있으며 표현의 극단에서 대립 유전자에 대한 표현 추정치를 비교하는 것이 더 나을 수 있습니다.
RNA-seq 데이터의 경우 PBMC에 대한 이전의 두 가지 HLA 맞춤형 RNA-seq 접근 방식과 추정치를 비교합니다. 전반적으로 Yamamoto et al.과 일치합니다. (2020), 여기서 A*24, A*02, C*04 및 C*06은 높게 표현되고 A*03, C*03 및 B*15는 낮은 수준으로 표현됩니다. qPCR 데이터와 더 일치하는 B*35의 경우. RNA-seq 데이터를 Johansson et al. (2021), 그러나 많은 혈통에 대한 샘플이 매우 적지만 더 많은 차이점을 볼 수 있습니다.
우리는 또한 우리의 결과를 대립유전자 특이적 프라이머를 적용한 두 개의 이전 qPCR 연구 결과와 대조합니다. Bettenset al. (2014)은 일부 HLAC 계통에 대해 대립유전자 특이적 프라이머를 사용했으며 C*04 및 C*06이 높게 발현되는 반면 C*07 및 C*03은 낮은 수준으로 발현되는 것으로 나타났습니다. 및 qPCR. Renéet al. (2015)는 HLA-A에 대해 대립유전자 특이적 프라이머를 적용했고 극한 발현에서 A*02(높음) 및 A*29(낮음)를 관찰했는데 이는 qPCR보다 RNAseq 결과와 더 일치합니다. 그러나 우리는 다른 대립 유전자 계통에서 많은 차이점을 봅니다.
경우에 따라 기능 연구와의 일치도 평가할 수 있습니다. 예를 들어, 전사 인자 결합 부위(TFBS) 및 프로모터 활성에 대한 이전 분석(Anderson 2018에서 검토) 및 miRNA 조절에 대한 연구(Kulkarni et al. 2011)는 C*03 및 C*07이 약하게 발현되는 대립 유전자임을 보여줍니다. 이는 RNA-seq 및 qPCR 모두에 대한 우리의 관찰과 일치합니다.
차이점의 잠재적 원인
우리는 다음으로 RNA-seq에 사용된 샘플의 처리가 qPCR과 RNA-seq로 얻은 발현 추정치의 차이에 기여할 수 있었는지 여부를 조사했습니다.
한 가지 구체적인 우려 사항은 샘플을 –80도 냉동고에 보관한 시간(qPCR과 RNA-seq 분석 사이에 약 4년)과 샘플 해동을 포함하여 RNA-seq 실험에 특정한 다른 단계였습니다. 이 문제를 해결하기 위해 우리는 이 연구에서 분석된 96명의 하위 집합인 11명의 개인에서 다시 채취한 신선한 혈액에 대해 두 번째 RNAseq 실험을 수행하고 두 시점 사이의 발현 추정치를 비교했습니다. 이 두 번째 분석은 첫 번째 RNA-seq 실험(그림 S6A 및 B)과 관련하여 기술적 및 생물학적 차이를 모두 가지고 있지만, 시점 간의 발현 추정치에서 전사체 전체의 상관관계는 높습니다(그림 S6C).
11명의 개인과의 상관관계를 평가하는 것이 시끄러울 수 있지만 HLA 유전자의 상관관계는 두 샘플 간의 가장 큰 유전자 상관관계 중 하나입니다(그림 S6D 및 F). 우리는 또한 heterozygous 개체의 두 HLA 대립 유전자 사이의 발현 비율인 개체 내 대립 유전자 비율을 계산하고 시점 간에 비교했습니다. 상관관계는 HLA-A, -B 및 -C에 대해 0.94보다 컸습니다(그림 S6E). 따라서 우리는 원본 샘플에서 RNA-seq와 qPCR 사이의 낮은 상관관계를 설명하기 위해 RNA 분해의 주요 기여에 대한 증거를 보지 못했습니다.
RNA-seq와 qPCR 간의 차이에 대한 또 다른 가능한 기여는 특정 HLA 대립유전자가 한 방법 또는 다른 방법에서 더 편향될 수 있으며, 이 경우 그러한 대립유전자를 보유하는 개인이 큰 차이에 기여할 수 있다는 것입니다. 예를 들어, A*03을 보유하는 개체 또는 C*07에 대한 동형접합체의 경우 qPCR과 RNA-seq 간에 음의 관계가 있습니다(그림 4A).

RNA-seq 접근 방식에서 모든 HLA 대립 유전자에 대해 모든 Gencode 주석이 달린 전사체를 개인화한다는 사실에서 방법 간의 추가 차이점이 발생할 수 있습니다. 그러나 진정한 전사 다양성과 특정 HLA 대립 유전자와의 연관성은 잘 알려져 있지 않습니다. 예를 들어, Kulkarni 외. (2017)은 A*01과 A*11이 더 짧은 3'-UTR을 생성함을 보여주었다. RNA-seq 데이터에서 해당 자금을 복제할 수 있는지 조사하기 위해 읽기를 참조 게놈에 매핑하고 hla-mapper를 사용하여 HLA 유전자의 매핑 편향을 수정했습니다(Castelli et al. 2018). 실제로 A*01 또는 A*11을 보유하는 개인의 경우 HLA-A의 3'-UTR에서 판독 범위가 주석이 달린 유전자 끝 전 ~120bp에서 급격히 감소합니다(그림 S7).

TPM(transcript per million) 값은 참조 길이를 고려하여 계산되기 때문에 실제 전사보다 긴 참조를 사용하면 표현이 과소 평가됩니다. 우리는 읽기 정렬을 위해 인덱스에 단축된 3'-UTR이 있는 각 HLA-A 전사 버전을 포함하여 이러한 짧은 전사의 가능성을 제어하려고 시도했습니다. 그러나 우리는 더 짧은 isoform의 발현에 대한 증거를 찾지 못했습니다(그림 S8). 아마도 이러한 더 짧은 isoform이 정상 길이 isoform에 포함되어 있고 Salmon의 구현이 모든 읽기를 더 큰 isoform에 할당하기 때문일 수 있습니다. 흥미롭게도, isoform 수준에서의 발현은 A*11에 독점적인 더 긴 5'-UTR을 가진 isoform을 나타내며, 이는 이 대립유전자에 대한 전체 발현의 큰 부분을 차지합니다(그림 S8).
우리는 또한 근위 또는 원위 3'-UTR 말단(판독 범위를 가중치로 사용하여 전사 길이의 가중 평균)을 지원하는 읽기 범위가 주어진 읽기 길이를 조정하는 표현 추정치의 정규화를 테스트했습니다. A*01 및/또는 A*11을 보유하는 개인의 발현 수준이 최대 20% 증가하는 것을 관찰했지만, 이 조정 후(rho=0에서) qPCR과의 상관 관계에서 약간의 개선만 보입니다. 도 2의 20 내지 도 4b의 rho=0.24).
A*01과 A*11은 RNA-seq와 qPCR 사이에 가장 큰 순위 차이가 있는 대립 유전자에 속하며(그림 3), 주석에서 관련 전사의 불완전한 표현은 RNA-seq 추정치에 편향을 유발할 수 있습니다.
마지막으로, 원시 qPCR 데이터에서 최종 발현 추정치를 얻는 데 사용되는 정규화 방법은 qPCR과 RNA-see 추정치 사이의 차이의 원인이 될 수도 있습니다. HLA Class I 유전자에 대한 정량적 PCR 분석은 일반적으로 엑손 1~4 내의 영역을 증폭하고 B2M(2-마이크로글로불린)과 같은 하우스키핑 유전자의 발현에 의한 표준화가 일반적으로 수행됩니다(본 연구의 경우와 동일). ). 이 절차의 이론적 근거는 표현 수준이 안정적으로 표현된 참조에 의해 표준화되는 경우 다른 개인에 대한 추정치가 동일한 척도에 놓이므로 개인 간 비교가 가능하다는 것입니다.
B2M은 HLA 클래스 I 분자의 경쇄를 인코딩하며, B2M과 HLA 클래스 I 유전자는 유사한 프로모터 구조를 공유하기 때문에 어느 정도 발현 조정이 있을 가능성이 있습니다(Kobayashi 및 van den Elsen 2{{1{{12} }}}12; Vijayan et al. 2019) 공유된 전사 인자에 의해 조절될 수 있습니다(예: NLRC5/CITA는 Jurkat 세포주에서 HLA 클래스 I 및 B2M 모두의 발현을 유도합니다(Meissner et al. 2{{20}}10) 상관 값에 의한 HLA 유전자 발현의 정규화는 특히 HLA-B의 경우 qPCR 추정치에 편향을 유발할 수 있으며, B2M 발현과의 상관관계(그림 4C). 다르지만 상관관계가 있는 변수로 변수를 스케일링하면 극단값을 분포의 중간으로 가져오고 분산을 줄임으로써 섭동이 발생할 수 있습니다. 이 가설과 일치하여 qPCR 데이터에 대한 변동 계수는 다음과 같습니다. HLA-A 및 -C의 경우 각각 0.61 및 0.50, HLA-B의 경우 0.17로 떨어짐(비교로 RNA-seq 데이터의 CV는 HLA-A, -B 및 -C의 경우 0.20, 0.14 및 0.29임 , 각각). 그러나 동일한 qPCR 설계를 사용하여 Ramsuran et al. (2017) B2M, GAPDH, 18s 및 b-Actin 유전자에 의한 HLA-B 발현을 정규화했으며 매우 일관된 결과를 관찰했으며 이는 qPCR 추정치에 대한 B2M 정규화의 영향을 지원하지 않습니다.
논의
HLA 전사체 발현의 신뢰할 수 있는 추정치는 다양한 연구 질문에 기여할 수 있으며 질병 결과가 HLA 코딩 변이의 맥락에서 자주 탐구되지만 발현 수준도 임상 결과의 변이를 설명할 가능성이 있습니다(Dendrou et al. 2018에서 검토됨; 요한슨 외 2022). 발현 수준은 또한 조혈 줄기 세포 이식을 계획할 때 결정을 내릴 수 있는 가능성이 있습니다. 예를 들어, 동종이계 공여자 선택에서 완벽한 일치를 사용할 수 없는 경우 낮은 발현 대립유전자에서 일치하지 않는 항목을 선택하는 것이 유익한 것으로 보입니다(Petersdorf et al. 2014, 2015). 신뢰할 수 있는 전사 발현 추정치는 HLA 발현 제어의 기초가 되는 eQTL을 식별하는 데 도움이 될 수 있으며, 이는 MHC 영역의 알려진 적중이 HLA 유전자에 대한 eQTL과 일치하는지 질의함으로써 GWAS 결과에 통합될 수 있습니다(예: 표 참조). Aguiar 등의 S6 2019). 보다 일반적으로, HLA 전사체 발현의 개선된 추정은 HLA 조절의 유전적 구조를 이해하는 데 도움이 될 것이며, cis-작용 변이체(즉, 그들이 조절하는 HLA 유전자 근처에 있는 변이체)와 거래 변이체(멀리 떨어져 있는 변이체)의 상대적 기여도를 식별하는 데 도움이 될 것입니다. 다른 염색체를 포함한 게놈 위치). 이는 HLA 발현의 변이가 대립유전자 고유 특성 대 대립유전자 정체성과 무관한 개체 간 특성의 정도에 관한 정보를 제공할 것입니다(Bettens et al. 2022 참조).
정량적 PCR 기술을 통해 HLA 발현과 질병 표현형 간의 연관성을 밝혀낼 수 있었습니다. 보다 최근에는 RNA-seq가 다양한 집단의 대규모 전체 전사체 데이터 세트에서 유전자 발현을 평가하기 위한 선택 방법이 되었습니다. 이러한 데이터에서 HLA 발현에 대한 정확한 정보를 추출할 수 있다는 것은 중요한 과제이며 이 목표를 달성하기 위해 많은 방법이 제안되었습니다. 그러나 RNA-seq 분석에서 나오는 결과가 qPCR을 사용하여 축적된 결과와 일치하는 정도는 현재 알려지지 않았습니다. 이러한 방법은 동일한 분자 표현형(RNA 풍부도)을 대상으로 하지만 사용된 실험 기술, 데이터 분석 및 정규화 형식, 생물정보학적 절차 및 적용되는 편향에서 현저하게 다릅니다.
우리가 아는 한, HLAtailored RNA-seq 접근법을 qPCR과 비교한 이전 연구에는 작은 샘플이 포함되었습니다. 예를 들어, Johansson et al. (2021) HLA-C에서 단 5개의 샘플에 대해 qPCR로 HLA 표적 RNA-seq를 검증하여 중요하지 않은 0.9의 Pearson 상관 계수에 자금을 지원했습니다(p=0.08). .
현재 연구에서 우리는 고전적인 HLA 클래스 I 유전자 HLA-A, -B 및 -C에 대한 정량적 PCR 및 RNA-seq 발현 추정치를 96명의 일치된 세트에서 비교했습니다. 우리는 96명의 개인 샘플에 대한 표현에서 겸손하지만 중요한 상관관계를 발견했습니다. 이러한 추정치를 비교할 황금 표준이 없다는 점을 감안할 때 두 방법과 관련된 추정 오류 및 편향이 전체 결과에 기여할 수 있습니다.
우리는 특정 HLA 대립유전자에 대한 낮은 발현 추정과 qPCR에서 단일 하우스키핑 유전자에 의한 정규화와 같이 RNA-seq와 qPCR 추정 사이의 낮은 상관관계를 설명할 수 있는 다양한 요인의 영향을 조사했습니다. 우리의 결과는 다양한 접근 방식이 있는 모든 qPCR 설계 또는 RNA-seq 파이프라인에 일반화될 수 없습니다. 그러나 우리가 아는 한, 이것은 HLA 발현 추정을 위한 qPCR과 RNA-seq 간의 첫 번째 직접 비교입니다.
우리의 연구는 HLA 전사 발현의 결정에서 개선이 필요한 영역을 제안합니다. 예를 들어, RNA-seq과 qPCR 간의 비교는 이러한 방법과 관련된 인공적인 차이를 제한하기 위해 방법(예: 동일한 RNA 분리 프로토콜, 보관/해동 시간, RNA 무결성)에 걸쳐 샘플의 균일한 처리를 사용해야 합니다. 짧은 판독을 단일 참조 게놈 또는 전사체에 매핑하면 편향이 발생하고 HLA 다형성을 설명하는 판독을 매핑하는 전략이 필요합니다. 이를 달성하기 위한 몇 가지 전략이 있다는 점을 감안할 때(Boegel et al. 2012; Lee et al. 2018; Aguiar et al. 2019; Gutierrez-Arcelus et al. 2020; Darby et al. 2020), 이러한 접근법의 상대적 정확도.
잘못된 전사 길이에 의한 판독 횟수의 정규화가 오류의 잠재적인 원인이기 때문에 또 다른 정보 계층을 제공할 뿐만 아니라 보다 정확한 발현 추정치를 제공하기 위해 동형 변형을 적절하게 설명하는 방법을 개발할 필요도 있습니다. 이러한 맥락에서 전체 전사 정보를 직접 생성하는 장기 읽기 데이터는 강력한 도구가 될 수 있습니다(Cornaby et al. 2022). 마지막으로, 특정 HLA 유전자좌(예: DRB)에 대해 알려진 특징인 복제 수 변이도 발현 수준을 정량화할 때 고려해야 합니다.
감사의 말
유용한 토론을 해주신 Tatiana Torres(상파울루 대학교), Yang Luo(하버드 의과대학) 및 보스턴의 Joint Biology Consortium 회원들에게 감사드립니다.
저자 기여
Diogo Meyer, Mary Carrington, Richard M. Single 및 Vitor RC Aguiar는 연구의 개념과 설계에 기여했습니다. 재료 준비, 데이터 수집 및 실험은 Maureen P. Martin, Veron Ramsuran, Smita Kulkarni, Arman Bashirova, Danillo G. Augusto 및 Mary Carrington이 수행했습니다. 데이터 분석은 Vitor RC Aguiar, Erick Castelli, Richard M. Single, Maria Gutierrez-Arcelus 및 Diogo Meyer가 수행했습니다. 원고는 Vitor RC Aguiar와 Diogo Meyer가 작성했습니다. 모든 저자는 최종 원고를 읽고, 기여하고, 승인했습니다.
펀딩
São Paulo Funding Agency(FAPESP, http://www.fapesp.br/en/)는 DM(2012/18010-0 및 2013/22007-7)과 VRCA(2014/{{ 5}} 및 2016/24734-1). 미국 국립보건원은 VRCA 포스트닥의 일부를 지원하는 DM(NIH R01 GM075091)에 자금을 제공했습니다. Conselho Nacional de Desenvolvimento Científco e Tecnológico(CNPq)와 브라질 보건부는 MC와 DM(470043/{{13} }). NIH/NIAID R01AI157850은 SK를 지원합니다. VR은 과학 기술부(DST)의 자금으로 남아프리카 의학 연구 위원회(SAMRC)에서 자금을 지원받았습니다. 또한 AAS의 DELTAS 아프리카 이니셔티브(Grant # DEL-15-006)인 TB/HIV Research Excellence(SANTHE)를 위한 사하라 이남 아프리카 네트워크를 통해 부분적으로 지원됩니다.
이 프로젝트는 계약 번호 HHSN261200800001E에 따라 Frederick National Laboratory for Cancer Research의 연방 기금으로 전체 또는 부분적으로 자금을 지원받았습니다. 이 간행물의 내용이 반드시 보건복지부의 견해나 정책을 반영하는 것은 아니며 상표명, 상업용 제품 또는 조직에 대한 언급이 미국 정부의 보증을 의미하지도 않습니다. 이 연구는 부분적으로 NIH의 교내 연구 프로그램, Frederick National Lab, Center for Cancer Research의 지원을 받았습니다.
데이터 가용성
현재 간행물에 제시된 RNA-seq 데이터는 dbGaP 액세스 phs003177.v1.p1에 따라 dbGaP 데이터베이스에 기탁되었으며 사용할 수 있습니다.
참조
1. Aguiar VRC, César J, Delaneau O, et al (2019) 개인화된 파이프라인으로 HLA 유전자에 대한 발현 추정 및 eQTL 매핑. PLoS Genet 15:e1008091.
2. Alcina A, Abad-Grau MDM, Fedetz M et al (2012) 다발성 경화증 위험 변이체 HLA-DRB1*1501은 다양한 인간 집단에서 높은 DRB1 유전자 발현과 관련이 있습니다. PLoS One 7:e29819.
3. Anderson SK(2018) HLA-C 발현을 제어하는 요소의 분자 진화: 자연 살해 세포 기능을 조절하는 킬러 세포 면역글로불린 유사 수용체 리간드 역할에 대한 적응. HLA 92:271–278.
4. Apps R, Meng Z, Del Prete GQ et al (2015) 정상 및 HIV 감염 세포에서 HLA 클래스 I 단백질의 상대적 발현 수준. J Immunol 194:3594–3600.
5. Apps R, Qi Y, Carlson JM, et al(2013) HIV 제어에 대한 HLA-C 발현 수준의 영향. 과학 340:87–91.
6. Arshad N, Laurent-Rolle M, Ahmed WS et al (2023) SARS-CoV-2 부속 단백질 ORF7a 및 ORF3a는 별개의 메커니즘을 사용하여 MHC-I 표면 발현을 하향 조절합니다. Proc Natl Acad Sci USA 120:e2208525120.
7. Aulchenko YS, Ripke S, Isaacs A, van Duijn CM (2007) GenABEL: 게놈 전체 연관 분석을 위한 R 라이브러리. Bioinformatics 23:1294–1296.
8. Bachtel ND, Umviligihozo G, Pickering S, et al (2018) HIV에 의한 HLA-C 하향 조절-1은 숙주 HLA 유전자형에 적응합니다. PLoS Pathog 14:e1007257.
9. Bettens F, Brunet L, Tiercy JM (2014) HLA-C mRNA 발현의 고 대립형질 가변성: HLA 확장 일배체형과의 연관성. Genes Immun 15:176–181.
10. Bettens F, Ongen H, Rey G et al (2022) 비코딩 유전자 변이에 의한 HLA 클래스 I 발현의 조절. PLoS Genet 18:e1010212
11. Boegel S, Bukur T, Castle JC, Sahin U(2018) 표준 RNA-Seq 판독에서 고전 및 비고전 HLA 대립 유전자의 In Silico 유형 지정. 방법 Mol Biol 1802:177–191.
For more information:1950477648nn@gmail.com






