췌장암(pancreatic cancer)은 가장 치명적인 암 중 하나로서, 암종별 사망률은 국내 4위, 미국 3위에 이른다.1) 초기 증상이 없어 조기 진단이 어렵고 효과적인 스크리닝 방법이 부재하여, 5년 생존률이 약 2~9%에 불과하다. 저산소증은 췌장암 미세환경의 대표적 특징으로 염증성 미세환경을 회피하고 면역원성을 낮추어 자연살해세포, CD4+ T세포, CD8+ T세포, M1 대식세포 및 수지상세포와 같은 염증 유발 세포의 국소 침투를 방해한다. 또한, pembrolizumab의 치료예측 마커로 알려진 microsatellite instability (MSI) 상승 또는 DNA mismatch repair (dMMR) 결손의 분자 변이는 췌장암에서 약 1~3%로 나타나며, 대장암(10.2%)이나 자궁내막암(21.9%)에 비하여 낮다.2) 따라서, 췌장암의 분자적 변이에 관한 이해에 기반하여 효과적으로 진단, 예후예측 및 치료 타겟을 제시할 수 있는 분자마커의 개발이 여전히 요구되고 있다.
인간 유전체의 약 98%에 이르는 non-coding RNA3)에 관한 연구는 암의 발병과정에 대한 이해를 높일 뿐만 아니라, 진단 및 치료 기술 개발의 가능성을 높이고 있다. MicroRNA는 20-24개의 뉴클레오타이드로서, 세포 내 타겟 유전자의 mRNA 분해나 번역 억제 등을 유도할 뿐만 아니라 exosome 형태로 분비되어 plasma/serum 중에서 발견되기도 한다.4) miR-21, miR-155, miR-221/222 등은 잘 알려진 oncomiRs이다.3) Long non-coding RNAs (lncRNAs)는 200개 이상의 뉴클레오타이드로서, 전사 및 후성유전체 수준에서 유전자 발현, mRNA 가공, 전사 후 단백질 수식, 세포 신호 등을 조절한다.5) Prostate cancer antigen 3 (PCA3)는 정상 전립선 조직 대비 전립선 암에서 발현이 높은 lncRNA로서, 소변 중의 PCA3 양 측정은 반복적인 전립선암 생검의 부담을 감소시킬 수 있었다. 난소 종양에서 발현량이 높은 lncRNA인 HOX Transcript Antisense RNA(HOTAIR)는 난소암 환자에서 carboplatin 저항성을 예측하는데 유용하였다.6-7)
다유전자 기반의 예후예측 모델은 복합 질환의 메커니즘과 다양한 생물학적 경로를 포괄하여 반영하기 때문에 단일 유전자를 이용하는 경우보다 정확도와 신뢰도를 향상시킬 수 있으며, 정밀화된 치료 결정을 가능하게 할 수 있다.8) 최근 췌장암에서 microRNA 또는 lncRNA 기반 예후예측 위험 모델들이 보고되고 있으나, 이러한 연구들에 대한 종합적 고찰은 부재하다. 본 리뷰에서는 췌장암에서 lncRNA 또는 microRNA 기반 예후예측위험 모델 개발에 사용된 데이터 소스, lncRNA/microRNA 지문의 특성, 분석법과 성능을 비교하여 각 위험 모델의 임상적 유용성을 확인하고자 하였다. 또한, 면역 점수 및 약물 반응성과 관련된 위험 모델을 고찰하여 치료적 유용성을 검토하고자 하였다.
췌장암에서 다중 lncRNA/microRNA 기반 예후예측 위험모델에 관한 연구 논문을 선정하기 위하여 pubmed에서 pancreatic cancer AND prognosis AND risk model AND transcriptomic으로 검색한 결과 150개의 논문이 도출되었다(2024년 2월). 이 중 review나 meta-analysis를 제외하였으며, 예후와 관련된 단일 유전자를 연구한 논문을 제외하였다. 또한, mRNA나 single cell을 이용한 연구는 본 논문의 범위에 포함되지 않으므로 제외하였다. 최종적으로 여러 종류의 lncRNA와 microRNA로 예후예측 모델을 개발한 논문은 각각 10편1,9-17)과 3편18-20)이었다. 13편의 논문의 특징을 Table 1에 정리하였다.
Characteristics and performance of prognostic risk models
ncRNA signature of risk model | Number of ncRNAs | Training set | Validation set | Ref | |||
---|---|---|---|---|---|---|---|
Cohort | Performance | Cohort | Performance | ||||
Lnc RNA | m6A RNA methylation | 5 | TCGA (178) |
|
ICGC (82) |
|
1 |
m5C RNA methylation | 8 | TCGA (177) |
|
TCGAA group (88) |
|
9 | |
TCGAB group (88) |
|
||||||
m6A/m5C/m1A RNA methylation | 7 | TCGA (89) |
|
TCGA (88) |
|
10 | |
TCGA (177) |
|
||||||
PANoptosis | 6 | TCGA (89) |
|
TCGA (89) |
|
11 | |
TCGA (178) |
|
||||||
Cuproptosis | 6 | TCGA (89) |
|
TCGA (89) |
|
12 | |
TCGA (178) |
|
||||||
EMT | 11 | TCGA (125) |
|
TCGA (52) |
|
13 | |
TCGA (177) |
|
||||||
Oxidative stress | 6 | TCGA (84) |
|
TCGA (81) |
|
14 | |
TCGA (165) |
|
||||||
ICGC-PACA-CA (90) |
|
||||||
Immune | 9 | TCGA (88) |
|
TCGA (88) |
|
15 | |
TCGA (176) |
|
||||||
Genomic instability | 6 | TCGA (87) |
|
TCGA (84) |
|
16 | |
TCGA (171) |
|
||||||
Tumor vs Normal | 3 | TCGA (177) |
|
None | -None | 17 | |
Micro RNA | Prognosis | 7 | TCGA (172) |
|
None | -None | 18 |
Prognosis | 8 | TCGA (146) |
|
GSE 62498 (69) |
|
19 | |
Postoperative recurrence | 3 | FFPE sample (221) |
|
None | -None | 20 |
*: Dataset unspecified
The Cancer Genome Atlas Program (TCGA) 데이터에는 33개 암종의 유전체, 후성유전체, 전사체 및 단백체 정보가 포함되어 있다.21) TCGA-pancreatic adenocarcinoma (PAAD) 데이터 세트는 총 185 케이스의 샘플과 임상 정보로 구성되어 있으며, 178 케이스의 전사체 프로파일과 185 케이스의 simple nucleotide variation 데이터를 포함하고 있다. TCGA-PAAD 외에 International Cancer Genome Consortium (ICGC) 데이터도 췌장암 환자의 임상 및 전사체 정보를 제공하고 있다(ICGC-PACA-AU, ICGCPACA-CA).22) 1편의 연구를 제외한 모든 연구에서 TCGA-PAAD 데이터 세트를 이용하였으며, 일부 연구에서는 생존기간 정보가 없거나 일정 기간(1~6개월) 이하인 케이스를 제외하고 사용하였다. ICGC의 췌장암 데이터세트는 Yuan et al.이 82 케이스, Huang et al.이 90 케이스의 정보를 이용하였다.1,14) GSE62498에 포함된 69명의 pancreatic ductal adenocarcinoma 환자의 miRNA 프로파일과 임상정보도 연구에 활용되었다.19)
Genotype-Tissue Expression (GTEx) Portal에는 정상 췌장 조직의 데이터가, TCGA-PAAD 데이터에는 종양주변 정상조직 정보가 공개되어 있다.21,23) 대부분의 연구에서 GTEx 또는 TCGAPAAD 정상조직 데이터를 이용하였으며, 이들 데이터를 이용하지 않은 연구는 2건15,21)이었다.
신선냉동조직 또는 포르말린 고정 파라핀 포매(Formalin Fixed Paraffin Embedded, FFPE) 샘플을 이용한 연구는 3건이었다. Gao et al.과 Xia et al.은 각각 10쌍과 19쌍의 종양 및 종양 주변 정상조직의 신선냉동조직을 이용하여 후보 lncRNA들의 발현량을 비교하였다.13,16) Lee et al.은 신선냉동조직과 FFPE 조직에서 miRNA 발현의 상관성을 관찰한 후, FFPE 조직의 miRNA 발현량과 임상 정보를 이용하여 위험모델을 구축하였다.20)
위험모델 구축에 사용된 lncRNA는 암의 다양한 분자생물학적 특성과 관련된 유전자들과 공동 발현하는 lncRNA를 추출한 후, 독립적 예후예측 성능이 있는 lncRNA로 선정되었다. 3건의 연구는 RNA methylation과 관련된 lncRNA 지문을 이용하였다.1,9,10) RNA methylation 반응은 methyltransferase, demethylase, binding protein에 의해 조절되며, 주요 암에서 암세포의 성장, 전이, 약물저항성과 관련되어 있음이 알려져 있다. N6-methyladenine (m6A), 5-methylcytosine (m5C), N1-methyladenosine (m1A)은 대표적인 RNA methylation의 형태이다. Yuan et al.은 20개의 m6A 관련 유전자와 발현 상관성이 높은 lncRNA 중에서 독립적 예후예측 성능이 있는 5개의 lncRNA인 AC099850.3, UCA1, AP005233.2, AL513165.1, PTOV1-AS2를 이용하여 예후예측 모델을 구축하였다.1) Yu an e t al.은 13개의 m 5C r egu lator와 관련된 lncRNA를 발굴한 후 독립적 예후인자인 8개의 lncRNA (AC022098.1, AL031775.1, AC005332.6, AC096733.3, AC025165.1, CASC8, AC009974.1, PAN3-AS1)를 선정하여 위험모델에 이용하였다.9) 또한, m6A/m5C/m1A와 관련된 44종의 유전자와 관련된 lncRNA 중 7종의 lncRNA (SOCS2-AS1, LINC00941, UCA1, CASC8, TM4SF1-AS1, SNHG10, DNMBP-AS1)가 위험모델에 사용되었다.10)
조절된 세포사멸(regulated cell death) 기전과 관련된 예후예측 모델도 보고되었다. PANoptosis는 pyroptosis, apoptosis, necroptosis를 포함하는 염증성 조절된 세포사멸 기전으로서 종양 면역치료 반응과 관련되어 중요한 역할을 할 것으로 여겨진다. 문헌을 통해 PANoptosis와 관련된 24개의 유전자와 공동 발현하는 lncRNA 중에서 독립적으로 예후와 관련된 6개의 lncRNA(AC067817.2, LINC02004, AC243829.1, AC092171.5, AP005233.2, AC004687.1)가 위험모델 구축에 이용되었다.11) 또 다른 세포사멸 기전으로 cuproptosis는 과다한 copper 이온의 축적으로 인해 미토콘드리아 호흡사슬 저해되어 발생되며, copper 이온 감소는 PD-L1 분해를 통해 종양 성장을 억제할 것으로 제시되고 있다. Cuproptosis와 관련된 10개의 유전자와 공동 발현하는 6종의 lncRNA (AL117335.1, AC044849.1, AL358944.1, ZNF236-DT, Z97832.2, CASC8)가 독립적 예후예측 인자로 제시되었다.12)
Epithelial-mesenchymal transition (EMT)는 암의 진행 및 전이와 관련되어 잘 알려진 메커니즘이다. EMT와 관련된 1,184개의 유전자와 관련된 368개의 lncRNA가 도출되었으며, 최종적으로 11개의 lncRNA (CASC8, AC015660.1, SH3PXD2A-AS1, AC087501.4, LINC01133, AC009974.1, AC090114.2, TRAF3IP2-AS1, AC083841.1, PAN3-AS1, AC022098.1)가 EMT와 관련된 독립적 예후예측 lncRNA로 이용되었다.13) 또한 종양 조직에서 차별 발현하는 148개의 oxidative stress 관련 유전자와 연관 발현하는 lncRNA 중에서 6개의 lncRNA(AC008514.1, AP000695.2, C10orf5, GUSBP11, SLC2A1-AS1, UCA1)가 위험모델 생성에 이용되었다.14)
특정 유전자 지문과 공동 발현하는 lncRNA를 이용하는 방법 외에도, 종양의 면역 점수 또는 유전체 불안정성(genomic instability) 점수에 기반하여 lncRNA를 발굴하는 연구도 보고되었다. Xia et al. 는 332개의 면역 관련 유전자의 발현량에 기반하여 single‐sample gene set enrichment analysis를 수행한 후, 면역 관련 유전자의 증폭과 관련성이 높은 9개의 lncRNA (AL138966.2, AL133520.1, AC142472.1, AC127024.5, AC116913.1, AC083880.1, AC124016.1, AC008443.5, AC092171.5)를 이용하여 위험모델을 구축하였다.15) Wei et al.는 각 환자들의 체세포 과돌연변이(somatic mutation) 점수를 산출한 후, 상위와 하위 각 25%를 유전체 불안정 그룹과 유전체 안정그룹으로 분류하였다.16) 그리고, 두 그룹에서 차별적으로 발현하는 lncRNA를 이용하여 유전체 불안정성 관련 lncRNA (AC015660.1, LYPLAL1-AS1, AC132938.2, AC069120.1, CASC8,AC104695.4)에 기반한 위험모델을 제시하였다.
그 외에도 정상조직 대비 종양조직에서 차별 발현되는 lncRNA17), 환자 예후와 관련된 microRNA18,19) (Zhuang et al. 2020; Dou D et al. 2018) 중에서 독립적 예후예측 성능이 있는 lncRNA 또는 microRNA로 구성된 위험 모델이 제시되었다. Lee et al.은 수술 후 재발과 관련된 microRNA 중에서 독립적 예후인자로 작용하는 3종의 microRNA (miR-194, miR-99a, miR-1276)를 도출하였다.20)
Lee et al.을 제외한 모든 연구에서 TCGA-PAAD 데이터를 훈련세트로 이용하였다. 검증세트로 TCGA-PAAD 이외의 데이터(ICGC1,14), GSE6249819)를 이용한 연구는 3건에 불과하였다. 대부분의 연구에서 TCGA-PAAD 케이스를 훈련세트와 검증세트로 나눈 후, 훈련세트를 이용하여 위험 모델을 개발하였으며, 검증 세트와 전체 세트에서 위험 모델의 성능을 검증하였다. 검증세트를 사용하지 않는 연구는 3편이었다.17,18,20) 각 모델의 성능은 Kaplan-Meier plot의 유의성, hazard ratio (HR), ROC 곡선(receiver operating characteristic curve)의 AUC (Area Under ROC)값 등으로 제시되었다. 각 예후예측 위험모델에서 고위험군의 HR은 검증 세트의 경우 약 1.04~3.11로 다양하였으며, 그 결과는 Table 1에 정리되었다.
췌장암에서 종양 면역상태를 반영하는 지표를 개발하는 것은 면역항암제의 효력 개선을 위하여 매우 중요하다. 일부 연구에서는 개발된 예후예측 모델과 종양면역 상태 및 종양조직 변이부담(Tumor Mutational Burden, TMB)과의 관련성 여부가 생물정보학적 방법으로 분석되었다(Table 2). 종양면역 상태는 CIBERSORT, ESTIMATE, TIDE 알고리즘 등이 이용되었다.24-26) 구체적으로, CIBERSORT는 Cell-type Identification By Estimating Relative Subsets Of RNA Transcripts의 약어로 면역세포의 마커유전자 발현에 기반하여 침투한 면역세포의 비율 정보를 제공한다. ESTIMATE는 Estimation of STromal and Immune cells in MAlignant Tumour tissues using Expression data의 약어로 기질세포 및 면역세포의 유전자 발현 프로파일을 근거로 종양 중 두 유형의 세포량과 암 조직의 순도를 분석한다. TIDE는 Tumor Immune Dysfunction and Exclusion의 약어로 종양 내 T 세포의 기능장애(dysfunction)와 배재(exclusion)를 평가하며, 면역관문억 제제에 대한 반응성을 예측한다.
lncRNA/microRNA-based prognostic risk models related with immune status, tumor mutational burden, and drug sensitivity
ncRNA signature of risk model | Immune status | Tumor mutational burden | Drug sensitivity | Ref |
---|---|---|---|---|
m6A RNA methylation | ○ | 1 | ||
m5C RNA methylation | ○ | 9 | ||
m6A/m5C/m1A RNA methylation | ○ | ○ | ○ | 10 |
PANoptosis | ○ | ○ | ○ | 11 |
Cuproptosis | ○ | ○ | ○ | 12 |
EMT | ○ | 13 | ||
Oxidative stress | ○ | ○ | 14 | |
Immune | ○ | 15 | ||
Genomic instability | ○ | ○ | ○ | 16 |
RNA m5C, RNA m6A/m5C/m1A, RNA m6A, PANoptosis, Cuproptosis, EMT, 면역 점수, 유전체 불안정성, oxidative stress와 관련된 위험 모델은 종양 면역 상태 및 종양 내 면역세포의 차별적 활성화와 관련되어 있었다.1,9-16) 또한 이들 중 5건의 위험 모델은 종양 조직변이부담과도 관련되었다.10-12,15,16)
또한, 각 위험모델로 도출된 환자군에 대한 추천 약물이 pRRophetic 알고리즘 등을 이용하여 제시되기도 하였다.10-12,16) pRRophetic은 대규모 암 세포주의 유전자 발현과 약물 반응성 데이터를 이용하여 구축한 통계모델을 기반으로 환자 종양조직의 유전자 발현 데이터에 근거한 약물반응성을 예측한다.27) 각 위험모델의 고위험군과 저위험군의 전사체 특성에 기반하여 낮은 IC50를 나타낼 것으로 예상되는 약물들을 Table 3에 요약하였다.
Prediction of drug sensitivity depending on lncRNA/microRNA-based prognostic risk models.
ncRNA signature of risk model | Sensitive to high-risk group | Sensitive to low-risk group | Ref |
---|---|---|---|
m6A/m5C/m1A RNA methylation | Lapatinib, Epothilone, and Paclitaxel | Pazopanib, Phenformin, Ruxolitinib | 10 |
PANoptosis | MEK inhibitors PD-0325901, Gefitinib, Paclitaxel, and Trametinib | All-trans retinoic acid, Rac family small GTPases inhibitor EHT 1864 and Phenformin | 11 |
Cuproptosis | Bicalutamide, Epothilone.B, Lapatinib, Paclitaxel, Sorafenib | Lenalidomide, Metformin, Nilotinib, Pazopanib, Temsirolimus | 12 |
Genomic instability | BI.2536, BIBW2992, Bicalutamide, FTI.277, GW843682X, Paclitaxel, PLX4720, Thapsigargin | - | 16 |
암의 유전자 발현 특성에 기인한 다양한 예후예측 모델을 개발하는 연구들의 궁극적인 목표는 현재의 임상적 불충족 수요에 부응하며, 치료적 결정에 도움을 주는 잘 검증된 유전자 지문을 개발하는 것이다.24) 이를 위해서는 적절한 연구 디자인과 독립적 데이터 세트를 이용한 예후 모델의 통계적 검증이 필수적으로 요구된다.28) 췌장암에서 lncRNA/microRNA를 이용한 예후예측 모델에 관한 연구 디자인은 일련의 후보 lncRNA/microRNA의 발굴, univariate COX regression, Lasso regression, multivariate COX regression, Kaplan-Meier estimate을 이용한 생존 분석 수행으로 구성되었다. 후보 유전자를 선택하는 과정은 위험모델의 특성에 따라 매우 다양하였다. 반면, 대부분의 연구에서 위험모델 개발에 TCGA-PAAD 데이터 세트를 이용한 한계점이 있었다. TCGA-PAAD의 케이스 수는 TCGA의 다른 암종에 비하면 적은 편이며, ICGC나 GSE 데이터와 같이 독립된 데이터 세트를 이용하여 위험모델을 검증한 연구도 많지 않았다. 이는 췌장암의 낮은 빈도, 샘플 채취의 어려움에 따른 공개 데이터의 제한에 기인한 것으로 생각된다. 따라서, 현재까지 개발된 위험모델들은 향후 췌장암 데이터셋의 확보와 함께 추가적 검증이 필요하다.
예후 모델로 도출한 위험 그룹에 대해 적절한 치료적 대안이 제시되는 것은 모델의 유용성 측면에서 매우 중요하다. 현재의 치료에 대한 반응성이 분류되지 않은 환자들을 더 정확하게 분류하거나, 새로운 치료에 반응성이 높은 환자군을 식별하는 예후 마커는 매우 유용할 수 있다. 췌장암에서 개발된 예후예측 모델이 췌장암의 면역 상태에 대한 정보를 제시할 수 있다면, 췌장암의 면역항암제에 반응성이 있는 환자를 구분하고 개인화된 면역 치료법을 설계할 가능성을 제공할 수 있으므로 임상적으로 매우 유용할 것이다. 현재 각 위험모델에서 생물정보학적 분석으로 도출된 면역 점수 및 약물 반응성 예측결과들은 다양한 실험모델에서 검증될 필요성이 있다.
다양한 생물정보학적 도구들의 발전으로 다중 유전자 기반 바이오마커 발굴이 가속화되고 있다. 공개된 데이터를 활용하여 보다 다양한 유전자 서명의 예후예측 성능을 평가하고, 치료법 선택에 대한 개선을 점검해 볼 수 있다. 이러한 연구는 보다 확장된 코호트에서의 검증 또는 전향적 연구를 통하여 췌장암의 관리와 치료에 기여할 수 있을 것이다.
이 논문은 2022년도 충남대학교 학술연구비 지원에 의하여 작성된 것입니다.
모든 저자는 이해 상충을 가지고 있지 않음을 선언한다.
Ting Ting Chung : Graduate student
Seung Jin Lee : Associate professor