bioinfo-statistics
단백질/ 유전자 - 질병 연관성이 인종에 따라 왜 달라지는지에 대해 본문
요약표

1. 대립유전자 빈도 차이 (Allele Frequency Differences)
- 설명: 단백질 발현이나 기능에 영향을 주는 유전 변이(예: 단백질 QTL, pQTL)의 빈도는 인종에 따라 크게 다릅니다.
- 영향: 어떤 유전 변이는 한 인종 집단에서는 흔하지만, 다른 집단에서는 드물거나 아예 존재하지 않을 수 있습니다. 이로 인해 MR 분석에서 해당 변이를 도구 변수로 사용할 수 있는 정도(=설명력, 파워)가 달라집니다.
- 예시: IL6 수치에 영향을 주는 pQTL이 유럽인에게는 흔하지만 동아시아인에게는 드물다면, 염증 질환에 대한 단백질의 인과성이 인종에 따라 다르게 나타날 수 있습니다.
2. 연관불균형 구조 차이 (Linkage Disequilibrium, LD Structure Differences)
- 설명: 서로 가까운 유전 변이들 간의 상관 구조(LD)는 인구의 역사(병목, 확산, 혼합 등)에 따라 인종마다 다르게 형성되어 있습니다.
- 영향: 특정 SNP가 한 인종에선 인과 변이와 강한 LD에 있어 유효한 도구 변수로 사용될 수 있지만, 다른 인종에서는 LD가 낮아 도구 변수로서의 정확성이 떨어지거나 방향이 바뀔 수 있습니다.
- 예시: LD 블록이 유럽인에서는 더 길고, 아프리카인에서는 더 짧기 때문에, 같은 유전자 영역에서 아프리카 집단은 더 높은 해상도로 인과 변이를 정밀하게 찾을 수 있습니다.
3. 인구 특이적인 pQTL (Population-Specific pQTLs)
- 설명: 어떤 단백질 수준을 조절하는 유전 변이는 특정 인종에서만 발견되거나, 통계적으로 유의미한 효과를 나타냅니다. 이는 자연 선택이나 유전적 부동(drift) 같은 진화적 압력에 의해 발생합니다.
- 영향: 어떤 단백질은 특정 인종에서만 질병과 인과적으로 연관되어 있는 것으로 보일 수 있으며, 이는 그 인종에만 존재하거나 유효한 pQTL이 있기 때문입니다.
- 예시: 면역 관련 단백질 분비에 영향을 주는 missense 변이가 한 인종에서 양성 선택을 받아 자가면역 질환 경로에 특이적인 영향을 줄 수 있습니다.
4. 효과 크기 이질성 (Effect Size Heterogeneity)
- 설명: 동일한 유전 변이가 여러 인종에서 공유되더라도, 단백질 수치에 미치는 효과의 크기는 인종에 따라 다를 수 있습니다. 이는 다른 유전자들과의 상호작용(에피스타시스)이나 유전자-환경 상호작용(GxE)에 의해 발생합니다.
- 영향: MR 분석에서 단백질의 질병에 대한 인과 효과 추정치(예: 베타 값)는 인종에 따라 달라지며, 이는 인과성의 해석에 영향을 줍니다.
- 예시: 동일한 cis-pQTL이 존재하더라도, 어떤 인종에서는 CRP 수치를 더 강하게 증가시킬 수 있습니다.
5. 인종 특이적인 질병 유전 구조 (Ancestry-Specific Genetic Architecture of Disease)
- 설명: 복합 질환은 수많은 유전적 요소와 경로에 의해 발생하며, 이는 각 인종의 유전적 배경 및 환경에 따라 다르게 구성됩니다.
- 영향: 동일한 단백질이 질병에 영향을 미치는 경로가 인종마다 달라질 수 있으며, 결과적으로 인과적 역할이 인종에 따라 다르게 나타납니다.
- 예시: ApoE ε4 대립유전자는 유럽인에서는 알츠하이머병 위험 인자로 확립되어 있지만, 아프리카계 미국인에서는 같은 대립유전자를 갖고 있어도 그 위험 효과가 줄어드는 경향이 있습니다.
6. 유전자-환경 상호작용 (Gene-by-Environment Interactions, GxE)
- 설명: 단백질이 질병에 미치는 효과는 환경 요인(예: 식이, 감염, 생활 습관)과 상호작용할 수 있으며, 이들 환경 요인은 인종 또는 지역에 따라 매우 다릅니다.
- 영향: 동일한 유전적 변이를 갖고 있어도, 환경이 달라질 경우 단백질의 질병에 대한 인과 효과도 다르게 나타날 수 있습니다.
- 예시: 비타민 D 결합 단백질은 햇빛 노출, 피부색 관련 유전자와 상호작용하면서 자가면역 질환에 인종별로 다른 영향을 줄 수 있습니다.
생각
- 1-3번의 경우 유전체 정보만 알면 파악할 수 있는 차이
- 4-6번의 경우 환경이나 다른 유전자와의 상호작용 영향 포함
- 단순히 인종별 pQTL을 사용해 mendelian randomization 분석을 하고 인종 특이적인 결과와 인종 공통으로 나온 결과를 비교하는 것은 너무 단순하지 않나.
- 위와 같은 차이들을 고려해서 인종별 mendelian randomization 분석을 더 정밀하게 할 수 있지 않을까
1. 인종간 변이 빈도를 비교해서 샘플 수가 부족해서/ 변이 빈도 차이에 의해 특정 인종에서는 결과가 나오고 다른 인종에서는 결과가 안나왔을 가능성을 판단
2. 위와 같은 경우를 보정해서 그런 것을 고려해도 차이가 나는 mendelian randomization 결과를 찾아낼 수 있을까?
- UK Biobank에서 2026년에 수십만명 규모의 proteome 데이터를 공개할 거라고 하는데 다른 인종의 대규모 proteome 데이터가 공개되면 위와 같은 방법은 생각할 필요가 없어질지도...
'생각 정리' 카테고리의 다른 글
| 인종 간 유전자 발현 프로파일의 차이가 환경이 아닌 유전적인 원인일 때, 그 차이는 단일염기변이(variant)의 빈도 차이로 추적이 가능할까? (0) | 2025.05.21 |
|---|---|
| Mendelian Randomization with Molecular QTLs: Methods, Challenges, and Advances (1) | 2025.05.12 |
| 생물정보학 분석 방법 - 통계 원리 리스트 (0) | 2025.05.11 |
| 통계 방법들의 리스트와 관계, 발전 방향 (0) | 2025.05.10 |
| Gene-disease causality network 방법 리스트 (DeepSeek) (0) | 2025.02.19 |