bioinfo-statistics

단백질/ 유전자 - 질병 연관성이 인종에 따라 왜 달라지는지에 대해 본문

생각 정리

단백질/ 유전자 - 질병 연관성이 인종에 따라 왜 달라지는지에 대해

spnz3 2025. 5. 21. 08:07

요약표

 

1. 대립유전자 빈도 차이 (Allele Frequency Differences)

  • 설명: 단백질 발현이나 기능에 영향을 주는 유전 변이(예: 단백질 QTL, pQTL)의 빈도는 인종에 따라 크게 다릅니다.
  • 영향: 어떤 유전 변이는 한 인종 집단에서는 흔하지만, 다른 집단에서는 드물거나 아예 존재하지 않을 수 있습니다. 이로 인해 MR 분석에서 해당 변이를 도구 변수로 사용할 수 있는 정도(=설명력, 파워)가 달라집니다.
  • 예시: IL6 수치에 영향을 주는 pQTL이 유럽인에게는 흔하지만 동아시아인에게는 드물다면, 염증 질환에 대한 단백질의 인과성이 인종에 따라 다르게 나타날 수 있습니다.

2. 연관불균형 구조 차이 (Linkage Disequilibrium, LD Structure Differences)

  • 설명: 서로 가까운 유전 변이들 간의 상관 구조(LD)는 인구의 역사(병목, 확산, 혼합 등)에 따라 인종마다 다르게 형성되어 있습니다.
  • 영향: 특정 SNP가 한 인종에선 인과 변이와 강한 LD에 있어 유효한 도구 변수로 사용될 수 있지만, 다른 인종에서는 LD가 낮아 도구 변수로서의 정확성이 떨어지거나 방향이 바뀔 수 있습니다.
  • 예시: LD 블록이 유럽인에서는 더 길고, 아프리카인에서는 더 짧기 때문에, 같은 유전자 영역에서 아프리카 집단은 더 높은 해상도로 인과 변이를 정밀하게 찾을 수 있습니다.

3. 인구 특이적인 pQTL (Population-Specific pQTLs)

  • 설명: 어떤 단백질 수준을 조절하는 유전 변이는 특정 인종에서만 발견되거나, 통계적으로 유의미한 효과를 나타냅니다. 이는 자연 선택이나 유전적 부동(drift) 같은 진화적 압력에 의해 발생합니다.
  • 영향: 어떤 단백질은 특정 인종에서만 질병과 인과적으로 연관되어 있는 것으로 보일 수 있으며, 이는 그 인종에만 존재하거나 유효한 pQTL이 있기 때문입니다.
  • 예시: 면역 관련 단백질 분비에 영향을 주는 missense 변이가 한 인종에서 양성 선택을 받아 자가면역 질환 경로에 특이적인 영향을 줄 수 있습니다.

4. 효과 크기 이질성 (Effect Size Heterogeneity)

  • 설명: 동일한 유전 변이가 여러 인종에서 공유되더라도, 단백질 수치에 미치는 효과의 크기는 인종에 따라 다를 수 있습니다. 이는 다른 유전자들과의 상호작용(에피스타시스)이나 유전자-환경 상호작용(GxE)에 의해 발생합니다.
  • 영향: MR 분석에서 단백질의 질병에 대한 인과 효과 추정치(예: 베타 값)는 인종에 따라 달라지며, 이는 인과성의 해석에 영향을 줍니다.
  • 예시: 동일한 cis-pQTL이 존재하더라도, 어떤 인종에서는 CRP 수치를 더 강하게 증가시킬 수 있습니다.

5. 인종 특이적인 질병 유전 구조 (Ancestry-Specific Genetic Architecture of Disease)

  • 설명: 복합 질환은 수많은 유전적 요소와 경로에 의해 발생하며, 이는 각 인종의 유전적 배경 및 환경에 따라 다르게 구성됩니다.
  • 영향: 동일한 단백질이 질병에 영향을 미치는 경로가 인종마다 달라질 수 있으며, 결과적으로 인과적 역할이 인종에 따라 다르게 나타납니다.
  • 예시: ApoE ε4 대립유전자는 유럽인에서는 알츠하이머병 위험 인자로 확립되어 있지만, 아프리카계 미국인에서는 같은 대립유전자를 갖고 있어도 그 위험 효과가 줄어드는 경향이 있습니다.

6. 유전자-환경 상호작용 (Gene-by-Environment Interactions, GxE)

  • 설명: 단백질이 질병에 미치는 효과는 환경 요인(예: 식이, 감염, 생활 습관)과 상호작용할 수 있으며, 이들 환경 요인은 인종 또는 지역에 따라 매우 다릅니다.
  • 영향: 동일한 유전적 변이를 갖고 있어도, 환경이 달라질 경우 단백질의 질병에 대한 인과 효과도 다르게 나타날 수 있습니다.
  • 예시: 비타민 D 결합 단백질은 햇빛 노출, 피부색 관련 유전자와 상호작용하면서 자가면역 질환에 인종별로 다른 영향을 줄 수 있습니다.

 

생각

- 1-3번의 경우 유전체 정보만 알면 파악할 수 있는 차이

- 4-6번의 경우 환경이나 다른 유전자와의 상호작용 영향 포함 

 

- 단순히 인종별 pQTL을 사용해 mendelian randomization 분석을 하고 인종 특이적인 결과와 인종 공통으로 나온 결과를 비교하는 것은 너무 단순하지 않나. 

- 위와 같은 차이들을 고려해서 인종별 mendelian randomization 분석을 더 정밀하게 할 수 있지 않을까  

   1. 인종간 변이 빈도를 비교해서 샘플 수가 부족해서/ 변이 빈도 차이에 의해 특정 인종에서는 결과가 나오고 다른 인종에서는 결과가 안나왔을 가능성을 판단 

   2. 위와 같은 경우를 보정해서 그런 것을 고려해도 차이가 나는 mendelian randomization 결과를 찾아낼 수 있을까? 

 

- UK Biobank에서 2026년에 수십만명 규모의 proteome 데이터를 공개할 거라고 하는데 다른 인종의 대규모 proteome 데이터가 공개되면 위와 같은 방법은 생각할 필요가 없어질지도...