基于生物过程以及生物通路分析宫颈癌相关差异表达基因

/ 3

基于生物过程以及生物通路分析宫颈癌相关差异表达基因

耿炫   天津市红桥医院   300131

前言:

宫颈癌是常见的妇科恶性肿瘤之一,在女性的所有恶性肿瘤发病率及死亡率中,宫颈癌高列第四位及第六位[1]。宫颈癌的发病机制受很多因素影响,包括遗传因素以及环境因素[2]。目前,人类乳头瘤病毒(human papillomavirus, HPV)已经被证实与宫颈癌的发病有关,通过检测机体是否受到HPV感染,可以对宫颈癌进行防控及早期治疗[3-5]。除此之外,有报道指出多个基因遗传变异与宫颈癌的发病发展有关,并且针对遗传变异可能开发出潜在的标志物以及治疗靶点[6]。基于先验知识,宫颈癌的发生、发展受多种因素影响,其中与宫颈癌相关基因的差异表达发挥着重要作用[7]。

    通过生物信息学分析方法,基于生物过程分析以及通路分析对与宫颈癌相关的基因进行系统分析,从分子水平系统研究宫颈癌的发生、发展机制,为临床诊疗及后续实验提供有价值信息。

1 材料与方法

1.1  实验材料

实验选用的与宫颈癌相关基因来源于宫颈癌基因公共数据库(cervical cancer gene database,CCDB.)。CCDB是基于实验得到的与宫颈癌相关基因数据,经过人工筛选收录进而搭建起来的比较全面且准确的宫颈癌基因数据库。在数据库中,根据基因来源,与宫颈癌相关基因被归类成不同分类[8]。在这里,由于研究对象仅仅关注于宫颈癌相关的差异表达基因,我们只选择差异表达基因,包括257个上调基因和110个下调基因。

1.2  实验方法

功能富集分析是对一组基因集进行功能阐释的主要方法。这里,采用ToppGene在线富集分析工具进行功能富集分析 [9]。我们分别分析与宫颈癌相关上调和下调基因集的生物过程(biological processes)和生物通路注释(pathway annotation)。挖掘基因集的生物过程,是理解基因集功能发挥的首要步骤。生物通路注释是对基因集进行通路富集分析的过程,差异表达基因参与调控哪条通路,进而发挥生物效应,是通路富集分析的目的。

1.3 统计学方法

文中进行功能富集分析主要采用的是费舍尔精确检验(Fisher’s exact test),该检验方法基于超几何分布对一组给定基因集进行已知信息注释,比如生物通路或者生物过程富集注释。利用费舍尔精确检验,可以得到给定基因集与已知注释信息的相关程度,并得到相应p值。随后,利用Benjamini-Hockberg算法对结果进行多重检验的校正[10],得到FDR,这里采用FDR<0.05作为显著性阈值。

2  结果

2.1与宫颈癌相关基因生物过程注释

2.1.1与宫颈癌相关上调基因的生物过程注释

表1是对宫颈癌相关上调基因集合进行生物过程注释得到的结果,展示的根据FDR数值排名前3名的生物过程。通过对宫颈癌相关上调基因进行生物过程注释,发现参与宫颈癌上调基因集的生物过程主要包括细胞增殖调控、细胞迁移、正向调节细胞增殖分化以及细胞代谢、调节细胞凋亡以及死亡、上皮细胞增殖以及调控信号转导等。结果说明宫颈癌的发生发展是个复杂的过程,多生物过程失调导致疾病的发生发展。

表1 参与宫颈癌相关上调基因的生物过程

GO:ID

Name

P

FDR

GO:0042127

regulation of cell proliferation

1.67E-28

9.20E-25

GO:0051674

localization of cell

1.44E-25

2.65E-22

GO:0048870

cell motility

1.44E-25

2.65E-22

2.1.2与宫颈癌相关下调基因的生物过程注释

表2是对宫颈癌相关下调基因集合进行生物过程注释得到的结果,展示结果仍是的根据FDR数值排名前3名的生物过程。与上调基因集合参与的生物过程存在差异,与宫颈癌相关的下调基因集合主要参与调控凋亡过程、细胞程序性死亡以及调控细胞死亡、脂质响应、内源性刺激响应、循环系统以及调节血管生成系统。结果表明,对于宫颈癌来说,下调基因集通过调控细胞死亡、对内源性刺激响应以及血管生成等生物过程,参与到宫颈癌进展过程中。

表2 参与宫颈癌相关下调基因的生物过程

GO:ID

Name

P

FDR

GO:0006915

apoptotic process

7.29E-19

2.63E-15

GO:0012501

programmed cell death

1.32E-18

2.63E-15

GO:0010941

regulation of cell death

2.58E-16

3.43E-13

2.2 与宫颈癌相关基因生物通路注释

2.2.1与宫颈癌相关上调基因生物通路注释

   基于生物通路,可以对疾病的发生发展的机制进行更为系统且全面的解释。表3是通过对与宫颈癌相关上调基因集合进行通路富集分析得到的结果。发现,与癌症相关的多条通路被显著富集出来,包括癌症综合通路、膀胱癌通路、胰腺癌通路、非小细胞肺癌通路、黑色素瘤通路、脑胶质瘤通路、慢性粒细胞白血病通路、小细胞肺癌通路,这些结果说明,与宫颈癌相关上调基因主要参与癌症发生发展相关的通路,这与宫颈癌的癌症属性是一致的。除了与癌症相关通路,白介素4 – 13信号通路、PI3K-Akt信号通路、白介素介导的信号通路、免疫系统中的细胞因子信号系统、细胞周期信号通路以及EGFR酪氨酸激酶抑制信号通路也被富集标识。说明,与宫颈癌相关上调基因参与调控这些信号通路,进而影响宫颈癌的发生发展。

表3 参与宫颈癌相关上调基因的生物通路

Pathway:Name

P

FDR

Genes included

Interleukin-4 and 13 signaling

3.11E-23

1.94E-20

MYC, CDKN1A, IL10, CCND1, BCL2, BCL2L1, ITGB2, PTGS2, STAT1, STAT3, TYK2, JAK1, JUNB, SAA1, AKT1, MMP1, MMP2, MMP3, MMP9, VEGFA, ANXA1, LAMA5, BIRC5, TIMP1, TNF, IL6, TP53

PI3K-Akt signaling pathway

7.61E-22

3.18E-19

MYC, CDKN1A, CDKN1B, PDGFRA, SPP1, CCND1, BCL2, BCL2L1, ITGA1, ITGA4, MDM2, JAK1, MET, KITLG, HRAS, FGF1, FGF7, AKT1, FGFR2, KIT, COL1A1, VEGFA, VEGFC, KRAS, RAF1, FLT1, VWF, RBL2, GRB2, LAMA5, CCNE1, EFNA1, CSF1, CSF1R, EGFR, OSMR, IL6, TP53, CDK2, CDK6

Mitotic G1-G1/S phases

6.68E-17

7.60E-15

MYC, CDKN1A, CDKN1B, CDKN2A, MCM2, MCM3, MCM4, CCND1, TYMS, DHFR, AKT1, RBL2, E2F1, E2F2, E2F3, E2F4, E2F5, SKP2, CCNB1, CCNE1, TOP2A, PCNA, CDK2, CDK6

2.2.2与宫颈癌相关下调基因的生物通路注释

表4是通过对与宫颈癌相关下调基因集合进行通路富集分析得到的结果。与上调基因集参与到的信号通路存在差异,参与到宫颈癌相关下调基因的生物通路包括调控类胰岛素生长因子转运和类胰岛素生长因子结合蛋白摄取的信号通路、胞内外基质基因编码组装信号通路、蛋白多糖相互作用以及免疫系统相关的通路。

表4参与宫颈癌相关下调基因的生物通路

Pathway:Name

P

FDR

Genes included

Hypertrophic cardiomyopathy (HCM)

3.35E-06

3.06E-04

ITGA6, ITGAV, ITGB1, ITGB8, TGFB1, TGFB2, IGF1

TGF beta signaling pathway

1.18E-05

6.76E-04

TGFB1, TGFB2, SMAD2, SMAD4

SMAD2/3 MH2 Domain Mutants in Cancer

1.52E-05

6.99E-04

TGFB1, SMAD2, SMAD4

3讨论

       作为一种严重影响女性身体健康和生活质量的妇科肿瘤,宫颈癌的发生发展机制一直是研究热点问题。前期经过流病学以及细胞生物学等手段,对发病机制已经进行诸多探究,并取得一些成果。然而,先验结果是以“致病基因”为中心,并不能从系统全面的角度,对宫颈癌的发病机制进行系统的探究。

        通过对上调基因进行生物过程分析,发现细胞增殖调控、细胞迁移、正向调节细胞增殖分化以及细胞代谢、调节细胞凋亡以及死亡、上皮细胞增殖以及调控信号转导等生物过程参与到宫颈癌的发病过程中。而下调基因主要通过参与调控凋亡过程、细胞程序性死亡以及调控细胞死亡、脂质响应、内源性刺激响应、循环系统以及调节血管生成系统等生物过程,进而对宫颈癌的发生及发展造成影响。上、下调差异表达基因参与的生物过程存在差异,间接说明宫颈癌的发生发展是个极其复杂的机体调控过程,其中涉及多生物过程的失调。上调的差异表达基因促进了细胞增殖以及肿瘤转移进程,而下调的差异表达基因可能是对肿瘤进展或者恶化进行多系统的响应。

          不同于“以基因为中心”的研究手段,通路分析可以为更为系统的挖掘疾病的发病机制。分别对上、下调差异表达基因进行通路富集分析发现,作为癌症属性,多条癌症相关基因牵涉到宫颈癌的发病过程,上调基因则起到致病的主导作用,而下调基因则可能是其他多系统对癌症发生发展的相应,包括免疫系统以及血管生成系统。

4 结论

通过对与宫颈癌相关基因数据库的基因数据进行系统的生物信息学分析,我们发现,宫颈癌的发生发展是一个极其复杂的生物过程。有多生物过程和信号通路参与其中,包括细胞增殖、细胞迁移、血管生成等生物过程,以及多条与癌症相关的信号通路。同时,上调和下调的差异表达基因,在宫颈癌的发生发展中,可能扮演着不同的角色。上调基因主要介导癌症的发生发展,而下调基因可能是机体对癌症所带来刺激的一些系统响应。

参考文献

1. Siegel RL, Miller KD, Jemal A (2016) Cancer statistics, 2016. CA: A Cancer Journal for Clinicians 66: 7-30.

2. Soliman PT, Slomovitz BM, Wolf J (2004) Mechanisms of cervical cancer. Drug Discovery Today: Disease Mechanisms 1: 253-258.

3. Arbyn M, Dillner J (2007) Review of current knowledge on HPV vaccination: An Appendix to the European Guidelines for Quality Assurance in Cervical Cancer Screening. Journal of Clinical Virology 38: 189-197.

4. Castellsague X (2008) Natural history and epidemiology of HPV infection and cervical cancer. Gynecologic Oncology 110.

5. Chelimo C, Wouldes TA, Cameron LD, Elwood JM (2013) Risk factors for and prevention of human papillomaviruses (HPV), genital warts and cervical cancer. Journal of Infection 66: 207-217.

6. Martin C, Kehoe L, Spillane CO, Oleary JJ (2007) Gene discovery in cervical cancer : towards diagnostic and therapeutic biomarkers. Molecular Diagnosis & Therapy 11: 277-290.

7. Maciag PC, Villa LL (1999) Genetic susceptibility to HPV infection and cervical cancer. Brazilian Journal of Medical and Biological Research 32: 915-922.

8. Agarwal SM, Raghav D, Singh H, Raghava GPS (2011) CCDB: a curated database of genes involved in cervix cancer. Nucleic Acids Research 39.

9. Chen J, Bardes EE, Aronow BJ, Jegga AG (2009) ToppGene Suite for gene list enrichment analysis and candidate gene prioritization. Nucleic Acids Res 37: W305-311.

10. Benjamini Y, Hochberg Y (1995) Controlling the false discovery rate: a practical and powerful approach to multiple testing. Journal of the Royal Statistical Society Series B (Methodological): 289-300.