VEP注释工作流手册

Part 1 产品介绍

1. VEP注释工作流用途

VEP由国际三大数据库之一的Ensembl提供,基于perl语言。VEP可用于变异分析、注释和对编码、非编码区域的基因变异进行排序。本工作流使用VEP91对变异进行注释,标记变异对基因、转录组、蛋白序列和调控的影响。支持hg19/b37坐标。

详细信息请参看Variant Effect Predictor

2. 工作流介绍

【数据库及版本】

  1. 功能注释数据库: 两个工作流有区别,VEP_Ensembl_annotation工作流使用的是Ensembl 91、VEP_RefSeq_annotation工作流使用的是RefSeq(2015-01)

  2. 群体数据库: dbSNP150, 1000genomes(phase 3), NHLBI-ESP, gnomAD(r2.0 170228, exomes only)

  3. 致病性预测软件数据库: SIFT5.2.2, Polyphen2.2.2, dbscSNV(v1.1), SPIDEX(需自行下载,下载链接), dbNSFP3.5c

  4. 疾病数据库: Clinvar(20180603), GeneDock免费版知识库(整合HGMD.2011.2.SNP-hg19.database和DVD.v8位点), OMIM(genemap2.txt

【流程输出】

  1. 注释结果总文件,vcf格式;详细信息见VEP Output

  2. 单一转录本的tsv文件;详细信息见Single transcript Output

  3. 位点在知识库中的详细信息;详细信息见Knowledge Output

【运行时间】

182748个位点的vcf文件,VEP_Ensembl_annotation工作流运行时间29分钟(北京域,时间20180826)。

182748个位点的vcf文件,VEP_RefSeq_annotation工作流运行时间33分钟(北京域,时间20180826)

Part 2 操作教程

(以VEP_Ensembl_annotation为例)

1.工作流安装:VEP_Ensembl_annotation为公共工作流,使用前需安装;安装方法详见工作流操作

2.查看工作流详情:进入后台后,点击左侧工具栏中的工作流,在我的工作流标签中选择public,可以看到VEP_Ensembl_annotation工作流,点击“详情”,查看该工作流的介绍,包括:【概述】、【数据库及版本】、【流程输出】、【运行时间】等(如图1,图2);


图-1

(图1)



图-2
(图2)

3.运行工作流:熟悉工作流的信息后,重复第一步骤,点击“运行”,进入到运行工作流界面(如图3),为了方便后续查找任务,可以修改“任务名称”;
图-3

(图3)

4.设置输入文件:1、vcf文件;2、spidex数据库文件。点击输入文件条中对应的文件夹符号,可以看到对应的数据选择框,其中最上边可以看到对应的文件格式(如vcf),在您需要的文件前面操作栏选择“选取”,然后就可在输入文件条中看到选定的输入文件,所有输入文件都选择完毕后,点击“下一步”(如图4、图5);

图4

(图4)

图5
(图5)

5.设置输出文件:输出文件已经自动加载默认路径和文件名称,可以按照项目的目录情况修改输出路径,如无需要可以不做修改,所有输出文件都选择完毕后,点击“下一步”(如图6);



图6

(图6)



6.设置参数:系统中会绑定默认参数,且会标明参数属于的工具名称,如有需要修改参数,将鼠标放置参数名称上可查看参数的说明,选择参数后可直接修改(如图7);



图7

(图7)

7.运行工作流:参数修改完毕后,点击‘运行任务’,开始运行工作流;

8.查看任务:点击左侧工具栏中的“任务/报告”查看相应工作流的运行状态。如果提交的文件或参数有问题,可以选中任务,停止,也可以再重新或删除。如(如图8,图9):




图8

(图8)

图9

(图9)

点击所要查询的任务,可以查看“参数”,“日志”,“报告”以及“相关文件下载和预览”。点击”日志“,可以看到每一步的完成状态。点击APP名称,可以看到部分输出日志,点击“下载日志”可以下载查看完整的输出日志(如图10);



图11

(图10)

点击“参数“ ,可以看到输入,输出和相关参数,(如图11):




图10

(图11)

注:目前的工作流没有设置报告模板,因而报告不可查看,所以只能查看“相关文件下载和预览”。

点击“相关文件下载和预览”,可以看到任务的结果文件。对于vcf,文本文件和png等图文件,支持在线预览和下载,超过100M的文件,建议按照下文使用客户端下载(如图12)。



图12

(图12)

Part 3 参数解释

工具:VEP_Ensembl_annotation、VEP_RefSeq_annotation

参数 默认值 解释
dbNSFP M-CAP_score,MutationAssessor_score 注释dbNSFP3.5c中的M-CAP列和MutationAssessor_score列信息,详细列名称见readme