1、下载与解压
wget https://github.com/Illumina/strelka/releases/download/v2.8.2/strelka-2.8.2.centos5_x86_64.tar.bz2
tar xvfj strelka-2.8.2.centos5_x86_64.tar.bz2
2、解压之后一共有四个文件夹,主要运行程序在bin目录下,其实就是一些python脚本
3、测试软件是否能够正常运行:运行*Demo.bash
4、跑自己的数据
reference=/public/home/project/ref/ucsc.hg19.fasta
DBSNP=/public/home/tools/GATK/dbsnp_138.hg19.vcf
normal_bam=/public/home/project/align/N-06448.realn.recall.bam
tumor_bam=/public/home/project/align/A-06448.realn.recall.bam
sample=A-06448
cd /public/home/yangliuqing/reSNV_calling
mkdir -p somatic/strelka
/public/home/tools/strelka/strelka-2.8.2.centos5_x86_64/bin/configureStrelkaSomaticWorkflow.py \
--normalBam $normal_bam \
--tumorBam $tumor_bam \
--referenceFasta $reference \
--runDir somatic/strelka \
--exome \
--disableEVS \
--reportEVSFeatures \
--config=/public/home/tools/strelka/strelka-2.8.2.centos5_x86_64/bin/configureStrelkaSomaticWorkflow.py.ini \
--snvScoringModelFile=/public/home /tools/strelka/strelka.2.centos5_x86_64/share/config/somaticSNVScoringModels.json \
--indelScoringModelFile=/public/home /tools/strelka/strelka2.8.2.centos5_x86_64/share/config/somaticIndelScoringModels.json \
--outputCallableRegions
需要注意的是自己的数据是外显子测序数据?基因组测序数据?还是别的什么,默认的是基因组测序数据,如果是WES则加上--exome即可。其他参数使用-h查看。这个脚本运行得很快,因为结果就是产生真正的运行脚本
查看这个脚本的参数也是用-h,但是有一点需要注意的是,必须加上脚本的绝对路径!即便就在当前路径下也必须要加!如果发现结果中某些低质量的位点也显示出来了,只需要在configureStrelkaSomaticWorkflow.py.ini里面加一个参数就可以了:extraStrelkaArguments = -used-allele-count-min-qscore 30 最终的结果是产生snv和indel两个vcf格式的文件,因此还需要先把它们合并,可以使用GATK
java -jar ~/tools/GATK/GenomeAnalysisTK.jar -T CombineVariants -R ~/project/ref/GATK_ref/ucsc.hg19.fasta --variant sample.raw.indel.pass.vcf --variant sample.raw.snp.pass.vcf -o sample.raw.pass.vcf -genotypeMergeOptions UNIQUIFY
另外一般还需要一个注释软件,例如annovar对这些突变位点进行注释,结果是CSV表格
/public/home/tools/annovar/convert2annovar.pl -format vcf4old somatic.snvs.vcf>06448-N.annovar #转化格式
/public/home/tools/annovar/table_annovar.pl 06448-N.annovar /public/home/tools/annovar/humandb -remove -buildver hg19 -out 06448-N -protocol refGene,snp138,exac03,clinvar_20170130,cosmic70,1000g2015aug_all,1000g2015aug_afr,1000g2015aug_eas,1000g2015aug_eur,1000g2015aug_sas,esp6500siv2_all,avsnp147,ljb26_all,avsnp147 -operation g,f,f,f,f,f,f,f,f,f,f,f,f,f -nastring . -csvout –otherinfo