240 发简信
IP属地:山西
  • 120
    共线性分析 | MCscan (Python version JCVI 包)

    共线性分析可以很好地解释进化关系和多倍化事件。今天主要测试的是Python版McScan(jcvi工具包),这个包很强大,是从MCScanx升级而来的基因组共线性分析软件。 ...

  • GATK4 多个样本GenotypeGVCFs前用 CombineGVCFs还是GenomicsDBImport

    我们知道,GATK 4 多个样本joint genotyping用模块GenotypeGVCFs, 目前GenotypeGVCFs只支持以下三种形式的输入文件:1)a sin...

  • 120
    随笔1

    当别人都拿你当回事的时候,你千万别拿自己当回事;当别人都不拿你当回事的时候,你可一定要拿自己当回事。

  • 120
    GWAS全流程#02 | 数据准备

    写在前面 gwas整套流程按顺序如下: 1.测序数据质控(fastp) 2.比对&标记重复(bwa,samtools) 3.变异检测(gatk) 4.关联分析 前面一篇文章已...

  • 120
    GWAS全流程#01 | 变异位点获得(gatk)

    写在前面 原理应用部分就不多说了,太多文章了。这里稍微注意一下样本的选择问题: 1.尽可能得选择自然群体(野生个体),或者说遗传关系相对较远的个体,不要选择群体结构较为简单的...

  • 120
    基因组注释01# | 重复序列注释(RepeatModler+RepeatMasker)

    写在前面 进行这部分重复序列提取和注释,主要是为了屏蔽基因组的重复序列,以保证后面基因结构注释的准确性。大致的流程如下:1.首先使用RepeatModler对组装好的基因组进...

  • 120
    R学习笔记1 | 初步认识R

    虽然前期陆陆续续间断学习用过R,当时感觉自己现在每次用R又要花很多时间重新理解R的语言逻辑,所以想系统学习下R语言,主要记录下自己的R的学习过程,做下笔记加深印象。 R及Rs...

  • 120
    基因组结构注释

    1. 组装基因组质控 得到组装好的基因组序列之后,首先要使用多种方法评估组装质量。这里用到2款可用于基因组组装质量评估的软件——QUAST和BUSCO。 1.1 quast—...

  • 用verkko组装基因组

    背景介绍 verkko是一个最新的可以应用于二倍体基因组T2T(telomere-to-telomere)级别的基因组组装的组装软件。 2022年9月14号李恒在主题为Pac...

  • @荣_e687 先分别生成你的二代和三代HIFI测序数据的路径文件,在.cfg配置文件中的sgs_fofn/lgs_fofn那里改成相应文件就行

    De novo组装#05 | 基因组纠错polish(racon+pilon, nextpolish)

    写在前面 在进行染色体挂载之前一般对得到的 "primary assembly"(主要组装/初始组装结果)进行进一步的优化,以减少错误,提高基因组的质量和准确性。然后再将这些...

  • 120
    聊聊“基因组共线性”

    最近看了几篇关于共线性分析的微信/简书推送,发现不少研究人员把“编码基因共线性”错误地描述为“全基因组共线性”。这是两个完全不同的概念,前者主要是基于蛋白水平,蛋白的保守性很...

  • @13cdd6ddd9c3 不用删,非T2T级别基因组组装有一些没有挂在到染色体的contig很正常,一般你去下载的基因组fasta文件都是由chr1 chr2 .....,以及一些scaffold## 组成的。你就不用管他,因为你也搞不清他到底是基因组上真实存在的序列由于所在的位置比较复杂没有挂上,还是前面软件组装产生的垃圾,你自己很难判断手动去移到真正准确的位置。建议用juicerbox调整完就重新去用assembly文件去重新生成fasta,可以设置下过滤参数,把那些太短contig都过滤掉,剩下比较长可以留着说不定里面确实有重要的东西但又没挂上,你用这个基因组做后续其他分析的时候可以选择只用chr水平的序列去做。关于juicerbox软件具体用法我有点记不清了,不过有一点需要注意下,随时调整分辨率,对一些比较短的contig进行操作的时候需要放大一点鼠标箭头才会出现相应的形状

    De novo组装#07 | 染色体挂载 (allhic,3d-dna)

    写在前面 初始组装经过基因组纠错(polish)以及去冗余(purge)之后,就可以将其挂载到染色体上,使其由contig/scaffold级别的基因组提升到chromoso...

  • 120
    性染色体的鉴定(GATK4)

    写在前面 性别被称为“进化生物学问题的皇后”,一直是生命科学领域中最具吸引力和最热门研究方向之一。而有性生物其性染色体的解析是性别研究的基础,这篇文章主要介绍一套鉴定性染色体...

  • fastqc只是用来检测测序数据是否存在质量问题(有没有接头,低质量的reads等),输出结果就是一个检测报告,本身并没有做过滤,一般都是fastp来跑数据过滤。不过现在的测序公司释放给你的测序数据都是跑过fastp的"clean data"了,一般不会给你raw data要你自己跑过滤。你可以看下公司给你的结题报告,一般都会有fastqc/fastp的相关结果

    De novo组装#01 | 测序数据质控(fasqc+fastp)

    fastqc查看数据基本情况 1#安装fastqc课题组超算已安装的fastqc报错,在自己目录下新建一个software目录用于安装相应的软件,手动安装: 2#运行程序安装...

  • 120
    gvcf文件与vcf文件

    一、解释一 这里注意HaplotypeCaller只能处理单样本文件,当有多样本时,官方建议使用HaplotypeCaller对单bam文件分别进行变异检测,生成GVCF文件...

  • 120
    De novo组装#08 | 基因组组装评估

    写在前面 基因组组装完成后,我们需要对我们组装好的基因组进行一个质量评估,质量评估主要从连续性(continuity),完整性(completeness),准确性( accu...

  • 120
    De novo组装#07 | 染色体挂载 (allhic,3d-dna)

    写在前面 初始组装经过基因组纠错(polish)以及去冗余(purge)之后,就可以将其挂载到染色体上,使其由contig/scaffold级别的基因组提升到chromoso...

  • De novo组装#06 | Scaffolding和gap filling

    基于三代测序reads进行Scaffold构建以及补洞gap filling,我这里只有一种三代测序数据CLR,这里就先不做了,而且我看文章做这步的人也非常少。后面有时间再补...