质控pipeline技巧数据下载使用obstuil,下载代码位于hic博客中。
生成sample_sheet.csv通过使用python脚本
/data2/kunpeng/ATAC/atac_work/ATAC13/make_samplesheet.py和
/data2/kunpeng/CUT/CUT_script/make_samplesheet.py
用法示例
1python /data2/kunpeng/CUT/CUT_script/make_samplesheet.py /data2/kunpeng/CUT/data/CUT12+13_broad/add samplesheet.csv
结果tsv排序使用本地rust脚本my_csv。
从表格中复制样本名称,粘贴进order.txt里;把qc_metrics.tsv放入my_csv文件夹。运行:
注意:atac样本名是_REP,cut样本名是_R,要手动修改一下replace里面的内容。
1cargo run -- - ...
rust编写csv排序工具知识点周末两天的时间,学了以下io操作,文件的读写,代码的组织、测试和安全性的操作。
然后简单地写了一个用于将pipeline输出的qc_metrics.tsv转变成qc_metrics.csv并且按照样本顺序排序的工具
这是对这个工具的回顾。回头看一看如何发到github上。
琐碎的知识点:
rust analyzer自动格式化代码shift+alt+f。如果没能自动化,很可能因为代码有语法错误。
Path和PathBuf的区别是前者没有所有权,后者有。
.clone()和.cloned()的区别,.cloned()相当于对迭代器所有元素clone,以下两个用法等价。
12let a: Vec<String> = v.iter().cloned().collect();let b: Vec<String> = v.iter().map(|x| x.clone()).collect();
传递参数使用clap工具,基本用法如下:
1cargo add clap --features derive
1234567891011 ...
这段时间似乎也没有什么正经事,一天一天地过得很快。今天先把杂事做完吧,主要有加测数据、hic数据的阳性对照、学习hic下游的分析方法。学习算法和rust是必要的。有一些内容没有整理,分别是转录因子分析,以及hic数据的加测,还有hic下游分析。
这几天得想办法找些lol以外的事情来度过时间。
亢奋,难以平静的亢奋,不明缘由的亢奋令我错手不及,好吧,我知道缘由,只是不想明说,有时我会想沉溺于这种亢奋中,那时我会打开lol玩到疲惫或不得不休息的时间为止。
平静是适合思考的状态,若是认为不得不回归平静,那时我会找一些有益于精神的作品,游戏、动画、小说都可以是这样的作品,当我脑中狂乱的想象被这些作品取代,打乱我原本躁动的幻想时,那便是我从亢奋中脱身的时候。
当亢奋来临时,我不再寻求知识,我能做的,让我感到没有在浪费时间的事,通常是体育和音乐,得益于这种亢奋,我能坚持下自己的跑步计划,竖笛的学习也在日益进步。
算法学习(一)ref:1、Charging Station: Generating the Neighborhood of a String(飞书)2、Motif Finding Is More Difficult Than You Think(飞书)
🧬 Motif Finding 笔记🎯 核心问题:Motif EnumerationMotif Enumeration 是一种基础的 motif(模式)发现方法。目标是在一组 DNA 序列中找出所有长度为 k,且在每个序列中都至少出现一次、与真实 motif 最多相差 d 个碱基(即允许 d 个 mismatch)的模式。
以下是 Motif Enumeration 的伪代码:
123456781 MotifEnumeration(Dna, k, d)2 Patterns ← an empty set3 for each k-mer Pattern in the first string in Dna4 for each k-mer Pattern’ differing from Pattern by ...
如何搭建生信分析pipeline这个页面先创建好,回头有空的时候就回来看看,把搭建nf-core的内容写一篇博客。可能最近没空也说不定
科研进展
未读如何运行chromHMM见chromHMM步骤
结果解读
除此之外,我们选了一些样本,用来尝试chromHMM的分析,不过由于我们目前cut&tag的数据比较少,能做的分析比较少。
我们只分了5个chromatine state,marker越多,我们能看的chromatine state也就越多。我们目前有的抗体主要是K27ac,这三个,可以初步用来看一下promoter和enhancer,
H3K27ac 是活跃增强子和启动子的标志;H3K4me2 通常标记启动子或增强子附近的活跃区域;H3K4me3 是强启动子的经典标志。在我们的5个状态中:State 1 是 quiescent,也就是静默染色质,信号基本缺失,占据大部分基因组区域;State 2 表示低活性的调控区域,富集程度较低;State 3 是活跃增强子,显示出增强子相关的修饰特征;State 4 是活跃的启动子;State 5 是 poised 启动子,也就是待激活的启动子。
从注释数据中可以看到,State 4 和 State 5 在 TSS 区域显著富集,进一步验证它们启动子。从结果来看,整个状态的功能划分 ...
Hic上游分析hic-pro整理前言:
总体hic-pro是不如nfcore/hic的,无论是使用的简便性/报错的可读性/步骤的深度,都是。因为nfcore/hic本身便是hic-pro同一作者的改进。
但是我暂时依旧使用hic-pro,因为有苏卓杰写的整理qc的脚本。
下载数据首先,登陆hpc的登陆节点,打开tmux,进入ob的文件夹。
1./obsutil share-cp https://e-share.obs-website.cn-north-1.myhuaweicloud.com?token=cQTPwPGN6seCWf5euiwv4KFDcsSeV65pxwBPH1Iy+B9XF8goRmU+LNNz+aBcggMiS0dZceY8ha8w4FVoI+XxURfrARiZXt66ieqyQTtpVpsQNt3NbnjLDi2L2Yd7nYZTu9QkuZtrXkSBVIdjkXsWBCN5Ijcp4ANtdIqXRyV8yq8u3iu2V2nlw427/JNEn89GFMhN20pkFZfLz+l/W/hVJy7iewjF6TJTWZ ...
如何搭建博客ref:【Hexo博客系列】No.1 搭建Hexo博客,快速简洁高效,零成本搭建个人博客:Hexo + GitHub Pages + Cloudflare Pages 完整指南 | CMLiussss Blog
环境准备:安装Node.js和Git
配置Git和GitHub:设置SSH密钥,创建GitHub仓库
初始化Hexo项目:安装Hexo,创建新博客
部署到GitHub Pages:配置部署设置,推送静态文件
部署到Cloudflare Pages:连接GitHub仓库,自动部署
基本使用方法:创建新文章,本地预览,发布更新
工具介绍npm 是 Node.js 的包管理工具(Node Package Manager),用于安装、管理和分享 JavaScript 编写的库(package)或工具。
Git Bash 是 Windows 上的 Git 命令行工具,同时提供了 Linux 风格的终端操作方式。
hexo常用命令:123hexo cl ; hexo s(clean+server) #hexo二连hexo cl; hexo g;hexo d(clean+ge ...










