4/5/2017html
linux:python
仍是跟3月份的教程是同样的,不过学到了day2了linux
刚开始看了下fastq的格式(如今是几乎全部的illumina测序平台的通用格式了),而后fastq一个数据有有4行,分别是ID,序列读长,+,和对应的测序质量。这些都是能够在百度或者谷歌搜到的(下次准备单独更新市面上的测序格式)编程
常见的fastq格式的命令windows
zcat filename | grep ^*** | wc -l 以***开头的有多少行服务器
| less 查看具体的数据less
| head -n 4000 > top_1000.fastq 将前4000行截下来,而后保存(注意,因为一个读长数据占的是4行,因此咱们只能得到1000个数据)函数
| tail -n 4000 > bottom_1000.fastqpost
而后学习了paste命令,最经常使用的就是学习
zcat filename.fastq.gz | paste - - - -(这里的“-”之间是有空格的!!!!),而后就能把原来4行的fastq一个数据变成了以一个4列格式显示。(若是不是很懂这个命令,能够先用ls | paste - -先试试)
zcat filename.fastq.gz | paste - - - - | head -n 1000 > top_1000.txt(这里,因为4行变一行,因此只须要取前1000行便可)
具体的paste的用法可见,http://logo32.iteye.com/blog/1316299
而后初步地学习了linux的大杀器-awk编程
但光看那个手册不是很懂。。。我以为我得找本资料或者书去看看。。。。。忽然感受我要从入门到放弃了。。
暂定这个网站:http://www.zsythink.net/archives/tag/awk/
4/8/2017
linux:
学习了评估illumina数据的质量(先前已经有过一篇了,可见3月份的生物信息学-教学------ 用FastQC检查二代测序原始数据的质量,不过那篇是转载的)
上面提到了windows下跑很慢,由于你得链接到fastqc的服务器上,因此仍是linux下跑比较快。
python:
学习了字符串的转化,初步了解了下元祖(tuple)
学习了python的类型转化,int(),float(),str(),bool()--待学
了解了下函数,本身写了个弱鸡函数,注意def sayHello():-----()和:都不能少,下面的tab缩进!!也不能少,还有不能在定义的函数里面再调用自身。
而后仍是决定用笔,纸记笔记了,赵奶奶貌似之前说过抄程序其实也是有帮助的。
4/10/2017
python:
学习了python的加参数
4月的事应该忙完了,应该能够抽出时间来学习编程了,接下来要把R语言也加上了。
4/11/2017
python:
学习了函数的简单使用,大体跟VB仍是差很少。但要注意,python的函数是要有返回值的,即return,若是没有返回值,会获得一个None的对象,具体也能够见
https://www.zhihu.com/question/23765556/answer/25592016
http://www.iplaypy.com/jinjie/return.html
这两篇综合起来看
cross 先生最后说到:函数能够把某个功能的代码分离出来,在须要的时候重复使用,就像拼装积木同样,这会让程序结构更清晰。让我忽然感受其实函数跟合成生物学有点类似,都是把一类东西封装了,想用的时候拿出来用就好了
4/13/2017
python:
学了if,else,elif。大体跟VB仍是同样,有点明白return这个东西了。
感受最近愈来愈忙了。。。。。
4/22/2017python:
学了list相关的内容,学了索引,还学了切片。注意切片的话,开始位置包含在切片里面,结束位置不包含。