2015-09-15GeneDock

云之稻——水稻基因组资源与云计算数据技术的结合

       9月15日,农科院、阿里云、华智水稻、聚道科技共同举办了“云之稻”媒体见面会,正式对媒体和科学界宣布“云之稻”项目上线。该项目是源自于比尔和梅琳达•盖茨基金会的“为非洲和亚洲资源贫瘠地区培育绿色超级稻”项目和国家国际合作专项共同资助的3000份水稻基因组项目的测序成果。这一系列项目的总体目标是培育能够广泛适⽤于灌溉和⾬养地区⽣态环 境,并具有氮磷高效利⽤、抗病、抗⾍、高产、优质、抗逆(干旱、盐碱)等特性的水稻新品种,并在目标国家进⾏⽰范和推⼴。
阅读文章>>

2015-09-09GeneDock

GeneDock成立一周年

Hi GDers,

       GeneDock一周岁了!

       2014年9月9日,我司诞生于回龙观智慧社一个普通的二居室里。

       当天,只有我、乐珩、海洋、程夫四个人,我们简单收拾了下房子,去华联超市买了点零食和水就开工了。

       那时候,我们的数据上传OSS还有问题,程夫同学测试了好久都没把数据传上去,而workflow还不能运行。

       一晃一年,加入了更多有梦想的GDer,产品如同新生儿般茁壮,有了相信我们梦想的天使客户,有了信任我们的投资者。
阅读文章>>

2015-09-08Xiong Xu

fastq文件格式处理工具系列学习

(本文由GeneDock公司 Senior Bioinformatics Engineer 许雄撰写,转载请保留作者信息和原文链接)

fastq文件格式说明(wiki)

  1. FASTQ_format 维基百科
  2. NSC_2011_Illumina_fastqAndQC Illumina fastq 格式官方文档

fastq 文件质量控制

  1. fastqc

    CommandLine Demo:./FastQC/fastqc -o ./ –extract -f fastq -t 4 -q file.fq.gz
  2. solexaQA
    Dependency:R, gcc, perl

    阅读文章>>
2015-08-21MAO

BWA-MEM 不同方法的 Mapping 结果比较

(本文由GeneDock公司 Bioinformatics Engineer MAO 撰写,转载请保留作者信息和原文链接)

基本信息

  • 测试集群 CPU 型号: Intel(R) Xeon(R) CPU E5-4610 v2 @ 2.30GHz
  • bwa 版本:0.7.12-r1039
  • 参考序列:hg19
  • 原始数据:SRX265482

一、小样本测试

$ wc -l read*_1000.fq
  1000 read1_1000.fq
  1000 read2_1000.fq
  2000 total

提取了 1000 行 fastq 数据,一共 250 条 reads 做测试。

$ samtools view reads_1000.sam | wc -l
  501

Mapping 出来的结果是 501 行。
阅读文章>>

2015-04-29GeneDock

[招聘]前端工程师


[招聘]前端工程师

GeneDock.com是基因数据云计算领域的创业团队,帮助各领域用户处理海量的基因数据。随着业务增长和产品功能的增加,前端团队已经忙不过来了。所以我们需要你:一位有品味、有好奇心、热衷于前端技术的工程师。
阅读文章>>

2015-02-11GeneDock

[招聘]基因数据工程师


[招聘]基因数据工程师

传统生物信息分析是件苦逼的差事:维护服务器,安装系统,配置升级软件,调试脚本,传输数据,调整参数执行workflow,搜集实验数据,查询数据库,做图表,攒报告…… 日复一日,重复数百遍。
软件和网络正在改变世界,低效琐碎重复的人工操作应该让机器去干。GeneDock团队正在努力打造高效简捷的生物信息云平台。
现在我们需要你,一位有品位的基因数据工程师。
加入GeneDock,一起用前沿技术打造最酷的产品,让数据分析变得更高效,让生物信息应用变得更有趣。
阅读文章>>