文献速递 (2017年4月)

The Rice Paradox: Multiple Origins but Single Domestication in Asian Rice

Mol Biol Evol (2017) 34 (4): 969-979.
通过对几种栽培水稻和野生祖先的基因组比较,发现不同栽培稻亚种分别来自不同的野生祖先,但是只经历了一次驯化事件。
最先被驯化的是O. sativa ssp. japonica,与O. rufipogon大概在∼13.1–24.1 ka前分歧。japonica与indica和aus的驯化前体存在基因流,导致后两者获得了驯化基因型。

Genome Sequencing Reveals the Origin of the Allotetraploid Arabidopsis suecica

Mol Biol Evol (2017) 34 (4): 957-968.
对15个异源四倍体拟南芥Arabidopsis suecica进行了重测序。发现其与多个祖先物种共享多态性,排除了单一起源。该物种大概在末次盛冰期(LGM)的东欧或欧亚大陆中部出现。还发现两个自交不亲和基因都没有功能。

Deleterious Variants in Asian Rice and the Potential Cost of Domestication

Mol Biol Evol (2017) 34 (4): 908-924.
通过与野生种的比较,发现驯化种积累了更多(∼3–4%)的有害SNPs。这些有害SNPs 主要集中在低重组率的区域。在受选择区域,有害SNPs的频率增加和同义SNPs相近。驯化导致水稻从异交向以自交为主转变。

A Working Model of the Deep Relationships of Diverse Modern Human Genetic Lineages Outside of Africa

Mol Biol Evol (2017) 34 (4): 889-902.
人类走出非洲后,目前的遗传结构是怎样建立的,一直是人类历史研究的主要兴趣点。
本文作者提出了一个模型,能够很好的拟合各人群体(东亚,澳大利亚,美国本土,古欧亚大陆西部和北部)的基因型频率数据。

What is adaptation by natural selection? Perspectives of an experimental microbiologist

PLoS Genet 13(4): e1006668.
微生物对自然选择适应的综述。微生物实验进化学。

Evolutionary history of Tibetans inferred from whole-genome sequencing

PLoS Genet 13(4): e1006675.
通过对27个藏族人的全基因组测序,揭示其群体历史和受选择基因。

The time and place of European admixture in Ashkenazi Jewish history

PLoS Genet 13(4): e1006644.
推断德系犹太人的历史。用了一些新的推断方法。

RECKONER: read error corrector based on KMC

Bioinformatics (2017) 33 (7): 1086-1089.
对测序的reads质量进行矫正。

SVScore: an impact prediction tool for structural variation

Bioinformatics (2017) 33 (7): 1083-1085.
对SV的影响进行预测。发现高影响的SV在群体中的频率更低,说明它们受到纯化选择。SVscore对预测有害突变的效果比其他软件好。研究者还发现duplication比deletion受到更强的选择。

Fast and accurate phylogeny reconstruction using filtered spaced-word matches

Bioinformatics (2017) 33 (7): 971-979.
不依赖于比对的系统发育树构建。

Improved VCF normalization for accurate VCF comparison

Bioinformatics (2017) 33 (7): 964-970.
该工具将VCF文件中所有的变异替换到参考序列中,生成单个样本的基因组序列。再重新call variants,生成标准的格式,便于比较。[这个比较有意思,对于indel,即使同样的变异,samtools和gatk纪录的形式不同,没法比较,通过该工具可能可以解决。]

Biomartr: genomic data retrieval with R

Bioinformatics (2017) 33 (8): 1216-1217.
用来从NCBI上面下载数据(参考序列,数据库等)的R包。

GWAlpha: genome-wide estimation of additive effects (alpha) based on trait quantile distribution from pool-sequencing experiments

Bioinformatics (2017) 33 (8): 1246-1247.
通过混池测序,估计加性效应值。

Human Demographic History Impacts Genetic Risk Prediction across Diverse Populations30107-6)

AJHG 100, 635–649, April 6, 2017
人类群体历史影响遗传风险预测。在一个群体中预测的疾病相关位点,也许并不适用于另一个群体。

De novo assembly of the Aedes aegypti genome using Hi-C yields chromosome-length scaffolds

Science 07 Apr 2017: Vol. 356, Issue 6333, pp. 92-95
利用Hi-C技术辅助组装,将伊蚊基因组组装到染色体水平。

A chromosome conformation capture ordered sequence of the barley genome

Nature 544, 427–433 (27 April 2017)
大麦基因组发表

SynthEx: a synthetic-normal-based DNA sequencing tool for copy number alteration detection and tumor heterogeneity profiling

Genome Biology 2017
基于全基因组或全外显子组测序的拷贝数变异检测工具。其能力和基于芯片的软件相当,胜过其它基于测序的软件。

Ancient genomic changes associated with domestication of the horse

Science 28 Apr 2017
研究人员对14匹距今2000~4000年的古马进行全基因组测序,揭示马的驯化过程。

Genetic signatures of high-altitude adaptation in Tibetans

PNAS April 18, 2017 vol. 114 no. 16 4189-4194
文章结合了3,008个藏族人7.3 M SNP 芯片数据以及7,287个非藏族东亚人数据,揭示了藏族人适应高原环境基因。

Parallel adaptive evolution of geographically distant herring populations on both sides of the North Atlantic Ocean

PNAS April 25, 2017 vol. 114 no. 17 E3452-E3461
北大西洋鲱鱼的平行进化。

Finding a Needle in a Haystack: Distinguishing Mexican Maize Landraces Using a Small Number of SNPs

Front. Genet., 18 April 2017
作者通过50个样本(5个不同地方种)的50k芯片数据,筛选出了用于区分不同地方种的SNPs。“we identified 20 landrace-informative SNPs and 14 altitude-informative SNPs.”

Full Chloroplast Genome Assembly of 11 Diverse Watermelon Accessions

Front. Genet., 18 April 2017
11个西瓜全叶绿体基因组序列。

Analytical Biases Associated with GC-Content in Molecular Evolution

Front. Genet., 15 February 2017
碱基组成(GC含量)在不同位点或分类群的异质性,会使分子进化分析产生偏好性,如构建系统发育树,检测自然选择或估计密码子使用率。文章对产生偏好的原因以及避开偏好的方法进行了综述。

A genome-wide association study identifies six novel risk loci for primary biliary cholangitis

Nature Communications 8, Article number: 14828 (2017)
全基因组关联分析鉴定6个新的原发胆汁性胆管炎风险位点。

Genome assembly with in vitro proximity ligation data and whole-genome triplication in lettuce

Nature Communications 8, Article number: 14953 (2017)
生菜基因组,2.7 G。用in vitro proximity ligation数据锚定小scaffold。

Reconstructing the genome of the most recent common ancestor of flowering plants

Nature Genetics 49, 490–496 (2017)
开花植物最近共同祖先基因组构建。

Asymmetric subgenome selection and cis-regulatory divergence during cotton domestication

Nature Genetics 49, 579–587 (2017)
野生和栽培棉花揭示驯化过程中受选择基因。

Fast, scalable prediction of deleterious noncoding variants from functional and population genomic data

Nature Genetics 49, 618–624 (2017)
有害非编码突变预测。(是否适合非模式生物?)

Single-molecule sequencing and chromatin conformation capture enable de novo reference assembly of the domestic goat genome

Nature Genetics 49, 643–650 (2017)
通过单分子测序和染色体构像捕获组装山羊基因组。

Scallop genome provides insights into evolution of bilaterian karyotype and development

Nature Ecology & Evolution 1, Article number: 0120 (2017)
扇贝基因组。

如果我的博客能帮你节约时间,我会非常高兴你请我喝杯咖啡。