2026年5月,实验室成员陈金慧教授作为通讯作者,郝兆东副教授作为第一作者在Nature communications发表了题为"Genomic insights into the improvement of Chinese fir from ancient domestication continuum to modern breeding"的文章,成功绘制并发表了染色体级高质量的杉木参考基因组研究成果,填补了杉木高质量染色体级参考基因组的空白,并系统解析了这一战略性树种在数千年人工栽培历史下的遗传演化规律,可为相关研究提供重要的基础理论支撑。
杉木(Cunninghamia lanceolata),作为我国人工林“顶梁柱”,种植面积占全国人工林总面积17.33%,蓄积量占比22.30%(参考《中国森林资源报告·2014–2018》),是名副其实的“绿色黄金”。现代杉木遗传育种始于 20 世纪 50 年代末,南京林业大学叶培忠、陈岳武、施季森团队与福建省洋口国有林场开展长期场校合作,建立起"种质收集—遗传测定—良种选育—种子园推广"的完整改良体系,目前已跨入第四个育种周期。而根据考古和史料记载,杉木最早利用历史可最追溯到约5000年前的古越人,人工栽培起源时间可追溯至战国晚期(约公元前239年),是有据可考的世界最早进行规模化人工栽培的用材林树种之一。然而,当我们回望这绵延千年的利用和栽培史,不禁要问:千年人工栽培利用是否导致遗传多样性流失?不同历史时期的种质交流,如何塑造了今天的杉木群体结构?现代育种是否存在“谱系锁定”风险?这些关乎产业可持续发展的核心命题,长期缺乏基因组层面的科学解答。
1. 高质量染色体参考基因组:转座子暴发与窄窗口扩张
通过集成PacBio HiFi(~70x)和Hi-C(~109x)测序技术,成功组装出总大小为11.50 Gb的杉木基因组,Contig N50高达15 Mb,并将99.04%的序列精准锚定至11条拟染色体上。共线性与Ks分析表明,杉木在近期并没有经历裸子植物谱系特异性的全基因组复制(WGD)事件。其庞大的基因组体积主要源于上新世(约3~5 Mya)长末端重复序列逆转录转座子(LTR-RTs,主要为Gypsy成分)的快速爆发式插入。相比于红杉或银杏等在漫长历史中缓慢扩张的裸子植物,杉木受到了在极窄进化窗口内驱动高效扩张的独特谱系压力。
2. 串联与近端复制:驱动环境适应性基因家族扩张
通过与18个代表性陆生植物的比较基因组学分析,明确了杉木属(Cunninghamia)在广义柏科(Cupressaceae)中的姊妹群系统发育位置。研究鉴定到152个显著扩张的基因家族,富集在氧化脂质(Oxylipin)生物合成、α-亚麻酸代谢、泛素介导的蛋白质降解以及细胞壁重塑等通路中,这些通路的扩张可能赋予了杉木高抗逆、快速生长的生物学特性。深入分析复制模式发现,串联复制(TD)和近端复制(PD)在这些扩张家族中被显著富集。更为重要的是,TD和PD来源的基因对表现出更高的Ka/Ks比值和更强的正选择信号。尽管它们可能因物理距离较近保持了相对保守的表达模式,但基因序列的快速分化为杉木增强对环境变化的动态响应能力提供了潜在可利用的基因资源。

图1. 杉木基因组中的基因家族演化
3. 三大核心遗传谱系与历史人工林重塑
通过对源自15个省市的87个地理种源样本(收集于1979年,代表近代大规模种质交流前的“天然”分布)以及15株树龄数百年的历史古树(包括1176年南宋理学家朱熹手植古杉)进行了重测序。系统发育树构建与群体结构分析一致将杉木划分为三个主要的系统发育类群(谱系),但是每个类群中存在明显的“种源”材料交织状态,各省市的样本明显交叉,印证了历史文献中记载的自宋代“大造林”以来,人类长达千年的大范围引种与频繁的种质流转,导致了天然地理隔离的消除。由此研究团队提出假设:基于本研究所涉及的研究材料,现存杉木可能来自人工林,而非天然林。

图2. 杉木种源材料与古树材料的群体分析
进一步将不同系统发育谱系的杉木定位到地图上,发现其存在明显的人工介导的跨区域分布模式,其中第I组明显沿着长江流域分布,第II组以武夷-南岭为核心(杉木中心产区和优质种源区),以及第III组沿客家移民回迁秦岭路线区域分布。值得注意的是,三个系统发育谱系在武夷山地区存在空间上的重叠,暗示该地区可能是历史上杉木种质材料交换和跨区域交流的核心地区。相关史料记载也从侧面验证了这一点,1678年《广东新语》卷二十五《木语》记载“东粤少杉,杉秧多自豫章而至。鬻者为主人辟地种就,乃如株数受植。”。

图3. 杉木系统发育群的地理分布特征
4. 现代育种的谱系选择偏好性
进一步将90个杉木第3代种子园的选优子代个体以及13个生产用优良无性系纳入群体演化矩阵中进行分析。结果表明,现代育种群体在遗传结构上表现出了极强的向第II组谱系(武夷-南岭)集中的偏好性,而几乎包揽了所有古树的第I组谱系在现代高世代改良群体中的遗传贡献率却极低,暗示了现代杉木育种存在一定程度的谱系偏好性。但也要考虑到,本研究仅选用了来自福建地区的两个杉木第3代种子园所获得的优良子代个体,对于其他地区的杉木育种实践是否同样存在如此的谱系偏好性,尚且需要进一步的研究与探讨。

图4. 现代杉木高世代育种材料的群体分析
在育种实践中,杉木早期育种主要偏重于树高、胸径等生长量指标,虽然从第二代开始注重材性和生长的联合遗传改良,第三代引入种子结实性状,但更多的权重还是落在生长量上。这种重生长、轻抗逆的遗传资源非均衡性利用模式若长期持续,将可能加剧杉木人工林遗传脆弱性风险发生。目前,在第四代杉木遗传改良项目中,我们已经优化了权重指标体系,不再一味追求生长量和材性等指标的大幅度增长(事实上经过多代改良,相关指标的提升空间也受限),而是在保证生长量、材性等指标保持不变的前提下,提高抗逆性性状和指标权重来改善对古树所代表的抗逆性资源的利用。
杉木高效繁育与良种创制研究组围绕重要林木用材树种杉木、杂交鹅掌楸和生态树种白刺等开展研究,建立了基于体胚发生体系的快速繁育和基因编辑体系,并实现了林业良种的产业化推广应用,在我国南方公益储备林建设和三北生态防护林建设中发挥了重要作用。团队始终牢记自上世纪50年代起四代科研人员接续奋斗,建立起完整的杉木遗传改良体系。基因组的解码将持续深化基础研究,服务国家种业振兴战略,为筑牢生态安全屏障、保障战略资源供给贡献更多“南林智慧”。