留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

白边侧足海天牛全基因组Survey分析

李歆毓 丁梦莹 冯尔辉 张源源 章可兰 万迎朗

李歆毓,丁梦莹,冯尔辉,等. 白边侧足海天牛全基因组Survey分析[J]. 热带生物学报,2022, 13(5):457−463. DOI:10.15886/j.cnki.rdswxb.2022.05.005 doi:  10.15886/j.cnki.rdswxb.2022.05.005
引用本文: 李歆毓,丁梦莹,冯尔辉,等. 白边侧足海天牛全基因组Survey分析[J]. 热带生物学报,2022, 13(5):457−463. DOI:10.15886/j.cnki.rdswxb.2022.05.005 doi:  10.15886/j.cnki.rdswxb.2022.05.005
LI Xinyu, DING Mengying, FENG Erhui, ZHANG Yuanyuan, ZHANG Kelan, WAN Yinglang. Whole genome survey analysis of Elysia leucolegnote[J]. Journal of Tropical Biology, 2022, 13(5): 457-463. doi: 10.15886/j.cnki.rdswxb.2022.05.005
Citation: LI Xinyu, DING Mengying, FENG Erhui, ZHANG Yuanyuan, ZHANG Kelan, WAN Yinglang. Whole genome survey analysis of Elysia leucolegnote[J]. Journal of Tropical Biology, 2022, 13(5): 457-463. doi: 10.15886/j.cnki.rdswxb.2022.05.005

白边侧足海天牛全基因组Survey分析

doi: 10.15886/j.cnki.rdswxb.2022.05.005
基金项目: 海南省自然科学自然科学基金 (No.2019RCI55)
详细信息
    第一作者:

    李歆毓(1994−),女,海南大学热带作物学院2019级博士研究生. E-mail:xinyul@163.com

    通信作者:

    万迎朗(1976−),男,教授. 研究方向:热带作物遗传育种. E-mail:ylwan@hainanu.edu.cn

  • 中图分类号: Q 78

Whole genome survey analysis of Elysia leucolegnote

  • 摘要: 为揭示白边侧足海天牛基因组的信息,以便为后续构建全基因组精细图谱提供基础,利用流式细胞术与高通量测序技术对白边侧足海天牛全基因组进行了Survey分析。结果表明,流式细胞术预测白边侧足海天牛基因组是84K杨的1.69倍,约为794.6 Mb。白边侧足海天牛高通量测序得到25 Gb的过滤数据,总测序深度约为30 x,根据17-mer分析,预测海天牛基因组大小约为724.8 Mb,基因组重复率为52.8%,杂合度为1.55%,模型拟合值为99.38%;根据19-mer分析,预测海天牛基因组大小约为730.8 Mb,基因组重复率为35.1%,杂合度为1.68%,模型拟合值为99.72%。最后,对白边侧足海天牛尝试初步组装后得到总长为628 Mb的基因组。研究结果显示,白边侧足海天牛是一个高度杂合的物种,且其基因组大小超过700 Mb。
  • 图  2  白边侧足海天牛过滤前后测序情况

    A:过滤后序列碱基分布图;B:原始序列碱基分布图;C:过滤后序列测序质量分布图;D:原始序列测序质量分布图。

    图  3  白边侧足海天牛过滤数据情况图

    A:每个位置的碱基的测序质量;B:序列平均GC含量分布图,红线代表实际的GC分布情况,蓝色代表理论的GC分布情况;C:序列测序长度分布;D:全序列的质量得分分布图。

    表  1  基因组序列数据量统计

    数据类型数值
    原始序列数/条 171 847 064
    原始碱基数/bp 25 777 059 600
    过滤序列数/条 167 523 764
    过滤序列所占比例/% 97.48
    过滤碱基数/bp 25 128 564 600
    原始数据Q30比值/% 91.33
    过滤数据Q30比值/% 91.78
    下载: 导出CSV

    表  2  过滤数据的基本信息

    参数数值
    总序列数/条 83761882
    低质量序列数/条 0
    序列长度/bp 150
    G、C碱基含量/% 36
    下载: 导出CSV

    表  3  白边侧足海天牛的K-mer数据统计

    项目17-mer19-mer
    深度 30× 30×
    单倍体基因组长度/ bp 724,811,356 730,805,267
    基因重复序列长度/ bp 382,653,068 256,787,169
    基因特有序列长度/ bp 342,158,287 474,018,098
    杂合度/ % 1.55104 1.67714
    模型拟合/ % 99.3794 99.7184
    读错误率/ % 0.148872 0.206886
    下载: 导出CSV

    表  4  白边侧足海天牛预组装结果统计

    类型Scaffold
    长度/bp

    数量/条
    Contig
    长度/bp

    数量/条
    N50373405072358419361
    N60273602827262624669
    N70204870539195903051
    N8015512258461501271270
    N9012216849831201739030
    最长片段224241224241
    总计62857465322586936248547642313267
    下载: 导出CSV
  • [1] ASSUYUTI Y, YUSLI W. New distribution record of Elysia leucolegnote (Jensen, 1990) (Sacoglossa Plakobranchidae) in mangrove ecosystem of Biak Numfor [J]. Papua-Indonesia. Biodiversity Journal, 2020, 11: 259 − 262.
    [2] 李歆毓, 崔闯, 安启源, 等. 海南省海口市发现白边侧足海天牛[J]. 动物学杂志, 2021, 56(4): 631 − 635.
    [3] SANCHEZ-ESCALONA, KATHERINE. Elysia leucolegnote (Ophistobranchia: Sacoglossa) Jensen 1990, a new record for the Verde Island Passage[J], Philippines, 2021, 11: 42–48.
    [4] JENSEN K. Three new species of Ascoglossa (Mollusca, Opisthobranchia) from Hong Kong, and a description of the internal anatomy of Costasiella pallida Jensen, 1985[M]. //Proceedings of the 2nd International Marine Biological Workshop: The marine Flora and Fauna of Hong Kong and Southern . Hong Kong:Hong Kong University Press, 1986:419-432. .
    [5] 尤仲杰, 林光宇. 中国近海海天牛科(后鳃类)的研究[J]. 浙江海洋学院学报(自然科学版), 2007, 26(4): 363 − 370.
    [6] DE VRIES J, ARCHIBALD J M. Plastid autonomy vs nuclear control over plastid function [J]. Elsevier ltd. Adv Bot Res., 2018, 85: 1 − 28.
    [7] MAEDA T, TAKAHASHI S, YOSHIDA T, et al. Chloroplast acquisition without the gene transfer in kleptoplastic sea slugs, Plakobranchus ocellatus [J]. Elife., 2021, 10: e60176. doi:  10.7554/eLife.60176
    [8] CHRISTA G, HäNDELER K, SCHäBERLE T F, et al. Identification of sequestered chloroplasts in photosynthetic and non-photosynthetic sacoglossan sea slugs (Mollusca, Gastropoda) [J]. Front Zool, 2014, 11(1): 15. doi:  10.1186/1742-9994-11-15
    [9] MUJER C V, ANDREWS D L, MANHART J R, et al. Chloroplast genes are expressed during intracellular symbiotic association of Vaucheria litorea plastids with the sea slug Elysia chlorotica [J]. Proc Natl Acad Sci USA, 1996, 93: 12333 − 12338. doi:  10.1073/pnas.93.22.12333
    [10] RUMPHO M E, WORFUL J M, LEE J, et al. Horizontal gene transfer of the algal nuclear gene psbO to the photosynthetic sea slug Elysia chlorotica [J]. Proc Natl Acad Sci USA, 2008, 105: 17867 − 17871. doi:  10.1073/pnas.0804968105
    [11] BHATTACHARYA D, PELLETREAU K N, PRICE D C, et al. Genome analysis of Elysia chlorotica egg DNA provides no evidence for horizontal gene transfer into the germ line of this kleptoplastic mollusk [J]. Mol Biol Evol, 2013, 30: 1843 − 1852. doi:  10.1093/molbev/mst084
    [12] CAI H, LI Q, FANG X, et al. Data descriptor: A draft genome assembly of the solar-powered sea slug Elysia chlorotica [J]. Sci Data, 2019, ( 6): 1 − 13. doi:  10.1038/s41597-018-0005-2
    [13] CHIHARA S, NAKAMURA T, HIROSE E. Seasonality and longevity of the functional chloroplasts retained by the sacoglossan sea slug Plakobranchus ocellatus van Hasselt, 1824 inhabiting a subtropical back reef off Okinawa-jima Island, Japan [J]. Zool Stud., 2020, 59: e65.
    [14] MELO CLAVIJO J, FRANKENBACH S, FIDALGO C, et al. Identification of scavenger receptors and thrombospondin-type-1 repeat proteins potentially relevant for plastid recognition in Sacoglossa [J]. Ecol Evol, 2020, 10(21): 12348 − 12363. doi:  10.1002/ece3.6865
    [15] HAVURINNE V, HANDRICH M, ANTINLUOMA M, et al. Genetic autonomy and low singlet oxygen yield support kleptoplast functionality in photosynthetic sea slugs [J]. J Exp Bot., 2021, 72(15): 5553 − 5568. doi:  10.1093/jxb/erab216
    [16] HAVURINNE V, TYYSTJäRVI E. Photosynthetic sea slugs induce protective changes to the light reactions of the chloroplasts they steal from algae [J]. Elife., 2020, 9: e57389. doi:  10.7554/eLife.57389
    [17] STAMATAKIS K, VAYENOS D, KOTAKIS C, et al. The extraordinary longevity of kleptoplasts derived from the Ross Sea haptophyte Phaeocystis antarctica within dinoflagellate host cells relates to the diminished role of the oxygen-evolving Photosystem II and to supplementary light harvesting by mycosporine-like amino acids [J]. Biochim Biophys Acta Bioenerg, 2017, 1858(2): 189 − 195. doi:  10.1016/j.bbabio.2016.12.002
    [18] 李蔚, 刘莉莎, 李仁, 等. 十字花科蔬菜基因组含量的测定与分析[J]. 植物遗传资源学报, 2011, 12(1): 103 − 106.
    [19] 杨勇, 陈克成, 孙天恩. 对几种百合科植物基因组大小的评价[J]. 武汉植物学研究, 1996, 14(3): 199 − 203.
    [20] MOYANO J, RODRIGUEZ-CABAL M A, NUñEZ M A. Invasive trees rely more on mycorrhizas, countering the ideal-weed hypothesis [J]. Ecology, 2021, 102(5): e03330.
    [21] SHANGGUAN W, YONGJIU D, BAOYUAN L, et al. A China dataset of soil properties for land surface modeling [J]. Adv Model. Earth Syst, 2013, 5: 212 − 224. doi:  10.1002/jame.20026
    [22] 陈双双, 齐香玉, 冯景, 等. 基于流式细胞术和基因组Survey的绣球基因组大小及特征分析[J]. 江苏农业科学, 2021, 49(12): 6.
    [23] 霍恺森, 曹清河, 王珧, 等. 甘薯近缘野生种Ipomoea Littoralis全基因组Survey分析[J]. 热带作物学报, 2019, 40(10): 2001 − 2005. doi:  10.3969/j.issn.1000-2561.2019.10.012
    [24] LU MIN, AN HUAMING, LI LIANGLIANG. Genome survey sequencing for the characterization of the genetic background of Rosa roxburghii tratt and leaf ascorbate metabolism genes [J]. PloS one, 2016, 11(2): e0147530. doi:  10.1371/journal.pone.0147530
    [25] 许亚龙, 金静静, 赵艳珍, 等. 基于高通量测序的烟草甲基因组调查分析[J]. 烟草科技, 2020, 53(11): 1 − 6.
    [26] CHAN C X, VAYSBERG P, PRICE D C, et al. Active host response to algal symbionts in the sea slug Elysia chlorotica [J]. Mol Biol Evol, 2018, 35: 1706 − 1711. doi:  10.1093/molbev/msy061
    [27] CHRISTA G, ZIMORSKI V, WOEHLE C, et al. Plastid-bearing sea slugs fix CO2 in the light but do not require photosynthesis to survive [J]. Proc Biol Sci, 2013, 281(1774): 2493.
    [28] TRENCH R K. Chloroplasts as functional endosymbionts in the mollusc Tridachia crispata (Bërgh), (Opisthobranchia, Sacoglossa) [J]. Nature, 1969, 222(5198): 1071 − 1072. doi:  10.1038/2221071a0
    [29] HäNDELER K, GRZYMBOWSKI Y P, KRUG P J, et al. Functional chloroplasts in metazoan cells – a unique evolutionary strategy in animal life [J]. Front Zool., 2009, 6(1): 28. doi:  10.1186/1742-9994-6-28
    [30] PIERCE S K, CURTIS N E, MASSEY S E, et al. A morphological and molecular comparison between Elysia crispata and a new species of kleptoplastic sacoglossan sea slug (Gastropoda: Opisthobranchia) from the Florida Keys, USA [J]. Mollus Res, 2006, 26(1): 23 − 38.
    [31] CHRISTA G, GOULD S B, FRANKEN J, et al. Functional kleptoplasty in a limapontioidean genus: phylogeny, food preferences and photosynthesis in Costasiella with a focus on C. ocellifera (Gastropoda: Sacoglossa) [J]. J Mollus Stud, 2014, 80(5): 499 − 507. doi:  10.1093/mollus/eyu026
    [32] FAN X, QIAO H, XU D, et al. Short-term retention of kleptoplasty from a green alga (Bryopsis) in the sea slug Placida sp. YS001 [J]. Biologia, 2014, 69: 635 − 643. doi:  10.2478/s11756-014-0355-y
    [33] DE VRIES J, CHRISTA G, GOULD S B. Plastid survival in the cytosol of animal cells [J]. Trends Plant Sci, 2014, 19(6): 347 − 350. doi:  10.1016/j.tplants.2014.03.010
    [34] CHRISTA G, PÜTZ L, SICKINGER C, et al. Non-photochemical quenching does not prevent kleptoplasts from net photoinactivation [J]. Frontiers in Ecology and Evolution, 2018, 6: 121. doi:  10.3389/fevo.2018.00121
    [35] TORRES J P, LIN Z, WINTER J M, et al. Animal biosynthesis of complex polyketides in a photosynthetic partnership [J]. Nat Commun, 2020, 11(1): 2882. doi:  10.1038/s41467-020-16376-5
    [36] HANTEN J J, PIERCE S K. Synthesis of several light-harvesting complex I polypeptides is blocked by cycloheximide in symbiotic chloroplasts in the sea slug, Elysia Chlorotica (Gould): a case for horizontal gene transfer between alga and animal? [J]. Biological Bulletin, 2001, 201(1): 34 − 44. doi:  10.2307/1543523
    [37] CAI H, LI Q, FANG X, et al. A draft genome assembly of the solar-powered sea slug Elysia chlorotica [J]. Sci Data, 2019, 6: 190022. doi:  10.1038/sdata.2019.22
    [38] MENG X, FU Q, LUAN S, et al. Genome survey and high-resolution genetic map provide valuable genetic resources for Fenneropenaeus chinensis [J]. Sci Rep, 2021, 11(1): 7533. doi:  10.1038/s41598-021-87237-4
    [39] 江思容, 夏志强, 张辰笈, 等. 芭蕉芋和美人蕉全基因组Survey分析[J]. 分子植物育种, 2022,20(3): 765 − 771.
    [40] MIYASHITA T, ARAKI H, HOSHINO Y. Ploidy distribution and DNA content variations of Lonicera caerulea (Caprifoliaceae) in Japan [J]. J Plant Res, 2011, 124(1): 1 − 9. doi:  10.1007/s10265-010-0341-6
    [41] BENNETT M D, LEITCH I J. Nuclear DNA amounts in angiosperms: targets, trends and tomorrow [J]. Annals of botany, 2011, 107(3): 467 − 590. doi:  10.1093/aob/mcq258
    [42] VURTURE, GREGORY W, SEDLAZECK, et al. Genome scope: fast reference-free genome profiling from short reads [J]. Bioinformatics, 2017, 33(14): 2202 − 2204. doi:  10.1093/bioinformatics/btx153
    [43] 刘贵明. 农作物参考基因组的组装和基于高通量测序的表观调控技术及应用[C]//“农业健康与环境”组学大数据整合生物信息学研讨会. 蒙古民族大学、浙江省生物信息学学会、浙江省科学技术协会, 2017.
    [44] IMAKAEV M, FUDENBERG G, MCCORD R P, et al. Iterative correction of Hi-C data reveals hallmarks of chromosome organization [J]. Nat Methods, 2012, 9: 999 − 1003. doi:  10.1038/nmeth.2148
  • [1] 贾素行, 朱寿松, 符仁稳, 李春霞, 陈银华.  木薯MePPD3基因的克隆及功能分析 . 热带生物学报, 2024, 15(1): 10-18. doi: 10.15886/j.cnki.rdswxb.20230035
    [2] 朱昆宇, 潘成才, 吉怡颖, 王宇, 周扬, 江行玉.  盐胁迫下冰菜盐囊泡细胞的比较代谢组学分析 . 热带生物学报, 2024, 15(2): 224-231. doi: 10.15886/j.cnki.rdswxb.20230020
    [3] 李佳雪, 丁一, 王猛, 李涛, 郭攀阳, 刘成立, 韦双双, 黄家权, 李洪立, 胡文斌, 汤华.  火龙果HubHLH基因家族的全基因组分析及其对冬季补光诱导开花的表达响应 . 热带生物学报, 2024, 15(2): 198-209. doi: 10.15886/j.cnki.rdswxb.20220108
    [4] 董晨, 郑雪文, 王弋, 全振炫, 李伟才.  荔枝GRF基因家族的全基因组鉴定及表达分析 . 热带生物学报, 2024, 15(2): 190-197. doi: 10.15886/j.cnki.rdswxb.20230099
    [5] 金海峰, 王朝政, 侯清芳, 咸利民, 张华剑, 吴少英.  普通大蓟马MuRhodopsin基因的全长克隆及生物信息学分析 . 热带生物学报, 2023, 14(6): 651-659. doi: 10.15886/j.cnki.rdswxb.20220105
    [6] 王正磊, 刘凯扬, 袁琳琳, 李芬, 吴少英.  斑翅果蝇解毒代谢相关基因的鉴定与分析 . 热带生物学报, 2023, 14(6): 660-667. doi: 10.15886/j.cnki.rdswxb.20230009
    [7] 王宇航, 孟秀利, 黄山春, 林兆威, 宋薇薇, 唐庆华, 覃伟权.  双条拂粉蚧基因组DNA提取方法的比较和优化 . 热带生物学报, 2023, 14(6): 636-641. doi: 10.15886/j.cnki.rdswxb.20220085
    [8] 邓渊, 赖军, 毛梦迪, 张越冉, 李淳, 杨君, 王守创, 罗杰.  通过整合转录组与代谢组解析不同类型椰子的脂肪酸调控网络 . 热带生物学报, 2022, 13(5): 478-487. doi: 10.15886/j.cnki.rdswxb.2022.05.008
    [9] 武映宏, 黄东益, 王永, 张大鹏, 刘蕊, 孙熹微, 肖勇.  椰子ALDH基因家族的鉴定及生物信息学分析 . 热带生物学报, 2022, 13(6): 541-549. doi: 10.15886/j.cnki.rdswxb.2022.06.001
    [10] 符丹凤, 刘洪涛, 杨明秋, 何玉贵.  斑节对虾PmML1PmML2基因的鉴定及表达分析 . 热带生物学报, 2022, 13(5): 440-450. doi: 10.15886/j.cnki.rdswxb.2022.05.003
    [11] 潘雪莲, 杨磊, 袁琳琳, 陈龙威, 吴少英.  豆大蓟马钠离子通道基因克隆及分析 . 热带生物学报, 2022, 13(3): 249-258. doi: 10.15886/j.cnki.rdswxb.2022.03.007
    [12] 全飞, 兰国玉, 魏亚情, 李明美, 孙树晴, 杜昊楠.  基于宏基因组测序的橡胶林病原微生物的分析 . 热带生物学报, 2022, 13(1): 27-35. doi: 10.15886/j.cnki.rdswxb.2022.01.005
    [13] 韩语, 王昕, 潘纪汶, 杨诺, 郭桂英, 李迁, 曾纪锋, 郑继平.  鳄鱼源气单胞菌的毒力基因与耐药特性分析 . 热带生物学报, 2021, 12(1): 96-102. doi: 10.15886/j.cnki.rdswxb.2021.01.014
    [14] 董晨, 魏永赞, 王弋, 郑雪文, 李伟才.  转录组荔枝Dof基因家族的鉴定及其表达 . 热带生物学报, 2021, 12(1): 7-14. doi: 10.15886/j.cnki.rdswxb.2021.01.002
    [15] 闫冰玉, 巩笑笑, 谭玉荣, 王丹, 高璇, 张恒, 李双江, 王鹏, 潘英文, 刘进平.  文心兰OnRR10基因的克隆及表达分析 . 热带生物学报, 2020, 11(3): 288-295. doi: 10.15886/j.cnki.rdswxb.2020.03.005
    [16] 宋娜, 张刘宁颖, 曹敏, 郭文雅, 洪雨慧, 吴金山, 陈银华, 于晓惠.  木薯ERF转录因子调控的靶基因筛选与表达分析 . 热带生物学报, 2020, 11(2): 177-189. doi: 10.15886/j.cnki.rdswxb.2020.02.008
    [17] 白雪杨, 陈秀珍, 黄天帆, 江行玉, 周扬.  盐胁迫下拟南芥SCAMP基因克隆和表达的生物信息学分析 . 热带生物学报, 2020, 11(2): 138-144. doi: 10.15886/j.cnki.rdswxb.2020.02.003
    [18] 代佳妮, 于靖, 郑蔚, 王健, 吴友根, 胡新文, 赖杭桂.  海南油茶2个优良单株的比较转录组学分析 . 热带生物学报, 2020, 11(4): 426-436. doi: 10.15886/j.cnki.rdswxb.2020.04.005
    [19] 王子贺, 兰坚强, 廖承红, 韩谦.  天维菌素处理埃及伊蚊幼虫的转录组学分析 . 热带生物学报, 2020, 11(3): 281-287. doi: 10.15886/j.cnki.rdswxb.2020.03.004
    [20] 陈婉姨, 李新佳, 罗素兰, 长孙东亭.  信号芋螺基因组DNA提取方法的优化 . 热带生物学报, 2020, 11(2): 238-244, 250. doi: 10.15886/j.cnki.rdswxb.2020.00.015
  • 加载中
图(3) / 表 (4)
计量
  • 文章访问数:  935
  • HTML全文浏览量:  317
  • PDF下载量:  43
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-11-04
  • 录用日期:  2022-03-31
  • 修回日期:  2022-04-12
  • 网络出版日期:  2022-07-12
  • 刊出日期:  2022-09-21

白边侧足海天牛全基因组Survey分析

doi: 10.15886/j.cnki.rdswxb.2022.05.005
    基金项目:  海南省自然科学自然科学基金 (No.2019RCI55)
    作者简介:

    李歆毓(1994−),女,海南大学热带作物学院2019级博士研究生. E-mail:xinyul@163.com

    通讯作者: 万迎朗(1976−),男,教授. 研究方向:热带作物遗传育种. E-mail:ylwan@hainanu.edu.cn
  • 中图分类号: Q 78

摘要: 为揭示白边侧足海天牛基因组的信息,以便为后续构建全基因组精细图谱提供基础,利用流式细胞术与高通量测序技术对白边侧足海天牛全基因组进行了Survey分析。结果表明,流式细胞术预测白边侧足海天牛基因组是84K杨的1.69倍,约为794.6 Mb。白边侧足海天牛高通量测序得到25 Gb的过滤数据,总测序深度约为30 x,根据17-mer分析,预测海天牛基因组大小约为724.8 Mb,基因组重复率为52.8%,杂合度为1.55%,模型拟合值为99.38%;根据19-mer分析,预测海天牛基因组大小约为730.8 Mb,基因组重复率为35.1%,杂合度为1.68%,模型拟合值为99.72%。最后,对白边侧足海天牛尝试初步组装后得到总长为628 Mb的基因组。研究结果显示,白边侧足海天牛是一个高度杂合的物种,且其基因组大小超过700 Mb。

English Abstract

李歆毓,丁梦莹,冯尔辉,等. 白边侧足海天牛全基因组Survey分析[J]. 热带生物学报,2022, 13(5):457−463. DOI:10.15886/j.cnki.rdswxb.2022.05.005 doi:  10.15886/j.cnki.rdswxb.2022.05.005
引用本文: 李歆毓,丁梦莹,冯尔辉,等. 白边侧足海天牛全基因组Survey分析[J]. 热带生物学报,2022, 13(5):457−463. DOI:10.15886/j.cnki.rdswxb.2022.05.005 doi:  10.15886/j.cnki.rdswxb.2022.05.005
LI Xinyu, DING Mengying, FENG Erhui, ZHANG Yuanyuan, ZHANG Kelan, WAN Yinglang. Whole genome survey analysis of Elysia leucolegnote[J]. Journal of Tropical Biology, 2022, 13(5): 457-463. doi: 10.15886/j.cnki.rdswxb.2022.05.005
Citation: LI Xinyu, DING Mengying, FENG Erhui, ZHANG Yuanyuan, ZHANG Kelan, WAN Yinglang. Whole genome survey analysis of Elysia leucolegnote[J]. Journal of Tropical Biology, 2022, 13(5): 457-463. doi: 10.15886/j.cnki.rdswxb.2022.05.005
  • 白边侧足海天牛(Elysia leucolegnote)属于软体动物门囊舌目(Sacoglossa)海天牛超科(Elysioidea)海天牛属(Elysia),该种分布于中国的香港[1]、海口[2]以及泰国[3]、菲律宾[4]等地红树林。目前,在我国已报道有8种海天牛的分布记录[15]。海天牛属部分种具有保留藻类叶绿体并使其发挥光合作用的能力[6-7]。这种被吸收后且继续发挥功能的叶绿体被称为盗质体[8]。不同物种的盗质体寿命的决定因素和盗质体发挥功能的分子机制等相关的研究[9-13] 对叶绿体的内共生理论的揭示[14]以及指导植物抗逆方案的设计都具有重要的意义[15-17],但受限于光合软体动物材料的稀缺性,此相关研究的规模十分有限。白边侧足海天牛在我国的分布有利于科研人员就地取材,为我国在此方向的深入研究提供了独特的材料。分子机制的揭示离不开物种基因组的信息。海天牛属目前尚未有染色体水平上的高质量基因组的报道。基因组已经成为深入研究分子机制的关键内容。基因组含量在同一个物种里是保持稳定的[18-20]。高通量测序为一种广泛用于多种动植物基因组测序的技术[21],将高通量获得的原始数据通过质控以后,利用K-mer分析法评估基因组大小、杂合度和重复率等特征[22-23]。基因组测序大大促进了动植物的遗传进化及功能基因研究,但深度测序之前的低覆盖度的全基因组调查尤为重要,因为其可以决定基因组测序中的最合适的测序、拼装方式[24]。本实验旨在采用高通量测序技术结合K-mer分析[25],对白边侧足海天牛基因组进行测定及评估,为后续深度测序提供基础信息。

    • 供试材料白边侧足海天牛(以下简称为海天牛)收集于海南省海口市东寨港红树林保护区(110°38′26″ E, 19°56′31″N),并于海南大学热带作物学院饲养,84K杨树由北京林业大学细胞生物学实验室王鑫伟提供。

    • 取海天牛和84K杨树幼嫩新鲜叶片1 g,置于盛有500 μL细胞裂解液Galbraith中,并迅速将其切碎。细胞核通过30 µm滤膜后,与1 mL浓度为10 µg·mL−1的PI(碘化丙啶)染色液混合,室温孵育30 s后上机检测。使用CyFlow®Cube8(希森美康,日本)流式细胞仪对海天牛基因组大小进行评估,变异系数控制在5%以内。每个样品重复3次。

    • 粉碎合格的DNA样品为350 bp左右的目的片段,构建文库,经过末端修复、加A、加接头、目标片段选择和PCR等步骤,用安捷伦2100 和定量PCR的方法检测文库片段大小和文库定量,以确定文库是否符合测序标准,通过桥式PCR的方法将文库固定到测序芯片上;将这些两端的片段在 Illumina Hiseq Xten(Illumina, U.S)测序仪上进行双末端(Paired-End)测序,获得全基因组测序数据,去除未成对匹配的读长(reads)、低质量读长、接头遭受污染以及过滤掉接头重复(duplication)的读长等对测序所产生的数据进行预处理。

    • 比较原始数据与过滤后数据的质量控制数据后,使用FastQC(v 0.11.9)软件对过滤后的数据展开质量控制,包括对数据量的概览,并统计了读长每个位置测序质量,总体reads测序质量趋势,A、T、G、C碱基含量估计测序是否存在偏差,是否存在污染,数据处理时是否需要去冗余;从而实现对前期数据处理时,尽量高标准,严格质量控制。

    • 通过jellyfish-2(v10.7.7)软件对序列文件进行K-mer 的计数和统计;随后,利用负二项式模型(Negative binomial model)对应的软件GenomeScope(v1.0)对基因组大小及其杂合度的评估,并生成最终基因组评估结果。选用K-mer值17、19两种条件对评估结果进行比较。

    • 使用SOAPdenovo2(v2.03)软件对过滤后的数据进行拼接,拼接出Contigs序列,然后组装基因组。SOAPdenovo2的K-mer参数设置29,其他参数选择默认值。再将Contigs序列构图形成Scaffolds序列,并利用不同插入片段估计出 Contigs间的距离,用N 碱基填起来。最后,再利用测序的双末端数据之间的配对关系(Paired-End)以及短Reads数据对已组装的Contigs的覆盖信息,对Contigs间空隙(“N”)进行局部组装,补充Contigs信息,适当延长 Contigs序列。有效数据与原始序列进行对比后获得碱基深度,在序列上以5 kb为窗口,无重复前进,从而得到GC depth点图,对组装后的基因组进行评估。

    • 基于流式细胞术分析海天牛基因组大小,当变异系数控制在 5% 以内时,以84K杨作为对照样品(图1-A)信号峰清晰集中,84K杨与海天牛的混合样品的信号峰独立分离且距离较近(图1-B)。利用84K杨作为对照样品,根据混合样品PI 荧光强度以及峰值的倍数关系,计算海天牛基因组是84K杨的1.69倍,84K杨的核DNA相对含量为1.129 20,基因组平均值为470.155 Mb;估算出海天牛的核DNA相对含量为2.218 71,基因组平均值为794.562 Mb。

      图  1  海天牛流式细胞分析

    • 基因组调查利用第二代高通量测序技术进行双末端测序,获得全基因组的序列结果。测序共得到海天牛原始数据约25.8 Gb,共171 847 064条原始序列;过滤后约25.1 Gb,原始数据Q30比例为91.33%,过滤后Q30 比例为91.78%,满足基因组调查需要的测序数据量(表1)。比较原始数据与过滤数据(表2)的碱基的分布情况(图2-A、 2-B),过滤前后除了测序时前几个bp碱基含量略有波动属正常现象,其余每个测序位置A碱基和T碱比例相等,G碱基和C碱基比例相等,N碱基的数量为0。原始数据与过滤后数据的测序质量分布在Q30到Q40之间,Q30序列占比高,表明测序结果质量高可用于后续分析。

      表 1  基因组序列数据量统计

      数据类型数值
      原始序列数/条 171 847 064
      原始碱基数/bp 25 777 059 600
      过滤序列数/条 167 523 764
      过滤序列所占比例/% 97.48
      过滤碱基数/bp 25 128 564 600
      原始数据Q30比值/% 91.33
      过滤数据Q30比值/% 91.78

      图  2  白边侧足海天牛过滤前后测序情况

      过滤数据所有读长上的碱基质量值大于30且波动小,说明过滤后数据质量稳定(图3-A);实际G、C碱基含量与理论G、C碱基含量都在38%左右出现峰值,且没有明显的偏差,表明测序结果没有偏向性(图3-B);过滤后所有的数据读长都为150 bp(图3-C);全部序列达到Q20,超过95%序列达到Q30,且集中在Q36(表2)。以上结果表明,过滤后的数据读长长,质量高,没有碱基偏好性适用于K-mer分析。

      图  3  白边侧足海天牛过滤数据情况图

    • 使用K-mer的分析方法可以预测白边侧足海天牛的基因组特征。选择K-mer的条件为17和19展开分析,样本17-mer和19-mer分布曲线为非正常泊松分布,呈现双峰分布,在17×和27×附近各有1个峰值(图3-A、图3-B)。总测序深度约为30×,根据17-mer分析,预测海天牛基因组大小约为724.8 Mb,基因组重复率为52.8%,杂合度为1.55%,模型拟合值为99.38%;19-mer分析预测海天牛基因组大小约为730.8 Mb,基因组重复率为35.1%,杂合度为1.68%,模型拟合值为99.72%(表3)。

      表 2  过滤数据的基本信息

      参数数值
      总序列数/条 83761882
      低质量序列数/条 0
      序列长度/bp 150
      G、C碱基含量/% 36

      表 3  白边侧足海天牛的K-mer数据统计

      项目17-mer19-mer
      深度 30× 30×
      单倍体基因组长度/ bp 724,811,356 730,805,267
      基因重复序列长度/ bp 382,653,068 256,787,169
      基因特有序列长度/ bp 342,158,287 474,018,098
      杂合度/ % 1.55104 1.67714
      模型拟合/ % 99.3794 99.7184
      读错误率/ % 0.148872 0.206886
    • 选用SOAPdenovo2软件对海天牛样本进行预组装,设置K-mer参数为29时,在scaffold尺度上,得到含N碱基的基因组大小628 574 653 bp,不含N的基因组大小627 289 254 bp;Scaffold N50长度为373 bp,共405 072条;Scaffold数量2 258 693条,最长的scaffold长度为22 424 bp。在contig的尺度上,以contig N50为358 bp数量有419 361条。得到含N碱基的基因组大小624 854 764 bp,不含N的基因组大小624 854 764 bp,最长的contig为22 424 bp(表4)。组装成Scaffold的contig的数量为168 878条,每个scaffold的平均contig数目为1.5。除此,还得到scaffold尺度上的各碱基的含量,碱基A数量为207 638 986 bp,占总的碱基数目的33.03%;碱基C数量为110 706 106 bp,占总的碱基数目的17.61%;碱基G数量为109 134 885 bp,占总的碱基数目的17.36%;碱基T与碱基A的数量及占比基本相同,碱基T数量为199 809 277 bp占总的碱基数目的31.79%;剩下的所有为碱基N,数量为1 285 399 bp,占总的碱基数目的0.20%。最后计算得到G、C碱基含量为35.05%。GC-depth分析显示,测序无偏向性;平均深度集中在30×,GC 深度分布被分为2层。

      表 4  白边侧足海天牛预组装结果统计

      类型Scaffold
      长度/bp

      数量/条
      Contig
      长度/bp

      数量/条
      N50373405072358419361
      N60273602827262624669
      N70204870539195903051
      N8015512258461501271270
      N9012216849831201739030
      最长片段224241224241
      总计62857465322586936248547642313267
    • 目前,在我国已报道有8种海天牛的分布记录[15],其中部分海天牛具有利用藻类叶绿体进行光合作用的能力。盗质体寿命是不等的,有的盗质体能维持长达9个月[26],而有的只能维持短短的几个小时。根据叶绿体在海天牛中停留的时间将海天牛分为三类,第一类为长时间保存叶绿体物种(long-term retention (LtR) slugs),已报道的包括E. chlorotica, E. timida, E. crispata, E. clarki, E. viridis, Plakobranchus ocellatus and Costasiella ocellifera[27-30];第二类是短时间保存叶绿体物种(short-term retention species, StR),其对叶绿体的保留时间不超过两周;第三类是不保存叶绿体物种(non-retention species, NR),在食用藻类后迅速分解叶绿体[31]。在本研究中发现,白边侧足海天牛至少能保持盗质体活性2个月以上,属于能长时间保存叶绿体的海天牛。

      对盗质体活性的长期保持依赖于宿主核基因编码的功能基因与盗质体基因的协调表达。例如E. chloroticaE. timida食用藻类的叶绿体基因组中存在一种特定基因(ftsH,一种对光系统II修复至关重要的D1质控蛋白酶)其中M41金属蛋白酶结构域是维持盗质体长期活动的关键[32-33]。同时动物内源的脂肪酸合酶-(FAS)样聚酮合酶(PKS)蛋白也可以提供光保护能力,盗质体固定二氧化碳,固定碳被转化为甲基丙二酰辅酶a,并被软体动物EcPKS1酶修饰,合成紫外线-氧化阻断吡喃,保护软体动物及其叶绿体免受光合损伤[34]。另外,有观点认为吞食叶绿体后从植物中摄取的酶的丰度可能限制盗质体发挥功能。也有一种观念认为,盗质体寿命的维持是通过从藻类细胞核到动物细胞核的广泛水平基因转移(HGT)来实现。但是对于该假说还存在很大的争议,早期研究中,TORRES等证实了核编码的基因在质体核糖体抑制剂存在的条件下可以合成LHCⅠ,并提出可以通过病毒或逆转录病毒实现HTG的假说[35]。这些假说的讨论,都必须基于对海天牛核基因组及其摄取的盗质体基因组的分析研究。

      E. chlorotica的全基因组测序与组装是以二代为主,三代PacBio辅助的scafford的基因组组装水平, 其全基因组大小为557 Mb,scaffold N50为442 kb,BUSCO 注释率为93.3%[36]。海天牛科目前还没有染色体水平的基因组组装结果,所以对海天牛基因组的检测仍旧是一个具有新颖性的课题。基因组调查,也称作Survey,基于深度达到20~30×以上的高质量的二代测序数据对物种的基因组大小与特征进行解读,可以为物种基因组测序方案提供重要的指导[37-38]。在基因组调查的基础上,结合流式细胞仪可提升基因组大小预测结果的精准性[39-40]。本研究中,利用84K杨为对照,通过流式细胞术预测海天牛基因组大小均值为794.562 Mb,K-mer分析的结果显示其基因组大小为724~730 Mb,两者的结果偏差较小,不影响对基因组测序决策的判断 [41]。所有的结果显示,白边侧足海天牛是一个高度杂合的物种,且基因组大小超过700 Mb。为了达到染色体级别的组装水平,全基因组测序建议使用以三代测序技术为主,Hi-C或Hi-Fi技术相结合的测序手段[42-44],测序量达到80×~100×的深度足够完成海天牛基因组的精细组装。

参考文献 (44)

目录

    /

    返回文章
    返回