Long-read sequencing for de novo genome assembly in bioeconomic context

Vogel, Alexander; Usadel, Björn (Thesis advisor); Kurth, Ingo (Thesis advisor); Schaffrath, Ulrich (Thesis advisor)

Aachen : RWTH Aachen University (2020, 2021)
Doktorarbeit

Dissertation, RWTH Aachen University, 2020

Kurzfassung

Neuste Fortschritte im Bereich der third-generation Sequenziertechnologien eröffnen aktuell ungeahnte Möglichkeiten zur DNA Sequenzierung. In dieser Arbeit präsentiere Ich die Optimierung eines Protokolls zur Anreicherung langer Nanopore Reads sowie erforderliche Anpassungen in Bezug auf unterschiedliche Entwicklungsstufen der Technologie sowie Projektanforderungen zur Anwendung zur de novo Genomsequenzierung, Scaffoldassemblierung und dem Nachweis von genomischen Strukturvarianten. Die erzeugten Daten, die von der Anfangsphase der Technolgie bis hin zur aktuellsten Version reichen, wurden zur Untersuchung von Genomen bakterieller, Algen und pflanzlicher Herkunft eingesetzt. Ergänzend und im Vergleich mit alternativen Sequenziertechnologien umfasst die Arbeit die Genomsequenzen des gentechnisch veränderten Bakterienstamms Gluconobacter oxydans IK003.1, fünf verschiedener Chlorella Stämme sowie der Pflanzen Cuscuta campestris, Solanum pennellii LYC1722 und Solanum lycopersicoides. Dabei repräsentiert die Genomsequenz von S. pennellii das erste Pflanzengenom, welches durch Nanoporen sequenziert wurde und stellt dadurch einen bedeutenden öffentlichen Datensatz zur Entwicklung neuer Algorithmen und bioinformatischer Programme dar. In ähnlicher Weise stellen die Genome von Chlorella sorokinana 211-8k und S. lycopersicoides die zur Zeit umfassendsten durch long-read Sequenzierung generierten Genomsequenzen für Algen und Pflanzen dar. In Anbetracht neuster Entwicklungen im sich schnell weiterentwickelnden Feld der Nanoporesequenzierung, vermittelt diese Arbeit detaillierte Einblicke in die aktuellen Grenzen der etablierten Protokolle und identifiziert dabei potentielle Problemstellen zur gleichzeitigen Optimierung der Readlänge sowie der generierten Datenmenge. Gleichzeitig stellen die Projekte eine umfassende Momentaufnahme aktueller Technologien und deren Kombination zur Analyse von Genomen unterschiedlicher Komplexität dar.

Einrichtungen

  • Fachgruppe Biologie [160000]
  • Lehrstuhl für Molekulare Pflanzenphysiologie [161510]

Identifikationsnummern

Downloads