ZiF-Arbeitsgemeinschaft
Plakat

Computergestützte Pangenomik


Termin: 30. September - 2. Oktober 2019
Leitung: Jens Stoye (Bielefeld, GER), Alexander Schönhuth (Amsterdam, NED)

Das Pangenom einer Spezies ist als das komplette genomische Repertoire seiner Individuen definiert, was insbesondere natürlich auftretende Polymorphismen und strukturelle Variationen umfasst. Jüngste technologische Entwicklungen ermöglichen eine gute Abschätzung eines Pangenoms durch massive Sequenzierung. Einerseits erlaubt dies tiefere Einsichten in die innere Struktur der Gemeinschaft an Individuen einer Spezies, ihre Gemeinsamkeiten und Unterschiede. Dies ist sehr relevant, da sich innerhalb solcher Gemeinschaften häufig signifikante Diversitäten zwischen (Teilgruppen von) Individuen finden, ebenso wie dynamische Entwicklungen zwischen verschiedenen Zeitpunkten oder unter unterschiedlichen äußeren Bedingungen. Andererseits ist ein Pangenom bei der Analyse eines einzelnen Genoms eine deutlich robustere und informativere Referenz als das traditionelle einfache Referenzgenom.

In dieser Arbeitsgruppe haben Experten aus Informatik, Computerbiologie und Bioinformatik effiziente Repräsentationsformen für Pangenome diskutiert, ebenso wie Analysemethoden und praktische Anwendungen.

Einige der Teilnehmenden kamen bereits einige Tage zuvor in Bielefeld zusammen, um sich in Vorbereitung auf die Tagung über jüngste Entwicklungen bei effizienten Datenstrukturen zur Speicherung von Pangenomen und deren Anwendung auszutauschen und eine Panel Discussion vorzubereiten. Außerdem erarbeiteten Paul Medvedev (Pennsylvania State University) und Rayan Chikhi (University of Lille I) einen gemeinsamen Vortrag, in dem sie einen Überblick über k-mer-basierte Ansätze gaben. Bei diesen Verfahren werden anstelle der kompletten genomischen Sequenzen alle enthaltenen Teilsequenzen einer gewissen Länge k möglichst speichersparend in speziell entwickelten Datenstrukturen gespeichert. Zahlreiche der folgenden Tagungsbeiträge basierten auf diesem Ansatz. In einem anderen verbreiteten Ansatz werden die zu speichernden Sequenzen in einem sogenannten Varianten-Graph repräsentiert, in welchem gemeinsame Sequenzabschnitte einfachen Pfaden entsprechen und Variationen zu Verzweigungen im Graphen führen. Auch hierzu folgten prominente Tagungsbeiträge, etwa von Adam Novak (University of California, Santa Cruz) und Eric Garrison (Wellcome Genome Campus, Cambridge). Im Laufe des Workshops kam es immer wieder zu fruchtbaren Diskussionen von Vertretern beider Ansätze, welche im Plenum begannen und in Pausen soweit vertieft wurden, dass gemeinsame Pläne ausgearbeitet wurden, wie die beiden Repräsentationsformen ineinander übersetzt werden könnten.

Die Zusammenkunft zahlreicher Fachkolleginnen und -kollegen bot neben der eigentlichen Tagung auch die Gelegenheit für ein kurzfristig vom Co-Organisator Alexander Schönhuth (Centrum Wiskunde & Informatica, Amsterdam) anberaumtes Treffen in kleinerem Rahmen. So wurden im Round Table Room die Weichen für einen Antrag für ein International Training Network (EU H2020) gestellt, während im Fellow Room weniger formale Netzwerke geknüpft wurden. Einen Höhepunkt des kollegialen Miteinanders stellte eine gemeinsame Fahrt im Sparrenexpress dar.

Gegenstand der Panel Discussion war die Entwicklung eines Datenstruktur-übergreifenden Standards zur Speicherung und Weiterverarbeitung eines Pangenoms als Schnittstelle zur Programmierung von Anwendungen (API). Außerdem können so verschiedene Implementierungen bzw. verschiedene Repräsentationsformen objektiven Praxistests unterzogen werden, um etwaige Stärken und Schwächen in verschiedenen Anwendungsbereichen identifizieren zu können. Die vom Co-Organisator Jens Stoye (Universität Bielefeld) moderierte Diskussionsrunde mit den Gästen Rayan Chikhi (University of Lille I), Guillaume Holley (Decode, Island), Nina Luhmann (Warwick Medical School), Paul Medvedev (Pennsylvania State University) und Sandra Smit (Wageningen University) erfreute sich auch zahlreicher Beiträge aus dem Plenum. Die Ergebnisse und Denkanstöße werden Grundlage für ein White Paper sein, welches die Forschungsgemeinschaft zur Etablierung eines entsprechenden Standards in der computergestützten Pangenomik motivieren soll.

Zum Thema Standardisierung trug Sandra Smit zudem spontan mit ihrem grej of the day (Ding des Tages) bei: »Schreibt man Pangenomik ohne oder mit Bindestrich (Pan-Genomik)?« So banal diese Frage zunächst klingen mag, führte sie zu kurzweiligen Diskussionen in den Pausen – von der Grammatik bis hin zum Argument, die Pangenomik sei inzwischen als eigenständiges Fachgebiet etabliert und längst nicht mehr nur ein kleiner Nebenschauplatz der Genomik – eine Aussage, welche durch den Erfolg dieser Arbeitsgemeinschaft nur unterstrichen werden kann.

Roland Wittler, Jens Stoye

Tagungsprogramm
download
Teilnehmerinnen und Teilnehmer

Stefan Albaum (Bielefeld, GER), Nicole Althermeler (Bielefeld, GER), Ellen Baake (Bielefeld, GER), Peter Belmann (Bielefeld, GER), Broňa Brejová (Bratislava, SVK), Thomas Büchler (Ulm, GER), Rayan Chikhi (Paris, FRA), Kevin da Silva (Rennes, FRA), Marília Dias Vieira Braga (Bielefeld, GER), Daniel Dörr (Bielefeld, GER), Askar Gafurov (Bratislava, SVK), Erik Garrison (Hinxton, GBR), Robert Giegerich (Bielefeld, GER), Michael Hall (Hinxton, GBR), Barbara Hammer (Bielefeld, GER), Georges Hattab (Marburg, GER), Ralf Hofestädt (Bielefeld, GER), Guillaume Holley (Reykjavik, ISL), Jan Holub (Prague, CZE), Liren Huang (Bielefeld, GER), Zamin Iqbal (Hinxton, GBR), Laurent Jacob (Villeurbanne, FRA), Eef Jonkheer (Wageningen, NED), Jan Kölling (Bielefeld, GER), Brice Letcher (Hinxton, GBR), Nina Luhmann (Coventry, GBR), Veli Mäkinen (Helsinki, FIN), Tobias Marschall (Saarbrücken, GER), Paul Medvedev (University Park, USA), Tim Wilhelm Nattkemper (Bielefeld, GER), Markus Nebel (Bielefeld, GER), Adam Novak (Santa Cruz, USA), Lukas Pfannschmidt (Bielefeld, GER), Nadia Pisanti (Pisa, ITA), Sven Rahmann (Essen, GER), Mikko Rautiainen (Saarbrücken, GER), Andreas Rempel (Bielefeld, GER), Eric Rivals (Montpellier, FRA), Madis Rumming (Bielefeld, GER), Tizian Schulz (Bielefeld, GER), Alexander Sczyrba (Bielefeld, GER), Sandra Smit (Wageningen, NED), Leandro Soares de Lima (Hinxton, GBR), Linda Sundermann (Toronto, CAN), Tomáš Vinař (Bratislava, SVK), Bernd Weisshaar (Bielefeld, GER), Roland Wittler (Bielefeld, GER), Ilja Wolik (Bielefeld, GER), Karsten Wüllems (Bielefeld, GER), Olga Zolotareva (Bielefeld, GER)

Organisatorische Fragen beantwortet Marina Hoffmann im Tagungsbüro. Bei inhaltlichen Fragen wenden Sie sich bitte direkt an die Veranstaltungsleitung.


Tel: +49 521 106-2768
Fax: +49 521 106-152768
E-Mail: marina.hoffmann@uni-bielefeld.de