Datenbanken und Proteinstrukturen

Henrik Christensen, Lisbeth Elvira de Vries

Research output: Chapter in Book/Report/Conference proceedingContribution to book/anthologyResearchpeer-review

Abstract

Bioinformatik-Datenbanken enthalten biologische Daten aus wissenschaftlichen Experimenten, vor allem DNA- und Proteinsequenzen und Proteinstrukturen. Datenbanken mit veröffentlichter Literatur, computergestützte Analyse von Primärdaten und Metadaten sind ebenfalls wichtig. Primäre und sekundäre Datenbanken beziehen sich auf die Art und Quelle der gespeicherten Daten. Primäre Datenbanken wie GenBank und ENA werden auch als Archive oder Repositories bezeichnet. Sie erhalten Informationen direkt vom einzelnen Forscher, und die Daten gehören dem Einreichenden, der das Recht hat, die Daten zu ändern. Die Nukleotid-Datenbanken DDBJ, EMBL und GenBank werden automatisch auf Proteinebene übersetzt, wenn die DNA-Sequenzen codieren. Die sekundären Datenbanken (z. B. Swiss-Prot und PDB) werden kuratiert und führen eine Qualitätskontrolle und Sortierung der Informationen durch, bevor diese der Öffentlichkeit zugänglich gemacht werden. Diesen Datenbanken gelingt es besser, Redundanz zu reduzieren. Sie können auch die Einreichungen von Einträgen in den primären Datenbanken umgehen, die nicht mehr aktualisiert werden. Domänen sind kompakte Einheiten von Proteinen, die sich unabhängig verhalten und mit bestimmten Funktionen verbunden sein können. Motive sind konservierte Regionen von Proteinen, die Teil von Domänen sein können. Die Vorhersage von Domänen kann auf der Grundlage einzelner Motive, mehrerer Motive und vollständiger Domänen oder unter Verwendung von Verfahren erfolgen, die verschiedene Methoden kombinieren. Die Funktion eines Proteins kann über eine eher geringe Identität mit anderen bekannten Proteinen bei einer eher kurzen Vergleichslänge und eine eher geringe Ähnlichkeit zu Proteinstrukturen vorhergesagt werden. Die Proteomik befasst sich mit der Vorhersage von Proteinen auf der Grundlage der Messung von Masse-zu-Ladung-Verhältnissen (m/z). Die Vorhersage von Proteinen erfolgt dann mit Programmen wie Mascot, bei denen die m/z-Koordinaten aus einer Analyse mit dem überprüften Teil von UniProt abgeglichen werden.
Original languageGerman
Title of host publicationEinführung in die Bioinformatik in der Mikrobiologie
EditorsHenrik Christensen
PublisherSpringer
Publication date2023
Pages29-57
ISBN (Print)978-3-031-31211-3
ISBN (Electronic)978-3-031-31212-0
DOIs
Publication statusPublished - 2023

Cite this