Elektronische Hochschulschriften / Text mining and applications in life sciences

Titelaufnahme

Titel	Text mining and applications in life sciences / von Alexander Hinneburg
Verfasser	Hinneburg, Alexander
Betreuer	Brass, Stefan Prof. Dr. ; Seidl, Thomas Prof. Dr. ; Spiliopoulou, Myra
Erschienen	2011 ; Halle, Saale : Universitäts- und Landesbibliothek Sachsen-Anhalt, 2011
Umfang	Online-Ressource (152 S. = 2,57 mb)
Hochschulschrift	Halle, Univ., Naturwissenschaftliche Fakultät III, Habil.-Schr., 2011
Anmerkung	Tag der Verteidigung: 13.01.2011 Sprache der Zusammenfassung: Deutsch
Sprache	Englisch
Dokumenttyp	E-Book
Schlagwörter	Text Mining / Halle
URN	urn:nbn:de:gbv:3:4-7603

Zugriffsbeschränkung
Das Dokument ist frei verfügbar.

Dateien
Text mining and applications in life sciences [2.57 mb]

Links

Nachweis	Kein Nachweis verfügbar

Keywords
Text Mining; Life Science Applications; Topic Modeling; Density-based Clustering
Keywords (Englisch)
Text ist eine der häufigsten Form von elektronischen Daten die für Menschen direkt lesbar ist. In dieser Arbeit wird untersucht ob und wie statistische Methoden zur Textanalyse auf Anwendungen aus den Lebenswissenschaften übertragen werden können. Die betrachteten Anwendungen sind zwei-dimensionale-NMR-Spektren Proteomics-Experimente und Protein-Precursor-Sequenzen die eine Funktion als Transit-Peptid für Mitochondrien haben. All diese verschiedenen Datensorten können sinnvoll in eine Repräsentation überführt werden die analog der Bag-of-Words-Repräsentation von Textdokumenten ist. Die verwendeten Text-Mining-Methoden sind Topic-Modeling und dessen Anwendungen auf Ähnlichkeitssuche Near-Duplicate-Detektion von Dokumenten mittels Locality-Sensitive-Hashing und Cluster-Analyse basierend auf fraktaler Dimension. Die Ergebnisse zeigen dass die Bag-of-Words-Repräsentation ebenso wie die genannten Text-Mining-Methoden sich erfolgreich in den ausgewählten Anwendungen übertragen und nutzbar machen lassen.