Titelaufnahme

Titel
Text mining and applications in life sciences / von Alexander Hinneburg
VerfasserHinneburg, Alexander
BetreuerBrass, Stefan Prof. Dr. ; Seidl, Thomas Prof. Dr. ; Spiliopoulou, Myra
Erschienen2011 ; Halle, Saale : Universitäts- und Landesbibliothek Sachsen-Anhalt, 2011
UmfangOnline-Ressource (152 S. = 2,57 mb)
HochschulschriftHalle, Univ., Naturwissenschaftliche Fakultät III, Habil.-Schr., 2011
Anmerkung
Tag der Verteidigung: 13.01.2011
Sprache der Zusammenfassung: Deutsch
SpracheEnglisch
DokumenttypE-Book
SchlagwörterText Mining / Halle
URNurn:nbn:de:gbv:3:4-7603 
Zugriffsbeschränkung
 Das Dokument ist frei verfügbar.
Dateien
Text mining and applications in life sciences [2.57 mb]
Links
Nachweis
Keywords
Text Mining; Life Science Applications; Topic Modeling; Density-based Clustering
Keywords (Englisch)
Text ist eine der häufigsten Form von elektronischen Daten die für Menschen direkt lesbar ist. In dieser Arbeit wird untersucht ob und wie statistische Methoden zur Textanalyse auf Anwendungen aus den Lebenswissenschaften übertragen werden können. Die betrachteten Anwendungen sind zwei-dimensionale-NMR-Spektren Proteomics-Experimente und Protein-Precursor-Sequenzen die eine Funktion als Transit-Peptid für Mitochondrien haben. All diese verschiedenen Datensorten können sinnvoll in eine Repräsentation überführt werden die analog der Bag-of-Words-Repräsentation von Textdokumenten ist. Die verwendeten Text-Mining-Methoden sind Topic-Modeling und dessen Anwendungen auf Ähnlichkeitssuche Near-Duplicate-Detektion von Dokumenten mittels Locality-Sensitive-Hashing und Cluster-Analyse basierend auf fraktaler Dimension. Die Ergebnisse zeigen dass die Bag-of-Words-Repräsentation ebenso wie die genannten Text-Mining-Methoden sich erfolgreich in den ausgewählten Anwendungen übertragen und nutzbar machen lassen.