Titelaufnahme

Titel
Learning and visualizing topics and their change with time for the exploratory analysis of social tags and multilingual topic modeling of chemical compounds / von André Gohr
VerfasserGohr, André
BetreuerHinneburg, Alexander Dr. ; Wrobel, Stefan Prof. Dr.
Erschienen2012 ; Halle, Saale : Universitäts- und Landesbibliothek Sachsen-Anhalt, 2012
UmfangOnline-Ressource (159 Bl. = 2,28 mb)
HochschulschriftHalle, Univ., Naturwissenschaftliche Fakultät III, Diss., 2012
Anmerkung
Tag der Verteidigung: 19.12.2012
Sprache der Zusammenfassung: Deutsch
SpracheEnglisch
DokumenttypE-Book
SchlagwörterComputerlinguistik / Halle
URNurn:nbn:de:gbv:3:4-9444 
Zugriffsbeschränkung
 Das Dokument ist frei verfügbar.
Dateien
Learning and visualizing topics and their change with time for the exploratory analysis of social tags and multilingual topic modeling of chemical compounds [2.28 mb]
Links
Nachweis
Keywords
Probabilistische Themenmodelle; Visualisierung; Analyse sozialer Tags; dynamische Topics; statistische Modellierung von Dokumentströmen; statistische Modellierung von 2D-NMR-Spektren; statistische Modellierung von chemischen Konstitutionen; chemische Datenbanken; bilinguale Themenmodelle; Begriffsklärung für soziale Tags
Keywords (Englisch)
probabilistic topic models; visualization; analysis of social tags; dynamic topics statistical modeling of document streams statistical modeling of 2D NMR spectra; statistical modeling of chemical constitutions; chemical databases; bilingual topic models; disambiguation for social tags
Keywords
Ich schlage AdaptivePLSA für das Lernen von dynamischen Topics aus Dokumentströmen vor. Für die SIGIR Konferenzbände liefern die gelernten Topics Hinweise auf die wissenschaftlichen Hauptthemen. Ich schlage TopicTable als eine Visualisierung für die aus Dokumentströmen gelernten Topics vor. TopicTable visualisiert nützliche Zusatzinformationen wie Topicähnlichkeiten und neu auftretende Wörter. In einem Beispiel liefert TopicTable eindeutige Hinweise auf fremdartige Dokumente in einem Dokumentstrom. Desweiteren beschäftige ich mich mit dem Aufdecken der semantischen Mehrdeutigkeit von sozialen Tags. Der vorgestellte Ansatz deckt unerwartete Bedeutungen dieser Tags auf und visualisiert Themen der Dokumente mit diesen Tags. Zuletzt wende ich ein bilinguales Topic-Modell an um NMR-Spektren und chemische Konstitutionen chemischen Verbindungen zu modellieren. Die gelernten bilingualen Topics könnten Anwendung finden in neuartigen Ansätzen zum Datamining in chemischen Strukturdatenbanken.
Keywords
I propose AdaptivePLSA for dynamic topic modeling with streams of documents. For the SIGIR proceedings the learned topics give clear hints to the main research subjects. Next I propose TopicTable a visualization for presenting topics learned from document streams. TopicTable visualizes useful pieces of information e.g. topics similarities and newly emerging words. It is effective as it provides clear hints to alien documents which were added to a test stream of documents. Next I propose an approach for the disambiguation of social tags which have been added to documents by many users of a collaborative tagging system. This approach uncovers unobvious semantics of tags and visualizes topics which are learned from the tagged documents. Last I apply bilingual topic modeling to NMR spectra and chemical constitutions of chemical compounds. The learned bilingual topics might be exploited by new approaches for data mining in chemical- and structure-databases of chemical compounds.