|
Das Dokument ist frei verfügbar. |
|
| Nachweis | Kein Nachweis verfügbar |
|
Probabilistische Themenmodelle; Visualisierung; Analyse sozialer Tags; dynamische Topics; statistische Modellierung von Dokumentströmen; statistische Modellierung von 2D-NMR-Spektren; statistische Modellierung von chemischen Konstitutionen; chemische Datenbanken; bilinguale Themenmodelle; Begriffsklärung für soziale Tags | |
probabilistic topic models; visualization; analysis of social tags; dynamic topics statistical modeling of document streams statistical modeling of 2D NMR spectra; statistical modeling of chemical constitutions; chemical databases; bilingual topic models; disambiguation for social tags | |
Ich schlage AdaptivePLSA für das Lernen von dynamischen Topics aus Dokumentströmen vor. Für die SIGIR Konferenzbände liefern die gelernten Topics Hinweise auf die wissenschaftlichen Hauptthemen. Ich schlage TopicTable als eine Visualisierung für die aus Dokumentströmen gelernten Topics vor. TopicTable visualisiert nützliche Zusatzinformationen wie Topicähnlichkeiten und neu auftretende Wörter. In einem Beispiel liefert TopicTable eindeutige Hinweise auf fremdartige Dokumente in einem Dokumentstrom. Desweiteren beschäftige ich mich mit dem Aufdecken der semantischen Mehrdeutigkeit von sozialen Tags. Der vorgestellte Ansatz deckt unerwartete Bedeutungen dieser Tags auf und visualisiert Themen der Dokumente mit diesen Tags. Zuletzt wende ich ein bilinguales Topic-Modell an um NMR-Spektren und chemische Konstitutionen chemischen Verbindungen zu modellieren. Die gelernten bilingualen Topics könnten Anwendung finden in neuartigen Ansätzen zum Datamining in chemischen Strukturdatenbanken. | |
I propose AdaptivePLSA for dynamic topic modeling with streams of documents. For the SIGIR proceedings the learned topics give clear hints to the main research subjects. Next I propose TopicTable a visualization for presenting topics learned from document streams. TopicTable visualizes useful pieces of information e.g. topics similarities and newly emerging words. It is effective as it provides clear hints to alien documents which were added to a test stream of documents. Next I propose an approach for the disambiguation of social tags which have been added to documents by many users of a collaborative tagging system. This approach uncovers unobvious semantics of tags and visualizes topics which are learned from the tagged documents. Last I apply bilingual topic modeling to NMR spectra and chemical constitutions of chemical compounds. The learned bilingual topics might be exploited by new approaches for data mining in chemical- and structure-databases of chemical compounds. |
|
|