(Noam Chomsky)
Colorless green ideas
sleep furiously.
Wissenschaftliche Software
DKPro ist eine Sammlung von frei lizenzierten Softwareprojekten für natürliche Sprachverarbeitung, die am Ubiquitous Knowledge Processing (UKP) Lab entstanden ist. Ich entwickle die folgenden Projekte:
DKPro Statistics
Quelloffene Java-Bibliothek mit statistischen Verfahren und Tests.
Quelloffene Java-Bibliothek mit statistischen Verfahren und Tests.
Java Wiktionary Library (JWKTL)
Effizienter programmatischer Zugriff auf das Online-Wörterbuch Wiktionary.
Effizienter programmatischer Zugriff auf das Online-Wörterbuch Wiktionary.
Java OmegaWiki Library (JOWKL)
Effizienter programmatischer Zugriff auf das Online-Wörterbuch OmegaWiki.
Effizienter programmatischer Zugriff auf das Online-Wörterbuch OmegaWiki.
Forschungsdaten
Highlights:
UBY
Eine umfangreiche, standardisierte und integrierte lexikalische Ressource.
Eine umfangreiche, standardisierte und integrierte lexikalische Ressource.
Weitere Forschungsdatenprojekte:
- Hierarchical Summarization
Corpus, crowdsourcing and annotation guidelines for hierarchical summarization.
- Live Blog Corpus for Summarization
Approach to generate a live blog summarization corpus covering data from The Guardian and BBC.
- DBS – A summarization corpus of coherent extracts
The DBS corpus contains 93 multi-document summaries for 293 German documents about 30 education-related topics.
Experiment-Software
- Data-efficient Neural Text Compression
In this project, we develop a general framework for Interactive Text Compression. We propose an interactive text compression model using active learning learning methods for data-efficient learning.
- Diagnostic Reasoning
Challenges in the Automatic Analysis of Students' Diagnostic Reasoning
- Sherlock
Interactive Summarization of Large Text Collections
- APRIL
Active Preference Reinforcement Learning, for extractive multi-document summarisation
- Document-level Stance Detection
A Retrospective Analysis of the Fake News Challenge Stance Detection Task
- Concept-Map-Based Multi-Document Summarization
Structured summarization method based on concept co-reference resolution and global importance optimization.
- Interactive Multi-Document Summarization
A general framework for interactive multi-document summarization.
- Detection of Cross-lingual Marketing Blunders
Method, software, and data for getting started with a new NLP task: detecting marketing blunders.
- MDSWriter
A software for manually creating multi-document summarization corpora and a platform for developing complex annotation tasks spanning multiple steps.
- InViEdit
A web-based writing environment for evaluating intelligent writing assistance methods.