(Noam Chomsky)

Colorless green ideas
sleep furiously.

Wissenschaftliche Software

DKPro ist eine Sammlung von frei lizenzierten Softwareprojekten für natürliche Sprachverarbeitung, die am Ubiquitous Knowledge Processing (UKP) Lab entstanden ist. Ich entwickle die folgenden Projekte:

DKPro Statistics – https://dkpro.github.io/dkpro-statistics

DKPro Statistics
Quelloffene Java-Bibliothek mit statistischen Verfahren und Tests.

Homepage | Publikation

Java Wiktionary Library (JWKTL) – https://dkpro.github.io/dkpro-jwktl

Java Wiktionary Library (JWKTL)
Effizienter programmatischer Zugriff auf das Online-Wörterbuch Wiktionary.

Homepage | Publikation

Java OmegaWiki Library (JOWKL) – https://dkpro.github.io/dkpro-jowkl

Java OmegaWiki Library (JOWKL)
Effizienter programmatischer Zugriff auf das Online-Wörterbuch OmegaWiki.

Homepage | Publikation

Java OpenThesaurus Library (JOTL) – https://dkpro.github.io/dkpro-jotl

Java OpenThesaurus Library (JOTL)
Effizienter programmatischer Zugriff auf OpenThesaurus.

Homepage

Forschungsdaten

Highlights:

UBY
Eine umfangreiche, standardisierte und integrierte lexikalische Ressource.

Homepage | Publikation

Weitere Forschungsdatenprojekte:

Hierarchical Summarization
Corpus, crowdsourcing and annotation guidelines for hierarchical summarization.

GitHub | Publikation
Live Blog Corpus for Summarization
Approach to generate a live blog summarization corpus covering data from The Guardian and BBC.

GitHub | Publikation
DBS – A summarization corpus of coherent extracts
The DBS corpus contains 93 multi-document summaries for 293 German documents about 30 education-related topics.

GitHub | Publikation

Experiment-Software

Data-efficient Neural Text Compression
In this project, we develop a general framework for Interactive Text Compression. We propose an interactive text compression model using active learning learning methods for data-efficient learning.

GitHub | Publikation
Diagnostic Reasoning
Challenges in the Automatic Analysis of Students' Diagnostic Reasoning

GitHub | Publikation
Sherlock
Interactive Summarization of Large Text Collections

GitHub | Publikation
APRIL
Active Preference Reinforcement Learning, for extractive multi-document summarisation

GitHub | Publikation
Document-level Stance Detection
A Retrospective Analysis of the Fake News Challenge Stance Detection Task

GitHub | Publikation
Concept-Map-Based Multi-Document Summarization
Structured summarization method based on concept co-reference resolution and global importance optimization.

GitHub | Publikation
Interactive Multi-Document Summarization
A general framework for interactive multi-document summarization.

GitHub | Publikation
Detection of Cross-lingual Marketing Blunders
Method, software, and data for getting started with a new NLP task: detecting marketing blunders.

GitHub | Publikation
MDSWriter
A software for manually creating multi-document summarization corpora and a platform for developing complex annotation tasks spanning multiple steps.

GitHub | Publikation
InViEdit
A web-based writing environment for evaluating intelligent writing assistance methods.

GitHub | Publikation

Colorless green ideas sleep furiously.

Wissenschaftliche Software

Forschungsdaten

Experiment-Software

Colorless green ideas
sleep furiously.