Willkommen!
Ich bin ein begeisterter Informatiker aus Lüdenscheid und arbeite als Doktorand und wissenschaftlicher Mitarbeiter in der Arbeitsgruppe Semantische Datenbanken am Center for Cognitive Interaction Technology (CITEC) der Universität Bielefeld. Dort forsche ich im Rahmen des SAIL-Projektes ("SustAInable Life-cycle of Intelligent Socio-Technical Systems") zu Fragestellungen des Question Answering over Linked Data, Semantic Web, Lexikalisches Wissen und Kompositionalität im Bereich KI. Meine Forschungsschwerpunkte sind unter "forschung" zu finden.
Mein Studium der Informatik (Nebenfach Germanistik) an der TU Dortmund habe ich im März 2023 mit einem Masterabschluss mit Auszeichnung beendet. Ein kurzer Lebenslauf ist bei "über mich" zu finden.
Ich freue mich immer über den Austausch mit anderen Forschern und Gleichgesinnten, ob zur Vernetzung, zu möglichen Kooperationen, fachlichen oder anderen Themen.

Forschungsschwerpunkte
Question Answering over Linked Data
- Entwicklung einer kompositionellen Question Answering over Linked Data (QALD)-Pipeline basierend auf Dependency-based Underspecified Discourse Representation Structures (DUDES) und lexikalischem Wissen unter Nutzung der Lemon-Ontologie, um SPARQL-Anfragen für z.B. DBpedia und Wikidata zu generieren.
- Kombination der Stärken von LLMs und symbolischen Ansätzen, sowie die Umsetzung von "Explainability by Design"
Lexikalisches Wissen
- Nutzung von lexikalischem Wissen in QALD-Pipelines, z.B. für Ontology-Matching und Disambiguierung
- KI-gestützte Lxikonerstellung zur Unterstützung von z.B. Crowdsourcing-Projekten sowie vollautomatische Lexikongenerierung
- Lexika basierend auf den Lemon und LexInfo-Ontoligien
Kompositionalität im Bereich KI
- Erforschung der Grenzen der kompositionellen Fähigkeiten von LLMs durch Operationalisierung der Eigenschaften systematicity and productivity wie sie durch Szabó, Z. G. (2012) beschrieben wurden
- Entwicklung eines Datensatzes sowie einer Kompositionalitäts-Metrik zur Überprüfung der Systematicity-Eigenschaft von LLMs im Kontext von QALD, unter Nutzung von sowohl In-Context-Lernen als auch Fine-Tuning
Strukturgenerierung & Informationsextraktion
- Nutzung von Grammar-Constrained Decoding für z.B.
- Extraktion von Ergebnissen aus den Abstracts klinischer Studien, der C-TrO-ontologie folgend
- zuverlässige Generierung von strukturierten Ausgabeformaten wie SPARQL oder Lemon-Lexikoneinträgen
Social Media Listening für die Einschätzung der Lebensqualität
- Vorhersage der Antworten von Krebs-Patient:innen aufLebensqualitäts-Fragebögen basierend auf Posts in Online-Gesundheitsforen mit Hilfe von KI-Methoden
- Spezieller Fokus auf Brustkrebs-Patientinnen und den EORTC QLQ-C30 Fragebogen in Kombination mit dem QLQ-BR23-Modul
Über mich
Curriculum Vitae
Hobbys und Ehrenamtliches
Aktuelles
-
Seit 2015Von 2015-2016 Teilnehmer der jährlichen Veranstaltungen von Jugend hackt unter dem Motto "Mit Code die Welt verbessern", seit 2017 Unterstützung als Mentor
- Seit 2004 Klavier und seit 2013 Gitarre spielen
Ehemaliges
-
2020-2024Im Zuge der Corona-Krise Teilnahme am #WirVsVirus-Hackathon der Bundesregierung als Teil des Teams "Machbarschaft", seitdem Unterstützung des Projektes in den Bereichen Bot-Hotline und Fundraising, seit 2022 Teil des Vorstandes von Machbarschaft e.V.
-
2014-2023Mitglied des Redaktionsteams unserer Pfarreizeitung PORTAL
-
2017, 2018, 2019Besuch des Chaos Communication Congress in Leipzig
- Messdiener der katholischen Gemeinde St. Joseph und Medardus Lüdenscheid
- Pfadfinder bei der DPSG, Stamm St. Medardus Lüdenscheid
- Kid Kune Do/Zhăngdà Kung Fu (Jugendformen des Wing Chun Kung Fu)
Publikationen
Eine Liste von Publikationen, an denen ich mitgewirkt habe:2025
-
Sanchez-Graillet, O., Schmidt, D. M., Kullik, C., & Cimiano, P. (2025). Open challenges for the automatic synthesis of clinical trials. BMC Research Notes, 18(1), 50. https://doi.org/10.1186/s13104-025-07121-6
[tool] -
Schmidt, D. M., & Cimiano, P. (2025). Grammar-constrained decoding for structured information extraction with fine-tuned generative models applied to clinical trial abstracts. Frontiers in Artificial Intelligence, 7, 1406857. https://doi.org/10.3389/frai.2024.1406857
[artifact] [repo]
2024
-
Schmidt, D. M., Elahi, M. F., & Cimiano, P. (2025). Lexicalization is all you need: Examining the impact of lexical knowledge in a compositional QALD system. In M. Alam, M. Rospocher, M. van Erp, L. Hollink, & G. A. Gesese (Eds.), Knowledge Engineering and Knowledge Management (pp. 102–122). Springer Nature Switzerland. https://doi.org/10.1007/978-3-031-77792-9_7
[preprint] [artifact] [repo] [docker] - Schmidt, D. M., & Cimiano, P. (2024). Question answering from healthcare fora. DataNinja sAIOnARA Conference, DataNinja sAIOnARA 2024 Conference. https://doi.org/10.11576/DATANINJA-1159
-
Witte, C.*, Schmidt, D. M.*, & Cimiano, P. (2024). Comparing generative and extractive approaches to information extraction from abstracts describing randomized clinical trials. Journal of Biomedical Semantics, 15(1), 3. https://doi.org/10.1186/s13326-024-00305-2
[artifact] [repo]
2021
- Jasper, M., Schlüter, M., Schmidt, D., & Steffen, B. (2021). Every component matters: Generating parallel verification benchmarks with hardness guarantees. In T. Margaria & B. Steffen (Eds.), Leveraging Applications of Formal Methods, Verification and Validation: Tools and Trends (Vol. 12479, pp. 242–263). Springer International Publishing. https://doi.org/10.1007/978-3-030-83723-5_16
- Howar, F., Jasper, M., Mues, M., Schmidt, D., & Steffen, B. (2021). The RERS challenge: Towards controllable and scalable benchmark synthesis. International Journal on Software Tools for Technology Transfer, 23(6), 917–930. https://doi.org/10.1007/s10009-021-00617-z
Artikel und Berichte
-
19.10.2023SchülerUni feiert 20-jähriges Bestehen Bild: Martina Hengesbach/TU Dortmund. Weitere Veröffentlichungen: Screenshot 1 Screenshot 2 Screenshot 3
-
17.10.202320 Jahre SchülerUni - Meine Erfahrungen als Schülerstudent an der TU Dortmund. Weitere Veröffentlichungen: Screenshot 1 Screenshot 2
-
01.12.2020Informatik an der TU Dortmund studieren? David erzählt, warum. Weitere Veröffentlichungen: TU Dortmund
-
04.06.2020"Machbarschaft" schlägt Brücke zwischen Bedürftigen und Freiwilligen David Schmidt, Informatikstudent und Deutschlandstipendiat an der TU Dortmund, engagiert sich im Team "Machbarschaft". Weitere Veröffentlichungen: PDF
-
05.10.2018"SchülerUni der Technischen Universität Dortmund feiert ihr 15-jähriges Bestehen". Weitere Veröffentlichungen: TU Dortmund, focus.de (inzwischen nicht mehr online).
-
26.10.2015"David Schmidt aus Lüdenscheid – Schüler und erfolgreicher Student der TU Dortmund", Bild zum Artikel: "Prof. Metin Tolan, Prorektor Studium der TU Dortmund, zeichnete David Schmidt für sein erfolgreiches Studium aus." Bild: Roland Baege/TU Dortmund. Weitere Veröffentlichungen: Westfalenpost, Der Westen, TU Dortmund (inzwischen nicht mehr online).
- Porträt des Talentscoutings der TU Dortmund
- Porträt des Projektes Stipendienkultur Ruhr
Kontakt
Ich freue mich immer über Kontakt zu anderen begeisterten Menschen und Gleichgesinnten. Am besten bin ich per E-Mail an kontakt [at] davidmschmidt.de zu erreichen.Forschung
Social Media & Co.
Büro
CITEC 2-310
Cognitive Interaction Technology Center (CITEC)
Universität Bielefeld
Inspiration 1
33619 Bielefeld
Germany
Postanschrift
David Schmidt
Cognitive Interaction Technology Center (CITEC)
Universität Bielefeld
Inspiration 1
33619 Bielefeld
Germany