Willkommen!

Ich bin ein begeisterter Informatiker aus Lüdenscheid und arbeite als Doktorand und wissenschaftlicher Mitarbeiter in der Arbeitsgruppe Semantische Datenbanken am Center for Cognitive Interaction Technology (CITEC) der Universität Bielefeld. Dort forsche ich im Rahmen des SAIL-Projektes ("SustAInable Life-cycle of Intelligent Socio-Technical Systems") zu Fragestellungen des Question Answering over Linked Data, Semantic Web, Lexikalisches Wissen und Kompositionalität im Bereich KI. Meine Forschungsschwerpunkte sind unter "forschung" zu finden.

Mein Studium der Informatik (Nebenfach Germanistik) an der TU Dortmund habe ich im März 2023 mit einem Masterabschluss mit Auszeichnung beendet. Ein kurzer Lebenslauf ist bei "über mich" zu finden.

Ich freue mich immer über den Austausch mit anderen Forschern und Gleichgesinnten, ob zur Vernetzung, zu möglichen Kooperationen, fachlichen oder anderen Themen.

Bild von David M. Schmidt aus Lüdenscheid

Forschungsschwerpunkte

Question Answering over Linked Data

Lexikalisches Wissen

Kompositionalität im Bereich KI

  • Erforschung der Grenzen der kompositionellen Fähigkeiten von LLMs durch Operationalisierung der Eigenschaften systematicity and productivity wie sie durch Szabó, Z. G. (2012) beschrieben wurden
  • Entwicklung eines Datensatzes sowie einer Kompositionalitäts-Metrik zur Überprüfung der Systematicity-Eigenschaft von LLMs im Kontext von QALD, unter Nutzung von sowohl In-Context-Lernen als auch Fine-Tuning

Strukturgenerierung & Informationsextraktion

Social Media Listening für die Einschätzung der Lebensqualität

Über mich

Curriculum Vitae

Hobbys und Ehrenamtliches

Aktuelles

  • Seit 2015
    Von 2015-2016 Teilnehmer der jährlichen Veranstaltungen von Jugend hackt unter dem Motto "Mit Code die Welt verbessern", seit 2017 Unterstützung als Mentor
  • Seit 2004 Klavier und seit 2013 Gitarre spielen

Ehemaliges

Publikationen

Eine Liste von Publikationen, an denen ich mitgewirkt habe:

2025

  • Sanchez-Graillet, O., Schmidt, D. M., Kullik, C., & Cimiano, P. (2025). Open challenges for the automatic synthesis of clinical trials. BMC Research Notes, 18(1), 50. https://doi.org/10.1186/s13104-025-07121-6
    [tool]
  • Schmidt, D. M., & Cimiano, P. (2025). Grammar-constrained decoding for structured information extraction with fine-tuned generative models applied to clinical trial abstracts. Frontiers in Artificial Intelligence, 7, 1406857. https://doi.org/10.3389/frai.2024.1406857
    [artifact] [repo]

2024

  • Schmidt, D. M., Elahi, M. F., & Cimiano, P. (2025). Lexicalization is all you need: Examining the impact of lexical knowledge in a compositional QALD system. In M. Alam, M. Rospocher, M. van Erp, L. Hollink, & G. A. Gesese (Eds.), Knowledge Engineering and Knowledge Management (pp. 102–122). Springer Nature Switzerland. https://doi.org/10.1007/978-3-031-77792-9_7
    [preprint] [artifact] [repo] [docker]
  • Schmidt, D. M., & Cimiano, P. (2024). Question answering from healthcare fora. DataNinja sAIOnARA Conference, DataNinja sAIOnARA 2024 Conference. https://doi.org/10.11576/DATANINJA-1159
  • Witte, C.*, Schmidt, D. M.*, & Cimiano, P. (2024). Comparing generative and extractive approaches to information extraction from abstracts describing randomized clinical trials. Journal of Biomedical Semantics, 15(1), 3. https://doi.org/10.1186/s13326-024-00305-2
    [artifact] [repo]

2021

  • Jasper, M., Schlüter, M., Schmidt, D., & Steffen, B. (2021). Every component matters: Generating parallel verification benchmarks with hardness guarantees. In T. Margaria & B. Steffen (Eds.), Leveraging Applications of Formal Methods, Verification and Validation: Tools and Trends (Vol. 12479, pp. 242–263). Springer International Publishing. https://doi.org/10.1007/978-3-030-83723-5_16
  • Howar, F., Jasper, M., Mues, M., Schmidt, D., & Steffen, B. (2021). The RERS challenge: Towards controllable and scalable benchmark synthesis. International Journal on Software Tools for Technology Transfer, 23(6), 917–930. https://doi.org/10.1007/s10009-021-00617-z
* = Gleicher Beitrag zur Publikation

Artikel und Berichte

Kontakt

Ich freue mich immer über Kontakt zu anderen begeisterten Menschen und Gleichgesinnten. Am besten bin ich per E-Mail an kontakt [at] davidmschmidt.de zu erreichen.

E-Mail-Symbol kontakt [at] davidmschmidt.de

Forschung

ORCID-Symbol DBLP-Symbol Google Scholar-Symbol Semantic Scholar-Symbol ResearchGate-Symbol

Social Media & Co.

LinkedIn-Symbol Bluesky-Symbol Mastodon-Symbol Twitter-Symbol GitHub-Symbol

Büro

CITEC 2-310
Cognitive Interaction Technology Center (CITEC)
Universität Bielefeld
Inspiration 1
33619 Bielefeld
Germany

Postanschrift

David Schmidt
Cognitive Interaction Technology Center (CITEC)
Universität Bielefeld
Inspiration 1
33619 Bielefeld
Germany