Uni-Tübingen

INF

Heterogene Forschungsprimärdaten des SFB 833 – Repräsentation und Verarbeitung

Das Projekt INF "Heterogene Forschungsprimärdaten des SFB 833 - Repräsentation und Verarbeitung" stellte die Informationsinfrastruktur für den SFB 833 zur Verfügung, in der Zwischenzeit wird dieser Bereich im Allgemeinen als Forschungsdatenmanagement bezeichnet. Die Archivierung, Beschreibung der Forschungsdaten, die in den anderen Projekten des SFB erstellt und verwendet wurden, sowie die Bereitstellung von Daten zur Nachnutzung sind wesentlich für den langfristigen Zugang zu den Daten. Dies dient zum einen dem Zweck der Wiederverwendbarkeit erarbeiteter Daten in der Forschung in neuen Fragestellungen und zum anderen der konsequenten Nachvollziehbarkeit und Verifizierbarkeit veröffentlichter Ergebnisse über den gesamten Weg ihrer Erarbeitung.


Publikationen

  • Hinrichs, E. (2021). Multilinguale Sprachressourcen für die linguistische Forschung. In H. Lobin, A. Witt & A. Wöllstein (Eds.), Deutsch in Europa: Sprachpolitisch, grammatisch, methodisch. Jahrbuch des Instituts für Deutsche Sprache 2020 (pp. 189-208). Berlin/Boston, MA: De Gruyter.
  • Hinrichs, E., Hinrichs, M., Kübler, S. & Trippel, T. (2019). Language technology for digital humanities: introduction to the special issue. Language Resources and Evaluation 53(4), 559-563. DOI: doi.org/10.1007/s10579-019-09482-4.
  • Trippel, T. & Zinn, C. (2019). Describing research data with CMDI – Challenges to establish contact with linked open data. In A. Pareja-Lora, M. Blume, B. C. Lust & C. Chiarcos (Eds.), Development of Linguistic Linked Open Data Resources for Collaborative Data-Intensive Research in the Language Sciences (pp. 99-114). Cambridge, MA: MIT-Press.
  • Trippel, T. & Zinn, C.  (2019). Lessons learned: On the challenges of migrating a research data repository from a research institution to a university library. Language Resources and Evaluation. link.springer.com/article/10.1007%2Fs10579-019-09474-4 DOI: 10.1007/s10579-019-09474-4.  
  • Hinrichs, E., et al. (2018). Bridging the LAPPS grid and CLARIN. In H. Mazo, A. Moreno, J. Odijk, S. Piperidis & T. Tokunaga (Eds.), Proceedings of the Eleventh International Conference on Language Resources and Evaluation (LREC 2018). European Language Resources Association (ELRA). Verfügbar unter: www.lrec-conf.org/proceedings/lrec2018/pdf/662.pdf.
  • Hinrichs E., Trippel T., et al. (2018). Gute Forschungsdaten, bessere Forschung: wie Forschung durch Forschungsdatenmanagement unterstützt wird. Book of Abstracts -- Digital Humanities im deutschsprachigen Raum, März, Köln, Deutschland. Verfügbar unter: dhd2018.uni-koeln.de/wp-content/uploads/boa-DHd2018-web-ISBN.pdf.
  • Hinrichs, E., & Trippel, T. (2017). CLARIN-D: Eine Forschungsinfrastruktur für die sprachbasierte Forschung in den Geistes- und Sozialwissenschaften. Bibliothek - Forschung und Praxis 1(41). Verfügbar unter:
    https://www.degruyter.com/downloadpdf/j/bfup.2017.41.issue-1/bfp-2017-0015/bfp-2017-0015.pdf.
  • Chernov, A., Hinrichs, E. & Hinrichs, M. (2017). Search your own treebank. Proceedings of the Fifteenth International Workshop on Treebanks and Linguistic Theories (TLT15) (pp. 25-34). Bloomington, IN, Januar 2017.

  • Zinn, C., Trippel, T., Kaminski, S. & Dima, E. (2016). Crosswalking from CMDI to Dublin Core and MARC 21. Paper presented at the Tenth International Conference on Language Resources and Evaluation (LREC 2016). Portorož, Slowenien.
  • Trippel, T. & Zinn, C. (2015). DMPTY - A wizard for generating data management plans. Paper presented at the CLARIN Annual Conference 2015. Wrocław, Polen.
    http://www.ep.liu.se/ecp/123/006/ecp15123006.pdf

  • Zinn, C. & Trippel, T. (2016). Enhancing the quality of metadata by using authority control. Paper presented at the LREC 2016 Workshop “LDL 2016 – 5th Workshop on Linked Data in Linguistics: Managing, Building and Using Linked Language Resources”. Portorož, Slowenien.

  • Haaf, S., Fankhauser, P., Trippel, T., Eckart, K., Eckart, T., Hedeland, H., Herold, A., Knappen, J., Schiel, F., Stegmann, J. & van Uytvanck, D. (2014). CLARIN's Virtual Language Observatory (VLO) under scrutiny -- The VLO taskforce of the CLARIN-D centres. Paper presented at the CLARIN Annual Conference. Soesterberg, Niederlande.

  • Broeder, D., van Uytvanck, D., Gavrilidou, M. & Trippel, T. (2012). Standardizing a component metadata infrastructure. In N. Calzolari, K. Choukri, T. Declerck, M. Uğur Doğan, B. Maegaard, J. Mariani, J. Odijk & S. Piperidis (Eds.), Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012). Istanbul: European Language Resources Association (ELRA).

  • Dima, E., Henrich, V., Hinrichs, E., Hinrichs, M., Hoppermann, C., Trippel, T., Zastrow, T. & Zinn, C. (2012). A repository for the sustainable management of research data. In N. Calzolari, K. Choukri, T. Declerck, M. Uğur Doğan, B. Maegaard, J. Mariani, J. Odijk & S. Piperidis (Eds.), Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012). Istanbul: European Language Resources Association (ELRA).

  • Dima, E., Hinrichs, E., Hoppermann, C., Trippel, T. & Zinn, C. (2012). A metadata editor to support the description of linguistic resources. In N. Calzolari, K. Choukri, T. Declerck, M. Uğur Doğan, B. Maegaard, J. Mariani, J. Odijk & S. Piperidis (Eds.), Proceedings of the 8th International Conference on Language Resources and Evaluation (LREC 2012). Istanbul: European Language Resources Association (ELRA).

  • Zinn, C., Hoppermann, C. & Trippel, T. (2012). The ISOcat registry reloaded: A re-engineering proposal fllowing schema.org. In E. Simperl, P. Cimiano, A. Polleres, O. Corcho & V. Presutti (Eds.), Proceedings of the 9th Extended Semantic Web Conference (ESWC 2012) (pp. 285-299). Lecture Notes in Computer Science (Bd. 7295). Berlin/Heidelberg: Springer. DOI: 10.1007/978-3-642-30284-8_26.

  • Barkey, R., Hinrichs, E., Hoppermann, C., Trippel, T. & Zinn, C. (2011). Komponenten-basierte Metadatenschemata und Facetten-basierte Suche: Ein flexibler und universeller Ansatz. In J. Griesbaum, T. Mandl & C. Womser-Hacker (Eds.), Information und Wissen: global, sozial und frei? Proceedings des 12. Internationalen Symposiums für Informationswissenschaft (ISI 2011), Hildesheim, 9. bis 11. März 2011 (pp. 62-73). Schriften zur Informationswissenschaft (Bd. 58). Boizenburg: VWH.

  • Barkey, R., Hinrichs, E., Hoppermann, C., Trippel, T. & Zinn, C. (2011). Trailblaizing through forests of resources in linguistics. Digital Humanties (DH), 19. - 22. Juni 2011. Stanford, CA: Stanford University.

  • Hoppermann, C., Trippel, T. & Zinn, C. (2011). Devil’s advocate on metadata in science. In H. Hedeland, T. Schmidt & K. Wörner (Eds.), Multilingual Resources and Multilingual Applications - Proceedings of the Conference of the German Society for Computational Linguistics and Language Technology (GSCL) 2011 (pp. 105-109). Arbeiten zur Mehrsprachigkeit (Folge B, Nr. 96, 2011). Hamburg: Universität Hamburg.

  • Zinn, C. (2011). Building a faceted browser in CouchDB using views on views and Erlang metaprogramming. In H. Kuchen (Ed.), Functional and Constraint Logic Programming: 20th International Workshop, WFLP 2011, Odense, Denmark, July 19, 2011, Proceedings (pp. 104-122). Lecture Notes in Computer Science (Bd. 6816). Berlin/Heidelberg: Springer. DOI: 10.1007/978-3-642-22531-4_7.

Service

Schnellzugang zu
Übersicht

Das Projekts INF hat für die Projekte des SFB 833 Dienste im Bereich des Forschungsdatenmanagements bereitgestellt. Die archivierten Daten werden entsprechend der guten wissenschaftlichen Praxis auch über die Laufzeit des SFB 833 bereitgestellt und vorgehalten. Dazu dient das Repositorium für Forschungsprimärdaten. Die Kataloginformationen, also die Metadaten, können mit Hilfe verschiedener spezieller Suchmaschinen durchsucht werden, z. B. kann mit Hilfe des VLO nach Daten des SFB 833 gesucht werden. Bei zugangsbeschränkten Daten (z. B. wegen Rechten Dritter) sind in den Beschreibungen auch Informationen hinterlegt, unter welchen Bedingungen die Daten nachgenutzt werden können und wie ein Zugang zu den Daten errreicht werden kann. 

Metadaten können sich ändern: Etwa können neue MitarbeiterInnen in das Team aufgenommen werden oder die Kontaktpersonen, Telefonnummern und Adressen ändern sich. Daher können Metadaten im Repositorium auch upgedatet werden. Daten, die sich im Repositorium befinden, sind erstmal persistent, also dauerhaft referenzierbar und damit auch nicht veränderbar. Mit dem Persistent Identifier (PID) sind Forschungsdaten zitierbar und auffindbar. PIDs sehen aus, wie eine Web-Adresse, sind aber für den dauerhaften und eindeutigen Zugang ausgelegt. Eine PID wird in der Vorschau der Beschreibung der Forschungsdaten den Forschenden zusammen mit einem Vorschlag angzeigt, wie auf diese Daten verwiesen werden kann. Das Repositorium befindet sich auf einem dedizierten Server an der Universität Tübingen, der also keine anderen Anwendungszwecke hat, die über die Repositoriumsinfrastruktur hinaus gehen. Daten, die Persönlichkeitsrechte betreffen, wurden im SFB-Repositorium nur erfasst, wenn sie anonymisiert waren, so dass keine Rückschlüsse mehr auf den Ursprung möglich sind. 

Ansprechpersonen