• is_collection
    True
  • title_en
    Data
  • help_en
    The following questions collect information on the data that is produced or used in the project. They also help to estimate the value of the data in terms of potential re-use and long-term preservation. Before generating new data, it is advisable to check if there is existing data that could be re-used. This way, redundant collection or creation of research data is prevented. This saves efforts and costs. Furthermore, in the case of personal data, the German Federal Data Protection Act allows the collection of personal data only when there are no other reasonable means to clarify the research question (re-use of existing data would be such a reasonable means). Also, there shall be collected no more information than necessary. Organisation of data into data sets The following questions address the content, format, origin and management of the research data generated or reused in the project. It is best to answer these questions by dividing the data into logical units, since each unit will require different answers. The same questions are asked for each of these 'data sets'. Data sets may represent broader categories with similar characteristics and data management requirements. Click here to see tips for dividing project data into data sets You can proceed as follows: Obtain an overview of the data generated or used in your research activities. Evaluate the data based on the following criteria: Origin/generation: generated (e.g. observation/measurement, experiment, survey, simulation, web-crawl) or reused; Storage space requirements: e.g.: <1 GB, ~10 TB; Documentation requirements: Example A: Detailed description of sample generation and data collection; Example B: Description of measuring devices and measurement parameters; Data protection aspects: Personal data, sensitive non-personal data, public data; Relevance/reuse potential: High (reference data), medium (main scientific study), low (preliminary study); Publication of data: Yes/no, planned repository, planned implementation and financing; Long-term archiving: Yes/no, planned data format, planned implementation and financing. Decide on the most favourable division of project data into data sets, ensuring that only data which differ significantly in terms of these criteria are assigned to different data sets. Create a suitable number of homogeneous data sets: enough to avoid the need for conditional answers, but few enough to prevent repetition of the same answers. Examples of two projects in which the data are sorted into data sets can be found here. Give each 'data set' a meaningful but short name that reflects the research work. This name will be used to label the corresponding tab in RDMO.
  • verbose_name_en
    dataset
  • title_de
    Daten
  • help_de
    Die nächsten Fragen dienen zur Beschreibung der Datensätze, die im Projekt erzeugt und/oder verwendet werden. Sie helfen zudem, den Wert der Daten hinsichtlich der potentiellen Nachnutzung und einer späteren Archivierung einschätzen zu können. Vor der Erzeugung von Daten empfiehlt es sich zu prüfen, ob bereits vorhandene Daten nachgenutzt werden können. Die Vermeidung doppelter Erhebungen spart Aufwand und Kosten. Handelt es sich um personenbezogene Daten, ist dies zudem durch den Grundsatz der Erforderlichkeit (BDSG) sowie das Prinzip der Datenvermeidung und Datensparsamkeit (§3a BDSG) geboten. Organisation der Daten in Datensätze Die folgenden Fragen befassen sich mit dem Inhalt, dem Format und der Herkunft der im Projekt generierten oder wiederverwendeten Forschungsdaten und beschreiben deren Verwaltung. Am besten lassen sich diese Fragen beantworten, indem die Daten in logische Einheiten aufgeteilt werden, die jeweils unterschiedliche Beantwortung der Fragen erfordern. Für jeden dieser "Datensätze" werden dieselben Fragen gestellt. Datensätze können eher breitere Kategorien mit ähnlichen Eigenschaften und Erfordernissen hinsichtlich der Datenverwaltung darstellen. Klicken Sie hier für Tipps zur Unterteilung der Projektdaten in Datensätze Sie können wie folgt vorgehen: Verschaffen Sie sich einen Überblick über die Daten, die im Rahmen Ihrer Forschungsaktivitäten generiert oder verwendet werden. Bewerten Sie die Daten anhand der folgenden Kriterien: Herkunft/Generierung: generiert (Beobachtung/Messung, Experiment, Umfrage, Simulation, Web-Crawl,…) oder wiederverwendet; Speicherplatzanforderungen: z. B.: <1 GB, ~10 TB; Dokumentationsanforderungen: Beispiel A: Ausführliche Beschreibung von Stichprobengenerierung und Datenerhebung; Beispiel B: Beschreibung von Messvorrichtungen und Messparametern; Datenschutzaspekte: personenbezogene Daten, sensible nicht personenbezogene Daten, öffentliche Daten; Relevanz/Wiederverwendungspotenzial: hoch (Referenzdaten), mittel (wissenschaftliche Hauptstudie), gering (Vorstudie); Veröffentlichung der Daten: ja/nein, geplantes Repositorium, geplante Durchführung und Finanzierung; Langzeitarchivierung: ja/nein, geplantes Datenformat, geplante Durchführung und Finanzierung. Entscheiden Sie sich für die günstigste Unterteilung der Projektdaten in Datensätze, so dass nur Daten, die sich hinsichtlich dieser Kriterien erheblich unterscheiden, verschiedenen Datensätzen zugeordnet werden. Legen Sie eine angemessene Anzahl homogener Datensätze an: ausreichend viele, um Fallunterscheidungen zu vermeiden, und wenige genug, um Wiederholungen derselben Antworten vorzubeugen. Zwei Beispiele, wie Daten in Projekten Datensätzen zugeordnet wurden, finden Sie hier. Geben Sie jedem "Datensatz" einen im Sinne der Forschungsarbeit aussagekräftigen, aber kurzen Namen. Er wird zur Beschriftung des entsprechenden Tabs in RDMO verwendet.
  • verbose_name_de
    Datensatz