Changes
On 26 Eylül 2025 10:17:11 +0200,
-
Changed the license of Question Answering Datensatz, basierend auf den Dokumenten des Münchner Dienstleistungsfinders to Other (Open) (previously http://dcat-ap.de/def/licenses/other-open)
f | 1 | { | f | 1 | { |
2 | "author": "", | 2 | "author": "", | ||
3 | "author_email": "", | 3 | "author_email": "", | ||
4 | "creator_user_id": "3203264e-ffa9-4062-9190-345c5771ce89", | 4 | "creator_user_id": "3203264e-ffa9-4062-9190-345c5771ce89", | ||
5 | "extras": [], | 5 | "extras": [], | ||
6 | "groups": [ | 6 | "groups": [ | ||
7 | { | 7 | { | ||
8 | "description": "", | 8 | "description": "", | ||
9 | "display_name": "Regierung und \u00f6ffentlicher Sektor", | 9 | "display_name": "Regierung und \u00f6ffentlicher Sektor", | ||
10 | "id": "gove", | 10 | "id": "gove", | ||
11 | "image_display_url": | 11 | "image_display_url": | ||
12 | 490402024-09-27-125544.596104infrastructuregovernmentoffice100px.png", | 12 | 490402024-09-27-125544.596104infrastructuregovernmentoffice100px.png", | ||
13 | "name": "gove", | 13 | "name": "gove", | ||
14 | "title": "Regierung und \u00f6ffentlicher Sektor" | 14 | "title": "Regierung und \u00f6ffentlicher Sektor" | ||
15 | } | 15 | } | ||
16 | ], | 16 | ], | ||
17 | "id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | 17 | "id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | ||
n | 18 | "isopen": false, | n | 18 | "isopen": true, |
19 | "license_id": "http://dcat-ap.de/def/licenses/other-open", | 19 | "license_id": "other-open", | ||
20 | "license_title": "http://dcat-ap.de/def/licenses/other-open", | 20 | "license_title": "Other (Open)", | ||
21 | "maintainer": "InnovationLab IT-Referat", | 21 | "maintainer": "InnovationLab IT-Referat", | ||
22 | "maintainer_email": "itm.innolab@muenchen.de", | 22 | "maintainer_email": "itm.innolab@muenchen.de", | ||
23 | "metadata_created": "2023-06-13T05:39:52.095337", | 23 | "metadata_created": "2023-06-13T05:39:52.095337", | ||
t | 24 | "metadata_modified": "2025-09-25T13:42:19.693453", | t | 24 | "metadata_modified": "2025-09-26T08:17:11.622861", |
25 | "name": | 25 | "name": | ||
26 | tz-basierend-auf-den-dokumenten-des-muenchner-dienstleistungsfinders", | 26 | tz-basierend-auf-den-dokumenten-des-muenchner-dienstleistungsfinders", | ||
27 | "notes": "Dieser Datensatz ist f\u00fcr maschinelles Lernen gedacht. | 27 | "notes": "Dieser Datensatz ist f\u00fcr maschinelles Lernen gedacht. | ||
28 | \r\n\r\nDie Texte stammen aus dem | 28 | \r\n\r\nDie Texte stammen aus dem | ||
29 | [\"Dienstleistungsfinder\"](https://stadt.muenchen.de/service/) der | 29 | [\"Dienstleistungsfinder\"](https://stadt.muenchen.de/service/) der | ||
30 | Stadtverwaltung M\u00fcnchen. \r\nDort werden Informationen \u00fcber | 30 | Stadtverwaltung M\u00fcnchen. \r\nDort werden Informationen \u00fcber | ||
31 | die von der Stadt angebotenen Dienstleistungen online | 31 | die von der Stadt angebotenen Dienstleistungen online | ||
32 | pr\u00e4sentiert.\r\nDie Informationen reichen von der Beantragung | 32 | pr\u00e4sentiert.\r\nDie Informationen reichen von der Beantragung | ||
33 | eines Personalausweises bis zur M\u00fcllentsorgung.\r\n \r\nDiese | 33 | eines Personalausweises bis zur M\u00fcllentsorgung.\r\n \r\nDiese | ||
34 | Texte k\u00f6nnen zum Training von NLP (Natural Language | 34 | Texte k\u00f6nnen zum Training von NLP (Natural Language | ||
35 | Processing)-Modellen auf Beh\u00f6rdendeutsch genutzt | 35 | Processing)-Modellen auf Beh\u00f6rdendeutsch genutzt | ||
36 | werden.\r\n\r\nDer Question-Answering Datensatz eignet sich speziell | 36 | werden.\r\n\r\nDer Question-Answering Datensatz eignet sich speziell | ||
37 | um Frage-Antwort-Systeme oder neuronale Dokumentensuchen - vgl. den | 37 | um Frage-Antwort-Systeme oder neuronale Dokumentensuchen - vgl. den | ||
38 | [Artikel \"Dense Passage Retrieval: Neuronale Suche in | 38 | [Artikel \"Dense Passage Retrieval: Neuronale Suche in | ||
39 | rgrund/Dense-Passage-Retrieval-Neuronale-Suche-in-Texten-8992144.html) | 39 | rgrund/Dense-Passage-Retrieval-Neuronale-Suche-in-Texten-8992144.html) | ||
40 | (Heise Verlag - Paywall).\r\n\r\nDie Datens\u00e4tze stehen unter | 40 | (Heise Verlag - Paywall).\r\n\r\nDie Datens\u00e4tze stehen unter | ||
41 | [MIT-Lizenz](https://opensource.org/license/mit/).\r\n\r\n## | 41 | [MIT-Lizenz](https://opensource.org/license/mit/).\r\n\r\n## | ||
42 | Weiterf\u00fchrende Informationen\r\n\r\n[Mehr Informationen zum | 42 | Weiterf\u00fchrende Informationen\r\n\r\n[Mehr Informationen zum | ||
43 | Parquet-Format](https://parquet.apache.org/).\r\n\r\nDense Passage | 43 | Parquet-Format](https://parquet.apache.org/).\r\n\r\nDense Passage | ||
44 | Retrieval (DPR)\r\n\r\n* | 44 | Retrieval (DPR)\r\n\r\n* | ||
45 | https://haystack.deepset.ai/tutorials/09_dpr_training\r\n* | 45 | https://haystack.deepset.ai/tutorials/09_dpr_training\r\n* | ||
46 | se-passage-retrieval-dpr-system-bce5aee4fd40\r\n\r\nQuestion-Answering | 46 | se-passage-retrieval-dpr-system-bce5aee4fd40\r\n\r\nQuestion-Answering | ||
47 | (QA)\r\n\r\n* | 47 | (QA)\r\n\r\n* | ||
48 | https://huggingface.co/learn/nlp-course/chapter7/7?fw=pt\r\n\r\n", | 48 | https://huggingface.co/learn/nlp-course/chapter7/7?fw=pt\r\n\r\n", | ||
49 | "num_resources": 2, | 49 | "num_resources": 2, | ||
50 | "num_tags": 3, | 50 | "num_tags": 3, | ||
51 | "organization": { | 51 | "organization": { | ||
52 | "approval_status": "approved", | 52 | "approval_status": "approved", | ||
53 | "created": "2020-10-06T08:02:45.035112", | 53 | "created": "2020-10-06T08:02:45.035112", | ||
54 | "description": "Das IT-Referat der Stadt M\u00fcnchen (RIT) | 54 | "description": "Das IT-Referat der Stadt M\u00fcnchen (RIT) | ||
55 | gestaltet mit rund 1.400 Personen die gesamte IT der Stadt | 55 | gestaltet mit rund 1.400 Personen die gesamte IT der Stadt | ||
56 | M\u00fcnchen. \r\n\r\nWir treiben die Digitalisierung voran. Unser | 56 | M\u00fcnchen. \r\n\r\nWir treiben die Digitalisierung voran. Unser | ||
57 | Wirken und unsere Leistungen machen die Stadt M\u00fcnchen zu einer | 57 | Wirken und unsere Leistungen machen die Stadt M\u00fcnchen zu einer | ||
58 | erfolgreichen digitalen Metropole, die Standards setzt und auf die die | 58 | erfolgreichen digitalen Metropole, die Standards setzt und auf die die | ||
59 | Mitarbeiterinnen und Mitarbeiter sowie die B\u00fcrgerinnen und | 59 | Mitarbeiterinnen und Mitarbeiter sowie die B\u00fcrgerinnen und | ||
60 | B\u00fcrger stolz sind.\r\n\r\nIm IT-Referat werden alle strategischen | 60 | B\u00fcrger stolz sind.\r\n\r\nIm IT-Referat werden alle strategischen | ||
61 | und operativen Aufgaben rund um die Themen IT und Digitalisierung | 61 | und operativen Aufgaben rund um die Themen IT und Digitalisierung | ||
62 | zusammengefasst.\r\n\r\nMehr Informationen:\r\n\r\n* | 62 | zusammengefasst.\r\n\r\nMehr Informationen:\r\n\r\n* | ||
63 | https://www.muenchen.digital\r\n* | 63 | https://www.muenchen.digital\r\n* | ||
64 | https://www.muenchen.de/rit\r\n\r\n", | 64 | https://www.muenchen.de/rit\r\n\r\n", | ||
65 | "id": "06da4cce-4214-43e7-8924-a61cb85fd2be", | 65 | "id": "06da4cce-4214-43e7-8924-a61cb85fd2be", | ||
66 | "image_url": "2022-02-21-095634.365507IT-Referat43.jpg", | 66 | "image_url": "2022-02-21-095634.365507IT-Referat43.jpg", | ||
67 | "is_organization": true, | 67 | "is_organization": true, | ||
68 | "name": "it-referat", | 68 | "name": "it-referat", | ||
69 | "state": "active", | 69 | "state": "active", | ||
70 | "title": "IT-Referat der Landeshauptstadt M\u00fcnchen", | 70 | "title": "IT-Referat der Landeshauptstadt M\u00fcnchen", | ||
71 | "type": "organization" | 71 | "type": "organization" | ||
72 | }, | 72 | }, | ||
73 | "owner_org": "06da4cce-4214-43e7-8924-a61cb85fd2be", | 73 | "owner_org": "06da4cce-4214-43e7-8924-a61cb85fd2be", | ||
74 | "private": false, | 74 | "private": false, | ||
75 | "relationships_as_object": [], | 75 | "relationships_as_object": [], | ||
76 | "relationships_as_subject": [], | 76 | "relationships_as_subject": [], | ||
77 | "resources": [ | 77 | "resources": [ | ||
78 | { | 78 | { | ||
79 | "cache_last_updated": null, | 79 | "cache_last_updated": null, | ||
80 | "cache_url": null, | 80 | "cache_url": null, | ||
81 | "created": "2023-06-13T05:40:24.985074", | 81 | "created": "2023-06-13T05:40:24.985074", | ||
82 | "datastore_active": false, | 82 | "datastore_active": false, | ||
83 | "datastore_contains_all_records_of_source_file": false, | 83 | "datastore_contains_all_records_of_source_file": false, | ||
84 | "description": "Alle Texte des Dienstleistungsfinders. Stand | 84 | "description": "Alle Texte des Dienstleistungsfinders. Stand | ||
85 | 11/2022. ", | 85 | 11/2022. ", | ||
86 | "format": "TXT", | 86 | "format": "TXT", | ||
87 | "hash": "", | 87 | "hash": "", | ||
88 | "id": "d6e167ee-b11d-4d6c-8f33-07a6ce6fca9f", | 88 | "id": "d6e167ee-b11d-4d6c-8f33-07a6ce6fca9f", | ||
89 | "last_modified": null, | 89 | "last_modified": null, | ||
90 | "license": "http://dcat-ap.de/def/licenses/other-open", | 90 | "license": "http://dcat-ap.de/def/licenses/other-open", | ||
91 | "metadata_modified": "2025-09-25T13:42:19.705841", | 91 | "metadata_modified": "2025-09-25T13:42:19.705841", | ||
92 | "mimetype": null, | 92 | "mimetype": null, | ||
93 | "mimetype_inner": null, | 93 | "mimetype_inner": null, | ||
94 | "name": " LHM-Dienstleistungen-Corpus", | 94 | "name": " LHM-Dienstleistungen-Corpus", | ||
95 | "package_id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | 95 | "package_id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | ||
96 | "position": 0, | 96 | "position": 0, | ||
97 | "resource_type": null, | 97 | "resource_type": null, | ||
98 | "size": null, | 98 | "size": null, | ||
99 | "state": "active", | 99 | "state": "active", | ||
100 | "url": | 100 | "url": | ||
101 | uggingface.co/datasets/it-at-m/LHM-Dienstleistungen-Corpus/tree/main", | 101 | uggingface.co/datasets/it-at-m/LHM-Dienstleistungen-Corpus/tree/main", | ||
102 | "url_type": null | 102 | "url_type": null | ||
103 | }, | 103 | }, | ||
104 | { | 104 | { | ||
105 | "cache_last_updated": null, | 105 | "cache_last_updated": null, | ||
106 | "cache_url": null, | 106 | "cache_url": null, | ||
107 | "created": "2023-06-13T05:41:03.567160", | 107 | "created": "2023-06-13T05:41:03.567160", | ||
108 | "datastore_active": false, | 108 | "datastore_active": false, | ||
109 | "datastore_contains_all_records_of_source_file": false, | 109 | "datastore_contains_all_records_of_source_file": false, | ||
110 | "description": "2127 Frage-Antwort-Paare zu den Dokumenten des | 110 | "description": "2127 Frage-Antwort-Paare zu den Dokumenten des | ||
111 | Dienstleistungsfinders. Format inspiriert von | 111 | Dienstleistungsfinders. Format inspiriert von | ||
112 | [GermanQuAD](https://www.deepset.ai/germanquad).\r\n\r\nAnnotiert | 112 | [GermanQuAD](https://www.deepset.ai/germanquad).\r\n\r\nAnnotiert | ||
113 | von:\r\n\r\n* Institute for Applied Artificial Intelligence: Leon | 113 | von:\r\n\r\n* Institute for Applied Artificial Intelligence: Leon | ||
114 | Marius Schr\u00f6der\r\n* BettercallPaul GmbH: Clemens Gutknecht, | 114 | Marius Schr\u00f6der\r\n* BettercallPaul GmbH: Clemens Gutknecht, | ||
115 | Oubada Alkiddeh, Susanne Wei\u00df\r\n* Stadt M\u00fcnchen: Leon | 115 | Oubada Alkiddeh, Susanne Wei\u00df\r\n* Stadt M\u00fcnchen: Leon | ||
116 | Lukas\r\n\r\nStatistiken zur Frageverteilung finden sich auf der | 116 | Lukas\r\n\r\nStatistiken zur Frageverteilung finden sich auf der | ||
117 | [Huggingface | 117 | [Huggingface | ||
118 | rd](https://huggingface.co/datasets/it-at-m/LHM-Dienstleistungen-QA)", | 118 | rd](https://huggingface.co/datasets/it-at-m/LHM-Dienstleistungen-QA)", | ||
119 | "format": "TXT", | 119 | "format": "TXT", | ||
120 | "hash": "", | 120 | "hash": "", | ||
121 | "id": "4700d08f-e644-4fb6-a73d-75af7c9b506a", | 121 | "id": "4700d08f-e644-4fb6-a73d-75af7c9b506a", | ||
122 | "last_modified": null, | 122 | "last_modified": null, | ||
123 | "license": "http://dcat-ap.de/def/licenses/other-open", | 123 | "license": "http://dcat-ap.de/def/licenses/other-open", | ||
124 | "metadata_modified": "2025-09-25T13:42:19.705948", | 124 | "metadata_modified": "2025-09-25T13:42:19.705948", | ||
125 | "mimetype": null, | 125 | "mimetype": null, | ||
126 | "mimetype_inner": null, | 126 | "mimetype_inner": null, | ||
127 | "name": " LHM-Dienstleistungen-QA", | 127 | "name": " LHM-Dienstleistungen-QA", | ||
128 | "package_id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | 128 | "package_id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | ||
129 | "position": 1, | 129 | "position": 1, | ||
130 | "resource_type": null, | 130 | "resource_type": null, | ||
131 | "size": null, | 131 | "size": null, | ||
132 | "state": "active", | 132 | "state": "active", | ||
133 | "url": | 133 | "url": | ||
134 | ://huggingface.co/datasets/it-at-m/LHM-Dienstleistungen-QA/tree/main", | 134 | ://huggingface.co/datasets/it-at-m/LHM-Dienstleistungen-QA/tree/main", | ||
135 | "url_type": null | 135 | "url_type": null | ||
136 | } | 136 | } | ||
137 | ], | 137 | ], | ||
138 | "state": "active", | 138 | "state": "active", | ||
139 | "tags": [ | 139 | "tags": [ | ||
140 | { | 140 | { | ||
141 | "display_name": "Machine Learning", | 141 | "display_name": "Machine Learning", | ||
142 | "id": "c87bb1dd-8a5b-41ff-a9c6-9c1606f0f05f", | 142 | "id": "c87bb1dd-8a5b-41ff-a9c6-9c1606f0f05f", | ||
143 | "name": "Machine Learning", | 143 | "name": "Machine Learning", | ||
144 | "state": "active", | 144 | "state": "active", | ||
145 | "vocabulary_id": null | 145 | "vocabulary_id": null | ||
146 | }, | 146 | }, | ||
147 | { | 147 | { | ||
148 | "display_name": "NLP", | 148 | "display_name": "NLP", | ||
149 | "id": "e0d4582c-152d-4047-b927-bc33041df5ab", | 149 | "id": "e0d4582c-152d-4047-b927-bc33041df5ab", | ||
150 | "name": "NLP", | 150 | "name": "NLP", | ||
151 | "state": "active", | 151 | "state": "active", | ||
152 | "vocabulary_id": null | 152 | "vocabulary_id": null | ||
153 | }, | 153 | }, | ||
154 | { | 154 | { | ||
155 | "display_name": "Question Answering", | 155 | "display_name": "Question Answering", | ||
156 | "id": "a0eef3b1-3f37-4b19-adc4-0bc2bc2592df", | 156 | "id": "a0eef3b1-3f37-4b19-adc4-0bc2bc2592df", | ||
157 | "name": "Question Answering", | 157 | "name": "Question Answering", | ||
158 | "state": "active", | 158 | "state": "active", | ||
159 | "vocabulary_id": null | 159 | "vocabulary_id": null | ||
160 | } | 160 | } | ||
161 | ], | 161 | ], | ||
162 | "title": "Question Answering Datensatz, basierend auf den Dokumenten | 162 | "title": "Question Answering Datensatz, basierend auf den Dokumenten | ||
163 | des M\u00fcnchner Dienstleistungsfinders", | 163 | des M\u00fcnchner Dienstleistungsfinders", | ||
164 | "type": "dataset", | 164 | "type": "dataset", | ||
165 | "url": "https://stadt.muenchen.de/service/", | 165 | "url": "https://stadt.muenchen.de/service/", | ||
166 | "version": "" | 166 | "version": "" | ||
167 | } | 167 | } |