Những thay đổi
On 12:34:19 +0200 24 tháng 8, 2023,
-
Set format of resource LHM-Dienstleistungen-Corpus to TXT in Question Answering Datensatz, basierend auf den Dokumenten des Münchner Dienstleistungsfinders
f | 1 | { | f | 1 | { |
2 | "author": "", | 2 | "author": "", | ||
3 | "author_email": "", | 3 | "author_email": "", | ||
4 | "creator_user_id": "3203264e-ffa9-4062-9190-345c5771ce89", | 4 | "creator_user_id": "3203264e-ffa9-4062-9190-345c5771ce89", | ||
5 | "extras": [], | 5 | "extras": [], | ||
6 | "groups": [ | 6 | "groups": [ | ||
7 | { | 7 | { | ||
8 | "description": "", | 8 | "description": "", | ||
9 | "display_name": "\u00d6ffentliche Verwaltung, Haushalt und | 9 | "display_name": "\u00d6ffentliche Verwaltung, Haushalt und | ||
10 | Steuern", | 10 | Steuern", | ||
11 | "id": "f203d1b3-c9bb-4f1e-a224-49274bf5d0e7", | 11 | "id": "f203d1b3-c9bb-4f1e-a224-49274bf5d0e7", | ||
12 | "image_display_url": | 12 | "image_display_url": | ||
13 | .capp.muenchen.de/uploads/group/20141216-065158.198536verwaltung.png", | 13 | .capp.muenchen.de/uploads/group/20141216-065158.198536verwaltung.png", | ||
14 | "name": "verwaltung", | 14 | "name": "verwaltung", | ||
15 | "title": "\u00d6ffentliche Verwaltung, Haushalt und Steuern" | 15 | "title": "\u00d6ffentliche Verwaltung, Haushalt und Steuern" | ||
16 | } | 16 | } | ||
17 | ], | 17 | ], | ||
18 | "id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | 18 | "id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | ||
19 | "isopen": true, | 19 | "isopen": true, | ||
20 | "license_id": "other-open", | 20 | "license_id": "other-open", | ||
21 | "license_title": "Other (Open)", | 21 | "license_title": "Other (Open)", | ||
22 | "maintainer": "InnovationLab IT-Referat", | 22 | "maintainer": "InnovationLab IT-Referat", | ||
23 | "maintainer_email": "itm.innolab@muenchen.de", | 23 | "maintainer_email": "itm.innolab@muenchen.de", | ||
24 | "metadata_created": "2023-06-13T05:39:52.095337", | 24 | "metadata_created": "2023-06-13T05:39:52.095337", | ||
25 | "metadata_modified": "2023-06-13T11:21:30.243470", | 25 | "metadata_modified": "2023-06-13T11:21:30.243470", | ||
26 | "name": | 26 | "name": | ||
27 | tz-basierend-auf-den-dokumenten-des-muenchner-dienstleistungsfinders", | 27 | tz-basierend-auf-den-dokumenten-des-muenchner-dienstleistungsfinders", | ||
28 | "notes": "Dieser Datensatz ist f\u00fcr maschinelles Lernen gedacht. | 28 | "notes": "Dieser Datensatz ist f\u00fcr maschinelles Lernen gedacht. | ||
29 | \r\n\r\nDie Texte stammen aus dem | 29 | \r\n\r\nDie Texte stammen aus dem | ||
30 | [\"Dienstleistungsfinder\"](https://stadt.muenchen.de/service/) der | 30 | [\"Dienstleistungsfinder\"](https://stadt.muenchen.de/service/) der | ||
31 | Stadtverwaltung M\u00fcnchen. \r\nDort werden Informationen \u00fcber | 31 | Stadtverwaltung M\u00fcnchen. \r\nDort werden Informationen \u00fcber | ||
32 | die von der Stadt angebotenen Dienstleistungen online | 32 | die von der Stadt angebotenen Dienstleistungen online | ||
33 | pr\u00e4sentiert.\r\nDie Informationen reichen von der Beantragung | 33 | pr\u00e4sentiert.\r\nDie Informationen reichen von der Beantragung | ||
34 | eines Personalausweises bis zur M\u00fcllentsorgung.\r\n \r\nDiese | 34 | eines Personalausweises bis zur M\u00fcllentsorgung.\r\n \r\nDiese | ||
35 | Texte k\u00f6nnen zum Training von NLP (Natural Language | 35 | Texte k\u00f6nnen zum Training von NLP (Natural Language | ||
36 | Processing)-Modellen auf Beh\u00f6rdendeutsch genutzt | 36 | Processing)-Modellen auf Beh\u00f6rdendeutsch genutzt | ||
37 | werden.\r\n\r\nDer Question-Answering Datensatz eignet sich speziell | 37 | werden.\r\n\r\nDer Question-Answering Datensatz eignet sich speziell | ||
38 | um Frage-Antwort-Systeme oder neuronale Dokumentensuchen - vgl. den | 38 | um Frage-Antwort-Systeme oder neuronale Dokumentensuchen - vgl. den | ||
39 | [Artikel \"Dense Passage Retrieval: Neuronale Suche in | 39 | [Artikel \"Dense Passage Retrieval: Neuronale Suche in | ||
40 | rgrund/Dense-Passage-Retrieval-Neuronale-Suche-in-Texten-8992144.html) | 40 | rgrund/Dense-Passage-Retrieval-Neuronale-Suche-in-Texten-8992144.html) | ||
41 | (Heise Verlag - Paywall).\r\n\r\nDie Datens\u00e4tze stehen unter | 41 | (Heise Verlag - Paywall).\r\n\r\nDie Datens\u00e4tze stehen unter | ||
42 | [MIT-Lizenz](https://opensource.org/license/mit/).\r\n\r\n## | 42 | [MIT-Lizenz](https://opensource.org/license/mit/).\r\n\r\n## | ||
43 | Weiterf\u00fchrende Informationen\r\n\r\n[Mehr Informationen zum | 43 | Weiterf\u00fchrende Informationen\r\n\r\n[Mehr Informationen zum | ||
44 | Parquet-Format](https://parquet.apache.org/).\r\n\r\nDense Passage | 44 | Parquet-Format](https://parquet.apache.org/).\r\n\r\nDense Passage | ||
45 | Retrieval (DPR)\r\n\r\n* | 45 | Retrieval (DPR)\r\n\r\n* | ||
46 | https://haystack.deepset.ai/tutorials/09_dpr_training\r\n* | 46 | https://haystack.deepset.ai/tutorials/09_dpr_training\r\n* | ||
47 | se-passage-retrieval-dpr-system-bce5aee4fd40\r\n\r\nQuestion-Answering | 47 | se-passage-retrieval-dpr-system-bce5aee4fd40\r\n\r\nQuestion-Answering | ||
48 | (QA)\r\n\r\n* | 48 | (QA)\r\n\r\n* | ||
49 | https://huggingface.co/learn/nlp-course/chapter7/7?fw=pt\r\n\r\n", | 49 | https://huggingface.co/learn/nlp-course/chapter7/7?fw=pt\r\n\r\n", | ||
50 | "num_resources": 2, | 50 | "num_resources": 2, | ||
51 | "num_tags": 3, | 51 | "num_tags": 3, | ||
52 | "organization": { | 52 | "organization": { | ||
53 | "approval_status": "approved", | 53 | "approval_status": "approved", | ||
54 | "created": "2020-10-06T08:02:45.035112", | 54 | "created": "2020-10-06T08:02:45.035112", | ||
55 | "description": "Das IT-Referat der Stadt M\u00fcnchen (RIT) | 55 | "description": "Das IT-Referat der Stadt M\u00fcnchen (RIT) | ||
56 | gestaltet mit rund 1.100 Personen die gesamte IT der Stadt | 56 | gestaltet mit rund 1.100 Personen die gesamte IT der Stadt | ||
57 | M\u00fcnchen. \r\n\r\nWir treiben die Digitalisierung voran. Unser | 57 | M\u00fcnchen. \r\n\r\nWir treiben die Digitalisierung voran. Unser | ||
58 | Wirken und unsere Leistungen machen die Stadt M\u00fcnchen zu einer | 58 | Wirken und unsere Leistungen machen die Stadt M\u00fcnchen zu einer | ||
59 | erfolgreichen digitalen Metropole, die Standards setzt und auf die die | 59 | erfolgreichen digitalen Metropole, die Standards setzt und auf die die | ||
60 | Mitarbeiterinnen und Mitarbeiter sowie die B\u00fcrgerinnen und | 60 | Mitarbeiterinnen und Mitarbeiter sowie die B\u00fcrgerinnen und | ||
61 | B\u00fcrger stolz sind.\r\n\r\nIm IT-Referat werden alle strategischen | 61 | B\u00fcrger stolz sind.\r\n\r\nIm IT-Referat werden alle strategischen | ||
62 | und operativen Aufgaben rund um die Themen IT und Digitalisierung | 62 | und operativen Aufgaben rund um die Themen IT und Digitalisierung | ||
63 | zusammengefasst.\r\n\r\nMehr Informationen:\r\n\r\n* | 63 | zusammengefasst.\r\n\r\nMehr Informationen:\r\n\r\n* | ||
64 | https://www.muenchen.digital\r\n* | 64 | https://www.muenchen.digital\r\n* | ||
65 | https://www.muenchen.de/rit\r\n\r\n", | 65 | https://www.muenchen.de/rit\r\n\r\n", | ||
66 | "id": "06da4cce-4214-43e7-8924-a61cb85fd2be", | 66 | "id": "06da4cce-4214-43e7-8924-a61cb85fd2be", | ||
67 | "image_url": "2022-02-21-095634.365507IT-Referat43.jpg", | 67 | "image_url": "2022-02-21-095634.365507IT-Referat43.jpg", | ||
68 | "is_organization": true, | 68 | "is_organization": true, | ||
69 | "name": "it-referat", | 69 | "name": "it-referat", | ||
70 | "state": "active", | 70 | "state": "active", | ||
71 | "title": "IT-Referat", | 71 | "title": "IT-Referat", | ||
72 | "type": "organization" | 72 | "type": "organization" | ||
73 | }, | 73 | }, | ||
74 | "owner_org": "06da4cce-4214-43e7-8924-a61cb85fd2be", | 74 | "owner_org": "06da4cce-4214-43e7-8924-a61cb85fd2be", | ||
75 | "private": false, | 75 | "private": false, | ||
76 | "relationships_as_object": [], | 76 | "relationships_as_object": [], | ||
77 | "relationships_as_subject": [], | 77 | "relationships_as_subject": [], | ||
78 | "resources": [ | 78 | "resources": [ | ||
79 | { | 79 | { | ||
80 | "cache_last_updated": null, | 80 | "cache_last_updated": null, | ||
81 | "cache_url": null, | 81 | "cache_url": null, | ||
82 | "created": "2023-06-13T05:40:24.985074", | 82 | "created": "2023-06-13T05:40:24.985074", | ||
83 | "datastore_active": false, | 83 | "datastore_active": false, | ||
84 | "datastore_contains_all_records_of_source_file": false, | 84 | "datastore_contains_all_records_of_source_file": false, | ||
85 | "description": "Alle Texte des Dienstleistungsfinders. Stand | 85 | "description": "Alle Texte des Dienstleistungsfinders. Stand | ||
86 | 11/2022. ", | 86 | 11/2022. ", | ||
t | 87 | "format": "", | t | 87 | "format": "TXT", |
88 | "hash": "", | 88 | "hash": "", | ||
89 | "id": "d6e167ee-b11d-4d6c-8f33-07a6ce6fca9f", | 89 | "id": "d6e167ee-b11d-4d6c-8f33-07a6ce6fca9f", | ||
90 | "last_modified": null, | 90 | "last_modified": null, | ||
91 | "mimetype": null, | 91 | "mimetype": null, | ||
92 | "mimetype_inner": null, | 92 | "mimetype_inner": null, | ||
93 | "name": " LHM-Dienstleistungen-Corpus", | 93 | "name": " LHM-Dienstleistungen-Corpus", | ||
94 | "package_id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | 94 | "package_id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | ||
95 | "position": 0, | 95 | "position": 0, | ||
96 | "resource_type": null, | 96 | "resource_type": null, | ||
97 | "size": null, | 97 | "size": null, | ||
98 | "state": "active", | 98 | "state": "active", | ||
99 | "url": | 99 | "url": | ||
100 | uggingface.co/datasets/it-at-m/LHM-Dienstleistungen-Corpus/tree/main", | 100 | uggingface.co/datasets/it-at-m/LHM-Dienstleistungen-Corpus/tree/main", | ||
101 | "url_type": null | 101 | "url_type": null | ||
102 | }, | 102 | }, | ||
103 | { | 103 | { | ||
104 | "cache_last_updated": null, | 104 | "cache_last_updated": null, | ||
105 | "cache_url": null, | 105 | "cache_url": null, | ||
106 | "created": "2023-06-13T05:41:03.567160", | 106 | "created": "2023-06-13T05:41:03.567160", | ||
107 | "datastore_active": false, | 107 | "datastore_active": false, | ||
108 | "datastore_contains_all_records_of_source_file": false, | 108 | "datastore_contains_all_records_of_source_file": false, | ||
109 | "description": "2127 Frage-Antwort-Paare zu den Dokumenten des | 109 | "description": "2127 Frage-Antwort-Paare zu den Dokumenten des | ||
110 | Dienstleistungsfinders. Format inspiriert von | 110 | Dienstleistungsfinders. Format inspiriert von | ||
111 | [GermanQuAD](https://www.deepset.ai/germanquad).\r\n\r\nAnnotiert | 111 | [GermanQuAD](https://www.deepset.ai/germanquad).\r\n\r\nAnnotiert | ||
112 | von:\r\n\r\n* Institute for Applied Artificial Intelligence: Leon | 112 | von:\r\n\r\n* Institute for Applied Artificial Intelligence: Leon | ||
113 | Marius Schr\u00f6der\r\n* BettercallPaul GmbH: Clemens Gutknecht, | 113 | Marius Schr\u00f6der\r\n* BettercallPaul GmbH: Clemens Gutknecht, | ||
114 | Oubada Alkiddeh, Susanne Wei\u00df\r\n* Stadt M\u00fcnchen: Leon | 114 | Oubada Alkiddeh, Susanne Wei\u00df\r\n* Stadt M\u00fcnchen: Leon | ||
115 | Lukas\r\n\r\nStatistiken zur Frageverteilung finden sich auf der | 115 | Lukas\r\n\r\nStatistiken zur Frageverteilung finden sich auf der | ||
116 | [Huggingface | 116 | [Huggingface | ||
117 | rd](https://huggingface.co/datasets/it-at-m/LHM-Dienstleistungen-QA)", | 117 | rd](https://huggingface.co/datasets/it-at-m/LHM-Dienstleistungen-QA)", | ||
118 | "format": "", | 118 | "format": "", | ||
119 | "hash": "", | 119 | "hash": "", | ||
120 | "id": "4700d08f-e644-4fb6-a73d-75af7c9b506a", | 120 | "id": "4700d08f-e644-4fb6-a73d-75af7c9b506a", | ||
121 | "last_modified": null, | 121 | "last_modified": null, | ||
122 | "mimetype": null, | 122 | "mimetype": null, | ||
123 | "mimetype_inner": null, | 123 | "mimetype_inner": null, | ||
124 | "name": " LHM-Dienstleistungen-QA", | 124 | "name": " LHM-Dienstleistungen-QA", | ||
125 | "package_id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | 125 | "package_id": "6eab6eaf-ad4a-418c-9398-d4b790151165", | ||
126 | "position": 1, | 126 | "position": 1, | ||
127 | "resource_type": null, | 127 | "resource_type": null, | ||
128 | "size": null, | 128 | "size": null, | ||
129 | "state": "active", | 129 | "state": "active", | ||
130 | "url": | 130 | "url": | ||
131 | ://huggingface.co/datasets/it-at-m/LHM-Dienstleistungen-QA/tree/main", | 131 | ://huggingface.co/datasets/it-at-m/LHM-Dienstleistungen-QA/tree/main", | ||
132 | "url_type": null | 132 | "url_type": null | ||
133 | } | 133 | } | ||
134 | ], | 134 | ], | ||
135 | "state": "active", | 135 | "state": "active", | ||
136 | "tags": [ | 136 | "tags": [ | ||
137 | { | 137 | { | ||
138 | "display_name": "Machine Learning", | 138 | "display_name": "Machine Learning", | ||
139 | "id": "c87bb1dd-8a5b-41ff-a9c6-9c1606f0f05f", | 139 | "id": "c87bb1dd-8a5b-41ff-a9c6-9c1606f0f05f", | ||
140 | "name": "Machine Learning", | 140 | "name": "Machine Learning", | ||
141 | "state": "active", | 141 | "state": "active", | ||
142 | "vocabulary_id": null | 142 | "vocabulary_id": null | ||
143 | }, | 143 | }, | ||
144 | { | 144 | { | ||
145 | "display_name": "NLP", | 145 | "display_name": "NLP", | ||
146 | "id": "e0d4582c-152d-4047-b927-bc33041df5ab", | 146 | "id": "e0d4582c-152d-4047-b927-bc33041df5ab", | ||
147 | "name": "NLP", | 147 | "name": "NLP", | ||
148 | "state": "active", | 148 | "state": "active", | ||
149 | "vocabulary_id": null | 149 | "vocabulary_id": null | ||
150 | }, | 150 | }, | ||
151 | { | 151 | { | ||
152 | "display_name": "Question Answering", | 152 | "display_name": "Question Answering", | ||
153 | "id": "a0eef3b1-3f37-4b19-adc4-0bc2bc2592df", | 153 | "id": "a0eef3b1-3f37-4b19-adc4-0bc2bc2592df", | ||
154 | "name": "Question Answering", | 154 | "name": "Question Answering", | ||
155 | "state": "active", | 155 | "state": "active", | ||
156 | "vocabulary_id": null | 156 | "vocabulary_id": null | ||
157 | } | 157 | } | ||
158 | ], | 158 | ], | ||
159 | "title": "Question Answering Datensatz, basierend auf den Dokumenten | 159 | "title": "Question Answering Datensatz, basierend auf den Dokumenten | ||
160 | des M\u00fcnchner Dienstleistungsfinders", | 160 | des M\u00fcnchner Dienstleistungsfinders", | ||
161 | "type": "dataset", | 161 | "type": "dataset", | ||
162 | "url": "https://stadt.muenchen.de/service/", | 162 | "url": "https://stadt.muenchen.de/service/", | ||
163 | "version": "" | 163 | "version": "" | ||
164 | } | 164 | } |