Mehrfach annotierte Textkorpora: strukturierte Speicherung und Abfrage
Saved in:
Main Author: | |
---|---|
Format: | Book |
Language: | German |
Published: |
Tübingen
Narr Francke Attempo
[2019]
|
Series: | Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache
Bd. 8 |
Subjects: | |
Links: | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030852922&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
Physical Description: | 315 Seiten Illustrationen, Diagramme |
ISBN: | 9783823382867 |
Staff View
MARC
LEADER | 00000nam a2200000 cb4500 | ||
---|---|---|---|
001 | BV045467756 | ||
003 | DE-604 | ||
005 | 20191223 | ||
007 | t| | ||
008 | 190218s2019 xx a||| |||| 00||| ger d | ||
020 | |a 9783823382867 |9 978-3-8233-8286-7 | ||
035 | |a (OCoLC)1096363955 | ||
035 | |a (DE-599)BVBBV045467756 | ||
040 | |a DE-604 |b ger |e rda | ||
041 | 0 | |a ger | |
049 | |a DE-11 |a DE-473 |a DE-384 |a DE-19 |a DE-824 |a DE-20 |a DE-739 |a DE-12 |a DE-355 | ||
084 | |a ES 900 |0 (DE-625)27926: |2 rvk | ||
100 | 1 | |a Schneider, Roman |d 1970- |e Verfasser |0 (DE-588)1018181059 |4 aut | |
245 | 1 | 0 | |a Mehrfach annotierte Textkorpora |b strukturierte Speicherung und Abfrage |c Roman Schneider |
264 | 1 | |a Tübingen |b Narr Francke Attempo |c [2019] | |
300 | |a 315 Seiten |b Illustrationen, Diagramme | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
490 | 1 | |a Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache |v Bd. 8 | |
650 | 0 | 7 | |a Korpus |g Linguistik |0 (DE-588)4165338-5 |2 gnd |9 rswk-swf |
689 | 0 | 0 | |a Korpus |g Linguistik |0 (DE-588)4165338-5 |D s |
689 | 0 | |5 DE-604 | |
776 | 0 | 8 | |i Erscheint auch als |n Online-Ausgabe, PDF |z 978-3-8233-9286-6 |w (DE-604)BV046107070 |
830 | 0 | |a Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache |v Bd. 8 |w (DE-604)BV037384470 |9 8 | |
856 | 4 | 2 | |m Digitalisierung UB Augsburg - ADAM Catalogue Enrichment |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030852922&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
943 | 1 | |a oai:aleph.bib-bvb.de:BVB01-030852922 |
Record in the Search Index
_version_ | 1819350429408952320 |
---|---|
adam_text | Inhalt 1. Einführung und Motivation................................................................... 9 2. Linguistische Anforderungen an Sprachkorpora..........................23 Natürlichsprachliche Korpora in der Sprachwissenschaft............... 28 2.1 2.2 2.3 2.1.1 Umfang und Zusammensetzung von Sprachkorpora.................. 33 2.1.2 Sekundärdaten............................................................................. 38 Deutschsprachige Korpora im internationalen Kontext................... 49 Recherche in ausgewählten Korpussammlungen............................60 2.3.1 DeReKo/COSMAS........................................................................ 63 2.3.2 Deutscher Wortschatz/Leipzig Corpora Collection...................... 68 2.3.3 DWDS ...........................................................................................73 2.5 Multidimensionale Suchkriterien..........................................................77 Anforderungskatalog für linguistisch motivierte Korpusabfragen ... 95 3. 3.1 Design und Implementierung eines Korpusabfragesystems......101 Spektrum der Speicherungsmodelle.............................................. 103 2.4 3.2 3.3 3.1.1 Dateisystembasierte Lösungen....................................................103 3.1.2 Hauptspeicherbasierte Lösungen................................................105 3.1.3 Volltextsuchmaschinen ...............................................................106 3.1.4 Datenbankbasierte Korpusverwaltung........................................108 Ein Referenzsystem für die relationale
Korpusspeicherung..........111 3.2.1 Behandlung von Primär- und Sekundärdaten ............................111 3.2.2 Konzeptuelle Datenmodellierung...............................................115 3.2.3 Physisches Datenbankschema.....................................................119 3.2.4 Hard- und Software.....................................................................125 3.2.5 Datenimport................................................................................125 Evaluierung einzelner Designentscheidungen...............................136 3.3.1 Datenmodell................................................................................137 3.3.1.1 N-Gramm-Tabellen.........................................................138 3.3.1.2 Token-Tabellen.....................................................................150 3.3.2 Platzhalteroperatoren und reguläre Ausdrücke..........................155 3.3.3 Numerische und textuelle Schlüsselwerte...................................162
6 INHALT 3.3.4 Hochfrequente Phänomene............................................................ 169 3.3.5 Fazit...................................................................................................174 4. Evaluation des Anforderungskatalogs..............................................177 4.1 Abfrage 1: Einfaches Suchmuster........................................................180 4.2 Abfrage 2: Suffixsuche mit Platzhalterzeichen..................................182 4.3 Abfrage 3: Komplexes Relativsatz-Muster.........................................184 4.4 Abfrage 4: ACI-Konstruktionen...........................................................187 4.5 Abfrage 5: W-Fragen ohne Verb...........................................................189 4.6 Abfrage 6: Movierung in virtuellen Subkorpora...............................192 4.7 Abfrage 7: Genitivobjekte.....................................................................195 4.8 Abfrage 8: Partizipialphrase vor niederfrequentem Nomen.......... 197 4.9 Abfrage 9: Regulärer Ausdruck mit Rechts-Trunkierung............... 200 4.10 Abfrage 10: Regulärer Ausdruck mit Links-Trunkierung............... 202 4.11 Einflussfaktoren auf die Abfrage-Laufzeiten.................................... 205 4.11.1 Belegzahlen und Datenvolumen................................................ 206 4.11.2 Anzahl der Suchkriterien........................................................... 209 4.11.3 Modellierung der Abhängigkeiten............................................. 211 4.11.4
Fazit............................................................................................ 214 5. Versuch einer Laufzeitoptimierung durch segmentierte Abfragen............................................................ 217 5.1 Parallelisierung als Chance für das Korpusretrieval....................... 220 5.2 Problemorientierte Algorithmisierung.............................................. 224 5.3 5.2.1 Modellierung auf Wortebene..................................................... 232 5.2.2 Abfrage auf Wortebene mit spezifizierten Abständen............... 240 5.2.3 Abfrage unter Einbeziehung textbezogener Metadaten............. 252 5.2.4 Abfrage unter Einbeziehung syntaktischer Strukturen und Frequenzen ......................................................................... 255 Evaluation des alternativen Suchalgorithmus.................................. 257 5.3.1 Neuevaluation Abfrage 3 ........................................................... 259 5.3.2 Neuevaluation Abfrage 4 ........................................................... 262 5.3.3 Neuevaluation Abfrage 5 ........................................................... 266 5.3.4 Neuevaluation Abfrage 6 ........................................................... 268 5.3.5 Neuevaluation Abfrage 8 ........................................................... 271
INHALT 7 6. 6.1 6.2 6.3 6.4 Integration in ein Online-Framework......................................... 275 Suchformulare............................................................................... 275 Speicherung von Beleglisten ......................................................... 278 Schnittstellen zu Statistikwerkzeugen........................................... 280 Übersichtslisten..............................................................................282 7. Zusammenfassung und Fazit........................................................285 Literatur..................................................................................................... 291
|
any_adam_object | 1 |
author | Schneider, Roman 1970- |
author_GND | (DE-588)1018181059 |
author_facet | Schneider, Roman 1970- |
author_role | aut |
author_sort | Schneider, Roman 1970- |
author_variant | r s rs |
building | Verbundindex |
bvnumber | BV045467756 |
classification_rvk | ES 900 |
ctrlnum | (OCoLC)1096363955 (DE-599)BVBBV045467756 |
discipline | Sprachwissenschaft Literaturwissenschaft |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01629nam a2200349 cb4500</leader><controlfield tag="001">BV045467756</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20191223 </controlfield><controlfield tag="007">t|</controlfield><controlfield tag="008">190218s2019 xx a||| |||| 00||| ger d</controlfield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9783823382867</subfield><subfield code="9">978-3-8233-8286-7</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)1096363955</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)BVBBV045467756</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rda</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-11</subfield><subfield code="a">DE-473</subfield><subfield code="a">DE-384</subfield><subfield code="a">DE-19</subfield><subfield code="a">DE-824</subfield><subfield code="a">DE-20</subfield><subfield code="a">DE-739</subfield><subfield code="a">DE-12</subfield><subfield code="a">DE-355</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">ES 900</subfield><subfield code="0">(DE-625)27926:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Schneider, Roman</subfield><subfield code="d">1970-</subfield><subfield code="e">Verfasser</subfield><subfield code="0">(DE-588)1018181059</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Mehrfach annotierte Textkorpora</subfield><subfield code="b">strukturierte Speicherung und Abfrage</subfield><subfield code="c">Roman Schneider</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Tübingen</subfield><subfield code="b">Narr Francke Attempo</subfield><subfield code="c">[2019]</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">315 Seiten</subfield><subfield code="b">Illustrationen, Diagramme</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="490" ind1="1" ind2=" "><subfield code="a">Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache</subfield><subfield code="v">Bd. 8</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Korpus</subfield><subfield code="g">Linguistik</subfield><subfield code="0">(DE-588)4165338-5</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Korpus</subfield><subfield code="g">Linguistik</subfield><subfield code="0">(DE-588)4165338-5</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="776" ind1="0" ind2="8"><subfield code="i">Erscheint auch als</subfield><subfield code="n">Online-Ausgabe, PDF</subfield><subfield code="z">978-3-8233-9286-6</subfield><subfield code="w">(DE-604)BV046107070</subfield></datafield><datafield tag="830" ind1=" " ind2="0"><subfield code="a">Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache</subfield><subfield code="v">Bd. 8</subfield><subfield code="w">(DE-604)BV037384470</subfield><subfield code="9">8</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">Digitalisierung UB Augsburg - ADAM Catalogue Enrichment</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030852922&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="943" ind1="1" ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-030852922</subfield></datafield></record></collection> |
id | DE-604.BV045467756 |
illustrated | Illustrated |
indexdate | 2024-12-20T18:27:52Z |
institution | BVB |
isbn | 9783823382867 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-030852922 |
oclc_num | 1096363955 |
open_access_boolean | |
owner | DE-11 DE-473 DE-BY-UBG DE-384 DE-19 DE-BY-UBM DE-824 DE-20 DE-739 DE-12 DE-355 DE-BY-UBR |
owner_facet | DE-11 DE-473 DE-BY-UBG DE-384 DE-19 DE-BY-UBM DE-824 DE-20 DE-739 DE-12 DE-355 DE-BY-UBR |
physical | 315 Seiten Illustrationen, Diagramme |
publishDate | 2019 |
publishDateSearch | 2019 |
publishDateSort | 2019 |
publisher | Narr Francke Attempo |
record_format | marc |
series | Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache |
series2 | Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache |
spellingShingle | Schneider, Roman 1970- Mehrfach annotierte Textkorpora strukturierte Speicherung und Abfrage Korpuslinguistik und interdisziplinäre Perspektiven auf Sprache Korpus Linguistik (DE-588)4165338-5 gnd |
subject_GND | (DE-588)4165338-5 |
title | Mehrfach annotierte Textkorpora strukturierte Speicherung und Abfrage |
title_auth | Mehrfach annotierte Textkorpora strukturierte Speicherung und Abfrage |
title_exact_search | Mehrfach annotierte Textkorpora strukturierte Speicherung und Abfrage |
title_full | Mehrfach annotierte Textkorpora strukturierte Speicherung und Abfrage Roman Schneider |
title_fullStr | Mehrfach annotierte Textkorpora strukturierte Speicherung und Abfrage Roman Schneider |
title_full_unstemmed | Mehrfach annotierte Textkorpora strukturierte Speicherung und Abfrage Roman Schneider |
title_short | Mehrfach annotierte Textkorpora |
title_sort | mehrfach annotierte textkorpora strukturierte speicherung und abfrage |
title_sub | strukturierte Speicherung und Abfrage |
topic | Korpus Linguistik (DE-588)4165338-5 gnd |
topic_facet | Korpus Linguistik |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=030852922&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
volume_link | (DE-604)BV037384470 |
work_keys_str_mv | AT schneiderroman mehrfachannotiertetextkorporastrukturiertespeicherungundabfrage |