Automatische Duplikatserkennung: ähnliche Texte entdecken und erkennen
Gespeichert in:
Beteilige Person: | |
---|---|
Format: | Buch |
Sprache: | Deutsch |
Veröffentlicht: |
Tönning [u.a.]
<<Der>> Andere Verl.
2009
|
Schlagwörter: | |
Links: | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=020482196&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
Beschreibung: | Teilw. zugl.: Dortmund, Techn. Univ., Diplomarbeit., 2009 u.d.T.: Eichhorn, Christian: Automatische Erkennung von Duplikaten in Textbeständen mit Hilfe flacher Verfahren |
Umfang: | XI, 144 S. graph. Darst. |
ISBN: | 9783899599251 |
Internformat
MARC
LEADER | 00000nam a2200000 c 4500 | ||
---|---|---|---|
001 | BV036560849 | ||
003 | DE-604 | ||
005 | 20110111 | ||
007 | t| | ||
008 | 100712s2009 gw d||| m||| 00||| ger d | ||
015 | |a 10,N03 |2 dnb | ||
015 | |a 10,A11 |2 dnb | ||
016 | 7 | |a 999187430 |2 DE-101 | |
020 | |a 9783899599251 |c kart. : EUR 25.00 |9 978-3-89959-925-1 | ||
024 | 3 | |a 9783899599251 | |
035 | |a (OCoLC)560461400 | ||
035 | |a (DE-599)DNB999187430 | ||
040 | |a DE-604 |b ger |e rakddb | ||
041 | 0 | |a ger | |
044 | |a gw |c XA-DE-SH | ||
049 | |a DE-92 |a DE-M382 |a DE-1043 | ||
084 | |a AK 39580 |0 (DE-625)2617: |2 rvk | ||
084 | |a AN 96300 |0 (DE-625)6812: |2 rvk | ||
084 | |a 400 |2 sdnb | ||
084 | |a 004 |2 sdnb | ||
100 | 1 | |a Eichhorn, Christian |e Verfasser |4 aut | |
245 | 1 | 0 | |a Automatische Duplikatserkennung |b ähnliche Texte entdecken und erkennen |c Christian Eichhorn |
264 | 1 | |a Tönning [u.a.] |b <<Der>> Andere Verl. |c 2009 | |
300 | |a XI, 144 S. |b graph. Darst. | ||
336 | |b txt |2 rdacontent | ||
337 | |b n |2 rdamedia | ||
338 | |b nc |2 rdacarrier | ||
500 | |a Teilw. zugl.: Dortmund, Techn. Univ., Diplomarbeit., 2009 u.d.T.: Eichhorn, Christian: Automatische Erkennung von Duplikaten in Textbeständen mit Hilfe flacher Verfahren | ||
650 | 0 | 7 | |a Plagiat |0 (DE-588)4046196-8 |2 gnd |9 rswk-swf |
650 | 0 | 7 | |a Textproduktion |0 (DE-588)4184945-0 |2 gnd |9 rswk-swf |
655 | 7 | |0 (DE-588)4113937-9 |a Hochschulschrift |2 gnd-content | |
689 | 0 | 0 | |a Textproduktion |0 (DE-588)4184945-0 |D s |
689 | 0 | 1 | |a Plagiat |0 (DE-588)4046196-8 |D s |
689 | 0 | |5 DE-604 | |
856 | 4 | 2 | |m DNB Datenaustausch |q application/pdf |u http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=020482196&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |3 Inhaltsverzeichnis |
943 | 1 | |a oai:aleph.bib-bvb.de:BVB01-020482196 |
Datensatz im Suchindex
_version_ | 1819363404547096576 |
---|---|
adam_text | VII INHALTSVERZEICHNIS 1 EINLEITUNG UND UEBERSICHT 1 1.1 EINLEITUNG 1 1.2
ZIEL DER ARBEIT 2 1.3 UEBERSICHT 3 2 BEGRIFFSBESTIMMUNGEN 5 2.1 PLAGIAT 5
2.1.1 ARTEN VON PLAGIATEN 5 2.1.2 PLAGIATSKLASSIFIZIERUNG NACH
PUBLIKATIONSART 7 2.1.3 GRUENDE FUER PLAGIATE 7 2.1.4 FOLGEN DER
PLAGIATSANFERTIGUNG 8 2.1.5 EINE ANDERE SICHTWEISE 9 2.1.6 EINE
PLAGIATSRELATION 11 2.1.7 PROMINENTE PLAGIATSFAELLE 12 2.2 DUPLIKAT 13
2.2.1 DEFINITION DES DUPLIKATS 13 2.2.2 DEFINITION EINER
DUPLIKATSRELATION 14 2.3 FLACHE UND TIEFE VERFAHREN 15 2.4 WEITERE
BEGRIFFE 17 3 STAND DER TECHNIK 19 3.1 INTELLEKTUELLE STRATEGIEN ZUR
DUPLIKATSERKENNUNG 19 3.2 AUTOMATISCHE VERFAHREN ZUR DUPLIKATSERKENNUNG
20 3.2.1 COPYSCAPE 20 3.2.2 PLAGIARISM DETECTOR 21 3.2.3 URKUND 23 3.2.4
DOCOLC 24 3.2.5 TURNITIN 25 3.2.6 KRITIK KRITIK AM EINSATZ
AUTOMATISCHER VERFAHREN 26 3.3 SEMDUPL, EIN TIEFES VERFAHREN ZUR
DUPLIKATSERKENNUNG 27 4 EINSATZMOEGLICHKEITEN DER DUPLIKATSSUCHE 28
BIBLIOGRAFISCHE INFORMATIONEN HTTP://D-NB.INFO/999187430 DIGITALISIERT
DURCH 7.5.6 ALLITERATIONEN 54 VIII 5 AUSGANGSBASIS 32 5.1
ENTSCHEIDUNGSBAEUME 32 5.1.1 EINSATZ VON ENTSCHEIDUNGSBAEUMEN IN DER
DUPLIKATSSUCHE ... 34 5.1.2 TDIDT MIT ID3 35 5.2 UMGANG MIT HETEROGENEN
BLAETTERN 37 5.3 TEXTUAL ENTAILMENT 38 5.4 LERNUMGEBUNG RAPIDMINER 39 6
UEBERSICHT UEBER DEN ENTWICKELTEN ERKENNER CERKENNER 41 6.1 VERGLEICH
ZWEIER TEXTE 41 6.1.1 EIN-/AUSGABEVERHALTEN BEIM VERGLEICH ZWEIER TEXTE
41 6.1.2 PROGRAMMFLUSS BEIM VERGLEICH ZWEIER TEXTE 41 6.2 TEST EINES
TEXTES GEGEN EIN KORPUS 42 6.2.1 EIN-/AUSGABEVERHALTEN BEIM TEST EINES
TEXTES GEGEN EIN KORPUS 43 6.2.2 ERWEITERUNG FUER
MEHRKERNPROZESSORSYSTEME 44 7 VERGLEICHSMERKMALE 45 7.1 PRUEFSUMME 45 7.2
GLEICHE WOERTER 45 7.2.1 EINFACHER WORTMENGENVERGLEICH 46 7.2.2
WORTMENGENVERGLEICH UNTER AUSNUTZUNG VON SYNONYMIE . . . . 46 7.2.3
SELTENE WOERTER 47 7.3 RECHTSCHREIBFEHLER 47 7.4 SCHREIBSTIL 48 7.4.1
AEHNLICHKEIT IN DER SATZLAENGE 48 7.4.2 AEHNLICHKEIT IN DER WORTLANGE 49
7.5 N-GRAM-BASIERTE METHODEN 51 7.5.1 N-GRAMME 51 7.5.2 N-GRAM-VERGLEICH
51 7.5.3 N-GRAM-VERGLEICH UNTER AUSNUTZUNG VON SYNONYMEN 51 7.5.4
K-SMP-N-GRAM-VERGLEICH AUF WORTEBENE 52 7.5.5 MAX-GRAMME 53 IX 7.5.7
UNTERSCHIEDE IN WORTMENGEN- UND N-GRAM-ERKENMMG 55 8 BESCHREIBUNG DER
ALGORITHMEN ZUR MERKMALSWERTBERECHNUNG 57 8.1 SCHNITTMENGENGROESSE 57 8.2
VERGLEICH EINZELNER N-GRAMME 58 8.3 VERGLEICH ZWEIER TEXTE ANHAND IHRER
N-GRAMME 59 8.4 VERGLEICH EINZELNER N-GRAMME UEBER SYNONYME 59 8.5
VERGLEICH ZWEIER TEXTE ANHAND DER SYNONYME IHRER N-GRAMME . . . . 61 8.6
ERZEUGUNG VON K-SKIP-N-GRAMMEN 61 8.7 VERGLEICH AUF BASIS VON
K-SKIP-N-GRAMMEN 63 9 AUSWAHL DER VERGLEICHSMETHODEN 64 9.1 VORAUSWAHL
DER MERKMALE 64 9.2 EXPERIMENTELLE AUSWAHL DER MERKMALE 64 10 TEST- UND
TRAININGSKORPUS 68 11 TECHNISCHE REALISIERUNG 72 11.1
KLASSENBESCHREIBUNG 72 11.1.1 KLASSE TEXT 72 11.1.2 KLASSE TOOLBOX 73
11.1.3 KLASSE VERGLEICHER 75 11.1.4 KLASSE GRAMMNODE 75 11.1.5 KLASSE
MODREADER 75 11.1.6 KLASSE LAUT 75 11.1.7 KLASSE LAUTMALEREI 76 11.1.8
KLASSEN STOPREADER UN 11.2.6 XERCES2 78 12 AGGREGATIONSFUNKTION 79 13
EXPERIMENTE 85 13.1 EXPERIMENTE MIT PROGRAMMIERSPRACHENMETHODEN 85
13.1.1 ZUGRIFFSZEITEN AUF GESPEICHERTE TEXTE 85 13.1.2 MENGENOPERATIONEN
86 13.2 EXPERIMENTE ZUR VERBESSERUNG DER LAUFZEIT DURCH MULTITHREADING .
. 86 13.3 SPEICHERPROBLEME 87 13.4 ENTSCHEIDUNGSBAUM DES GESAMTSYSTEMS
90 14 EVALUATION 93 14.1 VALIDIERUNG AUF DEM GESAMTEN KORPUS 93 14.2
KREUZVALIDIERUNG DES SYSTEMS 94 14.2.1 STATISTISCHE AUSWERTUNG DER
MESSWERTE 96 14.2.2 ENTSCHEIDUNGSBAEUME DER KREUZVALIDIERUNG 98 14.3
FOLGEN DER EVALUATION: EINE DREI-KLASSEN-ENTSCHEIDUNG 101 14.4 TEST DER
MERKMALE 104 15 ANALYSE DER NACHTEILE DES SYSTEMS 108 15.1 VOR- UND
NACHTEILE DER MERKMALE 108 15.2 NACHTEILE DES GESAMTSYSTEMS 109 15.2.1
PLAGIATSKORPUS 110 15.2.2 ROMANKORPUS 111 15.2.3 GOOGLE-KORPUS 111
15.2.4 NACHRICHTENKORPUS 112 15.3 ZUSAMMENFASSUNG DER NACHTEILSANALYSE
112 16 AUSBLICK 114 16.1 HINZUNAHME WEITERER VORVERARBEITUNGSSCHRITTE
114 16.1.1 ZAHLENNORMALISIERUNG 114 16.1.2 NORMALISIERUNG DER
RECHTSCHREIBUNG 114 16.1.3 ABKUERZUNGEN ERKENNEN UND AUFLOESEN 115 XI
16.1.4 UNTERSCHIEDLICHE DATEITYPEN UND ENKODIERUNGEN VERARBEITEN . 115
16.2 ERWEITERUNG DES SYSTEMS UM WEITERE MERKMALE 115 16.2.1 VERGLEICH
SELTENER WOERTER 115 16.2.2 GRAMMATIKFEHLERSUCHE 115 16.2.3 SYNTAKTISCH
KORREKTE VERWENDUNG VON SATZZEICHEN 116 16.3 VERBESSERUNG DER ERZEUGUNG
VON K-SKIP-N-GRAMMEN 116 16.4 VERBESSERUNG DER AGGREGATIONSFUNKTION 117
16.5 EINSATZ VON LSI ZUR VERMEIDUNG FALSCH NEGATIVER ERGEBNISSE 118 16.6
ERWEITERUNG DER ERKENNUNG AUF UNTERSCHIEDLICHE AUTORENSCHAFT . . .118
16.7 VERGROESSERUNG DES KORPUS UM POSITIVE BEISPIELE 118 16.8
KANDIDATENGENERIERUNG MITHILFE VON SUCHMASCHINEN 118 16.9 ERWEITERUNG
AUF ANDERE SPRACHEN 119 16.10 ERWEITERUNG UM EINEN QUELLENANGABENTEST
119 16.11 GRAFISCHE AUSGABE DER ERGEBNISSE 119 16.12 ANWENDUNG INNERHALB
VON FAQ-SYSTEMEN 120 16.13 VERWENDUNG INNERHALB DER PASCAL RTE-CHALLENGE
120 17 SCHLUSSFOLGERUNGEN 121 A VERZEICHNIS DER FORMELZEICHEN 130 A.L
VERZEICHNIS DER FORMELZEICHEN 130 A.2 VERZEICHNIS DER DUPLIKATSMERKMALE
131 A.3 VERZEICHNIS WEITERER FORMELN 133 B ENTSCHEIDUNGSBAUM DES SYSTEMS
(TEXTFORMAT) 134 C TESTTEXT FUER BESTEHENDE PLAGIATSERKENNER 138 C.L
ORIGINALTEXT VON WWW.OUTTALIMITS.DE 138 C.2 DUPLIKAT VON
WWW.FORUMPROFI4.DE 140 C.3 ZU TESTZWECKEN ABGEWANDELTE UND GEKUERZTE
VERSION DES ORIGINALTEXTES 141 D ANLAUTE DEUTSCHER WOERTER 142 E
VERWENDETE STOPPWORTLISTE 143
|
any_adam_object | 1 |
author | Eichhorn, Christian |
author_facet | Eichhorn, Christian |
author_role | aut |
author_sort | Eichhorn, Christian |
author_variant | c e ce |
building | Verbundindex |
bvnumber | BV036560849 |
classification_rvk | AK 39580 AN 96300 |
ctrlnum | (OCoLC)560461400 (DE-599)DNB999187430 |
discipline | Allgemeines Sprachwissenschaft Informatik |
format | Book |
fullrecord | <?xml version="1.0" encoding="UTF-8"?><collection xmlns="http://www.loc.gov/MARC21/slim"><record><leader>01839nam a2200457 c 4500</leader><controlfield tag="001">BV036560849</controlfield><controlfield tag="003">DE-604</controlfield><controlfield tag="005">20110111 </controlfield><controlfield tag="007">t|</controlfield><controlfield tag="008">100712s2009 gw d||| m||| 00||| ger d</controlfield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">10,N03</subfield><subfield code="2">dnb</subfield></datafield><datafield tag="015" ind1=" " ind2=" "><subfield code="a">10,A11</subfield><subfield code="2">dnb</subfield></datafield><datafield tag="016" ind1="7" ind2=" "><subfield code="a">999187430</subfield><subfield code="2">DE-101</subfield></datafield><datafield tag="020" ind1=" " ind2=" "><subfield code="a">9783899599251</subfield><subfield code="c">kart. : EUR 25.00</subfield><subfield code="9">978-3-89959-925-1</subfield></datafield><datafield tag="024" ind1="3" ind2=" "><subfield code="a">9783899599251</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(OCoLC)560461400</subfield></datafield><datafield tag="035" ind1=" " ind2=" "><subfield code="a">(DE-599)DNB999187430</subfield></datafield><datafield tag="040" ind1=" " ind2=" "><subfield code="a">DE-604</subfield><subfield code="b">ger</subfield><subfield code="e">rakddb</subfield></datafield><datafield tag="041" ind1="0" ind2=" "><subfield code="a">ger</subfield></datafield><datafield tag="044" ind1=" " ind2=" "><subfield code="a">gw</subfield><subfield code="c">XA-DE-SH</subfield></datafield><datafield tag="049" ind1=" " ind2=" "><subfield code="a">DE-92</subfield><subfield code="a">DE-M382</subfield><subfield code="a">DE-1043</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">AK 39580</subfield><subfield code="0">(DE-625)2617:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">AN 96300</subfield><subfield code="0">(DE-625)6812:</subfield><subfield code="2">rvk</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">400</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="084" ind1=" " ind2=" "><subfield code="a">004</subfield><subfield code="2">sdnb</subfield></datafield><datafield tag="100" ind1="1" ind2=" "><subfield code="a">Eichhorn, Christian</subfield><subfield code="e">Verfasser</subfield><subfield code="4">aut</subfield></datafield><datafield tag="245" ind1="1" ind2="0"><subfield code="a">Automatische Duplikatserkennung</subfield><subfield code="b">ähnliche Texte entdecken und erkennen</subfield><subfield code="c">Christian Eichhorn</subfield></datafield><datafield tag="264" ind1=" " ind2="1"><subfield code="a">Tönning [u.a.]</subfield><subfield code="b"><<Der>> Andere Verl.</subfield><subfield code="c">2009</subfield></datafield><datafield tag="300" ind1=" " ind2=" "><subfield code="a">XI, 144 S.</subfield><subfield code="b">graph. Darst.</subfield></datafield><datafield tag="336" ind1=" " ind2=" "><subfield code="b">txt</subfield><subfield code="2">rdacontent</subfield></datafield><datafield tag="337" ind1=" " ind2=" "><subfield code="b">n</subfield><subfield code="2">rdamedia</subfield></datafield><datafield tag="338" ind1=" " ind2=" "><subfield code="b">nc</subfield><subfield code="2">rdacarrier</subfield></datafield><datafield tag="500" ind1=" " ind2=" "><subfield code="a">Teilw. zugl.: Dortmund, Techn. Univ., Diplomarbeit., 2009 u.d.T.: Eichhorn, Christian: Automatische Erkennung von Duplikaten in Textbeständen mit Hilfe flacher Verfahren</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Plagiat</subfield><subfield code="0">(DE-588)4046196-8</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="650" ind1="0" ind2="7"><subfield code="a">Textproduktion</subfield><subfield code="0">(DE-588)4184945-0</subfield><subfield code="2">gnd</subfield><subfield code="9">rswk-swf</subfield></datafield><datafield tag="655" ind1=" " ind2="7"><subfield code="0">(DE-588)4113937-9</subfield><subfield code="a">Hochschulschrift</subfield><subfield code="2">gnd-content</subfield></datafield><datafield tag="689" ind1="0" ind2="0"><subfield code="a">Textproduktion</subfield><subfield code="0">(DE-588)4184945-0</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2="1"><subfield code="a">Plagiat</subfield><subfield code="0">(DE-588)4046196-8</subfield><subfield code="D">s</subfield></datafield><datafield tag="689" ind1="0" ind2=" "><subfield code="5">DE-604</subfield></datafield><datafield tag="856" ind1="4" ind2="2"><subfield code="m">DNB Datenaustausch</subfield><subfield code="q">application/pdf</subfield><subfield code="u">http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=020482196&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA</subfield><subfield code="3">Inhaltsverzeichnis</subfield></datafield><datafield tag="943" ind1="1" ind2=" "><subfield code="a">oai:aleph.bib-bvb.de:BVB01-020482196</subfield></datafield></record></collection> |
genre | (DE-588)4113937-9 Hochschulschrift gnd-content |
genre_facet | Hochschulschrift |
id | DE-604.BV036560849 |
illustrated | Illustrated |
indexdate | 2024-12-20T14:36:56Z |
institution | BVB |
isbn | 9783899599251 |
language | German |
oai_aleph_id | oai:aleph.bib-bvb.de:BVB01-020482196 |
oclc_num | 560461400 |
open_access_boolean | |
owner | DE-92 DE-M382 DE-1043 |
owner_facet | DE-92 DE-M382 DE-1043 |
physical | XI, 144 S. graph. Darst. |
publishDate | 2009 |
publishDateSearch | 2009 |
publishDateSort | 2009 |
publisher | <<Der>> Andere Verl. |
record_format | marc |
spellingShingle | Eichhorn, Christian Automatische Duplikatserkennung ähnliche Texte entdecken und erkennen Plagiat (DE-588)4046196-8 gnd Textproduktion (DE-588)4184945-0 gnd |
subject_GND | (DE-588)4046196-8 (DE-588)4184945-0 (DE-588)4113937-9 |
title | Automatische Duplikatserkennung ähnliche Texte entdecken und erkennen |
title_auth | Automatische Duplikatserkennung ähnliche Texte entdecken und erkennen |
title_exact_search | Automatische Duplikatserkennung ähnliche Texte entdecken und erkennen |
title_full | Automatische Duplikatserkennung ähnliche Texte entdecken und erkennen Christian Eichhorn |
title_fullStr | Automatische Duplikatserkennung ähnliche Texte entdecken und erkennen Christian Eichhorn |
title_full_unstemmed | Automatische Duplikatserkennung ähnliche Texte entdecken und erkennen Christian Eichhorn |
title_short | Automatische Duplikatserkennung |
title_sort | automatische duplikatserkennung ahnliche texte entdecken und erkennen |
title_sub | ähnliche Texte entdecken und erkennen |
topic | Plagiat (DE-588)4046196-8 gnd Textproduktion (DE-588)4184945-0 gnd |
topic_facet | Plagiat Textproduktion Hochschulschrift |
url | http://bvbr.bib-bvb.de:8991/F?func=service&doc_library=BVB01&local_base=BVB01&doc_number=020482196&sequence=000001&line_number=0001&func_code=DB_RECORDS&service_type=MEDIA |
work_keys_str_mv | AT eichhornchristian automatischeduplikatserkennungahnlichetexteentdeckenunderkennen |