Neue Antwort schreiben 
 
Themabewertung:
  • 0 Bewertung(en) - 0 im Durchschnitt
  • 1
  • 2
  • 3
  • 4
  • 5
Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
Xaar Offline
Wahnsinnige Geschwindigkeit - und los!

Beiträge: 26.207
Registriert seit: Jul 2009
Beitrag #1
Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
Hallöchen!

Kennt jemand 'n Tool, dem ich ein Text enthaltendes Dokument (z. B. PDF- oder Word-Dokument) zuführen kann, welches mir dann eine Liste ausspuckt, welche Abkürzungen da drin so gefunden wurden? Was als "Abkürzung" zählt, sollte man vorteilhafterweise festlegen können (also bspw. Worte, die mehr als einen Großbuchstaben enthalten, oder die auf einen "." enden).

Hintergrund ist das Abkürzungsverzeichnis in 'ner wissenschaftlichen Arbeit :D Das würde das Ganze doch merklich vereinfachen =)

«Ich verstehe Ihre Frage so: Dass es Menschen gibt, die wünschen, dass ein solches OS als "Retro-OS" bezeichnet wird, ja? Mir ist nicht bekannt, dass solche Absichten bestehen, da HP-UX 9.x einfach ein altes OS ist. Niemand hat die Absicht, ein "Retro-OS" zu bauen.» Xaar, 2014

Prozessor gesucht? -> Prozessoren, die ich abgeben kann (unter "Available for trading")
"Überschüssige" Prozessoren oder Hardware? -> Einfach PN an mich schicken b1 -> Hardware, die ich suche
(Dieser Beitrag wurde zuletzt bearbeitet: 06.11.2016 09:12 von Xaar.)
06.11.2016 09:11
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
s4ndwichMakeR Offline
Realitätsfeinmotoriker‮

Beiträge: 5.195
Registriert seit: Jul 2008
Beitrag #2
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
grep?

• • • – • – – • – –
06.11.2016 22:31
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Xaar Offline
Wahnsinnige Geschwindigkeit - und los!

Beiträge: 26.207
Registriert seit: Jul 2009
Beitrag #3
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(06.11.2016 22:31)s4ndwichMakeR schrieb:  grep?

Falls diese Antwort ernstgemeint war: Beispiel gefällig?

«Ich verstehe Ihre Frage so: Dass es Menschen gibt, die wünschen, dass ein solches OS als "Retro-OS" bezeichnet wird, ja? Mir ist nicht bekannt, dass solche Absichten bestehen, da HP-UX 9.x einfach ein altes OS ist. Niemand hat die Absicht, ein "Retro-OS" zu bauen.» Xaar, 2014

Prozessor gesucht? -> Prozessoren, die ich abgeben kann (unter "Available for trading")
"Überschüssige" Prozessoren oder Hardware? -> Einfach PN an mich schicken b1 -> Hardware, die ich suche
06.11.2016 22:44
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Arnulf zu Linden Offline
Hat und braucht kein Smartphone!

Beiträge: 6.084
Registriert seit: Oct 2012
Beitrag #4
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(06.11.2016 09:11)Xaar schrieb:  Was als "Abkürzung" zählt, sollte man vorteilhafterweise festlegen können (also bspw. Worte, die mehr als einen Großbuchstaben enthalten, oder die auf einen "." enden).

Der Schuss wird gewaltig nach hinten losgehen, denn an fast jedem Satzende endet ein Wort mit einem Punkt. :D

Wenn es mal "etwas" älter sein darf:
https://www.sackpfeyffer-zu-linden.de/Hardware.html
06.11.2016 22:46
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
freaked Offline
× ∫яεαкεδ εησυġн × ζιgнтѕтαя ×

Beiträge: 17.321
Registriert seit: Jul 2008
Beitrag #5
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
Die windows suche kann doch dokumenteninhalte durchsuchen...dann einfach im explorer suchfeld die vorgegebenen abkürzungen rein klatschen

06.11.2016 22:51
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Xaar Offline
Wahnsinnige Geschwindigkeit - und los!

Beiträge: 26.207
Registriert seit: Jul 2009
Beitrag #6
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(06.11.2016 22:46)Arnulf zu Linden schrieb:  Der Schuss wird gewaltig nach hinten losgehen, denn an fast jedem Satzende endet ein Wort mit einem Punkt. :D

Das ist mir bewusst. Aber lieber schaue ich mir 1000 gefundene Einträge an, als fast 30000 Wörter ;)

(06.11.2016 22:51)freaked schrieb:  Die windows suche kann doch dokumenteninhalte durchsuchen...dann einfach im explorer suchfeld die vorgegebenen abkürzungen rein klatschen

Wie soll das gehen? Ich such ja nicht nach einer bestimmten Abkürzung (dafür kann ich auch die SuFu von Word oder dem Acrobat Reader nutzen), sondern will danach eine Auflistung aller "Abkürzungen" haben.

«Ich verstehe Ihre Frage so: Dass es Menschen gibt, die wünschen, dass ein solches OS als "Retro-OS" bezeichnet wird, ja? Mir ist nicht bekannt, dass solche Absichten bestehen, da HP-UX 9.x einfach ein altes OS ist. Niemand hat die Absicht, ein "Retro-OS" zu bauen.» Xaar, 2014

Prozessor gesucht? -> Prozessoren, die ich abgeben kann (unter "Available for trading")
"Überschüssige" Prozessoren oder Hardware? -> Einfach PN an mich schicken b1 -> Hardware, die ich suche
(Dieser Beitrag wurde zuletzt bearbeitet: 06.11.2016 22:53 von Xaar.)
06.11.2016 22:52
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Arnulf zu Linden Offline
Hat und braucht kein Smartphone!

Beiträge: 6.084
Registriert seit: Oct 2012
Beitrag #7
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(06.11.2016 22:52)Xaar schrieb:  sondern will danach eine Auflistung aller "Abkürzungen" haben.

Das wird schwierig, eine Möglichkeit wäre ein "Wörterbuchangriff" mit grep, also das Suchen gegen eine Liste mit Abkürzungen. Nicht allgemeinübliche Abkürzungen sollten in wissenschaftlichen Texten ohnehin bei Erstgebrauch ausgeschrieben sein, Beispiel:

… die Hochspannungs-Gleichstrom-Übertragung (HGÜ) wird … blablabla … die HGÜ … bläh sülz bla … wegen der HGÜ … bla blubb …

Wenn es mal "etwas" älter sein darf:
https://www.sackpfeyffer-zu-linden.de/Hardware.html
06.11.2016 23:08
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Xaar Offline
Wahnsinnige Geschwindigkeit - und los!

Beiträge: 26.207
Registriert seit: Jul 2009
Beitrag #8
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(06.11.2016 23:08)Arnulf zu Linden schrieb:  Nicht allgemeinübliche Abkürzungen sollten in wissenschaftlichen Texten ohnehin bei Erstgebrauch ausgeschrieben sein, Beispiel:

… die Hochspannungs-Gleichstrom-Übertragung (HGÜ) wird … blablabla … die HGÜ … bläh sülz bla … wegen der HGÜ … bla blubb …

Das habe ich ja auch so. Nichts desto trotz gehören die Abkürzungen ins Abkürzungsverzeichnis - und das will ich gegenprüfen. Also ob alles das, was im Abkürzungsverzeichnis drin ist, auch im Text verwendet wird, und - was noch wichtiger ist! - , ob alle im Text verwendeten Abkürzungen auch im Abkürzungsverzeichnis drin sind.

Letztlich werd' ich wohl oder übel eh im Abkürzungsverzeichnis "abstreichen", wenn ich die Arbeit nochmal einer Kontrolllesung unterziehe.

«Ich verstehe Ihre Frage so: Dass es Menschen gibt, die wünschen, dass ein solches OS als "Retro-OS" bezeichnet wird, ja? Mir ist nicht bekannt, dass solche Absichten bestehen, da HP-UX 9.x einfach ein altes OS ist. Niemand hat die Absicht, ein "Retro-OS" zu bauen.» Xaar, 2014

Prozessor gesucht? -> Prozessoren, die ich abgeben kann (unter "Available for trading")
"Überschüssige" Prozessoren oder Hardware? -> Einfach PN an mich schicken b1 -> Hardware, die ich suche
06.11.2016 23:14
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
s4ndwichMakeR Offline
Realitätsfeinmotoriker‮

Beiträge: 5.195
Registriert seit: Jul 2008
Beitrag #9
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
(06.11.2016 22:44)Xaar schrieb:  
(06.11.2016 22:31)s4ndwichMakeR schrieb:  grep?

Falls diese Antwort ernstgemeint war: Beispiel gefällig?

Natürlich war die ernst gemeint. Für genau solche Anwendungen wurde grep gemacht. Musst dir nur einen regulären Ausdruck zurechtbasteln, z.B. [A-Z-]{2,} (müsste man mal noch schauen wegen Unicode). Das mit dem Punkt als Satzzeichen wird dir aber tatsächlich auf die Füße fallen. Wie soll man bspw. das ›bspw.‹ von dem ›fallen.‹ im letzten Satz unterscheiden können? … Hmm, eventuell über den Case des ersten Buchstabens des folgenden Wortes. Wie gesagt, ist alles eine Frage der richtigen Regexp.

• • • – • – – • – –
(Dieser Beitrag wurde zuletzt bearbeitet: 07.11.2016 00:20 von s4ndwichMakeR.)
07.11.2016 00:15
Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Dirk Offline
Software Archäologe

Beiträge: 14.934
Registriert seit: Jul 2008
Beitrag #10
RE: Tool zur Suche/Auflistung von verwendeten Abkürzungen in Dokumenten
Hatte auch mal in der Unizeit mit Python und Regex gespielt. Da ist viel möglich. Aber hat auch seine grenzen. Wenn es hilft kann man mit Calibre die pdfs und doc/docx in txt verwandeln. Dort ist auch ne Regexsuche drin, aber die wirft keine Liste, sondern nacheinnander stellen.

Die Frage ist, ob normale Abkürzungen gesucht werden müssen, sonst sind bspw. wirklich nicht ohne Wortliste zu finden. Der Großbuchstabe danach kann auch einfach aus einem Hauptwort entstammen. Wenn mehrere Großbuchstaben in einen Wort sind ist es ja einfach, einfach a-z und A-Z gierig aber nullig suchen zwischen 2 Großbuchstaben. Aber Regex ist auch nicht mein Steckenpferd.

07.11.2016 06:42
Webseite des Benutzers besuchen Alle Beiträge dieses Benutzers finden Diese Nachricht in einer Antwort zitieren
Neue Antwort schreiben 


Gehe zu:


Benutzer, die gerade dieses Thema anschauen: 4 Gast/Gäste