Der NanaOne-Japanischkurs, Kapitel 37

Japanisch für den allergrößten Volltrottel, der sich niemals fortpflanzen sollte

Kapitel 37-

Endlich vernünftige OCR-Software für Kanji!

Der Titel beinhaltet genau eine Wahrheit und eine Lüge.

1) Die Wahrheit: Ja, es gibt dort draußen im großen, weiten Internet eine Software, die Text aus einem Bild erkennen kann. Das IME-Pad und Konsorten werden somit quasi überflüssig.
2) Die Lüge: „Endlich“ ist Unsinn, denn die Software ist nicht mehr wirklich neu (Es wird daran aber noch weitergearbeitet). Es handelt sich nämlich um eine grafische Benutzeroberfläche für NHocr, einer Kommandozeilensoftware, die Zeichenerkennungsalgorithmen zur Verfügung stellt.

Ich rede von einem Programm namens Capture2Text. Irgendjemandem auf der Welt war tatsächlich so unglaublich langweilig, dass er eine Software geschrieben hat, die alles, was sich unter Windows auf dem Bildschirm anzeigen lässt, mit nur einer kleinen Markierung erkennen kann. Gepriesen sei die Langeweile!

Sourceforge-Link

oder

Direkter Download der aktuellsten Version

Wer nicht weiß, wie man mit einer ZIP-Datei umgeht, der soll bitte schnellstmöglich seinen Vorkriegs-Computer entsorgen und sich von diesem Jungen hier einführen lassen:

Ist also das Archiv entpackt, starten wir die Capture2Text.exe. Beim ersten Mal starten kriegen wir eine Meldung, die wir ignorieren können. Wichtig ist, dass sich nun ein großes Fenster öffnet, in dem in dicken Lettern ein fröhliches „Konnichi wa!“ steht!!!

Na ja, eigentlich öffnet sich gar kein Fenster, also keine Sorge. Im Tray (Die Leiste unten, in der sich u.a. die Windows-Uhr befindet) müsste jetzt ein neues Icon erschienen sein, ein rot-schwarzes Paint-Gekritzel mit der Zahl 2 in der Mitte. Dort klicken wir mit der rechten Maustaste hinauf und wählen „Preferences“. Jetzt müsste sich ein Fenster öffnen, das uns zuerst einmal die vordefinierten Hotkeys anzeigt. Ihr könnt sie ändern, wie ihr wollt, ich fahre jetzt mit den Standard-Hotkeys fort.

Klicken wir nun auf den Tab „OCR“, denn hier definieren wir unsere Einstellungen für die Texterkennung („Optical Character Recognition“).

Da wir das Programm primär für die japanische Sprache nutzen, ändern wir unter „Current OCR-Language“ die Sprache von „English“ auf „Japanese (NHocr)“. (Wer möchte, kann auch Tesseract probieren, aber das hat, soweit ich es getestet hab, eine höhere Fehlerrate.)

So, das war’s schon wieder mit den Einstellungen, wir können OK klicken und das Fenster schließt sich.

Dieser Satz steht nicht in markierbarem japanischen Unicode-Text da, sondern ist als Bild gespeichert. Rikaichan und Co. KG helfen uns hier nicht weiter – Jetzt kommt Capture2Text ins Spiel! Wir fahren mit dem Mauscursor an den linken oberen Rand des Bildes, drücken Windows+Q und schieben dann den Cursor in die rechte untere Ecke. Wenn das Bild nun blau markiert ist und in der linken oberen Bildschirmecke ein schwarzer Kasten mit weißen Schriftzeichen zu sehen ist (möglichst mit den richtigen Kanji und Kana), habt ihr alles richtig gemacht. Klickt ihr nun mit der linken Maustaste, wird der erkannte Text in die Zwischenablage gespeichert (und in den Ordner „Output“). Aktiviert man zudem „Enable Popup-Window“ im Preferences-Fenster unter „Output“, wird nach dem Linksklick ein kleines Fenster mit dem erkannten Text angezeigt.

Sonstige wichtige Hotkeys:

Mit ESC lässt sich die aktuelle Erkennung abbrechen.
Hält man die rechte Maustaste gedrückt und fährt mit dem Cursor herum, kann man die Markierung herumziehen.
Mit der Leertaste springt die Maus zwischen den beiden Ecken hin- und her, sodass sich die Box besser modifizieren lässt.

Capture2Text beherrscht übrigens auch Spracherkennung für gesprochene Sprachen. Wie weit das funktioniert, soll jeder selbst für sich ausprobieren. Meine Tests für Deutsch, Englisch und Japanisch fielen eher durchwachsen aus.

Der Rest des Programmes ist selbsterklärend und nicht mehr essentiell für eine anständige automatisierte Texterkennung. Steckt man bei einem Zeichen fest, weil es falsch erkannt wurde, kann man ruhig auch Tesseract ausprobieren, denn das wurde schließlich speziell für die Erkennung einzelner Zeichen konzipiert. Schlägt auch das fehl, bleibt uns immer noch das gute, alte IME-Pad! Und ein Kumpel aus Japan, der hoffentlich helfen kann…

Autor: naich
Datum: 28.10.2012
Kategorien: Blog, NanaOne-Japanischkurs

4 Kommentare

1 | Spelllord

28. Oktober 2012 um 18:08
Link: #8683

ich hab zwar den Text bisher nur überflogen trotzdem danke
und ist das jetzt Kapitel 37 oder 36
hier steht ja 36
und unter blog 37
also?

( Antworten )
- 2 | naich
  
  28. Oktober 2012 um 18:20
  Link: #8685
  
  Kapitel 37 ist richtig. Hab vergessen, den Titel zu ändern, danke.
  
  ( Antworten )
3 | Drekelmann

1. November 2012 um 21:42
Link: #8793

Capture2Text beherrscht übrigens auch Spracherkennung für gesprochene Sprachen. Wie weit das funktioniert, soll jeder selbst für sich ausprobieren. Meine Tests für Deutsch, Englisch und Japanisch fielen eher durchwachsen aus.

Tja, in einem Mercedes-Navigationssystem oder auf der Enterprise-Brücke wird man Capture2Text-Spracherkennung wohl eher nicht verwenden… 😉 Gute (kostenlose, teils Open-Source-) Spracherkennungssoftware gibt es aber durchaus (mir wurde Sphinx-4 empfohlen, habe es aber noch nicht ausprobiert), falls du tatsächlich welche brauchst. Ansonsten: Finger davon lassen. Den Frust kann (und sollte) man sich ersparen.

ZIP-Archiv? Ich sollte mir eine WinRAR-Lizenz kaufen!

Nur, falls jemand das Obige ernst nehmen sollte: Nein, sollte man nicht. Windows kann seit ungefähr XP Zip-Dateien öffnen, und ansonsten gibt es Software wie WinZip bzw. (auch für alle anderen Betriebssysteme) 7-Zip.

(Tut mir Leid, wenn ich damit den Gag zerstöre, aber es gibt leider jede Menge unschuldige Computer-Deppen, die derartige Dinge glauben. Man beachte die Alliteration.)

( Antworten )
4 | Aru

23. November 2012 um 00:42
Link: #9653

Für Bilder und solche Dinge, die man in eine .pdf umwandeln könnte, kann ich für so was übrigens Adobe Acrobat empfehlen. Ist Wahnsinn, was das Programm da herausholt. Mit der ClearScan Funktion bleibt auch das ganze Bild erhalten, so wie es ist und gar nicht verändert. Trotzdem lassen sich alle Zeichen kopieren usw. Wer also das nötige Kleingeld hat oder bei wem es vom Laster gefallen ist … 😀

( Antworten )

Einen Kommentar schreiben

Hier klicken, um das Antworten abzubrechen.

	John Titor bei Crunchyroll betritt den deutschen Markt (UPDATE)
	Früherer Leecher bei Heute ab 19:30 Uhr: Frühlingsseason-Livestream #2
	Akihito bei Heute ab 19:30 Uhr: Frühlingsseason-Livestream #2
	U.S. Grant bei Heute ab 20 Uhr: RETRO-Livestream #408 (Movies)
	Firebird bei Fansub: Kuragehime 08-11 (FIN)
	naich bei Fansub: Kuragehime 08-11 (FIN)
	Gebbi bei Macross (alles) lizenziert

Der NanaOne-Japanischkurs, Kapitel 37

Neue Kommentare

Kategorien

Monatsarchive

Der Papst empfiehlt