BG Development


  Reply to this topicStart new topicStart Poll

> Софтуер за създаване на текстов файл от снимка
3p0
Публикувано на: 13-01-2024, 16:00
Quote Post



Име:
Група: Потребител
Ранг: Почетен член

Мнения: 955
Регистриран на: 18.06.05



Имам .png файл на текст кирилица сниман със смартфон.
Исками се, да го пусна през някакъв софтуер, който да разпознае символите от кирилица от снимката и да ги запише в текстов файл.
Преди години май ползвах някакъв фрий софтуер, но съм забравил кой.
Пуснах търсене в сайта на MX Linux: "convert image to text"
Searched query: +convert +image +text
В резултатите май няма коментари, които да ми помогнат, затова опитвам тук на български език - дайте предложение за такъв софтуер ...



--------------------
MX-21.3 Linux; CPU=Intel® Quad Core i5-2500 1.6-3.7 gHz; MB=Intel model: DQ67SW; Video=AMD RV770 [Radeon HD 4850]; RAM=16giB DDR3-1600 mHz;
PM
Top
rvc
Публикувано на: 13-01-2024, 16:05
Quote Post



Име:
Група: Потребител
Ранг: Почетен член

Мнения: 2636
Регистриран на: 13.05.11



опитай с OCR
PMEmail PosterUsers Website
Top
3p0
Публикувано на: 13-01-2024, 16:15
Quote Post



Име:
Група: Потребител
Ранг: Почетен член

Мнения: 955
Регистриран на: 18.06.05



Стартирах MX Package installer,
написах OCR
показа ми се списък със софтуери, от които само GOCR е инсталиран и пише като пояснение: Command line OCR

Мога да стартирам в терминал този GOCR, но не му знам командите, предполагам че трябва да напиша такава команда
gocr -h

за да разбера какви са му командите

CODE
released under the GNU General Public License
using: gocr [options] pnm_file_name  # use - for stdin
options (see gocr manual pages for more details):
-h, --help, -V --version
-i name   - input image file (pnm,pgm,pbm,ppm,pcx,...)
-o name   - output file  (redirection of stdout)
-e name   - logging file (redirection of stderr)
-x name   - progress output to fifo (see manual)
-p name   - database path including final slash (default is ./db/)
-f fmt    - output format (ISO8859_1 TeX HTML XML UTF8 ASCII)
-l num    - threshold grey level 0<160<=255 (0 = autodetect)
-d num    - dust_size (remove small clusters, -1 = autodetect)
-s num    - spacewidth/dots (0 = autodetect)
-v num    - verbose (see manual page)
-c string - list of chars (debugging, see manual)
-C string - char filter (ex. hexdigits: 0-9A-Fx, only ASCII)
-m num    - operation modes (bitpattern, see manual)
-a num    - value of certainty (in percent, 0..100, default=95)
-u string - output this string for every unrecognized character
examples:
      gocr -m 4 text1.pbm                   # do layout analyzis
      gocr -m 130 -p ./database/ text1.pbm  # extend database
      djpeg -pnm -gray text.jpg | gocr -    # use jpeg-file via pipe


CODE
$ gocr -i timg.png -o bulg.txt
sh: 1: pngtopnm: not found

ERROR pnm.c L328: unexpected EOF


Това мнение е било редактирано от 3p0 на 13-01-2024, 16:38


--------------------
MX-21.3 Linux; CPU=Intel® Quad Core i5-2500 1.6-3.7 gHz; MB=Intel model: DQ67SW; Video=AMD RV770 [Radeon HD 4850]; RAM=16giB DDR3-1600 mHz;
PM
Top
thrawn
Публикувано на: 13-01-2024, 17:18
Quote Post



Име:
Група: Потребител
Ранг: Почетен член

Мнения: 3615
Регистриран на: 17.01.17



И сега чакаш някой да ти каже, да инсталираш pngtopnm ли?
PMEmail Poster
Top
3p0
Публикувано на: 13-01-2024, 17:25
Quote Post



Име:
Група: Потребител
Ранг: Почетен член

Мнения: 955
Регистриран на: 18.06.05



Благодаря, ще инсталирам pngtopnm
Сигурно ви изглежда странно, че задавам тъпи въпроси. Причината е че съм на 69 години, нямам IT образование, около 2000 година работих 14 месеца като програмист на Делфи под Windows. Така и не научих командите на Линукс, а не искам да купувам Windows.

Общо взето никой не е длъжен да ми обяснява, няма да се разсърдя, ко не ми се отговаря на тъпите въпроси ...


--------------------
MX-21.3 Linux; CPU=Intel® Quad Core i5-2500 1.6-3.7 gHz; MB=Intel model: DQ67SW; Video=AMD RV770 [Radeon HD 4850]; RAM=16giB DDR3-1600 mHz;
PM
Top
SuN
Публикувано на: 13-01-2024, 17:39
Quote Post


Group Icon
Име:
Група: Администратор
Ранг: Почетен член

Мнения: 12666
Регистриран на: 27.01.05



Друга алтернатива е tesseract. Това е част от описанието според пакетния меринджей на дебиан:
QUOTE
# apt show tesseract-ocr
Package: tesseract-ocr
Version: 5.3.3-1
...
Installed-Size: 2281 kB
...
Homepage: https://github.com/tesseract-ocr/
...
Description: Tesseract command line OCR tool
Tesseract is an open source Optical Character Recognition (OCR)
Engine. It can be used directly, or (for programmers) using an API to
extract printed text from images. It supports a wide variety of
languages. This package includes the command line tool.


До колкото помня, алгоритъма, който ползва е старичък. Колкото по-ясна е картината, толкова по-качествено ще е разпознаването. Мисля, че можеше и да се обучава да разпознава шрифтове, но не съм го пробвал.

Това мнение е било редактирано от SuN на 13-01-2024, 17:41


--------------------
Само аз не троля.
Всички коментари са плод на художествена измислица и нямат общо с действителни и недействителни лица, събития и факти.
PMEmail Poster
Top
3p0
Публикувано на: 13-01-2024, 19:03
Quote Post



Име:
Група: Потребител
Ранг: Почетен член

Мнения: 955
Регистриран на: 18.06.05



Получи се чрез tesseract-ocr.
Даже след това намерих: Graphical GTK+ front-end to tesseract-ocr който избягва команди в терминала.
Благодаря!


--------------------
MX-21.3 Linux; CPU=Intel® Quad Core i5-2500 1.6-3.7 gHz; MB=Intel model: DQ67SW; Video=AMD RV770 [Radeon HD 4850]; RAM=16giB DDR3-1600 mHz;
PM
Top
1 потребители преглеждат тази тема в момента (1 гости, 0 анонимни потребители)
Потребители, преглеждащи темата в момента:

Topic Options Reply to this topicStart new topicStart Poll

 


Copyright © 2003-2019 | BG Development | All Rights Reserved
RSS 2.0