»Компьютерный форум Ru.Board
  http://forum.ru-board.com/board.cgi
»Программы
  http://forum.ru-board.com/forum.cgi?forum=5
»ScanKromsator | СканКромсатор (Часть 4)
  http://forum.ru-board.com/topic.cgi?forum=5&topic=50023


Автор: gyra, Отправлено:10:34 14-11-2018

Предыдущие темы: 1 часть | 2 часть | 3 часть

ScanKromsator

Знаменитый Кромсатор для обработки получаемых при сканировании изображений страниц.
Автор: bolega
ScanKromsator в Википедии: http://ru.wikipedia.org/wiki/ScanKromsator

Обсуждение создания e-книг: Электронные книги: скан, обработка, сборка

Текущая версия программы : ScanKromsator v6.97 | ScanKromsator v6.91 |
ScanKromsator v6.8 | ScanKromsator v6.75
Добавки и замечания от bolega:
к v6.91 |к v6.8 | к v6.75
Туториалы по ScanKromsator v6.72 и выше
Не используйте в версии 6.75 опцию Overwrite original scans after rotate!
Это приведет к повреждению исходных сканов, если они не в формате jpg и их dpi>300.

Предыдущая версия программы: ScanKromsator v6.71
Подключаемые утилиты и их [more=настройка]Настройка внешних программ и утилит

Для работы ряда функций СК потребуется установить несколько сторонних приложений/библиотек:

- DjVulibre: используется при создании djvu. Библиотека доступна на http://djvu.sourceforge.net.
Важно ! До версии SK 6.91 нужна старая djvulibre, версии 2015 года, например djvulibre_djview_4_9_djvulibre_3_5_25_3

- Kakadu: кодек jpg2000, может использоваться при создании PDF. Наличие кодека необязательно.
Доступен на http://kakadusoftware.com/downloads.
Достаточно иметь демонстрационную (trial) версию, при условии, что она не используется в коммерческих целях.
С "Copyright notice" можно ознакомиться на странице загрузки http://kakadusoftware.com/downloads.
- FFTW: используется для работы фильтра descreen. Библиотека dll доступна на http://www.fftw.org.
- DEE (documenttodjvu.exe): используется только при создании djvu.
- DjVuDecode: используется при импорте djvu-файлов. Утилита содержится в дистибутиве DEE или DjVu Small (Mod).
- Tesseract: используется при работе специального метода despeckle. Доступен на https://code.google.com/p/tesseract-ocr.


1. Файл bps.cfg, fftw3.dll, ocr.dll поместите в папку, где находится исполняемый файл sk.exe.

2. Папку tessdata со всем содержимым поместите в любое место на диске. В настройках СК
File>Options>Apps>Tesseract укажите полный путь к файлу eng.traineddata, напр.,
"C:\SK\tessdata\eng.traineddata"

3. Файлы kdu_compress.exe и kdu_v77R.dll поместите в любое место на диске. В настройках СК
File>Options>Apps>JPG2000 codec укажите полный путь к файлу kdu_compress.exe, напр.,
"..\..\Program Files\kakadu\kdu_compress.exe"

4. В настройках СК File>Options>Apps>DjVuDecode укажите полный путь к файлу DjVuDecode.exe, напр.,
"C:\Program Files\Utilities\djvu-decode\DjVuDecode.exe"

5. В настройках СК File>Options>Apps>DjVulibre укажите полный путь к файлу djvumake.exe, напр.,
"D:\DjVuLibre\djvumake.exe". Важно, что библиотека DjVulibre должна быть установлена полностью.
СК использует несколько утилит из DjVulibre, не только djvumake.exe.

6. В настройках СК File>Options>Apps>DEE укажите полный путь к файлу documenttodjvu.exe, напр.,
"D:\DEE\documenttodjvu.exe"
[/more].
Предыдущая стабильная версия: ScanKromsator 6.00.5
Устаревшие версии:
[more]

v6.52 https://yadi.sk/d/3xPQMUhFkaXXEQ

v5.96.2 https://yadi.sk/d/_rmVG3EJ3A8ptP (только файл sk.exe, утилиты к ней можно взять из 5.96.1)
v5.96.1 https://yadi.sk/d/z9C9krTA2fErk

Full-версии включают dll-библиотеки и Help к SK v1.0 в формате Pdf:
[/more]


Новое в 6-й версии
Изменения в версии (5.92) + описание нового порядка обработки (с "финализацией" файлов)
Учебный пример от bolega по использованию зон
Хелп v1.0 для Кромсатора. Есть в PDF (368 КБ)

Подборка ответов bolega про работу ScanKromsator (версия 1.0.2 с закладками и сносками), 2016 г.
ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018) Включённые в т.ч. материалы: [more]
Использование ScanKromsator’а v5.91 от Melirius
ScanAndShare v1.07 - инструкция в картинках от VadimirTT
Пособие по Кромсатору от monday2000
Примеры использования от shch_vg #1, #2
Обработка пикчур-зон от TelecomUral
"Самая краткая инструкция" по работе с СК (включает "сборку" СК) от ghosty

[/more]


Работа с автоглифами
Как подключить: шаги
Парсер версия 2.3.1 из ветки утилит NME
Видео bolega про работу с автоглифами (третья из четырех частей про версию 6.72) https://disk.yandex.ru/i/AbTv4koTmCGogw.


Как вставить OCR в PDF
[more]
serg28serg
ну что ж, напишу мануал по встроенному OCR через tesseract, пока все помню
что бы откликалось в поисковике яндекса :
"Как распознать текст через встроенный OCR в ScanKromsator", " tesseract"
1. скачать версию ScanKromsator v6.75 (эту версию потому как в шапке на текущий момент добавки для этой версии : ) скачать из шапки "добавки и замечания к v6.75 от bolega" архив sk6.75-add.rar, правда там папка 6.72
2. все файлы/папки из архива sk6.75-add.rar кинуть в папку с экзешником ScanKromsator
3. настроить путь до , файла "\tessdata2\rus.traineddata"" в меню SK "FILE->Options..->Apps->Tesseract" указать на данный файл
4. в "Page->special->More2->OCR Languares" отметить чекбокс Russian, English , отмечать обязательно с удержанием кнопки Ctrl !!!
5. OCR работает только с BW файлами , выбрать в Files->Color - B/W
6. сохранить как task и Закрыть-Открыт SK , с сохраненным task
......добавляем наши сканы... меняем остальные настройки как нужно нам....
7. Генерим выходной TIFF B/W
8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All
9. если нужен цветной TIFF , то меняем B/W на цветной , генерим TIFF на выход
10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page , наводим на слова , распознанное слово должно всплывать желтым текстовым хинтом
11. File > Create out task
12. в вкладках под файлами - в Files задаем имя выходного PDF - PDF Name : myfirstOCR (или имя какое придумаем) .
13. так же в вкладке Files задаем Output format : PDF
14. в вкладке PDF отмечаем обязательно галочку Add OCR
15. Сохраняем task (не проверял есть ли автосохран)
16. Жмем уже "главную кнопку" в верхней морде "Process!"
и смотрим результат
(указал минималку что нужна для OCR PDF , остальное естественно по желанию и хотелкам)
 
может будут всплывать сообщения о недостающей DLL или не указан язык или нет папки - значит что то не доделали по пунктикам, конечно касательно версии sk6.75.
 
может кому то поможет в раскопках по вопросу "как распознать текст в ScanKromsator"
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2980#17

обычно в новом СК забывают нажать кнопочку "отобразить текст" в окне VR.

[/more] | Иллюстрация алгоритма



Видеоуроки про ScanKromsator

Видео от bolega:
Обработка зон. Часть 1. Версия с таймлайнами на youtube
    Как правильно обрабатывать зоны с фоном (чистка фона страниц в иллюстрациях).

Обработка зон. Часть 2. Версия с таймлайнами на youtube
    Раскрашенные зоны, переобработка зон, габариты страниц, ребинаризация, удаление спеклов, малоцветные зоны и создание djvu.

Видеоролики других авторов: [more]
Автор Плейлист
wasp238 Основные принципы работы в программе ScanKromsator
imwerden Основы работы программы ScanKromsator
Установки по умолчанию в ScanKromsator
Обработка страниц с цветным текстом в ScanKromsator
Обработка страниц книги с иллюстрациями
Маленькие хитрости
TelecomUral 06. Сохранение светлой зоны под текстом
07. Бинаризация плохого текста. Групповые операции. Выпрямление строк (в Book Restorer)
08. Азы подготовки качественных djvu-файлов
16. Чистка мусора и замена плохих буковок
17. Как подготовить малоцветные рисунки в СК 6.52
18. Магическое выделение и другие трюки
Другие видео на youtube-канале автора
Другие видео на rutube-канале автора

[/more]


ВАЖНО!


Перед тем, как задать вопрос, читаем внимательно файл sk.N.N.whats.new.txt



Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.
Инструкция по созданию субтаска в следующей строке!

Что делать, если ScanKromsator не делает то, что хотелось бы...
И ещё bolega о том же самом[more=...]Дайте полную информацию: скан, задание spt, out-файлы. Случай элементарный. Чего там может не получаться - никак не пойму. Сто раз уже говорил: есть проблема - присылайте задание, а не кучу постов про то, как плохо выходит. По заданию сразу можно увидеть, что не так, подсказать, что поправить. А не гадать на кофейной гуще, отчего в таком простом случае может что-то не получаться.[/more]
и, наконец, от него же ОКОНЧАТЕЛЬНОЕ РЕШЕНИЕ.

Автор: shch_vg, Отправлено:15:29 14-11-2018

bolega

Цитата:
То, что картинки кодируются по разному в СК и DjVu Small - это факт. В СК за качество кодирования отвечает параметр Background quality - это синтетический параметр, который не имеет прямого соответствия в параметрах djvulibre. В DjVu Small такая же история. И они в СК и DjVu Small по разному конвертируются в параметры djvulibre. В СК приоритетным является качество, а не степень сжатия. Отсюда и различие.

Что-то я здесь не понимаю.
Есть СК и есть DjVu Small, которые для кодирования используют один и тот же модуль DEE, обращаясь к нему через параметры DEE.
Как в СК, так и в DjVu Small можно задавать параметр Background quality.
Каким образом модуль кодирования в DEE будет обрабатывать по-разному, получив одно и то же значение этого параметра?
Если же СК перерабатывает параметр Background quality, то хотелось бы в логе к step3 видеть реальные значения параметров, передаваемых в DEE, как это сделано на шаге 2, чтобы иметь возможность моделировать подобный вариант в DjVu Small.

Автор: TelecomUral, Отправлено:18:00 14-11-2018

shch_vg
DEE не входит в состав djvulibre. Видимо, использована утилита http://djvu.sourceforge.net/doc/man/c44.html

Автор: bolega, Отправлено:18:17 14-11-2018

shch_vg

Цитата:
Есть СК и есть DjVu Small, которые для кодирования используют один и тот же модуль DEE, обращаясь к нему через параметры DEE.

Ни СК, ни DjVu Small не используют DEE для кодирования зон. DEE используется только для ч/б текста, либо для случая, когда пользователь отказался от метода МПФ.
Зоны кодируются с помощью djvulibre в обеих утилитах.
Если я ошибаюсь в принцире работы DjVu Small, поправьте меня!

Автор: shch_vg, Отправлено:20:33 14-11-2018

bolega

Цитата:
Ни СК, ни DjVu Small не используют DEE для кодирования зон.


Цитата:
Зоны кодируются с помощью djvulibre в обеих утилитах.

Вроде бы DjVu Small зоны не кодирует (мне так кажется ), туда нужно подсовывать слитые файлы, так же, как и в DEE. Вот какие модули есть в директории DjVu Small.
djvudecode.exe
documenttodjvum.exe = documenttodjvu.exe из DEE
phototodjvu.exe
Поскольку в СК используется djvulibre, то вопрос о тождественности результатов при задании одинаковых параметров отпадает.
Остался один вопрос: почему на шаге 2 используется DJVU Image version 25, а на шаге 3 version 24?

Автор: bolega, Отправлено:21:09 14-11-2018

shch_vg
Вот здесь http://djvu-soft.narod.ru/scan/djvu_small.htm написано, что если включить опцию Sep (т.е. использовать МПФ), то DjVu Small будет вызывать DjVu Imager, который в свою очередь вызывает djvulibre для кодирования зон (например, в форме sep-файлов после СК).
Если МПФ не использовать, то тогда djvulibre действительно не нужен, но и кодирование иллюстраций будет не самым оптимальным.

Добавлено:

Цитата:
почему на шаге 2 используется DJVU Image version 25, а на шаге 3 version 24?

Чего утилиты прописывают, то и получаем. На шаге 2 версию подставляет DEE, на шаге 3 - djvulibre. Влиять на это СК не может. Возможно, более новая версия djvulibre дала бы более новую версию.

Автор: daa2013, Отправлено:21:38 14-11-2018

Цитата из статьи, которую я приводил выше (там это всё ещё и объясняется)

Цитата:
The number of stored slices is the main compression parameter of the IW44 format. Within the DjVu file, the streams of slices of all channels are stored in so called cycles (group of one slice for every channel). Doing so, the format also allows for a delay of both chroma channels with respect to the luminance channel. This delay is a second parameter which can be employed for compression purposes.

То есть реальных параметров два: слайсы и задержка. Остальное - антураж.
-- slices <1...200> (чем больше, тем лучше)
-- crcbdelay<1...32> (чем меньше, тем лучше)
Описание эксперимента.
Прогоняем все возможные сочетания параметров для той и другой утилиты photodjvu и c44 и сравниваем файлы. Побайтно (утилита dfcfr - пакетные сравнения батчем) и попиксельно (программа Beyond Compare - попарные сравнения ручками).
Гипотеза №1. bg-quality - это НЕ синтетическая опция. Она варьирует только число слайсов (по разному перераспределяя их на 4 группы), но не задержку. Задержка выставляется там дефолтной.
Гипотеза №2. photodjvu из DEE и с44 кодируют одинаково.
Неявно также предполагается, что documenttodjvu и photodjvu работают одинаково. Но если что, то можно эксперименты и с documenttodjvu повторить.
Ещё пара цитат из справок. (1= Якобы у DEE дефолт для задержки =16, а у с44 =10. 2. Как распределены слайсы между чанками неважно, важно только общее число):

Цитата:
DEE
Delay – --crcbdelay=<1-32> Sets the chrominance delay factor to influence blurring and file size. .. A value of 1 produces the best quality and the largest file size. The default for this option is 16.
Slices - The slices option defines the number of slices for each data chunk. Meaningful values are between 70 and 140. Each chunk is exponentially larger than the last.
с44
delay - modify the quality of the chrominance information. The option arguments specifies a parameter n, expressed in slices, that reduces the bit-rate associated with the chrominance. The default chrominance encoding delay is 10 slices.
slices - DjVuPhoto files are logically composed of a sequence of "slices" containing successive image refinements. Slices are grouped in "chunks" defining the progressive rendering sequence. The viewer is able to display an intermediate image after processing each chunk. A typical DjVuPhoto files contains 80 to 120 slices grouped into 1 to 4 chunks. The final quality is determined by the total number of slices, ...
Выводы:
1. Побитовые сравнения файлов кучами показывают: Справка DEE врёт - дефолтное значение delay=10. (Если не указать, то совпадёт с 10, а не с 16).
2. c44 и фотоджву при кодировании всех слайсов в один чанк дают одинаковые по размеру (в байтах) файлы. Однако побитово они не совпадают. Задержка и там, и там была выставлена по дефолту. Значит побитово сравнивать DEE/c44 бессмысленно.
3. Если экспортировать из них bmp-файлы, то cравнение программой Beyond Comparer показывает идентичность картинок для файлов с одинаковым числом слайсов. Я посмотрел 3-4 , но конечно не все.
4. При варьировании bg-quality, по всей видимости, какое-то время идёт перераспределение слайсов между чанками, потом прибавление слайса, потом снова перераспределение (правда, не на всём диапазоне 1-100 так. Иногда прибавление за прибавлением, особенно на высоких значениях.). Из-за того что структура чанков разная, то побайтово не совпадают. Тем не менее видно ступенчатое прибавление размеров (происходит когда +1 слайс). Попиксельное сравнение тоже вроде идентично.
5. Я сравнил несколько пар файлов для DEE (кволити) и с44 (слайсы) попиксельно. Они совпали. (Выбирать надо такой файл кволити который чуть-чуть больше файла от с44. Это как раз там информация о разбиении на 4 чанка вместо одного.)

Вопрос в том, сколько пар картинок нужно сравнить попиксельно, чтобы сделать вывод. С одной стороны результаты и от тестового изображения могут зависеть. С другой - были пары, где картинки для делэй 10 и делэй 16 совпадают, а вот для делэй 1 уже разница есть.
Чтобы получить 100% уверенность имеет смысл найти утилиту сравнения картинок из командной строки, и кому-то из программистов состряпать батник, делающий что-то такое:
- прогнать все комбинации слайсы - делэй в обоих программах
- экспортировать джвудекоде как тиффы или бмп-шки
- прогнать все типы качества (bg-quality) у DEE
- экспортировать джвудекоде как тиффы или бмп-шки
- попарно вообще всё сравнить.

Что это даст:
А) стопроцентное подтверждение, что bg-quality НЕ синтетический параметр, а чисто слайсовый. (Я лично на основе сравнения 3 картинок для себя так решил, но убеждать никого в этом не буду).
Б) приблизительную оценку вклада компонента задержка цветности в размерность файлов.
В) подтверждение идентичности кодирования картинок DEE и c44 (опять таки мне кажется, что это именно так), но если вдруг не так, то можно тогда будет составить таблицу соответствий/несоответствий параметров. (Напоминаю, что поскольку я делаю попиксельные сравнения результатов кодирования c44 со слайсами и DEE с их дурацким качеством, и всё совпадает, то хотя бы отдельные зоны соответствия точно есть.)

UPDATE
Да, вот еще что надо проверить: есть ли для задержки значение 0..

В справке DEE написано что диапазон задержки 1-32. Но в с44 имеется и упоминание

Select the highest possible quality for encoding the chrominance information. This is equivalent to specifying -crcbnormal and -crcbdelay 0

является ли это значение рабочим или он только режим normal обнуляет.

Автор: shch_vg, Отправлено:23:20 14-11-2018

bolega

Цитата:
Вот здесь http://djvu-soft.narod.ru/scan/djvu_small.htm написано, что если включить опцию Sep (т.е. использовать МПФ), то DjVu Small будет вызывать DjVu Imager, который в свою очередь вызывает djvulibre для кодирования зон (например, в форме sep-файлов после СК).

За много лет в такие дебри DjVu Small я не лез, обходился вариантом по умолчанию, тем более его для качества обрабатываемых мной сканов вполне хватало. Сейчас почитал по приведенной Вами ссылке, и там нигде не говорится, что "DjVu Small будет вызывать DjVu Imager, который в свою очередь вызывает djvulibre для кодирования зон". Там сказано, что DjVu Small можно использовать в связке с DjVu Imager в Методе разделённых сканов.
А все, что делает DjVu Small объяснено в этом абзаце:
-------------------------------------------------------------
Качество кодирования Document Express Enterprise 5.1 (опционально LE) и DjVu Small эквивалентно (поскольку обе эти программы являются лишь визуальной надстройкой над консольными утилитами documenttodjvu и djvudecode, выполняющими основную работу.
-------------------------------------------------------------
Возможно, что использование DjVu Small в связке с DjVu Imager в Методе разделённых сканов дает лучший результат, чем просто компиляция в DjVu Small, но это, как говорит известный персонаж по телевизору "совсем другая история".
Похоже, что Ваш метод компиляции в СК гораздо ближе к Методу разделённых сканов, чем просто к компиляции в DEE/DjVu Small.

Автор: bolega, Отправлено:08:44 15-11-2018

shch_vg

Цитата:
Похоже, что Ваш метод компиляции в СК гораздо ближе к Методу разделённых сканов

Что значит ближе? Он либо есть, либо его нет
Если страницу с зонами привязать (attach) к step3 - получится разделенный метод, если к step2 - без оного (тогда все кодирование будет исключительно в DEE). Attach auto привяжет по умолчанию к step3, но никто не мешает отказаться от такой привязки.

Автор: daa2013, Отправлено:17:10 15-11-2018

Наблюдаю следующее, и никак не пойму, баг это или фича.

Делаю magic-выделение в главном окне. Ctrl+Shift+ЛКМ.
Если на маусапе задан какой-то из типов зон (т.е. не стоп и не clear), всегда будет выставляться exclude-зона, которую ещё надо будет переназначить в нужный тип зоны.
Это видно по контуру и по тому, где стоит точка, в change zone kind.

Мне то ожидалось, что будет выбранный тип зоны.

Update
Я понял природу этого:

"Если в режиме mouse-up-zone расставлять зоны, то в случае нажатого Shift тип зоны будет всегда exclude независимо от текущего значения переключателя Mouse-up-mode."

Но тут ведь ctrl+shift для меджика.

Автор: daa2013, Отправлено:20:36 15-11-2018

Выделил по Ctrl+Shift+ЛКМ участок (он встал как exclude zone) и в первый для себя раз в СК начинаю команды convert to circle и convert to poligon применять.

convert to enclosing circle - выдаёт ошибку с плавающей точкой
convert to convex poligon - непредсказуемые (постоянно варьирующиеся) результаты.


Это известная штука, или надо документировать, ролики записывать, скриншоты делать, таски выкладывать ????

Объект - аналог лепестка на диаграмме Венна.

Добавлено:
Причем у меня такое ощущение, что результат и к типу зоны чувствителен. Для exclude я такого не видел:



Я понимаю, что задача тут нерешаема, и алгоритм с ума сходит. Но я не специально. Я вообще впервые на первом попавшемся тестовом скане, даже не присматриваясь к рисунку, в эту опцию ткнул.


PS
Ведь раз такое дело, и вершины полигона за скан уползают, то можно же на другие алгоритмы переключиться.

Добавлено:
PPPS
Мне тогда нужно объяснение где работает - где не работает и пример картинки, где гарантированно работает, чтобы я мог в Хрестоматию запихнуть.

Автор: TelecomUral, Отправлено:02:43 16-11-2018

daa2013
Выделение у меня стабильно работало на одноцветных жирненьких линиях типа подчёркиваний под абзацем, или под картинкой. Перевод в окружность вообще ни разу не сбоил. А в полигон - да, бывало примерно аналогично. Но мне показалось тогда, что алгоритм сходит с ума после многочисленных экспериментов с такими командами. Или когда узлов очень много, больше 15-20. Разово всё работает исправно.
Но всё это откладывает выход релиза А я постеризацию хочу, и пару исправленных багов.

Автор: daa2013, Отправлено:03:02 16-11-2018


Цитата:
Причем у меня такое ощущение, что результат и к типу зоны чувствителен.

Я даже догадался, как такое может быть. У пунктирчиков в контурах зон разная длина штриха, и при их построении алгоритм может по сетке с разным шагом смещаться.

Автор: daa2013, Отправлено:06:25 16-11-2018


Цитата:
после многочисленных экспериментов с такими командами


удалил все sav файлы (ini я тоже пересоздал), перезапустил кромсатор.
Выделил magic-wand большой лепесток, поставил exclude зону, перешел на следующую страницу и вернулся обратно (стрелочками в командной панели)

Появилось второе паразитное выделение (или первое трансформировалось). Откуда оно вообще берётся ? То есть СК даже не в угол скана, а в угол окна вершину загоняет:

Если же это какие-то где-то неизвестно где запомнившиеся настройки лезут, то как их обнулить ?





Автор: bolega, Отправлено:08:09 16-11-2018

daa2013

Цитата:
Я понимаю, что задача тут нерешаема, и алгоритм с ума сходит

Про это мне уже AAW писал. Все тут решаемо. Просто баг!
Вот из нового whatsnew:
- MW: исправлен баг: при создании зон из magic selection при превышении фактического количество вершин допустимого предела (по умолчанию 300), СК, как и было заявлено, оптимизировал форму зоны, однако неиспользуемые вершины не отбрасывались, а заполнялись мусором и делали зону практически неработоспособной.

Автор: daa2013, Отправлено:09:49 16-11-2018

1.
Я тут просто на очередные три часа отрубился и не дописал.

Делал-то я это magic выделение вот для чего: я хотел проверить, работает ли копипаста Ctrl+Insert / Shift+Insert не для обычных зон, а для зон с magic-выделением.

К огромному для себя удивлению, обнаружил что эти хоткеи вообще для зон не работают - они только для обычного выделения с черным пунктирчиком, которое еще не зона. Для зон всё через меню. Наверное, это правильно. Даёт больше гибкости - выделения - свой клипбоард, зоны - свой.

Но вот копипаста Ctrl+Insert / Shift+Insert для magic-выделений (ещё не зон) у меня работать отказалась, и вот это ИМХО уже неправильно. Нет, ну можно конечно зону назначить и уже зоной копировать ...


2.

Добавлено:
Пробелом маркируются только пикчур-зоны и деблур-зоны.

Автор: daa2013, Отправлено:13:45 16-11-2018

Я снова не помню, писал я об этом или нет. Насколько я помню, я только про отсутствие обратной синхронизации между Selection style и кнопкой "режим полигонального выделения" писал.

Я через меню Image - Selection style в главном окне выбрал другой тип выделения. Всё ОК, рисует так, как заказано в меню. Но кнопка на панели команд Selection style при этом не изменилась. Т.е. меню с ней не синхронизировано.

Также смущает, что в меню тип Circle, а на кнопке Ellipse.

С кнопкой "режим полигонального выделения" у меню, кстати, также нет синхронизации.
Хотя у этой кнопки с меню - есть.

После нажатия-отжатия кнопки "режим полигонального выделения" кнопка Selection style сбрасывается в пложение Rectangle. Казался бы более логичным возврат к тому значению, которое было до спецкнопки полигона.

Автор: bolega, Отправлено:14:32 16-11-2018

daa2013

Цитата:
Но вот копипаста Ctrl+Insert / Shift+Insert для magic-выделений (ещё не зон) у меня работать отказалась, и вот это ИМХО уже неправильно

исправил. Кстати, в окне VR если при Shift+Insert еще жать Ctrl, то выделение из кармана добавится к уже существующему выделению, иначе оно заменит его.


Цитата:
Также смущает, что в меню тип Circle, а на кнопке Ellipse

заменил везде на ellipse. Кстати, чтобы форма выделения была Circle, нужно в процессе выделения держать нажатым Alt.

остальное уже было исправлено ранее.


Цитата:
Пробелом маркируются только пикчур-зоны и деблур-зоны

маркируется, т.к. только они содержат опции, которые можно копировать на аналогичные зоны. Все остальные типы зон не обладают никакими опциями, и маркировать их нет нужды.


Цитата:
Казался бы более логичным возврат к тому значению, которое было до спецкнопки полигона.

У меня другое мнение.

спасибо!

Автор: daa2013, Отправлено:14:43 16-11-2018

1.

Цитата:
Все остальные типы зон не обладают никакими опциями, и маркировать их нет нужды.


А как же команды Copy marked и Add marked в меню Zones - Copy zones to clipboard ?

Можно было бы маркировать только нужные зоны разных типов и утащить с собой на другую страницу. А так их только по одной в карман класть придётся и можно запутаться, что есть, чего нет. А так было бы сразу видно: кого маркировали, тех в поход по страницам и берём.


Цитата:
Все остальные типы зон не обладают никакими опциями, и маркировать их нет нужды.

А как же контраст-зоны ?

Автор: daa2013, Отправлено:16:48 16-11-2018

2.
Создал с зажатым Shift сложноконфигурированное выделение из прямоугольников, а назначить ему никакой тип зоны не могу. Только очистить.


3.

Поскольку magic-выделения создаются с зажатым Ctrl+shift , их невозможно объединить по шифту. Может быть для этого можно еще какой-то модификатор приспособить ?
(Да, я в курсе, что заложено поведение: "для magic предыдущее выделение работает как ограничитель". Вопрос в том, можно ли дать возможность по какой-нибудь кнопке их складывать ?)

4.

Цитата:
Кстати, чтобы форма выделения была Circle, нужно в процессе выделения держать нажатым Alt.

Когда я маленькую круглую зону растягиваю в большую, то почему-то не происходит добавления новых вершин и она становится несколько звездообразной.

5.
А если она у меня в процессе стягивания/растягивания схлопывается в прямую линию, то обратно в круг уже не восстанавливается .



6.
Я выставил непрямоугольную зону и хочу сделать её активной (чтобы появились грипы на обрамляющем прямоугольнике).
Я могу сделать это при типах выделения (на кнопке, а не то, какой тип зоны) rect и circle и почему то не могу при lasso и polygon

Автор: bolega, Отправлено:18:37 16-11-2018

daa2013

Цитата:
Создал с зажатым Shift сложноконфигурированное выделение из прямоугольников, а назначить ему никакой тип зоны не могу. Только очистить.

об этом уже говорилось. давно исправил.


Цитата:
Поскольку magic-выделения создаются с зажатым Ctrl+shift , их невозможно объединить по шифту. Может быть для этого можно еще какой-то модификатор приспособить ?

Да, в окне VR это можно сделать, а в главном нельзя. Это действительно надо? Учтите, СК принимает только односвязные зоны, это ограничение незыблемо. Если попытаться сделать зону из нескольких несвязных выделений, СК возьмет только одну из них, остальные выделения проигнорирует.


Цитата:
Когда я маленькую круглую зону растягиваю в большую, то почему-то не происходит добавления новых вершин и она становится несколько звездообразной

Когда зона создана, она больше не круг и не эллипс, а просто набор вершин (т.е. всегда многоугольник), аппроксимирующих первоначальное выделение. В СК нет понятия "круглой" зоны, есть только круглое выделение, которое векторизовалось в зону. Это надо понимать.
Вершины можно удалять/добавлять/растягивать по одной, но надо включить режим edit vertexes.


Цитата:
Я выставил непрямоугольную зону и хочу сделать её активной (чтобы появились грипы на обрамляющем прямоугольнике). Я могу сделать это при типах выделения (на кнопке, а не то, какой тип зоны) rect и circle и почему то не могу при lasso и polygon

AAW сразу догадался, почему это в принципе невозможно.
Предлагаю вам это как упражнение






Добавлено:

Цитата:
А как же контраст-зоны ?

Они не имеют своих индивидуальных опций, так же как и bw-зоны. Их опции являются де-факто page-опциями. Т.е. они задаются для страницы и поэтому едины для всех зон на этой странице. А признак маркировки конкретной зоны нужно где-то хранить, а негде

Автор: daa2013, Отправлено:18:57 16-11-2018


Цитата:
об этом уже говорилось. давно исправил.


может, вы проект whats new выложите, а то я реально ни черта не помню.




Цитата:
Это действительно надо? Учтите, СК принимает только односвязные зоны, это ограничение незыблемо. Если попытаться сделать зону из нескольких несвязных выделений, СК возьмет только одну из них, остальные выделения проигнорирует.


Теоретически, это даст возможность то, что недобралось меджиком, плюсануть в него полигоном.
Или, как привычно для RV, там где градиенты идут, чтобы допуск в настройках не крутить, последовательно добавлять переливы в область выделения.
Или я вот тут попытался из разноцветных сегментов единый круг собрать - фиг.



Цитата:
AAW сразу догадался, почему это в принципе невозможно.


Ну вот перещелкнул я кнопу в прямоугольник - зона стала откликаться. Перещелкнул в лассо - перестала. Не понимаю, как связана реакция зоны с состоянием кнопки Select style.
Выставление любого выделения начинается с одинакового клика где бы то ни было. Я понимаю, если бы там ещё клики какие-то особые были ...

Update. Понял, видимо, дело в том, что полигоны я часто не отрывая мышки делаю. А так там клики разные.
Нет ну а лассо ? Там же клик безотрывный, как у rect ellips



Автор: TelecomUral, Отправлено:19:05 16-11-2018


Цитата:
Теоретически, это даст возможность то, что недобралось меджиком, плюсануть в него полигоном.

у меня опыт крошечный, в общем-то. Но то, что я делал, не требовало таких изысков. Это какая-то суперювелирная работа над пикселями получается. Где такое нужно?
Уточнить захват всегда можно либо edit vertexes, либо второй зоной поверх первой.

Добавлено:

Цитата:
Нет ну а лассо ?

Посмотрите на его вершины. Насколько я понимаю, при лассо они автогенерятся. Потому что чем быстрее мышь едет, тем реже вершины. То есть щелчки делаются за пользователя.
Вы не можете для полигона и лассо программно различить щелчок выделения зоны от щелчка постановки первой вершины. Поэтому зону выделяет двойной щелчок.
Меня программисты на работе за двенадцать лет надрессировали на такие вопросы Юзеру кажется фигня, два слова, а чтоб запрограммировать - умрёшь над деталями алгоритма.

Автор: daa2013, Отправлено:19:19 16-11-2018


Цитата:
Вершины можно удалять/добавлять/растягивать по одной, но надо включить режим edit vertexes.

Это всё понятно, я просто думал, что если зона "помнит", что она круглая/эллиптическая, то она при масштабировании может сама в себя вершин добавить, чтобы гладкость сохранить.
Я тут например пробовал эллипсы вращать ... Если их потом начать двигать и под реальный размер подстраивать, они портятся.


Добавлено:

Цитата:
чем быстрее мышь едет, тем реже вершины

Интересное наблюдение, не замечал. Впрочем, я лассо не пользуюсь. Движение при полигоне с зажатой ЛКМ тоже самое делает, так что я даже не понимаю смысл лассо.
Нет ну все равно, ИМХО, чтобы он начал щелчки отсчитывать первоначальное движение должно при зажатой кнопке состояться. Но спорить не буду.


Цитата:
Поэтому зону выделяет двойной щелчок.

так бы сразу и написали.

Автор: daa2013, Отправлено:23:14 16-11-2018

1.


Цитата:
Поэтому зону выделяет двойной щелчок.


При лассо на кнопке зоны вообще не реагируют.

На двойной клик, когда хочешь сделать зону активной.
Ни на одинарный, ни на двойной, когда наоборот, хочешь это выделение снять.



2.

После вращения [сконвертированной в полигон] прямоугольной зоны для неё не получается запустить команду Edit vertexes
проблема не воспроизводится, ловлю при какой именно последовательности действий было

Автор: bolega, Отправлено:11:25 17-11-2018

daa2013

Цитата:
Не понимаю, как связана реакция зоны с состоянием кнопки Select style.

Знаете, почему при обычном прямоугольном выделении СК может выделять и зоны? Вы заметили, что выделение происходит не в момент нажатия, а в момент отпускания кнопки мыши? В этом вся фишка: если в момент отпускания есть выделение, значит юзер рисовал зону, если выделения никакого нет - ищем зону. Т.е. несмотря на то, что редактор переведен в режиме рисования выделения, есть момент, когда можно отличить одно от другого. При lasso и polygon выделения как такового вообще не происходит, любой щелчок мышки участвует в построении вершин новой зоны, поэтому отличить его от выделения зоны невозможно в принципе.


Цитата:
я просто думал, что если зона "помнит", что она круглая/эллиптическая, то она при масштабировании может сама в себя вершин добавить, чтобы гладкость сохранить.

Вы натолкнули меня на мысль, как можно заставить зону "вспомнить про свое прошлое". Как-нибудь попробую сделать.


Цитата:
Поскольку magic-выделения создаются с зажатым Ctrl+shift , их невозможно объединить по шифту. Может быть для этого можно еще какой-то модификатор приспособить ?

Я подумал, что таким модификатором может быть только какая-нибудь кнопка-переключатель на панели инструментов. А почему нет? Клавиши и так перегружены. В будущем подумаю над этим.

Автор: daa2013, Отправлено:22:31 17-11-2018

bolega
Пытаюсь проверить два ваших указания:

а. "Если же все таки делать чистку, то dither зоны можно окружить exclude зоной. "

b. "Новая особенность: если внутри dither-Зоны имеется exclude-зона, то она защищает внутр. участок от самого ditheringa."

и не вижу.
Вообще не вижу влияния деспекла на дизер-зону.
Не вижу также влияния exclude на дизер-зону.

Автор: daa2013, Отправлено:08:25 18-11-2018

bolega

Вы мне как-то объясняли, как работает хоткей "Заменить зону (без выбора файла)" (и заодно писали, что в новой версии он переименован).

Если у меня внешняя зона в clipboarde, то он всё равно лепит последнюю импортированную. А если предварительно сохраненное оут-задание по новой открыто (и поэтому последнего импортированного нет), то он снова карман игнорирует и пытается файл открыть. Т.е. у меня получается так, что для того, чтобы пошла замена в 6.00.5 ext-зону можно только импортировать из "идеального файла", но не скопировать "идеальный вариант".
Правильно ли я понимаю и делаю ?

Замеченные по ходу странности в работе:

1. При замене зоны этот хоткей картинку поставил новую, а опции (в частности, опции раскраски) взял со старой (заменяемой) зоны. Как-то неожиданно. А при последующей вставке стал уже с этими почему-то запомнившимися опциями раскраски лепить. Баг или фича ?

2. Если зона любого типа есть и выделена, то он реагирует и делает пасте. Если совсем ничего не выделено, то он не делает ничего (а я ожидал пасте). Парный хоткей ("заменить зону с выбором") ведёт себя несколько по другому. Если ничего не выделено или выделена некая зона, то он открывает окно выбора.
Т.е. ожидаемое поведение от хоткея при отсутствии выделенной ext-зоны: либо никогда ничего не делать, либо всегда делать пасте.

Автор: daa2013, Отправлено:16:21 18-11-2018

Хоткей Copy zone to clipboard отказывается копировать external-zone

хотя команда контекстного меню "Copy to clipboard" это делает

Т.е. получается, что хоткеев на копипасту внешних зон - нет.


В тоже время хоткей Paste zones внешнюю зону выставляет.

Автор: shch_vg, Отправлено:20:18 18-11-2018

bolega
При создании out-task ниже фотографии появляется грязь, которой нет в выходном файле исходного задания. Если сделать дежавю методом разделенных сканов, то на выходе грязь будет как ниже, так и выше фото. Если же предварительно в исходном задании слить фото с текстом, то дежавю получается без грязи.
Вот пример.

Автор: bolega, Отправлено:21:03 18-11-2018

shch_vg
VR: КМ > Show > Hide zones

Добавлено:

Цитата:
Если же предварительно в исходном задании слить фото с текстом, то дежавю получается без грязи

Почитайте на досуге про устройство слоев djvu и тогда поймете почему так происходит.

Автор: daa2013, Отправлено:21:39 18-11-2018

В джву картинка лежит снизу, битовая маска сверху.
Эта грязь есть и в исходном задании, просто вам её под картинкой не видно.
Попробуйте в СК показ пикчур-зон выключить (хоткей Toggle zones visibility надо задействовать).
Или, если неохота, отдельно ч/б страницы каким-нибудь XnView почистить.

Добавлено:
Нашел в меню команду Auto exclude bitonalized

наверное, она мой вопрос про дизеринг решает. буду пробовать.


Автор: shch_vg, Отправлено:23:27 18-11-2018

То, что на текстовой части скана в этих местах есть грязь, я знаю и без скрытия зон. Мой вопрос был другой: почему после выполнения out-task грязь под фото появляется, хотя тот же скан (выходной для исходного задания) не показывает эту грязь?
Получается, что при out-task фото изменяет свои координаты на основном скане.
А теперь еще один вопрос возникает.При ручной очистке выходного скана эта грязь нигде не появляется.
Выходит, что очистку скана нужно производить, предварительно спрятав зоны?

Автор: daa2013, Отправлено:06:07 19-11-2018

1.
shch_vg

Цитата:
почему после выполнения out-task грязь под фото появляется, хотя тот же скан (выходной для исходного задания) не показывает эту грязь?

показывает, просто вам её не видно. Её закрывают белые поля в зоне с фотографией, которая находится сверху

Цитата:
Получается, что при out-task фото изменяет свои координаты на основном скане.

не координаты, а расположение. в СК фото сверху, текст снизу.
В джву - фото снизу, текст сверху.

Цитата:
Выходит, что очистку скана нужно производить, предварительно спрятав зоны?

именно


2.
bolega
Еще вопрос по поводу вставки/замены внешних зон.
Я втыкал известные вам пнг-файлы без разрешения. Они так и воткнулись с якобы разрешением 1 *1. Я сначала подумал, что это правильно, какой файл есть, такой и внутри задания. А вот сейчас подумал, что это может и проблемы при создании пдф/джву создать и наверное это надо как-то контролировать. (Тем более, что они еще и за пределы картинки торчали.))
Стал проверять. С джву всё нормально. А вот с пдф странно. (Переобработку и второй оут, т.е. оут-оут, делал). У меня файл с отсутствующим дпи внутрь пдф не попадает (выступает, не выступает за край). И даже никакого предупреждения нет. Если же дпи есть, то даже если файл торчит за пределы, то всё ОК.

Если не делать второй оут-оут , то при попытке создания пдф вылетает ошибка. Нельзя ли как-то в ней уточнить, что требуется именно обработка (дообработка задания), так как есть лишние внешние зоны без файлов в выходной папке.




Добавлено:
3.

Обнаружил, что галочку Auto exclude bitonalized в меню
отжать нельзя. Она всегда включена.

Автор: bolega, Отправлено:09:50 19-11-2018

daa2013

Цитата:
Если не делать второй оут-оут , то при попытке создания пдф вылетает ошибка. Нельзя ли как-то в ней уточнить, что требуется именно обработка

Это был баг. Уже исправил давно. Такая же ошибка вылезет если поставить обычную pic-зону и без обработки запустить задание на pdf. На самом деле СК не требует, чтобы при создании pdf зоны были обработаны. В таком случае он недостающее обработает на лету. Так и было в старых версиях, но кажется, начиная с 6-й появился этот баг. Так что на это внимания не обращайте.
А вот проблему создания Pdf с зоной без dpi воспроизвести не смог. У меня по крайней мере ничего не пропало.

Автор: DmitryKz, Отправлено:09:55 19-11-2018

Ув. bolega, не знаю, заметили ли вы мое сообщение в конце прошлой части, поэтому на всякий случай продублирую его в новой —

Не знаю, писалось ли уже об этом, но обнаружил такое глюк: в VR в режиме просмотра 2-х страниц рядом, на второй (правой) странице исчезает (не перерисовывается) ранее созданный aux rectangle, стоит только подвигать рамку полезной области страницы (синюю пунктирную).
Именно на правой — на левой все ок.

Автор: daa2013, Отправлено:10:17 19-11-2018


Цитата:
А вот проблему создания Pdf с зоной без dpi воспроизвести не смог. У меня по крайней мере ничего не пропало.


Вы, наверное, в своей бете проверяете ? А я то в 6.00.5 сижу.

Если надо, то я могу или ролик записать или проект с приложением текстового описания последовательности своих действий выложить.

Всё, закончил Хрестоматию 2.1. Больше не буду к вам с вопросами/багами приставать.

Автор: bolega, Отправлено:10:46 19-11-2018

DmitryKz
Баг исправил. Спасибо!

Добавлено:
daa2013

Цитата:
Обнаружил, что галочку Auto exclude bitonalized в меню отжать нельзя. Она всегда включена.

Да, помню, это чтобы показать, что dither-зоны всегда защищены от despeckle. Иное просто не имеет смысла.

Цитата:
Новая особенность: если внутри dither-Зоны имеется exclude-зона, то она защищает внутр. участок от самого ditheringa."

Посмотрел код. Не защищает. Не помню, почему отказался от этого, либо имел ввиду другое. Сейчас (и видимо, очень давно) exclude-зона внутри dither-зоны защищает ее от коррекции иллюминации, даже если опция corr.illum apply to exclude zones включена. Возможно так было всегда, а моя фраза про защиту от "самого ditheringa" была ошибочна.

Добавлено:

Цитата:
Если надо, то я могу или ролик записать или проект с приложением текстового описания последовательности своих действий выложить.

Не надо, я знаю почему у меня баг не воспроизвелся. Потому что там был еще один баг, который у меня уже исправлен. Баг проявлялся, если вставленная внешняя зона имела формат, отличный от tif. Т.е. dpi вообще ни при чем, да и формату Pdf значение dpi нафиг не нужно.

Автор: D1D1D1D, Отправлено:01:44 20-11-2018

Привет! Возможна ли настройка, при которой будет происходить лишь обрезка страниц, но не изменение цвета, контраста, фона и т.д.? Снимал галочки в "Grey enhance", во вкладках "Quality" и других — без результата.

Автор: TelecomUral, Отправлено:04:23 20-11-2018


Цитата:
будет происходить лишь обрезка страниц

выставьте на закладке Files формат Original вместо TIFF G4.

Автор: bolega, Отправлено:08:53 20-11-2018

D1D1D1D

Цитата:
Возможна ли настройка, при которой будет происходить лишь обрезка страниц, но не изменение цвета, контраста

Конечно.
1. На закладке Quality снимите галку на enhance с нажатым Ctrl. Это снимет все опции со всех файлов.
2. На закладке Page снимите галку на Deskew с нажатым Ctrl.
3. На закладке Files задайте: DPI=original, Color=original
4. На закладке Book задайте: page width=page height = none


Автор: Olexiy71, Отправлено:20:34 21-11-2018

Недавно скачал 6-ю версию кромсатора
приятно удивлен что он жив и развивается
пользуюсь им уже много лет
очень доволен.
скажите пожалуйста как обрабатывать сразу с финализацией и чтобы не запрашивало калькуляцию книги, как это раньше было.
а то приходится в ручную финализировать.

Автор: TelecomUral, Отправлено:21:10 21-11-2018

bolega
В визарде слева снизу есть легенда. Что там означают циферки? Я столкнулся с ситуацией, когда аттач ещё не выполнен, страниц всего две, а легенда пишет "одна страница - чб, одна - чб с pic-зонами". Тогда совершенно неясно, что такое в легенде "not used page"

Автор: bolega, Отправлено:10:26 22-11-2018

Olexiy71

Цитата:
а то приходится в ручную финализировать.

А что, вызвать один раз команду меню это так сложно?

TelecomUral

Цитата:
что такое в легенде "not used page"

если в списке файлов MW есть немаркированные

Автор: TelecomUral, Отправлено:12:35 22-11-2018


Цитата:
приходится в ручную финализировать

после окончания обработки всех страниц вернитесь в основное окно программы. можно в меню Process\Finalize финализировать сразу все страницы.

Автор: Olexiy71, Отправлено:22:17 22-11-2018

Просто раньше я об этом даже не беспокоился
сразу выдавало в окне просмотра готовый файл.
Я-то конечно привыкну, но мне хотелось бы чтобы я не заморачивался кликая что-то дополнительно.

И еще вопрос: а можно ли в окне просмотра (результата) отключить эту желтую рамку. что-то не пойму. Поможет кто?

Автор: TelecomUral, Отправлено:05:29 23-11-2018

пробел переключает режимы отображения жёлтой рамки

Автор: Olexiy71, Отправлено:15:21 24-11-2018


Цитата:
пробел переключает режимы отображения жёлтой рамки

очень спасибо!
как всё просто оказывается

Автор: daa2013, Отправлено:19:07 24-11-2018

В связи с замечаниями одного мега-сканировщика занялся изучением проблем с подключением внешних утилит.
(Которые могут возникнуть у потенциальных новых юзеров в момент развёртывания СК.)
Обнаружил, что FRFGrab, про которую вы когда-то так писали:

"Это просто подправленная версия из пакета DjvuOCR, сделанная gencho по моей просьбе. Отличие от той, что входит в DjvuOCR - в том, что она более аккуратно разбирает слова, содержащие цифры. В SK эта утилита используется только для одного - для автоматической генерации линков оглавление, индекс) для pdf (команда Service->Pdf links). Со временем сделаю и для djvu. Тогда же сделаю и описание к этой команде. Путь к frfgrab указывается в Options->Apps. Если не делаете pdf, то это и не нужно вовсе." ...

соответствующей команды при создании джву так и не получила.
Да и имевшаяся в старых версиях СК "Create PDF hyperlinks" тоже куда-то задевалась.

Поэтому возникли вопросы:
- как правильно пользоваться подключенной к 6.00.5 FRFGrab ?
- куда переехала команда изготовления гиперлинков в pdf ?
- какие действия рекомендуются для djvu ?

Автор: bolega, Отправлено:20:18 24-11-2018

daa2013
Последние версии СК делают hyperlinks как для pdf, так и для djvu.
Однако это пожалуй единственная функция, которая отсутствует в публичной версии СК. И ее там никогда больше не будет.

Автор: daa2013, Отправлено:20:35 24-11-2018

Извините, не понял ответ. Вопросы только умножились.
Вот я смотрю на настройки 6.00.5. Вижу там FRFGrab. Подключаю, что дальше ?


Цитата:
Последние версии СК делают hyperlinks как для pdf, так и для djvu.

6.00.5 это делает с граб / без граб ?
по команде ? без команды ? А как в бете ?


Цитата:
ее там никогда больше не будет.

Команды не будет ? Опции подключения не будет ?
Управления гиперлинками не будет ? В пдф или в джву ?


Цитата:
отсутствует в публичной версии СК

То есть где-то она всё-таки есть ?
Если не будет, то нужно ли в каких-то случаях запускать старые версии СК ?
(Ну помните, я вас про объединение разворотов когда-то спрашивал, и обнаружилось, что в 5.96 на ура, а в 6.00.5 - фиг).

В общем, ваш ответ меня только больше запутал. (Я сейчас, устраняя замечание, подключение внешних утилит расписываю, а FRFGrab выпала).


PS
И если не будет, то как правильно делать гиперлинки ?

Вот это вот:

Цитата:
Последние версии СК делают hyperlinks как для pdf, так и для djvu.


укажите, пожалуйста, порядок действий для этого.

Раз в 6.00.5 она есть, то как ею пользоваться ?

Автор: bolega, Отправлено:11:18 25-11-2018

daa2013
Я имел ввиду, что в меню СК не будет команды создания hyperlinks. Забудьте про нее, а FRGrab пусть пока будет. Скажем так: "назначение этой утилиты в СК выяснить не удалось".

Цитата:
Вопросы только умножились.

Вот именно поэтому команды и нет. Нет функции - нет вопросов. Я не хотел и не хочу разжевывать назначение опций в команде создания hyperlinks, объяснять какие там есть ограничения, недоделки и т.п. Мне было проще убрать ее совсем. Без hyperlinks обходятся 90% книгоделов. Да что там hyperlinks, многие даже распознаванием не утруждают себя.


Цитата:
то как правильно делать гиперлинки ?

"А часовню тоже я?..."

Автор: daa2013, Отправлено:11:36 25-11-2018


Цитата:
от именно поэтому команды и нет. Нет функции - нет вопросов.


Так вы её обратно включите, а мы разберёмся (Кстати и опцию для объединения разворотов было бы неплохо реанимировать).
Вопросы- то вызвала не функция, а ваш первоначальный излишне кортковатый ответ.

Как работают джву букмарки, DjvuOCR и DjVu Hyperlinks Editor, мне вроде понятно.
А будут про эту команду спрашивать - отвечайте, что когда daa в ней разберётся, вот тогда он всем и растолкует

Автор: TelecomUral, Отправлено:11:43 25-11-2018


Цитата:
Мне было проще убрать ее совсем. Без hyperlinks обходятся 90% книгоделов. Да что там hyperlinks, многие даже распознаванием не утруждают себя.

Ээ, не скажите. Нет софта - нет и его результата. Мне ваши (в смысле из СК сделанные) гиперлинки нравятся больше, чем чьи-либо другие. Причём с большим отрывом. Эстетически правильно они выполнены.
Конечно, программист царь и бог в своей программе. Тут не поспоришь.

Автор: bolega, Отправлено:12:17 25-11-2018

daa2013

Цитата:
Так вы её обратно включите, а мы разберёмся

Это вряд ли.

Цитата:
Кстати и опцию для объединения разворотов было бы неплохо реанимировать

Это есть в планах.
TelecomUral

Цитата:
Нет софта - нет и его результата

Так софт есть и другой. Что вы на СК зациклились с этими х.линками.
У меня тем более по старинке делается - через устаревший FR8 и frgrab. Сейчас в основном текстовый слой принято внедрять с помощью нового FR, а не с помощью утилит от gencho.

Автор: TelecomUral, Отправлено:12:38 25-11-2018

bolega

Цитата:
Так софт есть и другой. Что вы на СК зациклились с этими х.линками.

Потому что нету. U235 что-то такое смог сотворить под линуксом, какие-то скрипты с RegEx, а больше столь автоматизированной программы с красивым результатом - я не знаю. Может, плохо искал. Когда делал ссылки в Кулинарию 1955 года - вся работа по собственно вставке гиперссылок заняла, по памяти, едва ли 5 минут, не больше 10 уж точно. А там страниц тридцать (!). Реально удобно вы сделали. Минус только в ручном прописывании всех пустых листов. Кабы его брать из задания - по-моему, задача была бы вполне закрыта. Не для индивидуальной вставки гиперссылки, а чтоб автоматом распознавать цифры и их смещение.

Автор: xMARx, Отправлено:13:57 25-11-2018

Всем привет. Несколько смущает поведение ScanKromsatora.
1. Если воспользоваться ластиком, затем поменять масштаб, а затем выбрать режим mouse-up чистки (спеклов), то меняется масштаб страницы и экран уносит вбок . Приходится возвращаться обратно и менять масштаб на нужный.
2. Также сейчас частенько сталкиваюсь с проблемой. Забыл поставить х2 разрешение у picture zone (у основного файла х2 разрешение стоит).
а) Ставлю х2 разрешение и обрабатываю только picture zone - после обработки picture zone сдвигается, приходится руками возвращать обратно. Имеется даже sub-task с такой проблемой и с готовыми out файлами.
б) Если обработать весь sub-task заново (при этом out файлы заменятся), то все приходит в норму. То есть а) уже не проявляется.
__Так и не понял, почему так вышло и откуда возникла куча страниц, у которых проявляется а).
3. В окне result view почему-то периодически перестает работать ctrl+z. Когда и при каких условиях возникает проблема пока что сказать не могу. Лечится легко-достаточно сохранить файл и открыть заново.

Автор: daa2013, Отправлено:14:45 25-11-2018


Цитата:
1. Если воспользоваться ластиком, затем поменять масштаб, а затем выбрать режим mouse-up чистки (спеклов), то меняется масштаб страницы и экран уносит вбок . Приходится возвращаться обратно и менять масштаб на нужный.



снимите галочку «Restore zoom after erazer»

Если СК 6.00.5, то она в окне VR в контекстном меню вызов Options (откроется окно Clear options), на закладке Actions.
Если более старый, то там же (окно Clear options), но на закладке Misc

Автор: xMARx, Отправлено:15:10 25-11-2018


Цитата:
снимите галочку «Restore zoom after erazer»


__Спасибо )). Даже не думал, что такая галочка существует в СК.

Автор: sergiokapone, Отправлено:23:23 26-11-2018

Подскажите, как обработать малоцвет средствами СК? Если выделить picture zone ->picture zone promerties -> color - Low colors, после обработки появляется непердсказуемый фон.
Ссылка

Автор: shch_vg, Отправлено:17:00 27-11-2018

bolega
Два непонятных момента в обработке скана в СК.
После обработки скана выясняется, что левая граница области финализации не совпадает с левой границей текстовой области из-за имеющейся слева грязи, поэтому сдвигаю левую границу вправо, делаю финализацию страницы и попадаю в VR. В одном месте текст выглядит более бледным по сравнению с остальным, поэтому возвращаюсь в главное окно, заключаю его (бледный текст) в b/w picture-зону, устанавливаю нужный порог бинаризации и обрабатываю эту зону.
1 непонятный момент. После обработки зоны попадаю в VR, причем положение текста зоны соответствует его положению на странице до перемещения левой границы области финализации, а не положению после перемещения.
Приходится вручную перетаскивать зону на ее текущее место.
2 непонятный момент. Если после такого перетаскивания воспользоваться возможностью обработки зоны прямо в VR командой Reprocess, то после обработки зоны снова она прорисовывается не на своем текущем месте, а на месте выделенного в зону текста до перемещения границы зоны финализации.

Автор: Benoni, Отправлено:18:52 27-11-2018

bolega

Цитата:
Последние версии СК делают hyperlinks как для pdf, так и для djvu.
Однако это пожалуй единственная функция, которая отсутствует в публичной версии СК. И ее там никогда больше не будет.

Жаль, что не будет. Действия, выполненные этой функцией, хотя она, как Вы говорите, и несовершенна, красят любую книгу. Ради этого надо её развивать. Аналогов я не встречал.
Прав TelecomUral: U235 что-то такое смог сотворить. И я, воспользовавшись его творением, при работе над Энциклопедией Шахматных Комбинаций только и получал лестные оценки этого чуда.

Автор: bolega, Отправлено:19:06 27-11-2018

shch_vg
Мы вроде бы уже обсуждали с вами этот момент.
Корректировка границ имеет такой же эффект, как и сдвиг страницы. В обеих случаях изменяется координата верхнего угла зоны относительно страницы. Но все это происходит на выходе, в пространстве out-файла. Обработка же зоны выполняется в пространстве исходного скана и она знать не знает, что вы делали до этого на выходе. Максимум, что может СК - запомнить перед обработкой текущее
расположение зоны. И восстановить его по команде КМ зоны Restore position. Но чтобы Restore сработал, нужно, чтобы зона была обработана ранее вместе со всей страницей.

Benoni

Цитата:
Аналогов я не встречал.


Цитата:
U235 что-то такое смог сотворить. И я, воспользовавшись его творением

Что-то логика тут хромает

Автор: Benoni, Отправлено:19:09 27-11-2018

bolega
Всё логично:
Цитата:
что-то такое
- это часть такого.

Автор: shch_vg, Отправлено:20:45 27-11-2018

bolega

Цитата:
Корректировка границ имеет такой же эффект, как и сдвиг страницы. В обеих случаях изменяется координата верхнего угла зоны относительно страницы. Но все это происходит на выходе, в пространстве out-файла.

Мне непонятно изменение координаты верхнего угла зоны относительно какой страницы? Исходного скана или выходной страницы?
В любом случае говорить о положении зоны на странице имеет смысл только после финализации страницы, а в этом случае если привязать координаты верхнего правого угла зоны к правому верхнему углу финализируемой области в момент финализации, то тогда дальнейшие обработки зон как из главного окна, так и из окна VR будут помещать их в нужное место на выходной странице.
Или я что-то не понимаю?

Автор: TelecomUral, Отправлено:21:29 27-11-2018


Цитата:
Что-то логика тут хромает

Я подробно не вникал, но читал что настройка на номера диаграмм была проведена программистом вручную. Консольные скрипты то есть. А у вас приличный GUI.

Автор: daa2013, Отправлено:21:30 27-11-2018

В окошке "Пользовательские размеры страниц" забавный баг. Если за уголок окна вниз тянуть, то таблица размеры не меняет. Вместо этого серая зона с кнопкой "OK" огромной становится.
Upd: только у первого столбика можно изменить ширину, в т.ч. двойным щелчком.

Наверное, эту табличку в окне RV при финализации в окошке "Book properties" тоже стоит вызывать ?

В главном окне открыл оут-задание и стал зоны отлавливать. Контуров-то в оут не видно! Кликал, кликал (а они, оказывается, на другой, склонированной странице были). Подумал, что было бы полезно внизу слева информацию о числе зон на странице выводить, а их контуры делать видимыми/невидимыми по специальной кнопке на панели.

Обнаружил, что я использую XnView, а камрад AAW использует Irfan для задействования инструмента "замена цвета"
IRFAN: Image - Palette - Edit palette
XnView (для открытого изображения): Изображение - Изменить карту цветов.
Любопытно, позволяет ли такую операцию делать анонсированная постеризация (окошко Image adjustments) ?

Автор: daa2013, Отправлено:05:19 28-11-2018

Вопрос: зачем прописывать внешним редакторам имена, если в контекстном меню указывается не заданное редактору в первом поле имя, а имя вызываемого файла ?



Upd:
Кстати, если ничего не прописать, то оно всё равно всё работает.

Upd2:
Лучше так: Если пользовательское имя прописано, то его. Если нет, то имя файла.

Автор: bolega, Отправлено:11:04 28-11-2018

daa2013

Цитата:
В окошке "Пользовательские размеры страниц" забавный баг

Это все уже давно я исправил.


Цитата:
Любопытно, позволяет ли такую операцию делать анонсированная постеризация (окошко Image adjustments) ?

Конечно. Можно менять на изображении один цвет на другой. Причем это можно делать только для выделенного фрагмента. Можно задать допуск на разницу цветов.
Поддерживается еще один хитрый метод замены цвета: если пиксель цвета C1 граничит с пикселем цвета С2, то его цвет меняется на цвет С3. Причем замена может быть либо только этого пикселя, либо связного участка одного цвета начиная с искомого пикселя. Такая замена для малоцветных изображений позволяет избавляться от паразитных точек (С1) вдоль какого-нибудь контура (С2), от гало и т.д. Если задать С3=С2, то точки примкнут к контуру, если задать например С3=белый, то точки зачистятся.
Кстати, настройки цветовых замен сохраняются в задании. Их можно делать сколько угодно и давать им имена.
При заменах принимаются во внимание также clipper-зоны. Это введенные в последних версиях участки на изображении (в окне VR), которые защищают его от magic-операций, либо наоборот, ограничивают эти операции своим контуром. Например, есть картинка, имеющая темный контур и фон за его пределами. Вы хотите почистить фон с помощью Ctrl-Shift-Click, щелкая на нем. Выполняется magic-заливка, но вдруг из-за маленькой "бреши" в контуре картинки magic-выделение проникает внутрь картинки и портит ее. Чтобы этого не было, в месте "бреши" рисуется небольшая clipper-зона, которая служит барьером для чистящей заливки. Бывает и наоборот: нужно ограничить чистку (заливку) какой-нибудь областью (произвольной формы). Рисуете эту область как clip-зону, щелкаете внутри нее Ctrl-Shift-Click и тогда чистка не сможет выйти за ее пределы.

Осталось еще придумать цветной despeckle (для малоцветок).

Автор: TelecomUral, Отправлено:11:38 28-11-2018


Цитата:
позволяет избавляться от паразитных точек (С1) вдоль какого-нибудь контура (С2), от гало и т.д.

О, это будет классно. Из RasterId постоянно лезет фигня с цветной окантовкой, очень трудно её победить.

Автор: daa2013, Отправлено:11:57 28-11-2018

Мне кажется, что в команде главного окна Paste zone to pages для радиоточек Custom нужно дать возможность выставлять отрицательные значения.
И если единицы измерения пиксели, то подсказку такую выдать.


Upd:
Еще мне тут понаписали замечание, что эту команду можно зачем-то для одной страницы задействовать.
(Единственное, когда это имеет смысл ИМХО - точные смещения). Но тогда в список Destination scope надо добавить Current.
Хотя, наверное, можно для этого галочку "все выбранные" задействовать, а выбрать - текущую.

Автор: daa2013, Отправлено:04:20 29-11-2018

Нахожусь в главном задании. Вызвал джву-визард, сделал автоаттач. Файлы распределились. Закрыл визард, вернулся в задание, переобработал один из цветных файлов в ч/б.
Возвращаюсь в визард. Он продолжает считать этот файл цветным. Повторный автотатач, открепление/перекрепление страницы ни на что не влияют. Он считает её цветной. Числа на легенде не меняются, раскраска файла в списке не меняется, автоаттач гонит его на шаг 1.

Что я делаю не так ?

Автор: bolega, Отправлено:10:03 29-11-2018

daa2013

Цитата:
Нахожусь в главном задании


Цитата:
Что я делаю не так ?

Ну неужели не ясно??
Визард работает с "исходными" файлами, т.е. которые в списке задания. А не с теми, которые в обработанной out-папке (out для текущего задания). Для этого и делается out-задание, чтобы обработанные стали "исходными" и с ними мог работать визард. Ну это же азы, сколько раз про это писалось.

Автор: daa2013, Отправлено:11:16 29-11-2018

Ладно, это я, действительно, упустил, что визард в оут не лезет.
Сделал теперь правильно, с оут-таском.
Но всё равно суть ситуации не поменялась !

Эксперимент №1: Открыл два СК. В первом главное задание, во втором, сделанный из него оут-таск. Эксперимент №2: Изменяю цветность странички XnView. Проверяю реакцию визарда с выходом и без выхода из оут-таска.

Открытый оут изменений не видит. После переоткрытия оут-таска - видит.
То есть, судя по всему, автоаттач считывает цветность файлов единожды в момент запуска, запоминает, и больше к этому по ходу работы не возвращается. А мог бы либо при нажатии внутри визарда кнопки Аттач авто снова все файлы пробежать (он же их повторно снова все переназначает ! не только текущий), либо контроль времени изменений осуществить, либо варнинг какой-то выдать.

Автор: bolega, Отправлено:12:53 29-11-2018

daa2013

Цитата:
Открытый оут изменений не видит

Таску все равно какая там цветность. Оно ему не надо.
А вот визард действительно проверяет формат файлов и всех зон один раз при своем запуске. Т.е. чтобы учесть изменения в формате, достаточно переоткрыть визард, а не весь таск.
Проверять изменения при каждом чихе - это расточительно. Если много файлов и зон, медленный винт, этот процесс будет не быстрым. И в большинстве случаев ненужным. Думаю, смена формата файлов при постоянно открытом визарде - такое было только у вас и у AAW, причем связано это было не с реальной необходимостью, а просто чтобы проверить СК на "прочность" Не стоит рассчитывать, что я буду в бесплатной программе много времени уделять "защите от дурака" (так это принято называть). Нужно просто запомнить, что при изменении формата обработанных файлов и зон переоткрывать визард обязательно. И не надеяться, что это сделает за вас СК.

Цитата:
либо контроль времени изменений осуществить

вот это разумно.

Автор: D1D1D1D, Отправлено:14:17 29-11-2018

Здравствуйте. С какими настройками можно обработать такой файл — https://i.imgur.com/92Pp5bl.jpg — чтобы темная часть не получалась чёрной и нечитаемой? И где можно регулировать степень чистки? У меня, по одной инструкции, только так получается — https://i.imgur.com/WcIaoFA.jpg

Автор: daa2013, Отправлено:14:21 29-11-2018

Вы красный текст в шапке читали ?

Автор: D1D1D1D, Отправлено:14:27 29-11-2018

Так ведь в моем случае неважно, как действовал я, значение имеет — как правильно сделать.

Автор: bolega, Отправлено:14:39 29-11-2018

D1D1D1D
Правильно - включить опцию correct illumination (safe).
А dpi для такого шрифта явно недостаточный

Автор: D1D1D1D, Отправлено:16:15 29-11-2018

bolega

Спасибо, получилось) Хотелось бы еще оставить жирность букв по умолчанию, так как из-за особенностей шрифта они кое-где сливаются — https://i.imgur.com/x5zsvXF.png Читал, что за ужирнение отвечают фильтры Blur, Sharpen или Smooth, но вариации с их включением/отключением эффекта не дало.
А dpi на самом деле, вроде, достаточный — это на imgur.com изображение уменьшилось. Вот, на всякий случай, оригинал — https://yadi.sk/i/dyTk8PAbcsmJ0A

Автор: D1D1D1D, Отправлено:22:20 29-11-2018

Кстати, у меня этот файл — https://yadi.sk/i/dyTk8PAbcsmJ0A — с настройкой на 600dpi не обрабатывается, вылетает с ошибкой "Out of memoty".

Автор: shch_vg, Отправлено:23:12 29-11-2018

D1D1D1D
Поменяйте в СК ему dpi на 200 (это где-то рядом с его реальным) и будет вам счастье.

Автор: D1D1D1D, Отправлено:00:02 30-11-2018

shch_vg
Увы, но пока что счастье моё — в жирности букв, а dpi-то и на 300 отрабатывает))

Автор: shch_vg, Отправлено:00:15 30-11-2018

D1D1D1D
DPI можете ставить любое, но реальное - около 200.
А что такое жирность в вашем понимании - мне непонятно.

Автор: slava_kry, Отправлено:14:43 30-11-2018

Интересно когда вопрошающему скажут, что нужно сделать предварительную обработку такого корявого материала?

D1D1D1D
Чтобы нормально у вас преобразовывалось, вам требуется подготовить подобный оригинал.
Увеличить его разрешение раза в 2-4, слегка выбелить и уже потом отдавать СК.
https://yadi.sk/i/4xwXcReE0R063Q

Автор: daa2013, Отправлено:12:53 01-12-2018

bolega

08-06-2016 вы писали:


Цитата:
После обработки нужно до финализации и расчета размеров, откропить все зоны, которые касаются краев. ... до финализации еще раз проверка: режим показа двух страниц и визуальный контроль совпадения половинок по высоте. Если не совпадают, подвигать верхний/нижний край желтого габарита до нужного совпадения. Не факт, что совпадут и низ, и вверх: часто не совпадает сам оригинал.


Разбирался тут с совершенно случайно замеченными командами в КМ зон (вы про них когда не писали, а видны они только при определенных условиях, интересно, сколько еще в СК такого ?)
- Crop align vertical
- Crop align horizontal

И крайне удивился, что для разворота они не работают. (Они в режиме "2 страницы" даже не видны). Первое, что я полез проверять: а не решают ли они частично описанную в приведенной выше цитате ситуацию. Мне интуитивно показалось, что их функцией должно было быть одно из двух:
а) ровнять зоны на одной странице по размерам зон на другой странице
б) смещать всю страницу (зону вместе с подложкой), чтобы верхние/нижние края зон оказались на одном уровне.

Что и как делают команды, я, естественно, разобрался. Но и функционал, который я для них предположил, наверное, тоже был бы где-нибудь полезен.

Автор: D1D1D1D, Отправлено:00:52 02-12-2018

shch_vg

Цитата:
А что такое жирность в вашем понимании - мне непонятно.

Имелась в виду жирность букв после обработки в SK — https://i.imgur.com/x5zsvXF.png

slava_kry

Цитата:
Увеличить его разрешение раза в 2-4, слегка выбелить и уже потом отдавать СК.
https://yadi.sk/i/4xwXcReE0R063Q

Ого, уважаемый! По-моему, то, что вы сотворили с изначальным файлом — это чудо)) Не могли бы вы пошагово раскрыть его секрет?) Был бы очень признателен. Выглядит, будто каждую буковку прорисовывали кисточкой, прям картина маслом) Это Фотошоп и какие-то его фильтры?




Добавлено:

Цитата:
Кстати, у меня этот файл — https://yadi.sk/i/dyTk8PAbcsmJ0A — с настройкой на 600dpi не обрабатывается, вылетает с ошибкой "Out of memoty".

Оказалось, что это происходит на этапе устранения перекоса скана — если стоит галка на Deskew. Без этой галки памяти хватает и обработка проходит.

Автор: daa2013, Отправлено:06:35 02-12-2018

Заметил опечатки в слове transparency в меню зон



Надеюсь, что в бете они исправлены.



Автор: daa2013, Отправлено:11:27 02-12-2018

Команда Undo после Adjust (crop) page в КМ зоны даёт странные результаты. Основная страница (если она цветная) после кропа полностью не восстанавливается. Если же основная страница ч/б, то всё ОК.




Добавлено:
Я понимаю, что это зловредное буквоедство. Но тем не менее.

Команда Select zone at original scan

Эту самую зону не выделяет, а маркирует. И по-хорошему должна называться Mark ...

Автор: daa2013, Отправлено:08:10 04-12-2018

У внешних (!) зон в диалоговом окне свойств на закладке Filters3

отсутствуют мой любимый Autolevels
и Background substract

Добавлено:
Опечатка в названии чекбокса:

Restore zoom after erazer


Ластик же вообще и в окне VR в частности - Eraser (через S)

Автор: daa2013, Отправлено:14:22 04-12-2018

Я закрыл таск. Скан не открыт, список пустой.
Внизу в поле информации остались сведения о последнем открытом файле:
разрешение, размеры и пр. Наверное, надо было их обнулить, чтобы снова ничего не показывалось, как при первоначальном запуске СК

Автор: igogo22, Отправлено:19:03 04-12-2018

Помогите разобраться с настройками.
Пример из книги http://rgho.st/7YsPlRWt2
Проблема, что сконфигурировал так чтоб большинство страниц выходило нормально, и что самое главное чертежи. Но некоторые страницы ужас.
https://imgur.com/a/g9PXYm4


Автор: TelecomUral, Отправлено:05:54 05-12-2018

igogo22
что я сделал с вашим заданием:
снять на quality галки smooth blur2 sharpen2
включить контраст с тремя галками (для автолевелс)
снять галку page-деспекл
порог бинариз. 180
поставить sharpen на закладке sharpen
поменять unsharp mask на 5-5-2
на page-special залить дырки std+2

конечно, придётся почистить мусор. иначе буквы рваные, их только ocr спасёт, если деспекл включать.

результат:


слово "дюймовых" жирнее, потому что я попробовал b/w-zone с порогом 200 влепить на это место. но мне не понравилось.

Upd
чуть переделал картинку, ваш дизеринг даёт 600кб
https://www.upload.ee/files/9267108/aaw_ruboard_out2.djvu.html

Автор: igogo22, Отправлено:22:01 06-12-2018

TelecomUral
Спасибо.

Цитата:
чуть переделал картинку, ваш дизеринг даёт 600кб

А что конкретно делали с картинкой? Интересно.

Автор: Olexiy71, Отправлено:22:49 06-12-2018

добрый день
у меня такой вопрос.
задача - сделать все сканы одинакового размера, пиксель в пиксель.
На страницах есть картинки которые занимают всё, а есть страницы просто с текстом, они меньше
СК упорно делает картинки побольше (и то не одиноково) а с текстом поменьше
помогите.

Автор: TelecomUral, Отправлено:03:56 07-12-2018

Olexiy71
снимите у страниц галку автополя automargins, и поставьте на закладке book размеры Fixed.

Автор: Olexiy71, Отправлено:21:33 07-12-2018

[q][/q]
В том-то и дело что автовыравнивание не влияет на размер страниц ,
а fixed если выставлять то надо указать размер страниц (самой большой) а как это узнать???

Автор: TelecomUral, Отправлено:04:33 08-12-2018

Olexiy71
как узнать? читать документацию на СК (в шапке). Вам следует изучить идеологию расчёта размеров. я ещё видео записывал на эту же тему, тоже в шапке есть ссылка на ютьюб.

Автор: daa2013, Отправлено:11:12 08-12-2018

Пару лет пользуюсь редактором PicPick для работы со скриншотами, а вот только сейчас заметил в нём любопытную штуку.

при квадратных грипах - осуществляется обрезка
лишний клик - и грипы становятся круглыми.
при круглых грипах - осуществляется сжатие/растяжение изображения

Может быть, это как идею в СК тоже где-то задействовать ?
Не обязательно для переключения между обрезкой и сжатием.

Но вот я, когда про выделения зоны писал, чётко себе отметил, что для каких-то действий с ними дополнительного типа выделения не хватает.

Автор: igogo22, Отправлено:16:30 10-12-2018

TelecomUral

Цитата:
Upd
чуть переделал картинку, ваш дизеринг даёт 600кб
https://www.upload.ee/files/9267108/aaw_ruboard_out2.djvu.html


А что конкретно делали с картинкой?

Автор: TelecomUral, Отправлено:18:14 10-12-2018

igogo22
дескрин text&line и инверсный дизеринг.

Автор: igogo22, Отправлено:19:08 10-12-2018

TelecomUral

Цитата:
дескрин text&line и инверсный дизеринг.


Извиняюсь. Мне это ничего не говорит к сожалению. Можете подсказать, какие пункты меню?

Автор: TelecomUral, Отправлено:20:10 10-12-2018

igogo22
вы не извиняйтесь, вы в шапку загляните и материалы про СК почитайте. они для того и писаны, чтоб время моё не тратить зря.

Автор: daa2013, Отправлено:20:55 10-12-2018

На png файле без разрешения (=1), на закладке DPI = ORIGINAL, в начале обработке варнинг: Invalid dpi , выбрано значение select value = 300

а вот далее проблема:
в Result view не выпадает список Изменить глубину цвета,
и предупреждений никаких при этом не выдаётся.

Если же на закладке поставить Input DPI = 300 , то всё норм, список есть.

Автор: shch_vg, Отправлено:14:24 11-12-2018

bolega
Включаю для обработки входного скана Correct illumination, создаю b/w picture-зону, в которой стоит галка на Protect from illum.correction, и запускаю обработку этой зоны. В процессе обработки первое сообщение, появляющееся в окне Processing... это Correct illumination.
Вопрос: отключает ли вышеуказанная галка Correct illumination или нет?

P.S. Проверил на серой зоне с фото и выяснил, что отключает.
Может быть, стоит убрать появление сообщения Correct illumination при включенной галке, т.к. это несколько сбивает с толку?

Автор: Nitrofest, Отправлено:23:21 16-12-2018

Я несколько лет не занимался сканированием книг, забросил как-то это дело. Вот сейчас возвращаюсь к делу. И возник вопрос, который долгое время раньше меня "мучал". Обычно я сканирую литературы по физ-мат тематике, с минимумом картинок. Расставить вручную десяток-другой picture зон никогда не было проблемой (обычно в книге больше не попадалось). А вот сейчас попалась книжица, где иллюстрации почти на каждой второй странице. Скажите, не появилось ли в СК функции с автоматическим выделением картинки? Или хотя бы чтобы по клику она автоматом "обводила" картинку по контуру... Можно было бы пользоваться ScanTailor, в котором эта функция кое-как реализована, но компенсировать тонкую настройку СК он, конечно, и близко не может. А вручную выделять зоны на >400-х страницах я задолбаюсь.

Автор: slava_kry, Отправлено:06:54 17-12-2018

Nitrofest
Нет, не появилось. Это принципиальный взгляд bolega.
По сути он прав, т.к. СТ картинки выделяет, но ты потом сидишь и "уточняешь" зоны картинок... дык какая разница?
Сам СК почти не пользуюсь.
Нормального сегментатора как не было, так и нет.

Автор: TelecomUral, Отправлено:07:13 17-12-2018

оффтоп

Цитата:
Нормального сегментатора как не было, так и нет

Угу. причём понасмотревшись сканов, я предполагаю, что и не будет, нормального-то. Художники как только не извращаются.
Правда, отсюда следует вывод: программировать "вспомогательные" инструменты, для типичных ситуаций. То есть оставлять на откуп обработчику, тыкать ему на конкретном скане в конкретном месте "найти картинку, она здесь такого-то типа", или нет. К примеру, типичный советский вариант НПС, НБЛ: фотки строго отделены от текста, овальные или прямоугольные. Цветной текст (слово, фразу) тоже можно задетектировать, исходя из соотношений геометрии (по аналогии с тем, как ищется блок текста на скане). А в целом - задача нерешаемая. Какая-нибудь подкладка акварельная, под синеньким шрифтом, как её опознаешь.

по сути:
Nitrofest
вы не забывайте, что есть режим mouse-up. Для однотипных картинок он идеален: растягиваете прямоугольник над картинкой, по отпусканию мышки зона создаётся автоматом. Простые книжки, без пиксельной точности выделения, зонируются за десяток минут, только успевай листать. Непрямоугольные - с помощью лассо.

Автор: Archivist, Отправлено:11:27 17-12-2018

В FineReader 12 MRC достаточно хорошо работает автосегментирование, но пожинать эти плоды сейчас похоже нечем. Хотя слои в выходном PDF лежат в открытом виде и легко извлекаются.

Автор: bolega, Отправлено:11:57 17-12-2018


Цитата:
В FineReader 12 MRC достаточно хорошо работает автосегментирование

У меня нет FR12, можно пример исходного скана с картинками, и pdf после FR? Желательно, чтобы скан был естественный (т.е. с небольшим перекосом), а в FR был бы отключен deskew

Автор: Archivist, Отправлено:13:08 17-12-2018


Цитата:
У меня нет FR12, можно пример исходного скана с картинками, и pdf после FR? Желательно, чтобы скан был естественный (т.е. с небольшим перекосом), а в FR был бы отключен deskew


https://yadi.sk/d/g-My-eH8L8gt5Q

В архиве 3 примера:
- skewed (сырой скан с перекосом). Исходник - https://yadi.sk/i/0J57dT0-A6MM5Q
- sample (сырой скан с малым перекосом)
- Compas (обработанный в ФШ журнал)

К первым двум приложил рабочие папки проектов FR. Возможно, там есть информация непосредственно о зонах картинок.




Автор: bolega, Отправлено:15:01 17-12-2018

Archivist
Спасибо!
Заметил, что в pdf dpi заднего слоя уменьшился в 2 раза относительно исходного скана. FR всегда так делает или это поддается регулировке?

Автор: Archivist, Отправлено:16:06 17-12-2018


Цитата:
FR всегда так делает или это поддается регулировке?

Похоже, что именно для MRC не предусмотрена выдача картинок исходного разрешения. Не смог этого добиться. Хотя при экспорте обычного PDF с подложенным слоем текста все получается при аналогичных настройках. Тогда остается надеяться на читаемость информации о зонах картинок

Автор: TelecomUral, Отправлено:18:36 17-12-2018

обнаружил в 6.00.5 странность: если взять BMP с BW-содержимым (ирфан кажет, что палитра - однопиксельная), то мелкие точки внутри зоны стираются деспеклом страницы. Причём не у всех зон. Зависит от места точек на скане, что ли. Потому что я пробовал зоны перетаскивать, и всё равно в уголке снизу микроточки сохраняются, а наверху справа - нет.
Если картинку перевести в цветовое пространство 24бита, то всё ОК.
задание с файлами https://yadi.sk/d/ZOsDJCNLljUjCg
В бете 6.20 то же самое.

Автор: shch_vg, Отправлено:02:11 18-12-2018

TelecomUral
Не пробовали в свойствах зоны убрать галку в Clear source area?

Автор: TelecomUral, Отправлено:04:26 18-12-2018

shch_vg
сейчас попробовал, помогло. я и говорю: странное поведение.
Это картинка с рутрекера, она через старые DEE и DSM и DjvuLibre не пролазит. Вот я и захотел превратить с помощью СК её дизеринговые чб-точки в серый цвет.

Автор: shch_vg, Отправлено:14:03 18-12-2018

TelecomUral
А что в этом странного?
Этот параметр может действовать только на черно-белый скан, а после перевода его в серый (в частности в 24бита) он перестает действовать (а м.б. действует как-то по-своему?).
Другой вопрос, зачем он здесь нужен, т.к. на закладке Filters есть параметр Despeckle.

Автор: TelecomUral, Отправлено:14:26 18-12-2018

оффтоп
shch_vg
нуу... лично мне странно то, что в разных местах скана деспекл страницы на зону то воздействует, то не воздействует. При том, что по умолчанию зона от деспекла защищена. Я ж ни одной галочки при создании трёх зон не поменял, они все дефолтные. Более того, перетащил зону 1 на место зоны три, а третью - на место первой. Один шут при переобработке точки в правой верхней четверти исчезли, а внизу остались.
Но не суть. Я "прокукарекал".

Автор: bolega, Отправлено:15:48 18-12-2018

Все верно подметил TelecomUral. Это баг, причем серьезный. Я пока даже не знаю, как его обойти, чтобы малой кровью и не наделать новых багов. Проблема в том, что despeckle для ч/б сканов выполняется до того, как вырезаются и формируются зоны. Т.е. к моменту создания зоны точек уже нет. Костыли можно сделать, но они не будут универсальными. Если убрать Clear source area, точки останутся в зоне, но они останутся и на странице, а это возможно не то, что ожидает юзер. Можно вокруг pic-зоны создать exclude-зону (выделить pic-зону и держа нажатым Ctrl, щелкнуть по кнопке с exclude-зоной), но это лишнее действие.
По хорошему, чтобы вылечить баг, нужно в корне поменять последовательность обработки ч/б сканов, т.е. despeckle делать последним, как это делается в случае серых/цветных сканов.

Автор: TelecomUral, Отправлено:16:43 18-12-2018

bolega
создавайте exclude-зону на лету. как вариант. костыли, конечно.
или предупреждение давайте.

Автор: shch_vg, Отправлено:16:43 18-12-2018

bolega

Цитата:
Проблема в том, что despeckle для ч/б сканов выполняется до того, как вырезаются и формируются зоны. Т.е. к моменту создания зоны точек уже нет.


Цитата:
Если убрать Clear source area, точки останутся в зоне, но они останутся и на странице, а это возможно не то, что ожидает юзер.

Что-то я не понимаю взаимосвязь этих двух кусков. Если despeckle сработал ДО обработки самой зоны, то причем здесь Clear source area, который является параметром зоны? Задание этого параметра делает анти-деспекл всей страницы?
В примере TelecomUral видно, что Clear source area оказывает только локальное действие на свою зону.
И если верно указанное во втором куске, то есть обратное влияние параметра зоны на всю страницу? А что будет, если в одной зоне задан параметр Clear source area, а в другой нет?

Автор: TelecomUral, Отправлено:17:31 18-12-2018


Цитата:
то причем здесь Clear source area

=>

Цитата:
обратное влияние параметра зоны на всю страницу

вы встаньте на позицию юзера. он будет вынужден в разных условиях по-разному глядеть на одно и то же свойство зоны. она ему обычно нужна, чтоб сохранить то, что ПОД зоной, а на BW-скане - то, что _В_ зоне.

Автор: shch_vg, Отправлено:18:19 18-12-2018

TelecomUral

Цитата:
вы встаньте на позицию юзера

А я и есть юзер , но меня никогда не заботило, что есть ПОД зоной.
Как правило, я перед компиляцией делал слияние зон со страницей, и все, что ПОД зоной, исчезало. А там могло быть много чего, например, в варианте, когда сначала страница обрабатывается без зон, а только потом добавляются зоны, которые обрабатываются без переобработки страницы целиком.
С выползанием грязи из-под зоны столкнулся совсем недавно при создании дежавю в СК без слияния зон со страницей.
Кстати, до сих пор не понимаю, почему ПОД зоной появляется грязь, если зона задавалась ДО обработки страницы. Многократно рассматривал страницы после такой обработки, и всегда на месте зоны на странице были чистые места.
Пока же я вижу, что параметр Clear source area работает только для исходного черно-белого скана, или я не прав? Если это так, то м.б. лучше вообще его не показывать для не ч/б исходных сканов?

Автор: bolega, Отправлено:19:28 18-12-2018

shch_vg

Цитата:
Что-то я не понимаю взаимосвязь этих двух кусков


Цитата:
Если despeckle сработал ДО обработки самой зоны, то причем здесь Clear source area, который является параметром зоны?

Попробую объяснить, хотя подозреваю, что вы опять сделаете вывод, что я не прав и все должно быть не так, как я объяснил.
Clear source area делает всегда то, что и должен делать: после вырезания зоны чистит область под ней. И это не зависит от того, ч/б скан или нет, есть ли там despeckle или нет, и т.п. При этом допускается, что участок в районе периметра зоны может остаться не очищенным. Я как-то объяснял, почему это происходит. Повторяться не хочу. Скажу только, что непрямоугольные зоны чистятся полностью.

Когда СК начинает обработку, он строит матрицу влияния разных типов зон на разные фильтры. При этом во внимание принимаются типы зон и некоторые их свойства. Например, если для страницы задано despeckle, то СК анализирует все заданные зоны на предмет того, нужно ли подвергать despecklу область скана, находящегося под зоной. Если зона типа exclude, то область должна быть исключена из действия despeckle. Если зона типа picture, то СК смотрит на ее параметр despeckle source area. Если он выключен (по умолчанию именно так) то СК по идее должен также исключить эту область. Но как мы видим, она не исключается. Почему? Все просто: СК видит, что при этом включена опция Clear source area, поэтому какой смысл защищать область скана от despeckle, если она все равно будет очищена. Ведь защита областей от действия фильтров расходует ресурсы и требует дополнительного времени.

Автор: slava_kry, Отправлено:20:45 18-12-2018

хоть кто-нибудь...
быстренько куда-нибудь это запротоколировать для инструкций и помощи!

Автор: shch_vg, Отправлено:00:22 19-12-2018

bolega

Цитата:
Попробую объяснить, хотя подозреваю, что вы опять сделаете вывод, что я не прав и все должно быть не так, как я объяснил.

Спасибо за разъяснения, теперь мне кое-что стало более понятным.
Что касается выделенного мной из Вашего ответа, то мне кажется, что Вы не совсем правильно воспринимали мои предыдущие сообщения.
Дело в том, что мы изначально находились (и находимся) в неравном положении.
Вы знаете всю внутреннюю механику программы, максимум можете забыть какую-то деталь. Для меня же (думаю, и для многих других) СК представляет "черный ящик" с минимумом информации, которая в основном преобретается путем задания тех или иных параметров и оценки результата их действия. Не уверен например, что все написанное в "Хрестоматии материалов про СК" из шапки соответствует реальному положению дел. На основе этого складывается мое представление о работе СК, которое, конечно же, не совпадает с реальным алгоритмом. Поэтому и все мои вопросы или предложения делались исходя из МОЕГО представления о работе программы в тот или иной момент.

Несмотря на все вышеизложенное рискну предложить свое видение решения проблемы обработки ч/б исходных сканов. М.б. стоит отказаться в этом случае от экономии времени обработки на деспекле, а при наличии галки в Clear source area не делать диспекл со страницы на область зоны?
Альтернативный вариант: в конце нынешней обработки для ч/б скана выполнить команду Reprocess из меню зоны для всех зон с включенным параметром Clear source area. Так, например, я восстановил нормальный вид зон в примере TelecomUral.

Цитата:
При этом допускается, что участок в районе периметра зоны может остаться не очищенным.

Это объясняет появление в некоторых случаях правой вертикальной и нижней линий после слияния зоны со страницей.

Автор: bolega, Отправлено:09:35 19-12-2018

shch_vg

Цитата:
М.б. стоит отказаться в этом случае от экономии времени обработки на деспекле, а при наличии галки в Clear source area не делать диспекл со страницы на область зоны?

Это поможет не всегда. Например, если пользователь включит опцию зоны despeckle source area и отключит Clear source area, т.е. он захочет, чтобы спеклы остались в зоне, но убрались бы со скана, он опять получит не то, что надо: спеклы останутся и там, и там. Т.е. опять баг.

Добавлено:
Кстати, по чистой случайности я сейчас работаю над темой, которая очень близка к той, которую мы обсуждаем: проблема, возникающая при наличии в pic-зоне отключенной опции Clear source area (csa). Многие наверно заметили, что после обработки неочищенные (из-за опции csa) области под зонами выглядят отлично от соседних участков (по жирности и т.д). Это такой недостаток обработки, который упирается в принятый в СК ход обработки. Чтобы устранить его, надо обработку таких страниц выполнять не один, а два раза. Один раз с учетом зон, второй - как будто зон нет. Только так можно добиться адекватного результата. Можно этот процесс распараллелить, но я боюсь, что тогда появятся проблемы с нехваткой памяти. Поэтому я остановился на двухпроходной обработке одного и того же скана. Возможно, что в рамках решения этой задачи заодно удастся решить и тот баг, который мы обсуждаем.

Автор: Nitrofest, Отправлено:11:19 19-12-2018

Хочу попросить кого-то из экспертов обработать скан (расшитый из чужого pfd) и скинуть сюда результат с настройками sk, если кому-то будет не лень потратить на это время. Изначально крупноформатная книга была отсканирована с фиговым разрешением. Пытаюсь играться с разнообразными настройками Enhance - contour smooth - blur - но результат все равно не очень мне нравится. Было бы неплохо сравнить с результатом профессионалов.

https://yadi.sk/d/N0gbZ7I6R7IbIw

Автор: daa2013, Отправлено:11:42 19-12-2018

А нельзя ли каким-нибудь человеческим образом передать рисунок ?
rghost или яндекс диск или дропмифайл ? (Файлообменник а не радикал. И без дополнительных jpg-конвертаций ?)

И потом: что значит расшивка ? Вы его при помощи СК выковыривали или в Акробате Save As задействовали ?
Лучше вообще просто эту pdf-страничку положите.

Автор: slava_kry, Отправлено:12:11 19-12-2018

Nitrofest
Оригинал в студию!.. Самый-самый оригинал.
Ощущение современной книжки выложенной как превью с диким сжатием.

Автор: Nitrofest, Отправлено:12:19 19-12-2018


Цитата:
А нельзя ли каким-нибудь человеческим образом передать рисунок ?  
rghost или яндекс диск или дропмифайл  ? (Файлообменник а не радикал. И без дополнительных jpg-конвертаций ?)
 
И потом: что значит расшивка ? Вы его при помощи СК выковыривали или в Акробате Save As задействовали ?
Лучше вообще просто эту pdf-страничку положите.


Выложил на YD архив, страничка в pdf внутри. Я расшивал из pdf в png при помощи STDU viewer в 600 dpi.


Цитата:
Nitrofest
Оригинал в студию!.. Самый-самый оригинал.
Ощущение современной книжки выложенной как превью с диким сжатием.


Книжка 1991 года, кто сканировал не знаю, в инете уже 10 лет гуляет. Вот целиком, на всякий случай.
https://yadi.sk/i/AVrkC-3BiWYQ9A

Автор: slava_kry, Отправлено:12:24 19-12-2018

Nitrofest
Благодарствую.
Щаз попробуем.

Добавлено:
Nitrofest
Вообщем из оригинала можно вытянуть, но придётся сначала апскейл сделать, прежде СК
Получается вот что https://yadi.sk/i/95aUQElRLI34zw

Делается с помощью Топаз Гигапиксель вер.2 600% увеличения.
Конечно же, предварительно нормально разобрав ПДФ файл "как есть".

Автор: bolega, Отправлено:13:12 19-12-2018

slava_kry

Цитата:
но придётся сначала

ваши ответы в этом топике мне всегда напоминают анекдот про студента, который перед экзаменом успел выучить только одну тему - про блох, и когда на экзамене ему выпал билет про кита, он отвечал так: у кита не бывает блох, а что касается самих блох, то можно сказать, что ....

Т.е. относительно темы СК ваши ответы сводятся к нулю, но блеснуть знанием всяких плагинов к акробату и фотошопу вы никогда не упустите случая. Правда при чем тут топик про СК, не очень понятно...
Извините уж за прямоту.

Автор: slava_kry, Отправлено:13:34 19-12-2018

bolega
Да, спасибо за прямоту... только вроде бы задача-то получить результат и облегчить тяготы вопрошающим... так же воде бы?
А если ваша программа, в данном случае, нихрена не может, то что вам останется ответить?.. Прости дорогой, ничем не могу помочь! Так что ли?

А выход-то есть, только слегка другой чем вопрошающий знает, но зачем о нём говорить? Правда так?..
...Простите за прямоту.

Автор: Nitrofest, Отправлено:13:51 19-12-2018


Цитата:
Nitrofest
Вообщем из оригинала можно вытянуть, но придётся сначала апскейл сделать, прежде СК
Получается вот что https://yadi.sk/i/95aUQElRLI34zw
 


Спасибо! Ну я бы сказал, что результат похуже моего. Много мусора не вычищено из-за jpeg distortion.

А, стоп, у Вас же не бинаризованный файл. Наверное, результат будет лучше, если прогнать Ваш файл через SK.

Автор: bolega, Отправлено:14:26 19-12-2018

slava_kry

Цитата:
А если ваша программа, в данном случае, нихрена не может

А вы пробовали? А вы уверены, что в СК вы настолько опытный эксперт, что можете утверждать это так безапелляционно? Тем более вы всегда для тяжелых случаев предоставляете не ч/б версии. Так любой дурак может, вы уж доведите до ума, т.е. до bw, без мусора и т.д. А демонстрировать работу профессиональных программ-улучшателей много ума не надо.
Проверил.
При исходнике в 150dpi СК с Топаз Гигапиксель конечно бесполезно тягаться
Но думаю, что 900dpi все-таки хуже, чем найти и пересканировать книгу в нормальном dpi.


Автор: slava_kry, Отправлено:16:17 19-12-2018

bolega
Я вставил шпильку, извините.
И я всё время говорю именно о предварительной подготовке перед обработкой в СК, а не о самом СК. Если что-то СК не может, ему можно помочь, а дальше уже СК.
Я вот о чём.
Ещё раз простите за поддёвку, больше не буду.


Добавлено:
Nitrofest

Цитата:
А, стоп, у Вас же не бинаризованный файл. Наверное, результат будет лучше, если прогнать Ваш файл через SK.

Да, именно так, это подготовка материала перед обработкой в СК.

Автор: bolega, Отправлено:18:49 19-12-2018

slava_kry

Цитата:
Я вставил шпильку

Да о чем разговор. Все нормально.

Для сравнения вот djvu: 1-я страница обработана в СК, 2-я - slava_kry в Топазе. dpi искусственно установлено в 600, в реальности оно 900
http://fayloobmennik.cloud/7341770


Автор: TelecomUral, Отправлено:03:59 20-12-2018

del

Автор: igogo22, Отправлено:13:50 20-12-2018


Цитата:
Обработка пикчур-зон от TelecomUral Подробнее...

К сожалению две ссылки нерабочие. Можете обновить?

Автор: TelecomUral, Отправлено:14:36 20-12-2018

igogo22
в личке смотрите

Автор: Nitrofest, Отправлено:18:13 20-12-2018


Цитата:
Для сравнения вот djvu: 1-я страница обработана в СК, 2-я - slava_kry в Топазе. dpi искусственно установлено в 600, в реальности оно 900
http://fayloobmennik.cloud/7341770


Не могли бы выложить файл с настройками СК?

Автор: daa2013, Отправлено:11:16 21-12-2018

Опечатка в слове Brightness
на закладке Contrast окна Image enhance filters

писал уже о похожей:


Цитата:

Опечатка в слове Brightness на закладке Filters свойств зоны
(пропала вторая s)

Автор: igogo22, Отправлено:16:53 21-12-2018


Цитата:
дескрин text&line и инверсный дизеринг настройки для dither зоны.

Может кто то разъяснить где эти настройки находятся?
Насколько я понял text&line есть в Quality/Enhance/Misc?
Что такое инверсный дизеринг?

Автор: daa2013, Отправлено:04:01 22-12-2018


Цитата:
Что такое инверсный дизеринг?


Inverse dithering на закладке Filters3



bolega

Рассматриваю и сравниваю кнопку Selection style в окне MV и RV.

А. Обнаружил следующую ерунду. Может, это конечно от винды зависит, и только на моём компьютере проявляется.
Прямоугольник с треугольничком, где выпадающий список этой кнопки. В окне MV где бы ни находилась вершина курсора над этим прямоугольничком, будет выпадать список. В окне же RV остриё курсора должно быть обязательно в правой половине прямоугольничка, а если в левой, то список выпадать не будет, будет как бы нажиматься кнопка.

Это характерно и для других кнопок с выпадающими списками этого окна, вот только сравнивать их не с чем.


Б. В окне RV дополнительно есть опция Hand (кстати, это считается кнопка или команда ?). Вот я подумал. Вы уже отвечали, что скорллить колесиком мышки в окне MV изображение нельзя и не будет можно никогда. (И я догадываюсь почему: на нём прокрутка списка файлов + проблема, кто там в окне активный). Но может быть по аналогии с окном RV на панель команд можно впендюрить что-то типа кнопки Hand, и если эта кнопка нажата, то всё-таки дать возможность скроллить колёсиком и считать активным изображение, а остальные возможности колёсика при этом отрубить. Уж очень эти маленькие стрелочки у ячейки зума неудобные.
(Нажал кнопку -> поработал колёсиком = выставил зоны + подчистил -> отжал кнопку.)


В. Как всегда, моё любимое. Синхронизация Hand на кнопке Selection Style и самостоятельной кнопки Scroll cursor. Она есть только в направлении Scroll cursor -> Hand. Но не наоборот.


Я это еще в Хрестоматии 2.0 заметил и описал. Но сейчас у меня прямо редакторская проблема из-за этого. В окне MV панели команд имена имеют. Они названы в меню, правда почему-то в обратном порядке что по важности, что по алфавиту там стоят:
- Show zones toolbar
- Show commands toolbar

В окне RV в контекстном меню тоже есть команды Show ... Однако:
1-я панель - спрятать её нельзя, команды для неё нет, поэтому мне приходится именовать её безымянной. Но может быть у неё всё-таки есть имя ? А может её и прятать стоит ?
2-я панель - preferences command panel. Тут всё понятно.
А вот 3-я и 4-я панели обе идут как edit command panel и хотя в окне их можно спрятать по отдельности, в к.меню они связаны. Может быть, стоит развязать их там и самостоятельное имя одной из них дать ?

Автор: bolega, Отправлено:10:45 22-12-2018

daa2013

Цитата:
то всё-таки дать возможность скроллить колёсиком

http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=3180#8

Автор: daa2013, Отправлено:13:53 25-12-2018

Состряпал Хрестоматию 2.1

https://yadi.sk/d/NrtuRm3cxbarIw


Upd:
Напоминаю, что chm файлы надо разблокировать
https://htfi.ru/windows_7/kak_otkryt_chm_fajl_v_windows_7.html

Автор: gsn13n, Отправлено:15:06 25-12-2018


Цитата:
[/q]
[q]Состряпал Хрестоматию 2.1

https://yadi.sk/d/NrtuRm3cxbarIw

Спасибо, вроде и не новичок при работе с СК, но постоянно узнаю что-либо новенькое

Автор: Benoni, Отправлено:18:34 25-12-2018

daa2013

Цитата:
Состряпал Хрестоматию 2.1

Столько труда вложено! Спасибо!

Автор: allo04, Отправлено:15:01 26-12-2018

daa2013
а можно узнать, какая там информация обновилась.

Автор: TelecomUral, Отправлено:15:04 26-12-2018

allo04
в конце есть "Послесловие и источники", там есть что добавлено и поправлено.

Автор: ComboFZ, Отправлено:10:54 27-12-2018

daa2013

Цитата:
...Хрестоматию 2.1

У вас там картинки PNG 32bit.
Может стоит свести слои (убрать прозрачность) сделав PNG 24bit?
Или тут что-то кроется (быстрее открывается CHM, правильно показывается PNG и т.д.)?


Автор: daa2013, Отправлено:11:18 27-12-2018

Я делал в Dr.Explain, там отрублены все возможности редактирования/управления картинками.
В последних версиях вообще непредсказуемо фильтры накладываются и масштабирование происходит. Пришлось в старом собирать.

Я им даже в техподдержку писал:
https://techwriters.ru/forum/forum635/topic21293/

Т.е. пользователем это неконтролируемо никак, а какой замысел разработчиков за этим кроется, я не знаю.

Автор: TelecomUral, Отправлено:18:20 29-12-2018

bolega
Тестировал утром постеризатор, заодно нарыл какую-то инверсию при наложении зон в визарде. Справа зона это картинка, у которой я уменьшил число цветов, слева крашеная зона, они с перехлёстом поставлены.



Задание
https://yadi.sk/d/fHxammm9IEnXVw
В нём на втором скриншоте видно, что и в 6.00.5 это задание делает дежавю с искажением, только другого рода.

оффтоп
Постеризатор работает классно, только в применении непривычен. Как я к маскам привыкал, так и к палитрам и инструменту придётся привыкать. Но применение удобнее чем в RasterId, к примеру. Управляемость полная.

Upd
есть просьба в свойствах по Ctrl+I показывать реальное число цветов. Или ещё как-то оперативно это отражать. А то я собрал дежавю с вручную постеризованной картинкой, думал 6 цветов, а чанк FGbz кажет что цветов 193.

Upd2
пиктограммы MV на кнопочках выбора предыдущей/последующей внешней зоны малоразборчивы на большом разрешении. Слишком слабое отличие в картинках, а стоят они непривычно, сначала "последующая", потом "предыдущая".

Автор: sergiokapone, Отправлено:00:26 30-12-2018

Как я понял, алгоритм малоцветного кодирования таков:

task

1. В свойствах picture zone выбираю Few colors
2. Поставил Transparent 100
3. Убрал все галки Protect from
4. Количество цветов подбирал в ручную, получилось на 30. При меньших значениях не все цвета воспроизводились после обработки, с красным более-менее, синий и зеленый становились темно-серыми.

out-task
1. В свойствах picture zone->Djvu-> Few color coding

После кодирования djvu получилось 12 цветов.

Не ясно, почему в конце получилось 12 из 30-ти.

Ps. Посмотрел на зоны, они не индексированные, а RGB, значит кодировщик сам определил.
Если вручную зоны перевести в XnView (или в чем-нибудь другом) в индексированные, то после кодирования их столько же и будет в djvu, что как-бы логично.

Вопрос к bolega, можно ли после few color - зону делать сразу в индексированных цветах, чтобы обойтись без лишней ручной доработки вне СК?

Задание
rghost
Google Drive

Автор: bolega, Отправлено:11:12 30-12-2018

sergiokapone

Цитата:
Задание rghost

Доступ к информационному ресурсу ограничен

Автор: sergiokapone, Отправлено:12:30 30-12-2018


Цитата:
Доступ к информационному ресурсу ограничен

Добавил ссылку на google drive

Автор: bolega, Отправлено:14:56 30-12-2018

sergiokapone
Вы в какой версии СК делали, точно в 6.3?
запустил ваше исходное задание на обработку без изменений. Получил на выходе 8-битные зоны, т.е. индексированные. И в djvu 12 цветов как и положено.
Может вы на выходе как-нибудь изменяли зоны, так что они превратились в 24бит? Может случайно нажали кнопку в VR, которая меняет глубину цвета, по умолчанию там как раз 24 бит. Кстати, с помощью нее можно и в СК перевести сразу в индексы, если что. Не обязательно нужен внешний редактор.
И еще перевел ваш вариант зоны в 24 бита, результат такой же - 12 цветов. У меня ощущение, что вы что-то с зоной делали перед кодированием.

Цитата:
2. Поставил Transparent 100

Это в принципе лишнее. см. мой вариант


Цитата:
Не ясно, почему в конце получилось 12 из 30-ти.

Это особенность работы автоматического постеризатора. Если вы задали 30, то СК дает гарантию, что будет не более 30 цветов, но по факту может обойтись меньшим количеством. Почему же он не делает сразу 12, если задать изначально 12? Потому что результат зависит к сожалению от начальных условий и с этим ничего не поделаешь. Часто если задать удвоенное кол-во цветов, то результат будет точнее и примерно с вдвое меньшим количеством на выходе. Почему именно так, я не знаю.
Для сравнения: http://fayloobmennik.cloud/7344481
добавил вариант, когда палитра задана вручную, с помощью новой функции СК (стр. 3-4). 4-я страница аналогична 3-й, но включена прозрачность как у вас.
Отмечу также, что в новой версии 6.3 в малоцветках белый цвет - это тоже цвет! Т.е. он не есть прозрачный. Если под под зоной что-то будет, то белый цвет закроет его. Вот если нужно, чтобы что-то просвечивало сквозь нее, тогда есть смысл вводить прозрачность. Кстати, в версии 6.3 прозрачность можно включить прямо в зоне в out-задании, т.е. без переработки зон, т.к. при создании djvu СК теперь учитывает эту опцию зоны.

Добавлено:
TelecomUral
Вы привели интересный пример. Я уже о таком эффекте как-то давно упоминал. Суть его в том, что вьюер интересно отображает накладывающиеся друг на друга блиты (а именно в этом причина вашего эффекта), даже если они одного цвета. При кодировании в стандартных прогах (dee и т.п.) получить перекрытие блитов в принципе невозможно, поэтому эффект никогда не встречается. Но можно достичь этого искусственно, например, в СК. Причем сделать это можно только при перехлесте малоцветной и раскрашенной зон. При перехлесте двух малоцветных или двух раскрашенных зон эффекта не достичь. Именно поэтому я сказал интересно, что вы все-таки редкий случай создали.
Я раньше думал, что вьюер рисует блиты путем просто наложения его поверх канвы. Оказалось, что это не так, он накладывает блиты с помощью какой-то логической операции (или комбинацией).
Почему эффект происходит, мы выяснили. Осталось ответить на вопрос, почему он возникает в СК и только для двух разнотипных зон? Дело в том, что когда СК формирует блиты раскраски, неважно, раскрашенных зон или малоцветных, он следит за тем, чтобы перекрытия блитов не было. Если оно встречается, СК расщепляет блиты, разводя их по разным цветам (сколько цветов попало на один блит, столько и будет расщеплений). Но эта операция выполняется отдельно для раскрашенных зон и отдельно для малоцветных, т.к. кодирование их происходит также раздельно: сначала раскрашенные зоны, потом малоцветные . Пересечение блитов двух этих типов зон СК не контролирует. Я считал, что на практике такого пересечения никогда не встретится. Я и сейчас так считаю А ваш пример все-таки искусственный, не вижу причин, почему на практике пользователь такое пересечение должен допускать.
Но если очень надо, могу контроль ввести на всякий случай.


Автор: sergiokapone, Отправлено:19:02 30-12-2018


Цитата:
У меня ощущение, что вы что-то с зоной делали перед кодированием.  


Скорее где-то действительно накосячил. Да, действительно, зоны в palette 8.


Цитата:
Это в принципе лишнее. см. мой вариант

Если не ставить transparent, то в вьювере в режиме ч/б черые квадраты на всю площадь зоны, как-то не по феншую смотрится, при transparent=100 во вьювере просто изображение стает черно-белым.






Автор: TelecomUral, Отправлено:19:09 30-12-2018

bolega

Цитата:
не вижу причин, почему на практике пользователь такое пересечение должен допускать.

Я ничего специального вычурного не делал. Просто мне было неудобно выделять цветные куски одним прямоугольником, там чёрное попадало ("б"), и я выделил их два. Это проще чем полигон или лассо, я зоны сейчас создаю хоткеями на создание зон с номером группы. Кстати, и на других страничках этой книжки есть такие куски, и там тоже возникли аналогичные эффекты. Навскидку те малоцветные книги, что у меня в загашниках лежат, довольно часто имеют места, где бы я так же накладывал зоны.

Насчёт контроля - дело ваше. Предупреждать, что наложенные зоны имеют разные типы и будет артефакт? Но я зону делал цветностью "Original", а не "Few colors". Предупредить значит будет можно только в визарде? Навскидку это некорректно, точнее, поздно. Обработка уже произведена.

Не могу тут сходу сообразить, как мне изменить своё мышление, чтобы не лепить такие зоны. Привык, что с точки зрения всеядности комбинаций СК безупречен, а тут ограничение придётся наложить именно на собственные мозги. Стараюсь зонами не злоупотреблять, и ставить их поменьше и попроще по трудоёмкости. Может, подскажете, как тут поудобнее в интерфейсе сработать? Ведь если левую половинку делать типа Original - придётся ведь постеризовать.

Автор: bolega, Отправлено:19:11 30-12-2018

sergiokapone

Цитата:
в режиме ч/б черые квадраты на всю площадь зоны

Это да, и размер больше. Я просто хотел показать, что оба варианта в принципе правильны.

Добавлено:
TelecomUral

Цитата:
Но я зону делал цветностью "Original", а не "Few colors".

Это не важно какая цветность. Важно, что у нее включена опция "few colors coding", т.е. это именно малоцветка с точки зрения djvu.
Да вы и сами ранее писали

Цитата:
Справа зона это картинка, у которой я уменьшил число цветов, слева крашеная зона


Ну раз накладки разнотипных зон такое частое явление, придется мне это тоже контролировать. Убедили

Автор: TelecomUral, Отправлено:19:48 30-12-2018

bolega

Цитата:
придется мне это тоже контролировать. Убедили


а я написал и сообразил, что в данном случае мне надо было плюсовать прямоугольники выделений. Привычки нету, недавняя фича.

Автор: allo04, Отправлено:11:30 31-12-2018

Камрад bolega, когда уже 6.3 в люди выйдет? ... душа исстрадалась

Автор: TelecomUral, Отправлено:15:24 31-12-2018

bolega
а есть ли такая фича в СК 6.00.5: то, что было выделено в VR как "усреднение цвета по выделению" (магический цвет), вставить в MV в диалоге выбора цвета в зоне ? Чтоб не руками номер цвета вбивать.

Автор: bolega, Отправлено:15:46 31-12-2018

TelecomUral
В 6.3 в VR в КМ кнопки задания цвета copy color to clipboard. А в зоне на опции - команда paste color (именно на опции, а не в диалоге выбора цвета)
В 6.0 такого еще нет

Автор: TelecomUral, Отправлено:05:41 01-01-2019

Слетает в дефолт поле gap при дорасчёте.
Делаю такую последовательность:
уже и драфт сделал, и начал проверять макет страничек, размеры книги перешли в Fixed (из файла типовых размеров импортировал),
подобрал нужный gap и размножил центровку, проверяю дальше, и обнаружил что пятый разворот пропустил. Вставил его в нужной последовательности в список файлов, запустил драфт - упс, "H.Gap value "= 70. А было 280.
Может, тут надо было какие-то особые параметры драфта задать? Диапазон задал "All", галка "skip marked files" взведена.

Upd
Переобработал отмаркированные зоны "from current to the last". Странно, что информационное окно при завершении обработки говорит, помимо числа обработанных файлов, о переобработанных страницах и их нефинализированности: страницы я уже финализировал до запуска переобработки зон. А о числе зон не говорит.

Upd2
в режиме полигонального выделения в окне Zones при перемещении по страницам впечатление что при открытии сразу же один раз была нажата ЛКМ: рисуется линия от некоторой точки до текущего положения мыши. И на области страницы, и на области зоны. А если на странице выделить полигон и нажать "Q" или "W", то полигон не исчезает.

Upd3
В 6.3. Окошко показа зоны при переходе из MV в VR не даёт масштаб "вписать зону в границы окна" (Fit). Зона отображается с масштабом раза в полтора крупнее чем окно. Раньше такого поведения никогда не замечал.


Автор: daa2013, Отправлено:22:37 01-01-2019

Во время самого первого запуска 6.3. наблюдается следующее.
(Пытаюсь разрезать микс сканов. Есть развороты, есть одиночные страницы, развернутые в разные стороны).

1. Кручу Orientation на закладке Files она применяется не к одному а сразу ко всем файлам. Да и галка Split стала применяться сразу ко всем. В 6.00.5 и то и другое к текущему.

2. Нажимаю маркировочную кнопку №4 "сбросить все опции" - на Orientation она не влияет. (В км галки не трогал). Потом начинает. (Может, нужно хоть раз но это км вызвать? ) При самом же первом запуске кнопка на ориентатион не влияла.

Потом поведение и по п.1 нормализовалось - только к текущему. А потом опять вернулось - сплит ко всем и ориентация ко всем.

3. Команда меню Clear options ориентацию не сбрасывает, а кнопка №4 сбрасывает...


Ликвидировал все опции, размаркировал файлы. Запускаю драфт ...

Добавлено:
На страницах, не прошедших драфт, все равно почему то в процессе выставлены резаки. Причем прерываю драфт, а эти резаки остаются. (правла, и 6.00.5 так себя почему-то ведёт. Ставит паразитные резаки.)

Добавлено:
расставил резаки на первом файле пытаюсь скопировать положение на последующие. Файлы при этом немаркированы. Пишет nothing to do (А вот 6.00.5 один резак копирует).

И кстати непонятно. Почему-то я могу скопировать или положение или состояние. А если я хочу и то и другое ?

И кстати подсказка по состоянию unmarked/cut/clear появляется только если возле резака в диалоге стоит галка, т.е. "копировать". Но ведь состояние имеется у резака и без этой галки. Мне казалось, состояние должно всегда индицироваться.
И ещё. Подсознательно под состоянием понимается цвет (хотя это не цвет.) Может в этот диалог как-то можно и цвет резака задействовать ? Если не копировать его, то хотя бы указывать. Просто чтобы подчеркнуть, что это другое. А может и копировать смысл имеет.
И еще почему "unmarked" ??? В этом же диалоге имеется фраза "cutter is off". Насколько я понимаю, это синонимы, но теперь я в этом засомневался. Может и имеется теперь вдруг конструкция, что резак одновременно unmarked и ON.



Добавлено:
Список файлов теперь обозначен закладкой files. По моему прямо просится еще хотя бы одна закладка. Иначе она одна-одинёшенька и ей скучно.

Я постоянно контролирую файлы через ACDSee с предьтавлением файлов таблицей.
имя - ширина пикс - высота пикс - разрешение - цветность. С сортировками по каждому столбцу.
Когда-то обсуждалась как увидеть реальное число цветов в файле. Я понимаю, что это уже отожрет время, но может быть полезно. Ещё один столбец, который заполняется по команде "сосчитать реальное число цветов".
Это то чем я постоянно пользуюсь. Но можно и ещё-какие-то сведения с информационной панели воткнуть.
И будет вторая закладка Info.

Автор: bolega, Отправлено:10:33 02-01-2019

daa2013

Цитата:
Кручу Orientation на закладке Files она применяется не к одному а сразу ко всем файлам. Да и галка Split стала применяться сразу ко всем.

Никогда такого не было. И сейчас ничего подобного воспроизвести не смог. Файлы отмаркированы при этом?


Цитата:
Нажимаю маркировочную кнопку №4 "сбросить все опции" - на Orientation она не влияет

Тоже не смог воспроизвести


Цитата:
Команда меню Clear options ориентацию не сбрасывает

это да.


Цитата:
На страницах, не прошедших драфт, все равно почему то в процессе выставлены резаки

они не выставлены, это текущие опции. это же азы: когда вы перемещаетесь с маркированного на немаркированный файл, все опции, включая резаки, остаются взведенными. Это и позволяет присваивать так называемые "текущие" опции новым файлам просто взводя галку (поведение с 1-й версии СК!)


Цитата:
Пишет nothing to do

и правильно. маркированных файлов нет, куда копировать?


Цитата:
По моему прямо просится еще хотя бы одна закладка. Иначе она одна-одинёшенька и ей скучно.

это будет уже в следующей версии. можно будет создавать под-списки файлов из файлов задания


Цитата:
как увидеть реальное число цветов в файле.

Добавлю в команду task info. Там сейчас для текущего файла, если он jpg, выводится расчетный % качества. Можно добавить туда и кол-во цветов. Хотя как это знание повлияет на расстановку опций, не понимаю...

TelecomUral
Значение gap-ов сбрасываются в соответствии с опцией use options from. Это логика. Если не нужно их трогать, задайте при последующих драфтах: use options from = current file

Автор: daa2013, Отправлено:10:54 02-01-2019


Цитата:
И сейчас ничего подобного воспроизвести не смог. Файлы отмаркированы при этом?

Попробую вечером видео записать, если воспроизведётся. К зубному убегаю. Не исключаю, что это финты первого запуска. Мне еще на Win7 надо будет захватчик ставить. Чем сейчас экран грабят ?


Цитата:
они не выставлены, это текущие опции. это же азы

Меня тут как-то не логика их происхождения интересует, а то, что я запустил драфт -> прервал драфт -> получил кучу ненужных и неправильных резаков.
Значит их надо принудительно удалять после интеррапта.


Цитата:
Добавлю в команду task info.

Тут фишка в том, чтобы сравнивать файлы, делать по ним сортировки, вылавливать группы схожих, переключаться между закладками Files/Info с сохранением выделения ...
Команда для одного файла - это не совсем то, хотя она тоже бывает нужна.


Цитата:
и правильно. маркированных файлов нет, куда копировать?

В 6.00.5 же копирует !
Я же не обрабатывать файлы готовлюсь. А расставляю по отдельности опции и резаки. У меня, конечно, опыт разрезки в СК микроскопический, но ИМХО разрезать неотмаркированный файл всегда можно было, а значит и резаки скопировать должно быть возможно.

Автор: sergiokapone, Отправлено:13:24 02-01-2019

bolega, с малоцветом стало приятно работать, спасибо. Думаю Вы в курсе, но выскажу: пока постеризатор плохо отделяет чёрный. Остаются цветные окантовки черных линий, с которыми есть немало ручной возни.

Автор: shch_vg, Отправлено:22:11 02-01-2019

daa2013

Цитата:
Мне еще на Win7 надо будет захватчик ставить. Чем сейчас экран грабят ?

А что, в Win7 клавиши Print и Alt+Print отменили?

Автор: TelecomUral, Отправлено:05:29 03-01-2019

В постеризаторе применение замены цветов не откатилось по кнопке меню Undo, кнопка стала серенькой, когда я временно переключился из окна СК в другую программу. Откатиться смог только черз КМ "Undo". Upd. Уточню, что до этого сеанса мной был открыт другой экземпляр СК.
А ранее замечал, что Ctrl+Z в постеризаторе не работает, только кнопка меню.

Автор: daa2013, Отправлено:13:26 03-01-2019

bolega

Цитата:
И сейчас ничего подобного воспроизвести не смог. Файлы отмаркированы при этом?

Нет, файлы неотмаркированы.
Загрузил, перешел на предпоследний, нажал ориентацьон, повлияло на все.
Это воспроизводится.

Если отмаркировать все, то сплит к одному. Если неотмаркированы, то сплит ко всем. (Также и ориентация).

4-я маркировочная кнопка вроде сейчас работает нормально. Попробую потом на другом компе, где будет первый запуск.

shch_vg

Видео эти кнопки не пишут. Буду вот это изучать:

https://ocomp.info/programmi-dlya-zapisi-video-s-ekrana.html

Автор: bolega, Отправлено:14:01 03-01-2019

daa2013

Цитата:
Если отмаркировать все, то сплит к одному. Если неотмаркированы, то сплит ко всем.

Вы чего то тормозите.
Так было всегда! Так и задумано. Если файл неотмаркирован, никакие опции к нему не привязываются и соответственно при выборе файла не выставляются из его свойств (их просто нет физически! кроме зон). Включенный сплит не значит, что он есть у всех, он просто не меняется при движении по списку. Т.к. он принадлежит не файлам, а "текущему" набору.
Видео не нужно

Автор: daa2013, Отправлено:00:04 04-01-2019

В окне MW, где контрол+колесико стало давать зум, нельзя ли ещё добавить, чтобы смещение курсора от центра влияло бы на скроллбары, как в RV. Т.е. чтобы картинка не была все время центрированной, а можно было бы, крутя колесико и шевеля курсор, нацелиться.

Автор: TelecomUral, Отправлено:06:41 04-01-2019

daa2013
а чем Zoom selection плох? Я недавно раскопал эту команду, и доволен. Быстрее, чем колёсико крутить. Кнопка Fit обратно восстанавливает масштаб.

bolega
Защитил галкой separate b-w coding плохие карты. Случайно заметил, что имена таких страниц внутри дежавю имеют префикс "pg_". Странно, что номер при этом на единицу сдвинут:



(При какой-нибудь работе с этими именами - могут быть проблемы задвоения или сортировки.)

Автор: daa2013, Отправлено:11:51 04-01-2019


Цитата:
а чем Zoom selection плох


Я за стандартизацию работы. Есть уже привычные до рефлекса действия в RV. Точно также надо cделать и в MW. Тем более это не только привычно, но и реально удобно.

Ваша же команда, кстати, в RV называется Zoom selection, а в MW Zoom rectangle. Тоже стоит унифицировать.

Автор: Olexiy71, Отправлено:13:52 04-01-2019

в 6-ом кромсаторе столкнулся с такой проблемой: он создает (иногда) файлы, которые не читаются и вызывают ошибку. Такое редко но бывает.
Открываешь этот файл в другом редакторе - сохранить как... - сохраняешь его как другой тифф и только потом его можно кодировать в джву. и не я только сталкиваюсь с этим.

Автор: bolega, Отправлено:13:57 04-01-2019

daa2013
подправил

Olexiy71

Цитата:
которые не читаются

чем не читаются? дайте пример такого файла, иначе невозможно понять, что не так

TelecomUral

Цитата:
"pg_".

исправил

Добавлено:
TelecomUral
Игрался с бесплатным jbig2.exe кодером (который есть в pdfbeads) и в итоге добавил в СК jbig2 сжатие при создании pdf. Пока только для страниц, не для зон (там все сложнее из-за словаря). Вот не знаю, оставлять или убрать... Если и удастся победить jbig2 в зонах, то только уже в следующей версии СК.

Автор: TelecomUral, Отправлено:14:41 04-01-2019

bolega

Цитата:
Вот не знаю, оставлять или убрать...

Если решение не полноценное, то я бы на вашем месте вынес это в спецфичу. Не в обычный процесс. А то народ по незнанию наделает делов.
А я как раз завтра-послезавтра опробую на практике способ, который описывал на publ.lib.ru, с выносом малоцветки и последующей склейкой слоёв. 90 страниц ещё дочистить от мусора осталось. Больше 40 за один присест не могу, надоедает

Кстати, проверяя текст вблизи, и пытаясь побольше метёлкой захватить, подумал: а хорошо бы такие места, которые нужно поберечь при дежавю-кодировании, помечать прямо в VR. Вы там transit-зону придумали, но её же в VR не поставить.

Автор: sergiokapone, Отправлено:14:44 04-01-2019

bolega, не пойму, фича или баг, в VR в режиме подсветки спеклов кнопка ластика и кнопка mouse-up очистки остаются одновременно зажатыми, т.е. при смене режима с ластика на mouse-up очистку, ластик остается зажатым


Автор: TelecomUral, Отправлено:14:54 04-01-2019

оффтоп
sergiokapone

Цитата:
пока постеризатор плохо отделяет чёрный. Остаются цветные окантовки черных линий

Это скорее всего не постеризатор. Это долбаный оптикбук4800 на 600дпи слева и справа от черных линий оставляет жёлтую и синюю тонюсенькие окантовки. Это slava_kry обнаружил летом на моих сканах ДЭ-1. Не могу победить. Может потому что лампа светодиодная, а может технологические настройки в реестре такие. Там параметров - сотни, а доки - никакой.

Автор: Olexiy71, Отправлено:14:56 04-01-2019


Цитата:
которые не читаются  

чем не читаются? дайте пример такого файла, иначе невозможно понять, что не так

Не читаются ACDSee, Document Express Professional Editor 6/0,
при попытке кодировать через DjVu Small v0.4.4 тоже вызывает ошибку
вот этот файл https://yadi.sk/i/Y6vdtiFimexBjg для примера.
в ск 5.95 у меня такого никогда не было

Автор: bolega, Отправлено:15:20 04-01-2019

TelecomUral

Цитата:
подумал: а хорошо бы такие места, которые нужно поберечь при дежавю-кодировании, помечать прямо в VR

хорошая идея. если удастся приплюсовать эти пометки к transit-зонам, обязательно сделаю. Я даже думал, может эти транзиты только в VR и делать, да нет, иногда и на исходном скане бывает нужно.

sergiokapone
Это специальная фича: ластик в таком режиме ведет себя не как стирающий ластик, а как метелка с учетом формы ластика! Нужно просто отщелкнуть еще раз ластик, чтобы отключить такой режим.
Чего-то непонятное стало: всем теперь мерещатся повсюду баги Рекомендую внимательнее прочесть whatsnew.

Добавлено:
Olexiy71
Занятный файл - из-за дизеринга распух сильно. Хотя с пяток вьюеров его спокойно открыли (photoshop, paint, irfan и т.п.). Видимо, для DEE слишком много элементов.
Зря вы фото делаете как ч/б - ее в обычную серую зону и никаких проблем. Кстати, а чем пересохраняете, чтобы DEE потом кушал? У меня пересохранение в photoshop и irfan не помогло все равно.

Автор: TelecomUral, Отправлено:15:49 04-01-2019

Olexiy71

Цитата:
при попытке кодировать через DjVu Small v0.4.4 тоже вызывает ошибку

а у меня он закодил ваш файл без проблем. Djvu Editor 6 тоже его скушал.
И открывается этот тифф тоже без проблем, в старом acdsee 3.1 и в ирфане.
Так что копайте особенности операционки. Либо не тот файл выложили.

Автор: Olexiy71, Отправлено:16:03 04-01-2019


Цитата:
а у меня он закодил ваш файл без проблем.  
и открывается тифф тоже без проблем, в старом acdsee 3.1 и в ирфане.

у меня acdsee 5.0,
да, кстати, не подумал сделать в сером. ваши советы буду иметь ввиду. спасибо.
этот файл и у меня через пересохранение не лечится. а вот в другие разы помогало.
сохраняю такие картинки в ч\б потому что потом при кодировании они никак не меняются по качеству. а вот серые немного становятся размытые.

Автор: bolega, Отправлено:16:11 04-01-2019

Olexiy71
У меня он закодился в djvu так (из-под СК): я создал в out-задании special зону на месте картинки размером по вертикали чуть больше половины рисунка, в зоне задал separate b/w coding. Помогло, DEE справился.

Автор: sergiokapone, Отправлено:21:13 04-01-2019


Цитата:
Чего-то непонятное стало: всем теперь мерещатся повсюду баги

Ну, лучше, так сказать, перебдеть, чем недобдеть.


Цитата:
А ранее замечал, что Ctrl+Z в постеризаторе не работает, только кнопка меню.

Заметил, что она не работает в VR режиме Zones

Автор: daa2013, Отправлено:07:26 05-01-2019

По поводу закладок.

Обратил внимание, что в Document Express Editor тоже есть доп.закладка Outline с деревом внутренней структуры. И вспомнил, что буквально вчера случайно свой же текст про БукРесторер перелистывал:

То есть там дерево из страниц и их зон картинок. А дальше примитивными средствами визуализации впихивается целая куча информации. Простите за самоцитирование. В справке-то у них это не расписано.

То есть можно и третью закладку сделать. Дерево в дополнение к таблице. Такая закладка во внешних заданиях при сборке pdf и djvu могла бы быть полезной.
В ней, например, опциями можно было бы подсвечивать файлы, которые подверглись той или иной обработке. Показывать, к каким страницам подвязаны внешние зоны и т.п.



Автор: TelecomUral, Отправлено:08:38 05-01-2019

Что-то мне не удаётся создать Transit-зону, как это описано в whats'new. В out-task она не появляется. Но в особом случае:
до того как я сделал transit-зоны (причём я их сделал вокруг exclude-зон, которые мне уберегли мелкие детали от деспекла), я, во-первых, закончил чистку мусора, во-вторых, сделал полный sub-task, причём в двух вариантах: комплект всего что есть, и комплект с заменой output-файлов на чистые листки. Это мне нужно для дальнейшей подмены чб-текста на белые страницы. После чего поставил четыре transit-зоны, сгенерировал out-task, перешёл в него, ...и упс. Speiсal-зон нет.
Более того, СК при попытке поставить пикчур-зону заново, уже в самом out-task, выдал Access Violation, которое не закрывалось (переоткрывалось постоянно). Пришлось через Task Manager винды грохать его.
Суб-таск я сделал, правда смущает что exclude-зона куда-то исчезла. 99,9% что она там была, именно с установки защиты на этой карте я начал exclude-зоны по тексту расставлять.
https://yadi.sk/d/dAlVstiz_6VM5w

+
если в MV, стоя на пикчур-зоне (видны её грипы), дважды нажать пробел (отмаркировать зону и снять маркировку), то грипы при щелчке мышкой вне зоны не пропадают. Нужно сначала на зоне опять щёлкнуть.

++
Попробовал сделать transit-зону на новом задании - создалась, в out-task перешла, как заявлено. Значит, дело в моих манипуляциях с sub-task, либо в том, что после расстановки transit-зон (по Ctrl+Click на кнопочке в меню) ничегошеньки не нажимал, а сразу сгенерил out-task. В whats'new написано, что переходят вершины, вот я и решил что так можно.

+++
странно, что для Transit-зоны не появляется закладка Djvu, где бы я мог в основном задании установить галку separate b-w coding. Раз уж она гарантированно в out-task появится как Special-зона, где такая закладка будет.

Автор: bolega, Отправлено:11:44 05-01-2019

daa2013

Цитата:
По поводу закладок.

Создание дерева свойств у меня есть в _todo. Правда, планировал отображать в нем только информацию о всех зонах на стране.

TelecomUral

Цитата:
странно, что для Transit-зоны не появляется закладка Djvu

Это тоже есть в ближайших планах _todo.

Transit-зона должна быть обработана вместе со страницей (отдельно нельзя).
При обработке определяются ее координаты и размеры на выходе, которые конечно же будут отличаться от входных, и которые без обработки невозможно определить (из-за deskew, resample, обрезки, выравнивания и прочих трансформаций).
И вот эти выходные (!) вершины транзитной зоны становятся входными для pic-зоны out-задания.


Цитата:
ничегошеньки не нажимал, а сразу сгенерил out-task

так не получится перекинуть зону.
Либо мне надо предусмотреть возможность генерировать транзитную зону на выходе, т.к. для переброски в out главное - иметь координаты на выходе. Удастся это или нет, пока не знаю.

Проблема еще в том, что СК не создает результирующую матрицу трансформаций при обработке, как это делает например pdf. Если бы такая матрица была, это сильно бы облегчило манипуляцию с зонами без их обработки. Но пока увы..


Автор: TelecomUral, Отправлено:12:30 05-01-2019


Цитата:
И вот эти выходные (!) вершины транзитной зоны становятся входными для pic-зоны out-задания.

а! ларчик просто открывался.

Автор: TelecomUral, Отправлено:16:20 05-01-2019

bolega

Цитата:
Вот не знаю, оставлять или убрать... Если и удастся победить jbig2 в зонах

Заметил, что pdfbeads при работе с малоцветными страницами создаёт jbig2 под каждый цвет, приписывая к файлам суффикс, hex-код цвета. Может быть, вам можно таким же образом вызывать кодер? Я программных особенностей вызова не знаю, так что мысль наудачу.

Автор: bolega, Отправлено:17:56 05-01-2019

TelecomUral
Да дело не в кодере. А в том, что для того, чтобы изготовить jbig2 со словарем например на 50 страниц (т.е. зон), нужно их предварительно отобрать-переименовать, да еще с разных страниц, да еще где сами зоны, где только их маски. Это противоречит текущему, заложенному в СК, "линейно-последовательному" процессу кодирования и помещения зон в pdf. Т.е. сложность в том, что нужно много ломать в текущем коде, а это всегда чревато. Проблемы бы не было, если не использовать общий словарь, но это не практично.

Автор: TelecomUral, Отправлено:19:13 05-01-2019


Цитата:
сложность в том, что нужно много ломать в текущем коде, а это всегда чревато

значит, правильно я советовал спецфичу. Ломать работающее не стоит. Пусть когда-нибудь будет "Create PDF Wizard".

Автор: daa2013, Отправлено:21:10 05-01-2019

А куда делась команда Resort ? (Она была в основном меню Edit после Zoom). В вотцнью её исчезновение вроде не заявлено.
Нет, ну в км списка файлов осталась, конечно. Но она там не близко.


Добавлено:
И такой еще вопрос. Можно ли сделать хоткеи / хоткей на клик ПКМ ?
У меня снова мышка ломается и правая кнопа глючит. Нужна она только для вызова контекстных меню. Т.е. либо к.м. хотккем вызывать, но их много, либо клик ПКМ имитировать.


Добавлено:
Панель глифов автоматически закрепляется слева.
Нельзя ли ее сделать опционально и направо.
(Не исключаю, что кому-то также удобно снизу\сверху.)


Добавлено:
Назначил хоткей на Paste в RV (Ctrl+Q).
Он отображается в км , но не срабатывает. Команда же км срабатывает.
Задание сохранял, СК перезапускал. Не помогает
(Мышку другую взял, если что.)
UPD - не исключено, что не срабатывает автопозиционирование, а глиф просто черти куда улетает и я его не вижу. Также не исключено, что на дальность улёта влияет сглаживающий zoom filter.


Добавлено:
Я еще не добрался до этого в обработке, чтобы проверить, но я не вижу в вотснью двух важных обещанных штук:
1) Нормализация работы среднего ряда кнопок панели Page align;
2) Выдача предупреждения, когда запускается обработка с неодинаковыми размерами страниц на выходе. (Тревожную кнопку увидел, но она же для одного текущего файла, насколько я понимаю, сигнал даёт ? ). Важен же самостоятельный варнинг при запуске. Если это сделано, то упомяните в описании.

Кстати, такие выходные размеры, кстати, тоже можно в таблицу на гипотетическую закладку №2 запихнуть.

Автор: TelecomUral, Отправлено:07:56 06-01-2019

полуоффтоп

Цитата:
клик ПКМ имитировать

занятно: есть на клаве справа такая кнопка, но она не срабатывает в программе. И не подозревал о такой. И есть проги-имитаторы, судя по Ответы@mail.ru

Автор: bolega, Отправлено:09:38 06-01-2019

daa2013

Цитата:
Назначил хоткей на Paste в RV

Несрабатывание хоткеев (paste, undo) - это все из одной оперы. Причину я все-таки выяснил. Теперь будет все в порядке.


Цитата:
А куда делась команда Resort ? (Она была в основном меню Edit после Zoom). В вотцнью её исчезновение вроде не заявлено.

Мелкие изменения я в whatsnew не описывал. Их можно описать как "исправлены некоторые баги", "реорганизованы ряд меню".


Цитата:
1) Нормализация работы среднего ряда кнопок панели Page align;

Сделано.


Цитата:
2) Выдача предупреждения, когда запускается обработка с неодинаковыми размерами страниц на выходе.


Цитата:
Важен же самостоятельный варнинг при запуске.

Это пока нет. Такая проверка потребует выполнения расчета для всех файлов. Это может занять немалое время. Я пока не решил, стоит ли овчинка выделки. Или сделать такую проверку явной командой в меню. Чтобы не тратить каждый раз время на уже очевидное.


Цитата:
Можно ли сделать хоткеи / хоткей на клик ПКМ ?
У меня снова мышка ломается и правая кнопа глючит

Надеюсь, у вас экран не сломан слева/снизу/... А то я не готов подстраивать интерфейс под углы сломанных мониторов



Автор: TelecomUral, Отправлено:10:43 06-01-2019


Цитата:
Важен же самостоятельный варнинг при запуске


Цитата:
Или сделать такую проверку явной командой в меню

поясните, а зачем это вообще надо? сортировка thumbnails не спасает?
я видел два варианта (не)применения automargins: либо делаем красивую книгу с полями, либо раздельные листки разного размера, тогда авторасчёт отключен. Второй случай неинтересен, а в первом - все косяки вылезут в момент просмотра book preview. И есть ещё сортировка в thumbnails. Зачем ещё доппроверка, что за случай, когда "поля надо приплюсовать, я их приплюсовал финализацией, но они потом неконтролируемо уедут"?

Автор: sergiokapone, Отправлено:12:01 06-01-2019


Цитата:
Кстати, такие выходные размеры, кстати, тоже можно в таблицу на гипотетическую закладку №2 запихнуть.


Мысли вслух прописью
Может тогда в эту самую таблицу запихнуть побольше информации?
Это что бы ну совсем все внутри SK было, так сказать, для большей комбайнизации. А так с этим, в принципе неплохо и сторонние программы справляются, например, плагин images для Total commander



Автор: daa2013, Отправлено:16:25 07-01-2019


Цитата:
поясните, а зачем это вообще надо?

Для гарантированного исключения ситуации с разными пиксельными размерами на выходе. Увы, такое в разных ситуациях и по разным причинам, но наблюдается.


Цитата:
Такая проверка потребует выполнения расчета для всех файлов.


А зачем это считать разово ? нельзя ли это считать постоянно ?
Вот нажата кнопка Calculate book size. Посчитался размер, куда-то запомнился.
В момент расчета размера книги, насколько я понимаю, размеры страниц известны и учитываются. Т.е. это оно по сути и есть.

Далее либо в момент изменения опций на странице, которые влияют на её размер (deskew , ротации контента, зоны туда-сюда вылезают - что-то такое) идёт сверка с запомнившимся значением. Либо, когда идёт обработка и пишется графический файл - идёт такая сверка. Как только появилось отклонение - выдаётся предупреждение.

Т.е. где-то в памяти фигурирует целевое значение страницы; по числу страниц фактические значения ширины/высоты; и по числу страниц булевые да/нет (совпадает/не совпадает). Как только разошлось - варнинг, для кого не совпадает. (UPD а заодно и напоминалка "recalculate book size")

Поскольку это по своей природе таблица, то её можно и на закладку выводить. (Хотя совершенно и не обязательно).

Автор: TelecomUral, Отправлено:18:07 07-01-2019


Цитата:
Увы, такое в разных ситуациях и по разным причинам, но наблюдается

так "за руками надо следить"
и всего делов.
Это же не ответ, "по разным причинам". Вам же надо гарантию - вы и проверяйте, инструменты предоставлены.

Всё-то вы, ИМХО, мечтаете от бесплатной проги дорогущий и трудоёмкий функционал "защита от дурака" получить.

сорри за оффтоп, не сдержался. Я просто знаю, каково это - предусматривать "дебилизм" юзеров в сложном интерфейсе. На работе имею опыт с АРМами, как постановщик задач. Так извернутся, кнопки нажимая, что только диву даёшься.

Автор: TelecomUral, Отправлено:07:43 17-01-2019

Кажется, отловил мелкий баг, а может, фичу. В режиме VR Scroll image continiously работал метёлкой. Понадобилось подтереть типографскую грязь на букве, перешёл в "ластик", приблизил по Ctrl+Wheel буквы до включения сетки, почистил грязь. И решил посмотреть, как выглядит буква без фильтра улучшенного отображения. Посмотрел, а назад он не включается: кнопка воронки "нажата", а вид букв - как будто этот фильтр отключен. Переключился в метёлку, фильтр заработал.

Upd
и ещё после переключения на метёлку колёсико не работает, пока мышкой на тексте не щёлкнешь. Фокус уходит.

Автор: bolega, Отправлено:08:34 17-01-2019

TelecomUral

Цитата:
а назад он не включается

Тут и фича, и баг.
Фильтр в режиме ластика регулируется КМ > show > zoom filter in...
Но когда фильтр после отключения включается в таком режиме, СК ведет себя как будто zoom filter in выключен. Исправил.
Баг можно обойти, если при нажатии на кнопку с фильтром держать нажатым Ctrl


Добавлено:

Цитата:
и ещё после переключения на метёлку колёсико не работает, пока мышкой на тексте не щёлкнешь

не воспроизводится. либо уточните в каком режиме панелей и каком режиме редактирования

Автор: TelecomUral, Отправлено:09:15 17-01-2019


Цитата:
либо уточните в каком режиме панелей

А вот как обратно в метёлку из ластика переключаюсь в вышеописанном порядке действий.

Upd
я в деталях не запоминал, что и как делал, но действия самые обычные: либо белый цвет, либо чёрный (восстановить к.-л. линию), и размер ластика регулировал иногда (в мелкий квадратик).

Upd2
Что-то я затупил
Режим панелей - One page. Насчёт режима редактирования вопрос не понял.

Upd3
Ага, нашёл: если нажимать на кнопку переключения формы ластика, то фокус остаётся на этой кнопке.

Автор: romanef, Отправлено:16:51 17-01-2019

Всем привет

Вопрос по обрезке к фиксированным размерам книги.

Есть книга с разнообразным полезным фоном по всему полю страниц.
Поэтому автоматика кромсания ошибается. Все кромсание только вручную.
Расставлять вручную позиции резаков можно, но на каждой странице их положение надо двигать.

Есть ли такой режим, когда резаки строго зафиксированы относительно друг друга, образуя рамку, а мышкой таскать только это рамку относительно кромсаемой страницы? Это бы сильно ускорило процесс.

Возможно, есть ли такой режим кромсания в VR mode?

Автор: TelecomUral, Отправлено:19:45 17-01-2019

кажется, рамки нет, но можно парой двигать параллельные резаки. Видится так: на одном листе расставьте резаки на нужный отступ, размножьте их положение, а потом через ctrl двигайте парой горизонтальные и парой вертикальные. Два движения на один лист, вместо четырёх.
только вот - а если листы наклонены...

Автор: romanef, Отправлено:21:08 17-01-2019

Нет, спасибо, мне нужны одинаковые пиксельные размеры страниц.

Помню, когда-то камрад Astra55 выкладывал скрипт для Autoit для обрезки рамкой в Ирфане.
Если у кого сохранился, прошу в личку скинуть.

Автор: TelecomUral, Отправлено:09:55 18-01-2019

Вероятно, ещё мелкий баг: открыл VR в режиме "One page", поправил мусор метёлкой, щёлкнул на новой панельке кнопку режима "Zones", потому что часть мусора оказалась в зоне. Мне предложили сохраниться, а я отказался. Режим остался "One page", а кнопка на панельке - стала "нажата".

Автор: bolega, Отправлено:10:55 18-01-2019

romanef
Это можно сделать, но только в новой версии.
Желательно предварительно все страницы deskew-ть.
Вместо рамки используется временная picture-зона.
Делается это так: выбирается произвольный файл в списке. Все четыре резака ставятся почти вплотную друг к другу в районе центра. Затем положение резаков копируется на все страницы (диалог copy cutters state/position to...). Затем создается pic-зона размера, равного размеру необходимой рамки, тоже с центром в районе центра страницы. Зона размножается на все файлы (copy zone to clipboard + Zones > Paste zones to pages...). Затем проход по всем файлам и выставление зоны (по сути рамки) в нужную позицию. Затем нажатие новой кнопки Adjust cutters - в результате резаки выставляются строго по сторонам зоны-рамки. Когда все расставлено - удаление скопом всех зон на всех страницах (Zones > Picture zones > Delete...).
Т.е. главная фишка - в новой команде Adjust cutters: если резак стоит внутри зон, то он сдвигается на е край, если стоит извне их - ничего не делается.
Во время прохода желательно отключить фильтр отображения, чтобы быстрее двигать зону (Image > Special > No zoom filter)

Автор: TelecomUral, Отправлено:11:45 18-01-2019

На всякий случай уточню по поводу индикации locked у picture-зоны (замочка). Он перескакивает направо, если левый угол вне резака.

Автор: bolega, Отправлено:12:14 18-01-2019

TelecomUral
По замыслу он перескакивает на вершину, которая выше остальных (для полигональных зон). Или у вас наблюдаются скачки и для прямоугольных зон?
Резак никаким боком не влияет. Может влиять уход зоны за пределы сканы.

Автор: TelecomUral, Отправлено:12:40 18-01-2019

bolega
Чуть позже сегодня найду то задание, повторю.
Сейчас развлекаюсь с Floodfill Clipper зонами в VR. Шикарная вещь для бледных краёв рисунков, спасибо. Я летом Юдилевича так и не стал доделывать, не нравилось как magick-выделение белого подкусывает такие края. А сейчас освоил блокировку, так совсем другое дело.

Upd
Не могу найти то задание, где замочек прыгал.

Upd2
Извиняюсь. Я смог смоделировать странность с замочком, но это из разряда "местами неаккуратные эксперименты AAW".
Если замочек в полигональной зоне ушёл на правую вершину, и я создаю новый узел, а затем этот узел утягиваю выше правой вершины, то замочек остаётся на старом месте. Даже после выхода из Edit vertexes.
Возможно, дело в том, что зона растянута на обе половины разворота, и узел я создавал между средними резаками. Поэтому и извиняюсь. Я тогда экспериментировал с расположением зоны посредине разворота, растягивал её, чтобы понять на какой половинке разреза она останется, и проблему с замочком обнаружил случайно. Поэтому и осталось ассоциативное "что-то связанное с резаками".
Скриншот, если надо, выложу вечером.


Автор: bolega, Отправлено:13:23 18-01-2019

TelecomUral
Я кажется понял насчет перескока. Такое может быть у _внешней_ pic-зоны, если ее край уезжает за левый край редактора. Это так и задумано.

Автор: TelecomUral, Отправлено:13:26 18-01-2019


Цитата:
Такое может быть у _внешней_ pic-зоны

а! да, такое я тоже обнаруживал.

Автор: bolega, Отправлено:13:29 18-01-2019


Цитата:
Я смог смоделировать странность с замочком

А я так и не смог, замочек у меня все равно прыгает на самую верхнюю, как и положено.

Автор: TelecomUral, Отправлено:13:33 18-01-2019

bolega


там ещё и пунктир красный пропадает, выше прямоугольника зоны.

Автор: daa2013, Отправлено:17:29 19-01-2019

В ск 6.3

1
result -> show source file
включена зеленая метелка
при зажатом контроле выставляется красный прямоугольник, который ничем не снимается.

2.
Выставил раскрашенную зону. Хочу её цвет скопировать (из свойств пикчур-зоны, или из палитры вызванной в пикчур-зоне) в постеризатор. А вот фиг. (Не исключаю, что я что-то не так делаю.) Снова делал записи на бумажке.
Решения которые просматриваются:
- перетаскивание мышкой цвета с палитры на палитру.
- подсмотренное в ПикТуПик - пипетка применяется не только к изображению, но к экрану, т.е. можно ткнуть в элемент интерфейса (В палитре есть такой квадратик, где цвет показывается, так его там пипетка, вызванная из другого окна, цепляет. В СК сейчас всё блокируется.).

И это я не говорю, что могут быть переносы с разных страниц, из другого СК, и из РезалтВью в редактирование исходника через меню ШоуСорсФайл.


3. Для Image adjustments хотелось бы кнопку на панели и хоткей.

4. Наверняка вам известное: галочки "включать белый и черный в палитру" работают по-старому. Т.е. плохо. Я не знаю, как исправить. Но на уровне идей просматриваются некие чекбоксы-модификаторы их поведения: а) не трогать уже имеющиеся белый и черный. б) После постеризации принудительно назначить самый светлый - белым; самый тёмный - чёрным.

5. Я не в курсе алгоритма постеризатора, но иногда он цвет теряет. Например, я "желтый -розовый-коричневый" натягиваю на "белый-красный-черный", а он делает коричневый красным (а не черным). Исправлял волшебной заливкой. Т.е. не помешает либо чувствительность к какому-то одному цвету, либо повышенная избирательность для заданной пары цветов.

6. Уже постеризованные до 16 цветов картинки перегонял в Colr4bit, и все цвета уехали. Наверное, это нормально, так алгоритм работает. Но может стоит контроль реального числа цветов встроить ? Просто информирую, что такое было.

7. Проблема окантовок. Может, если они в 1-2 пикселя, то заранее говорить - считать их темными или светлыми и удалять.

8. При создании оут-таска галочка "открыть оут-таск" не работает, я остаюсь в старом.

9. Нельзя ли постеризованные картинки принудительно считать малоцветными зонами во внешнем задании.

10. Если мне известна палитра для постеризации, не могу ли я её применить пакетом к исходным сканам, а не вызывать по отдельности для каждой иллюстрации ?

Автор: TelecomUral, Отправлено:17:55 19-01-2019


Цитата:
Для Image adjustments хотелось бы кнопку на панели

так есть же. ручка-"клювик", 10я кнопка в новой панельке.

Автор: daa2013, Отправлено:18:45 19-01-2019

Нашёл. Через контекстное меню на панели включается 12 кнопок.

Как то для меня это было сразу неочевидно. (Только 4 включено было).




Автор: TelecomUral, Отправлено:19:04 19-01-2019


Цитата:
Нельзя ли постеризованные картинки принудительно считать малоцветными зонами во внешнем задании

вроде галочка "enable 'Low-color coding' for..." при создании out-task как раз это и делает, для зон с цветностью ниже 24бит. но я никогда не проверял, работает ли она.

Автор: bolega, Отправлено:19:22 19-01-2019

daa2013

Цитата:
1

читаем внимательно whatsnew

Цитата:
2.

читаем внимательно whatsnew

Цитата:
3.

читаем внимательно whatsnew

По поводу постеризации: проблем еще много, в смысле надежности алгоритма и наличия цветного мусора. Не стоит от меня требовать немедленного решения. Если у кого есть идеи как улучшить алгоритм - милости просим, делитесь.

Цитата:
После постеризации принудительно назначить самый светлый - белым; самый тёмный - чёрным.

Он так и делает, но есть разумный допуск на отклонение. Т.е. не самый светлый, а светлый, но не темнее...

Цитата:
Нельзя ли постеризованные картинки принудительно считать малоцветными зонами во внешнем задании.

если постеризация была проведена в RV, то нельзя. Формат файлов остается все равно 8 или 24 битным. В новой версии можно пометить все зоны, имеющие малоцвет, и присвоить им массово нужную опцию, в том числе малоцветную.


Цитата:
Если мне известна палитра для постеризации, не могу ли я её применить пакетом к исходным сканам, а не вызывать по отдельности для каждой иллюстрации

Задание палитры как опции зоны - есть в планах, но далеких.

Цитата:
вроде галочка "enable 'Low-color coding' for..." при создании out-task как раз это и делает

Галочка работает только для зон, в которых явно задано color=few-color. Но малоцветкой могут быть по факту и 24-битные зоны.

Автор: TelecomUral, Отправлено:19:42 19-01-2019

оффтоп

Цитата:
Галочка работает только для зон, в которых явно задано color=few-color. Но малоцветкой могут быть по факту и 24-битные зоны.

когда раньше уменьшал вручную число цветов, часто "зудело" добиться от СК, чтобы он по кнопке "Change color depth" не только постеризатор вызывал, но и альтернативно "указывал" что данная зона - точно теперь уже малоцветная. Например, тип зоны правил на "Low colors".

Автор: bolega, Отправлено:20:09 19-01-2019

TelecomUral

Цитата:
Более того, СК при попытке поставить пикчур-зону заново, уже в самом out-task, выдал Access Violation, которое не закрывалось (переоткрывалось постоянно).

Причину этого бага выяснил. Очень серьезный баг. Может проявиться при создании любой зоны, причем это может привести в итоге к порче всего задания (потере зон). Поэтому новой версией пользоваться нужно с осторожностью

Автор: TelecomUral, Отправлено:20:23 19-01-2019


Цитата:
Может проявиться при создании любой зоны

только в out-task? Или при обработке исходников?
А то я час назад словил какую-то ерунду с зонами, при расстановке, и слегка напрягся.

Автор: bolega, Отправлено:20:29 19-01-2019

Любой таск. Зоны могут перемешаться и в итоге потеряться.
Причем баг этот я создал практически перед самим релизом. Поспешил однако.
Вот что бывает, когда сам не занимаешься больше обработкой...

Автор: daa2013, Отправлено:20:34 19-01-2019

Расставляю раскрашенные зоны на исходные ч/б сканы из меню командой "пасте ту пажез".
Пишет: "несоответсвие типа зоны и формата страницы".

Добавлено:
Да читал я whatsnew.
1. читаем внимательно whatsnew = ничего нет про красные прямоугольники. И уж тем более, как их сбрасывать. Обратите внимание, это не RV. Это редактирование исходника: result -> show source file
2. читаем внимательно whatsnew - дайте алгоритм действий по копированию двух цветов текст/фон из раскрашенной зоны в постеризатор. Сохранить палитру, запущенную из свойств зоны, СК не даёт; мышкой цвет не цепляется. (Допускаю, что некий путь есть, но я его не нащупываю.)
3. хоткей тоже нужен. Что кнопки отключены и включаются через км панели там не написано. В опциях RV включения также нет.


Цитата:
Он так и делает, но есть разумный допуск на отклонение. Т.е. не самый светлый, а светлый, но не темнее...

Значит, сделайте галочку на отключение этого допуска. Ни разу чистого черного/белого по этой команде не получал.

Автор: TelecomUral, Отправлено:21:03 19-01-2019


Цитата:
читаем внимательно whatsnew = ничего нет про красные прямоугольники

а это часом не floodfill clipper? как раз они красные. удаляются через КМ Special... Delete all floodfill clippers


Добавлено:

Цитата:
дайте алгоритм действий по копированию двух цветов текст/фон из раскрашенной зоны в постеризатор

ПКМ на цвете.

Автор: daa2013, Отправлено:21:30 19-01-2019

Да. Вроде и то и другое сработало.

Автор: TelecomUral, Отправлено:21:51 19-01-2019


Цитата:
Например, я "желтый -розовый-коричневый" натягиваю на "белый-красный-черный", а он делает коричневый красным (а не черным). Исправлял волшебной заливкой.

я такие вещи делал в два этапа: сначала составлял пипеткой набор реальных цветов, постеризовал картинку. а затем составлял в правой половине комбинации "что на что исправить". Мышкой таскал цвета из палитры. получается быстро и точно. конечные цвета добавлял в палитру по кнопке "выбрать цвет вручную", там же, где пипетка.

Добавлено:
bolega
Пока с вопросом о копировании цвета разбирался, поймал по ПКМ на окошке палитры, вызванной из зоны, сообщение "List of bounds(0)", или что-то подобное. И пришлось по Cancel из свойств зоны выходить. Мышка превратилась в прозрачный контур "перечеркнутый круг".

Автор: daa2013, Отправлено:05:01 20-01-2019


Цитата:
Расставляю раскрашенные зоны на исходные ч/б сканы из меню командой "пасте ту пажез".
Пишет: "несоответсвие типа зоны и формата страницы".

там на самом деле каквя-то более глубокая проблема. так кк при обработке все страницы после той, на которой пасте пажез делал, забились копиями этой самой страницы. Пришлось весь проект выкинуть.

Update: и 6/00/5 такое творит. При копировании раскрашенной зоны на ч.б страницы пакетом (меню копи ту пажез) говорит о несоответствии. С обработкой только не лажает. После постраничной расстановки руками нормально делает.


Добавлено:
про floodfill clippers
если верить whatsnew, они должны ставиться при контрол+шифт
а у меня-то они ставятся просто при контрол на маусапе. (зелёной метелке)
и постоянно приходится отвлекаться на их удаление.

Кстати, то, что они красные прямоугольные рамки, в вотснью не написано. И как я должен был догадаться, что это они ?
Вообще стоит их расстановку отключать через опции, чтобы не мешали.


Добавлено:

Цитата:
Если у кого есть идеи как улучшить алгоритм - милости просим, делитесь.

Уже после постеризации, взять один из чистых цветов как битмап, те ч.б и применить к нему деспекл. Затем второй цвет ... При сборке битмапов обратно при наложении цветных пикселей руководствоваться иерархией замен в постеризаторе.

Автор: bolega, Отправлено:09:03 20-01-2019

daa2013

Цитата:
Вообще стоит их расстановку отключать через опции, чтобы не мешали.

ОК, исправлю.
А зачем вы держите нажатым ctrl при метелке. Что это дает?
Я понимаю если shift, чтобы временно включить режим красной метелки


Добавлено:
daa2013

Цитата:
при обработке все страницы после той, на которой пасте пажез делал, забились копиями этой самой страницы

странно. не понял, забились копиями обработанной страницы или копиями обработанной зоны?
если страницами, то по коду такого в принципе не может быть. зоны никаким боком не влияют на сами страницы.

Автор: daa2013, Отправлено:09:38 20-01-2019

1.
У меня на контроле висит:
ctrl+1,ctrl+2,ctrl+3 - переключение цветов
ctrl+z отмена
ctrl+q у меня пасте

и поэтому я почти постоянно при чистке держу контрол, так как все время переключаюсь.

2.
Кроме того у меня микс из ч/б и цветных страниц, так как я мерже постеризованных зон делаю и получается, что я иногда на цветных пытаюсь запустить
ctrl+зеленая метелка, которые работают на затягивание белых дырок. (При большом увеличении не вижу - цветной или ч/б картинка, так как при пролистывании вижу только ч/б участки, а цветные где-то по бокам.) Точно также происходит при переключении между цветной зоной и ч/б подложкой.

3.
А шифтом я почти и не пользуюсь. Единственное ctrl+shift+клик.
Но и тут иногда рука едет и снова - клиппер встаёт.

Лучше на ктрл+зеленая метелка затягивание дырок в цветных сканах подвязать.
(конвертировать участок в ч+б, затянуть дырки, конвертировать обратно).

Автор: TelecomUral, Отправлено:09:44 20-01-2019


Цитата:
что они красные прямоугольные рамки, в вотснью не написано

я и лассо их ставил.
красная линия - "ограничитель", ИМХО, нормально.

Автор: daa2013, Отправлено:09:45 20-01-2019


Цитата:
странно. не понял, забились копиями обработанной страницы или копиями обработанной зоны?

Копиями страницы !
Т.е. зоны в паке out правильные, расставленные (скопированные) руками. А вот в качестве подложки на страницах 3-48 везде в папке out страница 3.
Причем там, где стоят зоны, прямоугольнички вырезаны в соответствии с заданием. (Т.е.не как на 3, а как на 4-48 эти зоны стоят.)

Добавлено:

Цитата:
я и лассо их ставил.
красная линия - "ограничитель", ИМХО, нормально.

Дло не в цвете прямоугольничка. По вотснью нужен ктрл+шифт для их установки. А у меня при только контроле они ставятся.

Автор: TelecomUral, Отправлено:09:52 20-01-2019


Цитата:
Но и тут иногда рука едет и снова - клиппер встаёт

может, включить его в Undo ?

Автор: bolega, Отправлено:12:07 20-01-2019

daa2013
Похоже, что баг с одинаковыми страницами - это последствие серьезного бага связанного с зонами, о котором я недавно писал. Т.е. связано это не с пасте пажез (там как раз таких последствий бы не было), а именно с _ручной_ вставкой зоны из кармана.
Я легко воспроизвел баг в 6.3.
В текущей версии его уже нет. Сегодня выдам тестерам новую версию 6.4, а то с 6.3 стало опасно работать. Тем более в 6.4 есть полезные новшества, особенно связанные с импортом pdf и созданием djvu.
Спасибо всем, кто взял на себя нелегкий труд тестировать СК!

Добавлено:
Переименовал clipper в limiter. Так правильнее

Автор: TelecomUral, Отправлено:05:06 21-01-2019


Цитата:
выдам тестерам новую версию 6.4

не скомпилировали?

Пользуюсь с утра 6.2, вспомнил что иконки зон в режиме Zones не обновляются после сохранения зоны. Потом бывает трудно искать в их перечне именно ту, что нужна повторно.

Автор: romanef, Отправлено:13:17 21-01-2019

c нетерпением ждем релиз!

Автор: sergiokapone, Отправлено:05:23 22-01-2019

Как можно обработать такое?


Градиентная заливка, к сожалению, заходит внутрь белых букв.

Задание sub-task
https://www.upload.ee/files/9457222/_test.zip.html

Автор: daa2013, Отправлено:06:58 22-01-2019

Я бы так делал

https://dropmefiles.com/WTbxr

(Белые буквы:
поставить ч/б пикчур зону, инвертировать, почистить, задать прозрачность белого через зеро-транспарент, инвертировать обратно)

Автор: TelecomUral, Отправлено:07:04 22-01-2019

bolega
Возможно ли сейчас сделать Merge для внешних зон? Что-то у меня не вышло вчера в 6.2. В основном задании.

Автор: bolega, Отправлено:08:03 22-01-2019

TelecomUral
Конечно можно. Обработку задания сделали после добавления внешних зон?

Автор: TelecomUral, Отправлено:08:07 22-01-2019

bolega
Чёрт, нет. Поставил зону и сделал merge.

Автор: bolega, Отправлено:08:21 22-01-2019

sergiokapone
Переключаетесь в режим зон. Щелкаете мышкой Ctrl-Shift-Click внутри букв, чтобы выделить внутренность. КМ - Special - White transparent. Причем можно сначала нащелкать, потом один раз задать прозрачность.
Никаких инвертирований как предлагает daa2013 не надо.
У двух букв есть разрыв в контуре, вот тут и пригодится limiter. Поставить их на месте разрыва перед тем как выделять, чтобы выделение не вышло за пределы внутренности буквы.

Автор: TelecomUral, Отправлено:08:23 22-01-2019

bolega
у меня там был косячок, заметил поздно: одну зону не наложил куда следует. На однотипные участки скана. Обнаружил уже когда внешний вид страницы с оригиналом сравнивал, а это было после того как в VR зоны подчистил, цвета выправил. Подумал что раз зоны идентичные, можно влепить на скан внешнюю из файла уже имеющихся.
Бум знать.

---
в 6.4 кнопочки в визарде дежавю справа сверху торчат, какое-то доп.окошко без фактического наполнения. "EITabSheet4".
К слову, нетривиально зоны (step3) в визарде обрабатываются по новой кнопке. Я пока допёр - вспотел

---
ещё вопрос на понимание: если зона "few colors", то как будет отрабатываться раскраска Paint? Мне не удалось пока что получить в визарде дежавюшку с крашеным слоем, хоть ставь прозрачность, хоть не ставь. Это я пытаюсь обучиться по вотснью теме про учёт прозрачности ("при создании djvu учитывается текущее значение опции picture-зон transparent"). в MV раскраска видна, а дежавю её игнорит.

Автор: bolega, Отправлено:08:29 22-01-2019

TelecomUral
Я же уже говорил. Зону поставили, но СК должен как минимум рассчитать ее положение на выходе, а если разворот, то еще и определить, к какой половинке зону прикрепить на выходе. Не говоря уже о том, что у зоны могут быть заданы какие-нибудь опции.

Автор: TelecomUral, Отправлено:08:35 22-01-2019

bolega

Цитата:
СК должен как минимум рассчитать ее положение на выходе

да, я усвою постепенно, как это устроено. извините.

Автор: bolega, Отправлено:08:49 22-01-2019

TelecomUral

Цитата:
Подумал что раз зоны идентичные, можно влепить на скан внешнюю из файла уже имеющихся.

Зоны можно не обрабатывать, если это окончательное задание для создания djvu/Pdf. А для merge нужно обязательно.


Цитата:
ещё вопрос на понимание: если зона "few colors", то как будет отрабатываться раскраска Paint?

Самую мозоль раскопали
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.
В общем, сейчас для таких зон раскраска фона не выполняется (игнорируется), а вот "текст" красится.
И еще раз повторю: белый фон для малоцветных зон - это тоже цвет, который будет закрывать собой то, что под ним. Если нужно, чтобы не закрывал, достаточно включить в зоне опцию transparent.

Автор: daa2013, Отправлено:09:13 22-01-2019


Цитата:
sergiokapone
Переключаетесь в режим зон. Щелкаете мышкой Ctrl-Shift-Click внутри букв, чтобы выделить внутренность. КМ - Special - White transparent. Причем можно сначала нащелкать, потом один раз задать прозрачность.
Никаких инвертирований как предлагает daa2013 не надо.
У двух букв есть разрыв в контуре, вот тут и пригодится limiter. Поставить их на месте разрыва перед тем как выделять, чтобы выделение не вышло за пределы внутренности буквы.


Увы, но так не получится. Там со страшной силой просвечивает текст с задней стороны обложки, а бэкграундклинер зачищает дизерный градиент.
Поэтому приходится раскрашенной зоной делать свой градиент, на неё отдельно накладывать черные контуры и обустраивать прозрачность. Тут у меня 4 зоны (градиент, рамки букв, черный текст, + беленькое с маской прозрачности).

Добавлено:

Цитата:
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.

Я сильно удивился, когда в 6.3. Paint сработал для цветной зоны. Чистых (цветов там было три, но тип был Original), а она в итоге при создании джву стала двухцветной.
Если цветные красятся, то и малоцветные по идее должны красится.
Ну например у меня один комплект пар цветов, а на выходе я хочу получить другой - я просто включаю им Paint.
Т.е. реальные цвета - это одно, а включённая раскраска - это другое.

Я даже не думал, что может быть по другому.

Автор: bolega, Отправлено:09:29 22-01-2019

daa2013

Цитата:
Увы, но так не получится

Я открыл его задание (там уже все бинаризовано, оставшийся мусор был убран и ничего не просвечивает, откуда вы это взяли??) и добавил прозрачность. Все получилось.
А просвечивающий фон был убран автоматом еще во время обработки фильтром background substract

Автор: daa2013, Отправлено:09:37 22-01-2019

Упс. Получается, я что-то не то и не так открывал.
(Судя по всему, наложил клинер и попортил его задание, а потом сразу стал джву и пдф делать)
Действительно, всё ОК там.

Автор: TelecomUral, Отправлено:10:22 22-01-2019

daa2013
bolega

Цитата:
Если цветные красятся, то и малоцветные по идее должны красится

Да не факт. Я потому и стал пробовать на малоцветке, что это малоцветка, то есть специально созданная под конкретные цвета зона (а не как тот градиентный "эллипсоидный конус" с просвечиванием, что я в своей статейке про зоны показывал). На таких сложных примерах понимаешь быстрее, что к чему и как устроено внутри.
Только уж тогда логично блокировать галочки раскраски, которые не будут использоваться в визарде и pdf-ке.

Автор: bolega, Отправлено:10:59 22-01-2019

Чего еще не доделано в 6.4:
- не решен вопрос перекрытия few-color зон с раскрашенными зонами, да и просто с имеющимся на странице текстом (т.е. тоже передним слоем).
- при импорте из Pdf страниц, в которых картинка (зона) развернута на +-90/180 градусов относительно медиа. Т.е. картинка хранится внутри pdf в портрете, а выводится на страницу ландшафтно или вверх ногами (такое мне встречалось). И это не то же самое, что поворот всей страницы со всем содержимым (с этим в СК все в порядке).

Автор: sergiokapone, Отправлено:11:18 22-01-2019

bolega, daa2013 спасибо!

bolega, ловлю какой-то баг с tesseract-OCR


Вылет появился, когда я выбрал язык Ukrainian







Автор: bolega, Отправлено:11:22 22-01-2019

sergiokapone
Используйте только ту версию dll, которую я когда-то выкладывал. Другие версии не совместимы.
А в какой момент это вылазит, в процессе обработки?

Автор: sergiokapone, Отправлено:11:27 22-01-2019

bolega, вылет появился, когда я выбрал язык Ukrainian, с Russian распознает без вылетов.


Цитата:
А в какой момент это вылазит, в процессе обработки?

Это уже после обработки, когда я захожу в MW Result->OCR


Добавлено:
ukr.traineddata брал здесь https://github.com/UB-Mannheim/tesseract/wiki
ocr.dll у меня с незапамятных времен 3 074 048 байт 2014 года

Автор: bolega, Отправлено:11:52 22-01-2019

tessdata тоже нужно от старой версии, 3.03
Возможно, подойдут это:
https://github.com/tesseract-ocr/tessdata/tree/3.04.00


Автор: sergiokapone, Отправлено:12:12 22-01-2019


Цитата:
Я до сих пор не решил, что делать с раскраской зоны с опцией "few colors".  
С одной стороны можно раскрашивать для универсальности, с другой стороны - ее ведь и так готовили с нужным набором цветов, зачем же их менять на этой стадии.  


А если на малоцветку нужно будет наложить градиентную заливку, например, как для B/W?

Добавлено:

Цитата:
Чего еще не доделано в 6.4:
- не решен вопрос перекрытия few-color зон с раскрашенными зонами, да и просто с имеющимся на странице текстом (т.е. тоже передним слоем).


А вот, только заметил пост, вопрос снимаю.

Автор: sergiokapone, Отправлено:17:54 22-01-2019


Цитата:
tessdata тоже нужно от старой версии, 3.03
Возможно, подойдут это:
https://github.com/tesseract-ocr/tessdata/tree/3.04.00


Да, подошло. Спасибо.

Автор: romanef, Отправлено:19:03 22-01-2019

bolega

А не могли бы Вы записать ролик по обработке "сложной" книги с рисунками на примере нескольких страниц?

Приятно смотреть на работу Мастера.


Автор: bolega, Отправлено:21:03 22-01-2019

romanef
Фильм про то, как я ставлю резаки и расставляю зоны? Фигня это. Дело не в мастерстве, а в отношении к процессу, в том, сколько человек готов потратить своего свободного времени и сил.

Добавлено:

Цитата:
Приятно смотреть на работу

Согласен, смотреть как работают другие, всегда приятно

Автор: romanef, Отправлено:21:42 22-01-2019

самое интересное - обработка зон (малоцвет/полноцвет) с раскрытием имеющегося инструментария СК.
акцент на слове "Мастер"
фильм-то учебный

PS. Как стать тестером новых версий?

Автор: useretail, Отправлено:21:46 22-01-2019

В чем отличия от ScanTailor?

Автор: sergiokapone, Отправлено:21:55 22-01-2019


Цитата:
В чем отличия от ScanTailor?

Google и интернет в помощь. Поставьте обе программы, поюзайте, это будет лучше тысячи слов.

Автор: TelecomUral, Отправлено:04:15 23-01-2019

sergiokapone
daa2013 составил и внёс в последнюю Хрестоматию по СК отличия между известными программами сканобработки.

Автор: sergiokapone, Отправлено:08:43 23-01-2019


Цитата:
В чем отличия от ScanTailor?


Если появляются вопросы, вот еще ролик по SK от daa из шапки.

Автор: daa2013, Отправлено:15:10 23-01-2019

del

Автор: sergiokapone, Отправлено:15:42 23-01-2019

bolega,
будет ли в возможность внедрять распознанный tesseract-ом текст в djvu?

Автор: bolega, Отправлено:16:42 23-01-2019

sergiokapone
Никогда о таком не думал

Автор: sergiokapone, Отправлено:19:39 23-01-2019

bolega,
для интереса погонял последнюю версию tesseract, вполне нормально распознает, удивлен, думал будет хуже.

А файлы SK .tocr можно переконвертировать в txt, интересно глянуть как там прошло распознание?

Автор: shch_vg, Отправлено:22:34 23-01-2019

bolega
Очень не хватает среди хоткеев VR "Show/hide zone", т.к. часто приходится чистить под зонами.

Автор: useretail, Отправлено:04:07 24-01-2019

bolega
А ее можно собрать на lazarus для линукса?

Автор: daa2013, Отправлено:05:55 24-01-2019

панель глифов при ширине 6 глифов и более встаёт неправильно (зарезает 6-й).
При 5 нормально.

Автор: daa2013, Отправлено:09:56 24-01-2019

После задействования хоткея отмены ctrl+z перестает работать назначенный хоткей вставки (пасте) ctrl+q (глиф улетает, точнее ставится в одно и то же неправильное место, как будто там курсор залип). После вставки через контекстное меню (и там он ставится правильно) работоспособность хоткея восстанавливается.

Автор: bolega, Отправлено:13:46 24-01-2019

shch_vg

Цитата:
Очень не хватает среди хоткеев VR "Show/hide zone",

Не хватает - назначьте, он называется Toggle zones visibility

Автор: daa2013, Отправлено:16:30 24-01-2019

1.
Чтобы сохранить таблицу глифов, приходится выходить в гланвое окно и сохранять таск.
Может это можно из RV как-то делать (команду в км добавить) ?
Также в принципе известно, что можно руками перекопировать файлик *.skgl. Но может также как и с палитрами можно заставить их открывать, импортировать, сохранять с другим названием, перетаскивать закладки ?


Добавлено:


2.

Цитата:
- будет ли в возможность внедрять распознанный tesseract-ом текст в djvu?
- Никогда о таком не думал

Я уже как-то писал, что если такое будет, то следующий шаг - это заменить все распознанные буквы на их "идеальные" варианты из таблицы глифов методом автопозиционирования в распознанной тессерактом ячейке буквы.
Для этого, как в инфиксе нужно будет каждому глифу сопоставить букву (вбить правильную букву алфавита в ячейку под ним)

Автор: sergiokapone, Отправлено:17:28 24-01-2019


Цитата:
Я уже как-то писал, что если такое будет, то следующий шаг - это заменить все распознанные буквы на их "идеальные" варианты из таблицы глифов методом автопозиционирования в распознанной тессерактом ячейке буквы.


Да, тогда процесс обработки выйдет на качественно новый уровень. Круче будет даже чем ClearScan в pdf. Эволюция...


Цитата:
Жители Москвы, стеснённые жилищным кризисом, бросятся в ваш великолепный город. Столица автоматически переходит в Васюки. Сюда переезжает правительство. Васюки переименовываются в Нью-Москву, а Москва — в Старые Васюки. Ленинградцы и харьковчане скрежещут зубами, но ничего не могут поделать. Нью-Москва становится элегантнейшим центром Европы, а скоро и всего мира.


Но может это все же и возможно

Автор: shch_vg, Отправлено:23:41 24-01-2019

bolega

Цитата:
Не хватает - назначьте, он называется Toggle zones visibility

Это ж надо, никогда бы не догадался.
Искал по аналогии с "Show/hide glyphs panel".
В связи с этим, м.б. все такие хоткеи сделать либо Toggle ..., либо Show/hide ...
Заодно вопрос, зачем кроме вышеупомянутого хоткея (Show/hide glyphs panel) еще и просто "Show glyphs panel"?

Автор: bolega, Отправлено:09:37 25-01-2019

shch_vg

Цитата:
В связи с этим, м.б. все такие хоткеи сделать либо Toggle ..., либо Show/hide ...

А какой вариант лучше оставить?

sergiokapone
daa2013

Цитата:
заменить все распознанные буквы на их "идеальные" варианты из таблицы глифов

Ага. А плохо распознанные вообще затереть чтобы картинку идеальную не портили.
Если серьезно, то этим я заниматься не буду. Там минусов больше чем плюсов: нет контроля базовой линии, ошибки распознавания, наклонные/жирные шрифты, разные семейства шрифтов и т.п. Я не уверен, что tesseract все это отдает. Текст он хорошо распознает, а вот правильно ли он детектирует шрифты и их размеры, большой вопрос.

Автор: sergiokapone, Отправлено:09:39 25-01-2019

bolega, pdf-импорт
затягиваю в SK файл https://yadi.sk/i/hpEQUg9UWUON8w
все картинки помещаются в зоны, а вот текст куда-то пропадает.

Автор: TelecomUral, Отправлено:09:49 25-01-2019


Цитата:
А какой вариант лучше оставить?

ой... а может, не надо править имена... Там так хорошо делилось на "show" для инструментов и "toggle" для режимов/процессов. Я когда-то давно это уяснил и влёгкую стал находить нужные хоткеи в списке.

Автор: daa2013, Отправлено:09:54 25-01-2019


Цитата:
Там минусов больше чем плюсов: нет контроля базовой линии, ошибки распознавания, наклонные/жирные шрифты, разные семейства шрифтов и т.п. Я не уверен, что tesseract все это отдает. Текст он хорошо распознает, а вот правильно ли он детектирует шрифты и их размеры, большой вопрос.


При ручном контроле за шрифтами. Например такие замены делать только для текущей закладки глифов и в выделенной пользователем на основном изображении участке. И только те буквы, которые на этой закладке есть.
Автозамена позиционирует в 99.9% случаях верно. Тессеракт опознает главное - ячейку, где она стоит, и саму букву. Базовая линия тут вообще не нужна. За разные шрифты согласен, но тут пользователь может руками выделить участок, где шрифт един.И переключиться на ту закладку глифов, где этот шрифт собран.

Да даже если по словам, а не по абзацам так делать - ускорение чистки на порядок. Уходят действия по выбору букв и их расстановке.

Автор: TelecomUral, Отправлено:10:06 25-01-2019

daa2013
проще перенабрать книгу на основе тессеракта, чем так утончённо работать со сканом.

Автор: daa2013, Отправлено:10:13 25-01-2019

Мне не надо всю книгу, мне надо плохой участок.

Автор: TelecomUral, Отправлено:10:19 25-01-2019

daa2013
я про плохой участок и говорю. У вас будут скрытые ручные действия, bolega, на мой взгляд, верно отмечает - плохие распознавания и т.п. Если уж человек опознаёт участок как "плохой", то автоматика и подавно споткнётся. Овчинка выделки не будет стоить.

Upd
Сейчас ведь хорошо налажено: сканы публикуются чистенькие насколько возможно, и под них подкладывается распознанный слой. Его-то и можно отдельно выправить перед подкладыванием.

Автор: bolega, Отправлено:10:31 25-01-2019

sergiokapone

Цитата:
вот текст куда-то пропадает

СК не импортирует векторный текст, только картинки.
Растеризация текста - это отдельная история, за которую даже браться не хочу. Все-таки СК нужен для обработки сканов, а смысла дербанить идеальный векторный шрифт нет никакого. Вот картинки из pdf достать куда ни шло, мало ли понадобятся.

Добавлено:
daa2013

Цитата:
Тессеракт опознает главное - ячейку, где она стоит, и саму букву.

Ну можно будет попробовать как-нибудь. Кстати, именно так я и планировал бороться с самым ужасным злом - марашками. Но все руки не дойдут.

Добавлено:
В 6.4 сам нашел 2 бага.
В djvu-визарде неправильно копируются индивидуальные опции по команде copy state. А также намудрил при расщеплении блитов в случае контактирующих цветов в раскрашенных зонах. Оптимизировал эту фичу и привнес ошибку. Но она проявляется явно, путем выдачи диагностического сообщения при кодировании, в лог тоже пишется о неудаче, так что незаметно это не пройдет.

Автор: shch_vg, Отправлено:14:57 25-01-2019

TelecomUral

Цитата:
ой... а может, не надо править имена... Там так хорошо делилось на "show" для инструментов и "toggle" для режимов/процессов. Я когда-то давно это уяснил и влёгкую стал находить нужные хоткеи в списке.

Ключевое место здесь "когда-то давно это уяснил". Я вот не уяснил и тыкался с этим. В Вашем варианте есть одно лишнее звено - понимание, это инструмент или режим/процесс (Увы, для меня определить это не так просто), и лишь потом поиск нужного хоткея. Проще унифицировать и сразу его искать, не заморачиваясь.

bolega
Лично для меня понятнее "Show/hide".

Кстати, у меня висели в 6.00.5 хоткеи на fit height и fit width.
Поместил 6.4 в ту же директорию и обнаружил, что хоткей fit height в новой версии на месте, а хоткей fit width оказался пустым. Свою комбинацию нашел на хоткее Toggle fit width, что не есть хорошо, т.к. по этому хоткею не только происходит переключение, но и простановка галочки в ниспадающем меню лупы+, чего я избегал, присваивая хоткеи.
Удалил в 6.4 Toggle fit width и активировал fit width, но в 6.00.5 этот хоткей (fit width) так и остался неактивированным.

Автор: daa2013, Отправлено:15:50 25-01-2019

в окне RV
не ставятся вторые цифры 1 2 3 в окне "допустимое отклонение чистящего цвета", вместо этого переключается цвет заливки. Т.е. он реагирует как если бы контрол был зажат, а он не зажат. Попробуйте набрать 11, 22, 33.



Добавлено:
Сбросил все опции 4-ё маркировочной, установил зону во всю станицу, нажал процесс.
В RV пишет, что зона на пиксель меньше основной страницы и по вертикали и по горизонтали

Автор: shch_vg, Отправлено:16:39 25-01-2019

bolega
spt привязано к 6.00.5.
Делаю в 6.4 sub-task на выделенные сканы, каковой стартует в СК 6.4.
В этом СК делаю out-task для дежавю с галкой в open out task in new window, каковой стартует в 6.00.5. Почему не как в случае с sub-task?

Автор: daa2013, Отправлено:16:41 25-01-2019

Это потому что у вас оба в одной папке.
У меня 6.4. лежит отдельно, так там оут в этом случае просто не стартует, о чем я уже тут писал.

Автор: shch_vg, Отправлено:19:43 25-01-2019

daa2013
Не вижу смысла разводить их по разным папкам, если это не противопоказано для идеологии самой программы.

Добавлено:
daa2013

Цитата:
У меня 6.4. лежит отдельно, так там оут в этом случае просто не стартует, о чем я уже тут писал.

Поместил 6.4 в отдельную директорию, вызвал задание, сделал саб-таск, затем в нем оут-таск, который нормально стартовал.

Автор: shch_vg, Отправлено:14:04 26-01-2019

bolega
Обратил сейчас внимание на такое событие, которое наблюдается как в 6.00.5, так в 6.4. Перетаскиваю из библиотеки глифов фрагмент, который помещается в то место, где в момент опускания находится мышь. Если же перед перетаскиванием я создам маленькую прямоугольную область на принимающем скане, то куда бы я не перетащил фрагмент, он появится не там, где в этот момент находится мышь, а там, где была создана прямоугольная область.
Это так и задумано?
Дело в том, что иногда, нажимая клавишу мыши, непроизвольно дергаешь ее, создавая практически незаметную прямоугольную область, а затем удивляешься, почему фрагмент появляется не в том месте, где сейчас находится мышь.

Автор: bolega, Отправлено:14:32 26-01-2019

shch_vg

Цитата:
Это так и задумано?

Да. И это связано вообще со вставкой из кармана. Если есть выделение - вставляется в его верхний угол.

Цитата:
непроизвольно дергаешь ее

Прошу всех более не просить меня подстраивать СК под "закидоны" пользователей. Ну чес слово, смешно. У одного рука дергается, у другого ногу сводит, третий юзает полудохлую мышку и хочет, чтобы СК за него ее кнопки нажимал, четвертый, извините, громко пукает, и ему надо чтобы в этот момент СК заглушал это и т.д. и т.п.


Автор: Olexiy71, Отправлено:01:42 27-01-2019

Есть такое задание:
имеется книга, в ней всего два цвета черный и красный. То есть основной текст чёрный а комментарии в скобках красным текстом. Вопрос к знатокам - по какому алгоритму это безобразие обработать, чтобы хорошо получилось?

Автор: sergiokapone, Отправлено:09:58 27-01-2019

Olexiy71

Про такие вопросы иногда злобно отшучиваются "телепаты в отпуске".
Вы как хотите увидеть алгоритм, в виде блок-схемы?

Давайте sub-task, или парочку типичных страниц для примера, тогда можно будет уже что-то отвечать.

Автор: daa2013, Отправлено:13:19 27-01-2019

Меня смутил пункт whats new для 6.4. про опцию "Do not check dpi equality", так как у меня всё в 600 дпи. Нового проекта у меня пока нет, я на уже обработанных попробовал. И всё повторилось. Зона пачкой не копируется, при постраничном копировании руками выход забивается копиями основной страницы. Прилагаю субтаск.
Здесь на 4-й странице стоит раскрашенная зона. Если попытаться её скопировать на все последующие, то пасте пажес даст мисматч и не сделает. Если скопировать руками, то после обработки появятся дубли.

https://yadi.sk/d/HoZhWsHdLtIWyA

PS
кстати, а почему в *.spt заголовок 6.2 ???

Добавлено:

Цитата:
третий юзает полудохлую мышку и хочет, чтобы СК за него ее кнопки нажимал,

Хоткей на ПКМ - это супер-пупер классная идея, а не закидон. На ноутбуке с трекболом/тачпадом пробовали ск юзать ? Это же старый принцип, и в старых виндовых прогах всегда так было: на всякий пожарный сделать так, чтобы всё можно было с клавы реализовать без мышки. (И наоборот, кстати, тоже.) Отрубилась мышь - значит врубить режим, чтобы стрелки перемещали курсор. и т.п. Пусть медленно и неудобно, но всегда есть возможность выкрутиться.


Цитата:
чтобы в этот момент СК заглушал это и т.д.

Внедрите в опции звуки на события. Та же тревожная кнопка, например, может не просто загораться, а одновременно какое-нибудь дын-дын-дын выдавать.

Автор: bolega, Отправлено:22:35 27-01-2019

daa2013

Цитата:
при постраничном копировании руками выход забивается копиями основной страницы. Прилагаю субтаск.

Не смог воспроизвести на вашем примере. Может все-таки у вас запустился экземпляр СК от предыдущей версии?


Цитата:
почему в *.spt заголовок 6.2

У файлов нумерация своя.


Цитата:
Хоткей на ПКМ - это супер-пупер классная идея

ОК


Цитата:
Внедрите в опции звуки на события

Это есть в планах.



Автор: daa2013, Отправлено:23:28 27-01-2019

Запускал я 6.4, по команде меню About он пишет 6.4., в заголовке окна тоже написано Version 6.4, но я так вас понимаю, что при всём этом может исполняться и другая версия.
А как тогда точно проверить ? (UPD Под WinXP я могу ProcMon из wininternals задействовать, тем более что я хотел вызовы отследить, что вместо cpaldjvu задействовано)

У меня воспроизводится и на Win7, и на WinXP. Скачал сейчас свой же субтаск.
Порядок действий после открытия субтаска:
- иду на файл 4
- кликаю по зоне мышкой, вижу грипы
- через км копи зоне ту клипборд
- иду на пятую, делаю пасте зонес через км
- иду на шестую, делаю пасте зонес через км
- запускаю кнопку процесс с панели команд
- получаю дубли на 5, 6 (любые страницы, где делал пасте)

А мисматч на команде пасте ту пажес наблюдали ?

Автор: sergiokapone, Отправлено:23:42 27-01-2019

daa2013


Цитата:

У меня воспроизводится и на Win7, и на WinXP. Скачал сейчас свой же субтаск.
Порядок действий после открытия субтаска:
- иду на файл 4
- кликаю по зоне мышкой, вижу грипы
- через км копи зоне ту клипборд
- иду на пятую, делаю пасте  зонес через км
- иду на шестую, делаю пасте  зонес через км
- запускаю кнопку процесс с панели команд
- получаю дубли на 5, 6 (любые страницы, где делал пасте)
 
А мисматч на команде пасте ту пажес наблюдали ?


Сделал по Вашему алгоритму, на Win 8.1 все ок, никаких дублей

Мисиматчи получил при paste zone to pages



Автор: daa2013, Отправлено:23:50 27-01-2019



Цитата:
Сделал по Вашему алгоритму, на Win 8.1 все ок, никаких дублей и мисиматчей

Так как это обсуждалось несколько ранее, я в порядке действия этого не указывал.
После копирования зоны через км надо вызвать из меню Zones - > Paste zones to pages

Автор: sergiokapone, Отправлено:23:54 27-01-2019

Я получил мисиматчи, но пока свой пред пост изменял, вы успели ответить

Автор: daa2013, Отправлено:00:16 28-01-2019

надо запускать процесс все страницы.
Если обработать одну страницу (через меню - Process - Current file), то нормально.

Автор: bolega, Отправлено:08:04 28-01-2019

daa2013
мисиматчи получил.
Я совсем запутался, вы в какой момент запускали Paste zones to pages, до или после мисиматч. А если делать пасте вручную, без вызова Paste zones to pages, баг остается? Я просто не пойму, баг из-за Paste zones to pages или из-за ручной вставки.
У меня никак не воспроизводится.


Добавлено:

Цитата:
А как тогда точно проверить ?

Я на всякий случай спросил, т.к. намедни обсуждалось поведение, когда в одной папке сразу несколько версий СК. При обработке одна версия используется, при запуске out-task может уже другая (та, к которой привязан spt)

Добавлено:
Ага, нашел. В настройках СК отключил использование более одного ядра при обработке и баг воспроизвелся. При обработке в нескольких потоков баг не проявлялся.

Автор: daa2013, Отправлено:08:56 28-01-2019


Цитата:
вы в какой момент запускали Paste zones to pages, до или после мисиматч.

Если я копирую зону, делаю пасте ту пажес, то я наблюдаю сообщение о мисматч.


Цитата:
т.к. намедни обсуждалось поведение, когда в одной папке сразу несколько версий СК. При обработке одна версия используется, при запуске out-task может уже другая (та, к которой привязан spt)

нет, у меня всё отдельно стоит



Цитата:
Я просто не пойму, баг из-за Paste zones to pages или из-за ручной вставки.


Я так понимаю, что это две разные ошибки, хотя имеющие схожую природу.
Ошибка с дублями воспроизводится вне зависимости от того, делал или нет я перед этим пасте ту пажес.

Я скачиваю субтаск на новой машине, делаю указанные действия и получаю дубли.

Вот вообще с нуля, с загрузки этих 10 файликов из субтаска вместо его открытия:


Запускаю 6.4
Файл - Оупен имажес
4-я маркировочная кнопка
иду на 4 файл
создаю раскрашенную зону (синий текст) на колонтитуле
копирую зону через км в клипборд
иду (через список) на 5 стр и вставляю на 5-ю
процесс все
= 4 и 5 страницы дубли

АПДЕЙТ


Цитата:
Ага, нашел. В настройках СК отключил использование более одного ядра при обработке и баг воспроизвелся. При обработке в нескольких потоков баг не проявлялся.


Ага, увидел, что вы добавили.
А с ошибкой ctr+z разобрались ?

Автор: TelecomUral, Отправлено:15:20 28-01-2019

bolega
показ floodfill limiter: наблюдаю отрисовку этих областей по краю окошка редактирования зоны.
Влепить скриншот наверное не смогу, но суть простая: рисую вертикальный прямоугольник limiter'а вблизи левого края зоны. Потом увеличиваю масштаб колёсиком, и когда этот прямоугольник уходит за пределы окна, по краешку остаётся тонкая красная линия. Справа то же.

Автор: VidelSamogO, Отправлено:15:25 28-01-2019

Где скачать новую 6.4?

Автор: allo04, Отправлено:17:55 28-01-2019

VidelSamogO нигде. Это для тестирования особо доверенными камрадами.

Автор: TelecomUral, Отправлено:12:51 29-01-2019

bolega
лассо становится фактически прямоугольником, если сделать так:
в Zones выбрать инструмент лассо
выделить кусок, установить limiter
щелкнуть на поле, которое буду зачищать (ctrl+shift+click)
нажать Del
нажать ctrl+z
попробовать сделать выделение. Должно быть лассо, кнопка его и показывает, а тянется прямоугольник.

Upd
нажимать ctrl+z необязательно. Первое выделение идёт прямоугольником. Потом лассо.

Upd2
нет ли тут ошибки с расчётом? не пойму, отчего чёрная полоска.



субтаск
https://yadi.sk/d/B9FyroGk6RJxWg

Автор: bolega, Отправлено:18:59 29-01-2019

TelecomUral

Цитата:
нет ли тут ошибки с расчётом?

Нет, такой расчет и заложен, очищается под зоной с запасом.
Нужно в VR подчищать такие ошметки, т.к. в djvu они вылазят на передний слой. Но их бы не было, если бы край зоны был чуть дальше от картинки.
Я кажется как-то писал вам про причину этого "запаса". Если имеется перекос скана и картинка вблизи текста (например, подпись под ним), то прямоугольную зону поставить будет проблематично - она залезет на текст и сотрет его (при включенной опции clear source area). Расстановка непрямоугольных зон более затратна по времени и по движениям. Поэтому прямоугольную зону при не очень большом перекрытии текста все-таки можно оставить, т.к. она хоть и залазит на текст, но СК не сотрет его именно из-за этого "запаса". Минус такого подхода - иногда нужно чистить ошметки на выходе в случае, если край зоны очень близко к ее содержимому. Кстати, такое поведение СК идет от самой первой версии, в которой появились зоны (не помню уже какой).


Автор: VidelSamogO, Отправлено:19:21 29-01-2019


Цитата:
нигде. Это для тестирования особо доверенными камрадами.

Дайте потестировать. Интрересно, что там такого особо недоверяемого.

Автор: romanef, Отправлено:22:57 29-01-2019

bolega



Цитата:

Это можно сделать, но только в новой версии.
Желательно предварительно все страницы deskew-ть.
Вместо рамки используется временная picture-зона.
Делается это так: выбирается произвольный файл в списке. Все четыре резака ставятся почти вплотную друг к другу в районе центра. Затем положение резаков копируется на все страницы (диалог copy cutters state/position to...). Затем создается pic-зона размера, равного размеру необходимой рамки, тоже с центром в районе центра страницы. Зона размножается на все файлы (copy zone to clipboard + Zones > Paste zones to pages...). Затем проход по всем файлам и выставление зоны (по сути рамки) в нужную позицию. Затем нажатие новой кнопки Adjust cutters - в результате резаки выставляются строго по сторонам зоны-рамки. Когда все расставлено - удаление скопом всех зон на всех страницах (Zones > Picture zones > Delete...).
Т.е. главная фишка - в новой команде Adjust cutters: если резак стоит внутри зон, то он сдвигается на е край, если стоит извне их - ничего не делается.
Во время прохода желательно отключить фильтр отображения, чтобы быстрее двигать зону (Image > Special > No zoom filter)



Спасибо.
Так как новой версии SK у меня нет, то я пока использую след. способ как делать кромсание рамкой-резаком фиксированного размера:

1. Сбрасываем положение резаков, чтобы они запарковались по краям страниц
2. Создаем на одной из страниц пикча-зону строго по размерам рамки для кромсания, которая будет обрезать все лишнее
3. Копируем эту зону-"резак" на все страницы задания
4. Пробегаем по страницам, двигая мышкой эту зону-"резак" в нужное положение, чтобы кропнуть лишнее за ее пределами
5. Запускаем задание и ждем выполнения
6. В папке OUT забираем файлы pic.xxxx - это и есть наши откромсанные страницы строго фиксированного размера, и работаем дальше с ними, импортировав в новое задание.







Автор: sergiokapone, Отправлено:23:02 29-01-2019

romanef
Что это было? А главное, зачем?

Автор: romanef, Отправлено:23:12 29-01-2019

отмотайте пару страниц назад

Автор: TelecomUral, Отправлено:06:45 30-01-2019


Цитата:
очищается под зоной с запасом

Слово "запас" я воспринимал иначе. Выходит, этот "запас" фиксирован по толщине? А я думал, что он рассчитывается, исходя из угла наклона скана. Тут угол близок к нулю, и запаса быть по моему мнению не должно.
Ясно, спасибо. Надо было резак повыше отодвинуть.


Добавлено:
bolega
Попробовал в визарде прицепить внешний файл дежавю. Жму кнопку Attach external djvu, она даже визуально как-то "дёргается" вместе с окном визарда (типа некий процесс отработал и вернул управление, окно перерисовалось), но циферка этапа не появляется, и остается красная надпись "число нераспределенных файлов =1".
Однако когда я решил плюнуть и просто закодить с одним нераспределенным файлом, по факту дежавюшка страницы прикрутилась.
Один нюанс, может, в нём дело: чтобы добавить дежавю-страничку в конец, я в out-task задублировал последнюю страницу в списке входных файлов. Была "g0097.tif", стало их две. дежавю обозвал g0097.djvu.

оффтоп
bolega, а как вы в своих книгах получаете OCR-слой для цветного текста? Экспортируете все страницы из готового дежавю и скармливаете распознавалке? У меня таким способом ФР-проект ДЭ8 больше 30Гб сожрал пока я сгенерировал все 700 страниц текста. Может, есть поэкономнее путь.

Автор: bolega, Отправлено:18:24 30-01-2019

TelecomUral

Цитата:
А я думал, что он рассчитывается, исходя из угла наклона скана

так и есть


Цитата:
Тут угол близок к нулю

ничего себе "близок". 0,7 градуса это значительный перекос. Запас зависит от угла и ширины зоны (по сути проекция, можно сказать тень на текст под зоной). Чем меньше ширина, тем меньше запас выходит. И наоборот, чем шире, тем сильнее (на крае особенно) прямоугольная зона выйдет за пределы и закроет собой текст.


Цитата:
как вы в своих книгах получаете OCR-слой для цветного текста?

сохраняю временно все out-файлы. Во всех зонах отключаю скопом раскраску. Делаю merge всех b/w-зон. Делаю ocr. Восстанавливаю out-файлы.


Автор: TelecomUral, Отправлено:18:41 30-01-2019


Цитата:
отключаю скопом раскраску

О! Спасибки, не додумался.

Автор: daa2013, Отправлено:08:27 31-01-2019

Имею страницу 3568*4645, на ней выставлена зона во всю страницу (3567*4644) - писал уже, что почему-то зарезает на пиксель, и пара раскрашенных зон поменьше.
Djvu генерируется в размере 3570*4647, и я теряю совпадение пиксельных размеров страниц в книге.

Провёл обработку в 6.00.5: размер остался нормальный 3568*4645
(если же открыть в 6.00.5 оут-задание от 6.4, то получаю те же гадкие 3570*4647)

Автор: bolega, Отправлено:10:40 31-01-2019

daa2013

Цитата:
на ней выставлена зона во всю страницу

Командой fit to page?
Зоны внешние или внутренние? На закладке Book что задано в size multiply? Что пишет лог визарда по поводу resize sjbz? И еще можно было бы несколько вопросов задать, чтобы реально начать разбираться в причине, а не просто наугад анализировать тысячи строк кода СК. Но не буду. В таких случаях пишут "телепаты в отпуске"

Автор: daa2013, Отправлено:11:23 31-01-2019

Да я просто не знаю, что выкладывать.
Вот тут две папки:
https://dropmefiles.com/XzR5j

0003 - проект с 6.4
0004 - проект с 6.00.5
в каждой лежит свой таск, оут-таск, и сделал ещё по субтаску.

Не знал про команду fit to page в 6.4. (она же новая), руками на максимум растягивал. В 6.00.5., кстати, зона тоже на пиксель меньше получается.

джву генерил из оут-таска, так что зоны внешние. В size multiply задано 12, размер none.
В 6.4. вижу resize sjbz = Done в 6.00.5 нет.
Я догадываюсь, что тут ресайз сыграл (негодный размер кратен 6 для ширины и 3 для высоты), но в 6.00.5 его же нет. А потом как размер за пределы страницы-то вылез ? Я же делаю одинаковые действия что в 6.00.5 , что в 6.4., а результат получаю разный. (Зоны конечно не с пиксельной точностью идут) .
Вот сейчас из 6.4. запустил оуттаск для 6.00.5 - тоже размер нормальный.
Как уже писал, если из 6.00.5 запускаю оуттаск для 6.4. - размер ненормальный.

Получается, что в момент создания оут-таска что-то происходит.

Добавлено:
А что это за закладка в джву визарде EITabSheet4 ??

Автор: TelecomUral, Отправлено:13:31 31-01-2019

bolega
FFlimiter, упирающийся в правую сторону зоны, не препятствует выделению.

Автор: TelecomUral, Отправлено:06:56 05-02-2019

Если в Zones вызвать свойства зоны и включить Background substract, то кнопка "взять средний по выделению" сразу активна, хотя никакого выделения ещё нет. Правда, цвет никакой и не выбирается, если попробовать нажать.

Добавлено:
мелочь: если можно, то при вызове VR закладочку в Image Adjustments сохранять ту, которая в прошлый вызов была.

Автор: TelecomUral, Отправлено:08:11 07-02-2019

Del

Автор: daa2013, Отправлено:18:26 08-02-2019

пиксельный сдвиг зоны:



Выделяю зону, делаю раскраску, вклеиваю (merge). По двум сторонам образуется белая пиксельная рамка.

Субтаск:

https://dropmefiles.com/qoopI

Автор: TelecomUral, Отправлено:08:37 11-02-2019

Вопрос: а это правильное поведение:
чищу метёлкой чб страницу. Цвет выставил магический, случайно остался от предыдущей цветной страницы. Зажал shift, выделяю прямоугольник, чтобы грохнуть очень крупный мусор. СК пишет "магический цвет не может быть применён к чб странице". И после нажатия "ОК" на этом сообщении на странице остаётся выделенный мной прямоугольник, краснопунктирный. Он зачем остаётся?

Автор: bolega, Отправлено:10:04 11-02-2019

TelecomUral

Цитата:
Он зачем остаётся?

А затем. Представьте, что там не просто прямоугольник, а сложное выделение, которое вы пять минут создавали. Бац, и нет его, а всего то надо было цвет на кнопке поменять и продолжить. Вот поэтому СК и дает шанс исправить чистящий цвет и закончить операцию (еще раз щелкнув на выделении).

Добавлено:
daa2013

Цитата:
Я догадываюсь, что тут ресайз сыграл (негодный размер кратен 6 для ширины и 3 для высоты), но в 6.00.5 его же нет

Разобрался с вашим примером. На самом деле в обеих версиях все делается одинаково, вы просто наверно забыли в 6.00.5 в параметрах djvu задать downsample ratio=3, как это задано в задании для 6.4. Поэтому там resize sjbz и не было.
В любом случае этот пример сподвигнул меня на пару исправлений: 1) СК теперь не будет делать resize sjbz если только вы не зададите обратное. Удалось обойтись без этого. Теперь равенство размеров будет соблюдаться независимо от соотношений размеров и dpi.
2) В предыдущих версиях СК при обработке Picture-зон не включал в результат последнюю строку и последний столбец выделенного фрагмента зоны на исходном скане. Это было так и задумано, не было багом, но создавало одно неудобство: если зона была на самом правом или самом нижнем краю скана, то эти самые крайние ряды пикселей невозможно было включить в зону, они так и оставались на скане. В 99.9% случаев это не создавало никаких проблем, т.к. зоны это главным образом иллюстрации, в которых плюс/минус одна строка ничего не решало. А вот если зона имела раскраску на всю площадь, да еще нужно было выдержать совпадение со слоем, лежащим под зоной, потеря столбца/строки могло создать проблему (нестыковку). Теперь такой проблемы нет.
Кроме того, с помощью дополнительной опции можно задать совместимость метода расчета размера зон с предыдущими версиями СК. По умолчанию новый метод используется только для вновь созданных заданий. Чтобы активировать его для заданий, созданных в предыдущих версиях СК, нужно явно задать опцию совместимости.


Добавлено:
TelecomUral
Возвращаясь к малоцветке. Если в ней есть черный цвет, то его можно взять с основного скана, т.к. как правило он там качественнее получается. Зону обрабатываете с отключенной clear source area, чтобы черный остался на странице под зоной. Если вы заметили, в новой версии расширился список операций, которые можно делать между зоной и ее подложкой. Раньше было только get transparency. Теперь там несколько растровых операций (КМ зоны > Raster operation), в том числе Copy foreground to zone (переносит черный цвет со страницы в зону).

Автор: TelecomUral, Отправлено:10:45 11-02-2019


Цитата:
Зону обрабатываете с отключенной clear source area, чтобы черный остался на странице под зоной. Если вы заметили, в новой версии расширился список операций

Разобраться с новыми командами - у меня в ближайших планах. Как-то там сложно получается, по названиям. А в whats'new совсем мало описания.

Автор: bearjrgm, Отправлено:15:56 11-02-2019

Всем привет, ччто я делаю не так?
СК 6.00.5
В задании есть picture-зоны, делаю out-task, после пытаюсь сделать djvu, страницы с картинками пустые, на них вообще ничего нет
ПДФ генерится нормально

Автор: bolega, Отправлено:18:50 11-02-2019

bearjrgm
Не помешал бы субтаск из вашего out-task хотя бы из одного файла

Раздал тестерам 6.41
Практически ничего нового, в основном исправлены баги

Автор: bearjrgm, Отправлено:11:35 12-02-2019

bolega
субтаск из основного https://www.upload.ee/files/9558587/test.zip.html
субтаск из оут-таск https://www.upload.ee/files/9558592/test-out.zip.html

Автор: bolega, Отправлено:15:32 12-02-2019

bearjrgm

Цитата:
субтаск из оут-таск

в нем к сожалению совсем нет параметров djvu-визарда.
ставлю сам, все кодится нормально.
а в логах djvu-визарда какие-нибудь сообщения об ошибках у вас есть?

Автор: TelecomUral, Отправлено:16:36 12-02-2019

опять небось не та версия djvulibre

Автор: bearjrgm, Отправлено:17:44 12-02-2019

Лог
[spoiler]

===========================
===========================
Step 2 start at 12.02.19 16:43
===========================
===========================

Prepare files... Done.
DEE command line: D:\Soft\sk6.05\DEE5\bin\documenttodjvu.exe --verbose --pages-per-dict=100 --aggressive --bg-subsample=2 --quality=75 --threshold-level=67 --filelist="C:\Users\VMCB27~1.SAV\AppData\Local\Temp\skdee274005B3.txt"

Run documenttodjvu.exe... Done.
File '-' : tif file
File '-' : tif file
[Page 1]
Page: 5040x7150 dpi:600
User Time(s)/image: Preprocess=0.00 Segment=0.00 JB2=0.01 IW44=0.00

===========================
===========================
Step 2 finished at 12.02.19 16:43
Encoding completed successfully
Size of encoded djvu: 27Kb
===========================
===========================

===========================
===========================
Step 3 start at 12.02.19 16:43
===========================
===========================

Dump structure of step2.djvu... Done.
FORM:DJVU [28152]
INFO [10] DjVu 5040x7150, v25, 600 dpi, gamma=2.2
Sjbz [28122] JB2 bilevel data
FORM:DJVU [28152]
INFO [10] DjVu 5040x7150, v25, 600 dpi, gamma=2.2
Sjbz [28122] JB2 bilevel data


Convert djvu to indirect format... Done.
---------------------------
Processing file 1 (Page 1)
---------------------------
Extract chunks from page 1 of step2.djvu... Failed.
Sjbz=C:\Users\VMCB27~1.SAV\AppData\Local\Temp\skdcf2A2CF096\skdc13187DEF.Sjbz --> "C:\Users\VMCB27~1.SAV\AppData\Local\Temp\skdcf2A2CF096\skdc13187DEF.Sjbz" (28122 bytes)
INCL=C:\Users\VMCB27~1.SAV\AppData\Local\Temp\skdcf2A2CF096\skdc6FEA35AF.incl --> not found!
INFO=C:\Users\VMCB27~1.SAV\AppData\Local\Temp\skdcf2A2CF096\skdc7CFCA33D.info --> "C:\Users\VMCB27~1.SAV\AppData\Local\Temp\skdcf2A2CF096\skdc7CFCA33D.info" (10 bytes)

===========================
===========================
Step 3 finished at 12.02.19 16:43
Encoding failed (20)
===========================
===========================
[/spoiler]


Автор: TelecomUral, Отправлено:13:49 19-02-2019

bolega
Мелочь. Если вызвать в VR режим Compare, то в верхней менюшке правое число масштаба ставится ошибочно, как "100%" (явно не соответствует истине, потому что слева он "19%", а физический размер картинок на мониторе примерно одинаковый). При изменении масштаба это число исправляется.

Автор: TelecomUral, Отправлено:12:31 20-02-2019

bolega
На всякий случай напишу, хоть это явно "неаккуратные эксперименты" опять.
Делал книжку, недочистил, создал out-task, сгенерил дежавюшку чтоб поглядеть.
Решил дочистить, но обнаружил, что предпоследний скан ошибочно оставлен разворотный. Грохнул галку Split.
Открыл out-task, и при открытии СК ругнулся что последний файл не может найти. Я сказал чтоб он проигнорил этот файл.
Открыл дежавю-визард, и случайно заметил, что задняя обложка, которая ранее была на Step1, стала Step2 (auto-attach я не делал).

Автор: shch_vg, Отправлено:17:01 23-02-2019

bolega
Начиная с 6.4 (в 6.3 еще есть), пропала одна удобная фича, а именно, когда в VR выделяешь прямоугольную область, а затем при переходе на следующий выходной скан, эта область сохраняется. Иногда так удобно подравнивать страницы.
М.б. эта фича теперь где-то включается/выключается в настройках, но найти мне это не удалось.

Автор: daa2013, Отправлено:20:16 28-02-2019

Делаю следующее:
- сбросил опции
- авто расставил резаки на первом скане (по дефолту - они синие)
- один отключаю, а три из них пытаюсь распространить в той же позиции на остальные страницы, но уже как пурпурные. (Т.е. просто обрезать.)

Творится полный ужас (интуитивно ожидаемые действия не дают ничего).
А когда всё-таки удается скопировать положение, то резаки синие, а не пурпурные. И через управляющую закладку (применение отключения подопции автомаржинов ко всем сканам командой "apply to all marked" КМ чекбокса закладки ) ничего сделать не получается !!!
Всё остаётся как есть.
(Win 7)


Добавлено:
Upd: наврное проблема в том, что я режу только первый, а не все .
А раз остальные не порезаны, то ск туда копировать не может ?

Upd2 : но в 6-00-5 может

Upd3. Я позже напишу точнее, мне это надо перепроверить, да еще в разных версиях, да еще в комбинациях и по контролу.
но мне сейчас кажется что вкл/выкл главной галки автомаржинов для всех сразу (апплай ту) работает несинхронно.
В одном случае она задействует подгалки, в другом нет, а в третьем сбрасывает ранее выставленные подгалки. (или наоборот включает ранее выключенные). Не на том скане, что текущий, а на тех, куда распространяем.

(Напоминаю задачу, что я решаю. Обрезал один скан. Резаки синие. Мне надо один или два отключить, оставшиеся сделать пурпурными и распространить их положение и цвет на все страницы.)

Автор: bolega, Отправлено:08:43 01-03-2019

daa2013

Цитата:
А раз остальные не порезаны

Что в вашем понимании "не порезаны". Если имеется в виду, что в списке перед ними нет галки (т.е. они де факто еще не включены в задание), то в тысячный раз повторю - к неактивным файлам никакие опции не привязываются!!! В любой версии! Если вы сфокусировались на неактивном файле вы видите не его опции, а текущие.

Автор: daa2013, Отправлено:10:24 01-03-2019

Нет, галка есть. Самое первое действие, которое я сделал, это 4-я маркировочная кнопка. Она сбросила все опции и расставила галки.
Просто в 6.00.5. у меня получается сделать, что я хочу. А в 6.4. пока нет.
(пока не получилось резаки на других стр сделать пурпурными)

Затем я встал на одну страницу и сделал драфт. (текущая, применять к маркированным, только резаки).
Затем я начинаю копировать положение резаков на др страницы. (Нужные резаки в правильную позицию, а ненужные вывел за экран).
Затем я иду на закладку PAGE , отключаю там подгалки у резаков, чтобы они стали пурпурные. И вот тут я вчера застрял и не проверил как с контролом. Но ПКМ -> апплай ту олл маркед (для снятой подгалки автомаржинов) в 6.4. оставило резаки синими.

Я еще буду проверять, как и что в 6.4. делает / не делает, но резал я в итоге в 6.00.5.

Автор: Archivist, Отправлено:17:17 21-03-2019

Потестировал на очередном отсканированном журнале DeskewTools и был приятно удивлен. Там где Кромсатор обычно безошибочно справлялся с 2/3 страниц, тут результат близок к 95%. Возможно, bolega будет интересно взглянуть - https://github.com/galfar/deskew
Там есть один серьезный недостаток, как и в ST - алгоритм поворота размывает изображения и не предусматривает возможности выбора более медленной бикубической интерполяции. Но можно получить значения углов без собственно вращения

Добавлено:
Чтобы пост был не голословным, а полезным, прилагаю архив со страницами, с которыми не справился Кромсатор, но справилась упомянутая утилита. Я еще нередко замечал, что иногда (неправильно) вращаются страницы, которые трогать вообще не нужно было. В примерах это также видно.

https://yadi.sk/d/w7eFHGU6162Jsw - 1.2Гб (3 папки, PNG/JPEG).

Автор: shch_vg, Отправлено:14:06 22-03-2019

Archivist
Если файлы в папке SK 6.0.0.5 получены в СК, то у меня пара вопросов:
1. Как вам удалось на выходе СК получить формат JPG?
2. Почему в свойствах файлов из этой папки отсутствует DPI?

Неплохо бы еще видеть задание, которым Вы получили эти файлы в СК.

Автор: Archivist, Отправлено:14:32 22-03-2019

shch_vg
1. Выходные файлы были сконвертированы в JPEG сторонней программой, их качество не имеет никакого значения, т.к. каждый может повторить эксперимент самостоятельно.
2. Возможно, это особенность конвертора ACDSee. Разрешение всех файлов 300dpi.

Задание состояло в отключении всех действий кроме deskew со следующими настройками: Antialias/Auto/Bicubic

Автор: daa2013, Отправлено:08:48 27-03-2019

Простите, вот только снова руки дошли. Записал по шагам последовательность действий со сканами, где у меня с расстановкой резаков проблема.
Разобрался. Сначала надо сделать копи стейт, потом делать копи позишн. Просто лишнее действие добавилось.

Однако, один, хотя и не самый критичный момент, меня всё равно смущает.


SK 6.4, Win 7, сканы - tiff-ы Задача: выставить правый резак в единую позицию (скопировать на все) и сделать его малиновым. (отрезаю черноту на сканах с оптикбука)


1. файл - опен
2. Четвертая маркировочная кнопка: сброс опций и маркирование
3. Стою на первом файле. Кнопка с ножничками - каррент - снимаю галку "скип маркед", ставлю галку "сет каттерс". (Получаю 4 синих резака на текущем скане).
4. на закладке пейж отжимаю подгалки

5. Щелкаю ПКМ по главной автогалке , делаю "апплай оптион ту олл маркед".
ОППА - включились все галки на всех файлах !!! т.е. и подгалки ! и на первом тоже !!!!
(чтобы увидеть их на первом, впрочем, пришлось перейти на второй, а потом вернуться на первый). Не уверен, что это нормально.

Автор: daa2013, Отправлено:21:23 27-03-2019

6.4.
улетают глифы при вставке по Paste

если я его перетягиваю с панели мышкой, то встаёт точно.
а если двойной клик по глифу, потом навожу мышку и нажимаю шорткат для пасте, то улетает.
самое странное, что часть страниц прошло и сделалось нормально, а потом начались улёты и даже выход и перезапуск СК не помогли.

Автор: daa2013, Отправлено:12:38 28-03-2019

Поскольку про резаки я сообразил далеко не сразу и попытки с 4-й- 5-й обрезки, то сейчас пришла идея. Возможно плохая.

Если делается попытка скопировать положение, а никаких других резаков нет, то может варнинг выдавать. (Типа "включите резаки, скопируя стейт".) А если копирование происходит, то вполне можно и сообщать, на какие страницы прошло (или если где-то резаков не оказалось, то где не прошло).

Как сделать пример с глифами, не знаю, потому что то улетает, то не улетает. После вкл/выкл компа начинает улетать не сразу. Может, в стэк для андо что-то не так пишется ?

Автор: bolega, Отправлено:17:57 28-03-2019

daa2013
А что значит улетает? Встает не в место под курсором?

Автор: daa2013, Отправлено:19:20 28-03-2019

Именно так.
И бывает, что даже очень сильно далеко от него, и по-разному.
- 2-3 символа в сторону;
- 7-8 строк вверх в пределах экрана;
- вообще за пределами экрана. (Это самое неприятное. Кажется, что вставки вообще не произошло, ставишь ещё раз, а потом при просмотре обнаруживаешь символы в неожиданных местах.)

Из-за нестабильности и нерегулярности эффекта не могу сделать примеры.

Единственная идея - это попробовать Вам пойти по моему пути. Назначить хоткей Ctrl+Q на пасте. Вставлять глифы не перетаскиванием, а этим хоткеем, и ждать. Месяц назад (6.3,кажется, тогда было) это сразу началось. Сейчас же я сначала 50 страниц по 3-4 замены на странице прошёл. Перезагрузка СК не помогла, а перезагрузки компа хватило страниц на две.

Добавлено:
И еще раз обращаю внимание: это был 6.4. А не 6.41.
Сейчас попробую открыть это задание в 6.41.

Добавлено:
Для 6.41 сохраняется проблема, о которой сообщал. Заказываю 5 или 6 глифов в ряд панель, а показывает на полглифа меньше.

Автор: TelecomUral, Отправлено:13:30 01-04-2019

При просвечивании маски (Get transparency mask from page) на Win10 стабильно получаю "Access violation...", правда команда при этом всё же исполняется.

Upd
вопрос: когда я в режиме чистки мусора метёлкой жму Ctrl, чтобы инвертировать процесс, то есть удалить белые точки на чёрном фоне, размер белых точек должен отличаться от размера чёрных? Визуально кажется что алгоритм куда больше бережёт белые точки.

Автор: bolega, Отправлено:15:43 01-04-2019

TelecomUral

Цитата:
При просвечивании маски (Get transparency mask from page) на Win10 стабильно получаю "Access violation...",

dpi у страницы и зоны один и тот же, или различаются?

Добавлено:

Цитата:
размер белых точек должен отличаться от размера чёрных?

в настройках эти размеры задаются раздельно. В предыдущих версиях (<6 ) размер был один.

Автор: TelecomUral, Отправлено:18:05 01-04-2019


Цитата:
dpi у страницы и зоны один и тот же, или различаются?

в свойствах зоны Default выставлял. Перепроверить не могу, задание домана работе осталось. Но зона BW, крашеная, так что 99% что дпи идентичны.

Автор: daa2013, Отправлено:07:25 03-04-2019

В 6.41 ошибочная подсказка в ячейке Grid step

Задание в ячейке "допустимое отклонение чистящего цвета" значений 1, 2, 3,
продолжает переключать этот самый цвет.


большой чистки (более 50 стр.) в 6.41 пока еще не делал.

Добавлено:
Хотелка (неприорпитетная) пока не забыл:

Чтобы можно было собирать малоцветные pdf по методике slava_kry
https://www.youtube.com/watch?v=9WEqfdBn0qA

если есть изображение с ограниченным числом цветов, то чтобы можно было сделать (экспортировать) битмап с заказанным цветом (ч.б маска, где только пиксели именно с этим цветом черные, а все остальные - белые).


Хотелка приоритетная:
сделайте послойный (фоны отдельно маски отдельно) импорт джву.
а то на сайте оцр-щиков benoni из моих сканов джву сделал, а пдф так и не изготовил,
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1325496030/452#452
а при наличии такой функции перегнать чужой джв в пдф (опять-таки по методике славы_крю) было бы несложно.

Автор: TelecomUral, Отправлено:09:27 03-04-2019


Цитата:
если есть изображение с ограниченным числом цветов, то чтобы можно было сделать (экспортировать) битмап с заказанным цветом (ч.б маска, где только пиксели именно с этим цветом черные, а все остальные - белые).

Это без СК просто сделать: отредактировать палитру файла картинки, заменив все ненужные цвета на белый, а нужный на чёрный.

Автор: daa2013, Отправлено:10:25 03-04-2019

Если в RV делался поворот выделенного участка (по Ctrl +R), нельзя ли сделать так, чтобы андо не возвращала полностью в исходное состояние, а просто отменяла вклейку.

Т.е. последовательность же такова: выделение - поврот - вклйка.

вклеил - видишь что плохо (смещение на пиксель не туда или угол неточный). Жмешь андо и оказываешься в окне Rotate. (А сейчас по новой выделять и крутить приходится). Т.е., чтобы после такой вклейки вернуться в совсем исходный, надо будет сделать два андо.

Автор: daa2013, Отправлено:08:14 04-04-2019

Ещё одна идея пока не забыл:
трудно выдлять круги и овалы. я уже предлагал усовершенствование, но видно оно не в приоритете. Было также предложено по трем точкам описанный круг ставить. Но в окне RV описанный многоугольник не описывается. Функции такой нету.
Может, пока хотя бы команду "выставить описаннный многоугольник" в RV внедрить ?

И еще одно наблюдение: при переключении между закладками на новой закладке один из глифов уже забран в синий прямоуг. Но вот является ли он активным или нет ? Если удалять - то удалится именно он. А если ставить - выставится глиф с прошлой закладки.
Мне кажется, что было бы праввыильно помнить какой глиф был на закладке активным в последний раз, подсвечивать именно его, и делать активным полностью (т.е., если он синий, то его и вставлять, а не тот глиф, что был на уже закрытой.) Впрочем, это всё такие мелочи, конечно.


Автор: bolega, Отправлено:18:04 04-04-2019

daa2013

Цитата:
"выставить описаннный многоугольник"

вокруг чего он описанный?
я понимаю понятия "круг описанный вокруг" и "вписанный в круг", а "описанный многоугольник" мне непонятен

Автор: daa2013, Отправлено:18:35 04-04-2019

Ролстите, речь идёт о комнаде

"""Convert to enclosing circle"

Автор: bolega, Отправлено:19:29 06-04-2019

daa2013

Цитата:
5. Щелкаю ПКМ по главной автогалке , делаю "апплай оптион ту олл маркед". ОППА - включились все галки на всех файлах !!! т.е. и подгалки ! и на первом тоже !!!!

Да, именно такое поведение и заложено изначально (с 1-й версии). Т.е. включение главной галки включало автоматом под-галки. С одной стороны, не корректно такое поведение, с другой стороны, на практике неудобств от этого никогда не было, иначе нужно было бы копировать по отдельности каждую из подгалок, это аж 4 раза, а для разворота - аж 8!

TelecomUral

Цитата:
При просвечивании маски (Get transparency mask from page) на Win10 стабильно получаю "Access violation...", правда команда при этом всё же исполняется.

исправил. Этот глюк проявлялся только для ч/б зон, я такой вариант вообще не предусматривал ранее.

Автор: daa2013, Отправлено:20:39 06-04-2019


Цитата:
Да, именно такое поведение и заложено изначально (с 1-й версии)

нет, ну ок. Я могу сначала включить главгалку, потом выключить подгалки
(иначе в моем случае как раз и приходится их все дополнительно отключать).
Но я хотел обратить внимание тут еще и на другое.
Что на первой странице, на которой я стою, включение этих подгалок не отражается ! Я должен перейти на вторую, а потом вернуться на первую, чтобы это увидеть.
Т.е. если о таком поведении не знать (это, кстати, как-то обсуждалось, поэтому я на самом деле этого включения ожидал), то этого и не увидишь. Однако, при копировании автогалки на все, на той странице, где я стоял, подгалки не зажглись, и я поэтому в этом случае решил, что они и везде не зажглись.

Автор: bolega, Отправлено:10:56 08-04-2019

daa2013

Цитата:
И еще одно наблюдение: при переключении между закладками на новой закладке один из глифов уже забран в синий прямоуг. Но вот является ли он активным или нет ? Если удалять - то удалится именно он. А если ставить - выставится глиф с прошлой закладки.

По поводу активности и вставки. Активный и вставляемый - это совершенно разные вещи. Это нужно понимать. По горячей клавише вставляется не текущий активный глиф, а то, что находится в буфере обмена! Т.е. не надо путать вставку чего-то (это может быть и глиф оказавшийся в кармане в результате предыдущего перетаскивания, и просто любое изображение) и выбранный глиф на панели, это разные вещи. А раз так, не имеет никакого значения, какой там глиф подсвечен и на какой закладке. Вообще, не ищите проблему там, где ее нет.


Автор: daa2013, Отправлено:12:00 08-04-2019


Цитата:
Активный и вставляемый - это совершенно разные вещи. Это нужно понимать.

Я, кажется, ровно об этом своём наблюдении и написал. Что у вас есть две сущности: активный глиф и вставляемый глиф. И, как мне кажется, можно упростить и одну сущность убрать: если в кармане не тот глиф, что на панели, то и не брать его в синий прямоуг. Если же ставится прямоугольник, то этот глиф и класть в карман.
А также, то, что как это устроено, по большому счету мелочь. (То есть, не проблема.)


Автор: bolega, Отправлено:12:30 08-04-2019


Цитата:
если в кармане не тот глиф, что на панели, то и не брать его в синий прямоуг

Карман - это "собственность" windows, в нем может быть все что угодно. Следить за тем, что там происходит, СК не будет.

Автор: skrt, Отправлено:09:50 11-04-2019

а беты сейчас не выкладываются?

Автор: SVN75, Отправлено:21:09 12-04-2019

Вопрос, полагаю, отнюдь не новый, но я не смог найти ответа, поэтому всё же спрашиваю.

Номера страниц книги после автоматической черновой обработки (расставления резаков) оказываются «за бортом». Идея вручную передвинуть резак на нескольких сотнях страниц не вызывает радостного возбуждения (тем более, что происходит такое далеко не с этой одной книгой). Установка флажка «Safe top/bottom», который, казалось бы, должен за это отвечать никак не исправляет ситуацию. Ползунок «Text vert. sensitivity» я тоже пробовал выставлять на максимум. Можно тут что-то сделать?

P. S. Может быть всё это не работает из-за того, что в данном случае сами страницы обрезаны прямо по краю текста (хотя я нередко встречал подобную проблему и для изображений с полями)? Но почему тогда нет варианта автоматически ставить резаки просто по краям листа (смысла в такой предварительной обработке, конечно, нетути, но ведь без неё основная не заработает)?

Автор: TelecomUral, Отправлено:04:11 13-04-2019


Цитата:
нет варианта автоматически ставить резаки просто по краям листа

есть такое. кнопки под свойствами. в моём видео №10 это тоже показано, в районе 4м45с.

можно поглядеть на скан, на котором СК не ловит края? давно такого не встречал.

Автор: daa2013, Отправлено:04:24 13-04-2019

Ненужный резак можно отключить галочкой на панели. Нижний это Yb.
Резак также можно передвинуть на край листа и скопировать его положение на другие страницы. (ПКМ на ползунке резака и жмём copy current position )

Автор: bolega, Отправлено:06:57 13-04-2019

SVN75

Цитата:
смысла в такой предварительной обработке, конечно, нетути, но ведь без неё основная не заработает)?

заработает. Draft можно не делать. Установить нужные опции на одном файле и скопировать их на все остальные, например, кнопками под свойствами.


Цитата:
Но почему тогда нет варианта автоматически ставить резаки просто по краям листа

Есть. Нужно их вообще не взводить (отключить галки Xl, Xr, Yt, Yb или любую их комбинацию), что эквивалентно установке резаков на самые края страницы.

Автор: daa2013, Отправлено:08:50 13-04-2019

6.41

Вроде почистил толстоватую книжку, глифы не улетали.


ПКМ на оригинальном изображении в окне RV в режиме Compare



Заодно заскриншотил команду, о которой когда-то давно спрашивал (ПКМ на ленте в режиме Thumbs)



Добавлено:
PS
мне почему-то казалось, что где-то была команда, которая в ленте ставит миниатюры не по два, а по одному. Я ошибаюсь ? Это в окне MW такое было ? А когда по две миниатюры, то можно задать смещение как в джву броузер плагине, чтобы передняя обложка не мешалась:

Т.е. пары не так
1-2
3-4
5-6

а вот так

1
2-3
4-5

Я наверное что-то путаю, и такого не было никогда ?

Автор: bolega, Отправлено:22:27 13-04-2019

daa2013

Цитата:
что где-то была команда, которая в ленте ставит миниатюры не по два, а по одному

Clear options > Editor > thumbnails in two columns

Цитата:
А когда по две миниатюры, то можно задать смещение как в джву броузер плагине, чтобы передняя обложка не мешалась:

такого нет

Автор: VadimirTT, Отправлено:15:55 14-04-2019

Что значит сообщение task file not found?

Автор: bolega, Отправлено:18:42 14-04-2019

VadimirTT
Уточните, когда выскакивает

Автор: SVN75, Отправлено:15:52 15-04-2019

TelecomUral, daa2013, bolega

Спасибо, не знал про такое.


TelecomUral

Вот тут файл выложен: https://drive.google.com/open?id=1pWPXkeLVMmhrYp-_459mtOJW4SerC92l. Прямо на первой же странице усекается год внизу, а на большинстве последующих — номера.

Автор: TelecomUral, Отправлено:18:13 15-04-2019

SVN75
аа. чб страницы.

Автор: SVN75, Отправлено:20:34 15-04-2019

TelecomUral

Э-э-э... ну так научно-техническая литература обычно именно в таком варианте и сканируется. Мне в градациях серого редко встречались, не говоря уж о цветных.

Автор: TelecomUral, Отправлено:04:38 16-04-2019

SVN75
в личку черкнул

Автор: TelecomUral, Отправлено:13:41 22-04-2019

bolega
Пытаюсь скопировать положение верхнего резака на All marked (по моему мнению, это на все файлы с зелёными галками). Не работает, на других страницах всё остаётся как было. А копирование положения нижнего - сработало. Остальные не проверял. Версия 6.41.

Автор: niccolo, Отправлено:21:17 23-04-2019

Вопрос или пожелание

Часто попадаются книги с перекосами страниц на разворотах и картинками.

Можно ли какую-то в предобработку просто делить и устранять перекос, чтобы потом точнее резаки расставить и зоны выделить? Или в тулзах тулзу, чтобы два раза не гонять SK

Иногда хочется не заморачиваясь одной кнопкой запустить обрезку и выравнивание без обработки, не занимаясь съёмом стандартно поставленных галок.

Автор: daa2013, Отправлено:21:51 23-04-2019

у меня кстати, похожий вопрос.

при драфте все резаки ставятся вертикально/горизонтально.
и я задолбался их наклонять вручную. Хорошо хоть книжка была короткая, хотя и разваливающаяся на странички.

Может, где-то есть галочка, которая ловит дескью и ставит резаки с этим углом ? Ну, или включает наклонные резаки / поиск угла наклона. При этом для разворота у каждой половинки может быть свой собственный угол.

Автор: VadimirTT, Отправлено:00:09 24-04-2019


Цитата:
Может, где-то есть галочка, которая ловит дескью и ставит резаки с этим углом ?

Во первых, знаки препинания ставятся без пробелов.
Во вторых, предоставьте алгоритм для Ваших желаний.

Автор: TelecomUral, Отправлено:03:11 24-04-2019

и у меня было подобное пожелание по разрезу с поворотом. Именно чтобы потом точнее зоны ставить. Но, возможно, это нехорошо для пикселей? Потом хуже обработка будет?

upd:
подумал, что ведь можно оставить один внутренний резак, включить дескью и split, а выход "original". Вроде должно получиться.

Автор: daa2013, Отправлено:03:36 24-04-2019


Цитата:
Во первых, знаки препинания ставятся без пробелов.
Во вторых, предоставьте алгоритм для Ваших желаний.

Я рассуждаю чисто гипотетически, так как плохо знаю работу резаков СканКромсатора, никогда ими не пользовался.
Мне казалось, что в старых версиях, я наклонные резаки после драфта встречал. Поэтому сильно удивился, что в 6.41, причём в проекте, где все страницы рассыпались, всё перпендикулярно. Но я, правда, не знаю, как оно тут правильно. Может, кнопочка включения наклона где-то прячется.
Алгоритм мог бы выглядеть так: если эта кнопочка включена, то СК ставит перпендикулярные резаки, потом делает дескью половинок и определяет их соответствующие углы, потом ставит наклонённые под этим(и) углом(ами) резаки. Хотя бы вертикальные. Мне просто почему-то казалось, что оно так и работает.

Автор: daa2013, Отправлено:07:14 25-04-2019

У меня тут идея возникла, просьба только сразу в штыки не воспринимать.

Можно ли научить СК импортировать некий файл с координатами пикчур зон и выставлять зоны по заранее известным координатам ?
Если да, то каковы должны быть требования к этому файлу ?

Автор: bolega, Отправлено:09:48 25-04-2019

daa2013

Цитата:
Можно ли научить СК импортировать некий файл

Можно

Цитата:
Если да, то каковы должны быть требования к этому файлу

Текстовый файл в произвольном формате. xml не желателен, но не критично


Добавлено:
daa2013

Цитата:
при драфте все резаки ставятся вертикально/горизонтально. и я задолбался их наклонять вручную.

А так ли это нужно? Я вот с этим не заморачиваюсь. Если из-за сильного наклона верт. резак не может отрезать всю грязь, то и фиг с ним. Контур может определиться неверно, но так как из-за финализации контур можно всегда подкорректировать вручную после обработки, я так и делаю.
В драфте определять наклон резаков у меня не получилось, оказалось архисложно.
По хорошему, для этого нужно определить skew (а с этим у СК бывают проблемы даже после обрезки, а что уж говорить об исходном скане). В свою очередь, чтобы определить skew, нужно сперва разрезать. Напоминает СТ, не правда ли?
В СК и СТ по разному работает поиск контента. В СТ детектируется грязь на краях, затем она удаляется и получается по сути готовый контент, т.к. к этому моменту страница уже подверглась deskew. В СК задача сложнее: нужно не удалять грязь, а всунуть резак между грязью и контентом. Я скажу, что это гораздо сложнее, чем просто детектировать и удалять грязь. Если бы грязь можно было удалять, задача намного бы для СК упростилась, но к сожалению это делать нельзя.

Автор: TelecomUral, Отправлено:10:08 25-04-2019

bolega
насчёт импорта координат. как я понял, имя файла зон должно совпадать с именем графического файла где эти зоны, а внутри просто перечисление вершин с переводом каретки на каждую новую зону? И это всегда полигональная зона получится? Ну, классно. Ещё опционально в конце подхватывать ссылку на номер зоны-образца, откуда свойства брать, и было бы весьма неплохо.

Автор: niccolo, Отправлено:10:26 25-04-2019


Цитата:
Поэтому сильно удивился, что в 6.41


А где сейчас новые версии выкладываются?

Насчёт расстановки резаков - в большинстве случаев работа с рамкой страницы была бы быстрее.

Автор: bolega, Отправлено:10:48 25-04-2019

TelecomUral

Цитата:
имя файла зон должно совпадать с именем графического файла где эти зоны

Можно по всякому. Можно в один файл все записать, впереди каждой порции зон писать имя файла-скана, к которому зоны относятся. Порции отделять тэгами какими-нибудь. Можно для каждого скана свои файлы-описания зон делать. Программно можно любой вариант переварить. Главное, чтобы бы была однозначность и возможность пакетной обработки

Автор: Archivist, Отправлено:14:01 25-04-2019


Цитата:
Можно ли научить СК импортировать некий файл с координатами пикчур зон и выставлять зоны по заранее известным координатам?
Вы подразумеваете использование данных из FR? Там вроде бы информация о зонах хранится в доступном виде в xml, но вопрос не изучал. Вот картинка с их сайта:


https://abbyy.technology/en:features:ocr:xml

Автор: daa2013, Отправлено:06:38 26-04-2019

В проекте есть более светлые и более темные страницы.

Порог бинаризации Авто это видит, но уровень выставляет неточный.
Хотелось бы иметь возможность выделить группу страниц, у которых порог авто дал определенное значение, и назначить им другое.

Т.е. добавить в едит - селект груп - спешиал опцию "значение параметра бинаризации после авто".

PS
Сначала хотел попросить возможность задавать порог авто + K, но мою проблему это не решило бы, так как там уже целая формула потребовалась бы.

Автор: TelecomUral, Отправлено:06:51 26-04-2019

daa2013
А "change binarization threshold..." (ПКМ на виде бинаризации) вас не спасает? Там и галки отбора, и условия есть.

Автор: daa2013, Отправлено:06:56 26-04-2019

Ну да, это оно и есть. Просто т.к. новая фича, не знал про неё.

Хотя в случае выделения страниц в списке, я мог бы лишний раз по ним пробежаться, чтобы проверить, они на самом деле темные/светлые или нет.

Автор: TelecomUral, Отправлено:07:07 26-04-2019


Цитата:
т.к. новая фича

внимательно и целиком читайте what's new

Автор: daa2013, Отправлено:07:09 26-04-2019

Да уж слишком оно большое.

Автор: daa2013, Отправлено:01:06 27-04-2019


Цитата:
(ПКМ на виде бинаризации) вас не спасает?


не совсем спасает. Для самых бледных я бы адаптивный highdark назначил, а там такой возможности нет.
А если было бы выделение, то я мог бы и soft, и highdark задействовать. Хотя и его, видимо, можно как-то в это окошко воткнуть.
Или я мог бы на всех бледных автолевелы включить. (хайдарк мне не помог, а автолевел помог.)

Добавлено:
ПКМ на ячейках в этом окне ("change binarization threshold...") содержит команды "управляющие символы Юникода", наверное их надо как-то отрубить ?

Автор: TelecomUral, Отправлено:09:46 30-04-2019

bolega
Попробовал заюзать в VR кнопку изменения глубины цвета страницы. Перед этим сделал original-зону, постеризовав её до трех цветов, включая белый и чёрный. Слил зону со страницей. Закрыл/открыл СК (6.41). Выбрал на кнопке режим "4 bit", потом щёлкнул на ней. Галки на White и Black in palette - стояли включённые. Save сделал. Посмотрел, что сохранилось в папке. А там у файла в палитре (причём 8-битной, судя по info) нет белого, цвет 248-248-248.

Автор: daa2013, Отправлено:04:45 01-05-2019

6.41

когда прерываю задание, не задает вопрос "хотите ли потом продолжить"
и соответственно не позволяет потом запустить прерванное

Автор: asku, Отправлено:09:51 01-05-2019

Добрый день. Помогите, пожалуйста подобрать нормальные опции. Результат на выходе меня совсем не может удовлетворить. Пробую и так и эдак. /

Прилагаю архив test.

Ссылка

Автор: TelecomUral, Отправлено:13:32 01-05-2019

asku

Цитата:
Помогите, пожалуйста подобрать нормальные опции

А что не так у вас вышло-то ? Лично мне намного больше нравятся тонкие буквы, чем такие блямбы, но это на любителя. Укажите критерии "лучше-хуже".

Автор: asku, Отправлено:10:25 02-05-2019


Цитата:
А что не так у вас вышло-то ? Лично мне намного больше нравятся тонкие буквы, чем такие блямбы, но это на любителя. Укажите критерии "лучше-хуже".


Ну я думал из исходного варианта можно было бы выжать больше. Чтобы буквы были более гладкие, шума поменьше.

Автор: TelecomUral, Отправлено:12:47 04-05-2019

bolega
вопрос: как идеологически верно работать с кнопочками preview на закладке Quality? Я никак не могу уловить систему использования. Какие-то фильтры применяются к окну preview немедленно по галке Enable, какие-то применяются к выделению на оригинале, какие-то параметры не оказывают видимого влияния (а хотелось бы понять, с чего это! например auto-levels на Contrast-закладке, там ещё своя кнопка превью), а в целом результат обработки обычно и близко не совпадает с видами preview-окна или выделенного куска. Может, я не учитываю, мысленно, применение порога бинаризации? Помогите разобраться. Возился с примером от asku.

Автор: allo04, Отправлено:16:08 05-05-2019

У меня из теста от asku вот так вышло https://dropmefiles.com/jNtFZ

Автор: niccolo, Отправлено:18:09 05-05-2019


Цитата:
Закрыл/открыл СК (6.41)


Где вы все их берёте?
по поводу сплита - его, по идее, вместе с разворотом лучше добавить в (ре)импорт, оставляя возможность переразбить страницу позже.


какие-то глюки в 5.96 - прогоняешь со стандартными настройками - проверяешь, видишь неверно исправленный перекос - снимаешь галку - переделываешь пол-страницы - ничего не меняется - галка возвращается обратно....
Аналогично с исправлением позиции резака - сдвигаешь с чёрного поля, прогоняешь еще раз - снова картинка с полем

Автор: esys, Отправлено:19:55 05-05-2019

оффтоп: Русский интерфейс программы будет когда-нибудь?

Автор: niccolo, Отправлено:13:27 06-05-2019

Также хотелось бы уточнить, где в 6 версии можно включить финализацию сразу, если надо переделать 1-2 странички в уже финализованной книге?

Автор: TelecomUral, Отправлено:15:17 06-05-2019

niccolo
Насколько я понимаю, просто переделываете странички и по правой кнопке в окне VR делаете каждой "Finalize". Либо в главном окне через меню, на диапазон "All". Но я могу быть неправ, не работал с разными версиями.

Автор: niccolo, Отправлено:15:42 06-05-2019


Цитата:
Насколько я понимаю, просто переделываете странички и по правой кнопке в окне VR делаете каждой "Finalize". Либо в главном окне через меню, на диапазон "All". Но я могу быть неправ, не работал с разными версиями.


Это я знаю... Но иногда хочется избавиться от лишних телодвижений

Автор: daa2013, Отправлено:08:25 17-05-2019

включил протрактор, померял, перелистнул на следующую:
протрактор не действует, а при попытке сделать мув куска изображения выплюнул ошибку.

в режиме просмотра разворотами есть ли какая-то кнопочка, чтобы прямо по ходу вместо развортов 100-101, 102-103 показывать 101-102, 103-104 ?


(Это я пытался куски иллюстрации состыковать).

Автор: bolega, Отправлено:18:05 21-05-2019

daa2013

Цитата:
в режиме просмотра разворотами есть ли какая-то кнопочка, чтобы прямо по ходу вместо развортов 100-101, 102-103 показывать 101-102, 103-104 ?

Т.е. в режиме two-pages у вас несовпадение половинок разворота из-за отсутствия пары для обложки? Или несовпадение началось с 100-й страницы? Если так, то это странный скан, какой-то страницы не хватает.

Автор: daa2013, Отправлено:19:38 21-05-2019

И так, и не так.

Да, у меня нет пары для обложки. (еще точнее - обложка и титул отсутствуют). И проблема в чем-то из-за этого.

Нет, нельзя сказать, что несовпадение началось на стр 100 или даже, что оно вообще есть. У меня оказалась иллюстрация (если точнее, то таблица), которая разрезана на несколько страниц. Пары 100-101, 102-103 меня устраивали. Но чтобы обеспечить точный стык и не-дёргание строк при перелистывании, мне потребовалось переключиться на 101-102. И упс.

Померить линейкой тоже не получилось, т.к. включенный протрактор при переходе на другую страницу работать отказался. (А попытка сдвига изображения вообще привела к ошибке).

Автор: bolega, Отправлено:21:15 21-05-2019

daa2013
Баг в протракторе (угломере) я уже вылечил с месяц назад.


Цитата:
есть ли какая-то кнопочка, чтобы прямо по ходу вместо развортов 100-101, 102-103 показывать 101-102, 103-104 ?

Нет такой.



Автор: niccolo, Отправлено:21:47 21-05-2019


Цитата:
Добавлена новая закладка Reports.


Этого не хватало... А где взять новую версию?

Автор: bolega, Отправлено:21:58 21-05-2019

niccolo
Как будет готова новая бета, я сообщу вам в ПМ

Автор: daa2013, Отправлено:05:36 29-05-2019

6.41

Наблюдал следующее.
Хотел сделать импорт джву, он мне сказал что не указано расположение джвудекоде и сам (!) открыл окно "открыть файл". (раньше такого не было).
(Причем в этом окне все exe-файлы, а не только искомый.) Но после того как я путь прописал, СК все равно делать ничего не хотел.
В окне аппс настроек путь был. Пришлось его удалить и ввести уже через аппс. Тогда заработало.
если ск сам стал предлагать такое окно, когда понимает, что приложение не прописано, то:
- почему показываются все экхешники
- почему не заработало

Автор: bolega, Отправлено:09:30 29-05-2019

daa2013

Цитата:
Наблюдал следующее.

Спасибо, исправил

Автор: Vixerunt, Отправлено:06:53 31-05-2019

Друзья! Выручайте! Просто вешалка! Прога великолепная! После начала её использования, не хочется использовать другой метод обработки книжных сканов! НО! У меня программа работает стабильно, если выбрано небольшое количество опций обработки! Например, если включить "Enhance image" или другую доп. опцию, программа крашится! Приходится обрабатывать каждую страницу отдельно, но и это не гарантирует стабильную работу! Две-три страницы и - ошибка доступа к памяти по адресу.... Помогает только перезагрузка компьютера! Включил опцию совместимости с Windows 8! Чуть лучше, но.... только, чуть! Время обработки одной книги среднего объема возрастает в разы!!!!!
Система - Windows 10 x64 1903
Проц: - Threadripper 1950
RAM: - 64 GB
Видео: - Gigabyte 1080 Ti
SSD: Samsung SSD 970 PRO 1 TB
Может кто-то что-нибудь подскажет? Хотя бы, куда "копать"!

Автор: TelecomUral, Отправлено:08:07 31-05-2019

Vixerunt
укажите вашу версию СК. Текущая стабильная 6.00.5.

+
Первое, что приходит на ум - попробуйте поработать на другой машине, значительно более слабой по операционке. Или внутри виртуалки. Впрочем, я с зимы работаю на win10 без каких-либо особенных проблем. Комп, правда, "офисный", не игровой.
Второе, что приходит на ум, это какой-нибудь ненормальный антивирусник.

Автор: bolega, Отправлено:10:16 31-05-2019

Никогда не было возможности протестировать СК на AMD. Вроде бы совместимость на уровне команд (MMX, SSE И т.д.) у AMD и intel полная. Часть кода Image enhance написана на assembler. На нем же полностью реализованы операции resample и rotate (deskew), но они как я понял не вызывают краха.

Автор: Vixerunt, Отправлено:16:36 31-05-2019


Цитата:
укажите вашу версию СК. Текущая стабильная 6.00.5.

Забыл! Да! Именно текущая стабильная 6.00.5

Цитата:
Первое, что приходит на ум - попробуйте поработать на другой машине, значительно более слабой по операционке. Или внутри виртуалки. Впрочем, я с зимы работаю на win10 без каких-либо особенных проблем. Комп, правда, "офисный", не игровой.

Именно это и мне пришло на ум! Специально для этих целей установил на второй комп семёрку! Машина на базе i5. Та же история! Один в один! Правда сейчас меня осенило: я тестировал СК, тупо скопировав содержимое, и запустив обработку из бекапов! Может СК в бекап сохранил и ошибки! Не знаю! Вечером попробую начать с нуля.

Цитата:
Никогда не было возможности протестировать СК на AMD. Вроде бы совместимость на уровне команд (MMX, SSE И т.д.) у AMD и intel полная. Часть кода Image enhance написана на assembler. На нем же полностью реализованы операции resample и rotate (deskew), но они как я понял не вызывают краха.

Самое интересное, что подобные ошибки не вылезают при обработки "приличных" сканов! Стоит только начать работать с книгами типа советских брошюр из цикла "Памятка бойца Красной Армии" на туалетной бумаге, и "краши" просто начинают выбивать этого бойца из седла (( Как правило, я подобные сканы делаю с разрешением в 600 dpi в формате uncompressed tiff.

Автор: bolega, Отправлено:16:37 31-05-2019

Начал работу по русификации СК.
Возможно, потребуется помощь в подборе наилучших (и наиболее кратких) эквивалентов

Автор: daa2013, Отправлено:16:50 31-05-2019


Цитата:
Самое интересное, что подобные ошибки не вылезают при обработки "приличных" сканов!


Попробуйте воспользоваться советом из шапки: "Что делать, если SK не делает...?"

Автор: Vixerunt, Отправлено:17:15 31-05-2019


Цитата:
Попробуйте воспользоваться советом из шапки: "Что делать, если SK не делает...?"

Я так и сделал, в своё время! Но ответа не получил!

Автор: TelecomUral, Отправлено:17:24 31-05-2019


Цитата:
Я так и сделал, в своё время! Но ответа не получил!

по памяти - вы же не предоставили тогда своё задание, хотя вас попросили сразу. сходу не нашёл сейчас ту переписку.

Автор: Vixerunt, Отправлено:17:31 31-05-2019


Цитата:
по памяти - вы же не предоставили тогда своё задание, хотя вас попросили сразу. сходу не нашёл сейчас ту переписку.

Нет! Нет! Вы ошибаетесь! Я выполнил все требования, и выложил задание!

Но сейчас, я всё больше убеждаюсь, что ошибка, всё-таки, в совместимости программы именно с железом!!!! В ту пору, я работал на камне i7-5960x! Поэтому, мне кажется, я и не получил ответа: ошибку не нашли в моём примере!!!

Автор: TelecomUral, Отправлено:17:51 31-05-2019


Цитата:
Я выполнил все требования, и выложил задание!

поиском не обнаруживаю. было обещано в "12:34 08-09-2017".
ну и тем не менее, совет daa2013 вы не выполняете и сейчас. ок, ждите экстрасенсов, удачи.

Автор: bolega, Отправлено:18:35 31-05-2019

TelecomUral
насколько я помню, задание выкладывали. У меня прошло без ошибок, поэтому причину я не выяснил. Если она повторяется и на intel, и на AMD, но только у одного человека, может и правда там дело в ПО, а не в железе, либо в старой версии СК: если ошибка из-за постепенно накапливающейся утечки памяти, то sub-task проблему не поможет выявить. Надеюсь, скоро можно будет проверить на новой.
Кстати, по поводу ПО: если я запускаю в СК сервисную команду корректировки dpi, то Касперыч (корпоративный!) уже через несколько десятков секунд начисто грохает СК без всякого предупреждения. На домашней версии Касперского такого не бывает. Ему видимо кажется ужасно подозрительным, что СК открывает массу файлов, меняет в них несколько байтов (т.е. dpi) и пишет обратно.

Автор: TelecomUral, Отправлено:18:44 31-05-2019


Цитата:
Ему видимо кажется ужасно подозрительным ...

угу. наблюдал на службе похожее поведение - корпоративный антивирь возбуждается при активной работе с файлами. но СК не схлапывает, просто замедляется работа проца - антивирус начинает отжирать выше половины ресурсов.


Цитата:
У меня прошло без ошибок

я обычно тягаю отсюда суб-таски, надо ж тренироваться не только на своих материалах. не нахожу в своем архиве заданий ничего похожего от vixerunt. Но, в общем, не суть.

Автор: daa2013, Отправлено:19:03 31-05-2019

Я не поленился и прочесал эту и 3-ю часть форума. Тоже ничего не нашел.
Не знаю, куда он клал.

Автор: Vixerunt, Отправлено:19:14 31-05-2019


Цитата:
он
клал туда, куда было сказано! а сейчас
Цитата:
он
сам не вспомнит!
bolega
кстати, про антивирь я реально не подумал! попробую его отключить!

Автор: Vixerunt, Отправлено:03:23 01-06-2019

В общем, мне кажется, я поборол эту беду! Причина, таки, крылась в антивирусе! Загнал процесс и папку в исключения и, как говорил кот Матроскин, ЗАРАБОТАЛО! Во всяком случае, всё это время обрабатывал книгу и не было ни одного вылета! Тьфу! Тьфу! Тьфу! Спасибо всем за помощь!!!
Да! Для информации! Подобные "краши" наблюдались у меня под "родным" Защитником, и под Eset Internet Security.

Автор: imwerden, Отправлено:11:08 03-06-2019

Увидел в одном видео возможность Create out-task. Проэкспериментировал. Не пойму, почему в результате изчезают выставленнэ мною белые поля вокруг текста. И совершенно не нахожу, как их вернуть, учесть или сделать заново. В нормальмом задании все на месте, но если идти в Create out-task - все исчезает.

Автор: TelecomUral, Отправлено:11:26 03-06-2019

imwerden
версия СК какая?
Непонятно, что значит "выставленные мною белые поля"? В смысле - включены automargins? Может, вы финализацию не сделали? Тогда да, в оут-таск полей не будет видно (в главном задании их редактор на ходу рисует). Но вы бы тогда не смогли редактировать содержимое бинаризованных страниц (чистить мусор и тэ пэ).
В Хрестоматии неплохо разработан вопрос о финализации, отдельной главкой.

Автор: imwerden, Отправлено:12:53 03-06-2019

Да, финализацию не делал - думал, что не нужно. Теперь все работает. Спасибо. Речь шла об установках Book-H.Gap-V.Gap

Автор: Olexiy71, Отправлено:07:45 08-06-2019



Цитата:
Также хотелось бы уточнить, где в 6 версии можно включить финализацию сразу, если надо переделать 1-2 странички в уже финализованной книге?

В СК 5.95 эта функция была но потом её зачем-то отключили.
и теперь только через дополнительные телодвижения.


Добавлено:
интересно, а вы планируете сделать функцию выпрямления строк, как в Скан Тейлоре, например.?
Очень полезная фишка

Автор: bolega, Отправлено:10:12 08-06-2019


Цитата:
В СК 5.95 эта функция была но потом её зачем-то отключили.

Режим с финализацией - это возможность preview книги. Дает шанс без хлопот что-то исправить в размерах, выравнивании и т.д. Без нее только полная переобработка, если геометрия книги оказалась неверна.
Обычно критики финализации - это те, кто ничего не смыслит в изготовлении книг (но не переживайте, с опытом понимание придет!), либо вообще этим не занимается.

Автор: daa2013, Отправлено:06:01 15-06-2019

6.41

Наблюдаю следующее.

в режиме RV
вырезал полоску и вставляю. До мерже увеличиваю, чтобы точно позиционировать.
При определенных увеличениях вставляемый кусок перестает отображаться.


Не знаю, зависит ли тут от размеров и характера исходников, удастся ли воспроизвести.
Не знаю, как тут сделать пример.

Автор: daa2013, Отправлено:08:01 21-06-2019

6.42

на закладке бинаризация справа от ячейки перестала выскакивать подсказка об уровне порога

Автор: Dracula, Отправлено:09:41 25-06-2019

Всем привет!
Раньше я делал книги и переводил в конечный формат DjVu. Выходило супер.
А можно ли всё это же делать, но уже сохраняя уже после обработки в PDF сразу?
Я сейчас вижу такой выход пока - после ScanKromsator отправляю в FineReader - распознаю и сохраняю в PDF там же. Конечно наверное качество будет нехорошим - но они там вообще сканируют в FienReader и сразу сохраняют в PDF - у меня хоть чистыми становятся после ScanKromsator.

Автор: TelecomUral, Отправлено:10:02 25-06-2019

bolega
при обработке нового задания в папке со старым без предупреждения затёрлись старые out-файлы. Нефигово получилось
Как я работал:
1. было старое задание (Рыбаков 1979). Пара страничек, пробные, на выходе в подпапке out 0001.tif, 0002.tif.
2. скопировал в основную папку два файла форзаца.
3. открыл СК 642, создал новое задание, подпапку в задании не переименовывал. Поставил выходной формат "original".
4. сделал драфт, снял automargins
5. нажал кнопку обработки одной страницы. Получил в подпапке out новый файл 0001.tif Потеря небольшая, но неожиданно.

Я-то хотел префикс отличающийся влепить. Раньше СК вроде всегда предупреждал, что перезатрёт выходной файл. Значит, он не в подпапку смотрит, а в состояние обработки внутри задания?

Добавлено:
Dracula
Можно (если я правильно расшифровал ваш "бессинтаксический" текст). В шапке есть ссылки на документацию. Почитайте, к примеру, Хрестоматию от daa.

Добавлено:
bolega
Что конкретно должна была сделать кнопочка Posterize auto, если я на файле выделил область, указал что цветов должно быть восемь, и нажал "posterize auto"?
У меня в результате постеризовался весь файл, а не выделенная область, и цветов (по кнопке info VR) - четыре. Работал с файлом страницы (он полноцветный). добавил: Вообще-то я ожидал что кнопка ещё заполнит палитру цветами.
Доп.сведения: перед тем, как я начал настраивать инструмент posterize auto, я пипеткой пару цветов выделил, накатил их (область постеризовалась) и сделал откат операции.

Автор: daa2013, Отправлено:14:57 25-06-2019

Так Хрестоматия в шапке пока не обновлена - версию 2.1. надо чуть раньше в ветке искать.

Автор: TelecomUral, Отправлено:15:04 25-06-2019


Цитата:
версию 2.1. надо чуть раньше в ветке искать

http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=140#8
https://yadi.sk/d/NrtuRm3cxbarIw

Автор: bolega, Отправлено:15:07 25-06-2019

TelecomUral

Цитата:
нажал кнопку обработки одной страницы. Получил в подпапке out новый файл 0001.tif Потеря небольшая, но неожиданно.

Вы наверно не обратили внимание, что такое поведение - во всех версиях СК!
Ключевое слово - "одна страница". Если вы обрабатываете только одну страницу (не все и не диапазон), СК не выводит никакого предупреждения. Обычно одну страницу обрабатывают: 1) для начального подбора параметров 2) для переобработки с другими параметрами. В обеих случаях предполагается, что это осознанное действие и предупреждать о наличии выходного файла не нужно. Тем более переобработка одной страницы - довольно типичная операция для постобработки. Была бы мука, если каждый раз СК надоедал бы предупреждением об очевидном.


Цитата:
и цветов (по кнопке info VR) - четыре

Алгоритм гарантирует не больше заданного кол-ва цветов. Но по факту может оказаться и меньше.


Цитата:
Вообще-то я ожидал что кнопка ещё заполнит палитру цветами

Для этого есть команда в контекстном меню. Вы не учли, что другим такой "бонус" может быть нафиг не нужен. Если вам нужно получить палитру - вызовите команду.


Цитата:
У меня в результате постеризовался весь файл

Наверно так и задумано. Если нужно авто ограничить выделением, сделаю.






Автор: TelecomUral, Отправлено:17:08 25-06-2019


Цитата:
Если вы обрабатываете только одну страницу (не все и не диапазон)

да, как-то не обращал внимания. спасибо. ситуация, когда мне оказался дорог предыдущий файл вообще редкая и этой кнопкой переобработки я редко пользуюсь.


Цитата:
Если нужно авто ограничить выделением, сделаю.

не уверен, что нужно. но применение палитры к выделению - работает по выделению. в принципе, полезное ограничение и в автопостеризации. если руки дойдут - хорошо бы.

Мне конкретно сегодня приспичило подправить у Рыбакова Геродотовой Скифии малоцветные картинки от грязи. То, что U235 опубликовал как дежавю. И СК тут пока что не помощник же?

Автор: TelecomUral, Отправлено:09:43 27-06-2019

bolega
Ковыряюсь потихоньку с автопостеризацией и тэ пэ.
Вроде как, если есть выделение, то команда "Add colors from image palette" не срабатывает. Если я всё правильно сделал

Появилась задача отсортировать палитру по яркости (а может и по преобладанию цветового тона). Хочу уменьшить число цветов палитры, по упорядоченному списку удобнее строить правую половину замен.

Автор: bolega, Отправлено:12:38 28-06-2019

TelecomUral
Учту ваши пожелания. Правда, не ранее осени. Сейчас жарко, сил корпеть над СК нет.
Заодно проверьте русификацию. В ini файл нужно прописать LangInt=1 (LangInt=0 для english). Пока что русифицировано только гл. окно. И поменять текст пока нельзя; потом сделаю через внешние файлы, можно будет любой язык подключать.

Автор: TelecomUral, Отправлено:12:46 28-06-2019


Цитата:
Заодно проверьте русификацию

кстати, да. сейчас грузил pdf, в окне импорта подсказка на галке skip blank pages не соответствует. Во всяком случае я прочёл русский текст ровно наоборот к английскому.

Автор: daa2013, Отправлено:02:56 30-06-2019

Есть ли в режиме Compare какая-нибудь кнопочка, которая заставляла бы исходное и обработанное изображение отображаться синхронно ?

То есть я масштабирую или двигаю одно , а точно также изменяется и другое ?

Автор: TelecomUral, Отправлено:19:24 30-06-2019


Цитата:
Пока что русифицировано только гл. окно.

Посмотрел бегло. Не понимаю принципы перевода. Скажем, на закладочке "Бинаризация" пометка "Convert to b/w threshold:" остаётся. И все английские термины, например Low/High на ползунках - они же останутся? Или вообще всё переедет в русский? А со спецтерминами как? Типа "Lin/Qua" для градиента бинаризации. Или тип зон. Сейчас они остались оригинальными наименованиями.

Извините, скажу как ощущаю: ерунда. Частичный перевод имеет мало смысла (для кого он? тут либо человек ноль в неродном алфавите, либо ему без разницы какой алфавит), а полный человеку с опытом использования программы - сильно не по нутру. Как мы "старперы" будем потом понимать новичков, когда они напишут что-нибудь навроде "блок-зона" вместо "exclude-зона"? Отвечать им как, в каких терминах? Ради переписки обязательно удваивать объём изучения понятий? Хм?..
Кстати. Что, планируется и корейский вариант? Кто переписываться будет и на каком языке...
Глядя на перспективу развития общества, считаю что люди без умения хотя бы складно прочесть английские буквы - исчезнут. Выучатся.

Ну ладно, это лирика.
Кое-где гл.меню осталось недопереведённым. "Вид/Antialias thumbnails" и "Изображение/Специальные команды/...". Это из того, что я увидел, ещё не подгрузив файлы. Надо предложить перевод в подобных местах?

Автор: bolega, Отправлено:22:18 30-06-2019

Ерунда есть, потому что я еще не закончил переводить. Просто не дошли руки до всего. Оказалось, что это довольно трудная работа. Но английских терминов не останется.


Автор: allo04, Отправлено:14:52 01-07-2019

del

Автор: shch_vg, Отправлено:13:41 12-07-2019

bolega
Рискну запросить еще одну "хотелку".
Часто приходится имеющиеся сырые сканы помещать в пдф для передачи или длительного хранения. Также часто у этих сканов есть дополнительная ненужная информация за пределами текстового прямоугольника, а именно , например, часть соседней страницы разворота или поле сканирования за пределами страницы, которую бы хотелось не помещать в пдф.
В СК на первой странице устанавливаю рамку вокруг текста с полями, отрезающую этот ненужный довесок и распространяю позиции резаков на последующие сканы.
Но в большинстве случаев на следующих сканах распространенную рамку надо сдвигать как правило как по горизонтали, так и по вертикали.
Держу нажатым CTRL и сдвигаю сначала правый резак, затем перехожу на нижний, т.е. два действия. На несколько сотнях сканов это довольно скучное занятие.
Здесь появляется "хотелка".
Нельзя ли в пересечении правого и нижнего резака сделать зону, которая появляется при установки на нее курсора и нажатом CTRL в виде, допустим, окружности и позволяет тащить в нужном направлении сразу всю рамку причем с возможностью поворачивать ее в зависимости от кривизны скана?

Автор: SVN75, Отправлено:18:21 27-07-2019

Господа, подскажите, пожалуйста, есть ли хоть какие-то методы борьбы с вот такими дефектами печати, кои отмечены на рисунке (я не знаю, как такие дефекты правильно называются). Именно печати, а не сканирования. Я понимаю, что в целом без использования искусственного интеллекта проблема не решаема, но хоть как-то облегчить ситуацию возможно?

Ссылка

Автор: shch_vg, Отправлено:21:11 27-07-2019

SVN75

Цитата:
но хоть как-то облегчить ситуацию возможно?

Периодически поднимаемый вопрос.
Только ручками...

Автор: SVN75, Отправлено:21:27 27-07-2019

shch_vg


Цитата:
Только ручками...


М-да... ужасная перспектива.

Автор: TelecomUral, Отправлено:12:21 28-07-2019


Цитата:
но хоть как-то облегчить ситуацию возможно

закажите спецсофт толковому программисту Сдвинете ситуацию с мёртвой точки.

Автор: daa2013, Отправлено:03:12 02-08-2019

6.42

В picture zone properties не запоминается изменение threshold бинаризации.

Поставил раскрашенную зону, обработал, увидел утраты, закрыл RV, изменил порог, переобработал,
изменений не увидел, полез в свойства зоны - порог снова нормал (Default).

Update
Эффект воспроизводится нерегулярно, но воспроизводится. Буду пытаться понять, при каких точно условиях и действиях.

Автор: TelecomUral, Отправлено:06:28 04-08-2019

В 6.42 обнаружил такое поведение: оставляю страницу полноцветной, пробую постеризовать кусочек. Сначала его приближаю, выделяю область, постеризую её, нравится, откатываю, снимаю выделение (мышкой щёлкаю мимо него), затем жму кнопку с дискетой и стрелкой (отмасштабировать в полный лист). Жму "Apply palette" и обнаруживаю, что выделение сохранилось и палитра применилась только к нему.

Автор: TelecomUral, Отправлено:07:24 05-08-2019

оффтоп
SVN75

Цитата:
есть ли хоть какие-то методы борьбы с вот такими дефектами печати

вспомнил, что в ветке про ST хвалили самописную программку удаления этой грязи.
http://forum.ru-board.com/topic.cgi?forum=5&topic=32945&start=2820#14
сам не юзал, ничего сказать не могу.

Автор: allo04, Отправлено:19:34 05-08-2019

Версия 6.42.
Разворот книги. Как сделать, чтобы на выходе страницы получились одинакового размера, при этом добавились поля к левому развороту и не добавились к правому.
Файлы прилагаю https://cloud.mail.ru/public/5qPJ/5jVdWHSCP

Автор: niccolo, Отправлено:19:59 05-08-2019


Цитата:
Разворот книги. Как сделать, чтобы на выходе страницы получились одинакового размера, при этом добавились поля к левому развороту и не добавились к правому.


Просто выставляете нужную ширину страницы, а картинку центрируете на ней слева или справа

Автор: TelecomUral, Отправлено:09:06 06-08-2019

allo04

сорри за многословие.

1. отделим страницы без полей
- установим у них spec gaps на закладке Page, со всех четырёх сторон. А на закладке Book сделаем его значение =0, если оно ненулевое;
- установим вокруг этих страниц резаки по краям, если нужно то наклоним их. deskew по вкусу, в данном случае я галку снял, но можно и точный угол установить, если автомат не справляется. Верхний край я слегка срезал, поставив резак так, чтобы он пересёк центр верхнего обреза правой страницы;
- лайфхак: в сложных случаях, когда разворот косой (книга неровно распластана по стеклу), и требуется разный наклон резака для половинок, можно сдублировать скан, это в списке файлов щелчок ПКМ на скане, будет меню;
2. определим нужный размер всех страниц книги
- установим Gap на закладке Book с запасом, я поставил 220 для dpi-output=600;
- сделаем Process;
- после сразу согласимся чтобы СК рассчитал book size;
- посмотрим в окне VR, в режиме Thumbs, что получилось. Если бы была вся книга, то можно отсортировать превьюшки страниц по размерам. А на одном развороте и так всё видно в пределах одного экрана;
- правая страница задает мне габариты книги (снизу окна в квадратных скобках, у меня 3196х4896);
- проверяем для левой страницы что числа в КРУГЛЫХ скобках (то есть после добавления к контенту полей) совпадают с габаритами книги;
3. уточним, если не совпадают, габариты книги
- прикидываем, надо ли поменять Gap (по умолчанию 70, мне мало, но это дело вкуса);
- если какой-либо контент зацепил грязь по краю страницы, и из-за этого габарит книги рассчитался ненормально большим (так вышло у меня, потому что в контент захватились черные полоски снизу и сверху левой страницы, и вертикальный gap приплюсовался к ним), то сдвигаем мышкой пунктирную границу контента к тексту
- если меняли границу контента, то в главном окне пересчитываем book size (в меню)
- проверяем повторно, что на всех страницах числа в круглых скобках одинаковые
4. финализируем, т.е. добавим поля в файлы страничек на диске
- проверяем центровку каждой страницы, и совпадение половинок рисунков на разворотах, если такие в книге есть (режим Two pages)
- вызываем в главном окне в меню Finalize
4доп. Если на некоторых страничках без полей будут некрасивые белые полоски в несколько пикселей, их можно потом подрезать в окне VR командой crop. Тут уж по вкусу, от оформления книги зависит. Где-то можно и оставить полоску, а где-то она глаз режет.

Может быть, всё в данном случае можно было сделать намного проще.

Могу и видео выложить, вечером, если текст неясен.

Автор: allo04, Отправлено:14:53 06-08-2019

TelecomUral
Да, спасибо, но от видео тоже не откажусь.

Автор: shch_vg, Отправлено:19:17 06-08-2019

TelecomUral

Цитата:
Если на некоторых страничках без полей будут некрасивые белые полоски в несколько пикселей, их можно потом подрезать в окне VR командой crop

А они обязательно будут, если исходный лист был повернут.
А ничего, что в результате этого выходные сканы будут иметь разные размеры?
Мне приходится в таких случаях кропнутые сканы расширять до размеров закладки "Book" в ирфане.
Вот если бы это можно было подрезать по команде Crop&resize...

Автор: SVN75, Отправлено:20:28 06-08-2019

TelecomUral


Цитата:
вспомнил, что в ветке про ST хвалили самописную программку удаления этой грязи.
http://forum.ru-board.com/topic.cgi?forum=5&topic=32945&start=2820#14
сам не юзал, ничего сказать не могу.


Пробую с этой программой проводить эксперименты. Вообще неплохо, даже на первый взгляд. Буду дальше варьировать параметры. Одна беда, урезает многие запятые и точки. Спрошу разработчика в той ветке можно ли тут что-то сделать.

Большое спасибо за «наводку»!

Автор: TelecomUral, Отправлено:07:02 07-08-2019

shch_vg

Цитата:
А ничего, что в результате этого выходные сканы будут иметь разные размеры?

Я же написал "на вкус".


оффтоп

Самый тяжёлый вариант это когда сквозь переплёт просочился клей, или просто переплёт не разгибается в 180 град (клееный, или жёсткий картон, или пробитый скрепками...). Тогда в пакете сканов возникает несколько страниц типа таких вот изогнутых у корешка:





Они а) неодинаковы по габаритам и б) по-разному косые.

Я не вижу проблемы выделить среди них максимальные габариты, сделать для обычных страниц с полями эти габариты стандартными, а те, что вышли чуть-чуть поменьше, оставить как есть (можно подкрасить клин, залить в окне VR). Если нормально сосканено, то я не припомню случая чтоб срез был более 50пкс. Обычно 6-20, а то и меньше. Ну будет гулять размер в меньшую сторону, ну и что?
А вот если растягивать, то будет необратимое ухудшение читаемости (резкости) и может быть несостыковка смежных картинок.
Пример: когда slava_kry делал ДЭ1 том про советские республики, то там есть развороты с вклейками. Поля были выбраны неправильно, завышены, но при попытке растянуть вклейку под обрез книги начинала бить в глаза несуразность, несочетаемость сходных элементов слева и справа. И они уходили с линии параллельности. То есть художник делал именно разворот, он был гармоничен. Масштабирование правой половинки всё убивало. А если левой, то там шрифт становился крупнее, тоже не фонтан.

Мораль: если в книге есть листы под обрез, выставляйте габариты книги точно

Автор: TelecomUral, Отправлено:18:45 08-08-2019

allo04
положил ролик на ютуб.

Автор: allo04, Отправлено:11:41 09-08-2019

TelecomUral
Спасибо, все очень информативно.
Всегда лучше один раз увидеть...

Автор: TelecomUral, Отправлено:07:57 15-08-2019

bolega
Команда "Change threshold..." на закладке Binarization не вызывается для правой страницы разворота. Нет в меню по ПКМ.

Автор: igogo22, Отправлено:16:16 15-08-2019

Вылезла проблема с импортом картинок в pdf в Кромсатор.
https://we.tl/t-UVGlobM6Pb
Выдает ошибку "Возможно, файл открыт другим приложением или запаролен."
Проперти файла говорят что он не запаролен. Все другие программы его открывают без проблем.

Автор: TelecomUral, Отправлено:05:21 16-08-2019


Цитата:
Вылезла проблема с импортом картинок

интересно, что эта страничка и тиффом lzw в СК не залазит. пока её немного не подрихтуешь, убрав часть черного (я удалял автомобили).

Автор: bolega, Отправлено:07:56 16-08-2019

TelecomUral

Цитата:
Нет в меню по ПКМ.

Так и задумано.
Это для того, чтобы не подумали, что команду можно применять только к левым или только к правым половинкам разворота. Она применяется только целиком.

Автор: igogo22, Отправлено:13:09 19-08-2019


Цитата:
Вылезла проблема с импортом картинок в pdf в Кромсатор.
https://we.tl/t-UVGlobM6Pb


Цитата:
пока её немного не подрихтуешь, убрав часть черного

Ну для меня это не вариант. Надо книгу "как есть" сделать.
Первый раз не знаю что делать, или как обойти.

Автор: shch_vg, Отправлено:14:15 19-08-2019

igogo22
TelecomUral

Цитата:
пока её немного не подрихтуешь, убрав часть черного

Я загрузил пдф в Nitro_PDF_Professional_7.3.1.10, сохранил с другим именем, после чего СК импортировал скан из пдф.
Думаю, это же сработает в любом другом ПДФ-эдиторе.

P.S. Хватило даже просмотрщика Foxit Reader.

Автор: TelecomUral, Отправлено:12:38 20-08-2019


Цитата:
сохранил с другим именем

?!
я вообще в тифф страничку экспортнул... и нифига.
мне ещё показалось странным, что число цветов в тиффе - 257, а с виду страничка чб. Не люблю таких совпадений

Автор: shch_vg, Отправлено:13:14 20-08-2019

TelecomUral

Цитата:

?!

Чтобы не затирать исходный пдф!
Можно сохранять и с тем же именем.

Цитата:
я вообще в тифф страничку экспортнул... и нифига.

Вот и ответ на вопрос: кривые свойства скана в пдф, только СК чувствителен к этому.

Вопрос: как Вам удалось извлечь кривой скан?
У меня после AcrobatPro и Nitro_PDF_Professional получаются тифы, которые СК нормально читает.

Автор: TelecomUral, Отправлено:15:13 20-08-2019


Цитата:
Вопрос: как Вам удалось извлечь кривой скан?

PDFXсhange Viewer 2.0 build 42.6
Он у меня давно-давно установлен как базовый просмотрщик pdf дома. Но в этом году стал обнаруживать, что он частенько глючит. Я вообще-то pdf-файлами не пользуюсь, так что может программа просто древняя. Когда-то её хвалили.
Настройки экспорта страницы, насколько помню - tiff lzw 24bit 600 точек.
UPD
Вот
https://yadi.sk/d/QxhoI12kY_14Rg

Автор: shch_vg, Отправлено:16:59 20-08-2019

TelecomUral

Цитата:
PDFXсhange Viewer 2.0 build 42.6
.......................................................
Настройки экспорта страницы, насколько помню - tiff lzw 24bit 600 точек.

Нашел у себя именно эту версию, но экспортируемый ею скан с Вашими параметрами СК принимает нормально.


Добавлено:

Цитата:
Вот
https://yadi.sk/d/QxhoI12kY_14Rg

Выложенный Вами скан содержит 512 цветов и нормально загружается в СК.
Кстати, у меня получился абсолютно похожий импортированный файл.

Автор: TelecomUral, Отправлено:17:48 20-08-2019


Цитата:
Выложенный Вами скан содержит 512 цветов и нормально загружается в СК.




upd

Более того, тифф пришлось упаковать в rar, потому что его и яндекс-диск отказался загружать.



Не знаю что и думать... md5=5CE789C740B9AE50E9E7C705B44DFF41

Автор: shch_vg, Отправлено:19:00 20-08-2019

TelecomUral
А вот что показывает ирфанвью на Вашем файле к1.tif:

Разучился загружать на ради-кал
Сейчас выложу в другое место.

Вот

Автор: TelecomUral, Отправлено:07:48 01-09-2019

bolega
Вы не глядели этот проблемный pdf?

Автор: bolega, Отправлено:10:58 01-09-2019

TelecomUral
А чего там глядеть. Открывам его в блокноте как текстовый файл и в самом конце что мы видим? Тэг "startref". Такого тэга нет и никогда не было в стандарте pdf. Должен быть "startxref"! Буква "x" пропущена.
Похоже, этот pdf создала какая-то глючная кустарная программа или скрипт. Отсутствие или повреждение Trailer-блока pdf-файла для большинства просмотрщиков не является фатальным. Дело в том, что pdf формат довольно избыточный, часть его блоков можно иногда восстановить проведя полный анализ всего файла. Но СК этим не занимается, у него другие задачи.

Автор: shch_vg, Отправлено:14:50 01-09-2019

bolega

Цитата:
Тэг "startref".

Отсутствие х одна из причин неимпортирования из пдф.
Добавление х в исходный кривой пдф оставляет его кривым.
А вот
Цитата:
Отсутствие или повреждение Trailer-блока pdf-файла для большинства просмотрщиков не является фатальным.
, по-видимому, является причиной кривизны, т.к. файлы пдф, полученные сохранением кривого пдф в любом пдф-эдиторе, увеличиваются более, чем на 100 байт.

Автор: bolega, Отправлено:16:23 01-09-2019

shch_vg

Цитата:
по-видимому, является причиной кривизны, т.к. файлы пдф, полученные сохранением кривого пдф в любом пдф-эдиторе, увеличиваются более, чем на 100 байт.

После обнаружения бага в startref я дальше не стал уже копать, возможно, там еще чего-нибудь не хватает. При сохранении редакторы заново генерируют trailer-блок, уже корректный.

Автор: TelecomUral, Отправлено:21:12 01-09-2019

ясно, спасибо.

ну а экспортированный тифф? с ним-то что не так?

Автор: shch_vg, Отправлено:22:19 01-09-2019

TelecomUral

Цитата:
ну а экспортированный тифф? с ним-то что не так?

Экспортированный Вами?
У меня с ним все так.
Но у Вас другая операционная система...

Автор: TelecomUral, Отправлено:06:46 02-09-2019

shch_vg
Вы хотите сказать, что СК и draft его делает?? У меня-то не делает.

Автор: bolega, Отправлено:09:28 02-09-2019

TelecomUral
а что не так. После пересохранения из акробата СК нормально его открывает и обрабатывает.

Автор: TelecomUral, Отправлено:10:42 02-09-2019

bolega
тот тифф, который на ЯД в раре лежит, он в СК не лезет.
Может, ещё что-нибудь обнаружится с кривизной...

Автор: bolega, Отправлено:16:18 02-09-2019


Цитата:
тот тифф, который на ЯД в раре лежит, он в СК не лезет.

Лезет, но на последней строчке дает сбой, как будто данные обрываются. Она белая, поэтому сбой визуально не заметен. В главном окне СК такие ошибки не считаются фатальными (чтобы можно было хоть что-то показать), а при обработке это считается грубой ошибкой.

Автор: DmitryKz, Отправлено:17:48 04-09-2019

Ребята, напомните, плиз, как выделять в режиме редактирования зоны область вокруг рамки таблицы? Запамятовал — делаю Ctrl+Shift+Клик, должны вроде как выделиться белые пиксели вокруг рамки, а у меня выделяются и внутри рамки.


Добавлено:
При увеличении обнаружил микрощели в рамке, поэтому и выделялось все.

Автор: D1D1D1D, Отправлено:13:53 06-09-2019

Привет. После запуска FINALIZE, у меня вторая половина файлов получилась почему-то со смещенным блоком текста - то есть, поля добавились, но сам текст уехал вплотную в верхний левый угол TIF-файлов. С чем это может быть связано?

Автор: D1D1D1D, Отправлено:18:07 06-09-2019

И как настроить, чтобы имена обработанных файлов, соответствовали именам исходных файлов?

Автор: bolega, Отправлено:18:11 06-09-2019


Цитата:
чтобы имена обработанных файлов, соответствовали именам исходных файлов?

Задать Output prefix = *


Цитата:
добавились, но сам текст уехал вплотную в верхний левый угол TIF-файлов

насколько вплотную? в ноль? Может, включили spec.gaps? Гориз выравнивание чему равно?


Автор: D1D1D1D, Отправлено:01:21 07-09-2019



Добавлено:
Публиковались ли здесь какие-нибудь готовые минимальные настройки (task), достаточные для обработки большинства файлов, чтобы можно было подключить их, как шаблон?

Автор: VadimirTT, Отправлено:01:47 07-09-2019

D1D1D1D
Профили же есть. Пусть люди поделятся.

Автор: bolega, Отправлено:09:45 07-09-2019

D1D1D1D

Цитата:
Может, включили spec.gaps?

Включается на закладке Page, индивидуально для каждого файла.
И не отключено ли там Automargins


Цитата:
Публиковались ли здесь какие-нибудь готовые минимальные настройки (task), достаточные для обработки большинства файлов

По умолчанию так и есть (default профиль). Только многие начинают зачем-то отключать то, что не надо, и включать то, что не требуется
На скриншоте видно, что размеры книги еще не рассчитаны. Чего же вы ожидаете тогда?

Автор: D1D1D1D, Отправлено:10:13 07-09-2019

С «spec.gaps» и «Automargins» вроде все как надо:

Выходит, так было из-за не рассчитанных размеров? Но в одном руководстве писалось, что Page width и height надо оставлять в Auto. Как правильно задать размеры?

Автор: bolega, Отправлено:10:33 07-09-2019

D1D1D1D

Цитата:
писалось, что Page width и height надо оставлять в Auto

Все верно.
Когда все страницы обработаны, СК предложит сам рассчитать размер книги. Если не все файлы обработаны, или обработка выполнялась кусками, то может сам и не предложить. В любом случае можно всегда дать команду Process > Calculate book size. СК рассчитает размеры на основании того, что уже готово. Auto заменится на Fixed. Если размеры/поля/выравнивание не устраивают, можно их менять, обработку делать не надо, результаты скажутся сразу. При условии, что финализация не сделана. Когда все устроит, только тогда можно дать команду финализации.

Автор: D1D1D1D, Отправлено:12:39 07-09-2019

bolega
Ясно, спасибо! Видимо, не все страницы посчитались обработанными, потому что первая была с разворотом, и я на ней резаки уточнил только после обработки всех.

Автор: D1D1D1D, Отправлено:18:22 07-09-2019

Когда выбираю Exclude zone, чтобы картинка не затемнялась — после Process -> Current file эффекта это не даёт.


Автор: gerxer, Отправлено:10:44 13-09-2019

Настройка внешних программ и утилит:
4. В настройках СК File>Options>Apps>DjVuDecode укажите полный путь к файлу DjVuDecode.exe, напр., "C:\Program Files\Utilities\djvu-decode\DjVuDecode.exe"

Скачал в официального сайта DjVu Small (Mod), но в папке нет DjVuDecode.exe и кромсатор не видит его.

Автор: TelecomUral, Отправлено:17:32 13-09-2019

gerxer
а шапка темы на что. там версия 5.96.1. и там утилиты.

Автор: sergiokapone, Отправлено:20:49 27-09-2019

bolega, а есть возможность применить цветовую палитру к серии выделенных файлов?

Автор: asku, Отправлено:16:27 17-10-2019

Добрый день.
Подскажите пожалуйста! Заранее скажу, что пдф-справочник смотрел и ответ не нашел.

Как выставлять резаки для книги с такими сканами? То есть, чтобы программа не захватывала ненужное пространство (то есть фрагмент соседней страницы).
Книга очень большая (более 1200 страниц), и если начну вручную поправлять каждую страницу, то на это уйдет очень много времени.

Спасибо!


Автор: TelecomUral, Отправлено:18:01 17-10-2019

asku
а сканы по внешнему виду (положению линии корешка) - стандартны? Тогда размножьте положение "через один скан". ПКМ на головке резака для 6.00.5.

Кстати, тщательная проверка резаков, точно ли они стоят, всё равно необходима. Глазками.

Автор: asku, Отправлено:18:40 17-10-2019


Цитата:
а сканы по внешнему виду (положению линии корешка) - стандартны?


Стандартны. То есть -- то слева, то справа. Но я книгу в сканере клал не строго по одной линии (не знаю как это объяснить), так что резаки даже «через один скан» все равно не всегда верно выставляются.

Автор: TelecomUral, Отправлено:04:42 19-10-2019

asku


Цитата:
не всегда

мне кажется, такого инструмента нет, чтобы логически заблокировать кусок контента от опознавания. Алгоритм, как я понимаю, тупо ищет с края блок текста, с некоторыми особенностями. Сказать алгоритму "а если нашел узкую полоску то ты её пропусти" - нельзя.

Во всяком случае 1200 страниц всё равно отсматривать Так что поставьте это примерное положение резака в наиболее массовое положение корешка, чтоб поменьше мышкой двигать. Не так страшен чёрт. Я 1800 страниц отсматриваю сейчас, и ничего.

Ещё есть галка "Ignore if the existing cutter closer to the text". Но что-то я не подберу версию её использования в вашем случае.

Автор: bolega, Отправлено:08:51 19-10-2019

asku
В draft на закладке Preprocess задайте опцию Pre-cut. Она работает именно для игнорирования куска слева или справа (либо попеременно для неч/чет страниц). Выделите все страницы где кусок слева, задайте precut = left и выполните draft при range = selected. Затем сделайте то же самое но для страниц right. Можно делать и для всего диапазона, если задать precut = left, right (или right,left в зависимости от того, с какой стороны начнется появление куска).
Размер игнорируемого куска задается там же в долях ширины страницы. В вашем случае достаточно 1/6 или 1/7. Его стоит задавать с небольшим запасом, т.е. не стремиться подрезать очень близко к полезному тексту.
Кстати, размер доли можно посмотреть в главном окне: включить левый резак, подвести в место, до которого контент нужно игнорировать и в КМ резака выбрать команду Metric

Автор: VadimirTT, Отправлено:18:40 19-10-2019


Цитата:
В draft на закладке Preprocess задайте опцию Pre-cut.

"Очевидно, Ватсон!" (с)

Автор: asku, Отправлено:10:35 20-10-2019


Цитата:
В draft на закладке Preprocess задайте опцию Pre-cut. Она работает именно для игнорирования куска слева или справа (либо попеременно для неч/чет страниц). Выделите все страницы где кусок слева, задайте precut = left и выполните draft при range = selected. Затем сделайте то же самое но для страниц right. Можно делать и для всего диапазона, если задать precut = left, right (или right,left в зависимости от того, с какой стороны начнется появление куска).


Получилось. Спасибо!

Автор: SVN75, Отправлено:23:31 24-10-2019

Добрый вечер!

Хотелось бы попросить уважаемых гуру помочь советом в том как «эффективно разобраться» с книгой несколько страниц которой я выложил по этому адресу. Качество невысокое (возможно делали снимки экрана со страниц на сервере Google books или Amazon или чего-то подобного). Я добросовестно почитал инструкции к использованию функций, представленных на панели «Quality» СК, и поэкспериментировал с параметрами, вроде «Blur/Sharpness», «Illumination» и прочими, но мне так и не удалось добиться мало-мальски пристойного результата. Понятно, что из такого худого изображения конфетку не сделаешь, но хотелось бы понять до какого качества можно «дотянуть», поэтому я и прошу взглянуть профессиональным глазом и посоветовать куда копать. А если не поленитесь чуть объяснить, почему имеет смысл копать именно в эту сторону, то я буду очень признателен (именно эти функции во всех самиздатных руководствах описаны хуже всего, к тому же рискну предположить, что некоторые из них работают не совсем так, как можно ожидать из названия, или имеют столь ничтожный эффект, что никому пока не удалось обнаружить оный).

Автор: Archivist, Отправлено:23:59 24-10-2019

SVN75
Скриншоты в PDF не могут отображаться в масштабе 1:1 и замыливаются, вероятно в этом вся проблема.
Можно перепаковать их в CBR и смотреть в оригинальном размере.


Автор: SVN75, Отправлено:19:34 25-10-2019

Archivist
Спасибо за идею. Я конвертировал (в помощью Calibre). Две страницы могут быть найдены здесь и здесь. Но проблема всё же в низком качестве сканирования (или, как мне по-прежнему думается, снимков экрана с чего-то вроде Google books, где качество изображения занижают целенаправленно). Вопрос можно ли его хоть как-то улучшить с помощью СК остаётся. Кстати, если сосканировано качественно, то и в pdf более или менее смотрится, хоть формат и не для этого предназначен, разумеется.

Автор: daa2013, Отправлено:20:35 25-10-2019

У меня в два действия (обычная бинаризация без кволити, но есть апсемплинг) так получилось:
https://yadi.sk/d/hX0bMBMp1EmmVg

Автор: SVN75, Отправлено:21:13 25-10-2019

daa2013

Спасибо. У меня такой эксперимент даёт чуть худшие, но, в принципе, похожие результаты (пробовал выходное разрешение ставить «twice greater» и 600, а resample filter — bicubic). Собственно вопрос сводится к тому, можно ли что-то улучшить, манипулируя параметрами на вкладке качества (методом тыка плохо получается, больно там много всего, надо всё же хотя бы качественное понимание иметь что там есть что).

Автор: shch_vg, Отправлено:17:30 04-11-2019

bolega
Не смог импортировать этот пдф (45,9 мб), СК просто молча создает выходную директорию и все.
Акробат импортировал нормально.
Похоже проблема в первых 8 сканах, т.к. СК 5.93 вытаскивает, начиная с 9-го скана.

Автор: chesskom, Отправлено:19:41 04-11-2019

(...)

Автор: shch_vg, Отправлено:21:33 04-11-2019

chesskom
Я же написал:
Цитата:
Акробат импортировал нормально.
, а выложил это я для автора программы, если ему это интерсно.
Что-то похожее уже было недавно.

Автор: Kazakalitopus, Отправлено:15:21 29-11-2019

Коллеги, прошу не бить за совершенно тривиальный вопрос, но он сводит
с ума. Только что обработал книжку целиком (нажал кнопку Process).
Открылось окно Result View. Вижу обработанные страницы, еще не
финализированные, листаю. Содержимое страницы выделено желтым
фоном. Подправляю (двигаю мышкой поля, если надо). Вижу какую-то
грязь, которую хочу удалить. Рука тянется выделить прямоугольник мышкой
и нажать delete. Но мышка не выделяет! Пытаюсь сменить тип выделения
на эллипс - меняется, но мышка не выделяет. Пытаюсь выбрать ластик
в ряду иконок - выбирается (кнопка становится как бы нажатой), но
форма курсора не изменяется, остается стрелка, а не прямоугольник.
И так же с метлой, magic wand и т.д.
Что не так? Что-то изменилось в интерфейсе за последнее время?
(Я не пользовался кромсатором несколько лет, версия сейчас у меня
5.96.2, ей успешно пользовался, хотя уже не помню, чистил ли что-то
в Result view или и без того получалось). Или я схожу с ума?
Полистал документацию, все советы и ответы обычно начинаются
со слов "выделите мышкой и..." Но она не выделяет!
Или это происки Windows 10?
Помогите, не дайте пробить монитор головой!

Автор: SVN75, Отправлено:18:16 29-11-2019

Kazakalitopus
Так оно всё не будет работать, покуда финализация не завершена. Если все поля подвинуты куда надо, то закрываете Result view, далее Process / Finalise / All. Или по одной страницы финализировать через контекстное меню прямо в Result view. Тогда все инструменты заработают.

В 5.96.2 всё работало поскольку там финализация не была принудительной, как в последней версии.

Добавлено:
Не совсем удобно такое спрашивать, но меня что-то заклинило и не понимаю как сделать несложную (наверное) вещь. И таки-да я пробовал прочесть материалы, упомянутые в шапке этой темы, но там про подобную проблему не говорится (или я не понял, хотя честно пытался).

Итак, на странице помимо текста есть цветной рисунок, который помещён в picture-зону. При этом в зоне оказывается и часть белого пространства вокруг рисунка (он имеет сложную форму) с мелкими speckles (грязь). При обработке грязь вне зоны исчезает, но внутри оной, разумеется, остаётся. Далее в свойствах зоны есть параметр Despeckle (их даже два: Despeckle source area и просто Despeckle; я не понимаю, чем они отличаются и на всякий случай включил оба). Обрабатываю с этими параметрами. Эффекта — нуль! Грязь внутри зоны продолжает прекрасно себя чувствовать. Не то, чтобы было так уж сложно убрать её в руками Photoshop, но хочется понять как это должно работать.

Автор: shch_vg, Отправлено:21:08 29-11-2019

SVN75
В RV в верхнем меню выберите вместо One page вариант Zones и там издевайтесь над картинкой, как хотите.
Другой вариант: сначала делаете merge зоне, а потом чистите на странице.

Автор: SVN75, Отправлено:22:04 29-11-2019

shch_vg
Спасибо! Совет улучшил положение. Photoshop уже точно не понадобится. Но грязь всё же не убирается стандартным инструментом (Mouse-up despeckle). Её можно вычистить с помощью mouse-up clear или ластика, но мне хотелось бы понять почему же всё-таки не работает despeckle ни в каком варианте.

Автор: asku, Отправлено:11:59 30-11-2019

Добрый день. В СК можно выставить текст по центру (Page h.align=С, Page v.align=С).
Но что делать если текст в книге выровнен не совсем по центру, а чуть вверх (см. рис.). Конечно, не велика ошибка будет все выровнять по центру страницы. Но хочется аутентичности?
Как быть? Вручную двигать на заданную величину?
Спасибо.


Автор: shch_vg, Отправлено:13:41 30-11-2019

asku
При выравнивании по центру этот текст перед финализацией располагается в центре в желтом прямоугольнике.
Оттащите нижнюю рамку вниз, расширенный прямоугольник снова выравняется по центру, а текст поднимется повыше.

Автор: TelecomUral, Отправлено:11:43 01-12-2019


Цитата:
мне хотелось бы понять почему же всё-таки не работает despeckle ни в каком варианте

так рисунок цветной же. спеклы чистятся только на чб материале.

Автор: SVN75, Отправлено:12:20 02-12-2019

asku
В принципе, это можно сделать точно, если очень важно. На вкладке «Page» раскрываете выпадающий список «Spec. gaps» и устанавливаете флажок для, допустим, «T». Выбираете тот же «T» для «Page v. align». Переходите на вкладку «Book» и задаёте в поле с тем же названием значение желаемого отступа сверху в пикселях (разумеется, его нужно сначала замерить в миллиметрах и перевести в пиксели, учитывая разрешение монитора; там вроде даже можно прямо миллиметры выставить в списке «Units», но знающие люди говорят, что так будет глючить, хотя ничто не мешает попробовать, может разработчик уже и поправил, я не пытался). Дальше всё как обычно.

Впрочем, на мой взгляд это всё слишком большая головная боль. Я бы обработал со стандартными настройками, а потом подогнал бы руками, используя режим отображения «Compare» в окне «Result view». Вполне можно с точностью до пары миллиметров так выровнять.

P. S. Мне любопытно, а что это за язык такой интересный издания из Вашего примера?

TelecomUral
Да, действительно, что-то я не сообразил такой очевидной вещи. Спасибо!

Автор: arnyc, Отправлено:21:31 10-12-2019

Подскажите, каким образом сделать в SK приемлемый деварпинг этого примера фотки страницы книги снятой в JPEG с руки камерой смартфона, с помощью каких функций и с какими параметрами?

Автор: niccolo, Отправлено:21:53 10-12-2019


Цитата:
Подскажите, каким образом сделать в SK приемлемый деварпинг этого примера фотки страницы книги снятой в JPEG с руки камерой смартфона, с помощью каких функций и с какими параметрами?


Похоже на лист из книги с Archive.org. Подушку лучше устраняет букресторер. А сами файлы без заморочек и настроек перегнать в ч/б можно файнридером. Если извлекать - там какой-то геморройный двухслойный тифф как правило.

Если у кого то есть настроенный шаблон для книг с archive.org для SK - тоже было бы интересно.

Автор: shch_vg, Отправлено:00:00 11-12-2019

arnyc

Цитата:
деварпинг

А если то же самое, но по-русски?
Если это выпрямление строк, то СК этого не делает.

Автор: bolega, Отправлено:15:13 11-12-2019

niccolo

Цитата:
Если у кого то есть настроенный шаблон для книг с archive.org для SK

Там разные типы сканов. Какие именно у вас вызвали затруднения?

Автор: xMARx, Отправлено:19:07 12-12-2019

__Всем привет. Использую версию СК 6.00.5. Не знаю, указывал ли кто-то на проблему или нет. На всякий пожарный опишу ее:
__1. Производим бинаризацию исходного 2-страничного скана (ctrl+p);
__2. В начале в окне "Result view" финализирую страницу. Режим просмотра -One page;
__3. Выбираю ластик и стираю им линию на ЧБ скане.
__4. Далее не убирая ластик перехожу в режим Compare (СК спрашивает, нужно ли сохранять скан - сохраняем). Теперь видим слева исходную страницу, справа- ЧБ скан.
__5. Пытаемся ластиком (он никуда не делся) стереть на этом скане что-нибудь - не получается. Более того включается прямоугольное выделение.
__6. Два раза нажимаем на ластик на панели. Он выключается. Тыкаем на скан - выделение пропадает.
__7. Далее снова нажимаем на ластик и уже можем стирать им линии (или рисовать черным цветом)
без назойливого прямоугольника. Вроде бы все нормально...
__8. При попытке сохранить изменения на скане (ctrl+s), который обрабатывался в режиме compare, вылетает ошибка.

Автор: shch_vg, Отправлено:16:47 21-12-2019

bolega
Заметил странность как на версии 6.00.5, так и на версии 6.41.
Загружено несколько сканов, помечены все и, допустим, левый резак у сканов не вертикальный, а смещенный. Становлюсь на первый скан, двойным щелчком на расширении резака делаю его строго вертикальным, затем распространяю положение резака с этого скана на все последующие через "Copy current position to..." для первой версии и "Copy current state/position to..." для второй при выбранной команде "Copy position", выбрав опцию "All down".
В обоих версиях получаю неожиданный результат на любом последующем скане с невертикальным левым резаком, а именно, верхнее положение резака остается на месте, нижнее положение перемещается в положение на скане, где выполнялась команда.
Так же непредсказуемо копируется не строго вертикальный резак, т.е. для последующих строго вертикальных резаков устанавливается строго вертикальное положение по нижнему положению копируемого резака, для не строго вертикальных последующих резаков передвигается только нижняя часть резака, а верхняя остается прежней.
В связи появившемся в версии 6.41 промежуточным окном не удалось понять, что делает команда "Copy state" из блока "Command".

Автор: arnyc, Отправлено:01:23 22-12-2019

bolega

Не подскажете, с какими настройками SK можно оптимально закодировать в DjVu этот файл? Под оптимально я понимаю наиболее чёткий и ясный текст при отсутствии фона и наименьшем размере DjVu файла. В какой конкретно обработке нуждается этот файл? Какие параметры DjVuLibre выставить?

Версия 6.00.5 похоже поддерживает лишь English UI? Не нашёл переключателя на RU? В таком случае можно ли как-то отключить дублирующие подсказки Хэлп на русском? Без поддержки сабжем Unicode они проблематичны.

Автор: arnyc, Отправлено:18:47 22-12-2019

Кто пробовал, подскажите в чём конкретно отличие по функционалу ScanKromsator 6.42 от 6.00.5 из шапки?

К примеру (но не только), последняя версия чище делает бинаризацию, методов бинаризации в ней больше?

Автор: imwerden, Отправлено:21:19 22-12-2019

Я заинтригован.... А где берут версии 6.41 или 6.42???

Автор: TelecomUral, Отправлено:03:42 23-12-2019

imwerden
или даже 6.43. "Достают", видимо, как дефицитный товар про позднем социализме

arnyc
отличается массой новых фич, нужных сугубо высококлассным обработчикам, которые готовы долго работать над одной сложной книгой. Ну, не массой, десятком. Можно и в 6.00.5 работать спокойно.
Введена работа с малоцветкой, субсписки файлов, защита букв от деспекла, транзитная зона, ну и по мелочи всякие удобства и исправления. Панелька быстрого переключения режимов, подсветка номера зоны, убран cpaldjvu из визарда (он цвета искажает). И т.д.

Автор: igogo22, Отправлено:17:28 23-12-2019


Цитата:
или даже 6.43. "Достают", видимо, как дефицитный товар про позднем социализме

А я надеялся, мы уже вышли из социализма. Или возвратились назад? Даєш назад Березки и Торгсин!?

Автор: niccolo, Отправлено:18:17 23-12-2019


Цитата:
Там разные типы сканов. Какие именно у вас вызвали затруднения?


В принципе с проблемой преобразования как-то справился файнридер.

Речь о сканах, которые из PDF Кромсатор сохраняет в виде двустраничных тифов, из которых один - не совсем оптимальный Ч/Б или Б/Ч а другой грязная серо-красно-желтая подложка (детальнее не разбирался - но показалось, что полноцветный оригинал получше, чем ч/б).
Ещё как помнится - проблема была в том, что 5.96 просто не мог всосать весь файл.

Автор: bolega, Отправлено:11:29 28-12-2019

niccolo
Дайте ссылку на какую-нибудь книгу, которая вам интересна, я имею ввиду ссылку на сайте архива.орг, а не на скачанный pdf.

Автор: 1234olexiy, Отправлено:13:26 28-12-2019

скажите а как обрабатывать такое изображение?



если не выделять текст в сером фоне как ч-б зона, то очень плохо смотрится
а если выделять то размер выходного файла очень огромный получается

??????????????????????

Автор: VadimirTT, Отправлено:13:57 28-12-2019

1234olexiy
Ссылка

Автор: niccolo, Отправлено:14:15 28-12-2019

bolega

https://archive.org/details/internationaldic00cagn/page/1096

И старый мой вопрос, где взять новую версию, так и остался без ответа...

Автор: TelecomUral, Отправлено:04:29 29-12-2019


Цитата:
1234olexiy
а если выделять то размер выходного файла очень огромный получается

В шапке темы указан способ получить помощь. Жирным красным шрифтом. Ибо телепаты в отпуске.

Автор: arnyc, Отправлено:07:41 29-12-2019

1234olexiy

Цитата:
скажите а как обрабатывать такое изображение?

У вас скан чистый, что там обрабатывать? Откладываем ScanKromsator в сторонку (каждый раз спотыкаюсь на таком названии, надо ж было его англицкими буквами сваять ). Конвертируем в DjVU Small Mod в DjVU формат в режиме Original-Clean, получаем чистый DjVU файл 27КБ с сохранением оформления оригинала.

Автор: 1234olexiy, Отправлено:11:01 29-12-2019


Цитата:
У вас скан чистый, что там обрабатывать? Откладываем ScanKromsator в сторонку (каждый раз спотыкаюсь на таком названии, надо ж было его англицкими буквами сваять ). Конвертируем в DjVU Small Mod в DjVU формат в режиме Original-Clean, получаем чистый DjVU файл 27КБ с сохранением оформления оригинала.

Такой вариант не пойдёт очень уж всё размазано получается


Добавлено:

Цитата:
1234olexiy
Ссылка


текст очень размывается, не прокатит


Автор: arnyc, Отправлено:19:01 29-12-2019

Можно так немного улучшить, хотя у меня опыт SK небольшой. Если надо, чтобы при увеличении до 400% текст выглядел гладким, а размер файла малым, может стоит отсканировать с разрешением повыше (300-600 dpi), и сохранить оригинал в TIFF вместо JPEG? Рост размера файла скана не должен привести к росту файла DjVU.

Автор: TelecomUral, Отправлено:20:53 29-12-2019


Цитата:
1234olexiy
текст очень размывается

https://yadi.sk/d/6pe2HAx3-NUVwg
лучше?

Автор: arnyc, Отправлено:21:15 29-12-2019

TelecomUral
Не поделитесь, как был улучшен этот текст в SK и DjVU? Дело в том, что народ постит здесь одну-две картинки, но в реале ведь большинству нужно много больше. И от того, что кто-то сделает красивый образец без объяснения с достаточным для воспроизведения новичком уровнем детализации, легче ведь не становится.

Вот с детализацией у большинства проблемы. Сначала вообще ничего не пишут, лишь демо красивой но бесполезной картинки. А когда спросишь, опишут парой слов так чтобы не смог сам повторить. В баг репортах есть такой принцип: опиши пошагово детальную последовательность, по которой девелопер сможет воспроизвести этот баг. Вот такой подход я очень редко встречаю в комментах на форумах. А между тем полезность одного такого поста в 100 раз выше, чем десятков красивых картинок, и работает такой пост вечно и для всех, а не одного заказчика. Причём отличие от мануалов в том, что адресуется конкретный пример, а не общий подход к скану книг или возможностям некого софта.

Автор: shch_vg, Отправлено:21:31 29-12-2019

arnyc

Цитата:
в баг репортах есть такой принцип: опиши пошагово детальную последовательность, по которой девелопер сможет воспроизвести этот баг

Если это делается в Сканкромсаторе, то достаточно файла задания.

Автор: TelecomUral, Отправлено:21:57 29-12-2019


Цитата:
arnyc
Не поделитесь, как был улучшен этот текст в SK и DjVU? ... Я бы с удовольствием поучился

Встречный вопрос: а зачем мне ваше удовольствие?

Имеется Хрестоматия, и другие документы и видео по СК. Изучите "с удовольствием". Совершенно типовая обработка, без каких-либо хитростей и особенностей.

В данном случае 1234olexiy не опубликовал субтаск, значит и в моём примере задания нет смысла. Нужно - чтобы научиться - искать ошибки в собственных действиях, а не глядеть, как действуют другие. Видишь эталон - ищи свой способ повторить.

Автор: arnyc, Отправлено:22:22 29-12-2019

TelecomUral

Цитата:
а зачем мне ваше удовольствие? Видишь эталон - ищи свой способ повторить.

Какой "эталон"? Ты сам год назад под разными никами по всем форумам побирался, каждого встречного вытряхивал, не зная НИЧЕГО. Инет всё хранит для потомков. Высосал опыт и знания у других, наворовал и выпросил кучу софта, а теперь куклу из себя строишь?

Любые твои картинки без инструкций будут сразу передаваться модам как коммерческое предложение в нарушение Правил форума. Учи букварь участника Руборд.


Цитата:
Таким помогать - как в дерьме мазаться.

А ты из него когда-либо вылазил? Благо нагло врать научился, прячась за чужие спины.


Автор: 1234olexiy, Отправлено:16:33 30-12-2019


Цитата:
https://yadi.sk/d/6pe2HAx3-NUVwg
лучше?

вот это хорошо
а поделитесь секретом - как делали djvu?
агоритм какой


Добавлено:

Цитата:
Можно так немного улучшить, хотя у меня опыт SK небольшой. Если надо, чтобы при увеличении до 400% текст выглядел гладким, а размер файла малым, может стоит отсканировать с разрешением повыше (300-600 dpi), и сохранить оригинал в TIFF вместо JPEG? Рост размера файла скана не должен привести к росту файла DjVU.


Это файл без обработки
черные полосы остаются, скан не чистится
не очень получается, видно что обработки не было, буквы не такие четкие



Добавлено:

Цитата:
Имеется Хрестоматия, и другие документы и видео по СК. Изучите "с удовольствием". Совершенно типовая обработка, без каких-либо хитростей и особенностей.


Я изучаю СК уже несколько лет, и до сих пор сталкиваюсь с тем что не знаю как делать.
Отослать к хрестоматии это не сложно, но мне нужно знать КАК этого добиться. Что касается меня то я много читал и смотрел у вас и у других людей , но всё равно не нашел. Я не очень соображаю во всяких форумах, но если какой-то живой человек скажет что, да как - это проще

Автор: TelecomUral, Отправлено:18:40 30-12-2019

1234olexiy
Вам же дважды указали: дайте свой суб-таск. Я могу записать по-быстрому видео, это полчаса, но это вас не научит ничему. Суб-таск - просто на порядок эффективнее. Всё, что я делал - в моих видео повторено раз восемь в разных вариациях. И трижды, если не четырежды, описано в хрестоматии, в текстах разных людей. Если вы оттуда "не считали" инфу КАК, то проблему надо изучать на вашей стороне обработки.
Я ж не зажимаю знания. Но работать имеет смысл эффективно.
Между прочим, я голову сломал, как у вас может получиться файл "большого объёма"

Автор: 1234olexiy, Отправлено:19:02 30-12-2019


Цитата:
Всё, что я делал - в моих видео повторено раз восемь в разных вариациях. И трижды, если не четырежды, описано в хрестоматии, в текстах разных людей.

Хорошо дайте тогда ссылку где искать
я не могу понять где это находится
сорри


Добавлено:

Цитата:
Вам же дважды указали: дайте свой суб-таск. Я могу записать по-быстрому видео, это полчаса, но это вас не научит ничему.

Я вижу что вы способны это сделать, но мне надо понять самому. И с чего вы решили что я ничему не научусь. Я очень обучаемый

Автор: TelecomUral, Отправлено:19:10 30-12-2019

1234olexiy
хрестоматия версии 2.1:
раздел 2.8 "Использование picture-зон, блок "раскрашенные зоны"
раздел 2.12 "Изготовление djvu", целиком

Автор: 1234olexiy, Отправлено:19:35 30-12-2019

Спасибо

Автор: TelecomUral, Отправлено:19:46 30-12-2019

1234olexiy
Пожалуйста.
В этом недавнем видео можно, среди прочего, посмотреть на практическую работу по раскраске и кодированию. Видео для других целей, так что длинновато.
https://www.youtube.com/watch?v=3Q30ynXXnLI

Автор: 1234olexiy, Отправлено:23:43 30-12-2019


Цитата:
раздел 2.8 "Использование picture-зон, блок "раскрашенные зоны"

Спасибо, это то что нужно.
очень выручили.

Такие книги попадаются редко, прям зависаешь - что делать.?
dither zone я обычно использовал для этого, а тут вся книга такая. И размер книги выходит большеватый.
У меня вопросы
- получается что эту серую зону всё равно надо выделять? Без этого никак?
- какие настройки вы для этой зоны использовали?
У меня получается что мелкие точки в иврите слипаются между собой иногда , ибо оч близко они.
Не могу добиться плавных и более резких очертаний шрифта. Может это как раз серый фон этому мешает.
dither zone конечно смотрится как в оригинале, хорошо

Все видео что вы дали буду изучать
потому как картинки доставляют немало напряги, и нужно как-то успешно их побеждать

Автор: shch_vg, Отправлено:00:01 31-12-2019

1234olexiy

Цитата:
Не могу добиться плавных и более резких очертаний шрифта. Может это как раз серый фон этому мешает.

Вот здесь и нужно сделать то, что уже несколько раз TelecomUral Вам писал, а именно, выполнить инструкцию.
Тогда можно рассчитывать на конкретную помощь.

Автор: TelecomUral, Отправлено:01:41 31-12-2019


Цитата:
1234olexiy
У меня вопросы
- получается что эту серую зону всё равно надо выделять? Без этого никак?
- какие настройки вы для этой зоны использовали?

Вы перестаньте играть в партизанский отряд "я что-то делаю, но никому не покажу. расскажите мне, а что я делаю?"
-по первому вопросу вам arnyc показал что можно и без зон
-по второму давайте свои настройки. если слипаются точки, то либо неправильный порог в зоне (надо авто или кастом, а поставили дефолт), либо нахимичили с фильтрами. ну или ахинею какую-нибудь от неопытности выдумали. Гадать я не собираюсь и без субтаска ответов от меня больше не ждите.

Автор: 1234olexiy, Отправлено:13:24 31-12-2019

Ладно не буду вас больше напрягать. Вы мне итак здорово помогли. Думаю дальше сам подберу настройки методом научного тыка.
всё-таки SK рулит, убеждаюсь в этом ещё раз.
Спасибо вам.


Автор: niccolo, Отправлено:23:49 01-01-2020

Bolega

подскажите - есть ли возможность автоматически подогнать страницы с разным фактическим разрешением (но указанным одинаковым) в один размер в одном разрешении?
пример книги

https://www.twirpx.com/file/794339/

двойные и одинарные развороты примерно одного размера...

Автор: shch_vg, Отправлено:02:04 02-01-2020

niccolo
Для тех, которых меньше, используйте "special" на закладке Page.

Автор: TelecomUral, Отправлено:05:15 02-01-2020

niccolo
а если экспортировать и разрезать, это не спасет?

Автор: niccolo, Отправлено:07:59 02-01-2020

shch_vg


Цитата:
Для тех, которых меньше, используйте "special" на закладке Page.

А там есть автоматические действия?

TelecomUral

Цитата:
а если экспортировать и разрезать, это не спасет?


А как это решает проблему разного физического разрешения?

Касательно пересканировать - идея неплохая, но таких книг, отсканированных давно в читабельном качестве, но с разными огрехами очень много. ИМХО - проще доводить до ума их, нежели искать и пересканировать оригиналы.

Автор: TelecomUral, Отправлено:08:26 02-01-2020


Цитата:
А как это решает проблему разного физического разрешения?

мне было непонятно, зачем вам одинаковое физическое разрешение, для чтения или печати, например. Ясно, что отмасштабировать листки, случайным образом перемешанные, автоматом затруднительно. Приведите их к одному "внешнему виду", потом уже применяйте какую-то автоматику, по числу пикселей сторон(ы) и т.п.
Ещё, кстати, большой вопрос, разное ли оно, физическое разрешение, в той книжке. Сомнительно мне (книжка не на компе сейчас, поэтому гадаю), что сканировщик (фотограф) делал то 600, то 300дпи, от листа к листу. В смысле, приводил к этим числам. Поэтому разрежьте и не парьтесь. Опираться всё равно не на что, кроме одинаковости ширины строк.

оффтоп
По "пересканировать" забираю предложение обратно Попытка сделать из г... конфетку. Ну-ну, мало вам попыток arnyc. Я думал, вам книжка нужна, а вы "лоск наводите". Заметание мусора под ковёр не мой метод.

Автор: niccolo, Отправлено:09:04 02-01-2020

TelecomUral

Цитата:
Ещё, кстати, большой вопрос, разное ли оно, физическое разрешение, в той книжке.


Иначе как объяснить почти одинаковость физического размера (в см) страницы и разворота при как бы равном разрешении?


Цитата:
Я думал, вам книжка нужна, а вы "лоск наводите"


1. Мне информация в книжке нужна (я её уже просмотрел)
2. Мне нужен индексируемый документ, желательно в одном размере (чтобы при перелистывании окно не прыгало - больше-меньше).

Насчёт автомата это конечно хорошо, но наверное тяжело. Поэтому может хотя бы кнопку - перемасштабировать до размера страницы.

Автор: daa2013, Отправлено:10:53 02-01-2020

Послушайте, ну так же просто нельзя.

1. Вы заставляете лезть на полу-коммерческий сайт, запрещенный в России; регистрироваться на нем, используя обходные маневры и кучу допсофта; тратить баллы...
Хотите помощи по файлу - выложите его на свободно доступный обменник.

2. Далее, видно же что страницы там были сфотканы. То есть вы некорректно описываете, что вы хотите. У вас есть куча фоток, расстояние фотик-сканер там гуляет по определению, развороты там или не развороты. То есть не разрешение ошибочное, а исходники у вас - фотографии.

Боюсь прогнозировать ответ болега, но мне кажется, что он принципиально не будет затачивать СК на работу с фотками, и ни одной связанной с этим фичи в СК добавлять.

Техника же обработки фоток такая: обрезать все по границам текста, не наращивая поля. Выбрать страницу-образец. Сделать три комплекта ресайзинга (например, в XnView):
- ширина образца (с сохранением пропорций)
- высота образца (с сохранением пропорций)
- ширина и высота образца.
Назначить всем одно разрешение.
Увеличить всем до единых размеров холст, одинаково нарастив поля. (Для разных комплектов с разных сторон тут будет разное нарощение).

Далее, взяв третий комплект за основу, так как у оригинала могли быть страницы с текстовым блоком разной ширины и высоты, заменить нестандартные страницы на страницы из первого и второго комплектов.


UPDATE
положил на я.диск, раз уж скачал:
https://yadi.sk/d/xIh0sDGQC0yBwA

Автор: bolega, Отправлено:11:07 02-01-2020

niccolo

Цитата:
https://www.twirpx.com/file/794339/

Не успел год начаться, а уже тройная свин... трабла
1) "Доступ к информационному ресурсу ограничен на основании..."
2) Чтобы что-то оттуда скачать, нужна регистрация (у меня ее нет)
3) Даже после регистрации (насколько я знаю), нужно еще заработать право на скачку.
В общем, спасибо за простоту и удобство ...

Добавлено:
daa2013
Опередили.


Добавлено:

Цитата:
Боюсь прогнозировать ответ болега, но мне кажется, что он принципиально не будет затачивать СК на работу с фотками

Можно придумать простое решение, но при одном условии: если все сканы одного физического размера. Если это не так, то все сложно.

Автор: daa2013, Отправлено:11:30 02-01-2020


Цитата:
Можно придумать простое решение, но при одном условии: если все сканы одного физического размера. Если это не так, то все сложно.

так как эти псевдо-фотки предварительно импортируются из джву, то можно было бы в джву-импорт встроить приведение к единому размеру холста. (единому размеру методом нарощения полей).
Если же это реальные фотки - то просто ничего с ними не делать перед засовыванием в СК, то вот и будет один размер. Конечно, еще может быть, что с двух фотиков фоткалось... Но тогда в два прогона делать.

Автор: TelecomUral, Отправлено:11:31 02-01-2020


Цитата:
все сканы одного физического размера

в каком это смысле, "физического"? Число пикселей на сторону, то есть все фотки в размер или кратны матрице фотоаппарата?

Автор: bolega, Отправлено:11:46 02-01-2020

Физического в смысле в мм, т.е. фоткали примерно одну и ту же область.

Автор: slava_kry, Отправлено:11:50 02-01-2020


Цитата:
но при одном условии:

Там ещё условие нужно - неизменяемое расстояние между книгой и фотиком. И тут засада, т.к. снимаешь с рук и вот масштаб страниц ужо разный.

Автор: niccolo, Отправлено:12:00 02-01-2020

daa2013

Цитата:
1. Вы заставляете лезть на полу-коммерческий сайт, запрещенный в России

Прошу извинить.


Цитата:
2. Далее, видно же что страницы там были сфотканы. То есть вы некорректно описываете, что вы хотите.


В чём? Ну сфоткали где-то по страницам, где-то по разворотам - в итоге грубо говоря можно считать, что разрешение страницы в 2 раза больше чем у разворота.


Цитата:
Техника же обработки фоток такая: обрезать все по границам текста, не наращивая поля. Выбрать страницу-образец. Сделать три комплекта ресайзинга (например, в XnView):
- ширина образца (с сохранением пропорций)
- высота образца (с сохранением пропорций)
- ширина и высота образца.
Назначить всем одно разрешение.
Увеличить всем до единых размеров холст, одинаково нарастив поля. (Для разных комплектов с разных сторон тут будет разное нарощение).

Далее, взяв третий комплект за основу, так как у оригинала могли быть страницы с текстовым блоком разной ширины и высоты, заменить нестандартные страницы на страницы из первого и второго комплектов.


Спасибо. Я немного по другому думал - обработал в SK. Там где из-за размера страница с разворота стала на 1/3 или на 1/4 страницы - кнопочка - растянуть на весь лист (с учётом полей).

bolega

Цитата:
В общем, спасибо за простоту и удобство ...


НУ archive.org позамороченней будет. Там ещё надо софт искать, чтобы скачать и потом чтобы снять DRM.


Цитата:
Число пикселей на сторону, то есть все фотки в размер или кратны матрице фотоаппарата?

Да. Но на одной фотке 1 страница, на другой 2. В итоге при приведении 1 страницы в половинный размер разрешение вырастет вдвое.

Автор: bolega, Отправлено:12:07 02-01-2020

niccolo

Цитата:
НУ archive.org позамороченней будет

Но если найти человека, у которого есть доступ к тамошним сканам, то все проще


Добавлено:
С фотками все можно упростить, если при фотографировании поступать так, как это делают криминологи: использовать фрагмент линейки. Т.е. класть на поле каждой страницы (разворота) что-то заведомо известного размера: пару см, цветную фигуру (круг, квадрат и т.д.). Затем, зная ее физич. размер и размер в пикселях, точно определить dpi.
Можно также перед обработкой привести все фотки к одному физ. размеру, при условии, что в область скана попал периметр книги. Перед обработкой все страницы выровнять, затем обрезать сверху и снизу по границе книги (она должна попасть в скан). С боков не пойдет, т.к. ширина из-за переплета варьируется. Дальше дело техники

Автор: TelecomUral, Отправлено:12:27 02-01-2020


Цитата:
daa2013
То есть вы некорректно описываете, что вы хотите.


Цитата:
niccolo
В чём?

Лично я понял вашу задачу так: "а можно ли в СК рассчитать дпи по опознанному полезному контенту?" Никаких "грубо говоря" в исходном тексте нет.

Upd
bolega
А возможно, для таких вот "книг" и имеет смысл предусмотреть кнопочку/командочку в Special по ПКМ на DPI "если страница имеет разрезку (Split взведён), измени на DPI вдвое ниже. Для всего выбранного". В виде допгалочки внутри диалога-указания, к каким страницам применять.

Автор: shch_vg, Отправлено:12:56 02-01-2020

TelecomUral

Цитата:
А возможно, для таких вот "книг" и имеет смысл предусмотреть кнопочку/командочку в Special по ПКМ на DPI "если страница имеет разрезку (Split взведён), измени на DPI вдвое ниже. Для всего выбранного".

Так это уже там есть!
Если пометить, допустим, все двойные, то, зайдя в Special на странице Page любого двойного скана, выставляем галку в опции DPI и при нажатом alt выбираем значение Half smaller для всех выбранных и все!

Автор: niccolo, Отправлено:12:57 02-01-2020


Цитата:
Лично я понял вашу задачу так: "а можно ли в СК рассчитать дпи по опознанному полезному контенту?"


Вы неправильно поняли. Моя задача

получить из мусора с разным размером и разрешением что-то более менее однородное и одного размера....

Разумеется - самое правильное решение - нормально пересканировать книгу.

bolega

Цитата:
С фотками все можно упростить, если при фотографировании поступать так, как это делают криминологи:


Можно упростить, можно пересканировать......
Пока речь идёт о том, чтобы как-то облегчить работу с мусором - в идеале, если не на автомате - то хотя бы в один клик типа растянуть на лист (а не ручными художествами в граф. редакторах)....

Автор: TelecomUral, Отправлено:13:04 02-01-2020


Цитата:
shch_vg
Так это уже там есть!

Точно! Есть же классная команда "Special..." в главном меню Select group. Редко пользуюсь. А вот про Half smaller я не знал.

Автор: shch_vg, Отправлено:13:22 02-01-2020

TelecomUral
Ну, это Вы немного другое смотрите.
Я имел в виду окно "Exclusive page options", открывающееся по щелчку на "special" на любой закладке page. В Вашем варианте я не нашел способа реализовать обсуждаемую проблему.

Автор: bolega, Отправлено:13:50 02-01-2020

niccolo

Цитата:
Можно упростить, можно пересканировать...... Пока речь идёт о том, чтобы как-то облегчить работу с мусором

Вы предлагаете мне все бросить и заняться созданием костыля для вашей сиюминутной задачи? При том, что даже не удосужились выложить свой "мусор" для понимания...
Кстати, растягивать b/w изображение - гиблое дело. Нужно работать с исходником, а это требует еще придумывания алгоритма. Но на это у меня нет к сожалению времени. А костыли я давно зарекся делать.

Автор: niccolo, Отправлено:14:02 02-01-2020

bolega


Цитата:
Вы предлагаете мне все бросить и заняться созданием костыля для вашей сиюминутной задачи?


1. Я спрашивал, есть ли простые пути решения, о которых я возможно не знаю.
2. Поскольку я вижу, что программа развивается, я предложил один из вариантов решения. Использовать его или нет, решать вам.


Цитата:
Кстати, растягивать b/w изображение - гиблое дело. Нужно работать с исходником, а это требует еще придумывания алгоритма. Но на это у меня нет к сожалению времени. А костыли я давно зарекся делать.


Можно не растягивать. Можно изменить разрешение готового файла, так чтобы он визуально стал в один размер с другими (тогда наверное и размер полей придётся пересчитывать)...

Минусом данного решения является то, что FR часто делает очень нестандартные ошибки на нестандартных разрешениях. Хотя, не исключаю, что в последних версиях, благодаря поддержке распознавания фото с телефонов, с этим стало лучше.

Автор: bolega, Отправлено:14:08 02-01-2020


Цитата:
1. Я спрашивал, есть ли простые пути решения, о которых я возможно не знаю

нет

Цитата:
Можно не растягивать. Можно изменить разрешение готового файла

daa2013 выложил ваш пример. я смотрю его в windjvu в режиме fit page, выглядят страницы практически одинаково, это не то же самое?

Автор: TelecomUral, Отправлено:14:59 02-01-2020

shch_vg
я про ваше

Цитата:
Если пометить, допустим, все двойные

в стандартном меню выбора по Alt можно сказать "selected". вот я и "ударил себя по лбу в озарении", - вспомнил, как в задании пометить сканы по признаку.
То есть выбрали сканы по наличию галки split и присвоили half smaller.
Спасибо за науку.

Добавлено:
niccolo
! С этой книжкой не морочьте людям голову. Я добрался до дома, открыл её, просмотрел параметры страниц. Хоть чб, хоть полноцвет, хоть одинарная страница, хоть двойная, везде приблизительно одна страница текста это 2300-2600пкс по вертикали и 1400-1800пкс по горизонтали.
Импортировал в СК, поделил двойные страницы напополам и собрал дежавю обратно. Всё прекрасно подходит под ваши критерии, без всяких изменений дпи, если поставить режим Fit page.
книжка: https://yadi.sk/d/eNRlmO2-HQ8mrg

режим FIT PAGE



режим 100%



То есть задача ваша сейчас либо смириться с тем, что вы видите, либо таки признать, что отображение на последнем экране (100% масштаб) вас не устраивает, а значит - требуется подбор дпи под конкретную фотографию, потому что расстояние до объекта съёмки плавало.

bolega
А что-то мне не удалось размножить положение внутренних резаков. Кнопка "ОК" недоступна. Один раз на Int1 она нажалась, а потом всё. И даже нажатое не сработало на резаках. Делал "All up" где-то с середины книжки и до концадо начала . драфт кромсэйт не делал, размножил состояние кнопкой.

Задание могу на фтп выложить.


Upd
вот пример получше показывающий проблему. крохотная страница имеет 1261х1697, а крупная 1822х2427.




Автор: bolega, Отправлено:15:58 02-01-2020

TelecomUral

Цитата:
А что-то мне не удалось размножить положение внутренних резаков

А те файлы, на кот. должно размножаться, отмаркированы? И галка на split у них уже стоит?

Автор: TelecomUral, Отправлено:16:02 02-01-2020

bolega
отмаркированы, галка split не стоит.

Автор: niccolo, Отправлено:16:40 02-01-2020

1.
Цитата:
нет

Спасибо.
2.
Цитата:
я смотрю его в windjvu в режиме fit page, выглядят страницы практически одинаково, это не то же самое?

Сам смотрю в Суматре - ни один из фитов особо не устраивает.

Помимо этого оригинал не устраивает. Мне нужен с текстовым слоем. А раз распознавать, так уже и хотелось сделать нормально, да преобразовать всё в ЧБ. А в ФР, когда надо блоки вручную наложить,
равенство размеров страниц и полей критично.


Цитата:
То есть задача ваша сейчас либо смириться

Понял, смирился. Предлагаю закрыть дискуссию.

Автор: bolega, Отправлено:17:46 02-01-2020

TelecomUral
Может сначала split взвести?

Автор: TelecomUral, Отправлено:18:03 02-01-2020

bolega
да, я ещё поковыряю эту проблему, спасибо. Сегодня работу работал, а завтра уже с утра книжки библиотечные сдавать, так что не сегодня.

Автор: slava_kry, Отправлено:11:19 04-01-2020

Товарищи подскажите, пожалуйста, какой формат CK импортирует с маской или альфа-каналом и в каком виде это нужно сделать, чтобы СК импортировал его правильно?
Оригинал - сделанные в Шопе изображения различных конфигураций с Альфа-каналом.
Чем "сконвертировать" альфа-канал, чтобы он для СК стал маской.

В книге много картинок большого размера и есть желание сделать файл поменьше по возможности.


Вопрос снят - разобрался.

Автор: TelecomUral, Отправлено:09:28 17-01-2020


Цитата:
TelecomUral
Может сначала split взвести?

Наконец я поразбирался с Int резаками. Поведение такое:
- импортировал дежавю с неразрезанными страницами (брал пяток страниц из книжки Орлова по малогабаритным источникам тока, там тип картинки 200dpi G4 CCITT compr)
- встал на последний скан, нажал на правую кнопку внизу. Проставились галки зеленые
- нажал Split с CTRL
- вывел внутренние резаки на середину скана
- нажал ПКМ на головке левого внутреннего резака, ничего не произошло
- нажал вторично, выбрал Copy current State/position to...
- выбрал диапазон All up, нажал ОК
- потыкал по сканам, вижу что внутренний левый резак прокопировался верно
- вернулся на последний скан, нажал ПКМ на головке правого внутреннего резка, ничего не произошло
- снова нажал ПКМ, выбрал опять команду размножения
- в окошке настроек команды взведена галка Int2, кнопка "ОК" недоступна
- попробовал включить галку Int1, при её включении кнопка "ОК" стала доступна
- выключил и снова включил галку Int2 - кнопка "ОК" доступна
- выключил галку Int1, кнопка "ОК" осталась доступна. Потыкал галку Int1 несколько раз, потом другие галки, убедился что если все галки сняты, то "ОК" становится серой (недоступной)
- снял все галки кроме Int2, нажал "ОК"
- пробежал по сканам. Везде кроме последнего скана положение резака (головка) стоит на нужной позиции, а вот синей линии резака нет. А на последнем скане нормальная синяя линия.
- !понял, что я неверно выбирал режим копирования "Copy position"
- попробовал повторить размножение правого внутреннего резака, стоя на последнем скане. Увы. Не удалось добиться для режима "Copy state and position" доступности кнопки "ОК" ни для галки Int1, ни для галки Int2.

Сорри за многословие, но поскольку логика взаимосвязей галок и режимов мне скрыта, пришлось так подробно записать шаги.


Добавлено:
Upd
перепроверил в новом задании, что при простановке зеленых галок и последующем Split+CTRL правый внутренний резак не включается нигде кроме последнего скана.

Автор: shch_vg, Отправлено:12:43 17-01-2020

TelecomUral
Переходите на v6.00.5.
Там все не так сложно и работает правильно (почти).

Автор: daa2013, Отправлено:20:06 17-01-2020

TelecomUral
Можете сделать туториал для новой версии Хрестоматии ?
(дополнить свой пост картинками).

Автор: shch_vg, Отправлено:20:37 17-01-2020

daa2013
А разве Ваша Хрестоматия не на нынешнюю рабочую версию СК?

Автор: TelecomUral, Отправлено:20:41 17-01-2020

daa2013
так задача-то примитивная: размножить положение резаков. о чем тут писать.

Автор: D1D1D1D, Отправлено:17:57 18-01-2020

Здравствуйте. Вроде обработал файлы с нужными настройками, в конце произвел Calculate book size, но после финализации tif-файлы получились по разному обрезанными, разного размера, с разными полями. Плюс я еще их правил от мусора, в отличие от исходных. Как это можно исправить теперь?

Автор: TelecomUral, Отправлено:18:35 18-01-2020

D1D1D1D
уточните, что именно вы хотите исправить. всё уже вами сделано.

Автор: D1D1D1D, Отправлено:18:40 18-01-2020

TelecomUral
Исправить разнобой в размерах и в полях.

Добавлено:
В собранном Djvu страницы прыгают Хавкина Л. Б. - Составление указателей к содержанию книг и периодических изданий - 2 изд. - 1931.djvu.

Автор: TelecomUral, Отправлено:19:19 18-01-2020

D1D1D1D
сделайте out-task, а в out-task новую обработку (Process). Поубирайте все деспеклы и дескью, и просто расставьте автополя.

Автор: D1D1D1D, Отправлено:21:10 18-01-2020

TelecomUral
Спасибо!

Автор: bolega, Отправлено:21:34 18-01-2020

D1D1D1D

Цитата:
В собранном Djvu страницы прыгают

Все страницы кроме обложек и форзацев абсолютно одинакового размера.
Если под "прыгает" понимается разнобой показа страниц/обложек, то это и немудрено: у всех страниц в djvu задано 300dpi, хотя по факту у ч/б он примерно 900dpi, а у обложек - 600.

Автор: D1D1D1D, Отправлено:00:32 19-01-2020

bolega
Дело в том, что я предыдущий djvu-файл по ссылке Яндекс-Диска заменил на недавно исправленный, в котором и теперь обложки, выходит, отличаются из-за разного dpi? Какое dpi следовало устанавливать, чтобы этого избежать?

Автор: TelecomUral, Отправлено:10:35 19-01-2020

D1D1D1D
СК-то тут причем. Вряд ли вы использовали индивидуальные настройки дпи на страницах. Виноват кодер, процесс сборки. Если, например, у DSM или D.Express Editor включить принудительную простановку дпи, выходит такая же ерунда.
На втором варианте книги на бумажной странице 137, и далее до конца, видно как скачут настройки размеров: то дпи 300, то 900, то размеры 3900х6600, то 6500х9700. А уж как вы это получили - ... Вариантов много.
Следить надо, что на входе у сканов настроено.

Автор: TelecomUral, Отправлено:15:31 19-01-2020

daa2013
Я правильно помню, что правила применения настроек dpi в Хрестоматии мы нигде не расписали с вами, обошлись общей фразой? Для зон есть ваша прекрасная картинка, а вот по обычным страницам D1D1D1D даже и не посоветовать ничего?

Автор: daa2013, Отправлено:17:12 19-01-2020

нет, отдельно не расписывали.
Есть пара слов, там и сям. А какая тут может быть инструкция ?
Просто четко представлять, что на каком шаге с дпи происходит.

Допустим,
исходник =300
При обработке текст 600 зоны 600
При кодировании текст не делим =600; картинки делим на 2 получаем 300

Или
исходник =300
При обработке текст 600 зоны 300
При кодировании текст не делим; картинки не делим. Получаем 600 и 300.

Или
исходник =600
При обработке (Оригинал), то есть текст 600 зоны 600
При кодировании текст не делим; картинки делим на 2. Снова получаем 600 и 300.



Автор: TelecomUral, Отправлено:17:23 19-01-2020

daa2013
Я больше про "нестандартные" случаи.
Хорошо бы сваять нечто визуально-понятное про фото-сканы, про отсутствующие дпи. Замечаю, что это многим остается непонятным - как пиксели из скана переходят на лист дежавю и что потом во вьюверах происходит при прорисовке.
Фишка в разных "умолчаниях". Я и сам иногда прокалываюсь с просмотром своих книжек, если выставлено "растягивать по ширине".

Upd
Множитель "12" например откуда возникает на вкладке Book.

Автор: shch_vg, Отправлено:17:30 19-01-2020

TelecomUral

Цитата:
Множитель "12" например откуда возникает на вкладке Book

Если это вопрос, то 12 кратно 2,3,4 и 6, т,е., например, 600/100, 600/150, 600/200 и 600/300

Автор: daa2013, Отправлено:18:02 19-01-2020

Ну, в обработке фото-сканов с фотика главное - это исправление искривлений, чего СК не делает. Поэтому тут упор на программы-аналоги.

Автор: TelecomUral, Отправлено:18:23 19-01-2020

daa2013
и тем не менее. сколько копий переломано, и до сих пор даже сослаться не на что.

Автор: daa2013, Отправлено:18:32 19-01-2020

Вопрос про число 12.

Насколько я догадываюсь, это важно при запихивании сканов в ДжвуИмаджер.
(я никогда в жизни им не пользовался поэтому точно не знаю)
Мне помнится, что там надо задник сразу подготовить так, чтобы он был кратен переднему фону. Поэтому на стадии обработки проще сразу нужное число пикселей для обеспечения кратности по бокам дорисовать, чем потом делать растяжки картинок на странные дроби.
Попробуйте более точно про эти кратности задника/передника в справке к ДжвуИмаджер почитать.

Не исключено, что эта кратность может оказаться важной и чисто внутри СК, если зоны идут как 300, передник как 600, а задник потом еще начинает делиться. Но это такая экзотика ... Я лично про это ничего не знаю, в практике не сталкивался, а проводить эксперименты на предмет того, что тут могут криворукие бакланы натворить, не собираюсь.

Вот что я недавно обнаружил, и даже начал писать текст про изготовление пдф.
Сделать пдф в 600 и пожать его на 300 в джипег2000 , оказывается толще, чем сразу сделать картинки в СК в 300 и закодировать их там в джипег2000. (Ну это видимо потому, что кодеры разные).
Поэтому я делал два оут-таска: один для джву (с картинками в 600) и один для пдф-а (с картинками сразу в 300).


Добавлено:

Цитата:
сколько копий переломано, и до сих пор даже сослаться не на что.


ИМХО про это никто никогда ничего не спрашивал и копий не ломал.
все вопросы которые тут задаются ответы постепенно получают.
Ну составьте список вопросов, которые несяны, я могу попробовать сформулировать ответы.

А может и сам болега ответит.

Неотвеченных вопросов про дпи на моей памяти в этой ветке не было.

Почему именно тут размеры разошлись - а хрен его знает - задание то не было выложено. Может, сборка не в СК шла. Какие исходники были - тоже неясно. Это гадание на кофейной гуще. Если бы товарищ следил за дпи и размерами своих сканов на всех стадиях, то и вопроса бы не было.

Добавлено:
И, кстати. Я писал в послесловии, что все претензии, что что-то не рассказано - изначально отвергаются. Это Хрестоматия. Если кто-нибудь про что-то новое расскажет, я в следующую редакцию включу.

Автор: TelecomUral, Отправлено:18:44 19-01-2020

daa2013
вы меня не поняли. я ведь спросил про Хрестоматию. Дописать туда текст, снимающий новичку недоумение от прочтения:
"Если бы товарищ следил за дпи и размерами своих сканов на всех стадиях, то и вопроса бы не было."
Что значит "следить"? С какой целью? и тэ дэ.
В Хрестоматии, а не тут на вопросы отвечать. Сделать один раз и закрыть вопрос. Он всплывал неоднократно.

Upd
а, ну вот вы и сами добавили про дописку текста.

Автор: daa2013, Отправлено:19:01 19-01-2020

Если есть идеи, то допишите.

Но лично у меня размеры сканов в джву неожиданно скакали один раз и я про этот случай в своей статье про Document Express рассказал (висит в шапке параллельной ветки). Оказалось, что Document Express по разному вписывает разрешение в джипеги и тиффы. (в одном случае берет дефолтное, а в другом разрешение скана). У меня исходники обложек были в джипегах и разрешение в них "уехало".

Для СК это не релевантно, так как внутри СК джипегов нет. Но вот если, например, джипег как внешняя зона подключается, то, может, фокусы тоже могут быть.

Автор: daa2013, Отправлено:21:37 19-01-2020


Цитата:
ну вот вы и сами добавили про дописку текста.


попросите у камрада задание .
потом разберите , что там не так.
Сделайте скриншоты.


Три-четыре разбора таких ошибок, вот вам и готовый туториал для включения в новую редакцию.

Автор: shch_vg, Отправлено:00:24 20-01-2020

daa2013

Цитата:
Вопрос про число 12.


Цитата:
Не исключено, что эта кратность может оказаться важной и чисто внутри СК


Автор: shch_vg, Отправлено:20:02 21-12-2011

bolega

Получается, что при обработке книги с фото в 600dpi нужно устанавливать
пиксельные размеры, кратные 6, тогда при любом стандартном значении (100,
200, 300, 600) разрешения бэкграунда будут одинакового размера страницы, а
если хочется использовать 150 в бэкграунде, то нужно размеры делать
кратными 12.

Автор: bolega, Отправлено:20:23 21-12-2011

shch_vg

Цитата:то нужно размеры делать кратными 12.

Именно. Кстати, обратите внимание на параметр Size multiply на закладке
Book. Он именно для этого и введен в новой версии. 12 - его значение по
умолчанию.

Автор: daa2013, Отправлено:03:15 20-01-2020


Цитата:
будут одинакового размера страницы

А как там могут оказаться страницы "неодинаковых размеров" ?
Если не был задан мультиплайер кратности, то при экспорте страниц из джву они будут хоть на пиксель, но другими ????
Document Express ведь вроде любые некратные страницы жрёт и все равно позволяет любые делители для задника устанавливать.
По моему это нужно единственное чтобы сошлись задники и передники, если задники вы обрабатываете отдельно и сразу в меньшем разрешении.
Ну там 600 и 300, 600 и 200, 600 и 150 ...
Если же у вас всё в 600 идет, а потом в момент сборки вы разрешение понижаете, то это не актуально.
Я то просто только по второму пути иду, ДжвуИмаджер не пользую. (Как правило, собираю в FSD. Иногда в СК.) Поэтому не сталкивался никогда.

Автор: TelecomUral, Отправлено:05:07 20-01-2020


Цитата:
Если не был задан мультиплайер кратности, то при экспорте страниц из джву они будут хоть на пиксель, но другими ????

какая-то странная формулировка.

Автор: daa2013, Отправлено:06:04 20-01-2020

Я не понимаю, где могут возникнуть "неодинаковые страницы".

Выдвигаю предположение, что они появятся внутри итогового джву, если задники и передники не были кратны коэффициенту уменьшения заднего фона, и увидеть это можно будет в момент экспорта страниц из джву.
Так лучше ?

Автор: TelecomUral, Отправлено:08:52 20-01-2020


Цитата:
Я не понимаю, где могут возникнуть "неодинаковые страницы".

На выходе из основного задания СК. Допустим, в поле Page width задан вручную 3471 пиксель по горизонтали. На этой странице есть зона с фото. Далее вы хотите при изготовлении дежавюшки закодировать фото с дпи меньше, чем разрешение страницы. А не получится.
Какой-то кодер автоматически надставляет белые полоски к бэкграунду, я забыл какой. А в основном у кодеров будет выскакивать ошибка.

Автор: AlVaKo, Отправлено:10:20 20-01-2020

Размер страницы в пикселах у djvu-книги может быть ЛЮБОЙ.
Когда используется понижение плотности фона у двухслойных djvu, то djvu-кодер ДОЛЖЕН установить размер фона в пикселах по правилу:

ширина_фона = (ширина_маски + делитель - 1)/делитель.

Т.е. надо округлять размеры фона до целого вверх.
Нет требования кратности размеров страниц.

Нормальному кодеру без разницы какая кратность у размеров страниц.
Для кодеров разной степени кривости, правило кратности размеров 12-и упрощает жизнь.

Автор: TelecomUral, Отправлено:10:41 20-01-2020

AlVaKo

Цитата:
Т.е. надо округлять размеры фона до целого вверх.


Цитата:
djvu-кодер ДОЛЖЕН установить размер фона

а эти фразы не противоречат между собой?

Автор: AlVaKo, Отправлено:10:54 20-01-2020

Нет, не противоречит.

Фраза "надо округлять размеры фона до целого вверх". Написана после формулы, и относится к формуле. В смысле надо округлять после деления.

Автор: TelecomUral, Отправлено:11:22 20-01-2020

А, ну да. Вспомнил, bolega ведь где-то объяснял, что ввёл параметр, чтобы не отбрасывать "дробные" пиксели фоток.

Автор: bolega, Отправлено:12:36 20-01-2020

AlVaKo

Цитата:
Т.е. надо округлять размеры фона до целого вверх.

Вы абсолютно правы. Я это не сразу понял, что нужно округлять вверх когда СК готовит файл фона в визарде djvu. Поэтому ввел множитель 12, чтобы избегать ошибки DjvuLibre. Если же кратность не выдерживалась, то тогда СК изменял размеры чанка sjbz на 1-2 пикселя, чтобы обеспечить нужную кратность, иначе djvu не собирался из-за ошибки.
Но начиная с версии 6.41 (02.2019) я это понял, и теперь выдерживать кратность размеров страницы необязательно. Один лишний пиксел для фона - и никаких проблем. И чанк sjbz теперь не меняется.

Автор: shch_vg, Отправлено:23:22 20-01-2020

AlVaKo

Цитата:
Т.е. надо округлять размеры фона до целого вверх.
Нет требования кратности размеров страниц.

Любое округление нарушает тождественность маски и фона, а правило 12 гарантирует эту тождественность.

Автор: AlVaKo, Отправлено:13:25 21-01-2020

Обычно я придерживаюсь кратности 60-ти. Могу без остатка еще делить на 5. Но это для меня не догма.

Допустим у страницы высота маски 4493 пикселов при 600dpi, то у фона в 100dpi высота получиться 749 пикселов.

Определим, на сколько мы отклонились от "тождественности".

4493/6 = 748.8(3)
100*(749 - 748.83)/748.83 = 0,02 %

Для меня, в плане djvu-книжек, точность запредельная.

Автор: daa2013, Отправлено:07:35 24-01-2020

Записал ролик, как выглядит "улёт глифов" в 6.42

https://yadi.sk/i/759Y05HNPprsDQ

(по хоткею "пасте" глиф встает не в области курсора, а в некоей другой позиции на экране). При нормальной работе этого не происходит, но в какой-то момент иногда раньше (минут 5 после включения компа), иногда позже (не один десяток страниц прошел и комп пару суток стоял включенным) начинается такая ерунда.



Автор: D1D1D1D, Отправлено:03:27 25-01-2020

Здравствуйте. Как отключить для определенной страницы — поля-отступы и изменение цвета?

Автор: bolega, Отправлено:10:45 25-01-2020

На закладке Page кнопка special, далее галку на "ignore gaps" (типичное значение опции для обложек) и color=original, можно и dpi=original

Автор: D1D1D1D, Отправлено:12:33 25-01-2020

Спасибо!

Добавлено:
Интересно, по какой причине при открытии страницы в PDF-файле показываются не в 100%, а в 20-ти %? — https://yadi.sk/i/vR6zqiqSEAillQ

Автор: D1D1D1D, Отправлено:23:24 25-01-2020

С какой настройкой можно задавать размер листа для PDF, чтобы на стандартных мониторах сто процентов показывалось без многократного уменьшения страницы?

Добавлено:
Тестировал на определенной странице, создавая PDF и меняя DPI, но размер листа получается огромный, а текст либо мелкий, либо большой.

Автор: TelecomUral, Отправлено:05:22 26-01-2020

D1D1D1D
я не специалист, поэтому мой ответ может быть неточен.
пдф считает габариты и все размерения объектов страниц в метрах (миллиметрах и т.п. дюймах). СК считает пиксели. Поэтому вы не должны "врать" при установке дпи, тогда всё автоматом сойдётся на экране просмотрщика. Если у него спецнастроек, перекрывающих файл, не установлено.
Допустим, исходный скан по линейному пиксельному(!) размеру 2300пкс. Это для среднего формата книг (20-21см), выходит, было сосканено в 300дпи. (расчет: 300dpi делим на 25,4мм получаем 11 точек на миллиметр, множим на высоту выходит 2480 пикселей).
Если сканер "правильный" и дпи в скане сохранил, то СК опознает его.
Вы в СК пишете выходной дпи = 600, тогда на выходе будет примерно 4600 пикселей, плюс-минус поля.
При изготовлении пдф габариты страницы будут рассчитаны и записаны в файл пдф как 4600/600*25,4 в миллиметрах. То есть 194,7мм.

Я сейчас взял и проверил это на одном своем файле: в pdfxchangeviewer в углоке проставлена верная информация о габаритах 10,97х19,05 см. При этом оригинал (в 300дпи) имел число пикселей 2405х3066 разворотом, поля я поставил 70пкс. ЧБ-страница вышла в СК 2592х4500пкс.

Все сложности начинаются вот тут:



Когда в скане не записана информация о дпи, рассчитать "метры" невозможно. Неизвестен коэф.пересчёта из "точек"-пикселей в линейный/физический размер.

И не забывайте, что у вьюверов может быть установлен принудительный масштаб:




Автор: bolega, Отправлено:08:52 26-01-2020

Все верно TelecomUral описал. В pdf у вас файлы имеют 300dpi, хотя на самом деле они где-то 1200dpi, обложка - 90 dpi, а на самом деле 600dpi.
Исправить можно так: в задании, в котором делаете pdf, на закладке Files задайте inputdpi=1200 и снимите галку с only for uknown (обязательно!).
Запустите обработку и получите уже корректный pdf. Кроме обложки, т.к. для нее надо было не 1200, а 600. Но опция работает для всех.
Чтобы обойти это ограничение, придется вместо inputdpi прописать в файлы правильное dpi. Это делается командой меню Tools > Correct dpi. В этом случае inputdpi трогать не надо.

Автор: ComboFZ, Отправлено:14:11 26-01-2020

Можно и сам PDF от D1D1D1D причесать т.к. разрешение в пикселях там запредельное.
Оптимизированный:Training in indexing 1969

Автор: D1D1D1D, Отправлено:15:08 26-01-2020

ComboFZ
Уважаемый, а вы из SK получили PDF 9 мегабайт, или после оптимизировали?

Добавлено:
Интересует, как точно установить DPI для страницы по ссылке, и корректно задать ей в нужном месте DPI? — https://yadi.sk/d/OWGAexUVohj0IQ

Смотрел DPI в IrfanView, там показано, что DPI = 1.

Автор: TelecomUral, Отправлено:15:48 26-01-2020

D1D1D1D
никак. нужно знать высоту книги, например (в выходных данных есть запись типа 84х108 1/8). На каталожной карточке пишут прямо сантиметры, чтобы потом на правильный стеллаж отправить в хранение. Или сфоткать линейку на фоне букв. Или монетку положить. А просто лист - не к чему привязать. Я же писал выше - коэффициент пересчета неизвестен.

Автор: D1D1D1D, Отправлено:15:56 26-01-2020

TelecomUral
Такого плана сканы могут быть для возможности определения размера? — https://yadi.sk/d/_yaO18fSZSX58A

Автор: TelecomUral, Отправлено:16:04 26-01-2020

D1D1D1D
ну да.
что угодно, что дает "в этом числе пикселей картинки столько-то миллиметров". но если это фото с рук или с плавающим фокусным расстоянием объектива - то на каждом фото такой объект должен быть.

Автор: D1D1D1D, Отправлено:20:22 26-01-2020

А когда размер текста меньше страницы — это признак того, что DPI указано меньше, или больше?

Автор: TelecomUral, Отправлено:20:29 26-01-2020

D1D1D1D
или это признак того, что не пересчитаны размеры на закладке Book. Меню Process\Calculate book size

Автор: ComboFZ, Отправлено:12:43 27-01-2020

D1D1D1D

Цитата:
вы из SK получили PDF 9 мегабайт, или после оптимизировали?

После.


Цитата:
Интересует, как точно установить DPI для страницы по ссылке, и корректно задать ей в нужном месте DPI? — https://yadi.sk/d/OWGAexUVohj0IQ

DPI (если нет данных или они неверные) можете узнать в FineReader 14 > Редактировать изображение > Разрешение изображений > Другое: (покажет 330dpi).
На кнопку Определить оптимальное разрешение там не надо нажимать.

Поправить/установить DPI на снимках/сканах (без пересжатия оных) можете в ExifTool

Автор: mmordk1, Отправлено:20:46 31-01-2020

Простой вопрос : какие опции ставить, чтобы собрать ГиФ файлы в ПДФ без потери в разрешении?

Спасибо

Автор: shch_vg, Отправлено:21:04 31-01-2020

mmordk1
Закладка File параметр DPI=Original.

P.S. Правда я не встречал гифы с указанным DPI.

Автор: niksad31, Отправлено:09:28 10-02-2020

TelecomUral

Цитата:
В СканКромсаторе есть инструмент Background cleaner. Чаще всего прекрасно справляется. За подробностями в соответствующую ветку.
Цветную ручку можно и в графредакторе, наверное, удалить, а вот карандаш - разве только по яркости.


Извини, не могу выложить примеры страниц книги, она ДСП по спецтематике. Но подчёркивание простым карандашом и синей ручкой самое обычное от руки, в любых справочниках такое встречается. Только я книгу отсканировал как чёрно-белый текст в PDF с очисткой фона сканером. Но подчёркивания все остались.

Попробовал вкладку Background Cleaner, но она совсем ничего не изменила. Я со СканКромсатором незнаком, что-то делаю не так. Вы не могли бы на примере любой страницы книги показать?

В графредакторе врядли осилю вручную чистить, книжка слишком толстая, и сильно замарана пометками. Хотелось бы конечно. Нашёл в сети ветку по нейронным сетям, вроде как к месту, но разраб код нифига не выложил, хотя просили.

Автор: niccolo, Отправлено:09:46 10-02-2020


Цитата:
Только я книгу отсканировал как чёрно-белый текст в PDF с очисткой фона сканером. Но подчёркивания все остались.


Теперь только руками. Более менее автоматом вычистить можно только из серого.


Цитата:
А когда размер текста меньше страницы — это признак того, что DPI указано меньше, или больше?


У данной страницы разрешение выше чем у других. Проверить разрешение можно любым просмотрщиком.

Автор: niksad31, Отправлено:18:14 10-02-2020

niccolo

Цитата:
Теперь только руками

Попробовал руками в СканКромсаторе, по пособию нашёл функцию Ctr+Shift+Click на линии подчёркивания. Не пошло, т.к. почти все линии где-то задевают буквы текста, и при клике буквы удаляются вместе с линией. Можно как-то алгоритм этого метода улучшить?

А как ещё руками: ластиком в Фотошопе, или какие фильтры имеются? Есть ли смысл перегнать книгу из PDF в DJVU для лучшего сжатия, и чем без потери качества?

Автор: TelecomUral, Отправлено:19:22 10-02-2020

niksad31
работает ли бэкграунд клинер на чб материале - это только разработчик СК подскажет. Я всегда на сером его использовал.

оффтоп
"Сами себе злобные буратино", в чб делать сканы. Уж сколько раз твердили миру...

Автор: daa2013, Отправлено:19:39 10-02-2020

Имеет смысл в цвете пересканировать.
Тот же Ктрл+шифт + Клик он же и на цветном работает.. Карандаш и ручка - они другие по цвету и часто можно неплохо порог подобрать, так что именно они и уходят, а буквы остаются.

Т.е. сначала почистить., сохраняя сканы цветными, а потом уже бинаризовать на втором проходе.

Это вот с черной ручкой или старыми темно-фиолетовыми чернилами засада.

Автор: niksad31, Отправлено:02:24 11-02-2020

Так в цвете или серым сканировать? Я думал, чип сканера лучше бэкграунд почистит, хотя там и чистить то нечего, кроме линий. Бинаризацию раньше пробовал, но качество текста ухудшалось, если фон грязный.

Непонятно, почему не работает бэкграунд клинер? Автор Кромсатора в той ветке по нейронным сетям упоминал, что использует распознавание текста для очистки фона. Цвет тогда при чём? Текст у меня и Ч/Б чистый без дефектов.

Автор: TelecomUral, Отправлено:08:05 11-02-2020


Цитата:
Так в цвете или серым сканировать?

Поэкспериментировал сейчас "от балды". Я, в общем-то, дилетант в обработке.
Советую перед СК перевести свои чб сканы в 24-bit color, и помимо background cleaner задействовать blur. Кое-что тогда и с чб скана удаляется. Хотя, конечно, фиговенько. Метод "Horizontal", параметр "protect black pixels" снял, иначе линия только жирнее становится.
На чистом чб клинер не работает у меня. Наверное и не должен.

А если будете пересканировать, то лучше делайте в цвете. В серый перевести никогда не поздно. Тем более ручка синяя.

Автор: daa2013, Отправлено:08:53 11-02-2020


Цитата:
Цвет тогда при чём?

руками кликаете по синему, синий и удаляется.

Автор: niccolo, Отправлено:13:01 13-02-2020


Цитата:
Попробовал руками в СканКромсаторе, по пособию нашёл функцию Ctr+Shift+Click на линии подчёркивания. Не пошло, т.к. почти все линии где-то задевают буквы текста, и при клике буквы удаляются вместе с линией. Можно как-то алгоритм этого метода улучшить?



Для рук сканкромсатор не всегда лучшее решение.
Линии подчёркивания отличить от текста для автоматического удаления можно только по цвету/интенсивности, что и делается в сером или цвете. В Ч/Б это уже невозможно.

А вообще, если речь о карандаше и есть доступ к книге для неопытных товарищей может оказаться проще простой ластик и пересканирование.
Вариант 2 — просто исправить ошибки в распознанном и не мучиться с картинками.

А где сейчас последняя версия обитает?

И еще вопрос - есть ли где функция выделения глифов из текста (или просто системным шрифтом типа Литературная) с возможностью последующей запечатки дефектов печати или сканирования? А то все равно когда проверяешь текст в SK исправить такие ошибки просто, чем потом их искать и исправлять в ФР.

Или кто вообще как данный вопрос решает?

Автор: TelecomUral, Отправлено:21:03 14-02-2020


Цитата:
есть ли где функция выделения глифов из текста

вы о чём? глифы в СК уж тыщу лет применяются. Сначала набираете глиф в табличку, потом оттуда его ставите в нужное место.

Автор: niccolo, Отправлено:23:51 14-02-2020


Цитата:
вы о чём? глифы в СК уж тыщу лет применяются. Сначала набираете глиф в табличку, потом оттуда его ставите в нужное место.


О какой версии речь?

После шапки ни одной новой версии в паблике не видел... Поэтому пока сижу на 5.96 или 6.00.05.

Автор: shch_vg, Отправлено:01:31 15-02-2020

niccolo
Тыщу не тыщу, а в 6.00.05 глифы есть.

Автор: niccolo, Отправлено:02:37 15-02-2020


Цитата:
Тыщу не тыщу, а в 6.00.05 глифы есть.


спасибо, изучаю документацию...Там вопросы по разделам и номерам, а не версиям....
Это есть в 6.00.05?
Работа с библиотекой глифов пополнилась рядом
усовершенствований: регулировка представления окошка с
глифами (количество колонок, авто-ширина), мульти-выделение и
мульти-перетаскивание глифов внутри окошка, авто-кроп
вставляемых глифов (удаление лишнего белого пространства
вокруг глифа), добавление заданного белого зазора со всех
сторон глифа.
Добавлена возможность авто-установки глифа в место вставки:
теперь не обязательно точно выбирать точку вставки глифа, СК
сам постарается найти оптимальное положение для вставки,
анализируя некоторую окрестность вблизи курсора.
- Новые hotkey для окна VR: Add glyph to library, Insert
glyph to library


По описанию, как понял, глифы в таблице не привязаны к клаве (т.е при нажатии m (например с модификатором - CTRL, ALT etc) — не вставляется глиф из ячейки m?)
Тогда, как вариант, вместо пустой коллекции глифов можно использовать шрифт типа Литературная (или с выбором) с подбором кегля... (с особенностями вставки глифов типа залития белым фоном прямоугольника вокруг+1-3 пикс)

Да отстал я от развития программы... Каюсь...

Автор: D1D1D1D, Отправлено:08:01 10-03-2020

Можно ли автоматизировать изменение цвета для колонтитулов, находящихся в определенном участке на всех страницах?

Автор: TelecomUral, Отправлено:10:46 10-03-2020

D1D1D1D
непонятен вопрос. Что такое "колонтитул"? У СК же нет такого термина. У него есть зона.
У зоны может быть признак группы. Размножение свойств может быть сделано по этому признаку. То есть если вы колонтитул выделили зоной и назначили зонам одну и ту же группу, то пожалуйста, групповые операции будут работать.

Автор: D1D1D1D, Отправлено:20:02 10-03-2020

TelecomUral
СК — программа. Но мы же с вами люди, могущие общаться и понимать друг друга, применяя любые термины, в том числе описанные в словарях, потому что под колонтитулом имеется в виду обычное словарное значение. Хотелось бы изменить цвет выделенному колонтитулу и чтобы то же самое было применено ко всем последующим страницам в области этого выделения насквозь.

Автор: TelecomUral, Отправлено:06:42 11-03-2020

А прикольная была бы фича в аут-задании Задать одинаковый номер зонам, расположенным в габаритах выделения мышкой. Или касающимся. Размеры-то страниц уже одинаковы.
Но именно прикольная - обработчик сам должен был при расстановке зон подумать о назначении группы.

Автор: D1D1D1D, Отправлено:09:20 11-03-2020

Так и не понял: это возможно или нет? Или я о чем-то заранее не подумал?

Автор: daa2013, Отправлено:09:48 11-03-2020

Да, возможно.


шаг №1 Выделить колонтитулы в пикчур-зоны. (предполагаем, что в зонах только колонтитулы)

(если страницы заранее правильно обрезаны, то и расставить зоны можно копированием. На одной страницы ее поставить, а затем сделать копи-пасте на все остальные страницы (или на все четные/ на все нечетные страницы). Если где-то колонтитулов нет, то там удалить. Если где-то колонтитула смещены там зоны пододвинуть.

шаг №2 в любой зоне с колонтитулом назначить свойства. Зона "раскрашенная" (т.е. ч.б., а на закладке PAINT свойств зоны ставите раскраску в желаемые цвета.)

шаг №3 назначаете всем зонам свойства этой правильно раскрашенной (Там в окне "свойства зоны" есть кнопка "Копи ту групп" , выберите группу All marked)

UPDATE
можно также сразу поставить зону с правильными свойствами и уже её копировать, а не свойства переназначать.

Автор: bolega, Отправлено:18:45 11-03-2020

D1D1D1D
По большому счету TelecomUral абсолютно прав: вы недостаточно ясно сформулировали условия вашей задачи. Если нужно расцветить уже обработанные сканы, то алгоритм будет один, если изначально имеем дело со сканами (разно размерными, перекошенными и т.д.) то алгоритм будет другой. В первом случае скорее всего все колонтитулы находятся примерно в одном месте, достаточно сделать одну/две раскрашенные зоны и размножить их на все страницы или чет/нечет. Лишние потом удалить. Во втором случае это не прокатит, нужно будет ставить зоны ручками на каждой странице. Есть еще одно важное отличие.
Для первого случая (т.е. это out-задание или что то же самое, задание из bw файлов, не требующих обработки), тип зоны должен быть special, а не b/w! Тогда после расстановки зон можно в этом же задании сразу сделать djvu или pdf. Все остальные типы подразумевают что будет сначала выполнена обработка, и только потом через out-задание получать djvu/pdf. Это справедливо и для второго случая.
Если во втором случае обработку не сделать, то на этапе создания djvu такие зоны будут просто проигнорированы.

Автор: D1D1D1D, Отправлено:20:15 11-03-2020

TelecomUral
daa2013
bolega
Ясно, спасибо.

Добавлено:
Пытаюсь отснятую на телефон книгу обработать, но никак не удаётся привести в соответствие разные страницы, текст на которых был на разном расстоянии, из-за чего размеры плавающие. На одной странице тест имеет заданные поля, на другой — правое поле чуть больше, а весь текст чуть меньше. Вот такая пара страниц — https://yadi.sk/d/-uxtlQ4uOCsDlw

Обрабатываются ли в программе такие случаи?

Автор: wasp238, Отправлено:09:49 15-03-2020


Цитата:
ScanKromsator. Основы автор разыскивается

Автор этого видео урока - я. Снимал лет 10 назад, потом отослал на оценку "кому-то" и они забраковали из-за длительности. Урок выкладывать не стал, и продолжение не снимал.
Что осталось, так это софт и небольшой хелп (20 стр с картинками) как я обрабатывал книги, кому надо качаем:
https://drive.google.com/open?id=1brAZ-JMcoVYpBfTWZvU12muGaWWDxN_c

Автор: D1D1D1D, Отправлено:21:35 15-03-2020

Всё-таки, никак не удается настроить соотношение страниц, чтобы текст с полями соответствовал остальным страницам и чтобы тексты с пустотами не смещались в ненужные стороны. Собрал в архиве выборочные страницы из проекта и сам файл проекта под них — просьба подсказать, как его правильно настроить — https://yadi.sk/d/5NHr9Yv5XJnZ6w.

Автор: TelecomUral, Отправлено:04:14 16-03-2020

D1D1D1D
объясните сначала свои термины. пожалуйста.
"ненужные стороны"
"соответствовал остальным"
"правильно"
Ни одного словаря на ваши термины, как я полагаю, не существует. Даль и Виноградов вряд ли помогут.

Возьмите листок А4, нарисуйте на нем эскизы оригиналов, и ниже - что вы хотите получить, какое равнение для каких сканов. Листок сосканьте и покажите тут. А уж потом можно будет глядеть, какие настройки делать в СК. Пока что ваше "правильно" для других сокрыто во тьме.

Вообще по равнению текстового блока в габаритах листа в Хрестоматии есть прекрасные тексты. И мой ролик о равнении в край может помочь, вероятно (https://youtu.be/gIhpk6bfl3w)

Автор: daa2013, Отправлено:06:53 16-03-2020

Постом ранее было написано:
"пытаюсь отснятую на телефон книгу обработать"

это значит, что нужна функция автомасштабирования, которую я в лохматом 2008 году просил от разработчика СканТейлора (он еще тогда был на стадии замысла !), и которую тот в мод СканТейлорЭкспериментал всё-таки встроил. Именно эта прога (этот мод) заточена на обработку фотографий книг из-за наличия следующих операций:
- исправление геометрических искажений как самая первая стадия обработки;
- выравнивание страниц по вышине и высоте текстового блока путем масштабирования.
В СканКромсаторе этих функций нет.


UPDATE
Упс. Тут у вас уже другой проект.
Короткого ответа на ваш вопрос не существует. Длинный текст (Хрестоматия - разделы 2.3, 2.4., 2.11). Вам не заходит.
Попробуйте видеоролики посмотреть. Впрочем, мне лично макетирование страниц в СК тоже кажется сложновато устроенным. Я сначала в СТ обрезаю все страницы под один размер с правильными полями. Делаю цветной вывод. А потом уже занимаюсь бинаризацией и расстановкой зон в СК.

Автор: shch_vg, Отправлено:17:24 16-03-2020

Кто-нибудь сталкивался с таким чудом?
На вин10 пробую к заданию импортировать пару сканов из пдф.
СК (6.0.5 и 6.41) спокойно проглатывают мой ОК и ничего не импортирует.
Пробую то же на сервер2003.
СК становится более разговорчив, выдает сообщение:

Ошибка открытия файла ХХХХХ.pdf!
Возможно файл открыт другим приложением или запаролен
Retry Cancel

хотя кроме как из СК я с ним не вступал в контакт.
Открыл этот пдф в Nitro_PDF и без проблем вытащил тифы.
Сейчас сижу и чещу репу:
1. Что происходит с СК?
2. Почему реакция одной и той же программы (оба компа связаны по сети и стартую из одной папки) на разных системах различна?

Автор: bolega, Отправлено:18:33 16-03-2020

shch_vg

Цитата:
1. Что происходит с СК?

Видимо, ожидаете, что автор СК должен принести вам извинения за доставленные неудобства?
Если по делу, то много раз такое встречалось и объяснялось тут на форуме: СК не любит файлы, сделанные не по стандарту PDF. Такие файлы встречаются на практике постоянно, профессиональные программы научены обходить косяки, СК - нет. Обычно пересохранение "неправильного" файла в акробате проф решает проблему. Если не решает - надо смотреть что не так идет в СК именно с этим конкретным файлом (баг в СК тоже вполне возможен).

Автор: shch_vg, Отправлено:18:51 16-03-2020

bolega

Цитата:
Видимо, ожидаете, что автор СК должен принести вам извинения за доставленные неудобства?

Интересно, из какого места моего сообщения был сделан такой вывод?
То, что в СК не все пдф импортируются, я давно знаю.
Просто с такой реакцией СК я еще не сталкивался, причем в разных системах по-разному, вот, что меня удивило.

Автор: bolega, Отправлено:19:49 16-03-2020

shch_vg

Цитата:
Интересно, из какого места моего сообщения был сделан такой вывод

Вы ранее всегда в таких случаях давали образец файла для исследования. Сейчас ваш вопрос выглядит риторическим (и вы сами это прекрасно понимаете), просто потому, что без pdf-файла никаких выводов сделать нельзя в принципе.

Автор: shch_vg, Отправлено:00:57 17-03-2020

bolega
Причина, заставившая меня написать сообщение, была не в том, чтобы обратить внимание на то, что СК не смог импортировать еще один пдф (тем более, что перезапись файла в NITRO выпрямила его), а в том, что программа повела себя неодинаково в разных системах.
Я только что начал немного работать в вин10 и не ожидал такой разницы.
Если бы она выдала что-то типа "Кривой пдф" или какую-то замысловатую (но похожую в обеих системах) ошибку, то воспринял это как должное. А то в одном случае (вин10) молча проглотила попытку импорта, а в другой (сервер2003) огорошила запароленностью пдф. Вот и все объяснение моего удивления.
В данном случае я интересовался, не сталкивался ли кто-нибудь с подобным явлением, а с конкретными кривыми пдф ранее я обращался непосредственно к Вам.

Автор: TelecomUral, Отправлено:03:06 17-03-2020

shch_vg
да, на десятке СК ведет себя странновато, не единожды отмечал. Конкретику не приведу.

Автор: D1D1D1D, Отправлено:05:56 17-03-2020

Возник вопрос насчёт сохранения в PDF из SK. TIF-файлы получились 5320х8020, в некоторых случаях с отличающимся DPI. Когда сохраняю в PDF, результат получается под гигабайт размером, не смотря, что комбинировал настройки из выпадающего списка «DPI» и «Input DPI». По открытии PDF-файла он по умолчанию отображается на уровне 30%, с возможностью увеличения. Хотелось бы понять, с какими настройками получать приемлемых размеров файл?

Автор: TelecomUral, Отправлено:07:02 17-03-2020

D1D1D1D
а зоны у вас в задании есть? или всё чистый чб текст? Зоны могут создавать очень большой объем, особенно если как у вас - из 120дпи на входе в 600дпи на выходе. И во flate.

Вообще-то намного проще сделать как в шапке написано - подготовить и выложить sub-task.

Автор: D1D1D1D, Отправлено:08:00 17-03-2020

TelecomUral
Поначалу все колонтитулы на четырех ста страницах переделал в зоны. Но потом они были объединены и повторно открыты в новом задании, так что в описанном задании уже только раскрашенные колонтитулы, а зон нет. Получается, СК не подходит для создания PDF с цветным текстом, или есть какие-то оптимальные настройки по DPI для размеров 5320х8020, и другим моментам?

Автор: abc10, Отправлено:08:07 17-03-2020

All
Откуда можно скачать последнюю версию ScanKromsator'a?

Автор: bolega, Отправлено:08:07 17-03-2020

D1D1D1D
А у вас точно out-файлы и раскрашенные зоны - ч/б? Размер под гигабайт говорит на 100% об обратном.

Добавлено:

Цитата:
Но потом они были объединены и повторно открыты в новом задании

Вот и причина. После объединения все файлы стали цветными, поэтому и объем стал гигантский. Так делать нельзя.

Автор: TelecomUral, Отправлено:08:31 17-03-2020

D1D1D1D

Цитата:
Получается, СК не подходит для создания PDF с цветным текстом

Вы пользоваться научитесь, а СК ругать не стоит раньше времени.

Вы зачем колонтитулы объединили с чб текстом? Получили каждую страницу размером по 30-50 мегабайт, может и побольше. Пытаетесь запихнуть это всё в pdf - имеете гигабайтного монстра на выходе. А как иначе-то? Ну соображать же надо, когда мышкой елозите по функциям.

UPD
То есть вы не разбили страницы на зоны. Страницы цветные, раз с цветными колонтитулами. Соответственно, кодеру pdf неизвестно, какие алгоритмы сжатия для какой области (зоны) страницы применить. Ну и он честно пытается всю страницу ужать без потерь, или там в качественный джипег (думаю, всё-таки в тифф, а не в джипег).

оффтоп
Я всё не перестаю удивляться - для кого daa2013 старался Хрестоматию пилил. Ведь там разжёвано до деталей. Получается, доки писать - вообще зряшный труд.

Автор: D1D1D1D, Отправлено:17:37 17-03-2020

А если у меня сохранилось предыдущее задание с размеченными зонами — можно ситуацию исправить? Ведь программа может считать, будто я только что объединил зоны и опознавать их как черно-белые? Сами тиф-файлы максимум от 100 до 600 кб.

UPD
Вроде понял — надо Color на вкладке Files в B/W установить.


Цитата:
Вы зачем колонтитулы объединили с чб текстом? Получили каждую страницу размером по 30-50 мегабайт, может и побольше. Пытаетесь запихнуть это всё в pdf - имеете гигабайтного монстра на выходе. А как иначе-то? Ну соображать же надо, когда мышкой елозите по функциям.

Это как раз результат того, что соображал — ведь если программа сохраняет тифы в минимальном размере, естественно предположить, что таков их окончательный размер и он не будет расти при конвертации.

Автор: bolega, Отправлено:18:18 17-03-2020

D1D1D1D

Цитата:
А если у меня сохранилось предыдущее задание с размеченными зонами — можно ситуацию исправить?

Да, можно. Вы правы, нужно задать в нем Color=B/W. И во всех зонах-колонтитулах тоже не забудьте (задать в одной и скопировать этот параметр на все остальные).

Автор: D1D1D1D, Отправлено:18:24 17-03-2020

bolega

Цитата:
нужно задать в нем Color=B/W. И во всех зонах-колонтитулах тоже не забудьте

Имеется в виду в диалоговом окне «Picture zone properties» задать B/W — помимо Color на вкладке Files?

Автор: bolega, Отправлено:18:39 17-03-2020

Да, помимо. Ведь на то они и зоны, что их опции могут отличаться от опций страниц.
Если этого не сделать, страницы в pdf будут ч/б, а зоны пойдут цветными и размер будет опять неоптимальным.


Цитата:
он не будет расти при конвертации.

Одна ч/б точка занимает 1 бит, одна цветная - 8 или 24 бит. Т.е. общий размер вырастет на 1-2 порядка.
Многие не понимают, как СК создает pdf с цветным текстом. Вариантов бывает два: объединить зоны со страницей и получить в итоге цветной файл (по другому никак цвет не передать!). Из цветных файлов создать огромный pdf.
Второй вариант: оставить все ч/б. СК, увидев, что для ч/б зоны задана раскраска, сделает так: поместит в pdf ч/б, т.е. 1-битный файл, и добавит специальную pdf-команду: "раскрась такой-то участок таким-то цветом".
Для djvu примерно то же самое.



Автор: TelecomUral, Отправлено:18:46 17-03-2020


Цитата:
т.е. 1-битный файл

экономия тут на том, что файл (зона) одного цвета имеет всего одну pdf-команду на все свои точки.

Автор: bearjrgm, Отправлено:20:03 17-03-2020

Добрый день, поделитесь пожалуйста ссылкой на комлект кромсатора и утилит

Автор: D1D1D1D, Отправлено:22:41 17-03-2020

У меня все 400 страниц проекта имеют разрешение 5320х8020, 300dpi, 2 colors — кроме обложки, которая 256 colors. PDF получается 60 МБ, когда открываю — PDF-просмотрщик показывает 32% во весь экран, с возможностью ещё большего увеличения до 100%. При этом цветная обложка (она при отдельном сохранении в одностраничный PDF весит 1 МБ) медленно разворачивается кусками, а все остальные намного быстрей.

С какими настройками можно уменьшить тяжесть обложки и увеличить скорость ее показа? А также, как получить PDF, который при открытии будет отображаться во весь экран на 90%, а не на 30%, благодаря чему наверно и общий размер PDF-файла уменьшится?

Автор: TelecomUral, Отправлено:01:54 18-03-2020

bearjrgm
в шапке

Автор: abc10, Отправлено:02:06 18-03-2020

TelecomUral
Разве в шапке это последняя версия ScanKromsator v6.00.5?

Автор: D1D1D1D, Отправлено:03:33 18-03-2020

Почему если прописывать в InputDPI значение 1200 — разрешение PDF-файла наоборот уменьшается? То есть, после конвертации в PDF открывается по умолчанию во весь экран на 129%.

Автор: TelecomUral, Отправлено:03:37 18-03-2020

abc10
публичная - последняя.

Добавлено:
D1D1D1D
потому что "в попугаях я всё-таки длиннее".
какой коэф.преобразования назначили, так и отобразилось.

Автор: D1D1D1D, Отправлено:03:53 18-03-2020

TelecomUral
А почему размер получается почти тот же — 59мб (на 300 или 600 dpi было 60мб)?

Автор: TelecomUral, Отправлено:04:00 18-03-2020

D1D1D1D
не знаю. преобразование многоэтапное. мало ли чего вы настроили.
по идее, размер должен был уменьшиться посущественнее, т.к. точек стало физически вчетверо меньше (600->1200 это значит для выхода в 600 каждую точку - пополам). но это если правильно делать.

Автор: D1D1D1D, Отправлено:04:19 18-03-2020

А можно считать оптимальным, когда при открытии PDF-файла он по умолчанию разворачивается во весь экран на 21% ?

Автор: TelecomUral, Отправлено:05:24 18-03-2020

D1D1D1D
от оригинала зависит. Если это плакат А0, отчего бы и нет.
смотрите во вьювере физразмеры в см.

Автор: D1D1D1D, Отправлено:05:30 18-03-2020

TelecomUral
Это обычные страницы книги.

Автор: TelecomUral, Отправлено:05:45 18-03-2020

D1D1D1D
Размеры-то какие вьювер показывает? Небось полметра на полметра? Значит ошиблись.

А старт просмотра, ИМХО, удобен такой, чтобы книжку сразу было легко читать.

Автор: D1D1D1D, Отправлено:07:31 18-03-2020

TelecomUral
Вьювер PDF? "26,60 x 40,10 in".

Автор: TelecomUral, Отправлено:07:42 18-03-2020

D1D1D1D
Ваш вопрос снят?

Автор: D1D1D1D, Отправлено:07:43 18-03-2020

А насчёт разрешения — вот смотрю я джвю, сделанные опытными товарищами, так у них, если обработанные ими страницы отобразить один к одному — они тоже огромные. Может, это не проблема, или для PDF надо иначе?

Добавлено:
TelecomUral
Вопрос ещё животрепещет.

Добавлено:
Хотя тоже с их джвю не понятно — если задать отображение на 100% — страница уменьшается и полностью видна на экране, а если задать один к одному — вылазит за края экрана.

Автор: TelecomUral, Отправлено:08:04 18-03-2020

D1D1D1D
Мне кажется, это всё тут далёкий оффтоп. Когда вы определитесь со своей задачей, тогда настанет время конкретики, что в СК настраивать. А пока что все разговоры не по теме. Вьювер вьювером, их десятки, и на разных аппаратах и операционках. Кому-то нравится смартфон, кому-то планшет, а я иначе чем на 24 дюймовом мониторе книги давно уже не просматриваю, другие устройства слишком мелкие. В разворот, естественно.

Всё, что стоит знать про СК пока что - это как его заставить указать в pdf предпочитаемый вид при открытии. Масштаб, попарность, первый лист отдельно/нет. Я не знаю как

Автор: D1D1D1D, Отправлено:08:11 18-03-2020

Задача — посредством СК создать оптимальный PDF. И раз уж в СК есть такая функция создания PDF-файлов, то обсуждение и попытка понять тонкости сохранения в этот формат далеко не оффтоп)

Автор: TelecomUral, Отправлено:08:38 18-03-2020

D1D1D1D
Кому оптимальный? Вам? Так их, тонкости, только вы и ощутите как оптимальные. Зачем тут себя выкладывать за образец.

Вы технические параметры конкретизируйте сначала. Чтобы тут разговор был предметным. Типа "я хочу на таком-то устройстве, такой-то оригинал, в такой-то программе, видеть в таком-то размере/цвете/с фоном ..."
Три страницы бессмысленных вопросов уже. Только размер pdf и известен - лист ватмана

Автор: D1D1D1D, Отправлено:09:31 18-03-2020

TelecomUral
Оптимальный не мне, конечно, а тем, кто в этом понимает — с соответствующими техническими параметрами, независимо от устройств и прочего. Вот как те, кто знают, какими более менее оптимальные pdf должны быть и по какому сценарию они их в основном делают — вот таким же мне хотелось бы воспользоваться, без чего-то особенного))

Автор: TelecomUral, Отправлено:10:05 18-03-2020

D1D1D1D
Ищете "заказчика" то есть?

Выберите такой файл среди готовых, который вам нравится. И делайте "такой же".
Потому что сколько людей, столько и мнений. Никакой "оптимальности вообще" не существует. Десятки людей делают pdf-ки. В разных вариантах.

Автор: bearjrgm, Отправлено:10:16 18-03-2020


Цитата:
в шапке

там же ссылки на русфолдер, который почил в бозе

Автор: D1D1D1D, Отправлено:10:32 18-03-2020

TelecomUral
Я говорил не о любых людях, а о сканировщиках, у которых создание электронных книг поставлено на поток и которые используют примерно одинаковые параметры в отношении того, о чем я писал. Кстати, в Хрестоматии вопрос сохранения в PDF не мешало бы отразить

Автор: abc10, Отправлено:10:32 18-03-2020

bearjrgm
Там на яндекс есть ссылка рабочая, скачивал несколько лет назад
ScanKromsator v6.00.5 (05.2016)

Автор: TelecomUral, Отправлено:10:47 18-03-2020


Цитата:
Кстати, в Хрестоматии вопрос сохранения в PDF не мешало бы отразить

раздел 1.3 пункты 8-10.
А в разделе 2.1 в блоке "Коррекция загруженных файлов " описаны нюансы с dpi.

Автор: daa2013, Отправлено:04:32 19-03-2020

D1D1D1D

Цитата:
Кстати, в Хрестоматии вопрос сохранения в PDF не мешало бы отразить


Напишите соответствующий параграф (какие были трудности, как вы их преодолели), а я в следующую версию вставлю. Разберитесь сами и расскажите другим.

Автор: shch_vg, Отправлено:18:21 20-03-2020

daa2013

Цитата:
Разберитесь сами и расскажите другим.

5 с плюсом за способ прекращения ненужной болтовни.

Автор: daa2013, Отправлено:11:25 25-03-2020

Моргнуло электричество.

И я обнаружил, что в 6.42 почему-то не сохранились автосейвы глифов. Сегодня 25-е, а бак-файл для skgli датирован утром 18-го даже до момента сохранения и проекта (и глифов вместе с ним) вечером 18-го.

В 6.00.5 бак-файлы глифов прекрасно сохранялись.
Тут было всё настроено хорошо, в опциях стояло по дефолту (каждые три минуты).

Автор: shch_vg, Отправлено:13:05 25-03-2020

daa2013
А Вы уверены, что при автосейве сохраняются глифы?
М.б. они сохраняются только при сохранении задания.

Автор: daa2013, Отправлено:13:41 25-03-2020

Именно такое поведение было в 6.00.5.

Иначе файл бак для глифов бессмысленнен. В 6.00.5. я, если что, лез именно в него и подменял основной на резервный.
А тут полез в резервный (бак.скгли), а он более старый, чем основной.

Автор: bolega, Отправлено:13:56 25-03-2020

Глифы сохраняются только при выходе из RV, и только если изменялись. BAK-файл создается тогда же. BAK-файл содержит предыдущую версию, поэтому он естесно более старый, время файла не меняется.
Автосейв не действует на глифы.

Автор: daa2013, Отправлено:15:52 25-03-2020

ага, понятно.
то есть у меня несколько дней висел СК без закрытия, вот я глифы и потерял.

печалька

Автор: D1D1D1D, Отправлено:19:11 25-03-2020


Цитата:
Разберитесь сами и расскажите другим.


Цитата:
5 с плюсом за способ прекращения ненужной болтовни.


Решение наклюнулось через сторонние приложения, но непраздный вопрос изначальной настройки принятого в большинстве случаев масштаба, к сожалению, так и остался на уровне болтовни.

Автор: shch_vg, Отправлено:00:42 26-03-2020

D1D1D1D

Цитата:
непраздный вопрос изначальной настройки принятого в большинстве случаев масштаба, к сожалению, так и остался на уровне болтовни.

Для обсуждения таких общих "непраздных вопросов" есть тема "Электронные книги: сканирование, обработка, сборка", в которой как раз и обсуждаются главным образом "сторонние приложения".
А это тема по конкретной программе Сканкромсатор, автор которого сам решает, что его программе нужно, а что нет.

Автор: D1D1D1D, Отправлено:03:14 26-03-2020

shch_vg
Да я тут не сторонние приложения собирался обсуждать, а выяснить, как это настроить в СК. А так как это не удалось, приходится использовать сторонние.

Автор: TelecomUral, Отправлено:07:02 26-03-2020

D1D1D1D

Цитата:
непраздный вопрос изначальной настройки принятого в большинстве случаев масштаба, к сожалению, так и остался на уровне болтовни.

Сделали пробную обработку, как в хрестоматии написано, в указанных мной разделах?

Автор: daa2013, Отправлено:13:27 26-03-2020

bolega

Цитата:
Глифы сохраняются только при выходе из RV, и только если изменялись.

а может на панели глифов можно какую-нить кнопку прикрутить "сохранить библиотеку глифов". Или хоткей какой для этого ввести , чтобы не входить/выходить в RV каждый раз как изменения в глифах сделал ? ну раз автосохранения там нет.

и вы не разобрались, отчего происходит "вылет глифов" ? (пертаксивание мышкой работает, а вставка по хоткею пасте - нет). а то приходится в 6.00.5 переходить, как это начинается.

у меня также возниклдо ощущение, что если подождть какое-то время (уйти, чаю попить), то оно прекращается. Но это не 100%. Может, где-то что-то переполняется ?

Автор: niccolo, Отправлено:13:42 26-03-2020


Цитата:
Или хоткей какой для этого ввести , чтобы не входить/выходить в RV каждый раз как изменения в глифах сделал ?


неплохо бы вообще стандартные библиотеки или возможность создания библиотеки из шрифта (напр. Литературная) подбором кегля.

Автор: bolega, Отправлено:14:45 26-03-2020

daa2013

Цитата:
и вы не разобрались, отчего происходит "вылет глифов" ?

Разобрался. Вроде починил, но не на 100%.
Проблема в том, что хоткеи windows привязаны к командам меню. Если в окне есть главное меню, то проблем нет - оно всегда присутствует. Если его нет (как в VR), то движок GUI ищет команду в контекстном меню текущего сфокусированного элемента. А фокус может быть не на панели графич. редактора, и команда уходит в никуда. Перехватить это у меня нормально не получается, т.к. обработка хоткеев встроена в самое ядро GUI.
По этой же причине и хоткей на undo иногда не срабатывает.
Если предварительно щелкнуть на редакторе, т.е. передать ему фокус, то проблем уже не возникает.

Автор: daa2013, Отправлено:16:41 26-03-2020

Я пробовал перед нажатием хоткея на команду пасте всегда кликать по окну.
То есть не просто навести мышь на точку вставку, а кликнуть туда. Это, если вылеты уже начались, не помогает. То есть где-то прописалась не та координата положения мыши и "застряла". В ролике, что выкладывал ранее, я зум делал. Т.е. колесиком мыши туда-сюда шевелил. (Это же тоже с кликом по странице происходит). Страничка приближается-удаляется, а вставка идет в фиксированную точку экрана (не страницы).

Просто в 6.00.5 такой беды не было и как-то странно, ведь визуально в логике работы окна RV ничего не изменилось.

Добавлено:
Возникла еще одна идейка по улучшению работы с глифами.
Дать им некое свойство. Например вылелить некоторые синей рамкой и вставлять всегда по умолчанию как если была нажата t (прозрачность белого).
Мотивация - стал делать часть глифов тоненькими: "н", "и", "п". И ставлю их в режиме t, только чтобы восстановить перемычки. Т.е. не спеклы вокруг отсечь, а перемычку внутри вернуть.

Войти в этот режим постоянно не очень, так как спеклы-то тоже есть. И режим тула сюда переключать жрет время. А так обычные глифы ставились бы в зависимости от режима. А "синенькие" всегда только в режиме прозрачности.

Если бы так было, то экономилась бы куча нажатий t.

Update
а "коричневые", например, всегда вставали бы как не-t. "Белые" же, так как сейчас, оставались чувствительны к режиму включенной/выключенной прозрачности.

Автор: daa2013, Отправлено:09:41 27-03-2020

del

Автор: VadimirTT, Отправлено:18:51 02-04-2020

Што за треш творится в ветке про Книгообменник?

Автор: daa2013, Отправлено:20:48 02-04-2020


Цитата:
Што за треш творится в ветке про Книгообменник?



Автор: niccolo, Отправлено:23:38 13-04-2020

Поддержка запечатки шрифтом или наборы глифов литературной гарнитуры для 300-600 DPI не появились?

Автор: daa2013, Отправлено:12:44 21-05-2020

Делаю обработку разворотов в 6.42

применил порог AUTO (галочка "одинаковый на обеих половинах" везде снята)

вернулся в MW

если раньше после прогона обработки справа начинало высвечиваться значение полученного порога, то сейчас этого нет (кажется, писал уже об этом). Горит просто АВТО

далее пытаюсь поднять полученные авто-значения на 5 единиц.

1. в контекстном ПКМ пункт change threshold почему-то есть только в ячейке для левых половинок разворота. Ну, ладно, допустим, на все страницы подействует.

2. Применяю "подъем на 5" для всех страниц без каких-либо условий. Оно оказывается задействованным только где-то для половины разворотов, причем непонятно по какому принципу отобранных. У части разворотов сменилось на Custom (с указанием значений), у части осталось Auto (без указания значений).
Upd: я подозреваю, что драфт резаков взвел где-то какие-то флажки, невидимые юзеру, которые и оказывают на это влияние. Так как в какой-то более ранней версии СК, но без использования резаков, я прекрасно корректировал авто-пороги, да еще и с разными условиями для разных значений порогов.

Любопытное наблюдение: Хотя половинки вроде как должны были считаться индивидуально, разные значения кастомного порога для половинок одного разворота я вижу. Но такое, чтобы были разные пары авто + кастом, такое отсутствует.


3. Не получается задать условие до прогона обработки, так чтобы например сразу сказать, хочу порог АВТО +5 или АВТО +10.

Автор: daa2013, Отправлено:02:29 22-05-2020

1. Можно ли для целей контроля за деспеклингом прикрутить к СК такую штуку:
чтобы пиксели, имеющиеся в ч/б исходнике и пропавшие в выходном файле, были бы в окне RV подсвечены красным ?

А еще можно сделать и наоборот, чтобы пиксели, имеющиеся в выходном файле но отсутствующие в исходнике, подсвечивались, например, зелёным. (А цвет совпадающих там и там был бы сереньким или настраиваемым, как сейчас при подсветке спеклов). Тогда можно было бы и агрессивное джву-кодирование контролировать. (Это уже будет моя головная боль разобрать джву файл и руками поместить странички в папку out). Зато какая красота получится: все ошибки И-Н или пропавшие кусочки букв будут сразу видны. И их можно будет глифами поправить ...


2. Для целей улучшения обработки тонких перемычек нельзя ли прикрутить к инструментам группы Enhance ещё один фильтр: Flatten Histogram ?

https://en.wikipedia.org/wiki/Histogram_equalization

https://www.researchgate.net/profile/Javad_Alirezaie/publication/228895848_Perfectly_Flat_Histogram_Equalization/links/00b7d5255dfa7153ac000000/Perfectly-Flat-Histogram-Equalization.pdf

https://aitap.github.io/2018/07/21/flathist.html

Автор: TelecomUral, Отправлено:04:48 22-05-2020


Цитата:
чтобы пиксели, имеющиеся в ч/б исходнике и пропавшие в выходном файле, были бы в окне RV подсвечены красным ?

а разве нельзя в MV отключить деспекл, а в VR включить подсветку спеклов. То же самое вроде и получится.


Цитата:
пиксели, имеющиеся в выходном файле но отсутствующие в исходнике ... ошибки И-Н или пропавшие кусочки букв будут сразу видны. И их можно будет глифами поправить

какая оригинальная мысль, серьёзно.

Автор: daa2013, Отправлено:05:30 22-05-2020


Цитата:
а разве нельзя в MV отключить деспекл, а в VR включить подсветку спеклов. То же самое вроде и получится.

Не совсем. Цель-то поправить глифами утраченное полезное. Если деспекл отключить, то потом придется его по новой прогонять, и не факт, что он снова что-то нужное не отгрызёт.

А потом это хорошо взаимодействует со второй частью "хотелки". В итоге все различия между двумя ч/б изображениями и будут видны. И добавки , и утраты.

Кроме того, не только деспеклинг может оказать влияние на пропажи кусочков символов. Если заниматься подменой сравниваемых исходников, то можно будет контролировать воздействие и других инструментов.

Возможные утраты могут также примыкать к буквам и не быть спеклами технически.

Автор: asku, Отправлено:12:39 22-05-2020

Добрый день. Подскажите, пожалуйста, как уменьшить вот такие «складки» на страницах в SK. На прикрепленном скане «складка» в верхней левой области.


Автор: NME, Отправлено:13:45 25-05-2020

daa2013

Цитата:
1. Можно ли для целей контроля за деспеклингом прикрутить к СК такую штуку:
чтобы пиксели, имеющиеся в ч/б исходнике и пропавшие в выходном файле, были бы в окне RV подсвечены красным ?
А еще можно сделать и наоборот, чтобы пиксели, имеющиеся в выходном файле но отсутствующие в исходнике, подсвечивались, например, зелёным.

это и сейчас можно сделать с помощью утилит imagemagick, например так:

Код:
convert 001.tif -fill red -draw "point 0,0" -opaque black 001.png
convert 002.tif -fill green -draw "point 0,0" -opaque black 002.png
composite -compose plus -blend 50 001.png 002.png out.png

если исходное изображение не монохромное, то скорее всего рисование точки (-draw "point 0,0") можно убрать..
при необходимости можно батником организовать цикл для обработки папок с файлами..

upd вместо -compose plus -blend 50 можно -compose multiply указать..

Автор: U235, Отправлено:20:53 29-05-2020

NME Если цвета не сильно принципиальны (пурпурный вместо красного), то проще так:

Код:
convert 0174.tif 0174_.tif 0174.tif -set colorspace sRGB -combine rgb.png


Автор: daa2013, Отправлено:03:53 31-05-2020

Нельзя ли сделать так, чтобы для окна MW запоминалось выбранное положение
no zoom filter (радиокнопка в меню). Т.е. чтобы если я его отключил, то это запомнилось, и когда я стартовал бы СК заново мне не пришлось бы по новой его отключать.
(Т.е. чтобы по дефолту он был не включен, а стоял в том положении, которое выбрал юзер).

Автор: bolega, Отправлено:07:50 31-05-2020

daa2013
Оно запоминается, но в задании. Сохраните задание после изменения фильтра.

Автор: daa2013, Отправлено:08:12 31-05-2020

У меня очень сильно тормозит комп, когда этот фильтр включен.
Я бы, честно говоря, хотел и новые проекты создавать с отключенным фильтром, а не искать его каждый раз в глубине меню.

Может, в опции чекбокс добавите ? "Состояние фильтра по дефолту = выкл"

Автор: bolega, Отправлено:10:00 31-05-2020

Добавил

Добавлено:
daa2013

Цитата:
если раньше после прогона обработки справа начинало высвечиваться значение полученного порога, то сейчас этого нет (кажется, писал уже об этом). Горит просто АВТО

Баг. Исправил


Цитата:
в контекстном ПКМ пункт change threshold почему-то есть только в ячейке для левых половинок разворота.

Это чтобы не подумали, что эту операцию можно применять отдельно для половинок.


Цитата:
Применяю "подъем на 5" для всех страниц без каких-либо условий. Оно оказывается задействованным только где-то для половины разворотов, причем непонятно по какому принципу отобранных

Если авто-порог неизвестен для страницы, т.е. ранее страница не была обработана со значением auto, то и прибавлять не к чему.

Автор: daa2013, Отправлено:10:14 31-05-2020

Цитата:

Цитата:
Применяю "подъем на 5" для всех страниц без каких-либо условий. Оно оказывается задействованным только где-то для половины разворотов, причем непонятно по какому принципу отобранных

- Если авто-порог неизвестен для страницы, т.е. ранее страница не была обработана со значением auto, то и прибавлять не к чему.


Во всем проекте были выставлены авто. И весь проект был обработан. Т.е. авто-значения должны были быть у всех страниц (только не отображались справа).
Возможно, так баг проявлялся. К сожалению, прогнать новый большой проект с драфтом резаков смогу не раньше четверга-пятницы.





Автор: daa2013, Отправлено:16:39 04-06-2020

Поднял авто в существующем старом проекте. Вроде, теперь ко всем страницам применяется.

Можно ли в закладке "доклады" (reports) отображать список страниц с указанием найденных автозначений порога, чтобы можно было проверить самые темные и самые светлые страницы (то бишь с самыми низкими и самыми высокими авто-значениями). А не отсматривать всю книжку. ?
Заодно будет виден разброс значений порога.

Upd
Прогнал и полностью новый драфт с последующим поднятием авто. Вроде, все нормально.

Автор: antabu, Отправлено:17:37 06-06-2020

В окне просмотра результата как убрать строку состояния ? V 5.96.2

Автор: D1D1D1D, Отправлено:01:05 07-06-2020

Привет. Книга в SK включает отдельные половины страниц и их целые развороты (повернул таблицы по горизонтали для удобства восприятия), а также имеются объединенные половинки с форзаца. То есть, размеры не стандартные. Когда рассчитываю размеры книги из соответствующего пункта меню и потом включаю процесс — половинки страниц получаются шире, чем требуется, с дополнительным пустым полем. Как задать процесс, чтобы отдельные страницы и развороты обрабатывались стандартно и при этом чтобы размеры по вертикали совпадали?

Автор: TelecomUral, Отправлено:04:36 07-06-2020

D1D1D1D
наверное, можно извернуться, сделав обработку в два этапа. Выделите горизонтальные страницы красным, и рассчитайте их отдельно.
или гляньте тут, как работать с полями:
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1535746511/10#10

Лично я сделал бы поворот в DEE (экспрессэдиторе) после СК. Быстро и просто.

Автор: bolega, Отправлено:08:01 07-06-2020

D1D1D1D

Цитата:
(повернул таблицы по горизонтали для удобства восприятия

Не стоит этого делать при обработке. Повернуть их на 90 градусов лучше после обработки, после финализации. Для этого в окне VR имеются две кнопки, которые быстро это сделают. Одна поворачивает налево, другая направо. Последовательные нажатия позволят поворачивать также на 180, 270, 360 и т.д.


Цитата:
имеются объединенные половинки с форзаца

для них надо включить опцию special > ignore gaps. Эта опция позволяет: 1) исключить страницу из расчета размеров книги, 2) не добавлять поля к странице, т.е. ее размеры остаются как есть (как обрезаны резаками) 3)размеры страницы не будут подгоняться под размер книги, а останутся как есть.
Опция подходит как раз для форзацев, обложек, вклеек и т.п. Хотя есть обработчики, которые всегда делают размеры обложки одинаковыми с размерами страниц. Я никогда не понимал такого подхода, тем более что такого никогда не бывает для книг в твердом переплете.

Кстати, СК может рассчитать размеры книги исходя только из нужного набора страниц, например, выделенного красным. Для этого в диалоге расчета размеров книги нужно задать диапазон файлов, используемых для расчета.

Добавлено:

Цитата:
чтобы отдельные страницы и развороты обрабатывались стандартно и при этом чтобы размеры по вертикали совпадали?

В новой версии, которая скоро выйдет, предусмотрено задание альтернативного размера книги для нужных страниц (высота, ширина, либо и то и другое вместе)

Автор: D1D1D1D, Отправлено:13:43 08-06-2020

bolega
Спасибо.


Цитата:
В новой версии, которая скоро выйдет, предусмотрено задание альтернативного размера книги для нужных страниц (высота, ширина, либо и то и другое вместе)

Речь о добавлении автомасштабирования (унификации расстояния фотик-книга)? Пока что это приходится решать в СканТейлор Экспериментале.

Автор: bolega, Отправлено:17:24 08-06-2020

Нет, речь о другом.
А как там выполняется автомасштабирование? Какой принцип? На основании чего прога подбирает масштаб

Автор: D1D1D1D, Отправлено:21:35 08-06-2020

После определения границ полезного текста со страницы, их размеры автоматически приводятся к единому.

Автор: bolega, Отправлено:23:37 08-06-2020

А если контент какой-то страницы меньше по ширине реально, а не потому что масштаб меньше. Что тогда будет?

Автор: D1D1D1D, Отправлено:00:41 09-06-2020

Я кстати ST второй раз пользуюсь и каждый раз открываю для себя заново) Вроде бы, в этом случае надо с помощью увеличения/уменьшения полей сверху/снизу, вписать контент в требуемый масштаб.

Автор: bolega, Отправлено:10:52 09-06-2020

Не понял, почему "вроде". Вы же написали выше, что решаете эту задачу в ST, я поэтому и спросил, это автоматизировано, или вручную подгоняете.

Автор: bearjrgm, Отправлено:20:45 09-06-2020

Подскажите, как научить кромсатора видеть спеклы определенного размера?
Допустим, плохой фон и бумага, потом получаются точки.
Я видел в настройках, но не совсем понял, как это работает.
Спасибо

Автор: D1D1D1D, Отправлено:20:54 09-06-2020

bolega
Я к тому, что возможно есть другие способы, но сам я так делал.

Автор: shch_vg, Отправлено:00:15 10-06-2020

bearjrgm

Цитата:
не совсем понял, как это работает

Просто.
В настройках выбираете, в какой диапазон попадает скан, например, 600дпи в диапазоне 550-1000. Тогда вместо 7 ставите, допустим, 9 и обрабатываете или вручную чистите ч/б скан.
Удаляется все, что в диаметре не больше 9 пикселей.
Главное, не потерять нужные точки и запятые.

Автор: bolega, Отправлено:07:02 10-06-2020

bearjrgm
Не совсем понял вопрос. Видеть или удалять. В процессе обработки или в постобработке. Если удалять в процессе обработки, то нужно использовать despeckle-метод Fine. Гарантированно удаляет все что меньше заданного размера. Про размер shch_vg правильно написал, где можно регулировать. Но дефолтные значения трогать не рекомендую. Только если у вас нестандартное dpi, например 800. Особенность fine еще в том, что он контролирует (только при обработке), чтобы не удалять точки в буквах i,j.
Normal более щадящий. i,j не контролирует.
Видеть можно в постобработке, в смысле подсветить спеклы.

Автор: bearjrgm, Отправлено:18:05 10-06-2020

shch_vg
bolega
спасибо, прояснили ситуацию.

Автор: DmitryKz, Отправлено:15:24 13-06-2020

bolega
Не знаю, баг или фича: в 6.5 и 6.51 в VR не активна кнопка Re-binarize панели Binarization

Прошу прощения — за время долгого пользования программой забыл о флажке Allow re-binarization.

Добавлено:
bolega
Можно ли сделать окно Book properties в VR таким же немодальным, как панель, скажем, Binarization?
Часто бывает необходимость страницу выровнять не только по низу/верху/слева/справа, но и точной подгонкой области текста (и/или бинаризацию поправить через соответствующую панель), но при открытом окне Book properties его постоянно приходится закрывать, чтобы потом снова открыть.

Автор: bolega, Отправлено:18:18 13-06-2020

DmitryKz

Цитата:
Можно ли сделать окно Book properties в VR таким же немодальным, как панель, скажем, Binarization? Часто бывает необходимость страницу выровнять не только по низу/верху/слева/справа

Нет, нельзя. Это окно не стоит использовать для массовой настройки выравнивания. Для выравнивания лучше использовать панель Show > show align panel. Вот она не модальная и больше подходит для этой задачи. А окно Book properties все таки использовать именно для корректировки размеров книги/полей.

Автор: Benoni, Отправлено:18:28 13-06-2020

DmitryKz

Цитата:
забыл о флажке Allow re-binarization

А где его искать?

Автор: DmitryKz, Отправлено:18:30 13-06-2020

bolega
Понял, спасибо!

Benoni
Последний пункт меню Process.

Автор: Benoni, Отправлено:18:42 13-06-2020

DmitryKz
Да, есть. Спасибо!

Автор: asku, Отправлено:21:26 13-06-2020

TelecomUral

Цитата:
положил ролик на ютуб.


Добрый вечер. А где можно посмотреть ролик? Ссылку не дадите?

Автор: sergiokapone, Отправлено:16:08 14-06-2020

asku
может здесь

Автор: bearjrgm, Отправлено:12:17 16-06-2020

bolega
подскажите, а можно получить picture зоны фиксированного размера.
В шахматной книге похоже размеры диаграмм гуляют, хочу заменить, при это м все диаграммы (подмененные) разные по размеру.
И как-то можно выровнять эти зоны на странице, например, когда идет три картинки в ряд?

Автор: bolega, Отправлено:13:00 16-06-2020

bearjrgm

Цитата:
при это м все диаграммы (подмененные) разные по размеру.

А что мешает делать их одинаковыми в той программе, где вы их подменяете (DiagrammsPy?)
В конце концов, создаете зону, затем делаете идентичные копии через copy-paste. Это не оно?


Цитата:
И как-то можно выровнять эти зоны на странице, например, когда идет три картинки в ряд?

Да, такая команда у меня в ппанах на реализацию есть.

Автор: bearjrgm, Отправлено:13:25 16-06-2020


Цитата:
А что мешает делать их одинаковыми в той программе, где вы их подменяете (DiagrammsPy?)
В конце концов, создаете зону, затем делаете идентичные копии через copy-paste. Это не оно?


Ок, спасибо за ответ.

И еще вопрос, зоны можно перенумеровать?

Автор: bolega, Отправлено:13:35 16-06-2020


Цитата:
зоны можно перенумеровать?

А смысл?

Автор: bearjrgm, Отправлено:15:48 16-06-2020


Цитата:
А смысл?

я пользовался Mouse-up созданием зон, пару раз промазал, что-то удалил, но эти зоны уже как бы есть и нумерация слетает.

Автор: bolega, Отправлено:16:04 16-06-2020

Это внутренний идентификатор зоны, участвует и в имени зоны. Я не пойму, что из того, что там пропуски? На что это влияет? Сделать ренумерацию можно, я просто не пойму, зачем это.

Добавлено:

Цитата:
но эти зоны уже как бы есть

Бред. Удалили, значит нет их.

Автор: bearjrgm, Отправлено:17:02 16-06-2020


Цитата:
На что это влияет?

на номера выходных файлов, которые становятся не последовательными, а с пропусками.

Автор: bolega, Отправлено:18:08 16-06-2020

Так я и хочу понять, зачем вам нужны именно последовательные номера.

Автор: Benoni, Отправлено:18:36 16-06-2020

bolega

Цитата:
Сделать ренумерацию можно
Как?


Цитата:
зачем вам нужны именно последовательные номера.
На странице 12 шахматных диаграмм. Все диаграммы заключаю в зоны. Обрабатываю, скажем, 100 страниц. Где-то, случайно, диаграмма была без зоны или дважды заключена в зону.
После обработки, в VR, каждая диаграмма (зона) получила свой pic.****. Желательно, чтобы номер этого pic.**** совпадал с номером диаграммы. Хотя бы для правки. Для нахождения диаграммы.
А то разнобой в нумерации затрудняет нахождения нужной, сравнения диаграмм реальных и обработанных.
Вот, наверное, это имел ввиду bearjrgm.

Автор: shch_vg, Отправлено:20:44 16-06-2020

Benoni

Цитата:
Желательно, чтобы номер этого pic.**** совпадал с номером диаграммы. Хотя бы для правки. Для нахождения диаграммы.

Можно, конечно, менять и тифы pic, но зачем, когда это просто делается в СК?
Для этого есть режим отображения Zones.
Другой вариант - сделать слияние всех зон с диаграммами, а потом заменять их в окне VR.
И не надо следить за какой-то нумерацией, создавайте зоны хоть стохастическим способом.

Автор: bolega, Отправлено:20:59 16-06-2020

А если в книге кроме диаграмм будут зоны с фото шахматистов. На разных страницах, вперемешку с диаграммами. Тогда что? Чтобы не сбивать нумерацию диаграмм, забьете на прочие иллюстрации?

Цитата:
А то разнобой в нумерации затрудняет нахождения нужной

Расскажите, как появляется потребность в нахождении нужной.
Т.е. вдруг возникает необходимость найти диаграмму № 256. Вот просто с потолка 256? Я понимаю если вы на определенной странице книги натыкаетесь на диаграмму 256 и хотите ее найти в СК. Но зачем вам ее номер внутри СК, если вы знаете номер страницы? Переходите на страницу и быстро находите pic. Зайдем с другой стороны. Вы видите pic256 и хотите узнать где он в задании. Легко: Zones > Picture zones > Find by id.
Других вариантов зачем нужно искать по номеру я не представляю

Автор: Benoni, Отправлено:21:33 16-06-2020

bolega

Цитата:
А если в книге кроме диаграмм будут зоны с фото шахматистов
Как правило, в книгах по шахматам множество диаграмм. Фото мало. И их можно обработать после диаграмм.

Цитата:
Зайдем с другой стороны. Вы видите pic256 и хотите узнать где он в задании. Легко: Zones > Picture zones > Find by id.
Согласен. Есть такой вариант. Но всегда хочется по номеру диаграммы иметь pic того же номера.
Всё таки:

Цитата:
Сделать ренумерацию можно

Как?

Автор: TelecomUral, Отправлено:06:24 17-06-2020

оффтоп
Benoni
А если диаграммы имеют несквозную нумерацию, н-р 34а и 34б ?
Меня прям разбирает любопытство - зачем "хочется"? (Да и bolega лишняя работа.) А если "захочется" иметь соответствие не номерам, а страницам, на которых они расположены?..

Цитата:
Вы видите pic256 и хотите узнать где он в задании.

Как вариант, report с экспортом списка соответствия.

Автор: bolega, Отправлено:09:03 17-06-2020

TelecomUral

Цитата:
Как вариант, report с экспортом списка соответствия.

Вы прям мысли мои читаете. Я безуспешно пытаюсь выяснить, зачем нужно такое жесткое соответствие. Т.к. разумного ответа не дают, кроме "хочется", прихожу к выводу, что эта потребность никакого отношения к задачам СК не имеет. Какие-то чисто шахматные заморочки. А такие вещи решать можно, но вспомогательными средствами (отчет, генерация скрипта и т.п.).
Если проводить аналогию с БД, номер зоны - это авто инкрементальное поле (используемое в индексах, в ссылках и т.д). Его ренумерация - это безумие, кто знаком с БД, тот поймет. К тому же в случае багов или внешних факторов, прерывающих процедуру, просто угробит задание. Поэтому о такой операции не может быть и речи. Но есть обходные пути, напр., генерация скрипта, который бы копировал файлы зон с заданной ренумерацией, т.е. не трогая задание. Можно добавить в свойства зоны новую опцию - еще один числовой тэг, и его заполнение и использование дать на откуп пользователю.

Автор: TelecomUral, Отправлено:12:37 17-06-2020

bolega, надо что-то сделать с автопостеризацией. Нынеиспользуемый алгоритм - полная фигня. Вот на таких картинках, видимо, черный равен темнозеленому в неких внутренних координатах, и нормально постеризуется при числе цветов под 40. Что для кодера дежавю уже не имеет смысла. А при меньшем числе цветов черные стрелки становятся такими же зелеными, как линии сигналов. Я думал, что играет роль относительная доля площади цвета, но непохоже.



Может, сюда заходят математики, которые знают более приемлемый алгоритм. С учетом пространственной связности, например.

Обходные пути, конечно, есть. Можно и цвета предварительно сгладить через clear magic, и разнести путающийся цвет заменой с ненулевой tolerance. Можно и hue, видимо, сдвинуть. Но всё это значительно более трудоемко из-за вариативности. Важно упростить первое окорачивание палитры.

Автор: AlVaKo, Отправлено:10:24 19-06-2020

Если что, то я не математик.
Вот картинка с преобразованием. Тут яркость пиксела есть функция расстояния цвета у пиксела исходной картинки от некоторого базового цвета. Считается расстояние в трехмерном цветовом пространстве(подобие HSL). Базовый цвет я задал вручную (RGB=56,104,118), у меня он скорее серо-голубой, а не темно-зеленый.




Чем темнее пиксел, тем более он похож на базовый. Попробуйте отбинаризировать эту картинку, поиграйтесь порогом. И станет видно, что часть пикселов "стрелок" очень близка к пикселам "сигналов". Алгоритмам автоматических постеризаторов тяжело будет "правильно" раскидать пикселы на малое число цветов.


Автор: TelecomUral, Отправлено:13:58 19-06-2020

AlVaKo
близка к вертикальным палочкам, вы хотели сказать?
Зато на исходной картинке эти желтые палочки от черных стрелок весьма далеко. Комбинация таких масок авось чего-нибудь бы и дала... для алгоритма.

Автор: ndch, Отправлено:14:53 19-06-2020

Исправьте пожалуйста шапку - половина ссылок не работает.

Автор: AlVaKo, Отправлено:15:55 19-06-2020

TelecomUral
Я про другое пространство, не пространство скана. Про близость цветов у пикселей "осциллограммы" и пикселей "стрелок".

Вот более "жесткое" преобразование. Вертикальные палочки вообще не видны. Т.к. отсечена область цветных тонов даже близко не соприкасающихся с тоном базового цвета, выбранного для выделения пикселов "осциллограммы".



Вот бинаризация с порогом 100. Ошметки от "стрелок", "текста" хорошо видны.




Вот бинаризация с порогом 60. Что-то осталось от "стрелок". А контур "осциллограммы" начал деградировать.



Где-то между двумя последними картинками, можно надеятся увидить результат автоматической постеризации. Вы хотите, "ошметки" чистить ещё каким-то дополнительным алгоритмом?

Автор: TelecomUral, Отправлено:16:27 19-06-2020

AlVaKo
а, понял. Вы берете один цвет. Для примера. Так?


Цитата:
Вы хотите, "ошметки" чистить ещё каким-то дополнительным алгоритмом?

Нет, это было бы и так неплохо получить на автомате, но если получится именно автомат по всем базовым цветам сразу. Дальше ручная чистка. И базовые цвета чтоб не вручную ставить. Ну чего сложного-то...
Пока что ручная постеризация вот таких геморройно отпечатанных картинок - очень трудоемко. Да, выходит, но за десяток-другой минут:

и черные линии все равно особо обрабатывать в отдельных зонах.

Автор: AlVaKo, Отправлено:16:59 19-06-2020

Да, я хотел показать ситуацию, какие существуют проблемы при в общем правильно выбранном "базовом" цвете, для выделения всего лишь одного заранее выбранного цвета.

По поводу автомата. Думаю, надо смотреть в сторону постеризатора на основе кластеризации. Простые алгоритмы сокращения палитры цветов слишком грубые.

Автор: sergiokapone, Отправлено:17:21 19-06-2020

Да, в CК нельзя четко отделить черный. Приходится фотошопить через CMYK.

Автор: TelecomUral, Отправлено:05:24 21-06-2020


Цитата:
Да, в CК нельзя четко отделить черный.

Поразмышлял пару дней, повспоминал свои проблемы с обработкой за последние годы. Наверное, да. Дело даже не в постеризации, а именно в вытягивании с рисунков черного. Если бы это можно было делать, то подавляющее большинство проблем решилось.
Наверное, это из-за принятого на компах и сканерах rgb. (хм. а бывают ли матрицы cmyk...)

Автор: AlVaKo, Отправлено:09:19 21-06-2020

С точки зрения математики, наверное я сильно ошибаюсь. Возможный вариант вытаскивания черного. Сложил "яркость" с удвоеной "цветностью". Выход за диапазон (0-255) отсекаем. Получаем серую картинку, красные вертикальные черточки совсем пропали.



Бинаризируем порогом 140




Автор: bolega, Отправлено:13:49 21-06-2020

AlVaKo

Цитата:
Сложил "яркость" с удвоеной "цветностью".

А каков диапазон у яркости и у цветности? Одинаковый или разный, 0..255 или 0..100?

Автор: AlVaKo, Отправлено:14:14 21-06-2020

У меня "доморощенная" цветовая модель(два конуса с общим основанием), вариация на тему HSV/HSL. В ней "яркость" и "цветность" имеет диапазон 0-255. Берем у пиксела значение RGB, через модель получаем "яркость" и "цветность". Переводим в серое изображение по формуле:

I = lum + kc * chroma.
где kc - коэффициент усиления "цветности".

По замыслу, пытаемся сдвинуть все "цветастые" пикселы в сторону "белого", а близкие к "бесцветным" по возможности оставить на месте. Совершенно "бесцветные" пикселы, у которых R=G=B, вообще не изменят своей яркости.

Автор: slava_kry, Отправлено:18:15 21-06-2020


Цитата:
хм. а бывают ли матрицы cmyk...

Нет. Только CMY можно сделать с тем или иным допущением, но в реальности не видел.

К - он же "Key" - "ключевой цвет", накладывается последним (раньше для регулировки тёмных полутонов). Просто дополнение к CMY для контраста и покрытия ошибок несовмещения при печати. А CMY - это тоже RGB с поправкой на доступные колоранты и разность синтезов цвета.

Автор: TelecomUral, Отправлено:11:32 22-06-2020

Вот ещё картинка, похуже чем сигналы



Серый упорно окрашивается или грязнозеленым или грязносиним. Особенно в тонких местах.
Подымаю насыщеннсть, так на красном серые линии исчезают:



Автор: AlVaKo, Отправлено:13:15 22-06-2020

Уфф... Ну и картиночки у вас доктор...

Отсечение цветов по порогу цветности. Пороги ставились вручную.

Порог цветности 20



Порог цветности 22



Лезет грязно-зеленый цвет, а левый край бумаги ещё не оформился. Т.е. у некоторых, как бы "серых" пикселей цветность выше чем у некоторых "зеленых". Ловля цветности ниже 10% от максимально возможного.

Автор: TelecomUral, Отправлено:13:33 22-06-2020

оффтоп
текст там хороший - "... участки записи имеют черный цвет достаточной плотности. Запись сопровождается выделением пыли и дыма ..."

А глаз достраивает картинку без проблем. Где чёрный, где зелёный, отличает. Связность.

Добавлено:

Цитата:
Т.е. у некоторых, как бы "серых" пикселей цветность выше

это, часом, не из-за фона бумаги? Если его вычесть, будет толк?

Автор: AlVaKo, Отправлено:14:14 22-06-2020

Скорее от того, что они напечатаны поверх другого цвета с более высокой цветностью.
У желтого сильнее цветность. Он и сильнее смещает цветность у серых.

Автор: asku, Отправлено:11:11 01-07-2020

Добрый день.
На одной из страниц книги фотография занимает всю площадь. Когда после обработки всех страниц, создаю в SK дежавю-файл, то эта страница (с фото) бывает шире, чем остальные. Подскажите, пожалуйста, как сделать, чтобы все страницы были одной ширины.

Файлы sub-task:
https://dropmefiles.com/zGctH

Скрин для наглядности:


Автор: TelecomUral, Отправлено:13:28 01-07-2020

asku
Так при кодировании дежавю уж поздно пить боржоми.
До финализации надо было поменять ширину и высоту чб страниц под размер фоток, отследить самые здоровые через режим thumbs. А как после финализации, я не знаю. Только вторым прогоном out-task с надставкой полей.

Автор: asku, Отправлено:13:33 01-07-2020


Цитата:
отследить самые здоровые через режим thumbs


Как понять фразу? Допустим все страницы в книге текстовые и имеют один размер. А вот одна, в самом начале, содержит фото автора книги на всю площадь. Как отследить? Что нужно сделать в режиме thumbs ?

Автор: TelecomUral, Отправлено:14:12 01-07-2020

asku
Сделать сортировку. Контекстное меню там есть, по правой кнопке мышки. найдете самые крупные по вертикали, потом по горизонтали, и подставите размеры в ячейки Book\Page width. Ну а если вы и так знаете габариты фотки, сразу и подставляйте.

Автор: shch_vg, Отправлено:15:26 01-07-2020

asku

Цитата:
как сделать, чтобы все страницы были одной ширины.

Вы непременно хотите сделать это в рамках СК?
Если это всего несколько страниц, проще изменить размеры в Irfanview.

Автор: asku, Отправлено:15:45 01-07-2020

shch_vg

Это не несколько страниц, а книга в 200 с чем-то страниц. Но выбивается своей шириной только одна страница.
Ну и вообще я хотел бы знать на будущее как мне в СК обрабатывать страницы так, чтобы все они были одной ширины.

Автор: shch_vg, Отправлено:16:17 01-07-2020

asku

Цитата:
На одной из страниц книги фотография занимает всю площадь.


Цитата:
как сделать, чтобы все страницы были одной ширины.

Может быть я в чем-то ошибаюсь, но мне представляется несколько возможностей.
1. Сначала обрабатываете только страницу с фото, не используя automargin, а только резаки. Такая обработка даст вам размеры выходной страницы, которые вы подставите на закладке Book. В этом случае у вас будет гарантия полного совпадения страниц. Проблемы возникнут только если нужно будет выравнивать страницу с фото, т.к. вокруг фото появятся белые области из-за поворота страницы.
Другого ТОЧНОГО совпадения размера страниц в рамках СК я не знаю.
2. Наиболее простой способ я указал выше, но он требует привлечения программы типа Irfanview.
Будет интересно, если кто-то сможет предложить равенство только в рамках СК.

P.S. Странно, что вас интересует равенство только по ширине страницы.
Ведь в книге равны и высоты страниц.
Различие по высоте будет заметно в режиме двустраничного просмотра.

Автор: TelecomUral, Отправлено:16:23 01-07-2020


Цитата:
вокруг фото появятся белые области из-за поворота страницы

В VR кропнуть, и всего делов.

Автор: asku, Отправлено:16:24 01-07-2020


Цитата:
только по ширине страницы


При чтении дежавю-файла в программе-просмотрщике в глаза бросается ширина страницы. Длина не так заметна. )

Автор: shch_vg, Отправлено:16:34 01-07-2020

asku
А только теперь посмотрел выложенный вами пример и увидел, что в нем нет фото на всю страницу.
Тогда нет и проблемы с выравниванием, обрабатываете страницу с фото, как и остальные. Единственная разница, что на странице с фото нужно создать две зоны.
Первая зона на всю страницу с заливкой ее серым, а поверх ее обычная зона только на фото с белой рамкой.

Получите примерно вот такое.

Автор: asku, Отправлено:18:03 01-07-2020


Цитата:
Получите примерно вот такое.


Ссылка недоступна.

Автор: shch_vg, Отправлено:18:50 01-07-2020

asku
А сейчас?
Вот дежавю-вариант.

Автор: asku, Отправлено:21:57 02-07-2020


Цитата:
А сейчас?


Сейчас видно. Спасибо.

Автор: bolega, Отправлено:15:07 04-07-2020

asku
В новой версии есть команда изменения (в сторону увеличения) размеров страниц уже после финализации: Result > Resize output files. Если до этого было out-задание, то его надо будет после перегенерировать.

Версия 6.52
https://dfiles.ru/files/3gjcw18qm

Автор: Benoni, Отправлено:22:52 04-07-2020

bolega
Спасибо!
Так это ведь комбайн!

Автор: bearjrgm, Отправлено:13:01 06-07-2020

Добрый день, а есть ли возможность конвертировать out-task в split task?
Сплит таск перезаписал случайно

Автор: bolega, Отправлено:14:59 06-07-2020

bearjrgm
Нет.
А bak или sav-файлов тоже не осталось?

Автор: bearjrgm, Отправлено:11:48 07-07-2020


Цитата:
А bak или sav-файлов тоже не осталось?

к сожалению - нет, я сам не понял как я их грохнул Похоже просто перезаписал out-task под именем сплит-таск.

Автор: DmitryKz, Отправлено:13:18 07-07-2020


Цитата:
к сожалению - нет, я сам не понял как я их грохнул Похоже просто перезаписал out-task под именем сплит-таск.

Если на диске особой активности не было (записи/перезаписи), то есть вероятность достать эти файлы с помощью, скажем, DMDE.

Автор: AKazak, Отправлено:23:40 07-07-2020

Будьте здоровы!

Какие варианты фильтрации могут помочь при заполнении "белых пятен" таких сканов с микрофильмов?



Спасибо.

Автор: qwaxym, Отправлено:14:09 08-07-2020


Цитата:
Будьте здоровы!
 Какие варианты фильтрации могут помочь при заполнении "белых пятен" таких сканов с микрофильмов?

Было бы неплохо, если бы выложили образец скана, 1-2 листа.
А вообще сначала нужно размыть(bloor) текст, а потом повысить резкость(sharpen).ИМХО

Автор: AKazak, Отправлено:16:10 08-07-2020

qwaxym

Цитата:
Было бы неплохо, если бы выложили образец скана, 1-2 листа.

Вот два типичных примера: https://dropmefiles.com/B7pp0


Цитата:
А вообще сначала нужно размыть(bloor) текст, а потом повысить резкость(sharpen).

Попробовал, но результаты пока не впечатляют...

Автор: bolega, Отправлено:18:16 08-07-2020

AKazak
http://depositfiles.com/files/0v8lwded0
Что делать с этим дальше, решать вам

Автор: DmitryKz, Отправлено:18:48 08-07-2020

bolega
Практически всегда, за некоторыми исключениями (имеется в виду время знакомства и работы с SK) у меня резаки на четных (после 180° разворота) и нечетных страницах выставляются так:




Т. е. на четной странице после разворота (не знаю, играет ли роль факт разворота) будто не видит горизонтальной линии и «режет» прямо по ней, в то время как на нечетной странице резак выставляется корректно — поверх линии. И такое поведение на протяжении всей книги после предварительной установки резаков.

Зная мощные возможности SK смею предположить, что существует какая-то опция, исправляющая такое поведение?

Автор: AKazak, Отправлено:01:27 09-07-2020

bolega
Впечатляет!
Как это получилось?

Автор: bolega, Отправлено:10:32 09-07-2020

AKazak

Цитата:
Как это получилось?

С помощью фильтра inverse dithering.
Пришлось делать через зоны, т.к. этот фильтр предусмотрен только там. Создаете pic-зону на страницу, color = gray, включаете inverse dithering. Все остальное по умолчанию. Копировать зону на все страницы, deskew и прочие опции везде отключить.

Автор: TelecomUral, Отправлено:07:18 10-07-2020

использующим новый СК
Тут на publ.lib.ru меня попросили сделать ролик про инструмент Posterization
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/213#213
Ради одного человека мне честно лень, проще ему в личку объяснить. Но может ещё кому надо? Чтоб труд не впустую уходил.

Автор: bearjrgm, Отправлено:07:58 10-07-2020


Цитата:
Ради одного человека мне честно лень, проще ему в личку объяснить. Но может ещё кому надо? Чтоб труд не впустую уходил.


было бы неплохо увидеть

Автор: DmitryKz, Отправлено:08:20 10-07-2020


Цитата:
Но может ещё кому надо? Чтоб труд не впустую уходил.

Я бы тоже был признателен за ролик.

Автор: bolega, Отправлено:08:42 10-07-2020

Я упоминал в whatsnew что начал русификацию СК. Работа долгая и нудная. Поэтому пока хватило только на менюшки главного окна. Надеюсь, со временем русифицирую все. Потом это будет сделано через внешний файл, и можно будет использовать и другие языки. Чтобы переключить меню на русский язык, в sk6.52.ini нужно в секцию [Options] добавить строчку
LangInt=1
Строчку можно добавить сразу после [Options].


Автор: Benoni, Отправлено:16:07 10-07-2020

bolega
Спасибо!

Автор: TelecomUral, Отправлено:06:41 11-07-2020

bearjrgm
DmitryKz
сделал видео. https://youtu.be/FnoqZe-uEhU

Автор: shch_vg, Отправлено:12:01 11-07-2020

TelecomUral

Цитата:
сделал видео

А можно выложить sub-task?

Автор: TelecomUral, Отправлено:13:03 11-07-2020

shch_vg
https://yadi.sk/d/EbbirlQ6pFk8CQ

А зачем вам?

Автор: shch_vg, Отправлено:13:48 11-07-2020

TelecomUral

Цитата:
А зачем вам?

Слишком мелко, а монитор, увы, не 24'.

Автор: TelecomUral, Отправлено:14:00 11-07-2020

оффтоп
shch_vg
да, к хорошему быстро привыкаешь. Я пробовал писать ролик в небольшом окне, увы, кажется очень неудобным. Хотя ведь были времена с 14' мониторами и не так уж давно.

Автор: qwaxym, Отправлено:20:45 11-07-2020


Цитата:
Слишком мелко, а монитор, увы, не 24'.

У меня монитор 22", всё отлично смотрится!

Автор: shch_vg, Отправлено:21:58 11-07-2020

qwaxym

Цитата:
У меня монитор 22"

монитор, увы, не 22'.

Автор: sergiokapone, Отправлено:19:12 12-07-2020

-

Автор: romanef, Отправлено:11:34 15-07-2020

---

Автор: TelecomUral, Отправлено:11:59 15-07-2020

romanef
вот кто за вас пример задания будет выкладывать, Пушкин?

Автор: bolega, Отправлено:14:15 15-07-2020

-

Автор: romanef, Отправлено:11:21 16-07-2020

bolega
Спасибо за совет, помогло.

Автор: bearjrgm, Отправлено:14:38 16-07-2020

TelecomUral
спасибо

Автор: AKazak, Отправлено:11:00 18-07-2020

bolega
IHMO, нужно автору не руссифицировать, а пользователям выучить набор простых англоязычных терминов. Это, кстати, поможет лучше понимать англоязычные форумы.

Автор: shch_vg, Отправлено:19:14 18-07-2020

AKazak

Цитата:
IHMO, нужно автору не руссифицировать, а пользователям выучить набор простых англоязычных терминов.

Вот еще один советчик-доброхот появился.
Прежде чем делать подобные заявления, лучше еще раз ВНИМАТЕЛЬНО прочитать первоисточник.

Добавлено:
bolega
Сейчас часто приходится просматривать и корректировать исходные сканы по Alt+S, получая при возврате в главное окно вопрос:
"The current image has been modifeid. Reload the file?"
Когда это повторяется много раз, то начинает раздражать.
Нельзя ли это сделать как-то опционно?

Автор: mais, Отправлено:20:54 25-07-2020

bolega

Цитата:
Я упоминал в whatsnew что начал русификацию СК. Работа долгая и нудная.

Непростая задача. Помимо трудностей смыслового перевода, есть ещё задача размещения этого перевода в меню и в окнах, английские-то слова в средем короче русских . К примеру: команду "deskew" довольно точно можно перевести как "устранение перекоса". Но в англоязычной версии программы текст этой настройки (чекбокса) в окне закладок команд обработки (по терминологии Хрестоматии по СК) занимает одну строку, а в русскоязычной - будет занимать или две строки, или вдвое большее пространство по горизонтали.
Я встречал программы, в которых при установленных по умолчанию разрешении экрана и размере шрифта тексты всех команд и настроек этих программ читались корректно, но стоило увеличить размер стандартного шрифта Windows, как половина текста в них просто переставала отражаться (из-за увеличенного размера шрифта возникал перенос текста команды или настройки и была видна только верхняя строка).
Хотел бы обратить внимание уважаемого bolega на этот момент, так как я думаю, что я не единственный пользователь СК, увеличивающий в настройках Windows размер отображения системного шрифта.

Автор: bearjrgm, Отправлено:22:50 25-07-2020

Подскажите, на 3 этапе кодирования djvu на некоторых файлах кодер падает

"C:\Users\zzz-~1\AppData\Local\Temp\skdcf1D711032\skdc593C79F9.info" (10 bytes)
Merge color picture zones... Done.
Number of few-color zones: 0
Number of colorized zones: 0
Number of color picture zones: 1
Number of color merged zones = 1
Create background djvu with picture zones... Done.
Extract BG44 from background djvu... Done.
BG44=C:\Users\zzz-~1\AppData\Local\Temp\skdcf1D711032\BG44.cnk --> "C:\Users\zzz-~1\AppData\Local\Temp\skdcf1D711032\BG44.cnk" (377232 bytes)
Assemble page 331... Done.
djvumake: photo djvu image has subsampled BGxx chunk

Create result djvu... Failed.
[1-12520] Internal error: id_to_file(C:\Users\zzz-~1\AppData\Local\Temp\skdcf1D711032\0100.djbz) did not create any file.
[1-12520] Internal error: id_to_file(C:\Users\zzz-~1\AppData\Local\Temp\skdcf1D711032\0100.djbz) did not create any file.
[1-12520] Internal error: id_to_file(C:\Users\zzz-~1\AppData\Local\Temp\skdcf1D711032\0100.djbz) did not create any file.
[1-12520] Internal error: id_to_file(C:\Users\zzz-~1\AppData\Local\Temp\skdcf1D711032\0100.djbz) did not create any file.

Автор: bearjrgm, Отправлено:14:23 26-07-2020

Оказалось, что проблема была в самих файлах зон, после пересохранения в несжатый тиф конвертер заработал

Автор: bearjrgm, Отправлено:10:08 27-07-2020

bolega
Было бы неплохо для зоны иметь возможность выставить безусловную ортогональность относительно страницы, например для кодирования в дежавю шахматных диаграмм, чтобы не ломались штрихи доски.

Автор: AKazak, Отправлено:22:29 27-07-2020

shch_vg

Цитата:
Вот еще один советчик-доброхот появился.
Прежде чем делать подобные заявления, лучше еще раз ВНИМАТЕЛЬНО прочитать первоисточник.


Я прочитал первоисточник, но заявил своё мнение.
bolega сам пишет, что это задача непростая.
Более того, весь современный Image Processing --- англоязычный. Так зачем тратить время?
С другой стороны, SK --- это мощный продвинутый инструмент и предполагает работу пользователя, который разбирается в терминологии. Я это написал не как совет и не для получения замечаний.

Вопрос по теме: как в 6.5.2 отключить русскоязычный перевод во всплывающих подсказках, которые возникают при наведении курсора мыши на элементы управления?

Автор: bolega, Отправлено:09:30 28-07-2020

AKazak

Цитата:
Вопрос по теме: как в 6.5.2 отключить русскоязычный перевод во всплывающих подсказках, которые возникают при наведении курсора мыши на элементы управления?

Никак

Добавлено:
В новой версии я сломал авто-позиционировании глифа при вставке. Причем только если вставка выполняется перетаскиванием мышкой. По двойному щелчку или горячей клавише все нормально. В этом году я больше не планировал новых версий, но из-за серьезности бага придется выпускать новую версию с исправлением. Впрочем, похоже кроме AAW это никого особо не интересует.

Автор: daa2013, Отправлено:17:04 29-07-2020


Цитата:
В новой версии я сломал авто-позиционировании глифа при вставке. ... Впрочем, похоже кроме AAW это никого особо не интересует.


bolega

Вы знаете, я уже смирился, что с глифами я работаю в 6.00.5, с постеризацией - в 6.42, с автолевелами бинаризации - 6.5.1. У меня также недавно был глюк, что пдф не разобрался на картинки в 6.5.2, но разобрался в 6.00.5 (сорри, но так и не заготовил пример).
Что объединение страниц в разворот было в 5.92, а больше этой функции и нету. По слухам, также была непубличная версия, в которой промелькнула автоматизация сборки индексов в джву. Но её буквально пара человек получили. И, как мне кажется, даже не все из них в её работе разобрались.

Но это всё, безусловно, всем нужно.
Будем ждать, когда появится интегральная (интегрированная) версия.

Лично у меня стоит 5 версий кромсаторов. И я, когда мне надо, тот или иной для нужной операции задействую. А по второму или даже по третьему разу те или иные фичи просить, простите, но ИМХО моветон.




Автор: TelecomUral, Отправлено:19:29 29-07-2020


Цитата:
Впрочем, похоже кроме AAW это никого особо не интересует.

да это просто я такой безбашенный, что ролики пишу и выкладываю. Пусть некрасивые, но других-то нет. А так ведь многие с СК работают. Я специально не рекламирую свежие выпуски, чтобы смотреть - каков реальный спрос на мои поделки. У 18го уже 20 просмотров, и это в летнее затишье.
И у меня тоже на рабочем столе несколько версий программы. 5.95 потому что надо выпустить описание как с гиперлинками работать, daa2013 давно просит, приходится сравнивать с работой в 6.43. 6.00.5 потому что последний публичный. 5.96.2 потому что кое-кто из тех, кто в личку пишет о совете, так и не привык к финализации. Надо же точный совет давать, у вас, bolega, программа сильно меняется даже по внешнему виду. Ну и все непубличные, потому что где-то что-то ломается и надо проверять как именно работало и работало ли в предыдущих.
Так что - интересует людей, поверьте на слово. Мне "спасибо" пишут с разных сайтов и совсем незнакомые люди. Немного, конечно, но не один и не двое тех, кто самые различные фичи юзает, а не только резаки ставит. Одних только скачек последнего дистрибутива с моего ЯД более 60. А старая версия по-моему за 300 перевалила.

Автор: bolega, Отправлено:12:04 30-07-2020


Цитата:
из-за серьезности бага придется выпускать новую версию с исправлением. Впрочем, похоже кроме AAW это никого особо не интересует.


daa2013

Цитата:
А по второму или даже по третьему разу те или иные фичи просить, простите, но ИМХО моветон.

Я вроде бы нигде не упоминал про фичи. Я имел ввиду не их, а баги. Если нет жалоб на них, значит, этими функциями либо не пользуются, либо человеку все равно: "не работает, ну и не надо". Только AAW обратил внимание на новые проблемы.


Цитата:
была непубличная версия, в которой промелькнула автоматизация сборки индексов в джву. Но её буквально пара человек получили

Да, получили в виде исключения. Но я сразу же сказал: этого функционала никогда в публичной версии не будет. Не потому что жалко, а потому что сделано на скорую руку, топорно, неполно, малопонятно. Т.е. делал чисто для себя. К тому же основано на древних версиях утилит, которыми сейчас уже наверно почти никто в мире не пользуется: FR7 и DjvuOCR.

Автор: TelecomUral, Отправлено:12:31 30-07-2020


Цитата:
К тому же основано на древних версиях утилит

вот уж проблема для вас Тессеракт ведь прикручен. Измените источник разметки текста, и сделайте полупрозрачное отображение распознанного им слоя букв.

Я как-то говорил, что даже то, что
Цитата:
сделано на скорую руку, топорно, неполно, малопонятно
разительно удобнее имеющегося иного софта. Во-первых, можно указать смещения из-за вставок и утрат. Во-вторых, WYSIWYG-групповая работа над размещением гиперссылок на листе. В-третьих, оперативная проверка правильности перехода (кнопка с цепью). Эти возможности легко кроют все неудобства. Ничего подобного в других программах лично я не знаю. И до сих пор убежден, что в СК эта фича должна быть добавлена, пусть в доработанном виде. Но обязательно. Е-книги просто обязаны выходить с подобными электронными плюшками, как я их называю.
И о малопонятности: то, как работать с каналом черного (вы описали на publ.lib.ru), мягко говоря, весьма нетривиально для новичка. Я-то и сам догадался, но я над идеологией СК три года пыхтел плотно. Картинок перепостеризовал не одну сотню. И догадался сходу, правда не успел попробовать. Так что и малопонятность визарда гиперссылок - в ту же степь. Кто хочет, тот разберется. А вот удобство программы - это вещь сильная. Да, можно в экспрессэдиторе линки вставлять. Но в визарде это делать на два порядка приятнее.

Автор: Torino, Отправлено:12:32 30-07-2020

Я глифы честно говоря не использую, поэтому этот баг не видел.

Автор: bearjrgm, Отправлено:15:01 30-07-2020

Начал пользоваться глифами как раз в последней версии, именно перетягиванием - страшно неудобно оказалось позиционировать, если почините будет здорово

Автор: bolega, Отправлено:17:59 30-07-2020

bearjrgm

Цитата:
если почините будет здорово


Все баги уже починил, там мелкие огрехи в коде были, исправилось элементарно за полчаса. Остался еще нерешенный вопрос с warnings и дурацкий вид Task info.

Автор: TelecomUral, Отправлено:18:11 30-07-2020

Вдогонку по гиперссылкам. Я тут в фоновом режиме давненько этот визард обдумываю. Есть у вас прекрасная зона Transit. Почему бы ее не использовать для ручных гиперссылок. Если ввести подтип или галку "link", то в дополнительном параметре можно сразу указывать страницу, на которую прыгать и процент ее установки (для пдф это возможно). Прямо мышкой показывать на список файлов в основном задании и "L/R" его половина. Тогда плюс тессеракт для оглавления и индексов, вот нам и нормальный визард, без древних утилит и вполне понятный и логичный. На 2021 год
...а в Page\special можно ставить галку "страница без номера", а в task info или в Files указывать пропущенные сканы. Или в Options, там места больше. Это только что в голову пришло.

Автор: bolega, Отправлено:18:46 30-07-2020

TelecomUral

Цитата:
Прямо мышкой показывать на список файлов в основном задании и "L/R" его половина

Вот этого я и боюсь. Пойдет лавина просьб, улучшений и т.д. Сейчас весь механизм ссылок основан на использовании физических номеров страниц. Это универсальный подход, гарантирует независимость ссылок от вставок, утрат и т.д. А вы предлагаете привязывать к порядковым номерам задания, который может изменится в любое время и тем самым разрушить все ссылки. На это я никогда не пойду.

Автор: TelecomUral, Отправлено:19:23 30-07-2020


Цитата:
который может изменится в любое время и тем самым разрушить все ссылки.

?.. А разве у вас не отработан аналогичный механизм на перемещение/вставку/удаление в списке файлов... Есть же какая-то внутренняя списочная структура, нельзя без неё.

Мне даже в голову не приходило юзать простой текст ссылки. Там действительно возникнет куча глюков при модификации списка файлов, так нельзя делать.


Цитата:
Сейчас весь механизм ссылок основан на использовании физических номеров страниц. Это универсальный подход

ну, не такой уж универсальный. Спецнумерация предисловия (сканю 5е ПСС Ленина, в каждом томе от 12 до 52 страниц римскими цифрами, плюс вклейки), и не- или криво-нумерованные многостраничные материалы. Это так, заметки на полях. Бывает нумерация вида номер_главы_точка_номер_страницы_внутри_главы. Нечасто, конечно, но физический номер - необязательно жесткий упорядоченный "от единицы до заднего форзаца".

upd
философски если рассудить, то физический номер использовать не следует, потому что гиперссылки не физическая сущность. Другое понятийное подпространство.

Автор: asku, Отправлено:22:21 09-09-2020

Добрый вечер.
Оцифровываю книгу 1950-го года.



На выходе получается вот такой результат. Вроде бы ничего, но во многих буквах пропадают тонкие линии-«перемычки». Не понимаю, в чем дело. Вроде и похуже сканы обрабатывал, а результат был, как минимум, не хуже.

Подскажите пожалуйста, как улучшить.

Если если увеличивать бинаризацию, то буквы будут слишком жирные. Да и не очень помогает это с «перемычками».
Прикрепляю файл test:

Ссылка

Автор: TelecomUral, Отправлено:05:41 10-09-2020

asku
Давно выяснено, что на таких тонких перемычках 300дпи мало. Они пропадают.
Поднял дпи скана до 600 с помощью photozoom. В СК воспользовался гаммой=5 и аншарпмаск r=3. Illumination тоже включил.
Дальше по вкусу ужирните. Я смартблур включил, но он вроде никак не повлиял на внешний вид.

Перемычки все на месте, насколько вижу:





Например в строке "древность" последняя буква "н" в оригинале без перемычки.

Автор: Benoni, Отправлено:07:56 10-09-2020

TelecomUral


Цитата:
В СК воспользовался гаммой=5 и аншарпмаск r=3. Illumination тоже включил.
Дальше по вкусу ужирните. Я смартблур включил


А их названия в оригинале? И где их искать?

Автор: TelecomUral, Отправлено:08:33 10-09-2020

Benoni


Автор: asku, Отправлено:09:05 10-09-2020


TelecomUral

Вы не могли бы дать test-файл? У меня почему-то не получается такой результат на выходе.

Автор: TelecomUral, Отправлено:09:31 10-09-2020

asku
https://yadi.sk/d/hsTfmaINK4dQ0g

Автор: asku, Отправлено:10:58 10-09-2020

TelecomUral
Какой хороший результат у вас на выходе, по сравнению с моим ((

Автор: Benoni, Отправлено:11:55 10-09-2020

TelecomUral
Спасибо.

Автор: TelecomUral, Отправлено:12:27 10-09-2020

asku
включать опции надо по минимуму. А у вас включено было все что только можно, даже C.Smooth, который хорош только на крупных буквах титульного листа. Как концы искать, что крутить, они ж все друг на друга могут влиять. Я отключил все, даже деспекл, и поштучно попробовал, какие опции quality работают (в ролике 18 на 57мин я показывал как можно смотреть результат на выделенном кусочке листа, не обрабатывая всю страницу). Увидел, что никакие опции не спасают, кардинально все плохо, и понял что придется в 600дпи скан делать. Даже известные мне комбинации типа гамма+аншарп или сильный шарпен, всё равно перемычки пропадают. И деспекл сильно вредит при этом.
Была бы книга, я просто бы пересканил в 600.

Автор: asku, Отправлено:12:40 10-09-2020

TelecomUral
Спасибо. Буду экспериментировать.
Книга на руках, но я потратил на сканирование несколько часов. А на сканирование с разрешением 600 уйдет времени раза в два больше.

Автор: bolega, Отправлено:13:47 10-09-2020

TelecomUral

Цитата:
даже C.Smooth, который хорош только на крупных буквах титульного листа

gentle-опцию можно юзать везде


Цитата:
я просто бы пересканил в 600.

Прогнал задание с исходным 300dpi файлом, на выходе 600, resample=bicubic, despeckle=fine. По перемычкам ничем не отличается от вашего варианта (после photozoom), небольшое отличие в гладкости букв.

Автор: TelecomUral, Отправлено:13:50 10-09-2020

bolega
и выравнивание освещенности было?

Автор: bolega, Отправлено:13:55 10-09-2020


Цитата:
и выравнивание освещенности было?

все опции взял из вашего задания не меняя. Выравнивание освещенности я всегда использую safe, а не normal.

Добавлено:
По просьбам наконец-то добавил в СК функцию слияния страниц. shch_vg если фича вам все еще нужна и есть на чем испробовать, вышлю вам новую версию для тестирования

Автор: Benoni, Отправлено:16:09 10-09-2020

Сегодня из PDF сделал djvu вот такой книги:
«Словарь української мови» Бориса Грінченка, 2971 страница.
В тиффах СканКромсатор расставлял резаки примерно 1.5 часа, обработка шла примерно 1 час, а
финализациия - 20 мин. Потом djvu в СканКромсаторе делалось 6 мин. Всё получилось! Книга примерно в 3000 страниц!
Болега, спасибо за чудесную программу.


Цитата:
shch_vg если фича вам все еще нужна и есть на чем испробовать, вышлю вам новую версию для тестирования

И я прошу!

Автор: romanef, Отправлено:00:01 11-09-2020


Как кромсать рамкой фиксированного размера?

Ув. bolega ответил:

Цитата:
Это можно сделать, но только в новой версии.  
Желательно предварительно все страницы deskew-ть.  
Вместо рамки используется временная picture-зона.  
Делается это так: выбирается произвольный файл в списке. Все четыре резака ставятся почти вплотную друг к другу в районе центра. Затем положение резаков копируется на все страницы (диалог copy cutters state/position to...). Затем создается pic-зона размера, равного размеру необходимой рамки, тоже с центром в районе центра страницы. Зона размножается на все файлы (copy zone to clipboard + Zones > Paste zones to pages...). Затем проход по всем файлам и выставление зоны (по сути рамки) в нужную позицию. Затем нажатие новой кнопки Adjust cutters - в результате резаки выставляются строго по сторонам зоны-рамки. Когда все расставлено - удаление скопом всех зон на всех страницах (Zones > Picture zones > Delete...).  
Т.е. главная фишка - в новой команде Adjust cutters: если резак стоит внутри зон, то он сдвигается на е край, если стоит извне их - ничего не делается.  
Во время прохода желательно отключить фильтр отображения, чтобы быстрее двигать зону (Image > Special > No zoom filter)


Спасибо. Команда Adjust cutters работает только для текущей страницы. А как применить ко всем сразу?

Автор: shch_vg, Отправлено:00:37 11-09-2020

bolega

Цитата:
добавил в СК функцию слияния страниц

Периодически использую sk594 для слияния, так что проверить есть на чем.

P.S. Удобнее всего проверять это на сканах разворотов!

Автор: bolega, Отправлено:08:04 11-09-2020

romanef

Цитата:
А как применить ко всем сразу?

А не проще в этом случае просто скопировать положения резаков на все страницы?

Автор: romanef, Отправлено:16:06 11-09-2020


Цитата:
А не проще в этом случае просто скопировать положения резаков на все страницы?


Нет, они же должны стать по границам рамки (кромсания), а рамка (кромсания) выставлена мной для каждой страницы "персонально". В этом и смысл - уникальность обрезки для каждой страницы.

Кстати, есть идея! В настройке положения резаков есть режим sync (два резака напротив "связаны") А если сделать режим "quadro-cutter" когда все четыре резака жестко связаны в рамку-прямоугольник фиксированного размера?
Тогда и временная пикча-зона не понадобится.
Пробежался по страницам, подвигал квадро-каттер, и запустил кромсание.

Такой режим очень полезен при обработке современных книг, где вообще нет белых полей или на полях есть информация.






Автор: bolega, Отправлено:18:17 11-09-2020

romanef

Цитата:
Кстати, есть идея!

Да уж. Пришли к тому, с чего все и началось. Напомню еще раз: СК не поддерживает задание границ рамкой (псевдо-рамкой, квадро-рамкой, окто-рамкой, псевдо-квадро-рамкой и проч. и проч.), только резаками. Точка. Да, можно двигать синхронно, но только в одном направлении.

Автор: TelecomUral, Отправлено:19:10 11-09-2020

bolega
ну а Adjust cutters ко всей книге можно ввести?

(хотя по мне так все эти групповые операции по типу ST - одна большая дурь. на книгу смотреть надо, глазами, и проблем не будет. все упрощения и автоматизации - путь к изготовлению фуфла. потенциальный баг.)

Автор: bolega, Отправлено:19:20 11-09-2020

TelecomUral

Цитата:
ну а Adjust cutters ко всей книге можно ввести?

Да.
Только непонятно, romanef выставлял зону на каждой странице, почему сразу же нельзя было применять эту команду. Тем более для нее есть хоткей.

Автор: shch_vg, Отправлено:19:30 11-09-2020

bolega

Цитата:
СК не поддерживает задание границ рамкой (псевдо-рамкой, квадро-рамкой, окто-рамкой, псевдо-квадро-рамкой и проч. и проч.), только резаками.

Но четыре резака как раз образуют рамку/прямоугольник.
То, что текущий вариант СК не поддерживает, это понятно.
Я вроде бы раньше задавал вопрос о принципиальной возможности реализации сдвига прямоугольника, образованного четырьмя резаками, в любом направлении, а не только вертикально/горизонтально соответствующую пару резаков.
Например, при установки курсора на пересечении двух резаков появляется курсор, допустим, типа окружности. При нажатии ПКМ и ее удержании сдвигаем курсор в произвольное положение, что вызывает соответствующее перемещение этих резаков. А при одновременном удержании клавиши Сtrl к этому процессу подключаются и два оставшихся резака.
В принципе это возможно реализовать?

P.S. Можете прислать для тестирования вариант с объединением страниц в разворот?

Автор: bolega, Отправлено:20:03 11-09-2020

shch_vg

Цитата:
В принципе это возможно реализовать?

К сожалению, нет.

На выходных выпущу релиз, разошлю.

Автор: TelecomUral, Отправлено:20:04 11-09-2020


Цитата:
Но четыре резака как раз образуют рамку/прямоугольник.
То, что текущий вариант СК не поддерживает, это понятно.

Попробую предположить, что резак как программный объект имеет однозначную связь с событием "передвижение мышки". Линейную (в смысле что объект может двигаться только линейно по оси X или Y). И одновременно захватить два перпендикулярных объекта-резака невозможно. Так запроектировано. Я конечно не спец, но наверное передается одно число: положение резака на оси. Если примитивно.

Автор: romanef, Отправлено:20:20 11-09-2020


Цитата:
К сожалению, нет.



В принципе, наверно и не надо.
Я использую в качестве "рамки-резака" временную пикча-зону, размноженную на все страницы.
Резаки вообще отключаю.
Расставляю на каждой странице в нужную позицию рамку-резак, и запускаю кромсание.

Потом забираю все файлы picxxxx.tif (они все одинакового пиксельного размера) в новое задание и там уже обрабатываю фильтрами.


Автор: bolega, Отправлено:20:28 11-09-2020

romanef

Цитата:
Команда Adjust cutters работает только для текущей страницы. А как применить ко всем сразу?

Т.е. команда для всех не нужна?

Автор: romanef, Отправлено:21:55 11-09-2020


Цитата:
Т.е. команда для всех не нужна?


нужна, для всех страниц (Adjust cutters for all pages)

Автор: asku, Отправлено:11:07 13-09-2020


Цитата:
(в ролике 18 на 57мин я показывал как можно смотреть результат на выделенном кусочке листа, не обрабатывая всю страницу)

TelecomUral
У вас там на видео справа от появившихся опций для зоны аншарп есть еще превью-окно. А у меня оно почему-то не появляется.

Автор: bolega, Отправлено:11:19 13-09-2020

asku

Цитата:
А у меня оно почему-то не появляется.

Все правильно. То, что появлялось preview при активации unsharp-зоны - это был баг, который я исправил.
Preview фильтров может работать только с выделением на скане. А выделение может быть только одно: либо зона, либо область на скане. Одновременно невозможно (редактор просто не поймет с чем ему работать). Поэтому если выделяется зона, выделение на изображении исчезает и фильтру не с чем работать (т.е. preview невозможно).
Обойти это наверно как-то можно, если получится, я когда-нибудь сделаю. А сейчас preview unsharp нужно делать без зоны.

Автор: asku, Отправлено:11:23 13-09-2020

TelecomUral
И тест-файл ваш я запускаю и результат почему-то хуже вашего -- больше шума (точек по всей странице), чем у вас. Странно.

Автор: TelecomUral, Отправлено:11:33 13-09-2020

asku
крестик гигантский внутри нажмите.



сначала сам сделал, потом вспомнил. доку кто изучать будет:



upd
А, вон bolega уже ответил. Этого я не знал, про баг.

Насчёт шума: ручную метёлку никто не отменял, растянули прямоугольник сразу на целый лист и пошли дальше. Вы что, хотите вообще всё на автомате? Так в жизни не бывает И сканер медленный, и сканы в 300, и перемычки тонкие, и печать хуже уж некуда, и бумага серая, и книга почерканная, и ещё чтоб вовсе не работать

Автор: asku, Отправлено:11:38 13-09-2020


Цитата:
А сейчас preview unsharp нужно делать без зоны.


А где вообще preview unsharp ? Я выделил зону unsharp. Появились опции unsharpmask. Ок. Выставляю разные значения в опциях. Жму кнопку Apply to image и опции применяются ко всей странице (развороту).
А где preview unsharp я не пойму.

Добавлено:

Цитата:
крестик гигантский внутри нажмите.


Гигантский крестик я нажал и превью-окно появилось (крестик я и раньше видел, только думал -- нажму и окно фильтров исчезнет). Вот только в нем ничего не появляется.

Добавлено:

Цитата:
И сканер медленный, и сканы в 300, и перемычки тонкие, и печать хуже уж некуда, и бумага серая, и книга почерканная, и ещё чтоб вовсе не работать


Согласен. Ручками надо тоже работать ))


Цитата:
ручную метёлку никто не отменял, растянули прямоугольник сразу на целый лист и пошли дальше.


Здесь под метелкой вы имеете в виду Режим mouse-up-despeckle mode ?

Автор: bolega, Отправлено:11:47 13-09-2020


Цитата:
А где вообще preview unsharp ?

Слева. Справа - опции зоны, слева глобальные для страницы. Делаете обычное выделение и опциями слева подбираете и смотрите preview. Потом отключаете глобальный unsharp и подобранные опции используете для зоны. К сожалению, пока только так.
Кстати, команда КМ зоны draw selection around нарисует выделение по контуру зоны. С ним уже можно делать preview, но опциями слева

Добавлено:
Насколько я помню, у AAW в примере был включен normal despeckle, он очень щадящий. Включите fine на закладке options

Автор: TelecomUral, Отправлено:11:55 13-09-2020


Цитата:
Вот только в нем ничего не появляется.

появится при выделении на странице. Пунктиром.
Я сделал ролик, да звук почему-то поехал относительно видео
А переделывать сильно лень.
https://yadi.sk/i/OrNmbULdQArnMA

оффтоп
винда XP упорно после всех обновлений браузеров "ломается" и глючит, вот примерно как в ролике. Вот с чего бы?! А глючит. Придётся переезжать на десятку. Или послать нахер мелкомягких и на *nix уйти. (upd. пришлось переключить аудиоустройства с usb-гарнитуры на встроенный реалтек и обратно. задержка ушла.)

Автор: bolega, Отправлено:11:56 13-09-2020

Еще вспомнил, почему я не стал делать preview для unsharp-зоны. Preview обычно делается для малого участка, а зоны обычно крупные, что-либо разглядеть в окошке preview будет очень сложно.

Автор: asku, Отправлено:12:07 13-09-2020

TelecomUral

Посмотрел видео. Спасибо. Сейчас в превью картинка появляется, но как только я отпускаю кнопку мышки (делая зону аншарп), то картинка исчезает.

Добавлено:
А вот например, на Вкладках Контраст и Иллюминацион превью нормально работает. СТранно.

Автор: TelecomUral, Отправлено:12:14 13-09-2020


Цитата:
как только я отпускаю кнопку мышки (делая зону аншарп), то картинка исчезает

Вроде ведь именно так и должно работать.
Порядок, насколько я понял комментарий разработчика, таков:
- выделили прямоугольник на скане
- включили quality preview
- настроили по вкусу опции аншарпмаск в левой половине окна свойств ("для всей страницы")
- создали аншарп зону из выделения
- повторили в правой половине свойств ("для зоны") левые свойства ("для страницы"). циферки.

Автор: asku, Отправлено:12:28 13-09-2020

TelecomUral

Все понял, получилось. Спасибо.

Автор: asku, Отправлено:20:58 13-09-2020

Добрый вечер. Вопрос, на который, наверное, уже отвечали не раз. Тем не менее...
Допустим, я экспериментирую с одной из страниц проекта (а в книге страниц много), в превью-окне и т.п. И вот я нашел оптимальные значения опций. Как мне ВСЕ опции Image enhance filters (только их) для страницы, на которой я экспериментировал применить ко всем остальным страницам.

Спасибо.

Автор: TelecomUral, Отправлено:07:40 14-09-2020

asku
набирайте в карман, потом примените пачку опций.


Автор: esys, Отправлено:11:33 14-09-2020

Где можно посмотреть сравнение возможностей ScanKromsator и Scantailor?

Автор: TelecomUral, Отправлено:11:46 14-09-2020

esys
в разделе 1.1 в Хрестоматии. В самом низу раздела.

Автор: bolega, Отправлено:12:08 14-09-2020


Цитата:
Как мне ВСЕ опции Image enhance filters (только их) для страницы, на которой я экспериментировал применить ко всем остальным страницам.

Если все опции Enhance, то самый быстрый способ: на файле, чьи опции нужно размножить на остальные файлы, на закладке Quality снимитие галку с Enhance image. Затем нажав Ctrl, снова взведите эту же галку.
Карман можно использовать, когда нужно копировать опции из разных закладок, либо часть опций

Автор: TelecomUral, Отправлено:12:15 14-09-2020


Цитата:
Затем нажав Ctrl, снова взведите эту же галку.

А это снова работает?? Вроде же вы года три назад писали, что такой режим приказал долго жить.

Автор: bolega, Отправлено:12:23 14-09-2020


Цитата:
Вроде же вы года три назад писали, что такой режим приказал долго жить.

Никогда такого не писал. Всегда работало, работает и будет работать. Вместо Ctrl можно жать Alt - больше возможностей.
Вы с чем-то спутали

Автор: TelecomUral, Отправлено:12:28 14-09-2020

Вероятно.
Может, я не учитывал тогда обязательность зеленых галок для копирования свойств на конкретный скан в списке.

Автор: esys, Отправлено:16:53 14-09-2020


Цитата:
в Хрестоматии

- это где? Дайте ссылку, пожалуйста.

Автор: TelecomUral, Отправлено:17:38 14-09-2020

esys
в шапке.

Автор: asku, Отправлено:21:47 14-09-2020

Добрый вечер.
Прошу помочь разобраться с функцией Background cleaner.
В книге очень много читательских «подчеркиваний» карандашом (см. скан). Как я понял, их можно более-менее убрать с помощью Background cleaner. Но как ее применять?..
Я выделяю зону (кстати, в превью-окне она не отображается), выставляю нужные опции и... что дальше? Зона же не вечная. Если я сейчас включу обработку разворота СКромсатором, то это «подчеркивание» функцией Background cleaner исчезнет на всем развороте, в том числе исчезнет горизонтальная линия колонтитула (см. вторую картинку)!





Автор: D1D1D1D, Отправлено:22:29 14-09-2020

Привет. Можно ли автоматизировать удаление разом во всей книге всех мелких точек на белом (подпадающих под определение спеклов), и закрасить чёрным — все белые точки на чёрном (в буквах и тп)?

Автор: D1D1D1D, Отправлено:00:30 15-09-2020

Есть ли настройка, позволяющая немного спустить вниз содержимое страницы на чётных страницах (что тем самым выравняет его с линией набора на нечётных)?

Автор: esys, Отправлено:11:49 15-09-2020

Хрестоматия - отличное руководство. Странно, что сама программа не переведена на русский.

Автор: asku, Отправлено:11:49 16-09-2020

Bolega, прошу помочь.

Автор: D1D1D1D, Отправлено:12:06 16-09-2020

asku
В вашем случае наверно проще было бы сразу вручную зачищать такие помарки - всё равно же автоматически они зачищаются не до конца.

Автор: bolega, Отправлено:16:19 16-09-2020

D1D1D1D

Цитата:
Можно ли автоматизировать удаление разом во всей книге всех мелких точек на белом (подпадающих под определение спеклов), и закрасить чёрным — все белые точки на чёрном (в буквах и тп)?

Можно: создайте задание, отключите все кроме Despeckle и Fill white holes. Размеры и того, и другого регулируются.


Цитата:
Есть ли настройка, позволяющая немного спустить вниз содержимое страницы на чётных страницах (что тем самым выравняет его с линией набора на нечётных)?

В новой версии есть. Выравнивает любой край по заданным границам.
Версия с этой фичей еще недоступна.

asku

Цитата:
Но как ее применять?..

Пока только интерактивно...
В новой версии планируется новый тип pic-зон (задумка давняя, все руки не доходили). Это зоны фильтрации. Применяют свои фильтры к локальным областям изображения, но не создают отдельных выходных файлов. Работают по типу зон unsharp/contrast/c.smooth, но универсальные. Там же будет добавлен и клинер.





Автор: D1D1D1D, Отправлено:18:02 16-09-2020

bolega

Цитата:
В новой версии есть. Выравнивает любой край по заданным границам.
Версия с этой фичей еще недоступна.

А пока что можно попробовать? Ведь наверняка с СК с другой стороны можно зайти?


Цитата:
отключите все кроме Despeckle и Fill white holes. Размеры и того, и другого регулируются.

Если я уже отрегулировал их размеры в окне "Result View" — они будут задействованы после включения галок?

Автор: bolega, Отправлено:18:43 16-09-2020

D1D1D1D

Цитата:
Если я уже отрегулировал их размеры в окне "Result View" — они будут задействованы после включения галок?

Я вас не пойму, вы же спрашивали про "разом во всей книге", а теперь про "Result View". Или одно, или другое.


Цитата:
А пока что можно попробовать?

Вручную. На нечётной выделите прямоугольник со стороной проходящей через линию набора, нижней или верхней, как удобнее. Затем команду Special > set aux rectangle. Этот rect будет в неизменной позиции на всех страницах, поэтому его можно использовать как эталон позиции. На четных смещайте страницу вниз/вверх с помощью Alt-стрелки, подгоняя нужный край под линию aux-rect. Шаг сдвига регулируется параметром на панельке.

Автор: D1D1D1D, Отправлено:19:00 16-09-2020

bolega

Цитата:
Я вас не пойму, вы же спрашивали про "разом во всей книге", а теперь про "Result View". Или одно, или другое.

Имелось в виду, что до этого вручную пробовал использовать закраску white holes в "Result View", и выставил там определенные настройки для их определения, которые не работают в окне "special", потому что некоторые буквы остаются с особо крупными пустотами, которые однако получалось закрашивать в окне "Result View". Сейчас выбрано «Std [+4]» для «Fill white holes». Так понимаю, это максимум, который может быть закрашен из окна "special"?

Автор: bolega, Отправлено:19:25 16-09-2020


Цитата:
Так понимаю, это максимум, который может быть закрашен из окна "special"?

Можно задать абсолютную величину базы, т.е. [Std]: Options > Despeckle > ...
Не боитесь, что при таких параметрах начнут затягиваться сами буквы?

Автор: D1D1D1D, Отправлено:19:32 16-09-2020

bolega

Цитата:
при таких параметрах начнут затягиваться сами буквы?

В "Result View" норм отрабатывало.

Автор: asku, Отправлено:20:46 16-09-2020


Цитата:
Пока только интерактивно...
В новой версии планируется новый тип pic-зон (задумка давняя, все руки не доходили). Это зоны фильтрации. Применяют свои фильтры к локальным областям изображения, но не создают отдельных выходных файлов. Работают по типу зон unsharp/contrast/c.smooth, но универсальные. Там же будет добавлен и клинер.

bolega

А что значит интерактивно? А когда планируется новая версия, в которой будут такие изменения?

У меня в обрабатываемой книге почти на всех страницах такие подчеркивания карандашом. Примерно вот так:



Я экспериментировал с Background Cleaner; оказалось, что он очень хорошо убирает эти подчеркивания.


Я подумал, хорошо бы выделять спецзонами все такие подчеркивания, чтобы СК их убирал во время обработки всех сканов.
Как я понимаю, сейчас можно все сканы сразу обрабатывать Cleaner’ом. Тоже наверное какое-никакой выход, просто когда обрабатываются зоны, то не так опасно, что в некоторых местах всего разворота эта функция что-то не так сделает и повредит какие-то буквы.

Автор: D1D1D1D, Отправлено:21:45 16-09-2020

bolega

Цитата:
Можно задать абсолютную величину базы, т.е. [Std]: Options > Despeckle > ...

По какой причине размер файлов после обработки спеклов, меняется с пятисот килобайт до пяти мегабайт? Тогда как после редактирования в окне Результатов, он не менялся?

Автор: bolega, Отправлено:11:15 17-09-2020


Цитата:
По какой причине размер файлов после обработки спеклов, меняется с пятисот килобайт до пяти мегабайт?

Попробую угадать: выходной формат стал серым или цветным.

Добавлено:
В последней версии whatsnew закралась ошибка: абзац
"- MW: В File > Options добавлена новая закладка Sounds, на которой можно задать звуки, которые СК будет воспроизводить в процессе выполнения некоторых операций."
должен быть на самом деле:
"- MW: В File > Options добавлена новая закладка Sounds, на которой можно задать звуки, которые СК будет воспроизводить по окончании выполнения некоторых операций."

Автор: D1D1D1D, Отправлено:12:54 17-09-2020

bolega
Оказалось, что надо было выбрать "TIFF G4FAX Compress", остальное было "Original".

Автор: bolega, Отправлено:18:37 18-09-2020

Заказчик фичи объединения страниц обратно в развороты мою последнюю реализацию забраковал. В связи с этим функционал merge из публичной версии убираю. Как говорится, на нет и суда нет.

Автор: DmitryKz, Отправлено:18:53 18-09-2020

bolega
Взгляд режет текст — "Save original scans after rotate". По-английски так не говорится. По смыслу того, что делает опция должно быть — "Overwrite original images after rotation". Вряд ли в этом контексте можно употреблять scans — по виду это глагол (как и rotate) в третьем лице, а если существительное — то рентгеновский снимок. Похоже на попытку выразить по-английски русское слэнговое скан.

Автор: Vixerunt, Отправлено:19:02 18-09-2020


Цитата:
Взгляд режет текст — "Save original scans after rotate". По-английски так не говорится. По смыслу того, что делает опция должно быть — "Overwrite original images after rotation". Вряд ли в этом контексте можно употреблять scans — по виду это глагол (как и rotate) в третьем лице, а если существительное — то рентгеновский снимок. Похоже на попытку выразить по-английски русское слэнговое скан.

Да! Если изучать английский по учебнику Бонка! В реальности же, слово scan в компьютерной терминологии означает то же, что и в русском языке - скан (жаргонизм). Что касается остального, то согласен - to overwrite по смыслу подходит больше.

Автор: bolega, Отправлено:19:16 18-09-2020

DmitryKz
Спасибо за уточнение. Если что еще подобное встретите, сообщайте. Я свободно читаю на английском, а вот в обратную сторону из-за отсутствия опыта общения испытываю большие затруднения.

Автор: daa2013, Отправлено:19:26 18-09-2020


Цитата:
Заказчик фичи объединения страниц обратно в развороты мою последнюю реализацию забраковал. В связи с этим функционал merge из публичной версии убираю. Как говорится, на нет и суда нет.


Я ее тоже просил, но пока не смотрел.
Как оно работало в старой версии, меня устраивало.



Автор: DmitryKz, Отправлено:19:29 18-09-2020

bolega
Сейчас вот еще такую штуку обнаружил — но, может, это фича...
В окне Image enhance filters если установить флажок Correct illumination, удерживая Ctrl, опция применяется ко всем отмеченным файлам — с этим все в порядке. Затем нужно выбрать метод — и тут уже Ctrl не работает. Приходится сначала, при установленном вышепомянутом флажке, выбрать режим, а затем переустановить флажок — т. е. снять и установить еще раз, при нажатом Ctrl, чтобы применить режим ко всем страницам.
Но, опять же — не знаю, может, так и задумывалось.

Автор: bolega, Отправлено:19:33 18-09-2020

DmitryKz
Да, так и работает с фильтрами, у которых много параметров. Нельзя размножить какую-то одну их под-опцию, только все под-опции сразу. В КМ таких фильтров есть команда копирования всех под-опций Copy options to ...

Добавлено:
daa2013

Цитата:
Как оно работало в старой версии, меня устраивало.

В старой работало с исходными сканами. В новой рассчитано по сути на out-задание. Но капризному заказчику это не подошло. Хотя разницы никакой. И кстати я уже давно пояснял: сложные манипуляции с обработанными сканами будут производиться только через out-задание.

Автор: TelecomUral, Отправлено:06:32 19-09-2020

Никогда не юзал функционал merge pages. Сейчас попробовал - все превосходно и логично работает. На что там можно ругаться??..

Автор: asku, Отправлено:23:51 20-09-2020

Добрый вечер. Некоторое время назад я уже задавал этот вопрос, но ответа не получил. Прошу помощи.
Как можно в ScanKromsator уменьшить вот такие «складки» на страницах. На прикрепленном скане «складка» в верхней правой области.

Таких складок в книге довольно много. Я хотел бы после сканирования сделать еще текстовый вариант книги, а с ними FineReader плохо распознает — ошибок будет много



Автор: TelecomUral, Отправлено:03:29 21-09-2020

asku
повреждено пять-шесть букв. Глифами их замените, если уж распознавания хочется.

Теоретически, вне СК, это можно опознавать как "царапину на фото". Наверное.

Автор: bolega, Отправлено:20:11 24-09-2020

В общем, я сделал новый тип pic-зоны с типом фильтр. В том числе она умеет удалять подчеркивания. Вот тест https://yadi.sk/d/xD-8oH2b-pyuiw
Там исходный файл, просто бинаризованный и бинаризованный с зонами. Вроде бы фича работает.


Добавлено:
Кто пользовался correct illum, method=safe, мог заметить, что метод портил текст и иллюстрации, если они касались края изображения (краевой эффект). Добавил под-опцию, которая защищает от такого артефакта.

Автор: Benoni, Отправлено:21:50 24-09-2020

bolega
Очень интересно! Спасибо! Ждём релиза.

Автор: asku, Отправлено:22:46 25-09-2020

Добрый вечер.
bolega, было бы здорово, если бы появился такой фильтр.
А пока буду такие подчеркивания удалять, как вы советовали (прочитал в вопросах-ответах в ScanKromsator_Answers) — выделяю зоной область подчеркивания, обрабатываю ее и сохраняю файл.

Но возникли вопросы.




1) Хочу внести назначить горячую клавишу для кнопки Apply to selection (показана нижней стрелкой), но не знаю как это сделать.

2) Можно ли сделать одновременно несколько рамок такого (см. верхнюю стрелку) типа? Чтобы разом их обрабатывать, потому что на развороте, как правило, таких подчеркиваний несколько и они в разных местах.

Спасибо.

Автор: bolega, Отправлено:08:12 26-09-2020

asku

Цитата:
1) Хочу внести назначить горячую клавишу для кнопки Apply to selection (показана нижней стрелкой), но не знаю как это сделать.

В вашем случае нужна не эта команда, а Preview enhance filter


Цитата:
Можно ли сделать одновременно несколько рамок такого (см. верхнюю стрелку) типа? Чтобы разом их обрабатывать

Можно, никто не запрещает

Автор: asku, Отправлено:10:57 26-09-2020

bolega «
Можно, никто не запрещает».

А как это делать? Ведь если сделать вторую такую рамку, то первая исчезнет.

Автор: bolega, Отправлено:11:38 26-09-2020

Как сделать мультивыделение, написано в хрестоматии! Если вам лень прочитать ее, почему я должен тратить свое драгоценное время, объясняя банальные вещи?? Я всегда найду время чтобы ответить на сложные или непонятные вопросы, но я не школьный учитель, чтобы разжевывать элементарное!

Автор: asku, Отправлено:09:46 27-09-2020

bolega, спасибо, уже понял как сделать мультивыделение!

Автор: sergiokapone, Отправлено:09:04 28-09-2020

bolega


Цитата:
В новой версии я сломал авто-позиционировании глифа при вставке. Причем только если вставка выполняется перетаскиванием мышкой. По двойному щелчку или горячей клавише все нормально.


Да интересно, долгое время пользовался перетаскиванием мышкой для вставки глифа, о двойном щелчке или забыл или не знал.

Немного помучившись со вставкой вспомнил этот пост. Выходит так еще проще. Не знаю, документированно ли это.


Автор: D1D1D1D, Отправлено:20:07 29-09-2020

Привет. Отсканировал книгу и путём тестов выяснил наиболее удачное разрешение, при котором ФайнРидер нормально распознает эти страницы (тут пример). Сканировал в 1000dpi и в СК при обработке увеличивал dpi вдвое, но теперь PDF-файл получается большой. Что можно сделать, чтобы привести соотношение по качеству и размеру к более-менее стандартному?

Автор: asku, Отправлено:21:12 29-09-2020


Цитата:
Отсканировал книгу...

D1D1D1D
Книга заинтересовала. А как она называется? И где вы будете публиковать файл книги?

Автор: esys, Отправлено:21:38 29-09-2020


Цитата:
Сканировал в 1000dpi и в СК при обработке увеличивал dpi вдвое

- излишне, т. к. ничего не даёт кроме кратного роста веса файла. Достаточно 600 дпи (в оттенках серого) с последующим увеличением до 1200 (или без увеличения).
Цитата:
PDF-файл

- надо в джвю, т. к. сжатие эффективнее (если разрешение не излишнее как сейчас).

Добавлено:
Сделайте скан одной (или нескольких) страницы 600 дпи тифф, в оттенках серого, проверьте, чтобы не было никакого сжатия изображения при сканирования (сжимать только сами файлы архиватором) и пришлите, я протестирую.

Автор: D1D1D1D, Отправлено:21:49 29-09-2020

esys
Дело в том, что у меня уже просканированы все эти 800+ страниц книги и перспектива заново сканить в 600 дпи не очень улыбается) Нельзя ли как то исправить то, что получилось? Так понимаю, остаётся уменьшать дпи и делать джвю?

Добавлено:

Цитата:
излишне, т. к. ничего не даёт кроме кратного роста веса файла. Достаточно 600 дпи (в оттенках серого) с последующим увеличением до 1200 (или без увеличения).

В 600 я пробовал, но результат распознавания в ФР был хуже (видимо, из-за словарного большого формата и ударений в тексте).

Добавлено:
asku
Это Русско-ингушский словарь Оздоева, который Вы вроде выкладывали на Рутрекер) Но потребовалось пересканировать, так как для распознавания файл не годился. Выложу наверно туда же

Автор: Archivist, Отправлено:21:56 29-09-2020


Цитата:
путём тестов выяснил наиболее удачное разрешение <...> 1000dpi

Разрешение при сканировании должно быть кратно оптическому разрешению сканера, иначе будет осуществляться программный апскейл от меньшего кратного. В вашем случае вероятно, что 800dpi (например, если оптическое разрешение 2400). Если это не так, можно смело уменьшать до 600dpi.

Автор: asku, Отправлено:22:00 29-09-2020


Цитата:
Это Русско-ингушский словарь Оздоева, который Вы вроде выкладывали на Рутрекер) Но потребовалось пересканировать, так как для распознавания файл не годился. Выложу наверно туда же


Отлично. Будем ждать. А с разрешением 1000 я никогда не сканировал. У меня простой сканер. Я бы с таким разрешением одну книгу по году сканировал.

Автор: D1D1D1D, Отправлено:22:09 29-09-2020

asku
Я вроде тоже на простом сканил epson/xp-8500, и тоже долго — по ходу работы на компе)

Archivist
Так понимаю, ОР для epson/xp-8500 — это 5760x1440?

Автор: esys, Отправлено:22:28 29-09-2020


Цитата:
В 600 я пробовал, но результат распознавания в ФР был хуже

- распознавать надо не сырые сканы, а уже обработанные.

Автор: asku, Отправлено:22:28 29-09-2020


Цитата:
Я вроде тоже на простом сканил epson/xp-8500

У меня гораздо проще сканер. Почему-то не могу отправить вам ответ в личку. Пишет ошибку. (тех словарей у меня нет, увы).

Автор: esys, Отправлено:22:35 29-09-2020


Цитата:
Нельзя ли как то исправить то, что получилось? Так понимаю, остаётся уменьшать дпи и делать джвю?

- выложите какие есть, страниц 10-20 (исходные сканы без обработки).

Автор: Archivist, Отправлено:22:43 29-09-2020

D1D1D1D
Там по ссылке указано - оптическое разрешение сканера 1200x4800 dpi. Значит ваш выбор это 300/400/600dpi (на будущее).

Автор: esys, Отправлено:22:45 29-09-2020

Кратность должна быть 2, 4, 8, или любая целая?

Автор: D1D1D1D, Отправлено:22:47 29-09-2020

esys
Я обработанные в СК сканы распознавал, результат был хуже.


Цитата:
выложите какие есть, страниц 10-20 (исходные сканы без обработки).

Исходных сканов у меня уже нет, и в любом случае пересканировать всё я бы не взялся. Но если речь об образцах того, что получилось (файлы после обработки) — то вот, пожалуйста: https://yadi.sk/d/fAZIKAExKSkIww

Но если Вы для тестов интересуетесь — то могу 10 страниц пересканировать.

Добавлено:
Archivist
То есть, если бы я сканил в 600 — то всё равно результат был бы такой же, как сейчас, доведи я его до 2000-х дпи?

Автор: esys, Отправлено:22:51 29-09-2020


Цитата:
если Вам для тестов надо — то могу и 10 страниц пересканировать.

- смысла нет (но мне самому было бы очень интересно), если:

Цитата:
пересканировать всё я бы не взялся

Попробую на том что есть.

Добавлено:

Цитата:
всё равно результат был бы такой же, как сейчас

- именно. Только быстрее отсканировали бы.

Автор: Archivist, Отправлено:22:53 29-09-2020

esys
Любая целая, но оптимальны эти три. Меньше - вылезет муар, больше - избыточно.

Автор: esys, Отправлено:22:55 29-09-2020


Цитата:
Любая целая

- так меньше потерь при программной интерполяции?

Автор: D1D1D1D, Отправлено:22:59 29-09-2020

Archivist
Спасибо, не слыхал такое про сканеры) Но зачем тогда вообще им задана возможность сканировать в большем дпи, если прироста качества оно не даёт?

esys
10 страниц в 600дпи и с параметрами по умолчанию, сойдёт?

Автор: Archivist, Отправлено:23:00 29-09-2020


Цитата:
так меньше потерь при программной интерполяции?

Так вообще не происходит интерполяции, сканируется нативно в разных режимах (можно заметить по скорости и звуку).


Цитата:
Но зачем тогда вообще им задана возможность сканировать в большем дпи, если прироста качества оно не даёт?

Наверное чтобы была такая возможность, аналогия с программным зумом на фотоаппаратах. Вы можете добиться максимального качества с 1200dpi на своем МФУ, но что с таким качеством делать - непонятно

Автор: D1D1D1D, Отправлено:23:01 29-09-2020

esys
И имеет ли значение, если сканить в программе по умолчанию — либо VueScan?

Автор: sergiokapone, Отправлено:23:03 29-09-2020

Заофтопили

Автор: esys, Отправлено:23:06 29-09-2020


Цитата:
Так вообще не происходит интерполяции

- т. е. просто меняется скорость каретки? А как узнать на каких кратных дпи нет интерполяции?

Добавлено:
D1D1D1D, см. результаты https://yadi.sk/d/3K4UrukKTkFT-g

Автор: D1D1D1D, Отправлено:23:43 29-09-2020

esys
Надо же, значит надо уменьшать дпи) Можно Ваш файл проекта, которым пользовались?

А вот исходные сканы в 600дпи, в серых тонах (хотя вроде была инфа, что лучше в цвете делать, несмотря на чб) — https://yadi.sk/d/CC22CgvduavtVw

Автор: esys, Отправлено:00:03 30-09-2020

Cм. результаты https://yadi.sk/d/3K4UrukKTkFT-g файлы «Из 600 в 600 дпи» и «Из 600 в 1200 дпи» (там ещё остатки мусора удалить надо).

Добавлено:

Цитата:
в цвете делать, несмотря на чб

- странно. Это откуда?

Добавлено:
Не повернул страницы, исправил. (Сжатие после поворота увеличилось).

Автор: D1D1D1D, Отправлено:00:27 30-09-2020

esys

Цитата:
странно. Это откуда?

http://publ.lib.ru/cgi/forum/YaBB.pl?num=1329855072/18

Автор: esys, Отправлено:00:44 30-09-2020


Цитата:
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1329855072/18

- там:

Цитата:
Мое мнение такое: если бумага пожелтела, то сканирование в цвете намного лучше, чем в сером. Я имею в виду случай серых картинок, с цветными все и так понятно. В цветном скане гораздо больше возможностей убрать фон, не повредив серые иллюстрации. В сером же скане области иллюстрации и фона могут стать очень близки друг к другу, и чистка фона повреждает их. Если бумага белая, то сканирования в сером за глаза хватит.
- т. е. это только для жёлтой от старости бумаги и только для лучшего разделения тоновых зон от черно-белых.

Автор: gyra, Отправлено:19:55 30-09-2020

D1D1D1D
esys
Господа, вы не одни на форуме. Какое отношение ваше обсуждение имеет к данному топику? Идите в личку (ПМ).

Автор: 1234olexiy, Отправлено:00:33 18-10-2020

Господа , помилуйте
скажите пожалуйста, есть ли кромсатор для МакОС ?
Если нет, то есть ли какая альтернатива??

Автор: bearjrgm, Отправлено:08:14 18-10-2020

1234olexiy
virtualbox+win+sk

Автор: D1D1D1D, Отправлено:17:01 26-10-2020

Дано ли прямо в программе грамотно обработать такого плана малоцвет, доведя до 5-ти цветов? — https://yadi.sk/i/Xt_-O2jHDxioJA

Автор: romanef, Отправлено:18:25 26-10-2020



Цитата:
Если нет, то есть ли какая альтернатива??

https://www.kv.by/post/1052347-5-sposobov-ispolzovat-na-mac-po-windows

Автор: bolega, Отправлено:18:49 26-10-2020

D1D1D1D
В СК: https://yadi.sk/i/H_kOvuHEHr4nKQ
Закладка RV posterization

romanef
Здесь топик по ФШ??

Автор: esys, Отправлено:19:00 26-10-2020


Цитата:
В СК: https://yadi.sk/i/H_kOvuHEHr4nKQ
Закладка RV posterization

- а перевести в джвю это чтобы границы тонов остались такими же чёткими реально?

Автор: bolega, Отправлено:19:15 26-10-2020


Цитата:
а перевести в джвю это чтобы границы тонов остались такими же чёткими реально?

https://yadi.sk/d/-AOpNRBcEaaUVA
СК кодирует в djvu малоцветку без искажений

Добавлено:

Цитата:
доведя до 5-ти цветов? —

Там есть еще 6-й цвет - номер страницы, но это банально, и я не стал в примере его учитывать.

Автор: esys, Отправлено:20:13 26-10-2020


Цитата:
https://yadi.sk/d/-AOpNRBcEaaUVA
СК кодирует в djvu малоцветку без искажений

- фантастика, чёткость абсолютная, до пикселя! Т. е. для каждого цвета выделяется отдельный слой в джвю? В DjVu Small, думаю, такое невозможно сделать.

Автор: asku, Отправлено:21:51 26-10-2020


Цитата:
Закладка RV posterization


Как найти эту закладку? Я и в PDF с ответами ищу, не могу найти. Как делать такую малоцветку идеальная?!?! Подскажите, пожалуйста )

Автор: D1D1D1D, Отправлено:23:29 26-10-2020

bolega

Очень круто) Можно коротенько инструкцию, как это делать? Туториал от AAW с ютуба — об этом?

Автор: esys, Отправлено:00:17 27-10-2020


Цитата:
Туториал от AAW с ютуба

- там сильно заморочено с удалением цветных окантовок, наверно, есть способ проще.

Автор: D1D1D1D, Отправлено:01:00 27-10-2020


Цитата:
Закладка RV posterization


Я тоже не нашел RV posterization. Может это в еще не вышедшей версии, а не в v6.52 ?


Добавлено:
Кстати, в режиме Просмотра результатов, у меня нет набора инструментов, как на видео AAW


Автор: chesskom, Отправлено:03:22 27-10-2020

http://filedwon.info/szegs8bi5bek/aaw16_sk_glyphs.mp4
http://filedwon.info/s4243bvshrjv/aaw17_posterization_sk-6.52.mp4
http://filedwon.info/rewxae6420jg/aaw18_magic-selection-and-other-tricks.mp4
http://filedwon.info/ai8wpbdotb36/aaw19_finalization_example.mp4
http://filedwon.info/9wau9zkk1v8s/aaw20_hyperlinks_insertion.mp4

Автор: TelecomUral, Отправлено:04:13 27-10-2020

D1D1D1D

Цитата:
Кстати, в режиме Просмотра результатов, у меня нет набора инструментов, как на видео AAW

это preferencies panel 2. По ПКМ включается, на свободном поле окна. Команду Show в VR ищете, там эту панель можно включить. Число кнопок настраивается по ПКМ на самой панельке.

Автор: D1D1D1D, Отправлено:05:37 27-10-2020

TelecomUral
Спасибо

bolega

Все-таки, выбор нужных цветов с командой "Apply palette", не даёт такого же результата, какой получили Вы на том же изображении.



Не могли бы Вы подсказать последовательность действий, которую применяли для обработки? Слева внизу на картинке есть участок с размазанной краской поверх другой краски, что тоже у Вас вышло чисто.

Автор: bolega, Отправлено:08:57 27-10-2020

D1D1D1D
В точности не помню. Но смысл в том что сначала нужно избавиться от типографского растра. Я поступил просто. Т.к. тут нет мелких элементов (букв и проч.) то просто сильно размыл: сначала median (9,100), потом smart blur (high, 5(?), 70(?), 1). Возможно, что-то пару раз запускал. Эти фильтра в том же окошке, на закладке Filters.
В результате растр пропал, все сильно размылось, но зато все хорошо постеризовалось. Потом мелкие огрехи быстро исправил заменой цветов (как это делать, есть в выложенном видео). Да, и изначально я еще добавил цвет (97,39,68), потом глобально заменил его на (77,22,46), у вас ему соответствует (77,24,47).

Советую вообще потренироваться с заменами цветов, мусор всегда остается, но освоив несколько нехитрых приемов, можно легко от него избавляться.
Один из приемов состоит в том, что иногда лучше сперва увеличить количество требуемых цветов, например, вместо 5 добавить еще пару, охватив тем самым несколько оттенков, которые присутствуют на картинке и довольно далеко отстоят по насыщенности от "соседа". После постеризации лишние цвета заменить с помощью панельки замены цвета.

Рекомендую глянуть сюда
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1535746511/12#12
Это к видео про малоцветку:
https://www.youtube.com/watch?v=FnoqZe-uEhU&t=265s
https://www.youtube.com/watch?v=-ujehvRMj7U

Пример я делал в новой версии СК, там в отличие от текущей для малоцветки добавилась только одна новая фича: сглаживание цветовых контуров малоцветных изображений. Т.е. получается более ровные стыки цветов и меньше зазубрин на их контурах.

Автор: D1D1D1D, Отправлено:15:44 27-10-2020

bolega

Спасибо! Всё-таки, с предварительной обработкой в фотошопе выходит глаже, без точек и размер вдвое меньше — https://yadi.sk/i/DEGAmilnpyyBqw

Добавлено:
А вот еще интересней получилось — на 300 КБ меньше размером. Если в фотошопе сначала через Изображение -> Коррекция -> Порог выравнять тон для всего изображения и потом залить все участки нужными цветами — в результате исчезают тонкие полоски с соседними цветами на границах цветов, которые возникали из-за типографского способа печати https://yadi.sk/i/5TS0xNeS2kJAjw

Сохранение этого файла из фотошопа даёт размер — мегабайт, а СК доводит его до 700 килобайт.

Автор: esys, Отправлено:18:59 27-10-2020

D1D1D1D
В джвю есть вариант обработки узора?

Автор: D1D1D1D, Отправлено:19:03 27-10-2020

esys
Не, не пробовал, это надо отдельно вникать

Автор: slava_kry, Отправлено:21:22 27-10-2020

esys
А смысл?
Делаете индексный Тиф любым путём и суёте в Djvu Small Mod "Экстремальная малоцветка" и получаете малоцветный дежавю на выходе.

Добавлено:
D1D1D1D
Тут работа с СК и если вас интересует только маленький размер, а не работа с СК, то обращайтесь в "Обработку изображений". Данный рисунок может иметь размер 40-80 кБ в ПДФ, но к СК это не имеет никакого отношения.

Автор: D1D1D1D, Отправлено:21:32 27-10-2020

slava_kry

Интересует конечно СК в итоге — Фотошоп только для предварительной обработки ради качества результата, на необходимость чего и вы кстати тут не раз обращали внимание

Автор: esys, Отправлено:21:42 27-10-2020


Цитата:
Делаете индексный Тиф

- подскажите как.

Автор: D1D1D1D, Отправлено:13:26 28-10-2020

esys

Наверно, имеется в виду сохранение из этого урока slava_kry (см. на 15-й минуте) — https://youtu.be/1deXUzo6ciY

Автор: slava_kry, Отправлено:13:44 28-10-2020

D1D1D1D
Дык, тогда задавайте вопросы в интересующих темах, а тут по СК.

esys

Цитата:
- подскажите как.


Я не понимаю вопроса!!!
В любой программе вы делаете то, что хотите и сохраняете в индексной палитре.

Может вам понравится СК, может СТ, может КорелДрав, может Фотошоп, может ИрфаВью... и много ещё чего.
Вы просто подготавливаете изображение там, где вам удобно и сохраняете его в индексных цветах.

Автор: D1D1D1D, Отправлено:21:50 28-10-2020

С какими настройками получше обработать такую вот печать? — https://yadi.sk/i/4UbBl4URTtyOMw

Автор: D1D1D1D, Отправлено:03:16 29-10-2020

bolega

Интересно: опция определения среднего значения цвета во вкладке постеризации, учитывает образец какого размера? Сколько на сколько?

Автор: bolega, Отправлено:08:50 29-10-2020

D1D1D1D
Не понял вопроса. Среднее берется по текущему выделению, т.е. размер вы сами задаете

Автор: D1D1D1D, Отправлено:15:45 29-10-2020

bolega

Имелось в виду: после выбора участка с цветом — получение цвета происходит исходя из всей выделенной области, которая может быть любых размеров — или имеет какой то фиксированный максимальный размер (например: 5х5)?

Автор: asku, Отправлено:18:57 03-11-2020

Добрый вечер.
Подскажите пожалуйста, как назначить горячую клавишу вот этой команде: Adjust (crop) page... — width, height, left, right, top, bottom.

Вообще назначаются ГК здесь:
File—Options—Hotkeys.
Но там в списке команд и действий нет нужной мне.

Добавлено:
Еще вопрос. Как сделать, чтобы колесико мыши регулировало зум, а не прокручивало страницы? Речь НЕ об окне Result view. В этом окне как раз зум работает.

Автор: D1D1D1D, Отправлено:21:29 03-11-2020

asku

Рекомендую программой AutoHotkey воспользоваться для таких дел - назначать и переназначать клавиши можно для чего угодно. Есть русская справка и форум. К примеру, если горячей клавиши для кнопки нет - можно скопировать ее изображение и назначить хоткей для команды, по которой по изображению кнопки на экране будет совершаться клик

Автор: asku, Отправлено:23:48 03-11-2020

D1D1D1D
Почитал о программе. Там программировать надо. А я не программист, увы.

Автор: TelecomUral, Отправлено:04:12 04-11-2020

asku


Цитата:
горячую клавишу вот этой команде: Adjust (crop) page...

В Хрестоматии (в алфавитном списке) написано что это группа команд. Вы хотите назначить на ГК вызов/скрытие всей панельки?

Автор: bolega, Отправлено:08:36 04-11-2020

asku

Цитата:
Как сделать, чтобы колесико мыши регулировало зум, а не прокручивало страницы?

Держать нажатым клавишу ctrl. Было когда-то описано в whatsnew


Цитата:
горячую клавишу вот этой команде: Adjust (crop) page... — width, height, left, right, top, bottom.

Горячие клавиши ввожу по просьбам, не проблема, минутное дело. Изначально они предусмотрены только для частых операций. Для редких действий, чтобы не засорять список, я не ввожу их.
Вам действительно нужно часто пользоваться именно этими операциями, причем всеми?

P.S. Вообще, самыми замусоленными и часто объясняемыми фичами СК были наверно две: 1) почему СК использует резаки а не рамку, 2) почему в главном окне не работает zoom через колесико. Т.е. на форуме в свое время объяснял десятки раз, почему. Устал, больше не буду.

Автор: asku, Отправлено:08:54 04-11-2020


Цитата:
Устал, больше не буду.


Ну так я, прежде чем здесь написать, искал в Хрестоматии (пдф-файл). По поиску там искал: колес, колёс, мыш, scroll. Когда не нашел, тогда стал писать здесь.


Цитата:
Вам действительно нужно часто пользоваться именно этими операциями, причем всеми?


Мне вчера нужно было пользоваться "Adjust (crop) page... — width" (по ширине). Не скажу, что часто бывает нужно, но все же.

Автор: daa2013, Отправлено:11:34 05-11-2020

В версии 6.6. снова появилась проблема "улет глифов".

Перетаскивание работает корректно.
Но по хоткею "пасте" он встает черти где, а не в окрестности указателя мыши.
(проявляется не сразу, а через какое-то время после начала работы).
Upd Один раз улёты начались сразу после вращения по Ctrl+R , но не уверен, что в нем была причина.
Upd2 В версии 6.00.5 я никогда с этим не сталкивался, поэтому загадка, что изменилось-то.

Добавлено:
В версии 6/6 в окне RV переключися в режим компаре.
Справа курсор как курсор - а слева квадрат, как ластик

Добавлено:
Писал также уже пару раз, но всё равно.
Когда в ячейке "отклонение чистящего цвета" пишешь цифры 1 или 2 или 3 происходит переключение этого самого чистящего цвета.
белый/черный/магик

Автор: daa2013, Отправлено:18:58 05-11-2020

Также при работе с глифами в режиме подсветки спеклов, часть спеклов подсвечивается как-бы наполовину:



Я для предыдущей версии 6.53 даже ролик снял, как это возникает:
https://yadi.sk/i/1B1vbe1aD93fVA


Также идентифицировано два черно-белых тиффа (нестандартных что-ли ?),
первый не видится, второй видится как полоски, хотя в других программах они открываются:
первый https://yadi.sk/i/1MnCmYHzDHblVA
второй https://yadi.sk/i/Jii8C653Ev8qsA

Автор: asku, Отправлено:15:24 06-11-2020

bolega


Два вопроса по палитре (sheet) глифов.

Двойным щелчком ставится тот глиф, который активирован в данный момент. Нельзя ли сделать так, чтобы активированным глифом считался по умолчанию тот, который последним внесен в палитру? Надеюсь, вопрос понятен.

Второй вопрос такой. Сложно ли было бы реализовать такую штуку. Чтобы глифы из палитры присваивались клавише (конкретный глиф конкретной клавише) на клавиатуре, чтобы можно было глифы как бы впечатывать клавишами, предварительно установив в нужном месте курсор. Нередко нужно бывает не только подправить слово, букву, буквосочетание, но и «вписать» поврежденный абзац, предложение. Не знаю, понятен ли и этот вопрос.

Спасибо.

Автор: daa2013, Отправлено:09:24 07-11-2020

И вот такой еще момент:
Я хотел задать условие бинаризации авто +10
Но СК выплюнул предупреждение, что опция применена к 0 файлов.

Я понял это так, что сначала надо сделать обработку, только потом менять полученные значения порога.

Но делать обработку дважды мне долго (там много фильтров), плюнул, задал кастомный порог.
Неужели нельзя дать возможность заранее наложить условие по изменению расчетного порога ?
(Причем как-то давно мне нужна была сложная комбинация, и я, помнится, ухитрился ее сделать: если автопорог до 170, то +10, если больше 180, то +20).

Возможно, конечно, (я уже не помню) я тогда делал прогон дважды. Первый раз без фильтров но с авто-порогом, потом изменение порога и прогон с фильтрами.

Добавлено:
И еще хотел написать/предложить.

В окне RV есть опция по заливке белых дырок. Там число. Можно подобрать его оптимальное значение для работы по площадям.

Но если попытаться задать этот в пакете через пайж/спешиал, то там "Станадарт +N"

а) непонятно, насколько эти действия идентичны. (заливка дырок в RV и в задании)
В обычном задании при обработке черных спеклов, там же часть блокируется, которые опознаются как прилегающие к буквам, точки и пр.
про белые же - неизвестно

б) хорошо бы видеть индикатор числа для заливки белых в пейж спешиал. Даже если его не задавать, то чтобы не считать лишний раз, показывать, какие дырки закрываются.
(Нет, ну можно залезть в опции, посмотреть число там, потом накинуть такой плюс, чтобы он соответствовал подобранному в RV). А если дырки большие, то и дефолт в опциях можно поменять. Но это и сложнее, и может не обеспечить соответствия.

Если же это два разных алгоритма заливки (в RV и в задании), то хорошо бы дать возможность в задании при заливке просто выставить число, которое перед этим подобрано в RV.

Автор: bolega, Отправлено:10:07 07-11-2020

daa2013

Цитата:
В версии 6.6. снова появилась проблема "улет глифов".

Не смог воспроизвести. Хотя гонял по черному.


Цитата:
Писал также уже пару раз, но всё равно.

Это да. Исправлю


Цитата:
Также при работе с глифами в режиме подсветки спеклов, часть спеклов подсвечивается как-бы наполовину

Да, там код у меня недоделанный. Так и написано было: костыль. Собирался к этому вернуться, да забыл. Сейчас доделал.


Цитата:
Я понял это так, что сначала надо сделать обработку, только потом менять полученные значения порога.

Да, только так. Нельзя менять то, чего еще нет.


Цитата:
нельзя дать возможность заранее наложить условие по изменению расчетного порога ?

Интересный вопрос. Всегда считал это бесполезным. Если не знаешь, какой порог будет рассчитан, то как заранее понять, какая должна быть поправка?? Или вы увидели там какую-то закономерность?


Цитата:
Но делать обработку дважды мне долго (там много фильтров),

Так не делайте. Задайте режим ребинаризации (у меня всегда включен). В этом случае после обработки можно просто бинаризовать повторно, не обрабатывая. Причем перед ребинаризацией можно менять не только порог, но и те параметры, которые применяются после нее, т.е. despeckle, hole, c.smooth. Ребинаризацию можно запускать как пакетно, так и в RV.


Цитата:
В окне RV есть опция по заливке белых дырок. Там число. Можно подобрать его оптимальное значение для работы по площадям. Но если попытаться задать этот в пакете через пайж/спешиал, то там "Станадарт +N"

Если вы подобрали числовое значение, так внесите его просто в Options > white hole sizes. И тогда никаких +N не нужно задавать. Я считаю, что использование базового значения намного удобнее чем задавать для каждой страницы.


Цитата:
Но это и сложнее, и может не обеспечить соответствия.

Внести одно число сложнее?? Соответствие для white hole есть.


Цитата:
то хорошо бы дать возможность в задании при заливке просто выставить число, которое перед этим подобрано в RV.

Вот и задайте его в Options > white hole sizes. И это не дефолт, это база для возможных постраничных отклонений (встречается редко).



Добавлено:
asku

Цитата:
Нельзя ли сделать так, чтобы активированным глифом считался по умолчанию тот, который последним внесен в палитру?

Весьма спорное требование. Для активирования глифа его нужно либо хотя бы один раз перетащить на скан, либо проще - дважды щелкнуть по нему в ленте глифов.
Автоматом активировать (т.е. копировать его в буфер обмена) добавленный считаю излишним. Я, например, сначала формирую все нужные глифы, так зачем мне эта лишняя операция. Впрочем, если вы настаиваете, могу сделать как опцию.


Цитата:
Чтобы глифы из палитры присваивались клавише (конкретный глиф конкретной клавише) на клавиатуре, чтобы можно было глифы как бы впечатывать клавишами,

Вопрос интересный. Надо подумать. Не уверен, что на практике это будет удобно. Выставлять на каждую букву точку вставки одной рукой, клаву давить другой. Ну не знаю. Вот если как-нибудь OCR применить, чтобы с его помощью автоматически передвигать курсор на следующую букву, вот это будет интересно.


Автор: TelecomUral, Отправлено:10:21 07-11-2020


Цитата:
так внесите его просто в Options > white hole sizes

Этот параметр применяется немедленно? Не надо чего-нибудь сохранить, или вообще выйти-зайти в СК или задание? Или, допустим, переобработать хоть страничку с включенным fill holes?

Добавлено:

Цитата:
Я, например, сначала формирую все нужные глифы

У меня совсем слабый опыт работы с глифами, и пока что поддерживаю просьбу asku - довольно удобно после вставки глифа сразу иметь его в буфере для немедленной вставки. Вероятно, по мере набора опыта я тоже перейду к вашему типу действий "сначала библиотека, потом вставка из неё", а пока - я иду постранично, мусор чищу, вижу проплешины в буквах, хочу сразу же их и устранить. А на странице чаще всего буквы плохие сходно. Глаз цепляется за какую-нибудь одну "м" или "п" сразу во многих местах. И руки чешутся её скопом и исправить.
Вообще-то согласен, что к середине книги, когда буквы уже набраны, автовставка в буфер лишняя и сбивать будет Так что опция "вкл/выкл автовставка" имеет смысл.

Автор: bolega, Отправлено:10:32 07-11-2020

TelecomUral

Цитата:
Этот параметр применяется немедленно?

Это параметр для обработки, поэтому нужно конечно переобработать, или если активен режим бинаризации, то ребинаризовать. Как я уже писал, при ребинаризации по новой применяются despeckle и fill hole, возможно, уже с новыми значениями параметров. Выходить из СК конечно же не нужно.
В окне RV размеры для despeckle и fill hole задаются независимо от размеров, используемых при обработке! Это гибко.

В options размеры спеклов и дырок встречаются дважды: default (применяются для вновь созданных заданий) и for current task. При создании нового задания default копируются в for current task и далее живут своей жизнью и применяются при обработке.

Добавлено:
Возвращаясь к вопросу asku по поводу глифов. Наиболее часто приходится менять две буквы "и" и "н", причем как правило, если они плохи, то плохи обе. Я уже думал на тем, чтобы когда их заменяешь на одной и той же странице, приходиться часто активировать то одну, то другую. Было бы удобнее назначить на каждую свой хоткей. Вот про это я уже думал, но так и не реализовал, руки не дошли. А вот чтобы прямо делать соответствие между клавишами и глифами, не думал, ведь надо будет специальный режим редактора вводить, чтобы на время блокировать срабатывание обычных хоткеев.

Автор: daa2013, Отправлено:11:49 07-11-2020


Цитата:
Не смог воспроизвести. Хотя гонял по черному.

Любопытно, так как я с глифами в режиме подсветки спеклов работаю.
Но если начинается улет, то он и при выключенном режиме происходит.
Но вот когда он возникает, я какое-то время, естественно, при подсветке был.


Цитата:
Интересный вопрос. Всегда считал это бесполезным. Если не знаешь, какой порог будет рассчитан, то как заранее понять, какая должна быть поправка?? Или вы увидели там какую-то закономерность?


Ну, вот есть проект на полторы тыщи страниц. А когда пользовался двойным условием - был на 2,5 тыщи страниц. (Сразу 5 томов энциклопедии в 600 стр каждый.)

Прогнал на тестовых 50-ти, достаточно разнообразных, понял, какие нужны смещения. Потом делаю весь проект.
А вот тут делал в 1200 дпи - так СК и 32 страницы час считает. Второй прогон тут мне совсем не нужен.


Цитата:
Внести одно число сложнее?? Соответствие для white hole есть.

Так я так и делаю. Почему бы не показывать это число там на закладке ?
(Не задавать, а просто справочно показывать.)



Цитата:
Вот если как-нибудь OCR применить, чтобы с его помощью автоматически передвигать курсор на следующую букву, вот это будет интересно.


А разве тессеракт не дает координаты ячеек, в которых буквы расположены ? Ведь от деспекла защита с его помощью реализована.

То есть , как я догадываюсь, где-то есть массив: координаты - буква. Создать массив буква- глиф , и шлёпать эти буквы автопозиционированием , запрашивая каждый раз у пользователя разрешение на замену.


Цитата:
Выставлять на каждую букву точку вставки одной рукой, клаву давить другой.


Я так и работаю хоткеем пасте. Дважды кликаю букву и правой рукой мышкой навожусь. Левой затем давлю клаву.
Ctrl+Q (моё пасте), Ctrl+Z, Ctrl+1, Ctrl+2 (для чистки) - всё рядом.


Я бы назначал не хоткеи, а просто сами эти буквы и - значит глиф И, (привязать только букву к глифу). Сделать режим "глифовая клавиатура".


Ну, а следующий шаг - автозамена

Автор: bolega, Отправлено:13:03 07-11-2020

daa2013

Цитата:
Любопытно, так как я с глифами в режиме подсветки спеклов работаю.

Там код от подсветки вообще не зависит. Я правильно понимаю, что улет - это когда глиф вставляется очень далеко от точки курсора? А то ведь еще бывает, что глиф автопозиционируется неправильно, т.е. ставится на соседнюю букву. Такое тоже бывает, но это такой алгоритм. Лечится только нажатием ctrl при вставке.


Цитата:
Ну, а следующий шаг - автозамена

Я бы сказал, шаг в пропасть В итоге будет инь-янь в кубе.


Добавлено:

Цитата:
А разве тессеракт не дает координаты ячеек, в которых буквы расположены ?

Дает, но если рядом с буквой есть мусор, он его включает в координаты буквы. Из-за этого координаты могут иногда быть в два раза больше реальных габаритов буквы

Автор: daa2013, Отправлено:13:47 07-11-2020


Цитата:
улет - это когда глиф вставляется очень далеко от точки курсора?

Да, правильно. Причем курсор с кликом переставил, а неправильная точка ввода осталась той же.
Еще в какой-то (я даже, кажется вам видео делал, или скриншоты) - зум сделал, а точка ввода в координатах экрана не изменилась. Когда делал видео, заметил, что в том же месте квадрата запись. Но за текущий СК не отвечу.

В каком-то старом, несколько версий назад, улет был возможен даже в позицию, не видную на экране. (И это самое страшное, ты этот глиф только потом случайно обнаруживаешь.) Но в текущем такого пока не видел.



Цитата:
Лечится только нажатием ctrl при вставке.

Не могли бы уточнить, что дает контрол, так как я по Ctrl+Q вставляю ?


Цитата:
Из-за этого координаты могут иногда быть в два раза больше реальных габаритов буквы

Насколько я понимаю, точность автопозиционирования больше размеров одной буквы, а для контроля ошибок одобрение пользователя будет


Цитата:
Там код от подсветки вообще не зависит.

ИМХО Где-то накапливается какая-то ошибка, которая влияет, или многопоточность запись про координату куда-то делает. А ошибку, что угодно (в смысле, пока неизвестно, что) породить может.
Я не могу предсказать, когда начнется улет. Иногда быстро, иногда позже. Никаких особых операций не делаю - чистку метелками и вставку глифов.

Раз я летом не писал, то в предпредыдущей это особо не проявлялось.




Автор: niccolo, Отправлено:14:00 07-11-2020

Касательно работы с глифами - если это не часто, и на разных книгах — более удобным вариантом может оказаться просто библиотека старых печатных фонтов....
Всё равно ведь все стараются для библиотеки выбрать идеально отпечатанные глифы.

Второй альтернативой для перфекционистов может быть программа Сканфонт - создание фонта из отпечатанных букв и см. п. выше....

Если речь не идёт об исправлении 1-3 дефектных букв затраты времени на исправление в СК по традиционному методу оказываются очень неприемлемыми.


Автор: bolega, Отправлено:14:01 07-11-2020


Цитата:
Не могли бы уточнить, что дает контрол, так как я по Ctrl+Q вставляю ?

Он дает только если вставлять перетаскиванием мышкой.
При автопозиционировании совпадение ищется в пределах определенной области относительно точки вставки. Если держать нажатым ctrl то СК эту область сократит вдвое, и перескок глифа на соседние символы практически исключен.

Автор: TelecomUral, Отправлено:14:32 07-11-2020

bolega
может, вам поможет такая инфа по поводу вставки глифов с помощью хоткея.
Я сейчас решил попробовать повторить опыт daa2013, повставлять хоткеем. Не подумавши, что Ctrl+V стандартное "Paste", стал выискивать специальную команду вставки глифа в списке для хоткеев. Не нашел Подумал, что это "Insert glyph to library". Назначил на неё Ctrl+B.
Так вот. Напробовался. Разобрался, что я неправ с командой.
Но по Ctrl+B у меня СК сворачивает свое окно, вместо того чтоб вставлять выделенный прямоугольник в библиотеку глифов
Если daa2013 назначил нетипичную комбинацию на хоткей вставки глифа, может в этом собака порылась?

Автор: daa2013, Отправлено:14:51 07-11-2020

А, может, я подсветку включаю/выключаю, и это только N раз прокатывает - неизвестно.

Upd
а может, действительно, когда набор глифов идет, где-то затык.
Сегодня, например, еще ни одного улета.

Автор: daa2013, Отправлено:20:03 07-11-2020

Сделал в ч/б режиме (без подсветки) поворот и начались улеты.

Автор: bolega, Отправлено:20:09 07-11-2020

TelecomUral

Цитата:
Подумал, что это "Insert glyph to library". Назначил на неё Ctrl+B.

Это баг. Среди всех команд MW есть две которые работают на уровне windows ('Hotkey: activate app', 'Hotkey: deactivate app'). Под этим же номером идет "Insert glyph to library", но только для VR, они не должны уходить на уровень windows, но из-за бага ушли.
Исправил.
Уровень windows означает, что команды становятся горячими клавишами всего windows, а не экземпляра запущенного СК.


Добавлено:

Цитата:
Сделал в ч/б режиме (без подсветки) поворот и начались улеты.

Когда начинаются улеты, вызовите и тут же закройте контекстное меню

Автор: daa2013, Отправлено:10:53 08-11-2020


Цитата:
В итоге будет инь-янь в кубе.

Если СК сразу заменит все буквы, то да. Да еще местами и промахнется.

Но я-то видел это по другому. СК показал ячейку, и предлагаемую замену. Пользователь кликом одобрил, (клавишей эскейп отказался). Глиф остается еще не вклеенным. Далее либо вторым кликом вклеивается, если точно расположено, либо мышкой чуть смещается и только потом вклеивается.
После этого осуществляется перемещение на следующую ячейку, и демонстрируется предлагаемая уже там замена.


Цитата:
Когда начинаются улеты, вызовите и тут же закройте контекстное меню

Сумели воспроизвести ?

Автор: bolega, Отправлено:14:47 08-11-2020


Цитата:
Сумели воспроизвести ?

Нет, но я знаю причину. Правда я сделал все, чтобы ее искоренить.
У СК всего два варианта где брать точку вставки. Если команда пришла из меню, он берет точку в которой было оно вызвано по ПКМ. Если команда пришла от нажатия хоткея, то брать текущую координату мышки. Проблема в том, что обработчик команды вызывается windows без намека на то, кто ее вызвал. Мне приходится исхитряться, чтобы выяснить это. Видимо, не всегда это срабатывает. Хотя все сделал как надо.
Есть еще третий, тоже штатный, вариант: если в момент вставки имеется выделение, либо оно начало выполняться, то СК вставит в левый верхний угол выделения. Но у вас же не этот случай?


Автор: daa2013, Отправлено:17:38 08-11-2020

Я никакого выделения не вижу, но не факт.

Я же кликаю мышкой перед тем как вставлять, а это на точку вставки не влияет.
Так что может он где-то этот угол и держит. Не случайно после ротации уже дважды начинались улеты. А для ротации как раз и делается выделение.
+ уж больно непредсказуемые условия возникновения (для предыдущих бет). а выделение -то при чистке всегда и идет.
Может выделение как-то где-то залипнуть ?

Автор: TelecomUral, Отправлено:17:56 08-11-2020


Цитата:
Может выделение как-то где-то залипнуть ?

Вот кстати о выделении в VR. Бывало у меня так, что выделение оставалось при смене страницы. Довольно давно, весной. Когда активно меняешь режимы работы. И я кажется как баг это не сдавал. Внешне выделения нет, страница свежая, а редактор ведёт себя так, как будто выделение уже есть. Ну, например, жмешь магическую очистку, а она применяется как контур, который был выделен на предыдущей странице. Я точно не вспомню, но какие-то проблемы с залипанием выделенной области точно были.

Автор: asku, Отправлено:18:43 08-11-2020


Цитата:
Я, например, сначала формирую все нужные глифы, так зачем мне эта лишняя операция. Впрочем, если вы настаиваете, могу сделать как опцию.


По мне очень удобная опция. Если бы она была по умолчанию (то есть последний внесенный глиф активен), то это бы неудобным ни для кого не было.

Кстати, я часто в палитру добавляю не только отдельные глифы-буквы, но и буквосочетания и целые слова. Добавил слово в палитру и оно сразу активно — удобно!
————————
Возник вопрос. Где-то здесь в сообщении Bolega узнал о такой возможности. На вкладке Page нажать кнопку Special. В открывшемся окне выбрать вкладку More и там выбрать в вываливающемся меню нужную цифру и тогда внутри букв не будет белых точек. Я так сделал, но белые «точки» все равно остались.
Прикрепляю скрин, чтобы яснее было, о чем речь.


Автор: bolega, Отправлено:19:09 08-11-2020

daa2013
Раз уж я никак не могу воспроизвести, попрошу вас помочь. Я добавлю логирование условий вставки, например, последних 5 штук. Как только у вас начнутся улеты, вы посмотрите этот лог и тогда будет по крайней мере ясна причина.

Добавлено:
asku

Цитата:
Я так сделал, но белые «точки» все равно остались.

Переобработку делали после этого?

Автор: asku, Отправлено:19:53 08-11-2020


Цитата:
Переобработку делали после этого?


Кажется дело в том, что эти белые точки слишком большие.
+4 это пикселы? Наверное на нотах точки слишком большие выходят.

Автор: daa2013, Отправлено:20:29 08-11-2020


Цитата:
Раз уж я никак не могу воспроизвести, попрошу вас помочь. Я добавлю логирование условий вставки, например, последних 5 штук. Как только у вас начнутся улеты, вы посмотрите этот лог и тогда будет по крайней мере ясна причина.

да, хорошо.
Но тут непредсказуемо, когда начнутся.



Цитата:
Кажется дело в том, что эти белые точки слишком большие.
+4 это пикселы? Наверное на нотах точки слишком большие выходят.


Вот именно об этом я и говорил !
Что справочные сведения там многим будут не лишними.

Автор: daa2013, Отправлено:07:48 09-11-2020

Сделал поворот большого участка - начались улеты. Вызов и закрытие контекстного меню помогло.
Перед этим делал поворот малого участка - улетов не было.

Автор: TelecomUral, Отправлено:08:34 09-11-2020

daa2013
причем с режимом подсветки? Без этого режима все хорошо у меня. А как подсветку включил, первый же paste по Ctrl+V вот:


вставлял в слово "легкое",

и вот:


вставлял в разрядку "к и ш е ч н и".

Автор: daa2013, Отправлено:09:19 09-11-2020

Без подсветки. Но вопрос в точку.

Выделение, выделение было сделано в режиме подсветки !

Запускаю СК с нуля, выключаю подсветку, выделяю-поворачиваю: улётов нет.

Запускаю СК с нуля (подсветка в сохраненном задании горит), выделяю, только потом выключаю подсветку, поворачиваю - начинаются улёты.


Важно , что хотя бы ситуация воспроизводится, а то сколько-то там бет назад, они совершенно неожиданно для меня начинались. Но, может, тут как раз проверки мышки, о которых, писал болега, сказались и часть причин в 6.6. уже заблокирована.

Добавлено:
Пользуясь случаем, хочу напомнить о фиче, которую уже неоднократно просил.
Делать разборку джву по слоям задний/передний с генерацией пустышек на месте тех слоёв, которые отсутствуют (для фото-страниц - пустой слой маски; для ч/б или раскрашенных масок - пустой задник).
Дело в том, что утилиты джву при разборке нарушают нумерацию страниц (пустышку не генерируют, а следующую страницу нумеруют предыдущим номером), и сгенерировать пустышки руками и вставить их с правильной нумерацией (и в комплект задников, и в комплект передников, в каждом из которых свои собственные смещения) для какой-нибудь толстой энциклопедии в тыщу с лишним страниц становится очень хлопотным занятием.

Автор: bolega, Отправлено:09:47 09-11-2020

Все равно у меня не воспроизводится
Давайте уточним, как поворачиваете: по команде КМ, хоткею (Ctrl-R?) или по кнопке в панели. Как завершается поворот: paste или paste and merge.
Включены ли опции RV Options > Editor > Auto merge pasted image и Auto merge non-merged image. Там же опция Paste point location чему равна?
Windows 7/10 ?


Цитата:
Пользуясь случаем, хочу напомнить о фиче, которую уже неоднократно просил.

Я знаю. Но эта фича пожалуй одна из самых сложных. Поэтому я иногда я ее обдумываю, но решения пока нет. Просто импортировать задний слой одной зоной на всю страницу мало толку. Чего потом с этим делать?? Там и картинки будут, и текст раскрашенный. В идеале из слоя надо вычленить цветной текст (тут еще тоже надо подумать, делать ли одной зоной или разбивать на отдельные зоны по какому-нибудь признаку), картинки тоже желательно разбить на отдельные зоны, если это возможно; по какому критерию я пока не знаю.
Малоцветка - это тоже самое что цветной текст, но области цветов более хаотично распределены, надо как-то определить, что с ними делать: как раскрашенные b/w зоны, либо как малоцветку.
Т.е. это намного сложнее, чем импорт pdf, в котором уже все как правило разбито.

Автор: daa2013, Отправлено:10:43 09-11-2020

Мне было бы достаточно двух папок, где в одной сложены задники, в другой - передники без какого-либо создания искусственных зон. Лишь бы была правильная нумерация и сгенерированы пустышки. Потому что я отдельно обрабатываю задники, отдельно передники.

А вообще мне для реставрации нужны три комплекта (еще и совмещенный).
Я открываю два кромсатора (допустим маски и совмещенные), и занимаюсь чисткой масок + вклеиванием в маску того, что неуместно ушло в фон.
Потом точно также при помощи двух СК делаю комплект правильных задников. Потом склеиваю все в FSD.
То есть вместо зон, тут в режиме компаре имеет смысл показывать совмещенный джву слева, а справа какой-то слой: маски/задники. Ну и дать возможность копипасты слева направо. Можно справа переключать демонстрируемый слой: задник/передник.
При генерации же джву задники можно считать зонами на всю страницу.
Upd: я назвал это реставрацией, но я так часто и свои собственные сканы обрабатываю, где для разделения текст/картинки использую джву-сегментацию (делаю джву без какого-либо субсэмплинга задника 1 к одному), а потом ошибки сегментера правлю руками. Использую эту технику, когда текст поверх картинок лежит.


При импорте же чужих книг еще может быть проблема, что часть страниц может иметь нестандартный дпи, или что разрешение задника у части страниц не такое (часть субсемплили на 2, часть на 3, часть на 4). Но я бы при импорте всё апсемплил до максимального разрешения.



Цитата:
Давайте уточним,

Win 7
Ctrl+R (кстати, при повороте через КМ, вроде, улетов нет)
завершаю paste
включен Auto merge pasted image
выключен Auto merge non-merged image
Paste point location = top left

Автор: bolega, Отправлено:10:57 09-11-2020

daa2013

Цитата:
утилиты джву при разборке нарушают нумерацию страниц (пустышку не генерируют, а следующую страницу нумеруют предыдущим номером),

А какими командами и утилитами вы получаете слои для случая картинок, и для случая раскрасок.
А то я не пойму насчет пустышек.

Добавлено:

Цитата:
завершаю paste

А merge как делаете, щелчком или командой КМ?
И еще: режим one-page Или two-page

Автор: daa2013, Отправлено:11:16 09-11-2020


Цитата:
А какими командами и утилитами вы получаете слои для случая картинок,

Разборку делаю при помощи djvudecode . У меня для слоёв два батника:

для задников:
djvudecode.exe --output-format=tif --layer=background input.djvu _output

для передников:
djvudecode.exe --output-format=tif --layer=foreground input.djvu _output

(ну и ещё третий для совмещенных страниц).

А других способов разборки я просто не знаю.

(Я любой файл для разборки именую input.djvu , а складывается стандартно в папку _output )


Цитата:
А merge как делаете, щелчком или командой КМ?
И еще: режим one-page Или two-page

щелчком
режим - one page

Добавлено:

Цитата:
А то я не пойму насчет пустышек.

Я не могу сейчас это перепроверить, но мне, кажется, что при попытке разборки
этого файла крестика, как раз, весь набор проблем и вылез:

http://publ.lib.ru/ARCHIVES/S/Sovetskaya_Enciklopediya/Bol'shaya_sovetskaya_enciklopediya._Izd.2._T.12.(1952).[djv-1200].zip

"Проблема пустышек" заключается в том, что если джву такой
1 - трехслойная страница
2 - однослойная
3 - трехслойная

то при разборке мы получим такую нумерацию
1 - страница 1
2 - страница 3

если слоя нет, то соответствующее изображение отсутствует и (что страшно) его номер присвоен следующей странице.
В результате получаем рассинхрон задников и передников

Автор: TelecomUral, Отправлено:12:47 09-11-2020


Цитата:
Просто импортировать задний слой одной зоной на всю страницу мало толку. Чего потом с этим делать?? Там и картинки будут, и текст раскрашенный.

Ногами не пинайте за идею.
Навскидку напрашивается особый визард импорта. С парой режимов:
- дежавю создан с правильным разбиением на текст, малоцветный текст, и фотокартинки. Тут всё должно быть просто, только ограничения на количество и мин.размер зон надо поставить. А то каждая цветная мусоринка зону станет создавать.
- дежавю требует вручную указания разбиения каждого (или всех) задников страниц на зоны "малоцвет", "фото", "на основную страницу". Некий аналог вызова графредактора из VR, когда СК на время вызова замораживается. Так и здесь - запускается второй СК, которому скармливается задник/задники. Расстановка зон будет служить исходными правилами при импорте в главном задании. Ну или вообще - предусмотреть в СК команду "экспорт зон", и визарду импорта указывать этот экспортнутый файлик-список. Его тогда и из других программ можно пристегивать, если о формате договориться.

А авторазбиение - "не наш метод".

По улёту: bolega, может для вас ролик снять? У меня улёт произошёл моментально.

UPD
хорошая мысля приходит опосля.
Грузить дежавю "как есть сейчас". Расставить зоны. Экспортнуть их в txt-файлик. Затем открыть новый СК и в импорте указать "для задника использовать разбиение на зоны из файла TXT".

Автор: bolega, Отправлено:13:56 09-11-2020

TelecomUral

Цитата:
По улёту: bolega, может для вас ролик снять? У меня улёт произошёл моментально.

Не надо, что толку если я не могу воспроизвести.
Лучше выдам версию с логированием, тогда будет проще разбираться в причине.

Добавлено:

Цитата:
Расставить зоны. Экспортнуть их в txt-файлик. Затем открыть новый СК и в импорте указать "для задника использовать разбиение на зоны из файла TXT".

Да лишнее это все. если уж есть расставленные зоны, зачем опять импорт? Просто запустить на обработку и получить разделение.

А то, что просит daa2013, т.е. не терять пустышки да еще в две папки раскидывать (ужас!), это больше подходит для меню service, но никак не для импорта. Поймите, цель любого импорта в СК создать задание в идеологии СК (т.е. подложка+зоны), а не просто чего то там вытащить и раскидать.

Автор: TelecomUral, Отправлено:14:18 09-11-2020


Цитата:
зачем опять импорт?

Как зачем. Чтоб не терять исходное расслоение, сделанное кодером дежавю.
Иногда, подтверждаю, именно так хочется сработать, с задниками отдельно от переднего слоя. Прямо напрашивается.


Добавлено:

Цитата:
Не надо, что толку если я не могу воспроизвести.

ОК.
А то например я иначе, чем daa2013, работал, когда улёт получал.


Автор: bolega, Отправлено:18:08 09-11-2020

daa2013
А поправка к порогу бинаризации auto должна быть одна и та же на всех страницах или для каждой страницы должна быть своей?

Автор: daa2013, Отправлено:21:21 09-11-2020


Цитата:
А то, что просит daa2013, т.е. не терять пустышки да еще в две папки раскидывать (ужас!), это больше подходит для меню service, но никак не для импорта.

Хоть тушкой, хоть чучелом, но дайте возможность получить полный комплект передников и полный комплект задников (проапсемпленных до размера передников) без пропусков и потери нумерации страниц.


Цитата:
Поймите, цель любого импорта в СК создать задание в идеологии СК (т.е. подложка+зоны), а не просто чего то там вытащить и раскидать.

Сделайте в визарде импорта джву галочку "DAA-режим" DEE-режим.
И если она включена, то совмещенные изображения сложите в папку входных.
У вас же это сейчас сделано и здорово сделано, если страница белая, то вместо пропуска как раз и генерируется пустышка. Джвудекоде сам так не делает.
Одновременно сделайте папку out , и туда сложите маски, как если бы они были результатами работы СК (и если маски нет, то генерируйте пустышку) , а задники (там, где они есть), проапсемплите до передников и сделайте зонами величиной на всю страницу. Если задника нет, то можно вместо него тут пустышку и не генерировать. Потом СК входит в режим и RV и можно всё редактировать.
Только хорошо бы, чтобы номера этих зон совпадали с номерами страниц, чтобы руками можно было отсортировать, если что.
(А как это сделать без пустышек, пустые зоны генерировать ? Если никак, тогда будет нужен еще и service.)

Да, я понимаю проблему, маска может быть ч/б, раскрашенной через картинку, и раскрашенной как малоцветка. Выкладывать маску как есть: ч/б, полноцветный тифф, индексированный тиф соответственно. Пользователь дальше сам. Делает оут-задание и занимается постеризацией, если хочет.

Upd: и поскольку в джву текст поверх картинок, а не наоборот, то, наверное, в картинках дырки надо прорезать под передник - сгенерировать маску прозрачности.
Upd2: Но тогда уж точно разборка отдельной командой в сервисе будет необходима



Цитата:
А поправка к порогу бинаризации auto должна быть одна и та же на всех страницах или для каждой страницы должна быть своей?


Сейчас я хотел сделать авто + 10.
Но ранее, как описывал, в другом проекте я накладывал условие: если расчетный авто менее 170 или 170, то одна прибавка, если более 170, то другая.
Получается, что у каждой своя, в зависимости от того, что посчитает простое авто.
Т.е. хорошо бы дать доступ к меню условий на прибавки, но до самого расчета.
Ну а СК когда считает, то знает, если авто = X, то делаю Y. (Применяемая авто, это некая функция от расчетного авто, в зависимости от заданных пользователем условий.)

Автор: TelecomUral, Отправлено:09:16 10-11-2020

оффтоп
daa2013
Не парьтесь с разделением djvu на слои. В свежем djvulibre (номер на 27 кончается) в опциях ddjvu появилась -eachpage. Она решает ваш вопрос с пустышками.
Команда такого вот вида:
>"L:\Program Files\DjVuZone\DjVuLibre27\ddjvu.exe" -format=tiff -mode=foreground -verbose -page=274-281 -eachpage primer_fajla\c.djvu _output\j%03d.tiff
для передника и -mode=background для задника. Я проверял на файле Колтуна Мир физики из Новых поступлений publ.lib Всё работает.

Автор: bolega, Отправлено:13:37 10-11-2020

daa2013

Цитата:
Получается, что у каждой своя, в зависимости от того, что посчитает простое авто.

Надеюсь, хоть условие будет одно для всех файлов?

Автор: daa2013, Отправлено:13:47 10-11-2020

Как я работаю, то да, одно.
А там, кто его знает, как другие юзеры захотят работать.

Автор: bolega, Отправлено:14:28 10-11-2020

А вопрос по разделению djvu как я понимаю больше не актуален?

Автор: daa2013, Отправлено:15:02 10-11-2020

Я эту новую утилиту пока не пробовал. Потом напишу.

Но даже если окажется, что она работает как надо, всё равно считаю импорт джву важной штукой.

Автор: niccolo, Отправлено:15:13 10-11-2020

Народ - в отсутствии автосплита при импорте или драфте, есть ли более оптимальный путь обработки разворотов с неодинаковым перекосом страниц и разным уровнем текста на страницах (так, что не получается одним резаком на двух страницах лишнее обрезать) кроме двухэтапной обработки - сначала просто сплит, а потом всё остальное?

Автор: TelecomUral, Отправлено:15:18 10-11-2020

niccolo
дублируйте скан в списке файлов. один дубль одна половина, второй - вторая. По ПКМ на файле есть команда Clone Create a copy.

Автор: bolega, Отправлено:15:51 10-11-2020

niccolo
И если наклонить резак не помогает??

Автор: TelecomUral, Отправлено:15:55 10-11-2020

bolega
для разворота со сканом конца главы, и горизонтальный нижний резак. Он кучу мусора может захватить снизу правой половины, где текста уже нет. Я когда-то прям бесился от невозможности "изогнуть" резак под полезный текст.

Автор: bolega, Отправлено:16:14 10-11-2020


Цитата:
и горизонтальный нижний резак

Так наклоните его. Никогда не встречал скана, в котором бы наклонный резак не мог бы что-то отрезать. За исключением случая, когда на одной половине картинка на всю площадь или впритык к краю.
Если допустить, что все-таки что-то останется, то после обработки можно подправить полезные блоки перед финализацией. Пересчитать размер если понадобится.

Автор: niccolo, Отправлено:16:34 10-11-2020


Цитата:
И если наклонить резак не помогает??


Да не помогает. Второй совет — используйте ластик

В принципе опцию разбивки перед обработкой хотелось бы видеть

Автор: TelecomUral, Отправлено:17:07 10-11-2020

нагляднее пример не смог найти:


Автор: bolega, Отправлено:17:28 10-11-2020


Цитата:
нагляднее пример не смог найти:

На таких книгах обязательно включать correct illumination, safe. И тогда резак ставьте где угодно, черноты не будет.
Кстати, я включаю correct illumination всегда. Кроме белоснежек

Автор: niccolo, Отправлено:19:40 10-11-2020

Второй вопрос - всё забываю спросить

После прогона Кромсатора - можно куда-нибудь вывести информацию по пакету - самые широкие и высокие файлы, средний расчётный размер страницы, чтобы она всегда была где-то - а то после окончания обработки каждый раз где-то помечать проблемные страницы приходится или в скт смотреть.....


Нашел - вопрос снят

Последнее - адаптация интерфейса самой программой для 4-8К разрешения.

Автор: bolega, Отправлено:20:27 10-11-2020


Цитата:
В принципе опцию разбивки перед обработкой хотелось бы видеть

Не понял. Разбивки чего? Если разворота, то разбивают верхние резаки.

Добавлено:

Цитата:
адаптация интерфейса самой программой для 4-8К разрешения.

А что не так?

Автор: niccolo, Отправлено:21:18 10-11-2020


Цитата:
Не понял. Разбивки чего? Если разворота, то разбивают верхние резаки


Разворота. Опционально конечно. Не все же захотят в 2 раза больше страниц обрабатывать. Чтобы после драфта страницы уже были отдельными и дескью (ну примерно как автоматически делить разворот в ФР). При расстановке можно и резаки расставить и дескью проверить.

PS. Серые указатели резаков на сером фоне не самое эргономичная решение, особенно в 4k.


Цитата:
А что не так?


Да мелковат интерфейс в 100%. А смысла от 4к с увеличением в винде - никакого.


Что-можно было бы еще ————— 6.52 вылетает обработка, если по ошибке резак у разворота путаешь с крайним (ну получилось так) (наверное лучше предложить исправить или пропустить проблемный файл)

И какая-то ерунда происходит в следующем случае.

Страница в файле повернута. При преобработке (драфт) - ставим разворот на 90°. Затем в процессе проверки резаков подчищаем на этой странице какой-нибудь мусор ластиком и сохраняем в оригинал, и ...... сохранённая страница и следующая оказываются в непонятной ориентации и масштабе. Во всяком случае у меня так.

Автор: asku, Отправлено:22:26 10-11-2020

Добрый вечер.
Прошу кого-нибудь подсказать, как изменить опции в СК, чтобы как-то улучшить результат. Не могу подобрать.

Было/Стало:



Тест-файл:
https://dropmefiles.com/khprT

Автор: niccolo, Отправлено:00:23 11-11-2020

Еще момент

Страницы - вверху подчёркнутый номер.

При одинаковых настройках выравнивания по верхнему краю - 2, 3,6,9 (круглые вверху) страницы на полцифры заходят за этот край вверх. На страницах с 2-3-значными номерами это не наблюдается.

Bolega - еще один плюс разбивки (или просто я пока не знаю, как обойти) - если при любых настройках при обработке разворота Deskew одну страницу делает хуже чем было (одну или вторую и их надо обрабатывать с разными настройками). Насколько вижу - на полстраницы Deskew не ставится.

Автор: bolega, Отправлено:08:15 11-11-2020


Цитата:
еще один плюс разбивки

В СК такого нет и не будет.


Цитата:
это не наблюдается.

Options > sensitivity увеличьте


Цитата:
Насколько вижу - на полстраницы Deskew не ставится

На полстраницы - нет, на страницу разворота - да

Автор: daa2013, Отправлено:10:42 11-11-2020

Попробовал ddjvu
Действительно, разборка работает как надо.

В батнике вместо одного мне пришлось почему-то ставить два знака %%
Новая джвулибре сносит старую джвулибре, которая СК нужна.
Самая последняя 3.5.27_qt_beta не идёт на XP, но предыдущая 3.5.27 идёт.

Автор: TelecomUral, Отправлено:12:03 11-11-2020


Цитата:
которая СК нужна

да
поэтому я поставил свежую, переименовал ее папку, и поставил старую.

Добавлено:
asku
есть такая опция бинаризации Smooth. Попробуйте ее выставить для bw-zone, которой окружите слабые буквы. Термоядерный вариант.

Автор: asku, Отправлено:13:07 11-11-2020

TelecomUral
На странице ближе к переплету сделать bw-зону с Smooth? Попробую, спасибо.

Автор: niccolo, Отправлено:18:53 14-11-2020

Сижу сползаю со стула

Есть пакет - в котором часть файлов обрезана и в Ч/Б, часть нет, и плавает разрешение. Прогнал на дефолтных настройках AAW всё и заметил следующее:

На некоторых страницах буквы касаются краёв. При обработке с включенной Correct Illumination такие буквы не спасает ничто — они уничтожаются. Почему?

Автор: bolega, Отправлено:19:41 14-11-2020


Цитата:
На некоторых страницах буквы касаются краёв. При обработке с включенной Correct Illumination такие буквы не спасает ничто — они уничтожаются. Почему?


http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=920#8

Автор: niccolo, Отправлено:22:44 14-11-2020


Цитата:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=920#8 [?]



А что за опция и где искать.....


Проблема с повёрнутыми при драфте сканами при подтирании их ластиком и сохранении у вас воспроизвелась?

Автор: asku, Отправлено:23:49 14-11-2020

bolega
Добрый вечер. Вопрос, если позволите.
Расставил резаки во всех страницах (Edit — Draft kromsate...).
На части страницах выравнивание получило значение A (см. рис.).
Вопрос: можно ли сделать так, чтобы все A поменялись на T (то есть выравнивание по верху)?


Автор: niccolo, Отправлено:01:34 15-11-2020

asku

Выберите Т -> ПКМ и применить ко всем

Автор: TelecomUral, Отправлено:04:00 15-11-2020

niccolo
ему не надо ко всем, ему надо - как я понял - фильтр "если стоит А, то поменять его на Т".

Нда, встречаются же задачки

Автор: daa2013, Отправлено:04:20 15-11-2020

Так вроде А - это для вертикали и есть Т.

Автор: TelecomUral, Отправлено:04:44 15-11-2020

daa2013
хм. хороший коммент. Тогда вообще зачем "А". Ставили бы "Т" сразу.

Автор: bolega, Отправлено:09:15 15-11-2020

asku
A == T
В стародавние времена задумывалось что это будут разные значения, но так повелось что это одно и то же.

niccolo

Цитата:
Проблема с повёрнутыми при драфте сканами при подтирании их ластиком и сохранении у вас воспроизвелась?

Правка исходных сканов да еще с ненулевой ориентацией не есть гуд в принципе. Поэтому в новой версии я убираю возможность сохранения исходных сканов.

Автор: asku, Отправлено:09:24 15-11-2020


Цитата:
В стародавние времена задумывалось что это будут разные значения, но так повелось что это одно и то же.


Хорошо, что спросил тут, а то я уже было начал вручную все А менять на Т.


Цитата:
Поэтому в новой версии


А когда ожидается новая версия СК?

Добавлено:
bolega

Еще такой вопрос возник. Нельзя ли добавить в СК такую возможность — обработка с такой-то (конкретной) страницы по такую-то (конкретную) страницу? А не только, как сейчас — напр. обработка с текущей до конца.

Добавлено:
И еще. Не могу добавить к этой функции горячие клавишы. В options-hot keys в списках нет этого пункта, к сожалению.


Автор: TelecomUral, Отправлено:11:09 15-11-2020

asku
по-моему, выделение от-до можно проделать двумя проходами selected. Если, конечно, и bold и selected ещё не используются для иных целей внутри этого диапазона.
Взвести "отсюда-1 до конца" а потом снять "отсюда-2 до конца".

Автор: bolega, Отправлено:14:06 15-11-2020

asku

Цитата:
Еще такой вопрос возник. Нельзя ли добавить в СК такую возможность — обработка с такой-то (конкретной) страницы по такую-то (конкретную) страницу? А не только, как сейчас — напр. обработка с текущей до конца.

Такая возможность и так есть. Выделите начальный файл красным (пробелом или F2). Затем станьте на последний файл нужного диапазона. Нажмите Shift-пробел, выделятся все файлы от предыдущего выделенного до текущего. Задайте обработку selected.


Цитата:
Взвести "отсюда-1 до конца" а потом снять "отсюда-2 до конца".

можно и так. но это дольше

Автор: niccolo, Отправлено:16:55 15-11-2020


Цитата:
Правка исходных сканов да еще с ненулевой ориентацией не есть гуд в принципе.


Не вижу ничего плохого в подчистке штампов библиотек, удалении каракуль, дефектов печати, грязи, которые можно убрать ковровым способом....Проще 1 раз подчистить оригинал, чем проверять 3-й раз - (резаки, до финализации - когда нельзя ничего подтереть и потом подтирать).

По мне - лучше путаницу не разводить - Rotate and save и поворот при предотбработке. Не было бы второго - сделал первое и забыл.

Так а опция защиты краевых букв где?

Играюсь с параметрами. Никогда не задумывался, а сейчас задумался - а как соотносятся флажки в Enhance image - Blur, Sharpen, Smooth c соответствующими вкладками в Gray Enhance

При установке в Contoor smooth SCALE OUTPUT=6 - стабильный Out of memory (памяти хватает)

Автор: bolega, Отправлено:12:37 16-11-2020


Цитата:
Проще 1 раз подчистить оригинал

Штатная работа с оригиналом - через Result > Show source files. Там и нужно редактировать


Цитата:
как соотносятся флажки

никак


Цитата:
вкладками в Gray Enhance

давно нет такого названия.
То, что на закладке Quality, применимо к ч/б и цветным файлам. То, что в окошке image enhence - только к серым/цветным


Цитата:
(памяти хватает)

вам конечно виднее
Есть нужда увеличить dpi в 6 раз?


Автор: niccolo, Отправлено:00:06 17-11-2020


Цитата:
Штатная работа с оригиналом - через Result > Show source files


Оригиналы в Results - несколько неожиданно.


Цитата:
Есть нужда увеличить dpi в 6 раз?


Нет. Есть нужда в понимании того, как работают фильтры, и как на их работу влияет изменение параметров (тем более, что названия у них такие - не отражающие суть).
Памяти 32 GB. Сомневаюсь, чтобы было мало, если конечно SK поддерживает 64 разряда


Цитата:
То, что на закладке Quality, применимо к ч/б и цветным файлам. То, что в окошке image enhence - только к серым/цветным


Речь об исходных ч/б файлах или ч/б после бинаризации?


Автор: asku, Отправлено:10:50 17-11-2020

bolega

Не подскажите, где можно почитать расшифровку ошибок СК? У меня при создании дежавю СК выдал: Encoding Failed (58).

Автор: TelecomUral, Отправлено:12:42 17-11-2020

asku
в логе кодирования ошибки - из подсистем программ кодирования, у СК почти нет своих. Включите подробный уровень лога, и тогда там обычно можно легко всё понять. Где какой этап разборки-сборки и какой модуль на каком скане (файле/зоне) ругнулся что не может его закодить. Прям постранично летит лог и микроэтапы все видны.

Автор: bolega, Отправлено:13:20 17-11-2020

asku

Цитата:
меня при создании дежавю СК выдал: Encoding Failed (58).

По идее эта ошибка вылезла на последнем этапе - сборке итогового djvu из отдельных stepN.djvu. Не фатальная ошибка, возможно даже, что итоговый файл все-таки успешно создался. 58 ошибка возникает, если djvmcvt.exe генерирует сообщение с текстом "Internal error". Что это значит, непонятно. Если djvu в папке не появилось, попробуйте снова запустить сборку. Чтобы собрать итоговый djvu из готовых step, не нужно все кодировать по новой. Достаточно на 1-й закладке Files нажать кнопку Create result djvu.

Добавлено:

Цитата:
Речь об исходных ч/б файлах или ч/б после бинаризации?

Об исходных

Автор: jeremy9621, Отправлено:16:04 17-11-2020

Доброго времени суток. Использую версию СК 6.52 из шапки, при попытке открыть 2 скана получаю ошибку "Access violation at address... at sk.exe". Система Windows 7 SP1 x64, на борту 4GB оперативной памяти. Верно ли мое предположение о нехватке RAM ?
P.s.Файлы цветные и достаточно большие, отсканированы в 300dpi насколько мне известно

P.p.s. Узналось по итогу: СК ругался на турецкую кодировку в названии файла, после смены языка в названии проблемы прекратились.

Спасибо, всем.

Автор: D1D1D1D, Отправлено:02:27 18-11-2020

Есть ли в ResultView возможность вставки черной горизонтальной черты во всю ширину в месте клика?

Автор: TelecomUral, Отправлено:06:31 18-11-2020

D1D1D1D
рисуете один раз черту, делаете из неё глиф, далее вставляете его где хотите и когда хотите по двойному щелчку.

Автор: D1D1D1D, Отправлено:06:47 18-11-2020

TelecomUral
Спасибо. Пробовал делать глиф с перетаскиванием черты) А оказалось, настроить по клику можно)

Автор: asku, Отправлено:10:24 18-11-2020

TelecomUral

«рисуете один раз черту».

А в СК есть средства рисования?

Автор: TelecomUral, Отправлено:11:05 18-11-2020

asku
ластик и заливка контура

Автор: bolega, Отправлено:11:58 18-11-2020


Цитата:
А в СК есть средства рисования?

Включите черный цвет и в режиме зеленой метелки нарисуйте тонкий прямоугольник нужной ширины и нужной высоты (2-3 пикселя?).
Если выйдет толсто, включите белый цвет и выделением срежьте лишнее

Если нужно рисование посложнее, например, наклонную линию, то лучше подключить внешний редактор и вызвать его прямо из RV. Хотя можно и с помощью лассо нарисовать.
Но только не ластиком.

Автор: TelecomUral, Отправлено:12:17 18-11-2020

bolega

Цитата:
Но только не ластиком.

ну почему, закругления на стыках нарисованных прямоугольников и тэ пэ я вполне аккуратно исправлял ластиком. Тоже "средство рисования".

Автор: bolega, Отправлено:13:30 18-11-2020

TelecomUral
Я имел ввиду что протяженные объекты рисовать не стоит, рука дрогнет, ровно не получится

Автор: mais, Отправлено:06:53 19-11-2020

bolega

Цитата:
Я имел ввиду что протяженные объекты рисовать не стоит, рука дрогнет, ровно не получится


Давно мечтаю, чтобы в последующих версиях СК была добавлена возможность рисования прямых линий аналогично GIMP или Photoshop - для получения просто прямых линий, ориентированных в произвольном направлении, нужно нажать Shift, кликнуть ЛКМ мыши на начальной точке линии, отпустить клавишу мыши и не отпуская Shift, переместить курсор в конечную точку линии, далее кликнуть левой клавишей мыши в этой точке.

Автор: shch_vg, Отправлено:01:13 20-11-2020

mais
А как в вашем описании задается толщина линии?

Автор: mais, Отправлено:07:06 20-11-2020

shch_vg
Если вы имеете в виду GIMP или Photoshop, то диаметр инструментов рисования ("Кисти" (Brush Tool) или "Карандаша" (Pencil Tool), например) задаётся на панели инструментов.
Если вы говорите о SK, то можно выбрать одну из трёх форм ластика (rectangle, small rectangle, circle), размеры которых неизменны, и менять масштаб отображения страницы. Такой подход меня в целом устраивает, но иной раз приходится разово редактировать крупные буквы в заголовках или на титульных листах, к примеру, наклонную перекладину буквы "И", и ровно сделать это трудно. Также выше писали о возникшей необходимости в рисовании длинной горизонтальной черты, bolega посоветовал воспользоваться прямоугольным ластиком, но это работает только для горизонтальных или вертикальных линий.

Автор: TelecomUral, Отправлено:08:15 20-11-2020

честно говоря, я не припомню ни единого случая, когда бы мне понадобилось провести наклонную линию. Мало, видимо, с СК возился
Но если уж хочется...
Я бы сделал режим-защёлку: в полигональном выделении если поставить одну вершину, а потом вторую вершину поставить двойным щелчком, то ничего сейчас не происходит - объём выделения "ноль пкс", и оно пропадает. Как-то взводить режим иной обработки такого случая: провести от точки до точки линию. Толщиной из окна "Толщина рамки".
Взводить где-нибудь по ПКМ на кнопке меню, как часто автор делает.

Автор: mais, Отправлено:08:42 20-11-2020

TelecomUral

Цитата:
честно говоря, я не припомню ни единого случая, когда бы мне понадобилось провести наклонную линию

Вы ведь на Youtube сделали хорошее, подробное видео о работе с новым инструментом "Постеризация" в SK. По-моему было бы неплохо получить возможность быстро поправить "лохматые" контуры элементов малоцветного изображения - стрелок каких-нибудь, границ геометрически правильных блоков и т.п. Для перфекционистов

Автор: bolega, Отправлено:09:24 20-11-2020

TelecomUral

Цитата:
Я бы сделал режим-защёлку: в полигональном выделении если поставить одну вершину, а потом вторую вершину поставить двойным щелчком, то ничего сейчас не происходит - объём выделения "ноль пкс", и оно пропадает. Как-то взводить режим иной обработки такого случая: провести от точки до точки линию. Толщиной из окна "Толщина рамки".

Мне понравилась идея.
Сейчас в непубличной версии СК есть возможность рисовать линии. После рисования они ведут себя как объекты, т.е. их можно менять, двигать и т.п. и потом слить с изображением. Регулируется толщина, закругленность концов, стиль линии, стиль заливки, цвет. Код не доделан, когда-то заброшен, поэтому не попал в рабочую версию.
Теоретически можно сделать два режима: мгновенное рисование, как предложил TelecomUral, и через объекты.

Автор: TelecomUral, Отправлено:09:52 20-11-2020


Цитата:
получить возможность быстро поправить

ключевое слово "быстро"
Не уверен я. Чем богаче возможности, тем легче накосячить при их применении. Сколько раз я при тренировочной обработке картинок гробил информацию. И не сосчитать.
Хотите отрисовать векторный малоцветный рисунок - вэлкам в графредактор типа visio, и нарисуйте с нуля. И не ошибетесь, и безупречно будет выглядеть. И крайне быстро. А когда вы пару линий сделаете в СК векторными, а оставшуюся пару оставите исходно-кривенькими - ... Не будет это смотреться.

Автор: TelecomUral, Отправлено:17:27 20-11-2020


Цитата:
мгновенное рисование

можно даже продлить идею на кучу вершин

Автор: bolega, Отправлено:18:36 20-11-2020

TelecomUral

Цитата:
можно даже продлить идею на кучу вершин

Правильно мыслите
Уже сделал. Только без двойного щелчка. Если в момент добавления очередной вершины держать нажатым ctrl, то будет нарисована поли-линия. Либо можно в КМ выбрать команду draw polyline или draw closed polyline. Благодаря КМ команды можно применять к любому выделению, не обязательно в режиме полигонального выделения.

Добавлено:
Сделал кодирование малоцветок в pdf через ч/б раскрашенные слои(маски)

Автор: shch_vg, Отправлено:21:50 20-11-2020

bolega

Цитата:
Если в момент добавления очередной вершины держать нажатым ctrl, то будет нарисована поли-линия

Очень полезная функция!
Обрабатывал в RV газеты, содержащие по несколько прямоугольных блоков разной расцветки. Для минимизации грязи приходилось заливать всю страницу усредненным фоновым цветом, что приводило к порче этих цветных блоков.
Приходилось либо помещать каждый такой блок в зону, либо окаймлять его (блок) черной рамкой. Предложенным способом это можно делать более быстро и удобно.

Автор: asku, Отправлено:22:03 20-11-2020



Делаю зону рисунка с разрешением 600, B/W, порог бинаризации (Thr) перепробовал разные.
Цвет фона в зоне -- розовый, цвет букв на розовом фоне -- черный.
И не получается. В чем я ошибся в опциях?

Тест-файл.

Автор: shch_vg, Отправлено:22:13 20-11-2020

asku
Для зоны нужно давать фон белый, а текст розовый.
Кроме того создать зону вокруг текста с розовым фоном и черным текстом.

Автор: TelecomUral, Отправлено:06:10 21-11-2020

asku
В типе зоны №2 вы ошиблись. Выделен кусок из трех цветов - желтая бумага, розовый фон и черные буквы. А тип зоны вы поставили BW, то есть ДВА цвета. Надо три цвета в зоне - ставьте или original или Few colors. Не BW.
Хотите обойтись двумя цветами, но в прежних габаритах зоны (прямоугольник) - оставляйте черный на основной странице. Красьте ТЕКСТ розовым (чтобы получился из всего розового "черный"). А в пост-обработке просветите черный со страницы в маску. Чтобы он выглядывал в окошечки.

Вот примерно так (видимость зон отключена):



Эти примеры bolega разбирал тут не так уж давно в вопросе про закрашенную таблицу с серым заголовком.
Подробно я разбирал это для Хрестоматии, про перенос маски. Там где красивые объемные рисунки с эллипсоидомгиперболоидом вращения

UPD
Если не получится убрать розовый с основной страницы, тогда введите для его исключения на закладке Binarization bw-zone с иным порогом. Я поставил 100, более-менее вышло.
Но, ИМХО, много проще сейчас, когда есть Posterization, отмалоцветить цветную зону.

bolega

Если в режиме VR Zones пытаться финализировать страницу, возникает access violation. И кнопка режима на панельке меняет свой вид - режим Zones, а кнопка отжата.

Автор: asku, Отправлено:17:19 21-11-2020


Цитата:
Но, ИМХО, много проще сейчас, когда есть Posterization, отмалоцветить цветную зону.


Да, кстати, забыл про малоцветку. Буквально недели две назад смотрел на ютубе видео о пастеризации.
Мне зона 600, B/W нравится тем, что она почти не увеличивает объем конечного дежавю-файла. В малоцветке вроде какие-то нюансы есть -- кажется при создании дежавю надо не забыть где-то указать, что там малоцветка. Надо пересмотреть ролик.

Автор: TelecomUral, Отправлено:17:31 21-11-2020

asku

Цитата:
надо не забыть где-то указать, что там малоцветка

Да, лучше перепроверить в out-task, что на закладочках у малоцветных зон выставлена галка "Few colors coding". По умолчанию всё корректно взводится и автоматом, но мало ли.

Хотя это (кривое кодирование малоцветных зон) и в итоговом дежавю прекрасно видно при отсмотре. Надеюсь, у вас это в привычке, проглядывать детально файл перед публикацией.

Автор: asku, Отправлено:17:36 21-11-2020


Цитата:
проглядывать детально файл перед публикацией.


Готовый дежавю никогда не просматривал Только в процессе подготовки в СК естественно все страницы смотрю.

Автор: TelecomUral, Отправлено:17:41 21-11-2020

asku

Цитата:
Готовый дежавю никогда не просматривал

"слабак!" (с) В бой идут одни старики

Автор: asku, Отправлено:18:09 21-11-2020

TelecomUral

А какие могут быть проблемы в готовом дежавю, созданном в СК? Может быть в таких сложных проектах, как том Большой советской энциклодпедии... Там под тысячу страниц, множество рисунков.

Автор: TelecomUral, Отправлено:18:27 21-11-2020

asku

Цитата:
А какие могут быть проблемы в готовом дежавю, созданном в СК?


ну вот у меня по весне (или летом, не помню) была "проблемка": сканы серые, на них фотки, оставил их серыми зонами. Сделал out-task. Взвелась галка "few colors coding". И вместо серых зон я получил фотки в чанке FGbz. Под три мегабайта на страницу, вместо 150-200 килобайт. Всё беззвучно закодилось, только медленно отработало, но я на это и внимания не обратил. Файл был небольшой по числу страниц, книжечка.
СК не для дураков, и требует от юзера соображения - что он делает. А у меня стояло при создании out-task "переводить зоны в малоцвет если число уровней не более 256". Но в сером-то их как раз 256
Сейчас я поумнел, стоит "не более 16"
Таких ляпов можно наделать массу. Можно слить зоны с текстом (обожаемый многими merge), и визард переведет в дежавю такие страницы в режиме photo (вейвлетами). Тоже будет всё беззвучно.


Добавлено:
UPD
из распространенного:
- задано неверное разрешение, и на 100% масштаба страницы/обложки/вклейки прыгают по габаритам. хорошо видно, к примеру, на книжке Буреева, что я в ролике показывал. Если посмотреть ее последнюю страничку с данными об обработчике, синий текст на белом фоне, то она в масштабе с соседними едва видна. Потому что делал я ее в 100дпи, а закодил ошибочно в 600дпи.
- ляпы обработки фоток, когда по краям вылезает чернота

Автор: bolega, Отправлено:19:00 21-11-2020

TelecomUral

Цитата:
Если в режиме VR Zones пытаться финализировать страницу, возникает access violation

Не смог воспроизвести. Видимо, было хитрое стечение обстоятельств

Автор: TelecomUral, Отправлено:19:45 21-11-2020

bolega
повторил ситуацию access violation таким вот способом:
открыл задание от asku
поменял выходную папку
нажал "обработать данную страницу"
подтвердил расчет габаритов
в VR перешел в режим zones
выбрал вторую зону в области превьюшек
переобработал зону (по ПКМ)
по ПКМ на основном тексте выбрал Finalize


Автор: asku, Отправлено:19:45 21-11-2020


Цитата:
ляпы обработки фоток, когда по краям вылезает чернота


Ну, под картинками черноту я убираю.)

Автор: bolega, Отправлено:00:28 22-11-2020

TelecomUral

Цитата:
повторил ситуацию access violation таким вот способом:

Спасибо, нашел баг

Автор: TelecomUral, Отправлено:09:18 22-11-2020

bolega
а как там с логированным глюком вставки глифа? нашли в чем дело?

Автор: bolega, Отправлено:11:38 22-11-2020

TelecomUral
Версия с логированием еще не готова. А у меня глюк никогда не проявлялся

Автор: bolega, Отправлено:14:23 22-11-2020


Цитата:
а как там с логированным глюком вставки глифа?

разослал новую версию для тестирования.
Если будет вылет глифа, просьба вызвать КМ кнопки paste и там выбрать команду paste log. Скопировать текст из окошка нажав Ctrl-Enter

Автор: TelecomUral, Отправлено:16:11 22-11-2020

bolega
никакой текст из никакого окошка не копируется:


Автор: bolega, Отправлено:17:33 22-11-2020

TelecomUral
Да, в XP такого еще не было. Возможность копирования диалогового окошка появилось начиная с win7
Пока удалил версию. К сожалению, в этом году уже не смогу выпускать новые релизы. Постараюсь вернуться к СК в январе.


Автор: TelecomUral, Отправлено:17:40 22-11-2020

но скриншот помог?

Автор: bolega, Отправлено:18:06 22-11-2020

Был улет?

Автор: TelecomUral, Отправлено:18:09 22-11-2020

а чего б я полез скриншот публиковать. Был. В слове вставлял на место первой буквы "а", а вставка попала на вторую "д", пару букв вправо.

Автор: bolega, Отправлено:18:24 22-11-2020

ОК, беру таймаут для анализа

Автор: TelecomUral, Отправлено:19:41 22-11-2020

оффтоп

Цитата:
Да, в XP такого еще не было.

А вот интересная штука с копированием информации: это всплывшее окошко нельзя скопировать даже выделением текста. А например в стандартном виндовом окошке "Свойства папки" некоторые текстовые поля скопировать можно: выделил
C:\Documents and Settings\All Users\Desktop

Это нельзя ли использовать при создании вашего окна?

Автор: asku, Отправлено:19:55 22-11-2020

TelecomUral
В видео о пастеризации упоминаются эти две галочки.



А если эти галочки ставить всегда, вне зависимости от того, есть ли в проекте малоцветка или нет, что будет плохого?

Вот доделал книгу, применив малоцветку, если интересно:
Книга в дежавю-фрмате

Автор: TelecomUral, Отправлено:20:11 22-11-2020

asku
"не ходите, дети, в Африку гулять"
Откуда я знаю, что может быть плохого. Смотря какая книга, какие методы обработки, какая цель. У меня эти галки всегда и взведены. Пока полёт нормальный.

Автор: asku, Отправлено:21:16 22-11-2020

TelecomUral

Тогда наверное это больше вопрос к Болега. Раз галочки можно убирать, значит это для чего-то сделано... )

Автор: bolega, Отправлено:10:31 23-11-2020

Наличие галочек при отсутствии малоцветок просто увеличит время создания out-задания. Т.к. СК будет загружать каждую зону и считать сколько цветов в ней. Если зон сотни, это займет немало времени

Автор: TelecomUral, Отправлено:06:32 24-11-2020

Что-то тут дурная мысль в голову пришла. В связи с частной перепиской с daa2013 по поводу автоглифов.
Подсвечивать символы на грани опознавания. Это и будут "плохие буквы". Хорошие и кодер опознает, чего их менять. А вот показывать "вроде бы это "а", но автомат не уверен, проверь-ка глазами" - может и толковая идея.
Или её кто-то уже озвучивал?
Как я понимаю, алгоритм сравнения можно извлечь из кода jbig2enc, там вроде коэффициент похожести выдается. Набрать в таблицу глифов символы, а потом запускать процесс "для данного глифа поищи-ка мне на странице неуверенно опознанные". Прощелкал их мышкой "да, это тот символ", а не прощёлкал - не трогать.

Автор: bolega, Отправлено:10:40 24-11-2020

TelecomUral

Цитата:
Или её кто-то уже озвучивал?

Вы первый

Цитата:
алгоритм сравнения можно извлечь из кода jbig2enc

Насколько я знаю, в самом jbig2enc никаких алгоритмов нет, весь полезный код берется из лептоники.

Автор: asku, Отправлено:12:01 24-11-2020


Цитата:
Цитата:
меня при создании дежавю СК выдал: Encoding Failed (58).

bolega: По идее эта ошибка вылезла на последнем этапе - сборке итогового djvu из отдельных stepN.djvu. Не фатальная ошибка, возможно даже, что итоговый файл все-таки успешно создался. 58 ошибка возникает, если djvmcvt.exe генерирует сообщение с текстом "Internal error". Что это значит, непонятно. Если djvu в папке не появилось, попробуйте снова запустить сборку. Чтобы собрать итоговый djvu из готовых step, не нужно все кодировать по новой. Достаточно на 1-й закладке Files нажать кнопку Create result djvu.


Добрался я до другого компа, на котором у меня эта ошибка получилась.
СК сделал файл step3.djvu.bak. Я нажал на на закладке Files кнопку Create result djvu. Дежавю был создан, но часть страниц в файле пустые.

Автор: bolega, Отправлено:12:04 24-11-2020

Версия DjvuLibre точно та, которую требует СК?
Причина может быть также в рассинхроне задания и ранее сделанных step.djvu.
Т.е. что-то поменяли в задании (свойства зон, перетасовали файлы и т.п.), а привязку к шагам или регенерацию например step2/step1 не сделали. В итоге реальная разбивка файлов по шагам не соответствует текущим step.djvu

Автор: TelecomUral, Отправлено:14:25 24-11-2020


Цитата:
в самом jbig2enc никаких алгоритмов нет

вспомнил: это truf рассказывал в ветке про minidjvu mod

Автор: asku, Отправлено:17:44 24-11-2020


Цитата:
Версия DjvuLibre точно та, которую требует СК?


Может в этом дело. Посмотрю версию DjvuLibre, когда буду за тем компом снова.

Автор: Ladina, Отправлено:20:26 24-11-2020

Поможете разобраться почему не открывается пдф в Сканкромсаторе?
https://we.tl/t-TctqJSZY7Y Спасибо

Автор: TelecomUral, Отправлено:20:33 24-11-2020

Ladina
символ диакритический в имени. Переименуйте.

Автор: asku, Отправлено:22:46 25-11-2020

Добрый вечер.
Понимаю, что вопрос этот скорее всего не раз обсуждался, но искать долго. Подскажите, пожалуйста.



Уже обработал и финализировал все страницы в проекте и тогда увидел, что поля выставлены были (70 пикселей) слишком маленькие. Как-нибудь можно увеличить поля на уже финализированных страницах?

Автор: useretail, Отправлено:03:36 26-11-2020

TelecomUral
Шутите? Это-же банальный баг. Попросите bolega пересобрать с поддержкой UTF-8



Автор: TelecomUral, Отправлено:04:37 26-11-2020

asku
сделайте очередной out-task и проведите там обработку с нужными полями. СК сконструирован так, что может выходные файлы принять на вход. Что расширяет возможности.

Автор: daa2013, Отправлено:08:06 26-11-2020

Пришла в голову следующая идея в развитие идеи TelecomUral.

Ведь что я делаю, и почему работаю с глифами в режиме подсветки.
Настраиваю такой размер спеклов, чтобы выделялись красным разорванные буквы, а потом ищу их, и заменяю на правильные.

Если тессеракт выдал координаты ячеек букв, то наверное можно и определять, красная она там, в этой ячейке, или нет. (Да просто наличие и размер спеклов в ячейке посчитать). А потом уже перемещаться между ячейками, где есть красные буквы (спеклы размером меньше заданного порога).
Тогда то, что я глазами ищу, прога сама за меня бы делала и мне в центр экрана подсовывала.
(Хорошо бы в режиме подсветки и, возможно, с выделением пунктирчиком расчётных контуров ячеек).

Добавлено:
Да, хотел-то я о другом совсем написать.

У меня возникла такая странная потребность. Не знаю, можно ли такое сделать в СК.
У меня есть два глифа: толстая версия буквы "м" и тонкая версия буквы "м".

Нельзя ли как-то автоматически получить из них среднюю по толщине версию буквы "м". ?




Автор: asku, Отправлено:12:58 26-11-2020


Цитата:
Версия DjvuLibre точно та, которую требует СК?
Причина может быть также в рассинхроне задания и ранее сделанных step.djvu.
Т.е. что-то поменяли в задании (свойства зон, перетасовали файлы и т.п.), а привязку к шагам или регенерацию например step2/step1 не сделали. В итоге реальная разбивка файлов по шагам не соответствует текущим step.djvu


Версия DjvuLibre нормальная — _3_5_25_3.
Все равно ошибку выдает.




Автор: bolega, Отправлено:13:01 26-11-2020

asku

Цитата:
Уже обработал и финализировал все страницы в проекте и тогда увидел, что поля выставлены были (70 пикселей) слишком маленькие. Как-нибудь можно увеличить поля на уже финализированных страницах?

Можно.
Откройте основное задание (не out-task)
Result > Resize output files.
Там два режима: либо добавлять заданные поля, либо увеличить до нужного размера с учетом выравнивания, заданного там же или взятого из опций каждого файла (align option).
Изменять можно не все, а для выбранного диапазона.
Не помню только, что будет с зонами, по идее СК должен сделать корректировку основного задания, чтобы после манипуляций зоны на выходе правильно размещались. Поэтому не забудьте его сохранить под новым именем. Out task надо будет после этого перегенерировать.

На всякий случай перед этим сохраните папку out.
Мало ли

Добавлено:

Цитата:
Все равно ошибку выдает.

Вы делали Run all steps?

Автор: asku, Отправлено:13:09 26-11-2020


TelecomUral

Цитата:
сделайте очередной out-task и проведите там обработку с нужными полями. СК сконструирован так, что может выходные файлы принять на вход. Что расширяет возможности.


Делаю новый out. Потом Process — All. Все файлы по-быстрому обрабатываются и... А после обработки, в out'е пункт меню Process — Finalize не доступен.

Добавлено:

Цитата:
Вы делали Run all steps?


Конечно. Эту кнопку же всегда надо нажимать, и после ее нажатия начинается создание дежавю-файла.

Автор: bolega, Отправлено:13:18 26-11-2020


Цитата:
Finalize не доступен.

Page width во что выставлен? Если в None, то СК поля вообще игнорит.

файл 0024 ему не нравится. Что там с ним, по скриншоту не видно, какой он и к какому шагу привязан.
Проверьте файл step2.djvu, все ли там страницы
Опции step2 меняли? Не вижу их чтобы судить

Автор: TelecomUral, Отправлено:13:22 26-11-2020


Цитата:
А после обработки, в out'е пункт меню Process — Finalize не доступен.

по мне так ничего страшного, если при этом поля стали правильные.

Автор: asku, Отправлено:17:48 26-11-2020

Чтобы увеличить поля на страницах проекта после финализации:
1. Создаю out.
2. Выставляю нужные поля (200/170).
3. Process — All.
4. См. рис.


Автор: TelecomUral, Отправлено:18:14 26-11-2020

asku
не вижу пункта "отмаркировал файлы кнопкой"

Автор: bolega, Отправлено:18:28 26-11-2020

asku
Есть такой нюанс: в out task выключены все automargins. Это равносильно page=none. Такой вариант я никогда не рассматривал, поэтому баг вылез.
Сделайте так: включите на всех страницах automargins (через Ctrl). Затем обязательно отключите все под-опции automargins (т.е. L,R,T,B) , тоже на всех страницах. Тогда все получится.

Автор: asku, Отправлено:19:15 26-11-2020


Цитата:
Сделайте так:...


Сделал. Получилось. Спасибо. Правда, не понял всех этих нюансов. Столько их в СК...

Автор: daa2013, Отправлено:04:51 27-11-2020

Мне кажется, я уже об этом где-то писал.
Но, возможно, что и не в этой ветке.

Одной из тех немногих операций, которые я не могу сделать в СК, и за которыми мне приходится лезть в БукРесторер или РастерИД - это утоньшение для ч/б изображений.

Было бы полезно встроить такой фильтр.

Автор: TelecomUral, Отправлено:05:21 27-11-2020

daa2013
это "минус пиксель на контуре" ?

Автор: daa2013, Отправлено:06:15 27-11-2020

Я так когда-то это называл: "утоньшение на пиксель".

Но, строго говоря, они снимают больше, чем пиксель. БукРесторер так точно.
Мне приходится делать апскейл, потом утоньшать, потом субсемплить обратно.

У букресторера команда "thinning/thickening" сидит почему-то там, где конволюционные фильтры (включая задание пользовательского ядра). Изображение нужно еще сначала из ч/б в RGB перевести. Потом обратно бинаризовать. Работает и с полноцветными изображениями.

В РастрИД команда "утоньшить" работает сразу с ч.б., а с цветным как раз нет. Есть опция число проходов и "утоньшение до скелета". Тут, видимо, морфологический фильтр. Снимает по пикселю с каждой стороны. То есть, была линия толщиной 3 пикселя, станет 1.
(Плюс снизу и сверху снимает, так что на углах еще больше сожрётся.)


Автор: bolega, Отправлено:08:34 27-11-2020

daa2013
Неужели есть программы, которые утоньшают на нечетное количество пикселей?
Если например взять 1 пиксель, то откуда она знает, с какой стороны убрать пиксели: слева или справа, сверху или снизу. Мне кажется, такого не бывает. Утоньшение не может отличать стороны, оно реагирует на контур, а он для всякой линии или фигуры замкнутый, поэтому снять можно только четное количество. Исключение только если толщина фигуры уже 1 пиксель.

Автор: TelecomUral, Отправлено:08:50 27-11-2020

bolega
допустим, делит область (контур, фигуру) пополам, слева отъедает пиксель, справа нет. Учитывает кривизну.

Автор: bolega, Отправлено:09:20 27-11-2020

TelecomUral
Покажите на примере буквы "Я"

Автор: TelecomUral, Отправлено:09:32 27-11-2020

bolega
алгоритм.
бежим построчно. переход Б-Ч учитываем, Ч-Б не учитываем
бежим постолбцово. аналогично.
к диагональным местам - где переходы начнут друг другу противоречить - применяем матрицу такого же типа, слева-сверху на справа-вниз одно правило, справа-сверху на слева-вниз другое правило.

Проканает? Я от балды писал, но сходу проблем не вижу. Глаз может так усреднить, значит и комп может.

Автор: bolega, Отправлено:09:38 27-11-2020

TelecomUral
бред Возьмите букву с серифами. Подобное утоньшение уничтожит их с одной стороны, оставив с другой. Всякое утоньчение контура должно быть симметрично!

Добавлено:
Еще нужно понимать, что понятие лево/право условно. На самом деле изображение это 2D объект, в котором любое направление равнозначно, изотропно. И алгоритмы должны быть соответствующие. Иначе например, точка, если ее отгрызать с одной стороны, превратится во что то кривое сплющенное. Но это не утоньшение, это какая-то однобокая калечащая эрозия. Кстати, яблоко вместо симметричного огрызка превратится в эмблему известной фирмы.

Автор: daa2013, Отправлено:10:23 27-11-2020


Цитата:
Неужели есть программы, которые утоньшают на нечетное количество пикселей?


Выше описал, как достигаю желаемого эффекта, когда утоньшение визуально сильнее, чем мне нужно: апсемплинг - утоньшение - субсэмплинг
Чаще юзаю Букресторер, там еще накладывается конвертация bw - rgb - bw, так как в отличие от РастерИД, судя по всему, там не морфологический, а конволюционный фильтр.


Я пиксели особо не считал. И удалять ровно один пиксель с одной стороны мне тут, наверное, не критично. РастерИД отгрызает пиксель со всех сторон, вот я так эту операцию и называл.





Цитата:
Всякое утоньчение контура должно быть симметрично!


В данном случае это компенсация некоего искажения, которое вполне может быть и несимметрично.

Кроме того вопрос встает и для букв с дырками - снимать ли внутренний контур внутри дырки ? Снимать - сильнее утоньшается. Не снимать - буква будет выглядеть более толстой.

Двигаться слева-направо (игнорировать движение верх-низ) - значит сохранять перемычки в н, п


Так что если встраивать морфологический фильтр, то, наверное, можно юзерам дать какие-то опции поиграться, чтобы понять как оно полезнее работает.

Но у Букресторера не морфологический, так что стоит оба сделать.



У меня нет готового ответа, как надо делать.
Я просто знаю, что если у меня возникает такая проблема (утоньшения), то методом пляски с бубном не в СК я ее решаю.

Автор: bolega, Отправлено:11:08 27-11-2020

daa2013

Цитата:
так что стоит оба сделать.

Хорошо хоть, что не "обязан сделать". В последнее время вы часто стали упрекать меня, что я игнорирую ваши хотелки. Ваши пожелания стали носить характер чуть ли не требований. Напомню, что я никому ничего не должен, и не могу все время заниматься только СК. В последнее время стало слишком много хотелок, над которыми нужно работать месяцами. Но мне еще кормить семью надо!

Автор: daa2013, Отправлено:11:41 27-11-2020

Нет, нет. Вы меня неправильно поняли/считали интонацию.

Я вообще вас ни в чем не упрекал.
Так. Осторожно напоминал.

Идеи, какие мне в голову приходят, я сюда записываю, чтобы они на будущее не потерялись.
Лично же меня и так вообще всё устраивает.

Автор: TelecomUral, Отправлено:12:19 27-11-2020

оффтоп
bolega

Цитата:
На самом деле изображение это 2D объект, в котором любое направление равнозначно, изотропно. И алгоритмы должны быть соответствующие.

"На самом деле" никаких объектов не существует. Это всего лишь нули и единички для цифровой аппаратуры.
Так что учитывайте - хотя бы - что мы тут читаем слева-направо.
А для китайских вертикальных иероглифов вполне можно предусмотреть вариации точки старта.

+
Напомню, что когда было нужно, вы вполне себе выбирали где какую строчку в фильтре доставить/обрезать Снизу и справа, помнится, полоска у зоны возникала.


Цитата:
Подобное утоньшение уничтожит их с одной стороны, оставив с другой.

и что с того? Любой фильтр в СК может принести пользу, а может раскурочить скан/зону просто в хлам. На то и юзер.

UPD
и вообще, всё что я про фильтр писал - было писано, убегая в библиотеку, и по наитию
Хотя идея не моя, я где-то про такую обработку изображений читал, в советского периода переводной литературе. Какой-нибудь "Хьюлсман" и тэ пэ.

Автор: asku, Отправлено:21:42 28-11-2020

bolega

Такая идея возникла. Может быть трудно реализуемая на практике.

Сейчас при вставке глифов можно воспользоваться опцией Auto adjust position. То есть пользователь в панели глифов двойным щелчком активирует глиф , который он хочет вставить, и при вставке глифа программа как-то сама высчитывает точное место вставки. Очень удобно.
А можно ли было бы реализовать такую фишку — пользователь делает двойной щелчок на месте заменяемого глифа НЕ АКТИВИРУЯ предварительно глиф из панели; программа сама бы выбирала из имеющихся на панели глифов наиболее близкий по форме, очертаниям?.. Ведь при включенном Auto adjust position СК как-то высчитывает очертания глифа.

Это бы существенно увеличило скорость работы. Пользователь бы не отвлекался на активирование нужного глифа на панели. Только бы щелкал в место, куда надо поместить глиф.


Автор: D1D1D1D, Отправлено:02:20 02-12-2020

Обрабатываю словарь с двумя колонками, и что-то много получается страниц, на которых перекос скана недоустранён. Можно ли автоматизировать исправление этого?

Автор: shch_vg, Отправлено:12:55 02-12-2020

D1D1D1D

Цитата:
Можно ли автоматизировать исправление этого?

Попробуйте включить Ortho, правда тогда изначальная кривизна проявится по горизонтали.

Автор: bolega, Отправлено:13:18 02-12-2020

D1D1D1D
Попробуйте режим art включить.

Автор: shch_vg, Отправлено:21:18 02-12-2020

bolega

Цитата:
Попробуйте режим art включить.

А у меня почему-то Ortho выравнивает лучше подобные сканы.

Автор: VadimirTT, Отправлено:21:51 02-12-2020

Да, на самом деле, выравнивание при многоколоночной вёрстке, часто приносит много проблем.

Автор: D1D1D1D, Отправлено:03:44 04-12-2020

Почему когда по CTRL или ALT во вкладке "C.Smooth", пытаюсь опцию "Gentle smooth" назначить всем страницам — этого не происходит?

Автор: asku, Отправлено:17:09 04-12-2020


Цитата:
пытаюсь опцию "Gentle smooth"


А что дает эта опция?

Автор: D1D1D1D, Отправлено:18:42 04-12-2020

asku
Как я понял из обсуждения выше — она применяет возможности C.Smooth, не только к крупным буквам.

Автор: asku, Отправлено:20:27 04-12-2020


Цитата:
она применяет возможности C.Smooth, не только к крупным буквам.


Я помню, что Болега написал, что эта опция (галочка) всегда может быть включена. Но что конкретно она делает неясно. Посмотрел в руководствах -- никакой информации.

Автор: TelecomUral, Отправлено:08:14 05-12-2020

asku

Цитата:
Посмотрел в руководствах -- никакой информации.

имеете шанс вписать себя в историю Провести эксперименты и дать текст.
what's new.txt файлик в комплекте СК много чего упоминает и объясняет.

Автор: bolega, Отправлено:09:26 05-12-2020

gentle так называется, потому что выполняет не сильное (деликатное), сглаживание.
Для его использования не нужно включать опцию contour smooth

Автор: bolega, Отправлено:21:22 11-12-2020

D1D1D1D

Цитата:
Почему когда по CTRL или ALT во вкладке "C.Smooth", пытаюсь опцию "Gentle smooth" назначить всем страницам — этого не происходит?

Серьезный баг. Вместо gentle может скопироваться случайно выбранная опция
Для клонирования опции пользуйтесь контекстным меню этой опции.

Автор: anion23, Отправлено:20:32 12-12-2020

Уважаемые специалисты-кромсаторы! Если у кого-то из вас найдется немного свободного времени, я был бы очень благодарен за помощь в подборе оптимальных настроек SK для обработки скана книги 30-х годов. Скан делал не я, поэтому возникли проблемы с качественной обработкой. Я сканирую в градациях серого с разрешением 600 dpi, и под свои сканы мне удалось нормально настроить SK для получения качественного результата (благодаря выложенным в шапке мануалам). Однако этот скан сделан цветным, с разрешением 300 dpi и пожат в jpg.
Возможно, вы сможете порекомендовать подходящие настройки, поскольку у меня не получается нащупать оптимальный режим обработки. Вот примеры страниц: https://anonfiles.com/zfLfm9ybp4/scan_zip

Автор: shch_vg, Отправлено:02:33 13-12-2020

anion23
В вашем сообщении присутствуют два субъективных понятия: " оптимальный режим обработки" и "качественная обработка" - у каждого свои представления об этом.
Я бы остановился на понятии "приемлемая".
Для этого пометьте в СК ваши три скана (слева внизу правая пиктограмма),поставьте на закладке Page в параметр Despeckle галку, на закладке Binarization для всех сканов Auto, на закладке Options параметр Despeckle=Fine и на закладке Files параметры DPI=600 и Color=B/W.
Если текст устраивает (а он будет приемлемым), занимаетесь далее резаками, автомарджином, дескью и т.п.

Автор: anion23, Отправлено:10:19 13-12-2020

shch_vg
Спасибо за ответ! Я, помимо описанных вами настроек, еще лез в раздел Quality и игрался с настройками улучшателей изображения. Результат получался в основном такой: https://anonfiles.com/5a82wcy0p2/result_zip
Просто обработать сканы без настроек Quality не пробовал, спасибо за наводку.
А как бы вы обработали такой скан при условии, что нет возможности пересканировать нормально и хочется выжать максимум качества? Или в данном случае это невозможно?

Автор: shch_vg, Отправлено:21:41 13-12-2020

anion23
Опять вопрос о субъективности.
Мне приходилось обрабатывать гораздо худшие сканы.
Эти же я считаю вполне приемлемыми для обработки, и приведенных мной параметров вполне достаточно, чтобы получить нормально читаемый вариант.
Какие-то дальнейшие улучшения это чисто по вкусу обработчика.

Автор: anion23, Отправлено:23:44 13-12-2020

shch_vg
Ясно, спасибо!

Автор: daa2013, Отправлено:16:29 19-12-2020

Прошлый раз я писал о том, что если есть ячейка буквы, и в ней опознаны спеклы заданного размера, то можно эту ячейку подсовывать пользователю и и предлагать на замену букву, которой сделан OCR в ячейке.

Сейчас вожусь с разрушенными буквами, и меня осенило, что это тоже можно автоматизировать.

"Разрушенная буква" - это такая буква, часть которой не пропечаталась. Т.е. это не оторванный спекл, а как бы понадкусанная буква или буква с проплешинами.
Что можно сделать:

а) есть ячейка и распознанная буква в ней.


б) рассчитать некий коэффициент полноты, то есть:

Х = число пикселей в ячейке/число пикселей сопоставленного это букве глифа.

и если он вышел за заданный пользователем порог, то подсовывать ему эту ячейку для обработки и контролируемой замены глифа, предлагая ему это глиф.


в) часто я правлю такие глифы не путем замены на идеальный, а путем вклеивания более тонкого глифа в режиме транспарентности белого. Так буквы получаются естественнее. (Толщина и плотность букв на станицах могут гулять. И мой "идеальный" может смотреться где-то тонковато, а где-то толстовато. ). Соответственно при режиме автоподсказки по глифам (который когда-нибудь, возможно, появится) хорошо бы дать опцию перевода всей работы в режим транспарентности.
Возможно, дать два набора букв. Один для расчета коэфф. Другой для замены.
(с разных закладок/страниц библиотеки глифов их брать)

Автор: TelecomUral, Отправлено:07:45 26-12-2020

Что-то не получается у меня использовать кнопку визарда дежавю "Create result djvu".
Дочистил мусор на чб странице (в основном задании), пересобрал step2. По времени создания смотрю - да, он новенький. Жму вышеуказанную кнопку - а она мне подсовывает старый файл.
Прикольнее всего, что даже если я меняю имя файла, то он генерируется со старой датой

Автор: bolega, Отправлено:10:54 26-12-2020

TelecomUral
А step1 и step3 отсутствуют?

Автор: TelecomUral, Отправлено:11:45 26-12-2020

в обработке два скана, оба на step3 приписаны. Файл step3 конечно есть.


Добавлено:
bolega
И большое спасибо за инструмент Soft brush. Я наконец добрался его опробовать - мне понравилось. Края рисунка слегка размываются, и вид более приятный глазу.

Автор: bolega, Отправлено:12:28 26-12-2020


Цитата:
Файл step3 конечно есть.

Если переделали step2, то переделка step3 обязательна. При наличии step3 в result берется именно он, т.к. step3=step2+зоны, т.е. это следующая стадия
Напомню, что кодируется на
STEP2: ч/б страница + ч/б зоны (раскрашенные, а также special с опцией separate b/w-coding). При этом раскрашенные bw кодируются, но пока не раскрашиваются. И они кодируются вместе со страницей, т.е. с использованием общего словаря. Special separate b/w-coding кодируются раздельно от страницы и затем полученный чанк встраивается в чанк страницы.
STEP3: цветные зоны (МПФ) целиком, few-color-зоны целиком (losseless), а также добавляется цвет для раскрашенных bw зон. Входным файлом для step3 является файл step2.djvu.
Result djvu = step3.djvu+вклейка на свои места страниц из step1.djvu и step4.djvu

Автор: TelecomUral, Отправлено:13:16 26-12-2020

аа

Автор: DmitryKz, Отправлено:12:45 27-12-2020

Подскажите, ошибка это в SK или я что-то не так делаю:
Picture-зона BW, 600dpi, задан цвет фона. Создаю на ней рамку с помощью Draw frame, внешнюю белую область выделяю и делаю White transparent. Таким образом, содержимое рамки окрашено в какой-либо цвет.
Финализирую, затем out-task и генерируется pdf-файл.
При импорте такого pdf-файла в FR, страница, на которой имеется созданная вышеописанным способом рамка, не открывается и не обрабатывается — в области ее просмотра FR пишет:
"Image size exceeds limits (32512 x 32512)"

Задание: https://yadi.sk/d/cmCfrA2DP_jPAw

Автор: TelecomUral, Отправлено:15:36 27-12-2020

DmitryKz
В ФР8 открылось и распозналось.

Автор: DmitryKz, Отправлено:15:49 27-12-2020


Цитата:
В ФР8 открылось и распозналось.

С FR8 могу подтвердить, что открывается.
Но я пользуюсь FR14 (лицензия) и там вот такая бяка (в FR15 вроде также, но наверняка не скажу — под рукой сейчас FR15 нету).

Автор: TelecomUral, Отправлено:16:22 27-12-2020

DmitryKz
Тю. Зачем тогда тут спрашивать, пошлите в абби, в поддержку.

Автор: DmitryKz, Отправлено:16:29 27-12-2020

TelecomUral
Здрасте
Если программа пишет, что размеры изображения в файле, полученном из СК, превышают лимит, значит она видит его таким по каким-то причинам. Т.е. не исключено, что СК не добавляет информацию о размерах изображения, и FR берет, скажем, произвольно какие-то максимальные значения — это может быть следствием изменения алгоритма парсинга pdf, ужесточением проверок корректности файла.
Я же не о любом файле, загружаемом в FR спрашиваю — а о файле, полученном из СК.
А здесь только автор СК может внести ясность, а никак не вы.

Автор: TelecomUral, Отправлено:17:23 27-12-2020

DmitryKz
Именно что здрасьте. восьмерка-то берет pdf. Ни один вьювер из четырех, что я использую, также не ругается на ваш файл.

Итого разница не внутри СК, а внутри алгоритма ФР. К кому вопросы, как не к разрабам ФР. Один и тот же файл два алгоритма, писанных одной командой, разбирают по разному. Вопрос к алгоритмам или к файлу - ? Ну не однозначно ли к алгоритмам? А вы спрашиваете bolega - "а подстроились ли вы под алгоритмы нового ФР?" Вы ещё потребуйте соответствующего тестирования от него

Я не защищаю bolega, моя цель - спрямить вам дорогу к правде.

upd
вот если бы вы сначала послали файл в абби, получили от них ответ " ваш pdf некорректен в таком-то месте" и написали тут "bolega, поправьте генерацию pdf, у вас ошибка потому-то и потому-то". Тогда другое дело.

Автор: DmitryKz, Отправлено:17:47 27-12-2020


Цитата:
А вы спрашиваете bolega - "а подстроились ли вы под алгоритмы нового ФР?"

Ну вот давайте вы все же не будете додумывать о чем я спрашиваю.
Мой вопрос был прост: "ошибка это в SK или я что-то не так делаю". Иными словами я вовсе не исключаю, что дело не в СК и тем более не прошу его автора что-либо сделать или починить.

Логические рассуждения ваши могут также быть однобокими, как и мои.
Я в свою очередь исхожу из того, что все файлы, созданные СК, ФР открывает вполне себе успешно. Но на страницах, где был применен White transparent, происходит упомянутая выше ошибка — и это единственная ошибка, с которой я столкнулся, работая со сгенерированными СК пдфками.

Поэтому я вполне могу посчитать, что СК тут отработал некорректно.
И поскольку оба варианта могут быть — ошибка в СК, или в ФР — таким и был мой вопрос. С этой позиции, как мне думается, неважно, кого спрашивать первым: автора СК или поддержку ФР. Потому что, уверен, если bolega будет несложно ответить — он вполне может это сделать и даст более устраивающий меня ответ, будучи автором СК.

В общем, я вполне допускаю, что вы правы — но дождусь ответа bolega, ежели таковой последует.

Автор: bolega, Отправлено:17:52 27-12-2020


Цитата:
Т.е. не исключено, что СК не добавляет информацию о размерах изображения

Какой бред...
Если бы не было информации о размерах, ни один вьюер не смог бы показать его. По факту акробат и даже сам FR прекрасно открывают и абсолютно правильно отображают его! Проблема начинается у FR когда нужно сохранить как word. Проверил на лицензионном FR15 - та же ошибка что и у вас.
Я даже знаю в чем проблема. 99,99% баг FR. У вас там раскраска фона. СК такую раскраску фона кодирует в pdf, помещая в pdf изображение размером 1х1 пикселя, растягивая его на нужную площадь и тем самым используя его как фон. Все по стандарту, но почему FR не может справиться с таким простым и в общем то штатным случаем, нужно спрашивать у них. Я даже ради интереса поменял код в СК, используя вместо 1х1 изображение 2х2. Результат тот же. Можно поэкспериментировать увеличивая размер, но мне это не интересно. Скажу точно, что если размер фона сделать равным размеру картинки, то тогда FR все прекрасно делает. Чтобы сейчас сделать это, нужно для раскраски задать градиент, но 2-й цвет сделать равным первому, т.е. по факту градиента не будет. Это по сути рабочий костыль для вашего случая

Автор: DmitryKz, Отправлено:18:01 27-12-2020


Цитата:
Какой бред...

Вполне возможно — я не знаю, как устроен формат pdf, поэтому озвучил первую возникшую идею, так как также не мог бы поверить, что ФР не может справиться с простейшими случаями.
За совет с костылем спасибо — обращаться в поддержку не буду, так как обычно это редко каким-то полезным телодвижением со стороны Abbyy заканчивается. Тем более 14-ю версию уже точно никто не будет исправлять.

Автор: bolega, Отправлено:18:07 27-12-2020


Цитата:
Но на страницах, где был применен White transparent, происходит упомянутая выше

Думаю, это ни при чем. Проблема не в том, что pdf после СК некорректен (ведь все этот pdf успешно отображают), а в том, что FR не может адекватно воспроизвести фичи pdf (в данном случае раскраску фона) при его конвертации в ocr-формат. Возможно, FR и в страшном сне не мог предвидеть ситуацию, когда ему дают распознать картинку размером 1х1 и он уходит в переполнение или что-то в этом роде. А может ему не нравится что изображение растягивается на площадь, большую на один-два порядка чем размер этого изображения. ХЗ.


Автор: niccolo, Отправлено:23:15 27-12-2020

DmitryKz

15 из местных портабл без проблем открыла pdf из пакета, распознала и сохранила в Ворд.

А то что толку от поддержки Абби, как от козла молока - это точно.

Автор: TelecomUral, Отправлено:09:28 28-12-2020

сильный оффтоп

Цитата:
А то что толку от поддержки Абби, как от козла молока - это точно.

писать надо продажникам, если саппорт мышей не ловит.
Черкнул я в техподдержку, файл приложил. Авось выйдет что.

Автор: niccolo, Отправлено:10:57 28-12-2020


Цитата:
писать надо продажникам, если саппорт мышей не ловит.
Черкнул я в техподдержку, файл приложил. Авось выйдет что.


Ну попробуйте попросить 2543 билд 8-й версии, где решена проблема с подстановкой неизвестных шрифтов в PDF... Официально он не выходил, но он есть. ОЕМ-щиков они посылают к Эпсону, Минольте и другим производителям, со сканерами которых поставлялся FR.

С пользователями старых версий у них вообще разговор простой - переходите на новую версию, косяки которой они точно так же не собираются исправлять.

Автор: TelecomUral, Отправлено:12:30 28-12-2020

оффтоп
niccolo
Кабы мне это было нужно, я бы раскопал.
Вот уж проблема из проблем, найти и купить старый сканер с сохранившимся cd-диском. Даже один диск. Даже образ диска. Определите модель(и), и дело в шляпе.
Значит, так "нужно".

bolega, сорри. Больше не буду.

Автор: niccolo, Отправлено:13:39 28-12-2020

TelecomUral

Ну-ну.

bolega

При редактировании изображения в сторонней программе может разумнее обновление картинки в СК НЕ ПО ЗАКРЫТИЮ внешней программы, а по сохранению изменённого файла (изменению первоначальной даты/времени....), как например пакетное переименование с ручным редактированием имён файлов в тота Коммандер.


Автор: TelecomUral, Отправлено:19:02 28-12-2020

в завершение переписки про глюк ФР. Ответ саппорта. Быстро, и надеюсь что адекватно. Мне проверить не на чем, только восьмеркой пользуюсь.



Автор: DmitryKz, Отправлено:19:14 28-12-2020

TelecomUral, спасибо! Действительно, ошибки нет после удаления скрытых данных.
Но качество изображения ухудшается — почему-то появляются артефакты, в виде размытия краев букв/ореолов, характерные для jpg-сжатия.
То есть, по сути, это не "удаление скрытых данных", а конвертация страницы с ее видимым оформлением из BW в Grey:
— до:


— после:


Автор: igogo22, Отправлено:20:33 28-12-2020

Извните за вопрос не по теме. Периодически попадаются мне книги с экслибрисом

Кто это? На каком сайте живет?

Автор: bolega, Отправлено:09:11 29-12-2020


Цитата:
Но качество изображения ухудшается

Очень своеобразное у FR понятие об "удаление скрытых данных". Я выбрал только "скрытые объекты и текст". В результате файл сильно распух, и это немудрено: FR слил все слои в одно цветное изображение (как если бы в СК дать команду merge zones) и сжал его в jpg с приличными артефактами. Понятное дело, что такой pdf не вызовет никаких проблем.

Добавлено:
Поставил последнее обновление для своего лицензионного FR15, теперь ваш файл конвертировался в WORD без ошибок, серый фон остался, но рамку вокруг него FR все-таки потерял... Впрочем, для ocr это не важно.
Попробовал не конвертацию в word, а просто внедрить ocr-слой, в итоге и фон, и рамка остались, но FR понизил dpi текста с 400 до 300dpi (это можно увидеть например, импортировав в СК полученный после FR pdf). В настройках FR увидел, что так по дефолту и должно быть. Задал там не менять цветность и dpi, и... FR все равно поменял dpi, теперь уже до 600, и текст сделал серым (( хотя и без артефактов. Возможно, нужно еще ковыряться в настройках, чтобы достичь правильного результата. Но мне это не удалось, либо качество падает, либо ч/б становится серым. Возможно, если бы не было раскраски фона, было бы все ок.


Автор: bolega, Отправлено:11:48 29-12-2020

Еще поэкспериментировал. Если убрать из зоны фон, то FR после ocr оставляет страницу ч/б. Иначе конвертирует в серое. К сожалению, сколько ни игрался настройками, добиться того, чтобы FR просто подклеил оcr, ничего более не трогая, мне не удалось
Вроде бы раньше PDF Transformer делал это без проблем. Но он больше не выпускается, его функционал полностью ушел в FR15.
Причина увеличения dpi до 600 тоже стала понятна, страница была 400dpi, чб зона - 600, вот FR их разрешение и выравнивал. Это я могу понять, но зачем он b/w превращает в серое, мне не понятно.
Это я все не с целью критики FR, а чтобы понимать может ли СК подготовить для FR такой файл, который бы не менялся в FR при добавлении OCR. Прихожу к выводу, что при наличии раскраски фона - нет. Но возможно я плохо еще знаю возможности FR.

Автор: TelecomUral, Отправлено:12:17 29-12-2020


Цитата:
добиться того, чтобы FR просто подклеил оcr, ничего более не трогая

может у них где-нибудь FAQ на сайте есть с таким вопросом. Я вот ни разу хорошего слова про ФР не слыхал насчет pdf с его участием. Всегда траблы.

Автор: TelecomUral, Отправлено:17:44 29-12-2020


Цитата:
Причина увеличения dpi до 600 тоже стала понятна, страница была 400dpi, чб зона - 600, вот FR их разрешение и выравнивал.

bolega, а как это вы вычисляете dpi внутри pdf ? Сами же говорили что такого слова стандарт pdf не знает, всё в долях дюйма.

Автор: ComboFZ, Отправлено:19:59 29-12-2020

bolega

Цитата:
...добиться того, чтобы FR просто подклеил оcr, ничего более не трогая, мне не удалось


http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=3160#6


test_2.zip

Автор: bolega, Отправлено:09:21 30-12-2020

ComboFZ
Спасибо. Так сработало. А я давал команду в меню "сохранить документ pdf с возможностью поиска". Оказывается, результаты кардинально отличаются.

TelecomUral

Цитата:
как это вы вычисляете dpi внутри pdf

Так просто. dpi=дюймы/пиксели. Размер в дюймах известен, размер в пикселях тоже известен. Размер в дюймах в pdf хранится не непосредственно, а рассчитывается из аффинной матрицы, которая в нем хранится. Конечно, нет никакой гарантии, что генератор pdf задал физические размеры картинки адекватно исходнику. Ведь изображение в pdf можно растянуть в любом направлении, в этом случае реальное dpi узнать уже невозможно.

Автор: TelecomUral, Отправлено:14:30 30-12-2020

bolega
да не, я не про теорию расчета. Вы ж не в hex-редакторе аффинную матрицу извлекаете, вот о чем вопрос. Поделить несложно, а где вы видите исходные числа - ? PDF-редактор какой-то, типа pdfxchange editor?

мелкая ошибка, dot per inch это пиксели на дюймы.

Автор: bolega, Отправлено:14:53 30-12-2020


Цитата:
а где вы видите исходные числа

Я же написал выше:

Цитата:
(это можно увидеть например, импортировав в СК полученный после FR pdf).



Цитата:
Вы ж не в hex-редакторе аффинную матрицу извлекаете

Вы наверно забыли, что я в коде СК это делаю

Автор: TelecomUral, Отправлено:15:40 30-12-2020

А, ну да. Не сообразил
Своему коду как не доверять

Автор: legen848dary, Отправлено:18:17 31-12-2020

Здравствуйте. Создал исчерпывающую сборку программ для создания DJVU-книг со ScanKromsator в основе. Целью сборки была возможность для человека начинающего знакомится с созданием DJVU-книг пройти все этапы от получения сканов до получения DJVU-книги с OCR-слоем и содержанием. В сборке в наличии: ScanKromsator 6.52, ссылки для скачивания сопутствующих программ и инструкции по настройке и использованию ScanKromsator и сопутствующих программ. Можно расположить эту сборку в интернете для облегчения ознакомления с темой широких кругов интересующихся людей. https://yadi.sk/d/nQ9MdsKpXb0Kjg

Автор: esys, Отправлено:09:57 04-01-2021

djvu-import для чего?

Автор: shch_vg, Отправлено:13:45 04-01-2021

esys
Ровно для того же, для чего и пдф-импорт, а именно для извлечения сканов из имеющихся джву- и соответственно пдф-файлов.

Автор: legen848dary, Отправлено:22:56 04-01-2021

Могу вкратце описать функции используемых программ:
IfranView - получение сканов при сканировании и конвертирование картинок в формат tif;
DjvuDecode.exe - программа находящаяся в папке djvu-decode для импорта djvu-документов в ScanKromsator, декодирует djvu-документ в tif-картинки, необходимо указать путь к программе в настройках ScanKromsator;
Editor 6.0 - программа для удаления/вставки изображений в djvu-документ, используется при вставке обложки;
ScanKromsator - программа для работы со сканами перед созданием djvu-документа, расставляет резаки, после можно выделить картинки, чтобы они были экспортированы из скана и не были испорчены при обработке, обрезает текст, повышает dpi сканов до 600, делает документ черно-белым, считает общий размер страницы с выставленным размером рамок, появляется окно со сканами, на данном этапе возможно удаление пятен со скана, далее необходимо пройти в меню Process->Finalize, сканы получат установленные рамки и общий размер, далее проходим Zones->Picture Zone->Merge zones. Экспортированные картинки вставятся в сканы;
DjVu Smalll - программа для кодирования и декодирования djvu-документов, то есть создает djvu-документ из сканов и получает сканы из djvu-документов;
ABBYY Finereader - программа накладывающая OCR-слой (текстовый слой) на djvu-документ, может быть использована для экспорта сканов из pdf-документа в формате tif 300 dpi серый сжатие LZW;
Pdf & DjVu Bookmarker - программа для создания бокового содержания, копируем текст содержания и вставляем в программу, редактируем, есть возможность расположения закладок в виде иерархической структуры, вставляем в djvu-документ.

Если вы используете вместо сканера камеру у вас могут получиться картинки с кривыми строками. Сначала необходимо обработать фотографии, используя программу Scan Tailor вместо ScanKromsator, так как при конвертации цветной фотографии в черно-белую в программе ScanKromastor на картинке появляется черное пятно (получается только если вы фотографируете страницы книги). Далее можно выправить строки на картинке с помощью программы Book Restorer. Если вы сделали сканы книги и хотите выпрямить кривые строки на сканах, программой Scan Tailor можно не пользоваться. https://yadi.sk/d/iwhG18vvOR2Nxw

Необходимые настройки ScanKromsator: File->Profiles, изменяем имя профиля, Pages->Hor. alignment Center, Book-Gap value ~200, Files->DPI 600, нажимаем Apply и Save.

C предыдущим постом - это полный алгоритм создания DJVU-книг вместе со сборкой всех используемых программ. Подробности искать в приведенных инструкциях.

Автор: Benoni, Отправлено:19:05 05-01-2021

legen848dary
Ваши уроки для кого предназначены?

Автор: legen848dary, Отправлено:19:36 05-01-2021

Для начинающих, как уже было написано. Хотелось собрать все необходимые программы в одном месте и изложить единый алгоритм.

Добавлено:
Есть мысль создать раздачу на RuTracker, нужна ваша критика.

Автор: Benoni, Отправлено:19:56 05-01-2021

legen848dary
Для этого есть тема
Электронные книги: сканирование, обработка, сборка - V
http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=3160

Здесь речь идет о ScanKromsatorе.

Автор: legen848dary, Отправлено:19:58 05-01-2021

Спасибо!

Автор: niccolo, Отправлено:15:35 07-01-2021

Bolega

При редактировании изображений из СК во внешнем редакторе

1. Не открывает изображение, если редактор (PaintDotNet) уже открыт с другой картинкой.
2. ИМХО — обновлять картинку в СК лучше по изменению даты/времени, а не по закрытию внешнего редактора.


В последней версии FR блоки при редактировании изображения так же слетают?
При повторном открытии изображения (ПКМ по странице в окне пакета, Свойства) программа всё так же выводит окно открытия, не подставляя имя первоначального файла, и не открывая файл автоматически, даже если файл с таким же именем лежит в исходной папке?
Пакеты из предыдущих билдов перекодирует?


Цитата:
в завершение переписки про глюк ФР. Ответ саппорта. Быстро, и надеюсь что адекватно


Если констатация факта саппортом — это адекватность....
Интересно - как бы подход коммерческого ИТ в жизнь перенести - купил глючную прогу (дефектный продукт) - обращаешься к изготовителю/продавцу с указанием на брак - Он говорит: «Да есть такое. Но исправлять мы не будем. Купите новую версию. Там этого бага нет».... (но есть куча других)

Представляю, какая бы лафа началась для всяких МВидео, Ситилинков и иже с ними.
А на официальных автосервисах так вообще СКАЗКА.....

Автор: bolega, Отправлено:16:06 07-01-2021

niccolo

Цитата:
1. Не открывает изображение, если редактор (PaintDotNet) уже открыт с другой картинкой.

СК вызывает редакторы однотипно: редактор.exe имя_файла.tif
И СК не может влиять на поведение редактора. Может быть, PaintDotNet не позволяет открыть новый файл , когда у него есть несохраненное текущее изображение?


Цитата:
ИМХО — обновлять картинку в СК лучше по изменению даты/времени, а не по закрытию внешнего редактора.

Согласен, что заморозка не очень удобна. Много времени уходит каждый раз на запуск программы. Но иначе не очень понятно, сколько времени СК следует следить за файлом. Ведь сохранений одного и того же файла может быть сколько угодно. И СК получается должен постоянно мониторить это. СК подсовывает редактору не оригинальный файл, а временный, который по хорошему нужно удалять по завершении редактирования. Но если делать так, как вы предлагаете, это завершение невозможно отловить.


Автор: niccolo, Отправлено:17:43 07-01-2021


Цитата:
И СК не может влиять на поведение редактора. Может быть, PaintDotNet не позволяет открыть новый файл , когда у него есть несохраненное текущее изображение?


Выдаёт ошибку - файл не найден.


Цитата:
Согласен, что заморозка не очень удобна. Много времени уходит каждый раз на запуск программы. Но иначе не очень понятно, сколько времени СК следует следить за файлом.


варианта 2 — при возврате в окно SK на текущей странице или кнопка - обновить изображения.

Автор: Benoni, Отправлено:14:38 10-01-2021

В версии ScanKromsator 6.61 есть группа команд Draw: Line/polyline, Closed polyline, Polyline (jointed), Closed polyline (jointed).
Кто-то овладел искусством рисования? Кто-то может подробнее описать (чем на sk.6.6 whats) или на ролике показать?

Автор: TelecomUral, Отправлено:03:46 11-01-2021

Benoni
это очень низкоуровневый инструмент, "искусство" не подходит.
Дайте задачу, которую вы не можете выполнить. А сама по себе рисовалка примитивная: настроили толщину, выбрали тип цвета рисования, если он не черный и не белый нужен, то выбрали в палитре цвет. Провели выделение на картинке, и выбрали вид Draw из вами перечисленного.
Можно кисть настроить, только непонятные английские слова сбивают.
Вот я побаловался в зоне:


Автор: bolega, Отправлено:16:26 11-01-2021

Benoni
Недавно было обсуждение: http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1080#6
Рисование добавлено по итогам обсуждения.
В будущем возможно еще сделаю линии-объекты.

Автор: Benoni, Отправлено:17:16 11-01-2021

bolega
Большое спасибо. Не заметил. Пропустил.

Автор: DmitryKz, Отправлено:10:13 18-01-2021

Ребят, подскажите, пожалуйста, — скорость вращения зоны (что по Shift) можно ли регулировать?

Автор: TelecomUral, Отправлено:10:52 18-01-2021

DmitryKz
отъезжайте мышкой после нажатия ЛКМ подальше от зоны. И перемещайте. Будет крутиться медленнее.

Автор: DmitryKz, Отправлено:11:02 18-01-2021

TelecomUral
Не вполне понимаю, что имеется в виду — вот зона выделена, подвожу курсор к одному из квадратиков на границе зоны, нажимаю Shift, чтобы курсор сменился на кружочек со стрелкой, что обозначает режим вращения — и потом уже ЛКМ. Но это уже вращение — и чем дальше отводишь от зоны зажатый ЛКМ, тем быстрее зона вращается.
Если есть еще какой-то способ — просветите, а то не понимаю...

Автор: TelecomUral, Отправлено:11:31 18-01-2021

у меня, наоборот, медленнее. Там полярная система координат (как-бы). Вектор дальности и угол азимута. Вы по вектору строго отводите, чтоб угол не менялся (направление на центр зоны), а потом азимут тихонько меняйте поперечным перемещением.

Автор: DmitryKz, Отправлено:11:39 18-01-2021


Цитата:
Там полярная система координат (как-бы).

Ага, кажется, понял, о чем вы...
Приноровиться только нужно...
Но я бы, наверно, предложил bolega добавить какую-нибудь дополнительную клавишу к Shift (Ctrl, например) — чтобы вращение производилось с меньшей скоростью.
А то оно все равно как-то быстро (ну, может, субъективно) получается.

Автор: asku, Отправлено:19:35 19-01-2021

Добрый вечер.

Подскажите, пожалуйста. Как можно в режиме out сделать дежавю не из всех сканов, которые находятся в папке out, а только из части.
Я в левом окошке — списке файлов выделяю несколько первых файлов-сканов (см. рисунок), но мне делает дежавю всех файлов.



Автор: TelecomUral, Отправлено:20:38 19-01-2021

вроде очевидно: не привязывайте сканы к этапу (пусто в квадратных скобочках). Или отвяжите ненужное, если уже привязали.

Автор: Benoni, Отправлено:22:24 21-01-2021

asku
1 Сохранить задание.
2 Открыть out-task.
3 В нем удалить лишние сверху(у Вас их нет) и лишние снизу(у Вас 11 -хх)
4 Для оставшейся части запустить Tools/Create djvu.
Всё! Получите необходимое.

Автор: shch_vg, Отправлено:22:29 21-01-2021

Benoni
Зачем удалять?
А если нужно просто проверить на нескольких сканах?
Гораздо проще отвязать (или не привязывать вообще).

Автор: TelecomUral, Отправлено:08:43 22-01-2021

Есть более сложный вариант Сначала сделать sub-task.

Автор: daa2013, Отправлено:11:24 28-01-2021

У меня возникла новая идея, как ещё можно было бы использовать механизм демонстрации пользователю тессерактовских ячеек с глифами.

Для начала опишу проблему. Она нечасто возникает, но когда возникает, то крайне неприятна: при агрессивном джву-кодировании плохая щербатая буква распространяется по всей книге. Редактора готовых шейпов в джву-кодировщиках нет; возможности найти, с какой страницы эта буква пришла в словарь, чтобы ее прибить, тоже нет.
В режиме по типу глиф-редактора СК: слева шейпы словаря - справа страницы джву-документа ни один из известных джву-просмотрщиков не работает.
Update: Оказывается, последний Djvu Editor от Куминас работает, но только в пределах одной страницы. Где этот шейп еще в книге есть, там не видно.
https://yadi.sk/i/-JQF1xQFgPhQcQ


И тут меня осенило, что СК предоставляет для такого редактирования уже почти все необходимые возможности. (Если, конечно, в нем будут отображаться ячейки тессеракта).

Что нужно только сделать, это сопоставить djbz-словарь и массив тессерактовских ячеек по пространственным координатам.

Потрошение djbz-словаря вроде truf делал:
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1559575438

Тогда видишь плохой символ в готовом джву со словарем, охватывающим все страницы. Идешь на эту букву на этой странице в СК. , а потом перемещаешься по всем тессерактовским ячейкам, который соответствуют позициям расположения соответствующего кривого шейпа.
(Ну, и руками исправляешь в глиф-редакторе те, где исходная буква действительно щербатая.

Автор: TelecomUral, Отправлено:15:08 28-01-2021

daa2013
как вариант: на безрыбье работать со словарем для куска книги. Целый, половинка, четвертинка и так далее страниц. Найдете место, откуда приходит щербатая буква.

Автор: NME, Отправлено:15:28 28-01-2021


daa2013
djvutoy может раздербанить словарь на шейпы, дальше в получившихся графических файлах ищется нужный и поиском по номеру шейпа в текстовых файлах находятся координаты местоположения его на страницах книги..

Автор: TelecomUral, Отправлено:16:12 28-01-2021

NME
проблема в количестве шейпов Глазами это не отсмотреть
Кроме того, искать-то надо не шейп, а его первоисточник.

Автор: NME, Отправлено:16:59 28-01-2021

TelecomUral
всё очень легко делается за несколько минут, не считая времени на разбор книги djvutoy.. но, это не тема данного топика.. если интересно, можно продолжить в личке или другой теме, но не здесь..

Автор: TelecomUral, Отправлено:17:28 28-01-2021

NME
согласен. давайте в вашу тему по утилитам перескочим.

Автор: bearjrgm, Отправлено:21:52 29-01-2021

Как работает механизм сабтасков?
если я выбираю файлы, ну допусти м картинками-зонами, потом в сабтаске на этих картинках делаю еще картинки-зоны, перовначальные живые будут? И будет ли наложение зон друг на друга?

Автор: shch_vg, Отправлено:23:39 29-01-2021

bearjrgm
Субтаск делается в другой папке и никак не связан со своим "родителем".
Это отдельное самостоятельное задание.
Бардак можно устроить, только если задать папкой сабтаска саму папку основного задания.
Возможно, в программе предусмотрен запрет этого варианта, не пришло в голову это проверить.

Автор: TelecomUral, Отправлено:04:38 30-01-2021

bearjrgm
а если вам надо поработать с несколькими файлами задания особым образом, то в свежем СК есть закладочка Subsets (после Reports). Иногда просто выручает.

Автор: TelecomUral, Отправлено:20:57 08-02-2021

Настигла меня намедни мысль. Спросонок. Всё-таки есть какое-то чудо чудное в том, что именно во сне или в пробуждении от сна видишь какое-то решение.
Короче, посетила идея с рамкой и резаками. Хотя мне самому рамка в СК нафиг не нужна, но видно мозги всё равно хотят решить нестандартную задачу
Если нельзя двигать резаки в виде рамки, может быть можно придумать инструмент "рамка" - ? Как ruler, который на панели есть. Типа включаем его, над сканом повисает привязанный к движениям мышки прозрачный штрихпунктирный прямоугольник, и в момент щелчка ЛКМ резаки передвигаются к соответствующим границам этой рамочки. Справа или слева на развороте решается в зависимости от места центра рамочки (оно подсвечено). Срабатывает только если центр внутри всех четырех резаков. Щёлк, щёлк, и на следующий скан автопролистывание. Почище ST выйдет скорость расстановки.
Габариты рамочки задаются на какой-нибудь закладочке или даже по ПКМ на кнопке инструмента. Типа "взять габариты от видимых резаков справа (слева)".

Что-то написал и засомневался - а моя ли это идея Не писали ли здесь уже нечто сходное.

Автор: shch_vg, Отправлено:21:10 08-02-2021

TelecomUral
Интересно, а как эта идея будет работать на сканах разворотов старых книг, причем левая и правая страницы которых расположены под углом друг к другу и обе страницы отнюдь не вертикальны?
Плюс еще малое расстояние между страницами разворота.

Добавлено:

Цитата:
Если нельзя двигать резаки в виде рамки

Хотелось бы понять, почему это нельзя реализовать, а предложенную Вами идею можно?

Автор: TelecomUral, Отправлено:21:26 08-02-2021

shch_vg
А никак не будет работать. Люди хотели двигать рамку вместо резаков - я дал решение. Люди не просили вращать резаки.
Впрочем, никто не мешает вращать рамку, за угол. Только это уже не тот кайф будет. Проще поставленные резаки наклонить. Или вообще пропустить скан.
Фантазировать-то несложно, сложно программировать


Цитата:
Хотелось бы понять, почему это нельзя реализовать, а предложенную Вами идею можно?


Я не разработчик СК. Но интуиция мне подсказывает что при щелчке мышкой последовательно сообщить "offline" каждому резаку его новую координату - можно. А вот одновременно "защелкнуть" четыре живых канала передачи координат - нельзя.

Автор: shch_vg, Отправлено:21:50 08-02-2021

TelecomUral

Цитата:
Но интуиция мне подсказывает что при щелчке мышкой последовательно сообщить "offline" каждому резаку его новую координату - можно. А вот одновременно "защелкнуть" четыре живых канала передачи координат - нельзя.

А Вы не обратили внимание, что при перемещении мыши по скану (без щелчка!) вид курсора меняется при прохождении через резак?
Кроме того в случае прямоугольной области внутри курсоров текущие координаты этих резаков известны безотносительно положения или перемещения мыши, поэтому известны также координаты точек пересечения этих резаков. Да и координаты вершин не прямоугольной области внутри резаков, наверное, тоже известны. Что мешает при попадании мыши в дельта-окрестность точки пересечения резаков изменению вида курсора с одновременным переходом в возможный режим перетаскивания/ поворачивания области внутри резаков?

Автор: shch_vg, Отправлено:00:13 09-02-2021

TelecomUral

Цитата:
Впрочем, никто не мешает вращать рамку, за угол. Только это уже не тот кайф будет. Проще поставленные резаки наклонить.

Очевидно, что резаки наклонять СЛОЖНЕЕ, т.к. их 4, а поворот - один.

Автор: daa2013, Отправлено:05:52 09-02-2021

Насколько я понимаю концепцию гипотетического инструмента "рамка" - она немного другая.
Это для журналов с иллюстрациями в край. То есть один раз настроил прямоугольник правильных размеров. Потом правильно повернул все страницы.
А потом двигаешь этот прямоугольник поверх сканов, таская его за край.

Ну, то есть по ЛКМ его двигать, по двойному клику - резаки подтягивать.
Upd и не просто подтягивать, а пурпурнымии их при этом делать

Автор: TelecomUral, Отправлено:08:02 09-02-2021

shch_vg

Цитата:
А Вы не обратили внимание, что при перемещении мыши по скану (без щелчка!) вид курсора меняется при прохождении через резак?

"А вы ещё не попробовали навести мышку на четыре резака одновременно?"
Один, первый, режим - считывание места мышки и реакция вида курсора. Совершенно иной режим - отправка от мышки новых ее координат тому объекту, который в первом режиме вероятно даже не опрашивался о текущей его координате.


Цитата:
Что мешает при попадании мыши в дельта-окрестность точки пересечения резаков изменению вида курсора с одновременным переходом в возможный режим перетаскивания/ поворачивания области внутри резаков?

Всё это, повторяю, гадание на кофейной гуще. И, наверное, радости bolega не добавляет.


Цитата:
Насколько я понимаю концепцию

Вот уже и варианты пошли Я о таком и не думал. В голове крутилась картинка обычного текстового блока. Но ваш пример актуальнее, наверное.

Автор: shch_vg, Отправлено:14:49 09-02-2021

TelecomUral

Цитата:
"А вы ещё не попробовали навести мышку на четыре резака одновременно?"
Один, первый, режим - считывание места мышки и реакция вида курсора. Совершенно иной режим - отправка от мышки новых ее координат тому объекту, который в первом режиме вероятно даже не опрашивался о текущей его координате.

Не очень понял смысл этого абзаца.
Пример - перемещение одного резака.
Сначала при попадании курсора на резак меняется его вид.
При нажатии и удерживании ЛК мыши перетаскивается резак в новое положение.
Т.е. в этом процессе фиксируются два момента:
1. координаты курсора при попадании на резак
2. координаты курсора при отпускании ЛКМ.
Разность этих координат позволяет вычислить новое положение резака.
То же самое происходит в приведенном мною варианте, но уже относительно области внутри резаков.
Сначала получаются координаты любого угла этой области.
Затем после нажатия и удержания ЛКМ курсор перемещается в новое положение.
При отпускании ЛКМ фиксируются новые координаты перетаскиваемого угла.
Далее простая арифметика позволяет вычислить новое местоположение всех резаков.

Другой вопрос: можно ли это реализовать, следуя алгоритму программы?

Автор: TelecomUral, Отправлено:15:15 09-02-2021

оффтоп

shch_vg

Цитата:
1. координаты курсора при попадании на резак
2. координаты курсора при отпускании ЛКМ.
Разность этих координат позволяет вычислить новое положение резака.

Ээээ....
Всё это время резак-то перемещается по экрану... вы чего...
Я уж дуб дубом в визуальных интерфейсах, но это ж очевидно, что при нажатии ЛКМ и последующем перемещении мыши происходит масса обработок изображения (рендеринг на лету). Вы же видите, что линия резака не статична. Значит, что-то и в ветках кода происходит, обеспечивающее этот рендеринг.

Автор: shch_vg, Отправлено:15:57 09-02-2021

TelecomUral

Цитата:
но это ж очевидно, что при нажатии ЛКМ и последующем перемещении мыши происходит масса обработок изображения (рендеринг на лету). Вы же видите, что линия резака не статична.

При чем здесь резак?
Я упоминал только координаты курсора.
Насколько я помню из моей допенсионной программистской деятельности можно определять местоположение КУРСОРА, а все эти рендеринги это работа программы по вычислению текущего местоположения резака, используя текущие координаты курсора.

Автор: TelecomUral, Отправлено:16:17 09-02-2021

shch_vg

Цитата:
При чем здесь резак?

как причем? Вам надо визуально резак переместить в новое место. Вы от рендеринга не можете избавиться как от ненужной дополнительной вещи в процессе. Вам необходимо двигать мышь и отрисовывать резак над сканом. Ветка, отвечающая за рендеринг, вероятно, и блокирует возможность одновременно рулить несколькими резаками. Это же целые идеологии сейчас, все эти среды разработки, QT и прочие wxWidgets-ы. Создан какой-нибудь объект, с определенными характеристиками. Создана комбинация объектов, она помещена на "рабочий стол программы", MV СК. Все взаимосвязано, стройно, масштабируется внутри окошка быстро. А вы предлагаете воткнуть туда "лом" прямой обработки движений мыши Скорее всего это просто технически невозможно.
Вот у меня на днях была задача по работе: ввели новую услугу коммерсанты. Анализ номера звонящего потребовался для выставления тарифа. Так мне пришлось написать новую функцию обработки услуг на самом нижнем уровне биллинга, потому что номер звонящего в принципе ранее не передавался с верхнего уровня в базу данных. Ни в запросе, ни в справочнике, ни в подзапросах, ни в экспортируемой таблице его не было. Пришлось раскрутить всё что до меня наваяли за 14 лет, изменить связки всей "пирамиды" запросов к таблицам, добавив в параметры "номер вызывающего абонента". И до кучи справочники обновить. И ещё пока неизвестно, а не ошибся ли я в какой-нибудь мелочи
А с графикой скорее всего все на-амного сложнее. Все эти сплайны и z-порядки, известные еще в 80е годы - цветочки.

Автор: shch_vg, Отправлено:17:08 09-02-2021


Цитата:
 А вы предлагаете воткнуть туда "лом" прямой обработки движений мыши

Не "прямой обработки движений мыши", а обработки текущего положения курсора.
Эти координаты курсора (по горизонтали и по вертикали) постоянно высвечиваются в СК (слева внизу нижние два числа) при перемещении курсора по скану в главном окне.
Причем съём этих координат происходит не постоянно, а дискретно.
А все эти, как Вы выразились "целые идеологии сейчас, все эти среды разработки, QT и прочие wxWidgets-ы" тоже начинают работу со съёма текущих координат курсора.

Автор: TelecomUral, Отправлено:17:37 09-02-2021

shch_vg

Цитата:
тоже начинают работу со съёма текущих координат курсора

да ёпрст же...
начинают. не спорю.
Вы на шаг вперёд собираетесь начать думать? Сняли координаты, ок, следующий шаг какой? Ну, предположительно, конечно.
Следующий шаг в уже построенной системе окна - ? Определить, на какой объект мышь навелась.
Затем что?
Разрешить объекту отработать наведение на него.
Либо сделать какое-то иное действие. Прокукарекать в динамик. Вид курсора поменять. Неважно.
Событие -> реакция.
Так вот когда резак подсвечен, а ЛКМ нажата, реакция на это "отрисовывать его непрерывно в совокупности с подлежащим сканом, пока ЛКМ нажата". И иной обработки не предусмотрено. Сейчас.
Чтобы активировать другой резак для рендеринга, сначала надо отпустить прежний. Именно об этом я написал выше - "уже попробовали вы навести мышь на все четыре резака сразу".
Там два резака сразу можно двигать, параллельных. Почему не четыре? Потому что резак двигается в одной координате, полоске у края, ее ж тоже рисовать надо, когда там головка ездит. Нажимаете ЛКМ - резак отрисовывается согласно перемещению мыши по той ее координате, которая конгруэнтна координате перемещения резака. Визуализация объекта так сделана. Сместилась мышь по X влево - рендерится вертикальный резак и скан повдоль координаты Y. Объект "одномерен" если зажата ЛКМ. Во всяком случае, я это так предполагаю. (Я замечал, что если резак наклонить, то его отрисовка резко замедляется. Видно, как перерисовываются подлежащие пиксели.)
Все, давайте закончим.

Автор: shch_vg, Отправлено:17:59 09-02-2021

TelecomUral
Прошу прощения, но не стал читать такое подробное описание.
Объясните мне без всякого рендеринга (можно в ЛЯ), как происходит высветка резаков при загрузке уже имеющегося задания.
Я по простоте душевной считал, что информация о резаках записана в файле sk.ini.
Аналогично после перемещения резака в новое положение его координаты перезаписывают старые в том же файле задания.
Вот и все.

А поскольку информация о резаках есть в файле задания, то, сместив один резак на несколько пикселей, можно связанный с ним сместить на то же количество пикселей в ту же сторону.
Это же распространяется и на перемещение угла области внутри резаков, только в этом случае можно смещать и два других резака.

Автор: TelecomUral, Отправлено:18:09 09-02-2021

shch_vg
до перезаписи в sk.ini вы упускаете целый мир своей жизни: вы следите глазами за резаком на экране. И сопоставляете то, что нарисовано на скане, с перемещающимся резаком. А уж потом фиксируете ini.

Автор: shch_vg, Отправлено:18:16 09-02-2021

TelecomUral
Я согласен, что это будет замедлять процесс перерисовки резаков, но в принципе-то это возможно.

Уже сейчас, таская один резак при нажатом CTRL, двигается и второй, но особой задержки в перерисовке я не замечаю.

Автор: bearjrgm, Отправлено:16:33 15-02-2021

всем привет, кто чем пользуется для выпрямления строк? Можно это как-то соединить с кромсатором?

Автор: daa2013, Отправлено:21:27 04-03-2021

Подскажите, как обработать в СК, плиз.

Есть сканы, где иллюстрации колоризованы. Т.е. это 256 оттенков синего (фиолетового).



Вопрос №1.
Если бы я посканил их в сером (а с высокой вероятностью я мог быть вынужден это сделать), то как 256 оттенков серого перевести в 256 оттенков синего (или любого другого заданного цвета) в СканКромсаторе ?

Вопрос №2.
Мне удалось посканить в цвете, но полезли всякие паразитные цвета (желтые, зеленые и всякие другие грязные пиксели). Для достижения цветовой чистоты я бы с радостью перевел иллюстрации сначала в серый, а потом в заданный цвет (желательно по цветопробе на темном участке). Но как это сделать ?
Может, где-нибудь существует прямая конвертация в 256 оттенков заданного цвета, а не просто в серое ?


Я когда-то делал что-то похожее в Шопе. Но это было давно и я плохо помню как. Разберусь, конечно.
Но был бы рад, если бы мне также дали ссылку на вменяемое описание этого процесса в пакетном режиме, пусть даже и не в СК.

Автор: daa2013, Отправлено:04:04 05-03-2021

bolega
1. Мне кажется, что набор цветов по кнопке Color имеет смысл автоматически передавать и в окно MW, и оут-задание.

2. Если это невозможно или нецелесообразно, можно ли туда (в Color) прикрутить команду "сохранить как палитру", чтобы не идти на закладку постеризации и не перенабирать цвета ?

Автор: TelecomUral, Отправлено:11:45 05-03-2021


Цитата:
Для достижения цветовой чистоты

а правда нужно это? Я когда-то проводил тесты, печатал, и особо паразитные цвета не мешают.
Как я понимаю, чтобы выловить чистый тон, надо как-то математически выделять средний цвет, по осям разбирать пространство. А если реальная бумага имеет неоднородность, то пойдет искажение. ИМХО, не стоит овчинка выделки. Либо я не сталкивался.

Автор: slava_kry, Отправлено:14:47 05-03-2021

daa2013
Сделайте картинки ч/б диффузионным растром, а потом окрасьте любым цветом...
(т.е. полутону соответствует плотность пиксельных точек)
СК это может, насколько помню.

Только дежавю не любит такие выкрутасы и плохо их сжимает.

Автор: bolega, Отправлено:22:24 05-03-2021

daa2013

Цитата:
Есть сканы, где иллюстрации колоризованы. Т.е. это 256 оттенков синего (фиолетового).

Добавил в СК такую фичу, т.е. colorize серое изображение.
RV, панель image adjustments, закладка hue/saturation. В colors добавил режим colorize. Подбор цвета/яркости интерактивный с помощью preview

Добавлено:

Цитата:
Если это невозможно или нецелесообразно, можно ли туда (в Color) прикрутить команду "сохранить как палитру",

А color - это кнопка select clean color? Так там есть возможность добавлять цвета в существующую палитру. Правда, палитра уже должна быть создана, хотя бы пустая, ее имя нужно задать в posterization. Но это мне кажется не проблема.
Впрочем, можно добавить возможность создавать новую палитру прямо в диалоге задания цвета. Сейчас там только выбор существующих палитр.

Автор: bolega, Отправлено:21:06 06-03-2021

Новая версия 6.71
https://workupload.com/file/MWMY8Q5KuK4

Автор: Benoni, Отправлено:23:47 07-03-2021

bolega
Большое спасибо!

Автор: qwaxym, Отправлено:17:51 09-03-2021


Цитата:
Мне удалось посканить в цвете, но полезли всякие паразитные цвета (желтые, зеленые и всякие другие грязные пиксели). Для достижения цветовой чистоты я бы с радостью перевел иллюстрации сначала в серый, а потом в заданный цвет (желательно по цветопробе на темном участке).  Но как это сделать ?
Может, где-нибудь существует прямая конвертация в 256 оттенков заданного цвета, а не просто в серое ?

Я делал просто: выделяете pic зону, в настройках зоны color ставите bitonal, а в настройке paint выбираете нужный цвет.

Автор: niccolo, Отправлено:19:34 09-03-2021


Цитата:
Новая версия 6.71


bolega - спасибо большое. По первому ощущению показалась чуть медленнее.... 5.96 и 6.0х


Автор: daa2013, Отправлено:22:18 09-03-2021

А вы задали в опциях число ядер процессора ?

Автор: niccolo, Отправлено:23:53 09-03-2021


Цитата:
А вы задали в опциях число ядер процессора ?


Если вопрос мне - я не трогал дефолтные настройки, тем более что они сами подхватились с версии 6.5х
Медленнее по ощущениям даже на Драфте....

Автор: bolega, Отправлено:09:27 10-03-2021

Алгоритмы обработки и драфта в последних версиях не менялись. Так что это скорее только ощущения. Такое бывает, когда инструмент не любишь, кажется, что он работает все хуже и хуже
В 6.7x слегка изменилась обработка только для 1200dpi, она стала более устойчивой к нехватке памяти на 32 разрядной Windows.

Автор: Benoni, Отправлено:10:09 10-03-2021

bolega

Цитата:
Так что это скорее только ощущения. Такое бывает, когда инструмент не любишь, кажется, что он работает все хуже и хуже

!

Автор: bolega, Отправлено:10:37 10-03-2021


Цитата:
я не трогал дефолтные настройки

Если хороший комп, рекомендую задать использовать несколько ядер. Скорость обработки вырастет в несколько раз. На драфт не влияет пока..

Добавлено:
Benoni
i

Автор: daa2013, Отправлено:16:51 16-03-2021

Хочу поделиться очередной идеей полезного применения тессерактовских ячеек для букв.

Иногда такое бывает, что по всей книге при джву-кодировании вылезает ошибка transposed letters, именуемая инода на жаргоне "ошибкой ИНь". Это когда буквы И и Н перепутываются, и одна подставляется вместо другой. Объяснять и примеры приводить тут, наверное, даже и не надо.

Ну, так вот.

Взять и объявить все ячейки для букв И и Н зонами лосслесс кодирования.
Точнее, сначала провести OCR, а потом выбрать буквы, ячейки для которых станут такими зонами.
Перепутывание, оно ведь по разному случается.

Автор: TelecomUral, Отправлено:17:12 16-03-2021

daa2013
зоны определяются нечетко.

Автор: daa2013, Отправлено:19:50 16-03-2021

Ну и что ?
Какая разница в точности их границ, если внутри них гарантированно произойдет сохранение ч.б шейпов. Страдающие буквы-то они по любому захватывают.

Насколько я знаю, если лосслесс зона перерезает посередине какую-то букву, то она от этого не портится.

Автор: daa2013, Отправлено:00:21 17-03-2021

И вот еще дополнение.
У меня есть словарь, где ИНь только в заголовках словарных статей, а в самом тексте нормально.
Но это всё равно тысячи слов.

Можно встроить проверку на размер. То есть не только чтобы И была опознана, а еще чтобы она скажем оказалась по высоте больше N пикселей. И только тогда выставлялась лосслесс зона по координатам ячейки.

Автор: daa2013, Отправлено:01:23 19-03-2021

Уточнение к дополнению.

Например, чтобы было условие по высоте больше/меньше, по ширине больше/меньше
Плюс возможное сочетание комбинации этих условий.
Тогда ИМХО любую букву любого шрифта можно будет в лосслесс зоны поймать.

Автор: U235, Отправлено:09:51 19-03-2021

daa2013 можно еще так дополнить вашу идею:
1. Исходный ч/б скан распознать tesseractом.
2. Разделить скан на две части: первая - с буквами и,н,п на белом фоне, вторая - со всем остальным.
3. Вторую часть агресивно кодируем в djvu, а затем декодируем.
4. Объединяем первую часть с декодированой. Получится файл с некоторыми одинаковыми шейпами, но буквы и, н, п будут исходного начертания.
5. Кодируем в djvu результирующий tif с умеренной агрессией.


Автор: shch_vg, Отправлено:15:46 19-03-2021

daa2013
U235
Вы так интересно обсуждаете, как решить проблему инь и янь.
А можно привести пример исходного скана, результат его дежавуирования, на котором это проявляется, и обязательно (иначе предыдущее не имеет смысла) указать, какой программой и с какими параметрами создано дежавю?

Автор: bolega, Отправлено:20:34 19-03-2021

del

Автор: niccolo, Отправлено:13:50 22-03-2021

Сфотографированные книги с поочерёдно развёрнутыми влево и вправо страницами можно как-то в один проход исправить в оригинале в СК?

Автор: shch_vg, Отправлено:14:17 22-03-2021

niccolo
Один неудачно заданный вопрос порождает минимум два встречных:
1. Что такое "с поочерёдно развёрнутыми влево и вправо страницами"?
2. Что понимается под "исправить в оригинале"?

Автор: niccolo, Отправлено:14:25 22-03-2021

shch_vg

1. поочерёдно развёрнутыми влево и вправо страницами — чётные - повёрнуты по ч/с на 90, нечётные — против ч/с на 90°, или наоборот.

2. исправить в оригинале — повернуть именно оригиналы изображений (перезаписать оригиналы повёрнутыми), а не их представление в программе.

пример SINGLE PAGE ORIGINAL JP2 TAR
https://archive.org/details/schlomannoldenbo1319schl/page/354/mode/2up

И есть ли пути ускорения работы с jp2?

Автор: daa2013, Отправлено:15:40 22-03-2021

Я обычно jp2 конвертирую при помощи ирфана в тиффы.
Наверное там же можно и повороты пакетно сделать.

Автор: bearjrgm, Отправлено:17:43 22-03-2021

niccolo
Выделяете нужную группу файлов и поворачиваете за один проход,
выделить можно через один автоматически

Автор: niccolo, Отправлено:17:49 22-03-2021

bearjrgm

Спасибо. Разобрался. За один проход, я так понимаю, нельзя

Автор: bolega, Отправлено:18:03 22-03-2021

Можно. Маркируете все файлы. Выделяете все те, что +90. Выставляете для них orientation +90. Затем инвертируете выделение и выставляете для них -90. Затем команду rotate and save, параметр get angle from ставите = orientation option.
Но СК очееень медленно работает с Jp2, поэтому правильно рекомендуют сначала конвертнуть в тиф.

Автор: shch_vg, Отправлено:18:53 22-03-2021

niccolo

Цитата:
За один проход, я так понимаю, нельзя

Теоретически можно, если под одним проходом Вы понимаете обработку всех сканов на автомате, но для этого нужно произвести определенную настройку.
Более того в этом случае еще можно подключить в этот проход выравнивание страницы по вертикали.

Автор: niccolo, Отправлено:21:15 22-03-2021

За идеи спасибо

Пошёл немного иначе - повернул всё на 90 вовне, а затем просто половину на 180.

Bolega - по ссылке и есть «красные» сканы, о которых я когда-то говорил....

Автор: anion23, Отправлено:13:29 30-03-2021

bolega
Хотел узнать, так задумано или баг... Если так было задумано, то заранее прошу извинить за оффтоп.
Ситуация такая: в окне результата если активировать режим "Highlight speckles" и в режиме mouse-up-despeckle-mode выделить только часть подсвеченного красным спекла, то происходит удаление (обрезка) этой части как-будто в режиме mouse-up-clear-mode. Если выделять часть серого символа, то выделение в режиме mouse-up-despeckle-mode срабатывает штатно (ничего не обрезает). Версия последняя 6.71.

Автор: shch_vg, Отправлено:14:38 30-03-2021

bolega
Странное действие команды Import.
Делаю импорт одной страницы из пдф, она импортируется и появляется в главном окне.
Выполняю команду Result->Show source files и в RV окне получаю пустую страницу, а внизу в информационной строке стоит имя только что загруженной страницы.
Что не так?

Автор: bolega, Отправлено:18:03 30-03-2021

anion23

Цитата:
Хотел узнать, так задумано или баг... Если так было задумано, то заранее прошу извинить за оффтоп

Так и задумано. В режиме подсветки удаляет просто красные пиксели. В обычном режиме СК на лету ищет спеклы в области выделения. В режиме подсветки по-другому: сперва ищет спеклы по всей странице, а потом просто удаляет красное уже ничего не ища.
Кстати у подсветки есть и другой режим: не удаления, а замены красного на черное (серое). Иногда так бывает нужнее, т.е. убрать из выделения ложные спеклы, а затем избавиться от всего оставшегося красного одним нажатием "D". Правда в этом режиме undo не работает по отношению к убранному красному...

shch_vg

Цитата:
получаю пустую страницу

Может все ушло в зоны? Не пробовали переключиться в режим просмотра зон?

Автор: shch_vg, Отправлено:19:02 30-03-2021

bolega
Нет не пробовал.
При этом импорте создавалось два файла при импорте одной страницы: один нормальный, другой пустой. Причем в списке присутствовало имя пустого файла, хотя в главном окне высвечивалась импортируемая страница. Начал экспериментировать с параметрами окна импорта. В окошке Do not zones cтояла галка, вроде бы нормально, зоны мне не нужны. Но когда я эту галку убрал, страницы начали импортироваться нормально. Похоже галка действует противоположно предполагаемому варианту.

Автор: anion23, Отправлено:12:28 31-03-2021

bolega

Цитата:
Кстати у подсветки есть и другой режим

Спасибо за ответ и за интересные подробности работы данного режима. Было бы полезно добавить эту информацию в шапку или в _advices.txt.

Автор: bolega, Отправлено:12:39 31-03-2021


Цитата:
в шапку или в _advices.txt.

Когда-нибудь добавлю.
Кстати, если сделать ocr, то подсветка станет более направленной, СК не будет включать в подсветку заведомо не-спеклы: знаки препинания, рваные кусочки букв и т.п.

Автор: daa2013, Отправлено:17:08 31-03-2021

а можно, чтобы знаки препинания исключал, а рваные кусочки букв подсвечивал ?

Автор: bolega, Отправлено:18:00 31-03-2021

можно. по умолчанию так и есть. Только еще и спеклы будут светиться. Пользователь сам задает какие символы/буквы (целиком или части) исключать

Автор: asku, Отправлено:21:13 03-04-2021

Прошу помочь. Подскажите, пожалуйста, как улучшить качество на выходе. Как мог, сделал. Но может я упускаю какие-нибудь важные опции.


Тест-файл.

Редкий текст, хотел бы его попробовать через файнридер пропустить. Но с таким качеством это будет проблематично.

Автор: bolega, Отправлено:08:55 04-04-2021

asku
Поменяйте метод correct illum на safe. Можно уменьшить unsharp до 6/5
На закладке enhance я бы добавил blur=1 или даже blur2=1

Автор: asku, Отправлено:17:28 04-04-2021

bolega спасибо! Значительно лучше.
А на закладку enhance (Smooth, Blur, Sharpen и т.д.) я даже внимания не обращал...

Автор: daa2013, Отправлено:10:26 14-04-2021

Я снова про ячейки тессеракта.
На них можно было бы не только лослесс зоны подвязать.
Но и аншарп зоны. BW -зоны.

Вот, например, замазывается дырочка в петельке в букве З. Ее можно бло бы бинаризовать с боле низким порогом. и персональный аншарп букве делать.
Или пропадают ножки у буквы М - бинаризовать буквы М с более высоким порогом.

Автор: bearjrgm, Отправлено:11:49 14-04-2021

bolega
а можно как-то подключить 4 версию тессеракта? Интересно посмотреть на результаты.

Автор: bolega, Отправлено:12:27 14-04-2021


Цитата:
Вот, например, замазывается дырочка в петельке в букве З.

Защита и сейчас есть. Только замазывается она в з как правило из-за fill hole, а не порога. Вот именно защита от Fill hole заданных букв сейчас и есть. И ввел ее в свое время именно из-за "з"

Цитата:
Или пропадают ножки у буквы М - бинаризовать буквы М с более высоким порогом.

И это давно есть.
Интересно, whatsnew кто-нибудь когда-нибудь читал? Похоже, что никто и никогда.


Цитата:
а можно как-то подключить 4 версию тессеракта?

Чтобы подключить, нужно купить новую версию DLL. Самому ее создавать у меня ни времени, ни сил нет. Цена ее для меня великовата, я не готов столько тратить. И еще автор не дал информации о ее совместимости с версиями компилятора. Если она окажется несовместима с той, на которой я собираю СК, все будет напрасно, компилятор из-за нее я менять не собираюсь.
Наверно, есть еще вариант вызова T через комстроку. Но это будет слишком долго с точки зрения быстродействия.






Автор: TelecomUral, Отправлено:13:05 14-04-2021


Цитата:
Интересно, whatsnew кто-нибудь когда-нибудь читал? Похоже, что никто и никогда.

я читал И очень правильно вы развиваете именно это направление с защитой. Я после экспериментов U235 с марашками окончательно понял, что ваш путь правильнее.

upd
а что там по деньгам за dll ?

Автор: bearjrgm, Отправлено:13:37 14-04-2021

bolega
спасибо за ответ

Автор: bolega, Отправлено:15:24 14-04-2021

Я защитой (ужирнением порога) пользуюсь в основном не для буквы "м", а для "н" и "и". Причем СК позволяет увеличить порог не для всей буквы (это было бы некрасиво и выделялось бы на фоне остальных букв), а для ее части, т.е. например, для пространства в области перемычек. Тогда ужирнение практически не заметно.
Еще одно применение (редкое) связано не с ужирнением, а наоборот, с понижением порога для области серифов (вблизи гориз. центра букв) , чтобы они не сливались друг с другом. Иногда это бывает полезно для букв "н" (сверху и снизу) и "п" (снизу).

Автор: bolega, Отправлено:18:00 14-04-2021

TelecomUral

Цитата:
а что там по деньгам за dll ?

Я ни от кого это не принимаю

Автор: niccolo, Отправлено:13:28 16-04-2021

bolega

А прикрутить поддержку пакетов FR можно?
Чёрно-белые тифы пакетов находятся в папках с номерами файлов и имеют название bwpage.frdat.
Файл открывается любым редактором путём переименования в .tif.

Сохраняться такие файлы должны с исходным именем и бэкапом исходного файла.


Структура пакета последних версий ФР делает очень неудобной работу с графическими файлами пакета вовне.

Отсутствие залочки блоков от перераспознавания и функции автоматического перераспознавания исправленных блоков делает менее проблемным исправление оригинала картинки (запечатка дефектов, например), нежели текста в блоке. Тем более что на такие дефекты в SK часто не обращаешь внимание.
Про убогость встроенного редактора изображений ФР я даже говорить не буду.

Да и при исправлении изображения в SK, а не в ФР не приведёт к утрате расставленных блоков на странице.

Кроме того из ФР можно исправлять искажение строк, которое в 15 версии стало гораздо лучше, чем в предыдущих версиях.

Автор: daa2013, Отправлено:11:11 19-04-2021

Чищу с глифами в 6.71 в режиме подсветки спеклов с отключенной по OCR подсветкой знаков препинания. (Если это может играть роль). Удобная штучка на самом деле.
Вставка глифа (пасте) у меня подвязана на хоткей Ctrl+Q.
Сравниваю с 6.61 (правда, без OCR-подсветки. там не так, и по моей моторной памяти раньше тоже было не так).
Включено автопозиционирование.

Итак, суть проблемы.

Раньше:
пасте глиф (встал точно) - пошевелил мышь - снова пасте тот же глиф (снова встал точно)

Теперь:
пасте глиф (встал точно) - пошевелил мышь - снова пасте тот же глиф (встал неточно, сдвинулся вслед за мышью)

автопозиционирование теперь включается только после дополнительного клика по картинке


Автор: bolega, Отправлено:14:30 19-04-2021

В новой версии 6.71 так и задумано, это не баг и не проблема.
Проблема скорее у пользователя, который хочет дважды вставить один и тот же глиф в одно и тоже место.

Автор: daa2013, Отправлено:19:48 19-04-2021

Нет, это проблема, причем серьезная. Потому что раньше, если курсор был в неудачной для автопозиционирования точке, вставку (хоткеем Ctrl+Q) можно было (хоткеем Ctrl+Z) отменить, пошевелить мышку и вставить снова, чтобы глиф встал правильно.
Теперь же вместо того, чтобы встать правильно, он просто смещается относительно предыдущего неправильного положения и встаёт еще хуже. А каждый раз лишний клик делать - не накликаешься. (Видимо, только если предварительно наклюкаешься ... )

Раз так было "задумано", то добавьте в преференсез для глифов чекбокс, который возвращает предыдущее поведение.

Автор: daa2013, Отправлено:04:48 18-05-2021

Опечатка в сообщении после обработки:

finilized вместо finalized

Автор: D1D1D1D, Отправлено:18:20 20-05-2021

Здравствуйте. Как обработать такой случай — текст на картинке? — https://disk.yandex.ru/i/rFsELGmtHFdtwA

Автор: TelecomUral, Отправлено:04:20 21-05-2021

D1D1D1D
непонятно, чего вы хотите в итоге.

Такие картинки - как полноцветные журналы, в jpeg и точка. А если пытаться выделить черный текст в передний слой, то перепада яркости кое-где не хватит для отделения от фона. Ну, можно маленькими зонами попробовать это победить, разными порогами для разной бледности текста. Только смысла мало, ибо трудоёмко. Проще уж перевёрстку страницы сделать.

Автор: daa2013, Отправлено:06:25 21-05-2021

Я бы отделял текст путем кодирования джву и выдергивания из него маски.
Потом ее почистить с глифами надо и поверх исходника наложить.


https://disk.yandex.ru/d/CUdBULC9rQShAA

Автор: D1D1D1D, Отправлено:14:41 21-05-2021

TelecomUral
Хотелось бы быстро и красиво обработать множество страниц. Вдохновляюсь вот этим роликом — https://youtu.be/HbW8MPPzdEo Используемым там фильтром неплохо получается выделить и текст и изо.

daa2013
Интересно. В сочетании с методом выше наверно и все буквы получилось бы вытащить на передний план точнее. Можно подсказку, как и чем вы выполняли эти действия? Кодирование — это наверно "DjVu Small". А чем потом извлекать маску и накладывать поверх исходника?

Автор: TelecomUral, Отправлено:14:52 21-05-2021

оффтоп

D1D1D1D
Насчет вытаскивания букв. Я напомню, что в последних версиях DSM появился редактор зон. Вроде бы его задумка в том, чтобы вручную уточнять сегментеру, какие куски картинки обязательно отправлять в передний слой. В данном случае такая фича может помочь - у daa2013 далеко не все буквы пошли в маску.

Автор: D1D1D1D, Отправлено:15:16 21-05-2021

TelecomUral
В итоге вот так получилось по методу из ролика —

DJVU — https://disk.yandex.ru/d/dUy9CIh56HToww
PDF — https://disk.yandex.ru/d/YejceRSi9ahQAQ

Произведена обработка фильтром с уменьшением в 300dpi (чтобы розетки уменьшить), а потом Topaz Denoise. Как, по-Вашему?

Автор: TelecomUral, Отправлено:15:35 21-05-2021

D1D1D1D

Цитата:
Как, по-Вашему?

главное, чтоб вам нравилось

Ну а мне сильно не нравится - забеленные места появились, как передержка при проявлении. Оригинальный скан много приятнее, цвета "правильнее", соотносятся хоть между собой гармонично. И вас ведь про конкретику спрашивал - чего ж вы-то хотите от обработки. Тема про СК. А занимаемся "внешним видом".

Автор: D1D1D1D, Отправлено:15:37 21-05-2021

TelecomUral

Цитата:
В данном случае такая фича может помочь - у daa2013 далеко не все буквы пошли в маску.

Поэтому предполагаю, что если сначала произвести обработку как предложено в ролике, а потом извлекать маску, она точнее извлечется, так как буквы уже будут хорошо выделены.


Добавлено:
TelecomUral
Насчёт забеленного согласен, но если как метод рассматривать, в отношении простоты и скорости — он лучше других?

Автор: daa2013, Отправлено:16:19 21-05-2021

Кодирование и вытаскивание - Document Express (Enterprise).
Хотя, как уже тут в ветке обсуждали, разбирать можно DjvuLibre.
Для сборки задников и масок я использую FSD, но можно и DjvuSmallMod.

"Не все буквы пошли в маску". Должно делаться глифирование . Тогда они и вставятся.
Не захватился всего с десяток букв. На такую страницу - это мелочь.

ЗЫ
По- любому проще букву как глиф вставить, чем ее в зону захватывать, что в СК, что в DSM.


Автор: TelecomUral, Отправлено:20:08 21-05-2021

оффтоп

D1D1D1D

Цитата:
в отношении простоты и скорости — он лучше других?

есть такая штука "проектный треугольник"... и проигрываете вы в качестве.

Автор: D1D1D1D, Отправлено:20:31 21-05-2021

TelecomUral
Для качества надо разделить по слоям? Я и хочу так, предварительно обрабатывая в фотошопе, чтобы более контрастный текст лучше извлекался. Написал daa2013, так как пока не понятна последовательность, где и в которой надо обрабатывать.

Автор: TelecomUral, Отправлено:03:30 22-05-2021

опять оффтоп. Всё стараюсь это прекратить, но вы не реагируете.

D1D1D1D

Цитата:
Для качества надо разделить по слоям?

я про другое. Книга служит некой цели коммуникации. Что-то передать от автора читателю - образы, знание, смысл, "кусок" культуры. Качество как термин обозначает коэффициент при передаче.
Поэтому "для качества..." надо вам понять, что вы передаете. Чтобы вычислить коэффициент.


Добавлено:
daa2013

Цитата:
Не захватился всего с десяток букв

Восемьдесят семь штук
https://disk.yandex.ru/i/zWLczVunTnq6GA

Автор: hydrochaeris, Отправлено:14:50 31-05-2021

Как связаться с автором ScanKromsator для коммерческого предложения? (В смысле, я хочу предложить автору денег, а не наоборот.) Электронный адрес bolega@hotmail.ru, который везде указан, уже лет сорок не работает, а личное сообщение пользователю bolega через этот форум не удаётся отправить. Мне пишут: «вам запрещено отправлять сообщения, если вы считаете это ошибкой, обратитесь к администратору». Я обращаюсь по почте на support@ru-board.com, а там, естественно, никто никогда не отвечает. В общем, как связаться с автором?

Автор: shch_vg, Отправлено:15:12 31-05-2021

hydrochaeris
Страшное дело - вы 40 лет не можете связаться с автором СК.
Считайте, что уже связались, захочет - выйдет на связь.

Автор: trion1, Отправлено:15:16 31-05-2021

hydrochaeris
В ПМ для нубов немного ограничено:
http://forum.ru-board.com/topic.cgi?forum=13&topic=2383&start=1160#20

Автор: D1D1D1D, Отправлено:16:26 19-06-2021

Возможна ли обработка полос между буквами, подобных которым много в книге? Как-то их затереть?

Автор: TelecomUral, Отправлено:18:59 19-06-2021

Ещё идея про глифирование пришла на ум
Не просьба по функционалу, а так просто.
Отчего бы не ввести режим в редакторе: по двойному щелчку на символе подбирается глиф из заданного спецнабора. То есть не мы определяем букву умом и глазами, а СК сам подбирает идеальный глиф по указанному мышкой образцу со страницы.

Автор: D1D1D1D, Отправлено:21:33 19-06-2021

Как следует обрабатывать страницы с частично размытыми участками текста на них — с переходами от нормы к размытию?

Автор: TelecomUral, Отправлено:06:09 20-06-2021

D1D1D1D
вы про CIS-сканеры? Вот такое?


Автор: D1D1D1D, Отправлено:06:26 20-06-2021

TelecomUral
Да-да

Автор: alexarbuzik, Отправлено:11:26 20-06-2021

А где скачать эту новую версию ScanKromsator v6.71?
Благодарю.

Автор: driver1991, Отправлено:11:59 20-06-2021

TelecomUral

Пожалуйста, напишите подробнее.
Разве неравномерность цвета текста обуславливается сканером? У мения старенький Эпсон 33, но подобные картинки достаточно часто втречаются, да и на книжных страницах тоже цвет неравномерный.

Автор: alexarbuzik, Отправлено:12:11 20-06-2021

Версия шесть (любая): обескураживает то, что, в режиме просмотра
результата, - текст обрамлен рамкой и залит раздражающим желтым
цветом. Хотя на выходе файлы имеют нормальный вид с белым
цветом фона текста. Но, самое ужасное, при просмотре
результата с желтым цветом размер полей выдержан очень стабильно,
как указано в задании, а на выходе получаютмя сканы с прыгающими
полями разного размера! Такого в версия 5 не было!
Вот ссылка на задание: https://disk.yandex.ru/d/XMGN7rbK3NBKVA

Автор: TelecomUral, Отправлено:15:03 20-06-2021

alexarbuzik
СК 6.71 в шапке темы ссылки. В Хрестоматии описано что за жёлтый фон. В разделе 2.11.

driver1991
что подробнее написать? Там же написано снизу: unsharp-зона. Все детали есть в Хрестоматии, картинка оттуда. Специально её составляли, чтобы не ждать ответов ни от кого и иметь каждому личную подробную инструкцию почти по всем фичам СК. Функцией поиска по тексту ищется нужный термин и раздел где он встречается. Личный узкоспециализированный гугл, так сказать. Отобрано, вычитано, выверено.

Неравномерность цвета обуславливается чем угодно, в том числе и сканером. Вы вероятно неточно применяете слово "цвет". На картинке яркость понижена у корешка, а не цвет искажён. Бумага дальше от стекла, и света отражается меньше.

Автор: D1D1D1D, Отправлено:16:38 20-06-2021

Не нашел, как пользоваться unsharp-зонами. Это надо создать зону Unsharp, применить фильтр к зоне вручную, сохранить страницу (изменив страницу исходного скана) — а уже потом запускать процесс? Потому что иначе, если просто выбрать unsharp-зону и нажать процесс — на выходе выбранная область затемняется.

Автор: TelecomUral, Отправлено:16:55 20-06-2021

D1D1D1D
мои сканы все хорошие, загибов нет Дадите пример - сделаю видео.

Автор: D1D1D1D, Отправлено:17:03 20-06-2021

TelecomUral
Имелись в виду не загибы, а замыленные участки на тексте. Имеется ли пример для их обработки?

Автор: TelecomUral, Отправлено:17:14 20-06-2021

D1D1D1D
ну я же написал, что у меня хорошие сканеры, CCD. Где-то были примеры от других людей, но со сменой винды до них проблематично докопаться. Был бы свой такой скан, я бы не просил вас.
От вас нужны а)исходник б)результат с точным указанием что вам не нравится на нем. Чтоб глухих телефонов не было.

Автор: D1D1D1D, Отправлено:17:28 20-06-2021

TelecomUral
А-а, понял. Так-то сканы тоже не мои) Вот, пожалуйста — один из средних случаев сложности: https://disk.yandex.ru/d/1Dg0fZ1zdG6yhw

Добавлено:
Результат нужен стандартный, с исправлением замыленного участка, если это в принципе возможно.

Автор: TelecomUral, Отправлено:17:43 20-06-2021

D1D1D1D
Не надо такие сканы брать в обработку Это вытянуть можно только наполовину. Сильное размытие ничем, наверное, нельзя вытянуть в читабельный вид.

Автор: D1D1D1D, Отправлено:17:59 20-06-2021

TelecomUral
А когда размытие не сильное — какой сценарий действий? https://disk.yandex.ru/d/hTdTwPeSva3-8g

Автор: TelecomUral, Отправлено:18:27 20-06-2021

D1D1D1D
https://disk.yandex.ru/i/or1SN1sKjLTzAw

Добавлено:
+
В принципе, метод Вольфа с очень маленьким окошком - тоже хороший способ. Я ставил чувствительность 10 и окно 30.

Автор: D1D1D1D, Отправлено:18:58 20-06-2021

TelecomUral
Большое спасибо! А то бывало, что книга уже уехала, а не сильно мыльные пяточки остались по страницам) Теперь можно без фотошопа обходиться

А насчет этого скана — его делали в какой-то библиотеке и он действительно для обработки не годится

Автор: alexarbuzik, Отправлено:23:38 21-06-2021

Учитывая то, что я никак не могу добиться правильной калькуляции сканов на выходе после процессинга в Шестой версии, я решил вернуться к версии 5.96.2, в которой ранее я не включал опцию C.Smooth. Сегодня включил, проверил работу на одной страничке, все отлично, эффект потрясающий. Но когда включил процессинг на всю книгу - это 324 страницы (все тот же немецкий учебник), где-то в середине процессинга на страницах 150 программа выдает сообщение об ошибке: Access violation at address 0082D0AD in module 'sk.exe'. Write of address 067606F2 и прекращает работу. Когда отключаю опцию C.Smooth, вся книга отрабатывается отлично! Как с этим быть? И еще, где прочитать Вашу Хрестоматию, чтобы выяснить многие вопросы? Благодарю.

Автор: los, Отправлено:00:05 22-06-2021


Цитата:
И еще, где прочитать Вашу Хрестоматию, чтобы выяснить многие вопросы?

ссылки в шапке не подходят?

Автор: TelecomUral, Отправлено:02:03 22-06-2021


Цитата:
Access violation at address 0082D0AD in module 'sk.exe'. Write of address 067606F2 и прекращает работу. Когда отключаю опцию C.Smooth, вся книга отрабатывается отлично! Как с этим быть?

Снимите сбоящую страницу из списка обработки, сработайте процессинг группы, через Selection.
Но вообще-то новые версии СК выпускаются и для таких случаев тоже. Баги выловлены и устранены.

Автор: bolega, Отправлено:10:36 22-06-2021

alexarbuzik

Цитата:
Учитывая то, что я никак не могу добиться правильной калькуляции сканов на выходе после процессинга в Шестой версии

Посмотрел я ваше задание. Это хорошо, что его выложили. Сразу все понятно. Не каждый так делает.
Проблема с калькуляцией банальная. Посмотрите на размеры своих сканов и на то, что у вас задано как размеры книги на закладке Book. Размеры равны примерно исходным размерам книги, при этом dpi вы увеличиваете вдвое. Т.е. на самом деле размеры книги должны быть раза в два больше, чем у вас задано.
Когда СК видит, что заданные размеры недостижимы (как в вашем случае), тут ему уже не до того, чтобы выдерживать их и сделать одинаковыми; он тогда делает так, чтобы по минимуму отклониться от них.
Увеличьте размеры, либо задайте auto, чтобы СК сам их рассчитал.



Добавлено:
TelecomUral

Цитата:
https://disk.yandex.ru/i/or1SN1sKjLTzAw

Когда размытие сильное, unsharp поможет не сильно. Любые размытия отлично вытянет Topaz! Проблема только, что делать это желательно для выделенного участка а не для всей страницы. Для этого эти участки желательно заключать в зоны, оставлять color=original, dpi=default, корректировать их далее в topaz (через вызов внешнего редактора или раздельно), бинаризовать прямо в окне VR, и делать там же merge.

D1D1D1D

Цитата:
Возможна ли обработка полос между буквами, подобных которым много в книге? Как-то их затереть?

Можно, но в публичной версии фича недоступна. Возможно в следующей версии появится. Новая версия скорее всего выйдет не ранее следующего года.

Добавлено:
alexarbuzik

Цитата:
проверил работу на одной страничке, все отлично, эффект потрясающий.

Этим фильтром надо пользоваться осторожно. На первый взгляд все гладенько получается. Но при увеличении можно заметить, что местами форма букв может излишне сгладиться, пропасть округлость внутренних контуров. Для 300dpi я бы вообще не рекомендовал ее использовать.
Я пользуюсь только опцией gentle, сам csmooth отключен. gentle сглаживает очень аккуратно, можно не бояться.

Автор: alexarbuzik, Отправлено:11:01 22-06-2021

TelecomUral

Цитата:
Снимите сбоящую страницу из списка обработки, сработайте процессинг группы, через Selection.  
Но вообще-то новые версии СК выпускаются и для таких случаев тоже. Баги выловлены и устранены.

Все сделал так, как Вы сказали, однако после этого, на выходе получаются файлы сканов без калькуляции и добавления полей. Нажимаю после этого кнопку Финализация, выдается сообщение "Nothing to do! Process abortec".


Добавлено:

Цитата:
TelecomUral

Благодарю за Хрестоматию, все же сумел скачать, правда, после ее прочтения многое проясняется!

Автор: TelecomUral, Отправлено:11:13 22-06-2021


Цитата:
Благодарю за Хрестоматию

daa2013 благодарите, в основном это его труд - по сборке текстов, примеров.

Автор: alexarbuzik, Отправлено:11:16 22-06-2021


Цитата:
bolega


Цитата:
Увеличьте размеры, либо задайте auto, чтобы СК сам их рассчитал.

Я начинаю всегда работу с auto, а в представленном Вам задании уже указан результат вычисления программой, и несмотря на это, добавления полей не произошло, а потому страницы прыгают. Я никогда не назначаю размеров страницам сам, сначала я предоставляю это сделать программе, в крайнем случае, если все же где-то страница не вписывается в установленный программой размер, тогда я вручную увеличиваю ширину размера и по новому размеру провожу полный процессинг, после чего все странички становятся одинаковыми и приятными.

Добавлено:
bolega

Цитата:
Я пользуюсь только опцией gentle, сам csmooth отключен. gentle сглаживает очень аккуратно, можно не бояться.

Благодарю ха дельный совет, но подскажите, пожалуйста, где эту чудесную опцию gentle в версии 5.96.2 можно взять?


Автор: TelecomUral, Отправлено:11:26 22-06-2021

alexarbuzik

Цитата:
в представленном Вам задании уже указан результат вычисления программой

поставьте auto снова и затем пересчитайте размеры.

Автор: bolega, Отправлено:11:36 22-06-2021


Цитата:
Я начинаю всегда работу с auto, а в представленном Вам задании уже указан результат вычисления программой

Значит, это результат был получен при неверных опциях, либо они в тот момент были другими. Например, вы задали out dpi=300 рассчитали размер, затем поменяли out dpi=600, снова обработали, но fixed-размеры книги при этом остались от предыдущего расчета! Либо: у вас файлы не имеют dpi. Когда при обработке СК спросил вас dpi, вы выбрали не 300, а 600 например. В результате получили ту же проблему, что я описал ранее.
Я вот сейчас на закладке Files задал input(!) dpi=300, размеры поменял на auto, выполнил обработку и расчет размеров, и получил размеры 2688 и 4332. Это в 2 раза больше ваших расчетных, что подтверждает мою мысль, что вы в какой-то момент напутали с dpi. Такие случаи я расжевывал уже сотни, я знаю что говорю.

В вашем задании (после моей переобработки) только обложка не влезла в расчетный размер. В реальности обложка действительно больше. Если все-таки хотите выровнять все размеры включая и обложку, снимите галку на Book>Use average sizes и выполните расчет размеров. Все это конечно нужно делать до финализации. После уже ничего не исправишь, только переобработкой.




Добавлено:

Цитата:
где эту чудесную опцию gentle в версии 5.96.2 можно взять?

В ранних версиях она была как light в списке значений параметра Round

Автор: D1D1D1D, Отправлено:14:50 22-06-2021

bolega

Цитата:
Любые размытия отлично вытянет Topaz!

Имеется в виду Topaz Sharpen?

Автор: bolega, Отправлено:15:06 22-06-2021

Topaz Sharpen AI

Автор: alexarbuzik, Отправлено:18:10 22-06-2021

bolega

Цитата:
В ранних версиях она была как light в списке значений параметра Round

В версии 5.96.2 на закладке C.Smooth в параметре Round есть три значения: low, middle и hiah. Так какой из них тогда соответствует light? Благодарю заранее...



Добавлено:

Цитата:
bolega


Цитата:
Я вот сейчас на закладке Files задал input(!) dpi=300, размеры поменял на auto, выполнил обработку и расчет размеров, и получил размеры 2688 и 4332. Это в 2 раза больше ваших расчетных, что подтверждает мою мысль, что вы в какой-то момент напутали с dpi. Такие случаи я разжевывал уже сотни, я знаю что говорю.  
 
В вашем задании (после моей переобработки) только обложка не влезла в расчетный размер. В реальности обложка действительно больше. Если все-таки хотите выровнять все размеры включая и обложку, снимите галку на Book>Use average sizes и выполните расчет размеров. Все это конечно нужно делать до финализации. После уже ничего не исправишь, только переобработкой.

Знаете, кажется начало получатся! И видимо у меня проблема была в том, что когда нажима кнопку Process, у меня всегда выпадает окно предупреждения "Invalid DPM of the file "0001 .bmp"! Select valid value for DPI:"
По умолчанию там всегда стоит кнопка на 300, но я всегда выбирал 600, учитывая, что в настройках закладки Files выходной DPI стоит 600. Очевидно, правильным будет выбирать в окне предупреждения DPI 300, как имеет место в Input DPI? Или не прав?



Добавлено:
Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему за всех вас!
Особенно благодарю TelecomUral!
TelecomUral

Цитата:
Снимите сбоящую страницу из списка обработки, сработайте процессинг группы, через Selection.  
Но вообще-то новые версии СК выпускаются и для таких случаев тоже. Баги выловлены и устранены.


Выполнил Ваши рекомендации, и в версии 5.96.2 заработал C.Smooth, причем выбрал Scale output равным 2. Считаю, что версия 5.96.2 очень стабильно работает и дает превосходные результаты.

Исходные сканы учебника по ненецкому очень плохие, но в целом получился результат очень неплохой, даже удовлетворил моего взыскательного к книгам сына, именно он нашел эту книгу выброшенной на улицу и принес мне.

Еще раз благодарю, но все же, версия 6.71 нестабильна в работе!

Автор: Vixerunt, Отправлено:22:55 22-06-2021


Цитата:
версия 6.71 нестабильна в работе

Попробуйте добавить sk.exe в исключение DEP.

Автор: bolega, Отправлено:08:09 23-06-2021


Цитата:
версия 6.71 нестабильна в работе!

Вполне возможно. Но интересно, что с момента ее выхода никто ни одного баг-репорта не предъявлял. Это говорит о том, что либо ее особо не юзают, либо юзают в объеме предыдущей версии. Из чего следует, что выпуск новых версий у меня упал в приоритете до нуля, и отложен на год-два.

Автор: TelecomUral, Отправлено:08:24 23-06-2021

нуу... новые версии это ж всё-таки не только исправление багов...
Вон, марашки хотят удалять.
Но я соглашусь, что "в объёме предыдущей"

Автор: D1D1D1D, Отправлено:09:17 23-06-2021

bolega

Цитата:
бинаризовать прямо в окне VR, и делать там же merge

Можно подсказку, где именно в окне RV бинаризовать и объединять?


Автор: TelecomUral, Отправлено:09:37 23-06-2021

D1D1D1D
what's new опять не читали
https://disk.yandex.ru/i/BqjwuCFclRX1sg

+
merge


Автор: alexarbuzik, Отправлено:09:56 23-06-2021

Уважаемые! Вопрос: на закладке "Binarization" есть опция "B/W-zone threshold", по умолчанию она отключена. Какой смысл этой опции и когда ее надо включать? Благодарю...

Автор: bolega, Отправлено:10:08 23-06-2021

D1D1D1D
Это только в последней версии.
Сначала бинаризовать с помощью панельки Image adjustment. Там можно порог подбирать в режиме preview. Но это еще не все, после такой бинаризации останется только два цвета, но формат файла как был цветной, так и останется. Поэтому после бинаризации в режиме Zones надо в верхней панели на кнопке форматов нажать стрелку и выбрать 1bit. Потом нажать на кнопку. В итоге формат станет ч/б. Только потом в контекстном меню зоны дать команду слияния merge. Если не поменять формат, то после слияния страница из ч/б станет 24bit-ной что плохо, хотя и останется визуально ч/б.

P.S. По хорошему надо снять видео как это делать.

Добавлено:

Цитата:
Вопрос: на закладке "Binarization" есть опция "B/W-zone threshold", по умолчанию она отключена.

На странице можно использовать bw-Зоны, т.е. участки со своим индивидуальным порогом бинаризации. Этот порог для зоны и задается там. Если bw-зон на странице несколько, то порог все равно будет один на все.

Автор: D1D1D1D, Отправлено:10:33 23-06-2021

Спасибо, юзабельно. Еще такой вопрос насчёт работы с СК — в связке с Topaz Sharpen`ом. Как быть с тем, что Topaz Sharpen вроде не открывает тифы, которые в виде зон делает СК? Тифы конвертировать в джипеги надо?

Автор: alexarbuzik, Отправлено:10:40 23-06-2021

bolega

Цитата:
На странице можно использовать bw-Зоны, т.е. участки со своим индивидуальным порогом бинаризации. Этот порог для зоны и задается там. Если bw-зон на странице несколько, то порог все равно будет один на все.

Благодарю, теперь понятно!


Добавлено:
Еще вопросы: непонятно значение в настройках Options опции Crop page content at finalization stage. Я что-то не увидел разницы в ее включении или отключении?
Неясен смысл кнопки в VR "Режим качественного отображения", ведь выходной файл в реальности будет просматриваться в других редакторах не таким же, а таким, какой он есть в действительности?
Благодарю...

Добавлено:
Еще вопрос: я прописал в Options пути к трем графическим редакторам. Но в VR я так и не смог найти кнопку, которая позволяла бы мне открывать эти релакторы для редактирования. Как мне быть?

Автор: TelecomUral, Отправлено:12:37 23-06-2021


Цитата:
Но в VR я так и не смог найти кнопку, которая позволяла бы мне открывать эти релакторы для редактирования

в режиме Zones ПКМ на зоне в правом окне. Там Special... и в самом низу эти редакторы будут. Если СК 6.71.
Если 5.96.2, то... там же

Автор: alexarbuzik, Отправлено:13:06 23-06-2021

TelecomUral

Цитата:
в режиме Zones ПКМ на зоне в правом окне. Там Special... и в самом низу эти редакторы будут. Если СК 6.71.
Если 5.96.2, то... там же


В версии 9.71 Special... есть, но у него два затененных Show Selction
и Crop Selction, никаких названий редакторов нет, хотя я их прописал в Option и дал та же им названия. В версии 5.96.2 Special... нет вовсе!!!

Добавлено:
Ребята! Будьте внимательны при даче ответов, так халатно, т.е. лишь бы отписаться, вести себя неприлично!

Автор: TelecomUral, Отправлено:13:47 23-06-2021


Цитата:
никаких названий редакторов нет

а вот у меня есть.



И в 5.96.2 есть:



И что дальше- ? Напрашивается ответ "Тогда СК не для вас". Если вы пункты меню путаете.

Автор: alexarbuzik, Отправлено:14:31 23-06-2021

TelecomUral

Цитата:
И что дальше- ? Напрашивается ответ "Тогда СК не для вас". Если вы пункты меню путаете.

Прошу прощение, но Вы тоже даете советы не тщательно проработанные! Это факт! Я смотрел в главном окне программы. В 5.96.2 в VR, действительно по ПКМ появился на PZ появился Special..., а внизу ссылки на все мои три редактора. В версии 6.71, проделал то же, что и Вы, появилась та же картинка, что и у Вас, но внизу после Units никаких ссылок на редакторы вовсе нет, хотя в настройках программы все прописано!

Я СК использую с версии 2,6а, т.е. где-то с 2006 года. Сделал с помощью его сотню книг, в этом году начал использовать более поздние версии и дошел до 6.71, которой недоволен! Полюбил очень 5.96.2, пока буду на ней. Мои работы выложены в основном на моем сайте (кстати, писал весь код сайта ручками, потому лишнего ничего нет), а также на Флибусте, начните хотя бы с адреса: http://www.u92698ze.beget.tech/2s/lopuhin.html
Обложку для сайта сделал с помощью конструктора Google, и большего уродства для дизайна я не встречал, потому пишу только руками: https://sites.google.com/view/yura123
Новшества, которые ввели в СК, очень хорошие, но с ними надо разбираться и осваивать, с наскока ничего не получится. С помощью Аллаха Величайшего Благословен Он и Хвалою Ему, я это сделаю, ин шэ Аллаh, Он мне всегда во всем помогал ранее, и я Аллахом очень доволен!
Поэтому не обижайтесь, если что-то пишу не так! Да будет доволен Вами Аллах Величайший за Ваш прекрасный и бескорыстный труд. Это Ваше благодеяние Им обязательно через владычествующих небес записывается!
Аллаху Экбэр! (Аллах Величайший!)

Добавлено:
Прошу прощения, описка, версию 2.6а использу не с 2006 года, а с 2003 года!

Автор: TelecomUral, Отправлено:15:12 23-06-2021

alexarbuzik

Цитата:
Вы тоже даете советы не тщательно проработанные! Это факт!

какой же это факт У меня было написано "в режиме Zones". Разве в главном окне есть "режимы". Да и Топазом болега советовал пользоваться в VR.
Я понимаю, что программа сложная.

Автор: alexarbuzik, Отправлено:15:24 23-06-2021

TelecomUral

Цитата:
какой же это факт У меня было написано "в режиме Zones". Разве в главном окне есть "режимы". Да и Топазом болега советовал пользоваться в VR.
Я понимаю, что программа сложная.

Ладно, я перед Вами извинился! А про Топаз болега услышал только на Вашем форуме, выложите толковое описание на эту программу и смысл ее назначения, тогда люди будут ею пользоваться. Поймите, благочестивые люди очень заняты всегда и читать длинные романические инструкции у них просто не хватает времени и сил. Меня спасает то, что Аллах Величайший Благословен Он и хвалою Ему, в молодости научил меня очень быстрому чтению, иначе, катастрофа, читать многие длиннющие инструкции!
Всего доброго, будут вопросы, не обессудьте, обращусь!

Добавлено:
Да и хочется добавить: я человек советского времени и привыкший читать советские книги, особенно научно-технического характера. Поверьте, и можете это проверить, так толково писались книги, даже объемом в 400-900 страниц, что их было всегда приятно читать, особенно на досуге. В настоящее время так книги уже не пишутся. Многословные, большие по объему, а толкового мало. Чтобы разобраться, надо сидеть и специально прорабатывать каждое предложение! Это не книги, а иллюзия научного творчества, видимость работы для других, на самом деле не ставящая целью научить быстро и достаточно глубоко читающего. К сожалению, а это мое мнение, в основном инструкции к СК, много написанные по количеству, страдают именно таким недостатком. Я с молодости увлекался электроникой, обучился всему сам благодаря Аллаха Величайшего благословен Он и хвалою Ему,именно потому, что читал советские книги очень грамотно и толково написанные. В настоящее время книги по электронике пишутся уже не так! Поэтому и ценю книги по различным областям знаний, написанные в советское время. Это мое мнение - ИМХО!

Автор: alexarbuzik, Отправлено:21:57 23-06-2021

Уважаемые! Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!

Сегодня закончил наконец-то расставление резаков и установление правил в задании книги большого формата, страницами 450, с обильным количеством рисунков цветных. Работу проводил эту много дней, как сами понимаете. Все делал исключительно версией 5.96.2, но и для сравнения версией 6.71. Наконец-то наступил долгожданный час нажатия клавиши Process! Прошло некоторое время и открылось окно VR. Чудо! Так стабильно были вычислены граница с полями книги, такого ранее у меня не было. Работать в VR стало очень удобно и приятно. Фактически постобработкой в нем, все задачи решаются. Я восхищен! Душа поет хвалу для Аллаха и в ответ получаю наслаждение!

Как ни крутил ранее с тем же заданием в версии 6.71 - ничего и близкого не было, одни страдания!

Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему за чудесную версию 5.96.2. Советую всем, кто желает наслаждаться оцифровкой книг, получая удовольствие и радость от своего труда, с результатом работы превосходного качества, - используйте версию 5.96.2.

Правда, по совету всех вас, я прописал эту программу в DEP. Этот прием мне знаком давно и там у меня громадный список программ, которые работают стабильно после этого.

Да будет доволен Вами Аллах Величайший за чудесную версию 5.96.2!

Аллах Единственный, Аллах Абсолютный, Аллах Величайший!
(по-арабски: Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!)

Автор: slava_kry, Отправлено:07:23 24-06-2021

alexarbuzik

... Это так, взгляд со стороны.

Вы не видите странности в том, что читать вы любите "выжимки", а писать любите "словесные полотна".
Потом начинаются жалобы на "воду"...
А всё решается просто - нужна основа, как школа с институтом, НО - она никому неинтересна! Это же "вода" - когда её читать и думать!?!

Захотите ответить - пишите в личку.

Автор: TelecomUral, Отправлено:07:49 24-06-2021

slava_kry

Цитата:
писать любите "словесные полотна".

во-во. А всё потому что люди своё время ценят ого-го, а вот чужое ни на грош.
Вчера kamenkapenza тридцать минут жевал видеожвачку, описывая "свой вопрос по СК". Который зафиксировался в четырёх словосочетаниях - сохранить оригинальное имя файла, размножить зону по всем сканам, зафиксировать масштаб оригинального скана, и точно выбрать цвет раскраски зоны. Я ответил и то вдвое короче

Автор: D1D1D1D, Отправлено:09:46 24-06-2021

Они-с "благочестивые люди", им некогда-с.


Автор: alexarbuzik, Отправлено:10:54 24-06-2021

TelecomUral

Цитата:
Который зафиксировался в четырёх словосочетаниях - сохранить оригинальное имя файла, размножить зону по всем сканам, зафиксировать масштаб оригинального скана, и точно выбрать цвет раскраски зоны. Я ответил и то вдвое короче

Лично я видеоролики не люблю, потому что у них, чтобы добраться до сути, нужно прослушать много пустых, не относящихся к сути проблемы, слов, а книги, если даже, что-то не нравится, очень легко можно пропустить, добравшись до сути.

Вы, конечно, ответили вдвое короче, но Ваш ответ будет понятен только тем, кто очень хорошо знает все опции или "режимы", как любят здесь выражаться некоторые, и использующие программу почти 20 лет, как я.

Товарищи! Надо учиться выражать мысли коротко, но и достаточно понятно для тех, кто неопытен. Поверьте, опытные люди подобные вопросы не задают!

Кстати, кто-нибудь может объяснить мне, что означает картинка "off-topic", потому что я в принципе не приемлю иностранщины, особенно в русском богатейшем и красивейшем языке, и мне непонятны много употребляемые в наше время иностранщины типа: бренд, тренд и прочая чушь, можно подумать, что русский язык настолько слаб, что не в состоянии найти даже одного эквивалента этой мерзости.

Я считаю, ИМХО, что современная власть делает все, чтобы уничтожить прекраснейшую красоту этого ближнего мира - русский язык, равному которому может быть только арабский язык. Уничтожая язык населения, уничтожается и его носитель - народ! Вы этого хотите? Я нет, и мне жаль, что человек, применивший мерзкую иностранщину в мой адрес - "off-topic", стал жертвой современного правительства, которое, в отличие от советского правительства, не следит за чистотой культуры русского языка. В советское время и было введено понятие "иностранщина", чтобы оберегать людей от влиянии в языке русского народа иностранной культуры, которая, как теперь оказалась, есть не что иное, как откровенная педерастия! Прошу ко мне иностранщину в общении со мной не применять!

Автор: D1D1D1D, Отправлено:11:45 24-06-2021

alexarbuzik

Цитата:
я в принципе не приемлю иностранщины

А почему для "ИМХО" исключение? Или иностранное слово "принцип" тоже как-то иначе надо понимать?

Автор: alexarbuzik, Отправлено:12:51 24-06-2021

D1D1D1D

Цитата:
А почему для "ИМХО" исключение? Или иностранное слово "принцип" тоже как-то иначе надо понимать?

Уважаемый! Я понимаю Вас, но Ваше представление об этой аббревиатуре, есть следствие влияния на Вас современной иностранщины, вводимой современным правительством.

Почему, такие как я, ненавидящие иностранщину, все же используем это слово?

Ответ прост: потому что расшифровывается она, эта аббревиатура, следующим образом, родным, понятным русским языком!

Расшифровка: Имею Мнение Хрен Оспоришь!

А не угодливыми, педерастическими переводами с английского: ( In My Humble Opinion ) - по моему скромному мнению!

Если бы эта аббревиатура имела только такой перевод, который на русский переводился бы иными словами, как в данному случае, то аббревиатура имела бы вид ПМСМ, мы бы, конечно, эту аббревиатуру не применяли, но именно потому что русский язык четко и однозначно расшифровывает ее так, как я показал, и все истинные любители русского языка это знают, потому он и в ходу у нас, потому что сказав ИМХО, Вы уже возразить ничего не сможете!

Автор: TelecomUral, Отправлено:12:54 24-06-2021

оффтоп

Цитата:
alexarbuzik
Надо учиться выражать мысли коротко, но и достаточно понятно для тех, кто неопытен.

Не порите чушь.
Чтобы было понятно тому, кто "неопытен", разъясняющий должен заранее знать область понятного. Что возможно только при имеющейся истории контакта между людьми.
Именно поэтому я и вкладывался в тексты Хрестоматии, и именно поэтому тексты там столь подробно написаны. Чтобы обучающийся мог подтянуть свою область знаний с любого своего начального уровня. В пределах разумного, конечно. В текстах не объясняли цветовые пространства, хранение пикселей, методы архивирования tiff и тому подобное, выходящее за рамки самого СК. И то кое-где сильно расширяли границы текстов, по djvu например.
Отсюда и возмущение моё. Вместо того, чтобы вам самому повышать свой уровень "неофита" в теме СК до уровня "немного понимающего", откуда уже можно более-менее компетентно общаться с профи типа bolega, вы настаиваете на получении "персонального школьного учителя", который с чего-то должен изучать структуру ваших личных понятий и целей, их содержание, взаимосвязи, что весьма непросто, а затем тратить часы на последовательный подъём с этого индивидуального уровня до середнячка. Грубо говоря, мне по умолчанию навязывают роль "школьного учителя" для первоклашки. Но тут взрослые люди со своими личными хотелками сидят. А не первоклашки. Это вы лично, сами по себе и для себя, захотели что-то там обработать. Так и прикладывайте личный труд.

Автор: D1D1D1D, Отправлено:12:58 24-06-2021

alexarbuzik
Ваша расшифровка надуманная и вторичная, а Ваше мнение — это не иероглиф выжженный на небесах, чтобы поблизости не оказалось того, кто мог бы его оспорить)

Автор: TelecomUral, Отправлено:13:07 24-06-2021


Цитата:
alexarbuzik
Я считаю, ИМХО, что современная власть делает все, чтобы уничтожить прекраснейшую красоту этого ближнего мира - русский язык

Тоже бред бредовый: носителем языка является сам человек, он его получает от родителей. И если соглашается от языка отказаться, то в этом отказе не власть виновата, а сам человек. Потому что решение принимается в голове человека.
Напоминает "Кавказскую пленницу", когда Шурик попросил героиню идти по дороге, потому что ишак идёт строго за ней. "Так это ишак! А я думала..." - "Нет! Он!!"

Автор: alexarbuzik, Отправлено:13:14 24-06-2021

TelecomUral

Цитата:
Именно поэтому я и вкладывался в тексты Хрестоматии, и именно поэтому тексты там столь подробно написаны. Чтобы обучающийся мог подтянуть свою область знаний с любого своего начального уровня. В пределах разумного, конечно.

Уважаемый! Я ценю Ваши знания, лично мне они очень помогли, за что, как Вы знаете, я благодарю Аллаха Величайшего за Вас и всю Вашу команду, да будет доволен Вам Аллах Величайший за Ваши прекрасные труды!

Вашу Хрестоматию сейчас читаю, и, надо сказать, мне очень нравится она, написано, кстати, толково, и много полезного есть для меня, использующего Вашу программу уже почти 20 лет.

Одно мне не нравится: формат CHM. Вся проблема в том, что этот формат не позволяет увеличивать размер шрифта легко и просто, а мне, с моим зрением в почти 70 лет, ин шэ Аллаh, трудно читать такой шрифт и приходится использовать экранные лупы, а это не так удобно для чтения книг. Мне думается, что Вам следовало бы выложить Хрестоматии (очень полезные для всех) также и в формате HTML, который легко читается в любом браузере, где с масштабированием шрифтов нет проблем, все очень легко делается колесиком мышки, тем более исходники текста у Вас имеются, и все делается крайне просто.

Конечно, можно самому переконвертировать Ваш формат в HTML, но, сами понимаете, у благочестивых людей очень мало времени свободного!

И последнее, на Ваш сайт в основном приходят люди "школьники", а потому Вам надо становиться учителями, иначе, Вас просто понимать не смогут, а потому зайдя на сайт, потом уже снова приходить не станут!

Грамотным людям здесь делать и нечего, разве что изощряться друг перед другом своими знаниями, кто круче?!

Автор: TelecomUral, Отправлено:13:19 24-06-2021


Цитата:
а потому Вам надо становиться учителями

"А Карфаген должен быть разрушен".

Автор: alexarbuzik, Отправлено:13:20 24-06-2021

D1D1D1D
Вы сами себе противоречите, расшифровку русской аббревиатуры я дал, разве неправильно звучит? Дал и аббревиатуру перевода на русский с английского, разве неверно?

Думайте, что пишите, а терпения нам не занимать, потому что Аллах Величайший, благословен Он и хвалою Ему, в Ал-Куране учит нас терпению и, особенно, тогда, когда встречаешь человека, желающего с тобой спорить. А мы не имеем желания спорить, это - повеление нашего Господина Аллаха Величайшего!

Автор: D1D1D1D, Отправлено:13:22 24-06-2021

alexarbuzik
В Windows 7 и выше — шрифт в CHM-файлах можно увеличивать зажав контрольную клавишу (Ctrl), и прокручивая колесо мыши.

Добавлено:
alexarbuzik
Речь была о том, что ваша расшифровка аббревиатуры вторична по отношению к англ. оригиналу. Формально можно выдумать расшифровку любой западной аббревиатуры, но по сути это будет тем же ковылянием в западном хвосте и обезьянничаньем. Вам легко не спорить, потому что ваше мнение хрен оспоришь.

Автор: alexarbuzik, Отправлено:13:28 24-06-2021

TelecomUral

Цитата:
И если соглашается от языка отказаться, то в этом отказе не власть виновата, а сам человек. Потому что решение принимается в голове человека.

А для чего тогда существует власть? Для сбора налогов и только? А налоги для чего собираются?

Власть существует только для одного: для обеспечения в государстве справедливости и закона! А это невозможно, если власть не станет воспитывать людей в правильном направлении. Или Вы считаете, что советская власть была глупой, что уделяла первостепенное значение воспитанию населения, особенно молодежи?


Добавлено:
D1D1D1D

Цитата:
В Windows 7 и выше — шрифт в CHM-файлах можно увеличивать зажав контрольную клавишу (Ctrl), и прокручивая колесо мыши.


Цитата:
Речь была о том, что ваша расшифровка аббревиатуры вторична по отношению к англ. оригиналу. Вам легко не спорить, потому что ваше мнение хрен оспоришь.

Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему, и да благословит Он Вас за Ваш прекрасный ум! Вы все правильно поняли, потому мне нравится аббревиатура ИМХО, снимает всякие споры, а я спорить не люблю, Аллах Величайший запрещает, благословен Он и хвалою Ему!

Вся беда в том, что с 2003 года я работаю только на w2k3, переделанную мною под клиентскую систему, т.е. серверные возможности отключены. Работает система безупречно, все функции отлично выполняет, кроме масштабирования в CHM. Даже не переустанавливал систему уже 10 лет.

Все что выше Vista я ненавижу!


Добавлено:
Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!

Все, разобрался с версией 6.71, заработала превосходно! И все благодаря толково написанной Хрестоматии, вот вам и польза от толковых книг. Но, честно сказать, намудрили в этой версии, просто жуть! Но версия замечательная, пожалуй перейду на неё!

Да будет доволен вами всем Аллах Величайший за ваши прекрасные труды!

Автор: alexarbuzik, Отправлено:09:07 25-06-2021

Хвала для Аллаха Господина мироа, Превознесен Он и Хвалою Ему! Нашел как читать CHM на w2k3 с масштабированием шрифта: через FBReader!

Автор: alexarbuzik, Отправлено:12:49 27-06-2021

Мир Вам, уважаемые!
К сожалению, но Ваша SK_Compendium_v2.1.chm (в народе называемая Хрестоматия 2.1) имеет ошибку в компиляции файла CHM, в результате чего пользователи Linux-систем открыть его не могут без дополнительных ухищрений в поисках программы, которая может эту ошибку проглотить и открыть файл.
Windows XP и выше, эту ошибку проглатывают и открывают, а вот Linux-системы это сделать не могут.

Установленный в них по умолчанию FBReader его открыть не может, потому что из-за ошибки в коде (а это как видимо XML-файл) неправильно прописанная команда-тэг, заставляет при запуске Хрестоматии читать его как текст значимого содержимого для чтения, а поскольку это на самом деле не так, FBReader просто его отказывается открыть.

Ошибка находится в следующей команде: ") .addClass("b-article__headerSide m-article__headerSide__nav") ) .append( $("
") .addClass("b-article__headerSide m-article__headerSide__buttons") .append( $("
").addClass("b-controlButtons") .html("") ) ) ) ); } //]]>

Во всяком случае, линуксоиды Хрестоматию 2.1 программой FBReader открыть не могут.

SK_Anthology_v1.0.chm такой ошибки не содержит, а потому FBReader в Linux открывает его отлично!

Посмотрите, проверьте, но наши с сыном Linux (Puppy, Puppirus, Astra и другие) SK_Anthology_v1.0.chm открывают в FBReader отлично, а SK_Compendium_v2.1.chm - не открывают. Во всех этих системах стоят по умолчанию FBReader, как программа универсального чтения разных форматов.

Автор: daa2013, Отправлено:19:41 27-06-2021

И как это исправить ?

Линуксом я не пользуюсь.

FBReader сообщает следующее: CHM. Полного открытого описания этого формата не существует, разные open-source библиотеки поддерживают разные наборы возможностей. Поддержка chm в FBReader написана независимо от стандартных библиотек вроде chmlib, так что отображение может отличаться довольно сильно.
Так что думаю, это проблема fbreader.

Я могу попробовать скомпилировать chm в более свежей версии DrExplain, но не быстро, так как её у меня нет. И не факт, что проблема решится. Проще попробовать выставить более крупный дефолтный шрифт chm и перекомпилировать в старой.

Я также, когда выкладывал chm, одновременно куда-то выкладывал rtf- и pdf- версии документа. (См. послесловие.) Могу попробовать поискать эти файлы.

Автор: TelecomUral, Отправлено:20:03 27-06-2021

разумнее и быстрее поискать другой просмотрщик.

Автор: daa2013, Отправлено:21:20 27-06-2021

Вроде Эксплейн позволяет экспортировать проект и как кучку хтмл-ей.
Никогда не думал, что это хоть кому-то может быть удобно.
Но по идее можно попробовать такую папку сделать, а потом архивом выложить.


Upd:

получится как-то вот так:
https://disk.yandex.ru/d/_3IWi47seYnjoA

Это сделано демо-версией эксплейна 6.1. - поэтому рисунки попорчены ватермарками и использована версия проекта хрестоматии, которая еще две недели дорабатывалась. - каких-то кусков текста нет.
Просто если это решает проблему, то я на другом компе поищу и конвертну уже финальную.

Upd2
Ну, и чтоб с кресла два раза не вставать, скомпилировал там же новый chm (старый компилировался в версии 4.9)
https://disk.yandex.ru/d/K_e4I3QWqDw0pg
но думаю, он точно также фбридером не читается.


Автор: alexarbuzik, Отправлено:11:25 28-06-2021

Мир Вам! Благодарю Аллаха Величайшего и Вас за скорую реакцию на указанную мною проблему.

Прежде чем отвечать Вам на Ваши комментарии, хочу отметить, что СК вышел за рамки программы для оцифровывания книг, а прочно вошел в жизнь всякого человека, понимающего, что цифровой документооборот в жизни людей занимает все более и более места.

Поэтому линуксоиды также будут обращаться к СК, но посредством Wine. Так что читать Ваши хрестоматии им придется обязательно, как читал их упорно я.

Пример необходимости СК в документообороте в жизни людей.

Сейчас распространено электронное обращение к органам власти. Ответ при этом они имеют права давать также в электронной форме. Как правило это делают они, сканируя свои ответы и запаковывая их в PDF. Часто даже визуально такие электронные ответы оставляют желать лучшего. Но, представьте, что такой ответ надо вам распечатать и представить на бумаге, например, в суд. Распечатка выходит крайне отвратительной, чтобы улучшить качество, надо возиться с настройками принтера, увеличивая плотность тонера и т.д. И все равно получить результат хорошего качества невозможно. СК решает эту проблему очень быстро: прогоняешь такой ответ через СК, затем либо сканы на выходе можно отлично распечатать, либо, подготовленный им же PDF, уже дает прекрасную печать на бумаге. Так что, СК - это оружие всякого, кто имеет дело с цифровыми документами!

daa2013

Цитата:
Я также, когда выкладывал chm, одновременно куда-то выкладывал rtf- и pdf- версии документа.  (См. послесловие.)  Могу попробовать поискать эти файлы.


Это самое лучшее решение проблемы! Особенно PDF, читается всеми и везде!

TelecomUral

Цитата:
разумнее и быстрее поискать другой просмотрщик.


Да, если сможешь это сделать, зная, что икать! Мы, конечно, благодаря Аллаха Величайшего, Превознесен Он и хвалою Ему, эту проблему также решили - CoolReader, но только версии 3. И на Windiws и на Linux читает Вашу Хрестоматию 2.1 отлично. Но, это для тех, кто знает это или имеет возможность сидеть и искать замену FBReader.

daa2013

Цитата:
Вроде Эксплейн позволяет экспортировать проект и как кучку хтмл-ей.
Никогда не думал, что это хоть кому-то может быть удобно.  
Но по идее можно попробовать такую папку сделать, а потом архивом выложить.


Мы посмотрели Ваш архив, действительно, простому пользователю это очень трудно!

daa2013

Цитата:
Upd2
Ну, и чтоб с кресла два раза не вставать, скомпилировал там же новый chm (старый компилировался в версии 4.9)
https://disk.yandex.ru/d/K_e4I3QWqDw0pg
но думаю, он точно также фбридером не читается.


Верно, мы проверили, все равно не открывается. Однако, как мы заметили, ошибку в коде Вы устранили, вследствие чего даже на CookReader3 открывать и читать такой документ стало приятнее.

Но есть и другое решение проблемы, А почему бы Вам эту Хрестоматию не выкладывать в формате FB2?

Тот же FBReader читает его превосходно!

Добавлено:
Кстати, не говоря уже о том, что под Windows сделано очень много редакторов для FB2, на мой взгляд очень просто и изящно делает FB2 FineReader 12.

Обращаю внимание, что поздние версии FineReader, по сути, ничего нового в плане кодирования не дали, нагромоздили кучу ненужных редакторов, которые сделали программу тяжеловесной, но в итоге качество сканов, а следовательно, и выходного продукта, будь то PDF или другие форматы, ухудшилось.

И еще, если будете делать FB2 этой программой, там есть один глюк: если поставите в настройках качество картинок на "высокое" в настройках FB2 формата, то ни в одном просмотрщике эти картинки не откроются, а если поставите так, как стоит по умолчанию - "небольшой размер (150 dpi)", то все будет очень хорошо открываться везде, а результат очень даже хороший. Попробуйте!

Автор: daa2013, Отправлено:13:55 28-06-2021

Раз имеющийся chm в CoolReader3 открывается, то ИМХО не стоит плодить лишних сущностей и создавать еще один, даже если он и выглядит красивее. А вот когда будет изготавливаться новая версия Хрестоматии, то мы все и порадуемся, что этой ошибки в ней уже не будет.


Цитата:
Это самое лучшее решение проблемы! Особенно PDF, читается всеми и везде!

Увы, нет. Изготовление читабельного pdf требует значительной работы верстальщика, а желающих нет. Советую пользоваться выложенным chm, а эти файлы не распространять.


Цитата:
А почему бы Вам эту Хрестоматию не выкладывать в формате FB2?

Потому что я не умею их изготавливать

Вот в этой папке:
https://disk.yandex.ru/d/Gp-RQtMgM1dl2Q

я разместил:
- исходный проект DrExplain (делался в версии 4.9)
- экспорт в хтмл
- экспорт в rtf
- результат сохранения rtf в pdf

Любой желающий может взять либо исходник, либо экспорт и конвертировать/форматировать, во что и как ему удобно.

Автор: alexarbuzik, Отправлено:14:16 28-06-2021

daa2013

Цитата:
Советую пользоваться выложенным chm, а эти файлы не распространять.


Выкладывать ничего не будем!


Цитата:
Вот в этой папке:
https://disk.yandex.ru/d/Gp-RQtMgM1dl2Q

я разместил:
- исходный проект DrExplain (делался в версии 4.9)
- экспорт в хтмл
- экспорт в rtf
- результат сохранения rtf в pdf


Вот за это огромная благодарность Аллаху Величайшему и Вам!

Добавлено:
daa2013
А знаете, в RTF получилась Хрестоматия лучше, чем с CHM!


Добавлено:
Сейчас просмотрел Хрестоматию в HTML в папке 111. Превосходно! Открывается в любом браузере и никаких проблем с масштабированием текста. Для простоты пользования надо содержимое папки 111 поместить в другую подпапку, в а папке 111 в корне положить файл index.htm(l) с переходом на такой же файл в подпапке с содержимым всех файлов, чтобы пользователь не мучался с поиском индексного файла открытия. И в архиве все это выложить для пользователя.

Добавлено:
daa2013
вот этот код поместите в Блокнот, сохраните под названием index.htm и положите в корень папки 111, а все ее содержимое поместите в подпапку ind:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Frameset//EN" "http://www.w3.org/TR/REC-html40/frameset.dtd">
<html>
<head>
<meta name="robots" content="index,all">
    <title>&quot;ScanKromsator. Хрестоматия2.1&quot;</title>
    <meta name="language" content="russian">
    <META NAME="GENERATOR" CONTENT="Yuriy Veselyashkin">
<META NAME="Publisher-Email" CONTENT="mailto:yura.veselyashkin@gmail.com">
<META NAME="Publisher-URL" CONTENT="https://sites.google.com/view/yura123">
<!--<META HTTP-EQUIV="Refresh" CONTENT="1; URL=music/1.mid">-->
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
</head>
<body bgcolor="#F1F9FF">
<table align="center" width="90%" border="0">
<tr>
<td>
<p align="left"><a href="ind/index.htm" target="_self" alt="Начало" title="Начало"><font size="8">Вход в Хрестоматию</font></a></p>
</td>
</tr>
</table>
<center>
</body>
</html>



Добавлено:

извините, ошибочку в коде допустил после редактирования:


Цитата:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Frameset//EN" "http://www.w3.org/TR/REC-html40/frameset.dtd">
<html>
<head>
<meta name="robots" content="index,all">
    <title>&quot;ScanKromsator. Хрестоматия2.1&quot;</title>
    <meta name="language" content="russian">
    <META NAME="GENERATOR" CONTENT="Yuriy Veselyashkin">
<META NAME="Publisher-Email" CONTENT="mailto:yura.veselyashkin@gmail.com">
<META NAME="Publisher-URL" CONTENT="https://sites.google.com/view/yura123">
<!--<META HTTP-EQUIV="Refresh" CONTENT="1; URL=music/1.mid">-->
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251">
</head>
<body bgcolor="#F1F9FF">
<table align="center" width="90%" border="0">
<tr>
<td>
<p align="left"><a href="ind/index.htm" target="_self" alt="Начало" title="Начало"><font size="8">Вход в Хрестоматию</font></a></p>
</td>
</tr>
</table>
</body>
</html>



Добавлено:
Все это снова заархивировать WinRAR и прямо из архива все отлично открывается и читается!

Автор: ghosty, Отправлено:10:23 29-06-2021

Всем привет! bolega, Вам безусловный искренний респект за развитие и поддержку этого ценнейшего инструмента.

Такой вопрос. В последнее время приходится обрабатывать сырые JP2 с archive.org. Вот они открываются с особенно... громким скрипом: секунд 10 бывает. И проверить черновую кромсацию на 600-700 страницах становится проблематично. Вероятно, есть возможность (а я о ней не знаю) делать некие превью оригинальных файлов для быстрого просмотра с резаками? Как это реализовано в каком-нибудь Лайтруме? Если нет, то насколько сложно реализовать?

Автор: niccolo, Отправлено:11:17 29-06-2021

ghosty

Уже спрашивал недавно. Совет был - сначала переконвертировать без потерь в привычный формат

Автор: Archivist, Отправлено:12:19 29-06-2021


Цитата:
Такой вопрос. В последнее время приходится обрабатывать сырые JP2 с archive.org.

Вы уверены, что там не выложены другие форматы? JP2 это внутренний формат Архива, в который конвертируются документы, загруженные пользователями, при этом оригинальные файлы также сохраняются. Зачастую размер загружаемых PDF/CBR на порядок меньше, чем JP2. Но некоторые думают, что чем больше, тем лучше и именно в JP2 хранится оригинальная версия.

Автор: ghosty, Отправлено:13:13 29-06-2021


Цитата:
Вы уверены, что там не выложены другие форматы? JP2 это внутренний формат Архива, в который конвертируются документы, загруженные пользователями, при этом оригинальные файлы также сохраняются.

Гм, вопрос, конечно, интересный) Вот книга, с которой работаю:
https://archive.org/details/20191030whatplatosaid/page/n5/mode/2up

Оба -- что JP2, что PDF -- весьма и весьма 'lossy'. Но какой из них можно назвать оригинальным?
И какой практический смысл конвертировать в JP2, если он будет таким "тяжелым" и неповоротливым?

niccolo, спасибо, это понятно, что можно конвертировать...

UPD: Похоже, я действительно не читал, что написано "в конце мелким шрифтом". А там написано "12 files, 6 original". И если кликнуть на "6 original", то в архиве загружается PDF -- и она по дате создания на месяц раньше JP2.
Archivist, где ж Вы раньше то были? Я ж более 10 лет с этими JP2 мучаюсь)))
Точнее, где я был... Сейчас попробую обрабатывать из PDF...

Автор: Archivist, Отправлено:13:32 29-06-2021

ghosty

Цитата:
Оба -- что JP2, что PDF -- весьма и весьма 'lossy'. Но какой из них можно назвать оригинальным?

Скачайте оба, сравните пару одинаковых страниц "под микроскопом", где артефактов окажется меньше - там и оригинал. Наверняка им окажется PDF. Архиву нет смысла генерировать PDF, он хранит страницы в картинках jp2 и выводит в браузере (под пользовательское разрешение экрана) в jpeg.


Цитата:
И какой практический смысл конвертировать в JP2, если он будет таким "тяжелым" и неповоротливым?

Программисты Архива не заботятся об оптимизации, а место по файлы там неограниченное.

Автор: ghosty, Отправлено:14:00 29-06-2021


Цитата:
Скачайте оба, сравните пару одинаковых страниц "под микроскопом"

(уже ответил выше) Да нет, лучше просто смотреть на даты файлов. А еще проще нажать на линк с "**** original".
Остается надяться, что я не один такой дурак, кто тупо грузил самый большой архив в надежде добыть "самые оригинальные оригиналы".
Сколько времени потрачено... Сколько раз приходилось ставить обработку на ночь...

А с оригиналом работать в десятки раз быстрее :facepalm:

Archivist, СПАСИБО!     

Автор: daa2013, Отправлено:18:15 29-06-2021


Цитата:
. Архиву нет смысла генерировать PDF, он хранит страницы в картинках jp2 и выводит в браузере (под пользовательское разрешение экрана) в jpeg.


Как раз, наоборот.
Это только последние года два, от силы три, они стали генерировать из pdf файлы jp2. Раньше, если они брали чужие пдф-ки, то никаких jp2 в папках в помине не было.
Зато из своих цветных фоток, которые как раз и были в jp2, они ВСЕГДА делали и джву, и пдф. Просто если в jp2 находится ч.б. версия - то маловероятно, что это оригинал.
Ну, и сличить даты, обратить внимание есть ли суффикс orig_jp2



Цитата:
Вот книга, с которой работаю:

Ну, тут все цветное, и что первично - это квест.
Но если посмотреть свойства pdf , то он сделан сканером PFU ScanSnap при помощи PFU PDF Library. А портили свои фотки при создании pdf они лурой. (LuraDocument или LuraTech PDF Compressor )

Автор: ghosty, Отправлено:18:31 29-06-2021


Цитата:
Как раз, наоборот.  
Это только последние года два, от силы три, они стали генерировать из pdf  файлы jp2. Раньше, если они брали чужие пдф-ки, то никаких jp2 в папках в помине не было.

Не, вот навскидку из того, что помню -- 2009-й год, но может быть и раньше. Тут вообще поступали кэноновские CR2 аж на >7 гигов, они преобразовывались сразу в JP2, и только затем во всё остальное...
https://archive.org/download/operaomniarecens07platuoft

Тоже засада та еще -- не CR2 же обрабатывать

Автор: daa2013, Отправлено:18:57 29-06-2021


Цитата:
Не, вот навскидку из того, что помню -- 2009-й год


Но это именно о том, что я и говорю. Направление конвертации jp2 -> pdf, а не наоборот.
И pdf тут сделан LuraDocument


Возможно, вы меня не поняли. Я говорил о ситуации, что они получили pdf и сделали из него jp2. А не о ситуации, что они получили что-то другое. (фотки).
Раньше из пдф-к джп2 не делались. Теперь делаются.
Из фоток же пдф-ки делались всегда, а Archivist считает, что это нецелесообразно, и если есть пара фотки+пдф, то пдф - это более вероятный оригинал. А это не так.


Автор: ghosty, Отправлено:20:31 29-06-2021

daa2013
Я думаю, вы оба правы по-своему) Нам важно понять, как найти на archive.org именно оригинальные сканы. Всё оказалось довольно просто: нужно нажать на линк "Original" в конце списка. Что загрузится по этому линку -- то и поступило в archive.org с самого начала. В этом случае с самого начала поступил уже именно PDF:

https://archive.org/details/20191030whatplatosaid/page/n5/mode/2up

Он был преобразован в JP2. А уже из JP2 -- во всё остальное. В том числе и... вновь в PDF (оно называется "PDF with text" -- это последнее уже совсем в непотребном "расслоенном" виде.
Т.е. тут PDF --> JP2 --> PDF

Archivist прав в том, что этот 'workflow' в archive.org уже давно введен жестко. И возможно, JP2 на первом этапе нужен был именно чтобы жать вот такие многогиговые RAW из-под машин с кэнонами.

Но мы немного скатываемся в оффтоп. Задача не оказалась такой уж сложной и "типовой" для СК, как я ее представлял. JP2 -- отнюдь не "приговор", а в совсем тяжелых случаях, вроде CR2, проще действительно конвертнуть во что-нибудь более удобоваримое.

Автор: kamenkapenza, Отправлено:13:19 01-07-2021

Люди, здравствуйте! Вы тут все профессионалы. Скажите мне, как сделать формат джву непосредственно в Кромсаторе. Раньше я делал в Тейлоре, потом кодировал в джву смолле, если картинок немного. Если много, то в джву имиджере. Сегодня случайно узнал, что как то в Кромсаторе можно джву изготавливать. Как?

Автор: mvk2006, Отправлено:14:14 01-07-2021

kamenkapenza


Судя по всему, все ссылки в шапке Вы уже проштудировали и не нашли ответа на свой вопрос? А Вы не задумывались, что задавая такие вопросы, Вы плюёте на труд большого количества людей, которые так много сделали, чтобы помочь всем пользователям?...

Автор: TelecomUral, Отправлено:14:37 01-07-2021

mvk2006
там что в лоб, что по лбу. На месте совести дырка. Проще игнорить.
kamenkapenza
я в каком-то из последних своих роликов это четко показал. Пошагово. Жаль, таймлайны на ютьюбе человек начал, но не довел до ума.

Автор: kamenkapenza, Отправлено:15:38 01-07-2021


Цитата:
Судя по всему, все ссылки в шапке Вы уже проштудировали и не нашли ответа на свой вопрос? А Вы не задумывались, что задавая такие вопросы, Вы плюёте на труд большого количества людей, которые так много сделали, чтобы помочь всем пользователям?...

Как будто вопрос Президенту задал) Тактика точно такая же: вопросом на вопрос. Не переломился бы, если бы рассказал, что и как)))

Автор: Vixerunt, Отправлено:16:23 01-07-2021

mvk2006
К чему менторствовать? Просто прошли бы мимо и всё! Судя по всему, наш оппонент относится к человеческому подвиду "хам трамвайный"! Скажите спасибо, что не потребовал от Вас приобрести нужную ему книгу, отсканировать и сделать в djvu! Ну ведь реально, не переломились бы!!! Правда?
Я к тому, что не нужно "метать бисер перед свиньями"! Судя по ответу нашего оппонента, вряд ли Вам удастся научить его уважать чужой труд!!!

Автор: ghosty, Отправлено:16:48 01-07-2021

Друзья, я другого мнения. Сегодня мы должны быть благодарны уже за то, что человек вообще старается обрабатывать книги качественно. Если он обращается при этом еще и к СК, то пылинки сдувать пора уже...
Поэтому да, будет хорошо, если будем гибче -- чтобы не переломиться не дай бог.

Автор: TelecomUral, Отправлено:17:01 01-07-2021

оффтоп
ghosty
тогда мы закончим так же:
https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%B3%D0%B4%D0%B0_%D0%BE%D0%BD%D0%B8_%D0%BF%D1%80%D0%B8%D1%88%D0%BB%D0%B8%E2%80%A6
Я к тому, что Истина - абсолютна. Если я не стану держать чётких критериев, то никто их за меня и не удержит. За что этого бойца благодарить, за то что он наводняет здесь и сейчас говноподелками Миркниг - ? Приличный человек, понимая, что он делает фуфло, сперваначала останавливается. А тут, сами видите, никаких остановок. Даже задержек. Вон, bolega, книгу с марашками лет восемь держал, не выпускал. Пока не нашёл верный алгоритм.

Автор: shch_vg, Отправлено:23:11 01-07-2021

bolega
Вы намедни высказали мысль, что нет реакции на последнюю выложенную версию СК из-за того, что никто практически не использует добавленные функции. Не могу говорить за других, но хотелось бы получать обратную связь по непонятной работе программы. Как правило, описывать ситуацию долго, а дошло ли сообщение, не всегда понятно.
Все же попробую описать ситуацию, с которой мене не удалось справиться.
Скорее всего возможность управления резаками в одном окне добавлена не в последней версии, но сама по себе она замечательна, и заметно облегчает работу по управлению резаками.
На кое-как сделанных сканах эта возможность просто необходима, т.к. довольно часто приходится корректировать положение резаков.
Теперь то, что я не сумел побороть. Установив резаки в нужное положение, распространил их на последующие сканы через один (наверное, эта заморочка работает и при других распространениях).
Все работало замечательно, пока я неосторожно не распространил положение наклоненных резаков.
После этого мне уже не удалось на последующих сканах, входящих в область распространения, выправить их положение.
Никакие танцы с бубном мне не помогли, а именно:
У исходного скана убрал все резаки и распространил это состояние на последующие через раз.
У всех сканов резаки пропали в главном окне. Затем в первом скане выставил прямые резаки по контуру скана и распространил их на последующие через раз. После этого программа ухитрилась восстановить на всех соответствующих сканах (кроме начального) кривые положения резаков.

Может быть есть какая-то возможность победить эту ситуацию в рамках последней версии?

Автор: daa2013, Отправлено:08:55 02-07-2021

Режим подсветки спеклов чудит в раскрашенных зонах.

То подсвечивает, то не подсвечивает (и соответственно красной метелкой не удаляет).
То подсвечивает какую-то черезполосицу.

Автор: qwaxym, Отправлено:11:01 02-07-2021

shch_vg, раз вы начали делать снова, сбросить опции проекта или создать новый.

Автор: bolega, Отправлено:12:05 02-07-2021

shch_vg
Не знаю, у меня все нормально прошло, хотя код с тех пор не менял.
Сначала я скопировал кривой резак вниз.
Потом выпрямил его и снова распространил:
Command=copy state and position
справа галка на: copy cutter's slope (чтобы копировался угол наклона, т.е. 0)
Вы может галку не поставли на slope

Автор: shch_vg, Отправлено:14:53 02-07-2021

bolega

Цитата:
справа галка на: copy cutter's slope (чтобы копировался угол наклона, т.е. 0)

Единственная галка, которую я не ставил.
Сегодня проверю, если не напишу, значит, работает нормально!

Автор: shch_vg, Отправлено:17:24 02-07-2021

bolega

Цитата:
справа галка на: copy cutter's slope (чтобы копировался угол наклона, т.е. 0)

Вроде бы работает, но есть один нюанс.
В отличие от других галок она одноразова, приходится устанавливать ее при каждом входе в свойства резаков.

Автор: shch_vg, Отправлено:18:48 03-07-2021

bolega
Интересно, почему получается пустая страницы как при создании пдф, так и при получении выходного скана?

Каким-то образом влияет положение правого резака, но вот почему?

Автор: shch_vg, Отправлено:22:51 03-07-2021

bolega
И до кучи ошибка в СК.
Неправильно работает импорт дежавю в СК.
Если при импорте из пдф у первой порции сканов префикс f0001_, у второй - f0002_ т.д., то при импорте дежавю есть только один префикс - f0001_, т.е. возможно затирание ранее импортированных сканов.
Если же за один ввод импортировать несколько дежавю, то префиксы сканов из разных дежавю меняются правильно.
Но отсчет префиксов начнется с 1, так что если перед этим уже был импорт, то велика вероятность замены сканов.

Добавлено:
bolega
А вот еще одна удивительная ошибка.
Удивительная она потому, что отмечена еще в версии 5.94 (у раньих не проверял) и вроде бы никто о ней не писал столько лет. Правда возник вопрос, а чья это ошибка?
Давно мучаюсь со вводом сканов в СК. Начиная с какой-то версии в окне выбора сканов была добавлена возможность sort smart, причем она стоит по умолчанию и никак не управляется из файла ini. Я попробовал ввести последовательность сканов 1, 2 ... 9, 10 и получил такой порядок 1, 10, 2 ... 9. Меня это не устроило, я попробовал вариант sort by name и получил тот же результат.
Нужный порядок удалось получить только при третьем варианте do not sort и то только при правильной выботке файлов. Для себя сделал вывод, что файлы указанной нумерации можно ввести правильно только таким способом, и много лет ввожу так, удивляясь, почему sort smart забит по умолчанию и неуправляем. Иногда забывал сменить эту возможность, и приходилось вводить по новой.
Кстати, указанная мной выше нумерация не есть какая-то экзотика, часто выкладываются сканы именно в такой нумерации.
Короче, решил все-таки выяснить, что же это такое - sort smart, и заглянул, наконец, в Хрестоматию.
Каково же было мое удивление, когда прочел там, что этот вариант сортировки сканов предназначен именно для приведенного мной случая.
Теперь думаю, чья это ошибка: СК или Хрестоматии?

P.S. А м.б. мне все время попадались не те варианты программы СК?

P.P.S. Нашел версию СК 5.6А от 27.02.2006 (!), и в ней есть опция sort smart, которая работает абсолютно так же, как и последняя.

Неужели за 15 с лишним лет никто больше не вводил в СК сканы с такой нумерацией?

P.P.P.S. "О, сколько нам открытий чудных готовит просвещенья дух..." (А.С. Пушкин)

Оказалось, что sort smart все же работает, но при одном условии: все сканы должны быть пронумерованы числами. В конце моей выборки находились сканы обложек с незамысловатыми именами обложка1 и обложка2. Если их включать в выборку, то умной сортировки не получается, если же не включать, то получается.
Как говорится: "Век живи, век учись - все равно дураком помрешь"

Автор: TelecomUral, Отправлено:05:06 04-07-2021

shch_vg
скорее всего это не рекурсивная функция, на найденные подгруппы не распространяется, что в общем логично.
То есть так - не работает:


Прим.
я когда с таким поведением СК сталкивался, сразу отменял задание и переименовывал в папке файлы, добивая лидирующие нули. Это всегда проще, отсмотреть в acdsee порядок первичных сканов, чем незаметно получить случайную перестановку страниц в е-книге. Два прохода тоталкоммандером, и нет проблем. Больше тысячи файлов я только единожды в СК запихивал.
И всегда есть вариант дополнить форзацы и обложки позднее через add files. Только я всегда там забываю правильные опции применяемого профиля поставить Если чего настраивал, то всё слетает.

Автор: shch_vg, Отправлено:13:23 04-07-2021

TelecomUral
В последнее время участились выкладки сканов, пронумерованных от 1 до N с разным числом цифр в числах, а в конце две обложки. То, что предварительно можно переименовать либо подзагружать обложки отдельно, это понятно, но не хочется делать лишних движений по возрасту .
Т.к. в таком случае умная сортировка автоматически превращается в сортировку по имени, то единственный работающий вариант загрузки это загрузка без сортировки, но при выборке нужно выбирать от последнего к первому.
Я много лет делал это и удивлялся, почему бы не управлять этим параметром через файл ini, т.к. при любом старте СК всегда по умолчанию стоит умная сортировка.
Давно хотел попросить сделать этот параметр управляемым из ini, но как-то руки не доходили.
Кстати, это не один такой параметр, который мог бы управляться из ini.
Например, при импорте некоторых пдф сейчас по умолчанию происходит странный импорт. Каждая страница пдф грузится в два скана, один реальный, другой полностью пустой. Справа в главном окне высвечивается реальный скан, а слева в списке файлов стоит имя его пустого собрата.
Приходится перезагружать заново нужные сканы.
Но если в окне импорта проставить галку в окошке Do not use zones, то всегда импортируется только реальный скан. А при любом первом импорте из пдф эта галка не включена.

Автор: bolega, Отправлено:14:32 04-07-2021

daa2013

Цитата:
Режим подсветки спеклов чудит в раскрашенных зонах

Баг. Исправил

shch_vg

Цитата:
В отличие от других галок она одноразова, приходится устанавливать ее при каждом входе в свойства резаков.

Исправил.


Цитата:
Интересно, почему получается пустая страницы как при создании пдф, так и при получении выходного скана?

Баг. Исправил


Цитата:
Неправильно работает импорт дежавю в СК.

Постараюсь исправить


Цитата:
А вот еще одна удивительная ошибка.

Это не ошибка. Если какие-то файлы выбиваются из общей закономерности, СК отключает smart. Когда-то было задумано именно так. Ведь не факт, что всегда будет как у вас: все кроме двух будут с цифрами. Может быть и наоборот. Тогда как непонятно. Из-за двух городить smart? Вот именно из-за этого СК проще забить на smart и оставить как есть.
Но теоретически можно сделать по другому.
Попробуйте еще так. Откройте в СК один, самый первый файл. Потом, держа Ctrl+Shift, вызовите команду Files > Add images.

Автор: shch_vg, Отправлено:15:06 04-07-2021

Спасибо за информацию, но Ваш последний совет не сработал. По Ctrl+Shift вызов команды Files > Add images добавляет сканы по варианту Sort by name.
А нетрудно этот список сделать управляемым через ini?

Автор: bolega, Отправлено:15:29 04-07-2021


Цитата:
но Ваш последний совет не сработал.

ОК, сначала загрузите все с номерами через smart. Потом Ctrl+Shift Files > Add добавит все недостающие. Я это имел ввиду. Ctrl+Shift Add так и работает: добавляет все файлы из папки, которых еще нет в списке.

Автор: shch_vg, Отправлено:17:12 04-07-2021

bolega
Спасибо, это понятно, но требует два действия. Проще переключиться в вариант без сортировки и выбрать ВСЕ сканы, начиная с последнего и кончая первым. Поэтому хорошо бы иметь возможность, чтобы при запуске СК этот список уже был в нужном значении.

Автор: shch_vg, Отправлено:23:16 04-07-2021

bolega

Цитата:
держа Ctrl+Shift, вызовите команду Files > Add images

А нельзя ли реализовать эту комбинацию для загрузки всего содержимого папки в СК без предварительной загрузки хотя бы одного скана?
В большинстве случаев обработка начинается с загрузки всех сканов выбранной папки.

Автор: bolega, Отправлено:07:57 05-07-2021

shch_vg

Цитата:
всего содержимого папки в СК без предварительной загрузки хотя бы одного скана?

Пустое задание. Как СК узнает что за папка?


Цитата:
А нельзя ли реализовать

Можно: выделите папку в проводнике, перетащите в окно СК и киньте ее там в редактор. СК поддерживает drag&drop файлов и папок

Автор: bolega, Отправлено:11:21 05-07-2021


Цитата:
почему бы не управлять этим параметром через файл ini

На самом деле параметр всегда сохранялся в Ini-файл. И восстанавливался. Но в какой-то версии я ошибочно переставил местами несколько строчек кода, и в итоге восстановление происходит до того, как читается ini. Исправил баг. Спасибо.

Smart-сортировку я просто переделаю, сделаю более универсальную. Сейчас она рассчитана на одно число в имени. Если их несколько, то smart или работает не так как надо, или вообще отключается. Сделаю, чтобы он распознавал до трех числовых последовательностей в имени.

Автор: shch_vg, Отправлено:12:11 05-07-2021

bolega

Цитата:
Цитата:
всего содержимого папки в СК без предварительной загрузки хотя бы одного скана?  

Пустое задание. Как СК узнает что за папка?

Я имел в виду, что после входа в диалоговое окно "Открыть " по Files > Open images...,если нажата комбинация Ctrl+Shift, то достаточно выбрать любой файл из нужной директории, чтобы загрузить все файлы.

Автор: TelecomUral, Отправлено:12:13 05-07-2021


Цитата:
распознавал до трех числовых последовательностей в имени

и чтоб длинные числа верно отрабатывал. Если можно. С МФУ РГБ идут типа "doc43125920200206203133_002.jpg", хорошо бы общую часть цифр в папке считать именем. И что-то подобное.

Автор: bolega, Отправлено:13:03 05-07-2021

TelecomUral
В именах вида doc43125920200206203133_002.jpg
надеюсь в списке меняется только последнее число?

Автор: TelecomUral, Отправлено:16:02 05-07-2021

bolega
не-ет
я щас на новой винде (10ке) ничего из старых привычных папок найти не могу толком. Все попеременилось, что-то недоступно. Никак до ума не доведу переезд. Но по памяти - мне академии обложки и утраты человек присылал, ходил ногами и сканил - там в одной папке могло быть три-четыре разных больших числа группами, и последними знаками они тоже различались. Типа 43125920200206203133, 43125920200206203134, и 43126020200206203205. Примерно так. То есть номер задания в начале и временная метка в конце. Кабы было стандартно, префикс, я б сам заменял тоталкоммандером.
При этом после подчеркивания номер идёт обычным инкрементом в пределах номера задания. Насколько помню.

Добавлено:
UPD. Мне кажется, будет достаточно ввести логику обнаружения и игнорирования слишком большого числа. Просто считать его начало (не все число!) "одной большой буквой" для сортировки.

Автор: Archivist, Отправлено:19:20 05-07-2021

А собственно, для чего вообще сохранять эти многосложные оригинальные названия? Ну прислал человек пачку сканов со своими названиями, переименовали как надо и загрузили. Удобнее ведь когда название файла соответствует номеру страницы. Обложку, форзац и прочее назвать 000a, 000b итд.

Автор: TelecomUral, Отправлено:19:48 05-07-2021

Archivist
лишняя возможность накосячить при ручном переименовании. сбить исходный порядок.

Автор: shch_vg, Отправлено:16:32 08-07-2021

bolega
Еще одно странное поведение последней версии СК.
Загрузил в программу сканы, пронумерованные от 001 до 503 без пропусков.
Обычно в поле Output prefix я автоматически ставлю *, чтобы не заморачиваться с именами выходных сканов, а в данном случае забыл это сделать и по умолчанию получил имена выходных сканов от 0001 до 0503. Обработав задание, сохранил его.
Через некоторое время выяснилось, что перед 228-м входным сканом нужно вставить два пропущенных скана, имена которых были 227(170) и 227(171) (чтобы облегчить нахождение места вставки).
Загружаю сохраненное задание и замечаю, что в поле Output prefix нет *.
Так как выходные файлы задания были использованы как входные в следующем задании, то просто вставить их в нужное место я не могу, т.к. имена последующих выходных файлов увеличатся на 2.
Решаю, что ничего страшного, вставляю эти два скана в нужное место задания и проставляю в поле Output prefix "*". Расчет такой, что, конечно, в рамках этого задания я не смогу уже посмотреть выходные файлы ранее обработанных сканов, но мне это и не нужно, т.к. они уже задействованы в следующем задании, зато я буду иметь выходные файлы двух добавленных, которые смогу вставить в следующее задание.
Задумано - сделано!
Обработываю только эти два добавленные сканы и получаю на выходе их же с их именами. Все вроде замечательно. Захожу в выходную папку первого задания и вижу сканы с добавленными именами, НО выходные файлы 0228 и 0229 исчезли, а все последующие выходные файлы сдвинулись на два номера выше.
Как говорил один алкаш: вот такая загогулина!

Понимаю, что поставил программу в критическое положение, но на такой результат никак не расчитывал.

P.S. Думаю, что если бы я первоначально выбрал бы 3 в списке Name length, т.е. выровнял бы полностью имена входных и выходных файлов в первоначальном задании, то результат был бы тот же.

P.P.S. Еще одно предположение из всего вышесказанного, что значение поля Output prefix берется из ini-файла и не может быть изменено в процессе работы с заданием. Только его можно поменять, сохранив задание, закрыв его и вызвав заново.
Но тогда возникает вопрос, почему при обработке этих двух добавленных сканов было учтено текущее значение этого поля, т.к. выходные имена двух сканов были равны входным, а не присвоены порядковые номера, хотя сдвиг имен последующих файлов произошел?

Автор: bolega, Отправлено:17:01 08-07-2021

shch_vg
СК сделал все правильно. Это вы ошиблись.
Вы пишете, что сначала вставили файлы в задание, а потом только изменили prefix. Но я писал не раз (в том числе и в whatsnew 6.00.5), что СК переименовывает выходные файлы автоматически при их перетасовке. Если бы вы сначала поменяли префикс, и только потом тасовали, то ничего бы не произошло!
Трагедии никакой не вижу, уберите префикс и уберите два вставленных файла (или в конец их), тогда нумерация придет снова в исходное состояние. Только именно в такой последовательности.

Добавлено:
И честно говоря, не очень понял ваших манипуляций с префиксом. Можно было просто добавить новые файлы в конец, то же самое в Out-задании

Автор: TelecomUral, Отправлено:17:58 08-07-2021


Цитата:
Можно было просто добавить новые файлы в конец

вот-вот. Согласно логике обработки я так и делаю. Выгоняю в конец out-задания все что позабыл, а уже в нем передвигаю файлы в нужные места в списке. Вроде проблем не наблюдал при таком порядке действий.
Ну, разве что имена страниц внутри дежавю плывут. Какой-нибудь 183й между 32м и 33м.

Автор: shch_vg, Отправлено:19:45 08-07-2021

bolega

Цитата:
И честно говоря, не очень понял ваших манипуляций с префиксом. Можно было просто добавить новые файлы в конец, то же самое в Out-задании

В задании собраны сканы журналов за целый год. Потерян лист в одном из журналов.
Обработка поэтапная: сначала просто выравнивание всех сканов, на следующем этапе конкретная обработка каждого скана. По мере ручной обработки отдельные номера выводятся в пдф, поэтому желательно их иметь вместе в нужном порядке.

Добавлено:
TelecomUral

Цитата:
Вроде проблем не наблюдал при таком порядке действий.
Ну, разве что имена страниц внутри дежавю плывут. Какой-нибудь 183й между 32м и 33м.

А разве это не проблема?

Автор: bolega, Отправлено:20:34 08-07-2021


Цитата:
А разве это не проблема?

Что еще раз подтверждает, что ваш подход некорректен. Если вы добавляете пропущенные страницы куда-то в середину задания, то логично переименовывать выходные файлы, а не изголяться с префиксом, т.к. это создает путаницу (по сути рассинхрон), что рано или поздно приведет к проблемам.
Например, я делаю так. Если есть пропуски, то я вместо них вставляю пустые сканы, чтобы на выходе поддерживать правильную нумерацию. Когда отсутствующие страницы наконец-то находятся, я заменяю пустышки на них. И ничего переделывать (в плане нумерации) не надо, даже если выходные файлы использовались в out-задании.

Автор: shch_vg, Отправлено:21:46 08-07-2021

bolega
Вы описываете совсем другую ситуацию, чем та, которая была у меня. То, что сканы были пропущены, обнаружилось только после того, как выходные данные первого задания были задействованы во втором. Поэтому ни о каких предварительных вставках пустых страниц речи идти не могло.

P.S. Отквоченные Вами слова в предыдущем сообщении, относились не к Вам.

Автор: TelecomUral, Отправлено:04:22 09-07-2021

shch_vg

Цитата:
А разве это не проблема?

проблема
Для чего я и замодулировал автора DjvuToy добавить функционал переименования страничек в его прогу. (а не ввести ли в СК фичу в визард дежавю? поле спец.имени вместо имени файла из задания. )
Но в вашем случае - я более внимательно почитал "условия задачи" - даже это не требовалось. Мысль ваша пошла зачем-то сохранять цепочку файлов от самого первоначального пуска СК. А это не было нужно. Во втором задании приаттачить новьё в конец и затем передвинуть, заранее поставив файлам "правильные" имена вручную.

Автор: bolega, Отправлено:08:33 09-07-2021

Я придумаю какой-нибудь способ информировать out-задание (и перестраивать его) при изменении порядка в исходном задании. Сейчас СК поддерживает только постраничное уведомление об изменениях в зонах

Автор: shch_vg, Отправлено:15:40 09-07-2021

TelecomUral

Цитата:
Мысль ваша пошла зачем-то сохранять цепочку файлов от самого первоначального пуска СК. А это не было нужно. Во втором задании приаттачить новьё в конец и затем передвинуть, заранее поставив файлам "правильные" имена вручную.

Именно этого мне в тот момент и не хотелось, слишком много ручной работы.
И двигалась она ИМХО в правильном направлении, а именно, обработать вставляемые уже с нужным именем сканы в режиме префикса *.
Ошибка была в порядке действий.
Я не хочу это проверять, т.к. придется снова кое-что перерабатывать, поэтому поверю автору программы, что если бы я сначала проставил в префикс *, а затем вставил недостающие и обработал их, то получил бы желаемый результат. Осталось бы только ввести выходные файлы во второе задание, и не было бы никаких проблем.
А из-за неправильного порядка (сначала вставка с пустым полем префикса и только потом вставка префикса *), нужную обработку вставляемых файлов я получил, но это привело к сдвигу имен выходных сканов после вставляемых на два значения вверх.

bolega
Мне как-то неловко это спрашивать, но мой склероз мне подсказывает, что в каких-то ранних версиях программы при манипуляциях с заданием с пустым префиксом на предмет вставки, удаления, перемещения строк она спрашивала, надо ли сдвигать имена файлов.
Это так или я снова что-то напутал?

Автор: SorokaSV, Отправлено:12:20 10-07-2021

Нельзя ли сделать круглый ластик поменьше?

Автор: alexarbuzik, Отправлено:15:49 10-07-2021

SorokaSV

Цитата:
Нельзя ли сделать круглый ластик поменьше?

Этот ластик и так уже достаточно маленький, а чтобы им было удобно оперировать в мелких частях пикселей букв, надо просто увеличивать изображение в постобработке, лично я делаю увеличение до того момента, как фон станет серым и клетчатым, по которым очень удобно кругленьким ластиком филигранно-ювелирно оттачивать любую букву до нужного варианта или рисовать им.

Автор: SorokaSV, Отправлено:16:18 10-07-2021

alexarbuzik

надо просто увеличивать изображение в постобработке

Я конечно это знаю, но как раз это крайне неудобно. Хотелось бы ластик поменьше (а лучше, чтобы изменялся размер, как в фотошопе). Приходится пользоваться фотошопом (в этом моменте), но он очень плохо работает с черно-белыми изображениями.

Автор: alexarbuzik, Отправлено:16:27 10-07-2021

У меня вопрос: где взять DEE (documenttodjvu.exe)? Я скачал DjVuLibre+DjView-3.5.24+4.8-Setup.exe, но в нем не оказалось файла documenttodjvu.exe, чтобы прописать его в настройках СК File>Options>Apps>DEE укажите полный путь к файлу documenttodjvu.exe, напр., "D:\DEE\documenttodjvu.exe". Подскажите, кто может...

Добавлено:
Все, вопрос решил, скачал DjVu Small Mod v0.7.7.7z и там все есть. Благодарю всех!

Автор: qwaxym, Отправлено:18:56 10-07-2021

SorokaSV, я когда-то давно задавал этот вопрос bolega и он мне указал на глифпанель, с которой работать намного удобнее, чем подрисовывать буквы ластиком.

Автор: bolega, Отправлено:23:54 10-07-2021

SorokaSV
В последней версии можно сделать такой трюк. Выбрать в списке на кнопке "изменить глубину цвета" 8bit. Нажать на кнопку. СК спросит, действительно ли мы хотим изменит ч/б на 8 bit. Ответить да. Теперь включить кнопку режима клонирования. Нажать shift и щелкнуть мышкой. Вместо клонирования активируется режим ластика (т.е. курсор будет один, а не два как при клонировании). Но в отличие от обычного, размер ластика можно плавно менять комбинацией Shift+колесико мышки. Форму ластика (квадратная, прямоугольная, круглая, эллиптическая) тоже можно задать на панельке image adjustments > tools.
После чистки на кнопке выбрать глубину цвета 1bit и щелкнуть на ней, файл снова станет ч/белым.
Этот трюк нужен, потому что продвинутый ластик в текущей версии не работает с ч/б изображением.

Автор: VadimirTT, Отправлено:00:12 11-07-2021

bolega
"Элементарно, Ватсон!"

Автор: TelecomUral, Отправлено:09:36 11-07-2021


Цитата:
размер ластика можно плавно менять комбинацией Shift+колесико

ууу. попробовал. какая прелесть.

Автор: bolega, Отправлено:10:11 11-07-2021

Еще пару замечаний. При несимметричном курсоре ластике (прямоугольник, эллипс) shift+колесико изменяет ширину, чтобы изменять высоту используйте shift+ctrl+колесико.
Можно также включить tools > transparency (прозрачность), ползунок поставить на четверть от начала. Тогда полного стирания ластиком не будет, будет забледнение, сила которого зависит от силы transparency. Т.е. будет видно, что стерлось. При бинаризации это все уйдет. Кстати, порог, который используется при бинаризации, берется там же с закладки Filters2 > Threshold. С помощью его preview можно в режиме реального времени подбирать порог при необходимости.

Автор: Benoni, Отправлено:13:00 11-07-2021

bolega, это вещь. Спасибо!

Автор: alexarbuzik, Отправлено:13:34 11-07-2021

SorokaSV

Цитата:
Я конечно это знаю, но как раз это крайне неудобно. Хотелось бы ластик поменьше (а лучше, чтобы изменялся размер, как в фотошопе). Приходится пользоваться фотошопом (в этом моменте), но он очень плохо работает с черно-белыми изображениями.

Каждому свое! Великий лозунг на известном месте в известном месте от известного человека! По мне, лучше чем СК для обработки графики книг, найти не могу! Пользуюсь им и решаю все проблемы, надо просто научиться. А фотошопы - это не для меня, похоже ум мой заточен на другое, например на СК!

Автор: alexarbuzik, Отправлено:22:12 11-07-2021

Уважаемый daa2013! Пишите новую редакцию Хрестоматии для последней версии СК, потому что ScanKromsator. Хрестоматия 2.1 читается как роман на досуге, практически снимаются все вопросы, но хочется, чтобы были внесены последние новые инструменты. Более ранние инструкции, разрозненные, читались с трудом и требовалось много умственных сил приложить, чтобы все понять. А Хрестоматии - замечательны! Успехов Вам в этом прекрасном и добром деле! Да будет доволен Вами Аллах Величайший! Аллахьу Экбэр!

Добавлено:
PS. Да, но, пожалуйста, сделайте ее не только в CHM, но и в HTML, как в архиве, который замечательно открывается в браузере и масштабируется превосходно на старых системах.

Автор: daa2013, Отправлено:07:01 12-07-2021

Я очень рад, что Хрестоматия оказалась вам полезной. Но хочу разочаровать: в ближайшие пару лет я сам ничего про СК писать не собираюсь.

Придется вам новые штучки осваивать самостоятельно. Советую по ходу дела делать где-нибудь об этом для себя делать заметки. Что было непонятно, и как потом оказалось, оно на самом деле работает. Завести отдельную папку для хранения примеров и не лениться туда сканы откладывать. А там, глядишь, у вас и новый параграф появится.

Автор: alexarbuzik, Отправлено:10:07 13-07-2021

daa2013

Цитата:
Придется вам новые штучки осваивать самостоятельно. Советую по ходу дела делать где-нибудь об этом для себя делать заметки. Что было непонятно, и как потом оказалось, оно на самом деле работает. Завести отдельную папку для хранения примеров и не лениться туда сканы откладывать. А там, глядишь, у вас и новый параграф появится.

Очень дельный совет, благодарю.

Автор: shch_vg, Отправлено:22:38 14-07-2021

bolega
Сейчас если резаки активировать через галочки вверху главного окна, то 3 из 4-х устанавливаются по их крайнему положению, только правый резак остается вместе с левым. М.б. его тоже в этом случае устанавливать в правую позицию главного окна?

Автор: alexarbuzik, Отправлено:23:12 15-07-2021

Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!

Благодаря бестселлера daa2013 - "ScanKromsator. Хрестоматия 2.1" - потихонечку осваиваю версию 6,71, начиная понимать его алгоритм работы, в принципе, особых сложностей нет, с той лишь разницей, что в моей любимой версии 5.96.2 финализация по умолчанию включена сразу же, а в 6.71 - отключена. Параллельно провожу сравнительное тестирование этих двух версий: надо признать, что версия 6.71 работает превосходно, и даже несколько удобнее! Качество сканов выходит даже выше. Правда, сравнение провожу с исходников, которые изначально неплохо отсканированы, потому что книга по качеству была отпечатана хорошо, еще по-советски. Надо будет сравнить на очень плохих по качеству источниках. Да, благодарю авторов, версия 6.71 заработала превосходно, без всяких фокусов.

Но, уважаемый daa2013, не надо скромничать, если бы не Ваш литературный шедевр, так и считал бы версию 6.71 - более худшей и сложной! А bolega - особенная благодарность за эту превосходную программу, потому что я теперь через не прогоняю все файлы, которые приходят ко мне! Получается очень и очень здорово, нежели простым сканированием и обработкой в FineReader 12. После обработки в СК, FR12 выдает потрясающую конфетку!

Все же выход PDF, сделанный в СК обеих версий, уступает по качеству того же результата, сделанного потом в FR12: размер файла меньше более чем в 1,5 раза, естественно присутствует сразу же OCR, и округлость букв выходит еще более замечательная, даже на очень большом увеличении текста.
Вот книга, на которой я провожу тесты, но уже несколько дней назад сделанная в 5.96.2, затем обработана в FR12, b выложена на Флибусте: https://disk.yandex.ru/d/tRbMidFMPcarnQ
В данному случае ее размер получился даже в два раза меньший, чем если я сделал бы PDF в СК обеих версий (6,71 делает более cжатые PDF, чем 5,96,2), и это притом, что в ней текстовый слой и подробные закладки, которые в итоге увеличивают размер окончательного PDF.
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
(Аллах Единственный, Аллах Абсолютный, Аллах Величайший!)

Автор: daa2013, Отправлено:05:24 16-07-2021

Выложили бы сразу и "большой" файл от СК для сравнения.
В этом же файле на мой вкус буквы жирноваты и избыточно сглажены, как будто КлирСкан был применен.

Этот pdf файл у вас с jbig2 compession ч.б страниц внутри. А СК такое сам не делает.
PDF файл от СК надо открыть в акробате и "оптимизировать" - изменить там сжатие.
(В хрестоматии я об этом у поминал в разделе 3.5.)

Советую также почитать подборку ответов bolega. Они там также сгруппированы по темам. Есть тема и про "создание pdf" (раздел 9.1)

Автор: alexarbuzik, Отправлено:13:16 16-07-2021

daa2013

Цитата:
Выложили бы сразу и "большой" файл от СК для сравнения.
В этом же файле на мой вкус буквы жирноваты и избыточно сглажены, как будто КлирСкан был применен.

Выложу, тем более, что я сейчас тщательно прорабатываю Ваш литературный шедевр. Ин шэ Аллаh!

Про КлирСкан ничего не могу сказать, даже не слышал о нем, Попробовал Тэйлора, простая, но нет того, что есть в СК, поэтому оставил ее в архиве.

Согласен, что может быть шрифт жирноватый, но это, можно сказать, моя первая более менее осмысленная работы в 5.96.2, но с другой стороны, я сравнил его со шрифтом, который получился в 6.71. Да, там нежнее, но, как-то, лично для меня жирнее воспринимается более приятно при чтении. Попробую сделать эту книгу чисто в 6.71, и снова выложу ее на Флибусте, Ин шэ Аллаh. Акробатом я пользуюсь в исключительных случаях, когда FR12 что-то не может сделать, но, практика показала, если много работаешь на FR12 и прочитал к нему также хороший литературный шедевр, написанный одним человеком, то практически FR12 уже не нуждается в других программах.

Какую технологию сжатия FR12 применяет, я не знаю, нигде об этом не читал, но знаю одно, что в версии последней FR15, качество выходного файла оказалось хуже, как и многое другое, лично сравнивал тщательно!

Автор: alexarbuzik, Отправлено:13:28 17-07-2021

Уважаемый bolega!

Безусловно, Аллах Величайший, Мудрейший наделил Вас прекрасным даром программиста, коль Вы создали такую замечательную программу, без которой сделать качественную, приятную для чтения книгу в цифре просто невозможно.

Я сделал по просьбе Ваших товарищей одну и ту же книгу в версиях 5.96.2 и 6.71. Мне это было самому приятно, потому что, таким образом, я отрабатываю различные приемы работы и осваиваю Вашу программу, особенно, 6.71.

Всю работу я выложил по адресу, полагаю, разберетесь: https://disk.yandex.ru/d/0hPV14qszCOurg

В целом программа 6.71 вызывает восхищение и удовлетворение качеством итоговых файлов. Похоже, я перехожу на нее.

Но вот, что мне уже сейчас не нравится, потому что снизился уровень комфортности работы, в сравнении с версией 5.

Плохо, что Вы удалили возможность создавать по своему усмотрению фон рабочего окна программы и фон окна VR. Легче работать тогда, когда «фонит» твой желанный цвет, а не безликий, как у Вас, по умолчанию, без возможности изменения (я не смог найти функции изменения).

И второе, очень плохо, что убрали в VR «лапу»! Когда используешь большое увеличение, пользоваться полосами прокрутки крайне утомительно и неудобно, «лапой» все делается гораздо быстрее и проще, хотелось бы, чтобы Вы вернули ее.

Конечно, чтобы освоить все тонкости, а это значит, прелести работы с Вашей программой, надо каждую детальку ручками самому прорабатывать и смотреть на результат, потом анализировать, и получишь на выходе цифровой шедевр. Ма шэ Аллаh!

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!


Добавлено:
Да, простите, по ошибке я дал названия файлам одинаковое: 6_*.*, но на самом деле версию программы, в которой делался файл, смотрите по названию папки, в которой находятся эти файлы.

И еще: мне очень понравилась в бинаризации опция порога "Auto", на мой взгляд работает превосходно и снимает все мучения с подбором его. Я, выложенные файлы для Вас, делал именно в таком режиме.

Автор: SVN75, Отправлено:18:22 17-07-2021

Добрый день!

Мне попалось несколько djvu-файлов, отсканированных мало того, что в маленьком разрешении, но ещё и большим процентом букв «и», «в» и «н» напрочь перепутанными. Вы меня понимаете, классика маразматического жанра, словосочетание «в немногих» превратилось в «н иемиогнх» и т. д..

Я знаю, что в СК есть внешний OCR-инструмент Tesseract, про который я слышал, что он совсем не так уж и плох, как можно подумать (не помню где, но хвалили его). Он может чем-то помочь исправить это буквенное мясо хоть отчасти? И вообще можно с этим что-то сделать? Если даже нет, то помогите, пожалуйста, понять для чего Tesseract вообще можно использовать в СК и как именно это делается (ссылок будет достаточно).

Автор: niccolo, Отправлено:19:55 17-07-2021

SVN75

Может быть лучше поиском и заменой по DJVU? Для PDF есть программы, поддерживающие пакетную замену и регвыры. Для DJVU - возможно тут подскажут....

Автор: alexarbuzik, Отправлено:20:03 17-07-2021

SVN75

Цитата:
Мне попалось несколько djvu-файлов, отсканированных мало того, что в маленьком разрешении, но ещё и большим процентом букв «и», «в» и «н» напрочь перепутанными. Вы меня понимаете, классика маразматического жанра, словосочетание «в немногих» превратилось в «н иемиогнх» и т. д..


Это давно известная проблема djvu-конвертирования. Такие явления происходят тогда, когда сканы очень низкого качества, а главное, разрешения. Исправить этот дефект в готовом djvu, думается, практически невозможно, разве что, "прогнав соответствующие страницы" в СК, затем их редактировать, чтобы буквы «и», «в» и «н» поставить на свои места. На плохих сканах с низким разрешением алгоритм сжатия в djvu не справляется с правильным определением этих букв. Любая программа OCR (а движок этой технологии запатентован компанией AABBYY, и иные компании должны брать лицензию у них на использование) прежде всего рассчитана на отличный скан, где каждая буква достаточно хорошо прорисована и выделена на общем фоне. Иначе, результатом OCR будет большое количество ошибок, которые надо будет исправлять вручную, но, опять таки, это имеет смысл для текстового слоя, картинка (изображение) текста, так и останется с дефектом.

Мне думается, самым правильным будет для вас дефектные по тексту страницы файла djvu "прогнать" через СК, тщательно каждую букву дефектную отредактировать, после чего все снова завернуть либо в djvu, либо PDF.

Либо запустите этот djvu-файл в FineReader и сделайте распознавание, затем опцией проверки все тщательно проверьте. Полученный текстовый слой наложите сверху изображения и тогда все огрехи изображения исчезнут сами по себе.
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!

Добавлено:
SVN75

Цитата:
Если даже нет, то помогите, пожалуйста, понять для чего Tesseract вообще можно использовать в СК и как именно это делается (ссылок будет достаточно).


Tesseract нужен для создания текстового слоя, чтобы затем его подставлять в djvu, либо PDF, чтобы обеспечить возможность поиска по тексту в таких документах. Лично я не пользовался пока еще Tesseract (но, попробую ради интереса ин шэ Аллаh), потому что самый лучший OCR это у AABBYY, а значит в программе их же - FineReader (советую брать версию 12, но не 15, она стала хуже), потому что у них разработаны прекрасные словари на очень многие языки, особенно на русский, аглицкий и иные европейские и неевропейские языки. Все специалисты считают, что более точного распознавания (OCR) не дает ни одна программа, как это делает FineReader!

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!


Добавлено:
А в целом, уважаемый bolega, я прихожу к вводу о том, что версия 6.71 проще в пользовании, чем 5.96.2. Вы просто запутали многих тем, что в VR переменяли местами кнопки, и пришлось снова обучаться их расположению, не могу понять, почему Вы это сделали...

Автор: SVN75, Отправлено:15:37 18-07-2021

niccolo, alexarbuzik
Мне кажется, мы не совсем поняли друг друга, вероятно, я плохо объяснил. В указанных djvu-файлах вообще нет текстового слоя.

Я мыслю процесс возникновения проблемы следующим образом (насколько я понимаю специфику формата djvu, хотя я не специалист):
1) файл был отсканирован с низким разрешением;
2) запущена какая-то программа создания djvu с OCR-движком, которая плохо справилась с оцифровкой (разумеется, поскольку качество изображений было весьма посредственное с самого начала);
3) при сохранении файла в djvu-формате, были применены алгоритмы сжатия, специфика работы коих, имеющая значение для рассматриваемой проблемы, состоит в том, что сохраняется не собственно изображение, но текстовый слой с координатами каждого распознанного знака (букв, цифр и т. д.) на странице и библиотека изображений отдельных знаков. Поэтому картинки страниц стали выглядеть криво: в текстовом слое прописано, что на задаваемой координатами позиции должна быть буква «н», dvju-просмотрщик djvu подтягивает из библиотеки и отображает на экране соответствующий знак, хотя там, в действительности, должна стоять «и»;
4) потом кто-то текстовый слой удалил (понятия не имею зачем) и теперь мы имеем просто картинки с перепутанными буквами.

Вы правы, это можно распознать FR, но что это даст, даже если текст поправить руками? Картинка же всё равно будет выглядеть криво.

Мой вопрос был про то, можно ли осуществить обратный процесс хотя бы частично с помощью СК и Tesseract (кстати, думаю, что Вы ошиблись, Tesseract — технология, разработанная Google, насколько мне известно; Abbyy, конечно, есть могучий игрок на рынке ПО для оцифровки, но всё же не единственный, сомневаюсь, что Google им что-то платит).

Вероятно, я слишком многого хочу от СК, но может кто посоветует хоть паллиатив, если не лекарство (проблема-то классическая).

Автор: niccolo, Отправлено:15:57 18-07-2021

SVN75

Распознаёте текст. Сохраняете в ПДФ а затем правите в ФР 15 поиском и заменой. Исправленный текст FR будет заемнять на печатный.

Решение конечной так себе, но лучшего нет. Или искать и пересканировать оригинал

Автор: alexarbuzik, Отправлено:18:20 18-07-2021

SVN75
Вы заблуждаетесь! Я Вас прекрасно понял, но, к сожалению, Вы не совсем правильно понимаете процесс создания djvu. Не буду говорить за последнее, может быть компания Лизард, являющаяся автором этой удивительной технологии, в последних своих программах ввела возможность при создании djvu одновременно и создавать текстовый слой OCR, но на момент создания версии их программы Document Express Editor 6.0.1 Build 1320 такой возможности нет! Суть их технологии заключается в оригинальной возможности сжатия графических изображений максимально возможной степени с незначительными потерями качества или без такового, но выходной размер будет в разы больший. Если применять сжатие, то их технология раза в два и более обгоняет технологию AABBYY в PDF.

Текстовый слой создается отдельно рамными программами, в том числе, не только FR, но и Tesseract (и здесь вопрос только в качестве распознавания). Но, в djvu, в отличие от PDF, текстовый слой располагается только под изображение, поэтому он не может исправить саму картинку. в отличие от PDF, где текст можно класть как под картинку (и тогда картинка остается с теми дефектами, которые имелись), либо над картинкой, тогда все дефекты картинки по тексту исчезают (можно вообще написать свое и выдать за подлинный текст!).

Вы же столкнулись с явлением, которое, как я описал ранее, заключено в самой технологии сжатия изображения djvu. И никакие текстовые слои здесь ни при чем!

Еще раз говорю, эта проблема известна давно и решается она только одним способом: создание изображений, которые надо потом конвертировать в djvu, высокого качества и разрешения, тогда никаких ошибок не будет! Тот, кто это знает, так и поступает, а кто не знает, получает то, что имеете Вы.

AABBYY запантетовала свой движок на OCR, поскольку в итоге их работа оказалась самой качественной в мире. Это признают пользователи из-за рубежа, потому и их программа получали широкое распространение.

Google может у них не покупать лицензию, но потому их детище по OCR стало известно Вам, каким-то образом, и пользователям СК. Но знающие это обстоятельство, будут предпочитать использовать FR. И текстовый слой, созданный FR, потом с помощью программ отдельных разработчиков (а их уже много) затем подкладывать его под изображение в djvu.

А потому, если Вы ручками не исправите Вашу картинку с текстом djvu, то все эти огрехи так и будут видны, хотя поиск будет по тексту проводиться правильно, и даже копироваться правильно, чтобы потом его перенести в другие программы текстовых редакторов.

Добавлено:
niccolo

Цитата:
Распознаёте текст. Сохраняете в ПДФ а затем правите в ФР 15 поиском и заменой. Исправленный текст FR будет заемнять на печатный.


Вы также ошибаетесь, потому что править текстовый слой после распознавания можно в FR только до создания PDF, так как создание PDF - это заключительный этап, после которого редактировать, достаточно ограниченно, можно лишь в других программах, но это костыли для инвалида, хорошо отредактировать такой PDF весьма сложно, если, в ряде случаев, вообще возможно.

То, что Вы предлагает, приведет его к тому, что открыв PDF в FR15, программа снова его попросит распознать страницы, затем их проверить и отредактировать, а потом уже этот слой можете использовать либо в djvu, либо в PDF.



Добавлено:
niccolo

Цитата:
Исправленный текст FR будет заемнять на печатный.

Кстати, а иного, кроме как "печатного" текста FR и не создает, и ничего он не заменяет, а просто подкладывает этот печатный текст либо под изображение, либо над изображением, а результат визуальный будет разный! Хотя в обоих случаях поиск по тексту и копирование текста будет присутствовать.

Добавлено:
Уважаемый daa2013
Я все наслаждаюсь Вашим литературным шедевром, и все же, не откладывая в долгий ящик, решил сейчас спросить: у Вас при освещении работы DK, освещены все опции кроме одной - "Autolevels".
Пожалуйста, объясните, с чем ее едят и под каким соусом, да, и каким прибором: ложкой или вилкой?

Автор: niccolo, Отправлено:20:40 18-07-2021

alexarbuzik

Ваши знания несколько устарели. Finereader PDF позволяет редактировать PDF прямо, но в отличие от других программ, он еще и заменяет буквы на изображениях или накладывает исправленный текст поверх, независимо от первоначальной настройки ПДФ.

Автор: shch_vg, Отправлено:21:24 18-07-2021

alexarbuzik

Цитата:
у Вас при освещении работы DK, освещены все опции кроме одной - "Autolevels".

Ищите и обрящете!

Автор: alexarbuzik, Отправлено:21:50 18-07-2021

Уважаемый niccolo!

Цитата:
Ваши знания несколько устарели. Finereader PDF позволяет редактировать PDF прямо, но в отличие от других программ, он еще и заменяет буквы на изображениях или накладывает исправленный текст поверх, независимо от первоначальной настройки ПДФ.

Потому что Вы говорите о монстре FR15, куда они вставили свой редактор, а Вы пробовали с ним работать?
Гораздо проще все сделать так, как я описал, но FR12, производительность выше и качество выше.shch_vg
shch_vg

Цитата:
Ищите и обрящете!

Где, в Википедии или в англо-русском словаре? Посоветовать с таким апломбом знатока Божественных книг может всякий, а конкретно - только специалист! Вы, к сожалению, не из таких!
Уважаемый SVN75!
Не затруднит Вас выложить проблемный для Вас djvu на файлообменнике и дать мне ссылку, чтобы мог скачать его? Может быть что-то смогу сделать для Вас, тем более, мне самому интересно посмотреть это экземпляр творчества оцифровывания книги...

Автор: niccolo, Отправлено:22:20 18-07-2021

alexarbuzik

Гораздо проще все сделать в FR8, если у вас нет хитрых языков

Автор: alexarbuzik, Отправлено:23:02 18-07-2021

niccolo

Цитата:
но в отличие от других программ, он еще и заменяет буквы на изображениях


Если это так, то сделайте небольшой видеоролик об этом, обработав небольшой djvu, в котором сознательно на изображении страниц измените буквы...

А иначе, все, что Вы говорите, - из области Ваших измышлений! То, что говорю я, могу подтвердить видеороликами, могу сам снять процесс, как можно создать текстовый OCR даже из неправильного текстового изображения, но чтобы редактор, пусть даже графический, сам все подставлял на графике, т.е. изменял сам графику да еще интеллектуально? Теоретически все возможно, но практически кто создаст такой код, может быть это и под силу, разве что bolega? Спросите у него, он на этот вопрос точно может ответить, но даже его прекрасный СК такого делать не умеет! Знаете, даже фотошоп до такого не дошел.

Так что, подтвердите, пожалуйста, свое заявление, тогда поверим!

Автор: shch_vg, Отправлено:23:03 18-07-2021

alexarbuzik

Цитата:
Где, в Википедии или в англо-русском словаре?

Там, где вы не смогли найти.
Что пардон, то пардон, оказывается я нарвался на знатока "Божественных книг".
Юноша, не надо проявлять в этой теме такую экзальтацию, лучше смотрите внимательнее, прежде чем задавать вопросы.

Автор: alexarbuzik, Отправлено:23:06 18-07-2021

niccolo

Цитата:
Гораздо проще все сделать в FR8, если у вас нет хитрых языков


Это Вы верно сказали, потому что уже, начиная с версии FR10, извлечь текстовый распознанный слой, как это рекомендуется в известной для СК программе DjvuOCR, уже невозможно, но можно сделать, если идти некоторым хитрым путем, я уже это сегодня опробовал и отлично получилось на моем любимом FR12.


Добавлено:
shch_vg

Цитата:
Юноша, не надо проявлять в этой теме такую экзальтацию, лучше смотрите внимательнее, прежде чем задавать вопросы.


Я прочитаю весь литературный шедевр daa2013, но пока еще не нашел, но не проще ли было ответить на этот вопрос сразу, коль спрашиваю, чем томить меня, тем более, что мне это важно, потому что я отрабатываю сейчас все опции версии 6.71?

А так, создается у меня впечатление, что Вы больше изображаете из себя умников, чем действительных знатоков дела.

Чем мне нравится bolega, так это тем, что если он может ответить на вопрос, сразу отвечает коротко и точно, а если не знает, - просто молчит. А Вы много говорите, а толку-то мало...

Добавлено:
Ин шэ Аллаh!

Автор: niccolo, Отправлено:23:18 18-07-2021


Цитата:
Потому что Вы говорите о монстре FR15, куда они вставили свой редактор, а Вы пробовали с ним работать?

Пробовал и решал очень нетривиальную задачу. По выявленным проблемам накатал в Абби кучу замечаний - от багов до предложений, как и что улучшить? Но там всем пофиг....


Цитата:
Если это так, то сделайте небольшой видеоролик об этом, обработав небольшой djvu, в котором сознательно на изображении страниц измените буквы...


А мне это зачем - для моих целей это не нужно. Озадачьте лучше свой пытливый ум...


Цитата:
Это Вы верно сказали, потому что уже, начиная с версии FR10, извлечь текстовый распознанный слой, как это рекомендуется в известной для СК программе DjvuOCR, уже невозможно, но можно сделать, если идти некоторым хитрым путем, я уже это сегодня опробовал и отлично получилось на моем любимом FR12.


Какая цель действий - извлечь текстовый слой или попытаться распознать лучше? По опыту - создавая ПДФ и DJVU никто не заморачивается с правильным наложением блоков и многими другими вопросами. Поэтому, если нужен текст - всегда оказывается лучше перераспознать, при необходимости исправив дефекты изображений страниц....

Автор: alexarbuzik, Отправлено:23:26 18-07-2021

shch_vg
Да, Вы оказались правы, нашел это в разделе "2.2. Черновая расстановка резаков", но возникает вопрос: почему же эту опцию не осветили в предыдущих разделах, где речь шла о DC, причем все опции освещены, а именно об этой ничего не сказали?
Autolevels - осуществляет выравнивание гистограммы. Эта функция, по сути, взята из Фотошопа.
Благодарю Вас, а то уж было расстроился по поводу Вашей специализации. Ма шэ Аллаh!

Добавлено:
niccolo

Цитата:
Но там всем пофиг....


Это Вы верно сказали, потому я с ними тоже более не общаюсь, после того, как еще на версию 12 писал им кучу замечаний.


Цитата:
А мне это зачем - для моих целей это не нужно. Озадачьте лучше свой пытливый ум...


Свой ум я уже проверил, поработав на FR15, и дал себе зарок более эту версию не использовать, ин шэ Аллаh!


Цитата:
Поэтому, если нужен текст - всегда оказывается лучше перераспознать, при необходимости исправив дефекты изображений страниц....


Вот как раз об этом я и говорил, пытаясь все это объяснить товарищу SVN75.

Автор: shch_vg, Отправлено:00:24 19-07-2021

alexarbuzik
Рад, что Вам удалось все-таки это найти. Если желаете более подробно познакомиться с тем, что эта функция еще делает в СК, загляните в раздел 4.11.

А теперь у меня есть предложение к niccolo и alexarbuzik.
Посмотрите на название темы, в которой вы находитесь.
Если вынести за скобки упоминание всуе СК, то то, что вы пытаетесь здесь обсуждать, является оффтопиком.
Советую переместиться с этим в тему "Электронные книги: сканирование, обработка, сборка - V".
Хотелось бы в этой теме получать информацию о Сканкромсаторе, а не о том, что и где можно что-то делать с дежавю.
Заранее благодарю.

Автор: daa2013, Отправлено:11:12 19-07-2021


Цитата:
у Вас при освещении работы DK, освещены все опции кроме одной - "Autolevels".



см. мой пост от 22:36 07-11-2018 в предыдущей ветке про Кромсатор и далее.

В самой же Хрестоматии я бы хотел обратить внимание на разделы 3.8. и 3.4.

Автор: TelecomUral, Отправлено:15:30 19-07-2021

оффтоп

Цитата:
загляните в раздел

и вообще я офигеваю. Люди, которые задают вопросы, вы что, уже в принципе разучились условный Ctrl+F нажимать? На дисках личных компов 25 лет хранятся горы информации, а вы всё спрашиваете живых людей. Нонсенс. Бред какой-то. В читалках CHM есть закладка "поиск", я её открыл для себя в 1997м году. Почему не идти туда? Это же на часы проще. Никого не ждёшь. Вбил слово, получил список ответов. Пять-шесть раз слова поперебирал-потыкал, справа наткнулся на абзац с нужной информацией. Это стало так сложно нынче??! Функция поиска есть буквально везде, от тоталкоммандера до винды и гугла.

Автор: alexarbuzik, Отправлено:16:28 19-07-2021

shch_vg

Цитата:
Рад, что Вам удалось все-таки это найти. Если желаете более подробно познакомиться с тем, что эта функция еще делает в СК, загляните в раздел 4.11.


Благодарю Вас, сделаю это обязательно, ин шэ Аллаh!

daa2013

Цитата:
см. мой пост от     22:36 07-11-2018   в предыдущей ветке про Кромсатор и далее.
В самой же Хрестоматии я бы хотел обратить внимание на разделы 3.8. и 3.4.


Уважаемый daa2013! Я с наслаждением читаю Ваш литературный шедевр, поэтому все прочитаю, ин шэ Аллаh!

TelecomUral

Цитата:
и вообще я офигеваю. Люди, которые задают вопросы, вы что, уже в принципе разучились условный Ctrl+F нажимать? На дисках личных компов 25 лет хранятся горы информации, а вы всё спрашиваете живых людей. Нонсенс. Бред какой-то. В читалках CHM есть закладка "поиск", я её открыл для себя в 1997м году. Почему не идти туда? Это же на часы проще. Никого не ждёшь. Вбил слово, получил список ответов. Пять-шесть раз слова поперебирал-потыкал, справа наткнулся на абзац с нужной информацией. Это стало так сложно нынче??! Функция поиска есть буквально везде, от тоталкоммандера до винды и гугла.


Я не понимаю, что значит слово "офигеваю", видимо это опять иностранщина, введенная врагами русского языка, стоящими у власти, но, я не могу читать CHM, потому что на моей системе Win2003Serv. в этом варианте файлов не масштабируется текст, а уважаемый daa2013, изначально установил мелкий шрифт, поэтому я использую другой его вариант, выложенный по ссылке на этом форуме, и очень доволен. Ctrl+F я постоянно использую, потому что занимаюсь текстами целый день, а значит мне необходим поиск. Весь спор возник из-за нелогичности освещения функций СК, объясняемых в его шикарной Хрестоматии. Я просто хотел все быстрее узнать, но, когда меня "отфутболил" shch_vg, быстро исправить ситуацию помог именно Ctrl+F, но опять, дискуссия продолжилась потому, что "отфутболивать" людей нельзя, особенно на технических форумах, они для того и существует, чтобы давать "бестолковым" советы!

Обратите внимание! Все, что происходит в бытии, все происходит по воле Аллаха Величайшего, Благословен и Превознесен Он и хвалою Ему, и все прекрасно, если вы все это поймете. Все это произошло для блага всех, иначе бы многие проблемы не выявились на форуме, особенно этического характера!

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!

Добавлено:
Уважаемый shch_vg!

Цитата:
Советую переместиться с этим в тему "Электронные книги: сканирование, обработка, сборка - V".

Благодарю Вас за совет, но я занимаюсь оцифровкой книг уже 20 лет, мои работы, сделанные еще в 2006 году, кстати, с помощью СК 5.6а, выложены на моем сайте по адресу: http://www.u92698ze.beget.tech/ (обложка на адресе: https://sites.google.com/view/yura123), добро пожаловать, и можете скачивать книги и оценивать мой труд, как цифровальщика.

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!

Автор: shch_vg, Отправлено:23:47 19-07-2021

[more]alexarbuzik
Послушайте, неуважаемый арбузик!
Вас вежливо попросили прекратить оффтопик в этой теме, а вы еще пуще расходитесь.
Прочтите раз пять свое последнее сообщение и подсчитайте, сколько ерунды вы в нем наговорили.
И прекратите здесь всуе трепать имя своего кумира, это светский форум.
Внимательно прочтите первые 9 своих сообщений в этой теме и в будущем попробуйте писать сообщения на их уровне, т.е. задавать вопросы по профилю этой темы и без Алах акбар.[/more]

Автор: alexarbuzik, Отправлено:11:03 20-07-2021

[more]Уважаемый shch_vg!

Цитата:
Вас вежливо попросили прекратить оффтопик в этой теме, а вы еще пуще расходитесь.
Прочтите раз пять свое последнее сообщение и подсчитайте, сколько ерунды вы в нем наговорили.
И прекратите здесь всуе трепать имя своего кумира, это светский форум.


Процитированные мною Ваши слова, говорят о том, что у Вас имеется интерес к тому, что я пишу, иначе бы не реагировали так бурно. Мне очень жаль, что Вы неверно понимаете сущность светского государства. Светскость означает полную свободу выражения и поступков людей, но в рамках Конституции государства. Светскость без конституционного устройства быть не может!

Вы же, либо не читаете Конституцию России вовсе, либо втайне презираете ее, коль пишете мне такие слова.

Основой конституционного строя России является свобода выражения мнения и исповедания идеологии, религии той, которая человеку нравится, но, главное, Конституция России гарантирует каждому при этом поступать сообразно тем идеологическим и религиозным представлениям, которые он исповедует. Более того, Конституция России запрещает кому-либо принуждать другого человека не выражать свои мнения так, как он считает это нужным.

Вы же мне запрещаете говорить так, как меня к этому побуждают, прежде всего, мои религиозные убеждения, потому что для меня идеология и религия - равнозначные понятия!

И если Вы, все же, несознательно попираете мои конституционные права, то должны понять: терпимость - основа всякого светского государства! У Вас такой терпимости нет!

Я задаю вопросы так, как считаю нужным, чтобы у меня не было затруднений в пользовании СК, потому что, пока некоторые затруднения еще имеются, но, с помощью Аллаха Величайшего, все это будет устранено, ин шэ Аллаh!

Ни один раб Аллаха, каковым я имею Честь по Его Милости быть, не вспоминает имя своего Кумира всуе, потому что в последней Его Книге Откровения - Ал-Куране, которую подлые люди переписать не могут (она лично охраняется Аллахом Величайшим), сказано - поминайте имя Аллаха много, особенно перед другими людьми!

Вот это Его строгое указание я стараюсь тщательно выполнять, потому что каждое поминание, а тем более, с прославлением Его Величайшего и Славного имени засчитывается человеку в добродеяние! А это значит, что у него повышается шанс на приобретение места в садах блаженства, а не в геенне, где оказывается большая часть населения земли! А я очень хочу быть в садах блаженства!

Все эти основы Его Единственной религии, которая фактически только и правит бытием, и особенно, ближайшим миром, были уже много раз изложены Им в предыдущих Книгах Откровения - Торе и Евангелии. Но эти Книги были переписаны негодными людьми на нужный им лад, и представлены как книги Бога, за что были прокляты эти люди Аллахом, владычествующими и всеми благочестивыми людьми навечно!

Сюрат 2 Ал-Бакараh Ал-Курана, айат 159-160: "Поистине, те, которые скрывают то, что ниспослали Мы из свидетельств и руководства после того, что засвидетельствовали Мы для людей в Книге, – таких проклянет Аллах и проклянут проклинающие, кроме тех, которые покаялись и исправились, и засвидетельствовали. То таких – покаяние их Я приму: и Я – Принимающий покаяние, Милосердный!"

Сюрат 4 Ан-Ниса - Женщины, айат 46: " Из тех, которые – иудеи, некоторые искажают слова на их местах и говорят: «Мы слышали и не повинуемся, и выслушай неслыханное и упаси нас», – искривляя своими языками и нанося удары религии. И если бы, конечно, они сказали: «Мы слышали и повинуемся, и выслушай, и посмотри на нас», – это было бы лучше для них и прямее. Но проклял их Аллах их неверием, не верят же они, кроме как немногие."

Это лишь очень немногие свидетельства из Ал-Курана о проклятии искажающих слова Книг Откровения Аллаха Величайшего, больше писать не хочу из-за несоответствия профиля темы.

Для исключения соблазна, который хуже убийства, как говорит Аллах Величайший, Мудрейший: выражения, взятые из Ал-Курана, согласно законодательству России о противодействии экстремизму не могут признаваться экстремистскими!

Вот отсюда и появилось утверждение, что Имя Бога можно поминать всуе!

Все! Это хотелось бы, чтобы было последнее мое обращение, ин шэ Аллаh! Публично отвечаю Вам потому, что Вы меня публично унизили, а Аллах Величайший Мудрейший требует от нас, чтобы не поворачивать тыла к тем, кто на тебя нападает!

"Аллахъу Экбэр" в переводе с арабского означает только одно: "Аллах Величайший!"

Так на каком основании Вы мне, человеку, влюбленному в Аллаха Величайшего, запрещаете это говорить по-арабски?! Или Вы не боитесь Аллаха, что принуждаете Его рабов не выполнять Его требований?

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
перевод с арабского: Аллаh Единственный, Аллаh Абсолютный, Аллаh Величайший!

Добавлено:
Уважаемый bolega!

Милостью Аллаха Величайшего, должен сообщить Вам следующее: при более тщательном исследовании опций Вашей прекрасной программы я все же обнаружил возможность изменять фон рабочего окна программы. В связи с чем считаю обязанным себя ради славы нашего Господина Аллаха Величайшего, принести Вам искренние извинения!

Вместе с тем, возможности изменить цвет фона окна VR я так и не нашел, как и не нашел "лапы" в VR.

Если я опять заблуждаюсь, то прошу Вас сообщить мне об этом и указать, где все это можно найти, если же я прав, то прошу учесть мои замечания к Вашей прекрасной программе, чтобы она давала мне полнейшее удовлетворение при работе с ней.

Ма шэ Аллаh!

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр![/more]

Автор: Egor30, Отправлено:12:20 20-07-2021


Автор: Maz, Отправлено:13:18 20-07-2021

Заканчивайте оффтоп, пока он не перерос в большее!

Автор: daa2013, Отправлено:10:41 21-07-2021


Цитата:
Уважаемый daa2013! Я с наслаждением читаю Ваш литературный шедевр

должен напомнить, большая часть текстов в Хрестоматии написана не мной


Цитата:
daa2013, изначально установил мелкий шрифт

Я, кажется, уже об этом говорил, но еще раз. DrExplain имеет предустановленный размер дефолтного шрифта, который пользователь изменить не может.

Автор: shch_vg, Отправлено:11:47 21-07-2021

daa2013

Цитата:
имеет предустановленный размер дефолтного шрифта, который пользователь изменить не может.

Для справки:
Сейчас работаю на десятке, но на старом компьютере у меня Windows Server 2003, в котором я работал много лет. Специально проверил Хрестоматию на этой системе и утверждаю, что читать ее очень комфортно несмотря на мои проблемы со зрением.

Автор: alexarbuzik, Отправлено:15:12 21-07-2021

daa2013

Цитата:
Я, кажется, уже об этом говорил, но еще раз. DrExplain имеет предустановленный размер дефолтного шрифта, который пользователь изменить не может.


Ради интереса скачал с сайта DrExplain все доступные версии начиная с 3 по 6. Поставил создал проект. Изначально шрифт по умолчанию 11, но выделил этот шрифт, открыл редактор, выбор шрифтов богаты и размеров от 8 до 72.

Добавлено:
Надо просто уметь пользоваться программой, и не забывать, что во всех редакторах есть такие возможности как выбор шрифта и его размер по желанию пользователя, иначе смысла в них нет!


Автор: daa2013, Отправлено:02:54 23-07-2021

bolega

В режиме подсветки, когда вставляешь глифы, часто происходит так, что подсвечиваемое красным выделение возле области вставки частично принимает серый цвет.

Анимированная гифка:


Автор: kamenkapenza, Отправлено:10:49 25-07-2021

Хлопчики! Здоровеньки булы!
Раз тема про Кромсатор, то в шапку темы надо добавить ссылку на видео от автора программы, где он показал все способы обработки картинок (про которые никто даже и не подозревал). Негоже обходить такие вещи стороной! Ссылки на две части ролика от Bolega на канале Алексея Алексеева ч.1 https://www.youtube.com/watch?v=dgbYu_6Uehc&t=1176s ч.2 https://www.youtube.com/watch?v=zSDnkloduk0&t=624s

Автор: alexarbuzik, Отправлено:14:13 25-07-2021

kamenkapenza

Ассаламу Алейкум!


Цитата:
Негоже обходить такие вещи стороной! Ссылки на две части ролика от Bolega на канале Алексея Алексеева  ч.1 https://www.youtube.com/watch?v=dgbYu_6Uehc&t=1176s   ч.2 https://www.youtube.com/watch?v=zSDnkloduk0&t=624s


Верно сказано, но, чтобы все это переварить и усвоить для практической hf,jns каждого пользователя, необходима Хрестоматия по таким инструментам.

Ма шэ Аллаh!



Добавлено:
hf,jns = работы

Автор: alexarbuzik, Отправлено:22:57 25-07-2021

Сейчас провел сравнение создания DJVU в СК и в Document Express Editor 6.0.1 Build 1320. Безусловно, СК делает гораздо лучше! PDF пока FineReader12 делает лучше!
Ма шэ Аллаh!

Автор: alexarbuzik, Отправлено:12:58 26-07-2021

kamenkapenza

Цитата:
Ассаламу Алейкум!



Цитата:
видео от автора программы, где он показал все способы обработки картинок (про которые никто даже и не подозревал)


Знаешь, если это и есть автор программы bolega, то я тогда - пеле...

Ма шэ Аллаh!


Автор: alexarbuzik, Отправлено:21:07 26-07-2021


Цитата:
Ссылки на две части ролика от Bolega на канале Алексея Алексеева  ч.1 https://www.youtube.com/watch?v=dgbYu_6Uehc&t=1176s   ч.2 https://www.youtube.com/watch?v=zSDnkloduk0&t=624s


Ассаламу Алейкум!

Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!

Под впечатлением видеошедевра начал аккуратное исследование 6,71 на своей w2k3.
Результат таков: программа безусловно мощная, функции есть такие каких в 5,96,2 нет!
Начал делать довольно сложную книгу. Через некоторое время работы при попытке открыть Свойства пикчур зоны программа выдала ошибки при каждой попытке это сделать. И, проще говоря, ни взад, ни вперед. Спасло то, что смог сохранить задание, закрыть программу, снова открыл, все пошло гладко далее и пока этой ошибки снова не проявилось, если повторится, сделаю фото или кино, ин шэ Аллаh.
Сделал за сегодняшний день 59 страниц, ради интереса завернул работу в DJVU: программой СК и Лизардом. Результат получился интересный. Визуально практически различить эти два файла трудно, но Лизард сделал размер 5,9 Мегов, а СК – 7,43 Мега. Все это выложил для интересующихся по адресу: https://disk.yandex.ru/d/bdnVHbHT7d0ihw

Конечно, я еще не достиг того высшего пилотажа, что неизвестный дизайнер на видеоролике, вдохновившем меня на эту работу, но это – пока. Аллаh примет решение, буду делать не хуже этого асса!

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!

Автор: daa2013, Отправлено:04:36 27-07-2021


Цитата:
Лизард сделал размер 5,9 Мегов, а СК – 7,43 Мега



Судя по всему, у СК выставлены не-дефолтные по сравнению с DEE параметры деления фон/маска.
Вот и разница.
Но создание джву при помощи СК в первую очередь затеяно, чтобы картинки полностью ушли в фон, и не подвергались автоматическому разделению.

Т.е. джву должен получиться таким, чтобы в маске не было частей картинок, а в фоне не было текста.

Автор: shch_vg, Отправлено:13:38 27-07-2021

daa2013

Цитата:
Но создание джву при помощи СК в первую очередь затеяно, чтобы картинки полностью ушли в фон, и не подвергались автоматическому разделению.

Если это и верно, то только в варианте, когда картинки не слиты с текстом.

Автор: asku, Отправлено:20:44 27-07-2021

Добрый вечер.
Подскажите, по поводу Image enchance filters — Illumination — Method Safe.
Я обычно включаю этот метод на тех страницах, которые нужно осветлить у корешков. А как поступать, если в книге много таких страниц? Включить метод для всей книги? Не будет ли так, что на светлых страницах исчезнут какие-то детали? Вообще в каких случаях этот метод категорически не рекомендуется включать.

Спасибо.

Автор: niccolo, Отправлено:17:46 28-07-2021

Bolega

Попробовал импортировать 12 том Шломана (ПДФ с картиночными зонами) с публ.либ и очень интересный результат получил.

Во вкладке File - показывает файлов столько, сколько страниц и картинок, при по файлам на вкладке File - переходит по страницам, НО резаки на файлах, соответствующих картинкам, расставляет неверно.

Рядом в панели миниаютюр - те файлы, которые соответствуют картинкам - не показывает. А те страницы, что показывает - показывает с пропусками - т.е. 50, потом 59 и т.п.

Что можно сделать, чтобы сохранить и информацию о зонах и правильный порядок страниц?

Или немного переформулировав — как замерджить экстернал picture zone в исходники, чтобы они стали просто picture зонами

Автор: Egor30, Отправлено:15:47 29-07-2021


прошу прощения, но не могу пройти мимо:
упоротый снялся с пробега
за что ему:
Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!

Автор: niccolo, Отправлено:20:05 29-07-2021

Есть где нибудь эксель-файл с подписанными в столбцах названиями параметров для SKT файла, чтобы не перебирать вручную?
Поиск в гугле ничего не дал.

Автор: shch_vg, Отправлено:16:55 30-07-2021

niccolo

Цитата:
Есть где нибудь эксель-файл с подписанными в столбцах названиями параметров для SKT файла, чтобы не перебирать вручную?

Узнать еще бы, что это за "SKT файл" (наверное, это какой-то комбайн из SK и ST?), и зачем его параметры нужно перебирать вручную.

Автор: niccolo, Отправлено:17:05 30-07-2021

shch_vg

Ошибся - spt файл.... Skt в старых версиях был файлом прерванной обработки вроде.

Перебирать вручную - чтобы вытянуть координаты внешних зон и преобразовать их в зоны внутренние.

Автор: shch_vg, Отправлено:17:15 30-07-2021

niccolo
Думаю, что такой подвиг (сделать указанный xls) может совершить только автор программы, но уверен, что он это делать не будет. Файл spt это внутренняя кухня Сканкромсатора.
Его (spt-файл) можно изучать как черный ящик.

Автор: VadimirTT, Отправлено:20:45 01-08-2021

А возможно ли в кромсаторе, при заданных размерах страниц, указать, при выравнивании по нижней границе, отступ от нижнего края в пикселях?

Автор: shch_vg, Отправлено:21:50 01-08-2021

VadimirTT
Возможно.

Автор: VadimirTT, Отправлено:21:54 01-08-2021

shch_vg
Ну и как?

Автор: shch_vg, Отправлено:22:00 01-08-2021

VadimirTT
Page v.align=B
Spec. gaps - галку в Bottom
На закладке Book в Spec. gap - нужное количество пикселей

Автор: niccolo, Отправлено:22:00 01-08-2021

VadimirTT

Нижнее поле задаёте и всё. Или что и по чему в выравниваете?

Автор: VadimirTT, Отправлено:22:04 01-08-2021

shch_vg
Спасибо.

Автор: Vouk1, Отправлено:11:05 02-08-2021

приветствую,
подскажите граждане,
настройки и вообще порядок действий для того чтобы почистить уже отсканированные и кропнутые страницы,
чтобы убрать фон но не "засветить" текст.
вот пара из них для примера
https://cloud.mail.ru/public/KRHe/9AzR66kJa
https://cloud.mail.ru/public/bgiK/6W91U7LEc

600dpi Grayscale

(или может быть для этого не сабж нужен?)

Автор: TelecomUral, Отправлено:08:53 03-08-2021


Цитата:
Vouk1
настройки и вообще порядок действий

в шапке темы есть Хрестоматия 2.1. В первом её разделе подобраны советы (инструкции) использования Кромсатора для вашего случая. Рекомендую читать сначала все пять.

Автор: kamenkapenza, Отправлено:19:22 03-08-2021

Здравствуйте, пареньки!
Не подскажете, как исправить такую проблему: Кромсатор выстраивает файлы для работы не по порядку очередности: 01, 02, 03 и т.п., а незнамо как: 27, 12, 18. Как вернуть нужный порядок?

Автор: VadimirTT, Отправлено:19:35 03-08-2021

kamenkapenza
Паренёк, извилиной пошевели, как переименовать файлы, прежде чем в кромсатор совать.

Автор: kamenkapenza, Отправлено:19:41 03-08-2021


Цитата:
kamenkapenza
Паренёк, извилиной пошевели, как переименовать файлы, прежде чем в кромсатор совать.

VadimirTT
Хорошо, Дядя Вова, постараюсь шевельнуть и сунуть

Автор: shch_vg, Отправлено:20:16 03-08-2021

kamenkapenza
Начнем добывать конкретную информацию из этого вопроса.
Что означает "выстраивает файлы"?
Насколько мне известно Сканкромсатор ничего не выстраивает.
Все, что он умеет, это загружать сканы, удалять сканы и обрабатывать сканы.

Автор: daa2013, Отправлено:21:29 03-08-2021

Кликнуть ПКМ на списке файлов. -> Special -> Resort files

Далее либо в алфавитном порядкеу имен, либо Smart.

Раз у вас все перепуталось, то наверное "смарт" по умолчанию что-то не так опознал.
Так что попробуйте поставить по алфавиту.

Автор: Vouk1, Отправлено:22:42 03-08-2021

TelecomUral
Цитата:
в шапке темы есть Хрестоматия 2.1.

спасибо,
а какую версию использовать,
предполагая, что самые последние могут быть избыточны для данной задачи?

Автор: shch_vg, Отправлено:23:35 03-08-2021

Vouk1

Цитата:
самые последние могут быть избыточны для данной задачи?

Для этой задачи избыточны все доступные версии программы.
Но многочисленную грязь на страницах не уберет ни одна версия, придется это делать вручную.

Автор: daa2013, Отправлено:07:47 04-08-2021

Имеется в виду крупная грязь, мелкая-то уходит:

https://disk.yandex.ru/d/c7OegrRWgSeBkA

Ну а крупная чистится в СК ручками с использованием глифов.

Автор: TelecomUral, Отправлено:08:39 04-08-2021


Цитата:
уходит:

ужас какой. C.Smooth что ли ?

Автор: daa2013, Отправлено:09:07 04-08-2021

без него тут ИМХО хуже

Ну, можно будет gentle Smooth заказать, будет приятнее.

Upd
Ха. Оказывается, можно включить галку gentle, а сам c.smooth не включать.
Кажется, в этом случае третий вариант получается, еще более приятный.

https://disk.yandex.ru/i/1U9wYZljfTvI3g

Автор: Vouk1, Отправлено:09:40 04-08-2021

daa2013
Цитата:
Имеется в виду крупная грязь, мелкая-то уходит:
да ясно что кляксы надо вручную, но так уже и покатит, можно бы и Grayscale на выходе.

кстати, часть сканов исходно была в RGB, потом для единообразия переведена в Grayscale, может стоило оставить, как оно влияет на обработку в SK?

Автор: TelecomUral, Отправлено:09:47 04-08-2021


Цитата:
Vouk1
как оно влияет на обработку в SK?

вроде bolega как-то писал что всё цветное сперва переводит в серое.

Добавлено:

Цитата:
daa2013
еще более приятный

ну хоть так
а то я поперхнулся чаем, когда первый вариант открыл. После Блона от вас было странно такое увидеть.

Автор: Vouk1, Отправлено:10:09 04-08-2021


Цитата:
bolega как-то писал что всё цветное сперва переводит в серое.
тут еще конечно вопрос о параметрах преобразования, но это наверное параллельная тема.

Автор: TelecomUral, Отправлено:10:15 04-08-2021


Цитата:
наверное параллельная тема

наверное.
я иногда пробовал предварительно поделить скан на cmyk, и брать канал в обработку, но особой выгоды не увидел. Есть, но не такая большая как ожидал.

Автор: Archivist, Отправлено:10:24 04-08-2021

Из цветных каналов часто можно выудить полезное, даже вытянуть плохой скан. Но для бинаризованных книжных страниц разницы нет. Шум и jpeg артефакты уходят сами.

Автор: bolega, Отправлено:10:36 04-08-2021

TelecomUral

Цитата:
вроде bolega как-то писал что всё цветное сперва переводит в серое.

Нет, переводит только если включена опция convert color to gray на закладке Image enhance filters > misc

Автор: Vouk1, Отправлено:11:22 04-08-2021

bolega
Цитата:
переводит только если включена опция convert color to gray на закладке Image enhance filters > misc

вопрос в том - стоит ли переводить, и не дает ли RGB преимущества (или наоборот).
если цветных пятен нет, то наверное не дает, тут только бумага пожелтевшая

Автор: shch_vg, Отправлено:11:52 04-08-2021

TelecomUral

Цитата:
ужас какой. C.Smooth что ли ?

daa2013

Цитата:
Ха. Оказывается, можно включить галку gentle, а сам c.smooth не включать.
Кажется, в этом случае третий вариант получается, еще более приятный.

Что за кабалистика?
Скачал оба варианта daa2013 и сравнил в СК, просматривая в масштабе "По ширине".
Не заметил ни малейшей разницы ни в форме букв, ни в количестве грязи.
Может , надо как-то по особенному смотреть?
А может быть в обоих случаях выложен один и тот же вариант?
Затем обработал в СК тот же скан практически по умолчанию без всяких gentle и c.smooth и получил похожий результат, если не считать пары мелких точек, которые не зацепил мой вариант обработки.


Автор: TelecomUral, Отправлено:12:33 04-08-2021

оффтоп
shch_vg
да ладно
Конечно, не всякий это видит без опыта.
Вот вам указюльки (красным) на плохие места, и отдельно чистое сравнение шрифта, без красного, для тренировки внимательности.






Плюс я не могу показать как гарнитуру исказил C.Smooth. Палки шрифта стали другой формы. Надо мысленно построить схему буквы ("векторизовать" её), и тогда наглядно видно, что гарнитура поехала к чёрту, шрифт стал неузнаваем. Ну и базовая линия плывёт, конечно. На которой буквы "стоят".
На левом хвостике внизу "я" всегда наилучшим образом видны искажения. Хвостик либо торчит хвостиком, как мы его первоклашками писали, либо грустно падает вниз, чего нет в оригинале. И на стыковке вверху "р" всегда видно класс обработчика. Где колечко с палкой стыкуется. Там либо остренькая ямка, либо заглажено.

Автор: shch_vg, Отправлено:13:01 04-08-2021

TelecomUral
Я правильно понял, что первая строка в тройке относится к первой ссылке daa2013, а вторая - ко второй?
Если так, то почему первый вариант хуже второго?
Он при масштабе 100% в СК смотрится приятнее.
Во втором варианте буквы более рваные.

Добавлено:

Цитата:
оффтоп

Почему, если мы обсуждаем варианты параметров СК?

Автор: TelecomUral, Отправлено:13:13 04-08-2021

оффтоп
shch_vg
нет, верхний вариант - "второй, который делал daa". Я сблизил первый вариант и оригинал, чтобы легче было сравнивать плохую версию с исходником.
Ну вот, хоть увидели разницу
Почему второй вариант (верхняя строчка) лучше, понять сможете только после примерно 150-300-страничной книги, отпечатанной и прочитанной. Если гарнитура испорчена, на ней сильно устают глаза. Абзац в десяток строк и то уже читать тяжело, а после 40 страниц глаза вытекают. А если без полей, так и вовсе.

Это всё тут оффтоп. Заканчиваем. Это ж не СК, а внешний вид. Даже ещё дальше от темы - чтение книг.

Автор: shch_vg, Отправлено:13:45 04-08-2021

TelecomUral
Продолжу доставать своими дилетанскими вопросами.
1. Все-таки почему это здесь оффтоп, если обсуждаются варианты обработки в СК?
Может быть daa2013 обрабатывал не в СК?
2. Попробовал сравнить в СК при масштабе 100% два варианта обработки daa2013.
Первая строка из первой ссылки, вторая из второй.

На мой дилетантский вкус у первой строки более гладкие буквы, у второй - более рваные.
Хотелось бы услышать мнение специалистов.

Автор: TelecomUral, Отправлено:13:50 04-08-2021


Цитата:
shch_vg
если обсуждаются варианты обработки в СК

они как раз и не обсуждаются с точки зрения настроек СК. Вы же тут не обсуждаете содержание книги, предоставленной Vouk1 десятком постов выше. Ибо не по теме.
А вкус имеет смысл развивать, а не демонстрировать

Автор: Vouk1, Отправлено:13:50 04-08-2021

обращу внимание, что часть публикации напечатана шрифтом рубленым, а часть - шрифтом с засечками, я выложил оба образца,
отличается ли стратегия обработки?

Цитата:
А вкус имеет смысл развивать
ну в общем-то приемлемый внешний вид - это показатель не вкуса а качества на выходе...



Автор: TelecomUral, Отправлено:13:52 04-08-2021


Цитата:
Vouk1
отличается ли стратегия обработки?

обычно да. В Хрестоматии есть раздел 3.9, его из меня клещами вытянули Много полезного.

Автор: Vouk1, Отправлено:14:04 04-08-2021

лично мне "третий вариант, еще более приятный ... включить галку gentle, а сам c.smooth не включать." кажется более гуманным.

да кстати - ссылка в шапке неживая - http://bolega.hotmail.ru/
и еще другие

Автор: TelecomUral, Отправлено:14:15 04-08-2021


Цитата:
Vouk1
ну в общем-то приемлемый внешний вид - это показатель не вкуса а качества...

по мне так это софистика. Слова-абстракции. Ни пощупать, ни повторить.

shch_vg
Если без шуток и стёба, то очень советую листать книги, которые bolega обрабатывал и на публ.либ.ру выкладывал. Особенно по искусству, там обычно бумага мелованная и гарнитура лучше сохраняется при сканировании. Еще текст превосходно делает Dmitry7, жалко только что обычно чб типа серии НВЖНИТ. Его бы мастерство да на красочные сложные тома БСЭ прекрасно делал lis105.
То есть пошли в библиотеку, полистали руками оригинал вдумчиво, потом пошли домой и полистали е-копию. Так вкус и наработается.

Автор: shch_vg, Отправлено:14:16 04-08-2021

TelecomUral

Цитата:
они как раз и не обсуждаются с точки зрения настроек СК.

В первом случае daa2013 указал, что применен был параметр C.Smooth, а во втором

Цитата:
можно включить галку gentle, а сам c.smooth не включать.

На второй мой конкретный вопрос я получил конкретный ответ

Цитата:
А вкус имеет смысл развивать, а не демонстрировать

что действительно здесь оффтоп.

Автор: Vouk1, Отправлено:14:19 04-08-2021


Цитата:
Ни пощупать, ни повторить.
зато можно посмотреть и увидеть. Тут ведь на выходе буквы, а они - чтоб не щупать, а чтоб на них смотреть. Как же еще оценить качество результата?

Что толку в разглядывании со вкусом изданных изданий, когда чаще стоит задача - вытянуть в приемлемо читаемый вид то что невесть как напечатано и неизвестно кем и как сосканированное.

Автор: shch_vg, Отправлено:14:24 04-08-2021

TelecomUral

Цитата:
то очень советую листать книги

Я в стране Советов на текущий момент прожил большую часть своей жизни, поэтому хотелось бы в стране дикого капитализма получать более конкретные ответы.
Я свое мнение высказал, а ответа на вопрос не получил.

Автор: TelecomUral, Отправлено:14:27 04-08-2021


Цитата:
Vouk1
Что толку в разглядывании со вкусом изданных изданий, когда ...

сможете менять задачу на более правильную: выбирать правильные книги, хорошо изданные или хотя бы хорошо сосканированные Это давняя тема, что фигнёй страдать не надо, и из г... конфетку не сделаешь. СК программа крутая, но не круче кривых ручонок сканирующего.

Автор: shch_vg, Отправлено:14:30 04-08-2021

Vouk1

Цитата:
лично мне "третий вариант, еще более приятный ... включить галку gentle, а сам c.smooth не включать." кажется более гуманным.

Я вас правильно понял, что в приведенном мной сравнении Вас не смущают рваные буквы в этом варианте?

Автор: Vouk1, Отправлено:14:37 04-08-2021

shch_vgя просто смотрю на обе страницы целиком без увеличения, по высоте на весь экран у меня получается размер страницы близко к оригиналу, и вот второй вариант как-то глаже, не выглядит рваным. Может быть еще зависит от монитора и видеоадаптера?

TelecomUral
Цитата:
сможете менять задачу на более правильную: выбирать правильные книги, хорошо изданные
видите ли, есть немало книг, чепуховых по содержанию, но хорошо изданных, - а есть к сожалению еще больше толковых книг, но изданных как пришлось. Я выбираю второе, первое же мне не нужно.


Автор: TelecomUral, Отправлено:15:10 04-08-2021

Vouk1
я и не говорю, что надо выбирать хорошо изданные. Я говорю что вы задачу смените: будете понравившуюся вам книгу искать в другом издании, у другого сканировщика. От плохого издания/скана станете воротить нос.
И - по личному опыту - кроме периода 1991-1994гг, и 1918-1921гг, плюс конечно война, мне не приходилось встречать реально плохо изданных книг. Не, ну бывали, конечно, всевозможные брошюрки с "типа переводами" восточных трактатов по единоборствам. На бумаге хуже газетной и со шрифтом, который подобрали на помойке рядом с типографией. Тут СК вне конкуренции. Но в 97% эти же трактаты выходили через пяток лет в Москве, нормально изданные.

Автор: Vouk1, Отправлено:15:14 04-08-2021

будто я этак хожу по базару где есть всё на выбор - и издания и сканировщики, и выбираю что мне больше понравится.
Вот хоть бы этот скан - единственная журнальная публикация данного перевода (якобы выходило потом отдельной книгой, но найти мне не удалось). И это неплохой скан, бывает много хуже.

Автор: TelecomUral, Отправлено:15:18 04-08-2021

Vouk1, вообще-то "язык до Киева доведёт". Интернет позволяет охватить контактами почти всю планету. Было бы желание.
upd
На худой конец есть ленинка, и тематические форумы фанатов. А также книжные интернет-аукционы.

Автор: Vouk1, Отправлено:15:20 04-08-2021

вот в интернете и нашел

Автор: shch_vg, Отправлено:15:44 04-08-2021

TelecomUral

Цитата:
по личному опыту - кроме периода 1991-1994гг, и 1918-1921гг, плюс конечно война, мне не приходилось встречать реально плохо изданных книг.

Счастливый Вы человек.
Я этим похвастаться не могу, так как плотно знаком с шахматной литературой.
Очень много книг 20-30 годов, а также 80-х имеют очень плохую полиграфию, которую невозможно исправить никакими специальными программами.
Я уж не говорю о периодике.

Автор: TelecomUral, Отправлено:15:50 04-08-2021

shch_vg
так не гребите всякую фигню "ради полноты коллекции". Я ж говорю про понравившиеся книги, а не круглогодичный срез "всё что вышло!" на выходе из ворот типографии. Понравившихся книг - едва ли 1% из виденного. Думаю, много меньше.
Или оставляйте сканами, CBR.
upd
вопросов нет, что институтские курсовые методички отпечатаны ужасно. Но я за ними и не гоняюсь.

Добавлено:
Vouk1
ЛС гляньте.

Автор: shch_vg, Отправлено:16:15 04-08-2021

TelecomUral

Цитата:
Я ж говорю про понравившиеся книги

А я говорю об оцифровке бумажной литературы, чем сейчас занимаются большинство библиотек и не только они. К тому же уверяю Вас, что многие из упомянутых мной книг, особенно изданных в 80-е годы, относятся не к категории "Разная фигня", а очень даже нужных. Конечно, со всевозможными ухищрениями можно сделать их читаемыми, но при чтении вся эта неудаляемая грязь очень отвлекает от материала книги.
Впрочем это действительно ОФФТОПИК.

Автор: shch_vg, Отправлено:22:05 08-08-2021

bolega
Работаю с 6-ю процессорным компом. Запускаю задание на обработку и вижу, что работают все процессоры. Когда же я запускаю далее финализацию, то работает один процессор.
Почему нельзя делать финализацию на 6 процессорах?
Все упирается в обмен с диском?

Автор: bolega, Отправлено:22:58 11-08-2021

shch_vg
А в опциях обработки вы указали использовать 6 ядер?

Автор: shch_vg, Отправлено:00:28 12-08-2021

bolega

Цитата:
А в опциях обработки вы указали использовать 6 ядер?

Цитата:
Запускаю задание на обработку и вижу, что работают все процессоры.

Естественно указал. При обработке количество обработанных сканов меняется сразу на несколько, а не на 1, как в случае одного ядра.
Я так понимаю, что финализация в основном работает с диском на чтение-запись, или все же предварительно все (или достаточно большое количество) сканы считываются в оперативную память?
В любом случае большая часть времени уходит на запись финализированных сканов на диск.

Автор: kamenkapenza, Отправлено:16:38 14-08-2021

Help!!! Помогите, кто может!!! Кто может помогите!!!
Здравствуйте, товарищи!!!
Видеовопрос по поводу группы цветного текста тут https://disk.yandex.ru/d/F9e3jiABTn2P7Q

Автор: TelecomUral, Отправлено:17:19 14-08-2021


Цитата:
kamenkapenza
Видеовопрос по поводу группы цветного текста

Снимите галку Enable в блоке C.Smooth на закладке Blur. Наверное поможет. Две вы там сняли, третью не заметили.

оффтоп
Не надо включать ничего, в чём вы не разбираетесь. Кто вас где учил бездумно щёлкать кнопки в настройках зон? А люди потом должны вас из г..на выволакивать. Жалеть.
В электрики бы вам пойти, по высокому напряжению. Чтоб сразу и не мучаться

+
кажется bolega показывал как размножить свойства зоны на группу. Или я. Есть несколько вариантов размножения.

Автор: kamenkapenza, Отправлено:11:14 15-08-2021


Цитата:
В электрики бы вам пойти, по высокому напряжению. Чтоб сразу и не мучаться


Цитата:
Снимите галку Enable в блоке C.Smooth на закладке Blur

Хорошо, что вы только тут такие "дельные" советы даёте, а то сколько электриков погибло бы по вашей милости )))
Снятие галочки с C.Smooth ни на что не повлияло. Эх ты, дядя!!! ))) Зачем молотить ботву, если в этой теме не кумекаешь? Так бы и сказал: извини, брат, ничем помочь не могу. ... Да ладно, спрошу у самого главного.


Автор: TelecomUral, Отправлено:12:35 15-08-2021


Цитата:
kamenkapenza
Снятие галочки с C.Smooth ни на что не повлияло

зону-то переобрабатывал, дядя?

Автор: kamenkapenza, Отправлено:12:59 15-08-2021


Цитата:
зону-то переобрабатывал, дядя?

А как же, племянничек. Само собой! Прислать видеоотчет, что в этом случае ничего не помогло? Что со Смуфом, что без него. Да ладно, я обратился в вышестоящие органы. Надеюсь, что помощь придет. Ждём-с!!!


Автор: TelecomUral, Отправлено:13:26 15-08-2021


Цитата:
kamenkapenza
Само собой!

Покрутите порог бинаризации зоны тогда. custom, 100-120 примерно. Без примера скана и задания трудно что-то осмысленное советовать. Я уже говорил, что к видео нужны субтаски.

Автор: daa2013, Отправлено:13:48 15-08-2021

Там же видно, что порог стоит auto 205 (На закладке зоны format)
Это очень много. (То бишь авто, видимо по причине того, что текст цветной, сработал неправильно и завысил порог.).

Тут скорее всего и normal (=150) хватит. Не хватит - можно руками до 160-170 поднять.

Ну в общем, за жирность букв в первую очередь отвечает порог бинаризации.

Автор: TelecomUral, Отправлено:13:53 15-08-2021


Цитата:
порог стоит auto 205

а! я на ЯД смотрю, там неразборчиво, и внимания не обратил утром. Сейчас скачал - ну да, 205 это перебор.
Может надо было фон вычитать.

Автор: bolega, Отправлено:18:03 15-08-2021

kamenkapenza
На закладке Blur отключите фильтры Mean и Smart. Для такого однородного текста это только приведет к размытию и соответственно к ужирнению при бинаризации.
Из видео не видно, что у вас там еще включено на sharpen и filters2. И я бы в C.smooth отключил бы enable и включил бы Gentle.
И нужно давать не просто тифы, а кусочек своего задания, хотя бы из одного файла (Files > create sub-task)
Без этого понять, что пошло не так, нельзя.

Автор: kamenkapenza, Отправлено:20:41 15-08-2021


Цитата:
На закладке Blur отключите фильтры Mean и Smart. Для такого однородного текста это только приведет к размытию и соответственно к ужирнению при бинаризации.  
Из видео не видно, что у вас там еще включено на sharpen и filters2. И я бы в C.smooth отключил бы enable и включил бы Gentle.
И нужно давать не просто тифы, а кусочек своего задания, хотя бы из одного файла (Files > create sub-task)
Без этого понять, что пошло не так, нельзя.


Уважаемый bolega, большое спасибо! На на sharpen и filters2 у меня галочек нигде не стоит, то есть вкладки неактивны.

Автор: shch_vg, Отправлено:23:47 15-08-2021

kamenkapenza

Цитата:
Про то, как показывать задания я особо ничего не понимаю Если бы знал как - показал.

А посмотреть в шапке, как это делать, вам что, религия не позволяет?
Или читать не умеете, а только картинки смотреть?
Hint: ищите выделенное красным.

Автор: TelecomUral, Отправлено:02:29 16-08-2021

оффтоп, сильный
[more]
Цитата:
shch_vg
Или читать не умеете

kamenkapenza это особый тип книголюба, с девизом "читать очень вредно! пусть другие читают, а я никогда!" После "Волшебного сундучка" и "Угандей и Селендей" десятки лет сей девственный мозг литературой не удобрялся. (бог весть как уживается в голове нелюбовь к документации и книгообработка. шизофрения, вероятно, т.е. по научному говоря распад процессов мышления)
Насчёт незнания про порог бинаризации зоны я тихо присел на стульчик... То есть "bw" зоне ставим, а что это означает - понимания по нулям. Потом на Paint её красим... и тоже по нулям. Нда.
Как не вспомнить slava_kry, который отступился от курса по обработке сканов со словами "очень уж много придётся рассказывать".[/more]


Цитата:
Hint: ищите выделенное красным

расшифровываю:

Цитата:
Здесь уже много раз писалось, что делать, если что-то получается не так, как хочется, и нужно получить какую-то помощь.
Можно написать, как это сделали Вы, и ждать, что появится здесь экстрасенс, который может догадаться, что Вы выбрали в своем задании.
А можно сделать более грамотно, тем самым заметно увеличив вероятность получить помощь, поступая следующим образом.

Выбрать в задании наиболее проблемный скан.
Если их несколько, то пометить их, нажимая на каждом на пробел.
Затем выбрать в меню File->Create sub-task...
Если выбрали несколько сканов, то в появившемся окне в списке Source files выбрать значение All select group, иначе оставить по умолчанию Current.
Нажать кнопку ОК.
В директории, содержащей исходные сканы, появится поддиректория test, в которую желательно добавить текстовый файл с вопросом, потом заархивировать директорию test, архив выложить на доступный обменник, а ссылку на него сюда.
Это не дает гарантию, что Вы получите ответ на интересующий Вас вопрос, но шансы получить его значительно возрастут.

Автор: shch_vg, Отправлено:10:40 16-08-2021

TelecomUral

Цитата:
Подробнее...
 

Согласен, но справедливости ради надо заметить, что именно Вы начали что-то ему объяснять вместо того, чтобы отправить его в шапку темы.
А это дало ему возможность поизгаляться:
Цитата:
Зачем молотить ботву, если в этой теме не кумекаешь?

Автор: bolega, Отправлено:11:08 16-08-2021

Это последний раз, когда я пытался разобраться в проблеме при отсутствии готового суб-задания.
В дальнейшем просьба ко мне не обращаться с советами по поводу обработки. Хотите совета - предоставляйте свое задание, чтобы было сразу видно, где проблема (или даже баг) или что не так.
Отсутствие задания - это неуважение к тому, к кому идет обращение. Думаю, ни у кого не вызовет радости перспектива гадать что там у просящего переклинило в процессе обработки.

Автор: kamenkapenza, Отправлено:12:53 16-08-2021


Цитата:
Согласен, но справедливости ради надо заметить, что именно Вы начали что-то ему объяснять вместо того, чтобы отправить его в шапку темы.
А это дало ему возможность поизгаляться

Хлопчики, не надо из-за меня драться и обижаться друг на друга, что кто-то выдал мне военную тайну Ему, этому недостойному поганцу, а то пойдет у вас тут битва титанов. Хотя, если у вас насчет этого так всё строго, то кого то надо за это расстрелять, коли вам от этого легче станет. Это лирическое отступление.
Друзья! Если не трудно, то сделайте ролик по поводу того, как показывать задание (я не знал, что как то можно работу записывать, а потом показывать секретный процесс. Думал, что видеовопроса и видеопоказа вполне достаточно. А у вас тут во как мудрёно всё! Если уже такой ролик на ютубе имеется, как делать субтаски и как то их предостапвлять для просмотра, то просьба дать ссылку (я погляжу и пойму). Ссылку на ролик, как я понимаю, во избежание дальнейшей конфронтации между вами (не хочу быть яблоком раздора между достопочтенными господами) отправьте мне в личном сообщении, строго, секретно.я не предам огласке, что получил ценную информацию, всё останется в тайне. С низким поклоном, Юниор Мембер.

Цитата:
Это последний раз, когда я пытался разобраться в проблеме при отсутствии готового суб-задания.  
В дальнейшем просьба ко мне не обращаться с советами по поводу обработки. Хотите совета - предоставляйте свое задание, чтобы было сразу видно, где проблема (или даже баг) или что не так.
Отсутствие задания - это неуважение к тому, к кому идет обращение. Думаю, ни у кого не вызовет радости перспектива гадать что там у просящего переклинило в процессе обработки.

Наверное, это и меня касается. Так, что, ребя, помогайте, а то мне книги надо творить, и спросить будет не у кого, из-за того, что я не знаю, как продемонстрировать то что, я в Кромсаторе делал. Тем более, оказывается, у вас непредоставление каких то субтасков является злостным неуважением, плевком в адрес оппонента. Мои деяния просьба не относить к таковым в виду того, что я не являюсь членом вашего клуба, тем самым не знаю ваших непререкаемых джентльменских правил. Пардон! Научите путем видеоролика с подробным объяснением, что и как надо делать, чтобы показать мастеру записанный процесс своей работы - буду придерживаться этих правил.

Автор: TelecomUral, Отправлено:14:13 16-08-2021


Цитата:
shch_vg
вместо того, чтобы отправить его в шапку темы


Цитата:
kamenkapenza
Если не трудно, то сделайте ролик по поводу того, как показывать задание

шах и мат

upd
я такой ролик писать не буду

Автор: shch_vg, Отправлено:15:22 16-08-2021

TelecomUral
Цитата:
я такой ролик писать не буду

И совершенно зря, ведь было клятвенно обещано :

Цитата:
отправьте мне в личном сообщении, строго, секретно.я не предам огласке, что получил ценную информацию, всё останется в тайне.

Вообще-то для всего этого мракобесия есть одно хорошее иностранное слово - игнор.

Автор: kamenkapenza, Отправлено:14:50 17-08-2021


Цитата:
upd
я такой ролик писать не буду

Ну вот! Уважаемый TelecomUral, как же так? Я только на вас и надеялся, вы мне всегда помогали. Ворчали, но давали дельные советы. Я благодаря вам начал работу в Кромсаторе. Мы же с вами друзья ещё со времен общения в карасёвской библиотеке. Я так понимаю, что всё же никем не написан ролик про запись работы в субтаск показа. Очень жаль! Это большое опущение, без этого я теперь не смогу попасть на прием к вышестоящему начальству, которое сказало, что это было в последний раз, больше нельзя!!! )) Последнее китайское, так сказать. Ролик то этот письнуть, 10 минут, начать и кончить ))



Цитата:
Вообще-то для всего этого мракобесия есть одно хорошее иностранное слово - игнор.

И это правильно! Лучше молчать, чем заниматься красноречивым пустословием. Я задал вопрос, что меня интересует, кто хочет помочь - тот ответил по теме. Кто не хочет, лучше просто промолчать (по вашему игнор). И всем будет гоже.
Мне некоторые вещи нужно уяснить для работы по созданию книг, которые я делаю в Скан Тейлоре + Скан Кромсатор.
Кромсаторная Хрестоматия для меня Талмуд, по ней нужны отдельные толкования для простолюбдинов, так что если мне надо будет решить какие то проблемы (коли такие появятся, хотя я практически всё для непосредственной работы уяснил), тогда я тут спрошу, хлопцы, уж не обессудьте.
И на хрена тогда весь этот форум, если всё якобы написано в Хрестоматии, и тогда всех надо посылать: - Да иди ты... в Хрестоматию, мать твою...)))

Автор: TelecomUral, Отправлено:15:20 17-08-2021


Цитата:
kamenkapenza
Да иди ты... в Хрестоматию, мать твою

в шапку короче.
Причём я в своём последнем сообщении на предыдущей странице даже процитировал, что нужно сделать чтобы получить субтаск. Вот куда уж понятнее. Потому ролика и не будет. Ценз, так сказать. Поняли - прорвались. Не поняли - геть отсюда.

Автор: kamenkapenza, Отправлено:17:15 17-08-2021

Субтаск я и так делаю, чтобы попасть в создание джву-книги. Не тот ли это субтаск или надо какой то специальный шпионский создать, который записывает все проводимые шаги? В шапке ничего про субтаск нет, это надо весь ютуб перелопатить безрезультатно. Мне он этот субтаск и даром не нужен бы (только, чтобы попасть в пункт создания джву, иначе не получится). Этот субтаск просят вышестоящие органы, чтобы досконально, по мелочам исследовать дело и вынести справедливый приговор, хотя моё дело другие товарищи исследовали и без субтаска и вынесли мне определение с указанием ошибки в моем книгопроизводстве.
Я конечно понимаю, что показ субтаска автоматичесмки влечет изгнание из ложи сканкромсаторщиков и вечный позор. Тогда хорошо, не буду настаивать, а то эти товарищи переведут на нижестоящую ступень - балбесов, а на этой ступени я )))
И без субтаска добрые люди покосорылятся маненько для приличия (мы князья-мастера, как ты смел потревожить наш покой, челядь позорная ))), и подскажут по существу, как надо сделать, и в чем причина неудачи (нечасто и обращаюсь, когда уж совсем дело стопорится).

Автор: TelecomUral, Отправлено:17:30 17-08-2021


Цитата:
Субтаск я и так делаю

аут-таск вы делаете. out-task.
Просят же суб-таск, sub-task.

Автор: shch_vg, Отправлено:17:40 17-08-2021

TelecomUral
Классно он Вам разводит!
Стёб замечательный! Аффтар, пиши исчо!
Потихоньку заставит Вас пересказать всю инструкцию в шапке.
Впрочем Вы его лучше знаете по неведомой карасевской библиотеке.

Автор: TelecomUral, Отправлено:17:54 17-08-2021


Цитата:
shch_vg
по неведомой карасевской библиотеке

б-ка Вадима Ершова, publ.lib.ru

Добавлено:

Цитата:
shch_vg
Потихоньку заставит Вас пересказать всю инструкцию в шапке

Больше, чем там есть, не расскажу А это тупик.

Автор: shch_vg, Отправлено:18:03 17-08-2021

TelecomUral

Цитата:
б-ка Вадима Ершова

Тонкий юмор даже для стёба .

Добавлено:

Цитата:
Больше, чем там есть, не расскажу А это тупик.

Вы что, действительно верите, что это все серьезно?
Тогда мне интересно, что возьмет верх, пензенский стёб или уральская простота.
Хотел вас двоих попросить перейти в приват, но теперь ...

Автор: TelecomUral, Отправлено:19:50 17-08-2021

оффтоп
[more]
Цитата:
shch_vg
Вы что, действительно верите, что это все серьезно?

Во-первых, я давно общаюсь по поводу книгообработки с различными людьми. И удивить меня трудно.
Во-вторых, я не теряю из виду цель: научить получать готовую е-книгу с помощью СК. В фокусе этой цели всё идёт нормально. Ну, есть особенности, так они у всех и всегда есть.

Сам как-то после лекции про E&M-сигнализацию у нефтяников спросил их связиста "ок, это понятно, теперь скажите - а что такое Е1?" А это примерно тот же уровень непонимания, что порог бинаризации зоны. Так что "всё ОК" [/more]

Автор: bolega, Отправлено:10:46 18-08-2021


Цитата:
Субтаск я и так делаю, чтобы попасть в создание джву-книги

Вы делаете out-таск.
File > Create out task (выходное задание; обработанные файлы основного задания становятся входными файлами out-задания)
File > Create sub task (под-задание, т.е. подмножество из одного или более файлов)
Т.е. это разные вещи

Автор: shch_vg, Отправлено:19:24 18-08-2021

bolega
Это поддается какому-то логическому объяснению?

Автор: bolega, Отправлено:22:26 18-08-2021

shch_vg
СК не поддерживает 16-битные изображения.
Считаю, что для сканов это довольно экзотический формат. Но иногда такие встречаются и СК их неправильно трактует. В обозримой перспективе исправлять этот недочет не входит в мои планы. Рекомендую преобразовывать такие тифы в более "привычный" формат: 8 или 24 бит.

Автор: shch_vg, Отправлено:23:02 18-08-2021

bolega

Цитата:
СК не поддерживает 16-битные изображения.

Я только что с этим разобрался, провозился с переводом в 8бит.
Похоже это подарок от неграмотного использования vuescan.
Странно только, что оба скана 16-битные, один виден в СК, другой нет.
Впрочем не очень странно, т.к. первый сканировался в Фото Вьювере.

Автор: kamenkapenza, Отправлено:01:00 20-08-2021

Здравствуйте, дорогие друзья! Какими инструментами Кромсатора можно подправить нечёткость, размазанность букв цветного текста? Настройку букв проводил только путем уменьшения, увеличения бинаризации в зоне картинки (они цветные, т.е. идут как зона картинки). Некоторые буквы полураспавшиеся (изначально), выеденные, некоторые бахромистые, ошмёточные. Может, в меню bloor настройки зон поковырять, чтобы эту проблему решить, какие то параметры выставить? Получившаяся книга здесь https://disk.yandex.ru/d/AZRI-iFlUBSb3g Файлы для оказания неоценимой помощи (несколько страниц для видеоролика, в котором можно показать алгоритм работы) тут https://disk.yandex.ru/d/q4C7KtLwbpFyUg

Автор: kamenkapenza, Отправлено:11:48 20-08-2021


Цитата:
Вы делаете out-таск.
File > Create out task (выходное задание; обработанные файлы основного задания становятся входными файлами out-задания)
File > Create sub task (под-задание, т.е. подмножество из одного или более файлов)
Т.е. это разные вещи


Понятно. Спасибо!



Добавлено:

Цитата:
Это поддается какому-то логическому объяснению?


Бинаризацию надо уменьшить. и чернота пропадет. А проще сделать эту чёрно-белую книгу про шахматишки в Скан Тейлоре.
А ещё самый первый, архиважный шаг книгопроизводства: надо сканировать грамотно, на сканере, корешок плотно к стеклу прижимать. У вас крайние к корешку знаки расплылись, нечёткие, хорошего результата изначально не получится. Чтобы как то сделать видимыми эти знаки нужно будет ужирнять текст (поднимать бинаризацию), тем самым нормальные знаки станут жирными-прежирными.


Добавлено:

Цитата:
Потихоньку заставит Вас пересказать всю инструкцию в шапке.


Вас послушать, какая то у вас тут шапка безразмерная, если всё интересуемое в ней находится, прямо шапка Мономаха )))

Автор: shch_vg, Отправлено:15:05 20-08-2021


Цитата:
Бинаризацию надо уменьшить. и чернота пропадет.

Вот еще на одного "специалиста" в теме стало больше.
Оказывается 16-битовое сканирование тут ни при чем.

Добавлено:

Цитата:
Вас послушать, какая то у вас тут шапка безразмерная, если всё интересуемое в ней находится, прямо шапка Мономаха )))

Не возбуждайтесь так сильно, поскольку в отквоченной вами цитате речь шла лишь об инструкции по получению сабтаска.

Автор: 1234olexiy, Отправлено:14:23 21-08-2021

Интересно: а будет ли когда-нибудь реализовано автоматическое выделение картинок как в Скантейлоре?
очень удобная вещь. сокращает время обработки в разы

Автор: kamenkapenza, Отправлено:15:02 21-08-2021


Цитата:
Интересно: а будет ли когда-нибудь реализовано автоматическое выделение картинок как в Скантейлоре?
очень удобная вещь. сокращает время обработки в разы

В 7-й версии. Я так думаю!!!))) (фраза Мкртчяна из "Мимино"). Вы правильно говорите, что это очень удобная вещь, иногда Скан Тейлор так идеально определяет зону картинки (режим "Смешанный"), что ничего править не надо. Это касается картинок с прямоугольной зоной печати. Если картинка сложная, внеконтурная, то без Скан Кромсатора всё равно не обойтись, Скан Тейлор не имеет убирать фон между элементами рисунка (между рисунком и тектстом). Я книги без картинок (без фото) или с черно-белыми или цветными картинками, заключенными в прямоугольную зону печати, делаю в Скан Тейлоре, особенно если их немного. Если картинок много или они сложные, то в Кромсаторе, создатель и повелитель Кромсатора bolega недавно раскрыл тайну Золотого Ключика: показал в видеоролике все способы обработки картинок. Возможно (я просил), что в этом году многоуважаемый bolega покажет нам все инструменты Скан Кромсатора по коррекции текста. Картинки изучены, буквы нет. Ну и разрезку страниц надо производить в Тейлоре, намного быстрее и проще. Разрезка, полезная область и поля за 5-10 минут для книги в 500-700 страниц.
Так что и без Скан Тейлора не обойтись на первом этапе обработки, и без Скан Кромсатора на финальном.
Комбинированная обработка сканов (в двух программах)- идеальное и оптимальное решение для создании pdf/djvu-книг.

Добавлено:
Раз пошли пожелания, что хотелось бы видеть в новой версии, то неплохо было бы сделать фиксированной для профиля функции "Поля" (Page width). Чтобы можно было выставить в этой настройке "none"и зафиксировать в профиле для последующих заданий, и при новой запуске Скан Кромсатора поля так и оставались в "none", а не перескакивало каждый раз на "auto". Это было бы удобно для тех товарищей, как я, которые и "нашим, и вашим", т.е. создают книгу в двух программах (Тейлор-Кромсатор) и поля выставляют в Тейлоре, т.е. в Кромсаторе оставались неизменными

Автор: 1234olexiy, Отправлено:19:45 21-08-2021


Цитата:
показал в видеоролике все способы обработки картинок.

а где энти видео можно посмотреть
подскажите плиз

Автор: kamenkapenza, Отправлено:20:40 21-08-2021


Цитата:
а где энти видео можно посмотреть
подскажите плиз  

Сейчас из заначки достану, исходники, из первых рук, так сказать. Вот тут (ссылка удалена в виду её секретности) Всё подробно рассказано и разложено по полочкам. Всем бы так объяснять! Видео это из разряда запрещенных на этом форуме, никто на него особо ссылки не даёт, ни в какие "шапки" и "штаны" не кладут, не светят, иначе никто не будет смотреть видео по поводу Кромсатора от других товарищей. Я в сети не видел такого досконального объяснения конкретной темы, в данном случае - обработка зон рисунков и удаление фона в Кромсаторе. Ещё бы подобное видео от автора программы по поводу обработки текста, и можно вообще в ютуб и куда-либо по поводу работы в Кромсаторе не заглядывать.

Автор: niccolo, Отправлено:22:21 21-08-2021

Небольшой баг или неприятная особенность (6.71)
При сворачивании в трей программа не запоминает позицию и размеры окна на экране.

Автор: kamenkapenza, Отправлено:07:42 22-08-2021


Цитата:
При сворачивании в трей программа не запоминает позицию и размеры окна на экране.

И даже не помогает Фикс зум? (В окне списка обрабатываемых файлов правой кнопкой мыши, выбрать Special - Zoom - выбрать Fix current zoom).
А по большому счёту на фига он нужен этот трей? Это же надо где-то в углу найти манюсенький значок нужной программы. выковырять его и запустить. Не проще ли закрепить нужные программы, которые часто используются для работы, в панели задач, там они большушенькие (значки), не ошибешься, если лень нажать ярлык программы на рабочем столе. Тут вообще никакой проблемы нет! Самое главное, чтобы книжечки получались хорошенькие.

Автор: TelecomUral, Отправлено:14:01 23-08-2021

niccolo
у меня запоминает.

Автор: niccolo, Отправлено:14:56 23-08-2021

TelecomUral

Не запоминает. Разворачиваю на левую половину экрана (Win+Left) - сворачиваю в трей кнопкой в верхнем правом углу - разворачиваю обратно и получаю плавающее окно размером в 20-25% от исходного в левой верхней четверти экрана.

Могу ролик выложить....

Автор: TelecomUral, Отправлено:15:23 23-08-2021

niccolo
понятно. видимо не работает фишка новой винды - автопривязка к габаритам экрана. Я попробовал порастягивать и подвигать вручную - всё работает. Но если нижний край вставал впритык к полосе программ не вручную, а автоприжимался - то это автоприжатие не восстанавливается, да. А в случае Win+Left сразу четыре габарита так автоприжимаются.
Ерунда так то.

Автор: niccolo, Отправлено:17:13 23-08-2021


Цитата:
понятно. видимо не работает фишка новой винды


Я до новой винды не дорос. Мне 7 выше крыши...

Автор: romanef, Отправлено:15:38 27-08-2021


Цитата:
При сворачивании в трей программа не запоминает позицию и размеры окна на экране.


у меня в Вин10 несколько рабочих столов и Кромсатору выделен отдельный стол.

кстати, рабочими столами никто не пользуется, а зря
очень классная штука.
переключение клавишами ктрл+вин+стрелки

Добавлено:

Цитата:
Мне 7 выше крыши...



никто не будет заморачиваться подпиливанием софта по устаревшую семерку

Добавлено:

Цитата:
Комбинированная обработка сканов (в двух программах)- идеальное и оптимальное решение для создании  pdf/djvu-книг.


читаю и думаю - блин, реинкарнация monday2000

Автор: TelecomUral, Отправлено:18:15 27-08-2021

Пока не уверен, но вроде обнаружил мелкий баг.
Пробую добавить одну и ту же букву в панель глифов. Не нравится, удаляю. В конце концов выбрал такую, которая нравится. У неё с боков чуть-чуть побольше чёрного выступает (правые кругляшок и кончик у "е"). И тут обратил внимание что ее иконка явно не соответствует выбранной букве. С боков как-бы подрезано по одному или два столбика пикселей. Или это эффект от уменьшения масштаба? Размер 30х36.

Автор: kamenkapenza, Отправлено:19:32 30-08-2021

Здоровеньки булы!!! Для хлопчиков, хотящих изучить Кромсатор, переоформил Хрестоматию в легкоусваяемый формат пдф. Правда, пока не стал ничего редактировать,всё сделал по оригиналу кхм-вской,все разделы шиворот-навыворот. Вначале надо историю создания программы,возможности программы, затем полный обзор меню, подменю, закладок, подзакладок, список команд в алфавитном порядке (хотелось бы конечно полный перевод с басурманского на русский,ну уж как есть), потом уже работа, обзор операций и всех ньюансов, затем создание джву. Далеко ходить не надо. Пункт 2.12. Изготовление djvu, затем про чего-то...., потом 4.12. DJVU визард. Это ведь единое целое: создание джву и обзор меню создания джву, настройки профиля кодирования. Всё сделано вразнобой с 5-е на 10-е, надо всё это дело систематизировать в строгой последовательности для простого русского народа, желающего познать процесс создания книг через СканКромсатор.

Автор: shch_vg, Отправлено:20:01 30-08-2021


Цитата:
Всё сделано вразнобой с 5-е на 10-е, надо всё это дело систематизировать в строгой последовательности для простого русского народа

Осталось только назначить главного систематизатора.

Автор: Archivist, Отправлено:20:10 30-08-2021

Меня в свое время немало озадачил большой объем (70мб) компактной в сущности Хрестоматии, но 225мб это уже совсем за рамками приличия.

Автор: shch_vg, Отправлено:20:16 30-08-2021


Цитата:
но 225мб это уже совсем за рамками приличия

Наверное, если оптимизировать, то можно загнать в 20мб.
Интересно, а в этом пдф распознавание сделано?

Автор: TelecomUral, Отправлено:21:29 30-08-2021

оффтоп

Цитата:
shch_vg
Интересно, а в этом пдф распознавание сделано?

вы же видите чьё авторство, тогда к чему вопрос
На мой вопль позавчера в личке "где ocr?!" было отвечено что это ненужная никому фича. Барство. Надо, мол, читать "легкоусваяемый формат пдф"
хотя я всё не проверял...

Автор: kamenkapenza, Отправлено:23:16 30-08-2021


Цитата:
Осталось только назначить главного систематизатора.

Систематизатора и надо назначать из того, кто учится и кто видит несистемность этой Хрестоматии.

Цитата:
Меня в свое время немало озадачил большой объем (70мб) компактной в сущности Хрестоматии, но 225мб это уже совсем за рамками приличия.

Батенька, вы просто никогда не скачивали РГБ, а я в своё время скачал её всю (книги свободного доступа), там есть книги и по 3,5 Гигабайт, ОДНА! Купите несколько дисков по 4-6 Террабайт и 250 Мб вы просто не заметите. Это же Энциклопедия!!! Она и должна быть красивой и большой. На Паблибе (Библиотека Ершова) издания Советской Энциклопедии (1,2,3) каждый том по 300-400 Мб. А что такое 250 Мб, если Энциклопедия основополагающая книга, одна единственная. Скачайте и не ворчите! Хотя бы посмотрите какое качество. Неприлично урезать размер, всячески сжимать книгу. Это вот верх неприличия! Каждый для себя может ужать при желании хоть до одного килобайта (было бы что жать)

Цитата:
Надо, мол, читать "легкоусваяемый формат пдф"

Вот, вот!!! "Кролики - это не только ценный мех, но и три-четыре килограмма диетического, легкоусвояемого мяса" Улыбнитесь, господа!

Цитата:
Интересно, а в этом пдф распознавание сделано?

А что вы там распознавать собрались? И для чего? Я там ни одной буквы не изменил и авторства не присваивал.
Даже закладки есть (можно выбрать раздел в меню и выйти сразу в нужную главу). Так что берите и радуйтесь. Жмите до стольки байт, сколько считаете приличным.




Автор: TelecomUral, Отправлено:07:30 31-08-2021

оффтоп

Цитата:
kamenkapenza
И для чего?

Вы не понимаете разницу между текстовым документом (MS word) и картинкой. Поиск по тексту может сократить время нахождения нужного абзаца в десяток раз.
Самый такой банальный пример - крупное художественное произведение, типа "Война и мир", где вам надо найти места упоминания Наполеона, и простым последовательным чтением всего романа вы будете искать эти места дня четыре. А поиском по ocr-слою это можно сделать меньше чем за минуту.
На кой чёрт нужен ваш pdf, если это графика, и спецтермины найти невозможно. Например, despecle.

upd
могу также напомнить про предметные и именные указатели в конце научных и справочных книг. та же цель, моментально найти упоминание термина или фамилии в здоровенном талмуде.

Автор: trion1, Отправлено:09:39 31-08-2021

kamenkapenza
Цитата:
Для хлопчиков, хотящих изучить Кромсатор, переоформил Хрестоматию в легкоусваяемый формат пдф.
А зачем? Она уже есть в пдф с окр всего 42Мб.

Автор: qwaxym, Отправлено:15:03 31-08-2021

Оффтоп

Цитата:
никто не будет заморачиваться подпиливанием софта по устаревшую семерку

Ну да, конечно..., люди под ХР модифицируют драйвера, чтобы устанавливать на современное железо, https://hd-24.ru/windows/windows-xp-mod-2021-ustanovka-sistemy-na-sovremennyj-pk/ а про семёрку вообще молчу. И подпиливать софт не нужно, т.к. есть программы непосредственно для этих ОС!

Автор: kamenkapenza, Отправлено:16:17 31-08-2021


Цитата:
Поиск по тексту может сократить время нахождения нужного абзаца в десяток раз.Поиск по тексту может сократить время нахождения нужного абзаца в десяток раз.
Самый такой банальный пример - крупное художественное произведение, типа "Война и мир", где вам надо найти места упоминания Наполеона

Кто-то читает книги полностью..., кто-то только про Наполеона. Мой вариант для тех пареньков (а, может, и девиц), которые последовательно читают литературу, от начала до конца. Понятно тогда, почему в кхм-вской Энциклопедии все темы от балды (сначала рассказана работа в программе, а потом показаны функции меню, это потому что главное "Поиск", выцепить что-то, и не важно, как располагаются главы: то ли по уму, то ли через задницу. В инструкции к любому прибору сначала указывают назначение кнопок, их функцию, как управлять, а уж потом разговор идет по непосредственной работе. В моем варианте я поставлю последовательность по уму (пока она тоже сделана, как в оригинале - через задницу).

Цитата:
А зачем? Она уже есть в пдф с окр всего 42Мб.

Когда я спрашивал, есть ли Хрестоматия в пдф, все молчали, как партизаны, а тут она внезапно появилась откуда-то. Ну и где она? Ссылки в студию! Надобно посмотреть, а то, может, ерунда какая: ни текста не разобрать, ни картинок, в эти 42 Мб впёхнутые. У меня высшего качества: я никогда ничего не урезаю. Зачем??? Ну если вы книги для чтения по смартфону делаете, там их и храните, тогда базара нет, а я книги исключительно на компьютере храню и читаю.




Автор: trion1, Отправлено:16:51 31-08-2021

kamenkapenza
Цитата:
Когда я спрашивал, есть ли Хрестоматия в пдф, все молчали, как партизаны, а тут она внезапно появилась откуда-то. Ну и где она? Ссылки в студию! Надобно посмотреть, а то, может, ерунда какая: ни текста не разобрать, ни картинок, в эти 42 Мб впёхнутые. У меня высшего качества: я никогда ничего не урезаю. Зачем??? Ну если вы книги для чтения по смартфону делаете, там их и храните, тогда базара нет, а я книги исключительно на компьютере храню и читаю.
В теме надо быть :
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1380#8

Автор: shch_vg, Отправлено:17:20 31-08-2021

kamenkapenza

Цитата:
Мой вариант для тех пареньков (а, может, и девиц), которые последовательно читают литературу, от начала до конца.

Вы в своем полемическом запале не доходите до маразма. Научитесь отличать справочную литературу от художественной. В справочной (и ИМХО только в ней) распознавание обязательно, т.к. никому не придет в голову при поиске ответа на конкретный вопрос читать все с начала.

Автор: kamenkapenza, Отправлено:21:36 31-08-2021


Цитата:
В теме надо быть :
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1380#8


А вы сами то видели, что там за ерунда? Вот здеся (по вашей ссылке) https://disk.yandex.ru/d/Gp-RQtMgM1dl2Q В формате rtf текст и рисунки обрезаны по правому краю, то есть остаётся догадываться, что там написано и нарисовано. В формате pdf маненько получше, но такая же беда: обрезка текста и рисунков. Если не верите, посмотрите стр. 73. Ещё эта ваша хваленая Энциклопедия в 40 Мб изначально открывается в треть экрана. В моей Энциклопедии (извиняюсь, не моя , а в моём варианте pdf) страницы открываются на весь экран (это мой стиль работы создания pdf - pdf на весь экран изначально, и никакая страница не обрезана.
Скажу вам по секрету, что просто так сконвертировать эту Энциклопедию из chm в другой формат без искажений не получится. Поэтому я пошел другим путём и ничего не конвертировал.


Цитата:
В справочной (и ИМХО только в ней) распознавание обязательно, т.к. никому не придет в голову при поиске ответа на конкретный вопрос читать все с начала.

Если именно для вас это обязательно, то можете в моей pdf-версии ввести поиск по названию терминов, я не против. Если у вас это получится, я буду очень рад.

Если кому понадобится нормальный pdf-вариант Энциклопедии, письните мне на почту, дам ссылку.




Добавлено:
Может, кто знает, как через Кромсатор создать pdf-книгу? В Энциклопедии чего-то я не нашел, видео тоже не обнаружил на этот счет. Опять тайна за семью печатями. Можно конечно продолжать делать,как я делаю: через Мергезон, а потом из папки аут вставлять в Акробат. Вроде бы,через какое то Какаду делают.

Автор: TelecomUral, Отправлено:04:17 01-09-2021


Цитата:
В Энциклопедии чего-то я не нашел

а вы её читайте сплошняком. там есть

Добавлено:
shch_vg
признаю вашу правоту про игнор. Это ж он сначала удаляет ocr (в смысле - собственно текст), а потом я должен быть "поисковой функцией" по картинкам.

Автор: kamenkapenza, Отправлено:09:51 01-09-2021


Цитата:
а вы её читайте сплошняком. там есть

А как же поиск? Вы же тут все говорите, что "Поиск" - неотъемлемая часть этой Энциклопедии. В поиске не находит "Создание pdf" Если "сплошняком", то моя pdf-Энциклопедия лучше, чем допотопная chm. Слишком спесивым паренькам рекомендую попробовать конвертировать chm в pdf и показать результат, ну и посмотрим мастерство, сравним наше и ваше. Много слов, а дел никаких. Про ту ущербную Энциклопедию, которая 40 Мб просьба не упоминать в виду её дефектности (какие именно дефекты, я указывал выше, можете проверить)

Автор: TelecomUral, Отправлено:11:10 01-09-2021

оффтоп


Цитата:
В поиске не находит "Создание pdf"

Искать тоже надо с умом. Вы ещё "усваяемость pdf" там поищите, систематизатор.

Автор: kamenkapenza, Отправлено:12:49 01-09-2021


Цитата:
усваяемость

Я её ищу у Данильца с Моисеенко в 3-х-4-х килограммах


Цитата:
shch_vg
признаю вашу правоту про игнор

Это вы зря мне пишете, отвечаете, а то "свои" переведут в когорту балбесов и перестанут с вами общаться, имейте в виду. Видите: все сидят и помалкивают, как бы им лиса не говорила: "Петушок! Петушок! Золотой гребешок. Выгляни в окошко, дам тебе горошка.

Автор: shch_vg, Отправлено:13:10 01-09-2021

kamenkapenza

Цитата:
Про ту ущербную Энциклопедию, которая 40 Мб просьба не упоминать в виду её дефектности

Я смотрю вашего ума хватает только на производство глупых шуток. В "ущербной Энциклопедии" набрал в поиске pdf, и через минуту нашел в ней места, относящиеся к получению пдф в СК.
Зря вы занялись обработкой, гораздо больше бы пользы принесли, например, в лесном хозяйстве, да и для здоровья это полезней. Если ваша мысль созрела для ответа на это сообщение, то милости прошу в Личный Ящик (заодно и узнаете, что это такое, поищите в самом верху этой страницы).

Автор: kamenkapenza, Отправлено:15:00 01-09-2021


Цитата:
Зря вы занялись обработкой, гораздо больше бы пользы принесли, например, в лесном хозяйстве, да и для здоровья это полезней.

Вы, милый друг, за меня не беспокойтесь! У меня времени хватает и на лесное хозяйство, и на всякое другое, и на творчество. Я не видел ваших творений, а то, может, и вас послать в какое-нибудь хозяйство пользу обществу приносить. Птиц-говорунов, отличающихся умом и сообразительностью, много, а практической пользы никакой. Вот тут мои 7 сотен сделанных книг, с каждым днем прибывающих https://mirknig.su/user/kamenkapenza/news . (не забываем входить через анонимайзер, приложений типа browsec в виду запрещённости сайта)
А вы, батенька, что для общества создали?

Автор: shch_vg, Отправлено:16:42 01-09-2021

kamenkapenza
Поскольку вы, не милый и не друг, не соизволили (или просто не смогли) перевести разговор в ЛЯ, а собираетесь вместо признания своей неспособности найти что-то в "ужасной Хрестоматии" меряться причинными местами, считаю недостойным какое-либо дальнейшее общение с вами в этой теме.
Насколько же верно новозаветное высказывание "Не мечите бисер перед свиньями".
Три месяца в теме, а запах...
Безусловный игнор!

Автор: shch_vg, Отправлено:00:01 02-09-2021

bolega
Столкнулся с таким случаем.
Обрабатывал очень грязные сканы со скачущим по сканам текстовым блоком.
Т.к. все равно пришлось осматривать каждый скан, решил обработать с очень грубой (далекой от текста) расстановкой резаков, чтобы на стадии предфинализации при просмотре уменьшать выбранную программой текстовую зону (которую в дальнейшем буду называть ВТБ - выбранный текстовой блок) до границ текстового блока.
У всех сканов задал выравнивание по высоте - Т.
Естественно, что после предварительного прогона вокруг текстового блока почти каждой страницы программа захватывала большое лишнее пространство в ВТБ.
Перемещаю стороны ВТБ на границу текстового блока, причем после каждого перемещения стороны программа корректирует положение текстовой области согласно параметрам выравнивания. Корректирует при перемещении всех сторон кроме нижней, перемещение которой НЕ приводит к изменению положения текстового блока.
Когда же я поменял на выравнивание по высоте по центру, то перемещение любой стороны ВТБ сопровождается изменением положения текстового блока.

Автор: shch_vg, Отправлено:17:30 04-09-2021

bolega
На скане, импортированном из пдф в СК, появляются "трупные" пятна. В акробате и в нитро скан импортируется нормально. Все это можно посмотреть по этой ссылке.

Автор: DmitryKz, Отправлено:09:32 05-09-2021

Ребята, можно ли средствами СК получить из скана такой результат с минимальными усилиями?

То есть получить такую таблицу, с залитыми разным цветом фона хедером и содержанием таблицы, и с белой рамкой. Таких таблиц в книге отосительно много, поэтому не хочется делать их в виде обычной картинки. Хотелось бы, чтобы по стилю не оличалось от основного текста.

Автор: TelecomUral, Отправлено:12:35 05-09-2021


Цитата:
DmitryKz
результат с минимальными усилиями

можно, но как только вы дадите адекватное определение минимальных усилий. Потому что самое минимальное - это нулевое. "Кому и кобыла невеста" (с)

Иначе говоря, чем вас постеризация в СК не устраивает-то?

Автор: DmitryKz, Отправлено:13:46 05-09-2021


Цитата:
адекватное определение минимальных усилий

Да, некорректно выразился. В моем представлении рисовался сложный процесс и в сравнении с ним хотелось минимизировать сложности. Требовался просто аутентичный рецепт для данного случая.
Спасибо, испытаю постеризацию.

Автор: TelecomUral, Отправлено:14:03 05-09-2021

DmitryKz
если что - ролик есть. https://www.youtube.com/watch?v=FnoqZe-uEhU

Автор: DmitryKz, Отправлено:14:05 05-09-2021

TelecomUral
Ага, сейчас его смотрю и пробую.
Спасибо, кстати, и за ролик)

Добавлено:
Крутая фича.
С таким моментом не разобрался — если в одной из ячеек таблицы находится полноцветная графика (картинка, изображение), которая будет отдельной зоной и которая не будет постеризоваться, как сделать, чтобы участок зоны под ней (зоны, которая будет постеризоваться), был пустым, без этой самой картинки, которая увеличивает объем файла "родительской" зоны?

Автор: TelecomUral, Отправлено:14:49 05-09-2021

DmitryKz
зона на зону не может влиять. Поэтому удалите в нижней (постеризуемой) зоне картинку руками. Ну, ещё можно сложный контур зоны сделать. Типа выпил. Но это, ИМХО, геморно.

Автор: DmitryKz, Отправлено:14:57 05-09-2021

Способа сделать в VR аккуратные выделения на родительской зоне по дочерним (наложенным) нет?

Автор: TelecomUral, Отправлено:15:06 05-09-2021

DmitryKz
мне неизвестны такие способы. Но, может быть, bolega подскажет. У него часто кролики из шляпы появляются для таких задачек.

А почему неаккуратно выходит? Ячейки же прямоугольные. Выделили ячейку с картинкой (в VR Zones) и нажали Del. Всё.

Автор: DmitryKz, Отправлено:15:10 05-09-2021

Да-да, мне просто лень. Просто вот она возможность для автоматизации одного из элементов ручного процесса. Ладно, буду надеяться на кролика, а пока ручками.

Автор: bolega, Отправлено:16:27 05-09-2021

DmitryKz
Если цветов больше двух, то постеризовать.
Если есть черный, то желательно его первым отделить. Как это делать, я показывал в своем ролике https://www.youtube.com/watch?v=zSDnkloduk0 .
К сожалению, вы не дали ни одного примера (в очередной раз из разряда "лечите меня по телефону"), чтобы глянуть, насколько здесь это будет легко и не понадобится ли какой-нибудь другой "кролик", как выразился TelecomUral. Ну на нет и суда нет.


Автор: daa2013, Отправлено:16:00 06-09-2021

Мне по поводу этого примера пришла в голову мысль, что, может, какой векторизатор для построения таблиц и мог бы существовать. Чтобы заданное число вертикальных и горизонтальных линий строил. Либо сам для них (одинаковые) толщины определял, либо заданное число пикселей делал. А потом, может, ещё и цвет менял.

Вертикальные и горизонтальные линии ведь часто руками приходится встраивать и копипастить. Может, какая автоматизация тут и возможна. К тому же я не знаю так сходу, как белую сетку сделать. Инвертировать, построить черную, инвертировать обратно ... ?

Автор: Rick593, Отправлено:22:48 06-09-2021

bolega
Спасибо вам за прекрасную программу, пользуюсь постоянно.
Не могли бы вы рассмотреть возможность явного задания размера разных полей четных и нечетных страниц или их выравнивания L/R в зависимости от четности? Если обрабатываю изображения, отсканированные разворотами, проблем нет, галка Split активирует настройки второй половины разворота. Но в случае одностраничных сканов, если нужно сохранить оригинальные несимметричные поля, приходится прощелкивать каждый второй файл, задавая нужное выравнивание.

Может быть, что-то не так делаю?

Автор: TelecomUral, Отправлено:03:42 07-09-2021

Rick593
размножение свойства на четные/нечетные почему не применяете?

Автор: kamenkapenza, Отправлено:12:14 07-09-2021


Цитата:
Может быть, что-то не так делаю?

Rick593, разрезку страниц и поля лучше делать в программе Scan Tailor, всё это дело там занимает 5-10 минут даже для книги в 1000 страниц.

Автор: bolega, Отправлено:17:54 07-09-2021


Цитата:
поля лучше делать в программе

Человек, в форуме СК (в других - пожалуйста) отсылающий в другие программы, автоматически попадает в мой личный блэк-лист. Больше меня просьбами можете не беспокоить.

Автор: kamenkapenza, Отправлено:18:49 08-09-2021


Цитата:
Человек, в форуме СК (в других - пожалуйста) отсылающий в другие программы, автоматически попадает в мой личный блэк-лист. Больше меня просьбами можете не беспокоить.


Ну вот! Хотя я и стал самым злейшим врагом всего Кромсаторного сообщества и личным врагом Главнокомандующего, но правда дороже: ту операцию, про которую я говорил лучше делать... там, где я сказал - большая экономия времени.
По просьбам и отказам: вы и так дали понять, что к Его Величеству лучше не обращаться.
Про то, что вы выдали по моей просьбе (один разок) в основном пригодится другим людям, об этом можете не переживать, не зря потратили время.

Автор: niccolo, Отправлено:23:10 08-09-2021

Снова я с книгой с Архива.
https://archive.org/details/refrigerationair0000lang
Изображений при ней нет
в 6.71 не получается импортировать PDF в SK картинками без зон или подложек в количестве, равном числу страниц.

В режиме без зон вообще импортируются картинки, похожие на то, что книгу напечатали плотно тёмнофиолетовыми чернилами и потом полили водой и они потекли.....

Снова поднимаю вопрос - с какими настройками можно втянуть такие книги в СК так, чтобы они выглядели как в Акробате.

Вопрос 2. Болега - в вашем видео ч.1 по работе с картинками (там где пушки) в окне результатов самая правая панель инструментов с кнопкой деления окна результатов на окно страницы и картинок — никак не могу её найти в Версии 6.71.... У вас на видео какая-та особенная версия?

Автор: TelecomUral, Отправлено:04:31 09-09-2021


Цитата:
niccolo
У вас на видео какая-та особенная версия?

правой кнопкой щелкните на этой панели инструментов, там видимость кнопок настраивается


Сама панель включается по ПКМ, это "image adjustments", упс, зарапортовался спросонок. Конечно, это "preferences panel2":




Автор: bolega, Отправлено:08:05 09-09-2021

kamenkapenza
Это была шутка

niccolo
Я посмотрю (если дадите фрагмент своего pdf), но с архива лучше тянуть картинки, а не pdf. PDF там совсем убитые. А картинки нормальные (раз в 5 качественнее, чем pdf), если не считать артефактов сильного jpg-сжатия. На форуме publ.lib.ru уже не раз этот вопрос обсуждался.

Автор: niccolo, Отправлено:08:11 09-09-2021


Цитата:
Сама панель включается по ПКМ,


Спасибо. Несколько нестандартное решение.

Кто хочет посмотреть файл, но не имеет доступа к Архиву
https://www.upload.ee/files/13459062/Langley_Refrigeration_and_air_conditioning.pdf.html

Добавлено:
Болега, спасибо за ответ. Но к сожалению у данного файла нет опции — исходные изображения.


Еще вопрос
такие дефекты (зонное нарушение резкости то ли из-за плохого прижима у CIS-сканера, то ли из-за кривости самого сканера)

https://www.upload.ee/files/13459072/0017.tif.html
в СК можно вытянуть хотя бы до уровня распознавания 1-1,5% ошибок (сейчас >8-10%)?

Автор: bolega, Отправлено:09:50 09-09-2021

niccolo

Цитата:
Снова я с книгой с Архива.

Дайте скриншот с вашими настройками импорта pdf


Цитата:
Но к сожалению у данного файла нет опции — исходные изображения

Для программиста нет ничего невозможного
Если надо, я дам вам исходные этой книги. Но не быстро


Добавлено:

Цитата:
В режиме без зон вообще импортируются картинки, похожие на то, что книгу напечатали плотно тёмнофиолетовыми чернилами и потом полили водой и они потекли.....

Вы не поверите, но именно в таком виде хранятся слои в этом pdf. Забавно, да? При нормальном импорте (не в режиме do not used zones) эти "потеки" вроде бы не видны, но на самом деле они тоже есть на изображении, просто маскируются. В общем, это все типично и даже нормально для Lura с помощью которого этот pdf создавался.
Чтобы получить вид для таких pdf как в acrobat, нужно сделать так:
импортировать с опцией use original pdf page size/layout. После импорта отмаркировать все файлы большой кнопкой "сбросить все опции и отмаркировать...", запустить обработку. После обработки сделать полный merge зон. Получившиеся на выходе файлы можно использовать для обработки (можно просто сделать из них out-задание).

Добавлено:

Цитата:
Несколько нестандартное решение.

А как по вашему было бы стандартно?

Автор: niccolo, Отправлено:10:29 09-09-2021


Цитата:
Дайте скриншот с вашими настройками импорта pdf


Я перепробовал 3 варианта с разными настройками original size и зон.
Получаются пакеты c ~1500 и ~2100 картинок.


Цитата:
Если надо, я дам вам исходные этой книги. Но не быстро

Не надо. Я уже на PNG из Акробата карандаш для распознавания подтёр.


Цитата:
После импорта отмаркировать все файлы большой кнопкой "сбросить все опции и отмаркировать...", запустить обработку.


А потом ещё третий раз - Deskew. И только потом уже работать..... Так себе алгоритм.


Цитата:
А как по вашему было бы стандартно?


По моему не знаю. А со времён ворда 97 панели настраивались ПКМ по свободному месту на панели инструментов, как у вас настраиваются кнопки на панелях.

PS. Люра на архиве — очень популярна. Возможно стоит добавить в экнциклопедию подсказку - как лучше работать с Архивом - если есть оригиналы - тянуть их, конвертировать из JP2000 в JPG и обрабатывать, а если нет — тогда ваш вариант, либо экспорт в картинки из ПДФ в любой программе, которая это позволяет, и далее стандартная работа в SK.

Автор: bolega, Отправлено:10:37 09-09-2021

niccolo

Цитата:
Так себе алгоритм.

Блин, ну я уже запарился объяснять, почему СК именно так импорт делает, т.е. извлекает картинки as is, а не "рисует" их как акробат.

Автор: niccolo, Отправлено:12:18 09-09-2021


Цитата:
Блин, ну я уже запарился объяснять, почему СК именно так импорт делает, т.е. извлекает картинки as is, а не "рисует" их как акробат.


Болега - я не прошу объяснений, как устроен импорт PDF в SK. Вопрос стоит в том - как правильно импортировать книги с Архива или возможно ли это сделать, и с какими настройками...

Нет, так нет. И если это нигде не написать - он будет задаваться всеми, кто сталкивается с обработкой этих книг в SK.

Автор: TelecomUral, Отправлено:12:27 09-09-2021


Цитата:
добавить в экнциклопедию подсказку - как лучше работать с Архивом

светлая мысль, между прочим, а то больно много геморроя при импорте.
К сожалению, не реализуемо: надо проводить анализ содержимого pdf в каждом конкретном случае, а это потребует высокой (относительно, конечно) квалификации юзера.
Но составить шпаргалку хоть на типовые варианты и разместить в шапке в помощь пользователям - да, имеет смысл. Я не возьмусь, ибо плохо знаю инструменты анализа pdf, но может найдётся герой. Типа "в таком-то случае видим то-то и поступаем так-то, в таком-то - так-то".

Автор: bolega, Отправлено:12:46 09-09-2021

niccolo

Цитата:
Нет, так нет.

Не понял, нет что? Я же написал алгоритм, вы его отвергли. Насильно мил не будешь.


Цитата:
И если это нигде не написать -

Почему так, я уже неоднократно писал. Нужен мастер, который это вставит в инструкцию.
И кстати, архив тут ни при чем, Lura причина. Помню, у гугла такие же файлы были.

Автор: Archivist, Отправлено:16:25 09-09-2021

Кстати насчет разбора и пересбора PDF Кромсатором. Какие особенности PDF приводят к появлению пустых подложек (отсутствующих в исходнике) под страницами выходного файла? Снятие галки с original size/layout улучшает ситуацию, но не отменяет подложки под страницами с зонами картинок. Как от них автоматически избавиться?

Автор: TelecomUral, Отправлено:16:39 09-09-2021


Цитата:
Какие особенности PDF приводят к появлению пустых подложек (отсутствующих в исходнике

это пару страниц назад было подробно описано автором. У страницы pdf есть размеры. Также есть размеры объектов на странице, в т.ч. и изображений (картинок). Если не совпадает одно с другим - то будет сгенерирована пустышка-"страница".
Такая логика - необходима. Из-за самой структуры формата pdf.
Я думаю, можно merge применить для выходного файла. Но не пробовал.

Автор: Archivist, Отправлено:16:46 09-09-2021

TelecomUral
Спасибо, ознакомлюсь. А мысль такая - из выходного PDF можно "руками" удалить все подложки без какого-либо вреда для документа, так почему бы не делать это сразу автоматически.


Цитата:
Я думаю, можно merge применить для выходного файла. Но не пробовал.

Нене, мердж не подходит, в книжке текст в 600dpi и вырезанные картинки в 300, только все это очень грязно и неаккуратно сделано.

Автор: shch_vg, Отправлено:16:54 09-09-2021

Archivist

Цитата:
Как от них автоматически избавиться?

Галкой в Do not use zone

Автор: TelecomUral, Отправлено:16:58 09-09-2021


Цитата:
Нене, мердж не подходит, в книжке текст в 600dpi

почему? мерджите текст на пустышку.

bolega, может сделать специальный вариант импорта под конкретный случай, когда canvas не совпадает с самой большой зоной, но эта большая зона явно единственная? Хотя... нет, не получается. Если картинки тоже будут в 600, то автоматике не разобраться.

upd
хотя лично я во всех неадекватных случаях импорта делаю экспорт в тиффы попплером или акробатом, и уже их гружу в СК. Как правило это много проще оказывается. Лучше уж заново выделить картинки чем мудохаться в их импортированных слоях. Иногда та-акое встречается!

Автор: Archivist, Отправлено:17:11 09-09-2021


Цитата:
хотя лично я во всех неадекватных случаях импорта делаю экспорт в тиффы попплером

Я тоже так обычно делаю, но в данном случае придется картинкам апскейлиться до 600dpi, чего не хотелось бы.

Автор: TelecomUral, Отправлено:17:50 09-09-2021


Цитата:
придется картинкам апскейлиться до 600dpi

так вставьте external zone. Я же про экспорт исходных изображений, а не растеризацию.

Автор: driver1991, Отправлено:13:59 11-09-2021

Можно ли перетаскивать таблицу глифов из одного задания в другое?

Ситуация: обрабатываю многотомное издание. Для каждого тома надо делать таблицу глифов? Нельзя ли каким-то образом использовать уже имеющуюся? Никаких указаний найти не смог, поэтому прошу знающих товарищей помочь.

Автор: gsn13n, Отправлено:15:08 11-09-2021

Можно. Рядом с файлом задания - вида Имя.spt находится таблица глифов - вида Имя.skgli... Заменяете таблицу глифов - вида Имя.skgli на вариант из предыдущей обработки. Перезапускаете SK.

Автор: driver1991, Отправлено:15:22 11-09-2021

gsn13n

Большое спасибо!!! Через пару дней начну обрабатывать следующий том - надеюсь, будет чуть полегче.

Автор: niccolo, Отправлено:15:50 11-09-2021

bolega

Цитата:
Не понял, нет что? Я же написал алгоритм, вы его отвергли. Насильно мил не будешь.


Алгоритм, как оказалось, так себе.
Попробовал на этой и еще одной книге.

Пытаюсь получить выровненную картинку страницы по вашему алгоритму, добавляя, предварительно очистив всё, Deskew - безрезультатно. Я понимаю, что выравнивается просто пустая подложка - но вряд ли это кого-то обрадует.... Получается, что попытавшись сделать как я с непустыми подложками и картиночными зонами, можно нарушить макет страницы....

Как вообще лучше действовать с перекошенными страницами с ортогональными иллюстрациями? Кажется в вашем видео Ч1 эта проблема обойдена стороной.

На втором примере - полученный при импорте инвертированный текст благополучно перешёл в результаты экспорта и книга из чёрно-белой стала бело-чёрной..... Как-то желание экспериментировать дальше уже пропало.....

PS - Порча картинок, например на стр. 31 выложенной книги - это особенность люры или это была проблема оригинала?


Цитата:
Для каждого тома надо делать таблицу глифов? Нельзя ли каким-то образом использовать уже имеющуюся? Никаких указаний найти не смог, поэтому прошу знающих товарищей помочь.


Может для таких целей создание шрифта Сканфонтом лучше подойдёт..... При обильной запечатке перетаскивать символы мышкой - не самое удачное решение.

Автор: driver1991, Отправлено:16:34 11-09-2021

niccolo


Цитата:
Может для таких целей создание шрифта Сканфонтом


Вы имеете в виду scanfont? Можно поподробнее?

Здесь: https://disk.yandex.com/d/OZrDI6_mN5rkqw

я выложил задание с четырьмя страницами - сканы с обработкой - может быть кто-нибудь сможет помочь и указать, как можно улучшить результат.

Автор: niccolo, Отправлено:20:22 11-09-2021


Цитата:
Вы имеете в виду scanfont


Да её. Создаёте шрифт по литерам вашей книги и далее спокойно запечатываете дефекты без всякого геморроя.

Касательно данной книги - последовательность действий может быть такой - распознавание - Сохранение в ПДФ и далее правка ПДФ с созданным шрифтом в FR PDF 15. Получается ТЕКСТ в оригинальном макете.


Если нужен вариант в графике - запечатываете дефекты в векторном графредакторе....

Учитывая трудозатраты на подготовку (создание шрифта) - такой подход имеет смысл в ограниченном числе случаев, когда требуется масштабная запечатка и нужно сохранить оригинальный вид (что по файлам явно не ваш случай)

Автор: Benoni, Отправлено:22:43 11-09-2021

driver1991
В таблице глифов на закладке Preferences внизу есть Load glyphs. Нажмите эту кнопку и укажите путь к уже имеющийся таблице глифов. Она появится в данной таблице глифов со знаком +.

Автор: driver1991, Отправлено:22:58 11-09-2021

niccolo

Книги - это 90-томное собрание сочинений Льва Толстого. Я хочу его оцифровать, пару месяцев назад закончил сканрование всех томов, теперь продолжаю обрабатывать сканы. Но получается не очень гладко, книги старые, страницы покороблены, грязные и все такое прочее.

Я не работал с этими программами, поэтому придется знакомиться. Если учитывать еще очистку страниц, то объем работы - мало не покажется. Спасибо зо помощь. Сначала все-таки надо прикинуть - что надо делать и что только пожелание. Интересно все же, что можно сделать в СК, можно ли улучшить результаты.

Benoni

Спасибо за указание, Я до сих пор работал с версией 5.96.2. Надо, конечно, пользоваться новыми версиями, а не цепляться за старое.

Еще раз спасибо.

Автор: bolega, Отправлено:10:58 12-09-2021

driver1991

Цитата:
Книги - это 90-томное собрание сочинений Льва Толстого. Я хочу его оцифровать, пару месяцев назад закончил сканрование всех томов, теперь продолжаю обрабатывать сканы. Но получается не очень гладко, книги старые, страницы покороблены, грязные и все такое прочее.

Там основная проблема - тончайшие перемычки. По хорошему надо было опробовать посканить в 600dpi с последующей обработкой в 1200 ч/б. Возможно, получилось бы получше.
Попробовал их вытянуть, получилось немного лучше, но грязи добавилось. Трудный случай. Вот пример: https://workupload.com/file/AyFs8Hb93W6
Первая страница из вашего задания, вторая моя проба на основе вашего.

Автор: asku, Отправлено:11:01 12-09-2021


Цитата:
Книги - это 90-томное собрание сочинений Льва Толстого. Я хочу его оцифровать, пару месяцев назад закончил сканрование всех томов, теперь продолжаю обрабатывать сканы.



Они же оцифрованы давно!

Автор: bolega, Отправлено:11:04 12-09-2021

Про копирование глифов вам уже правильно подсказали. Добавлю, что их еще можно через карман копировать из одного открытого задания в другое (copy-paste). По одному либо скопом.
Напомню еще, что можно создавать несколько закладок глифов. Перемещать глифы между закладками тоже можно, либо через copy/paste, либо проще перетянуть выделенные глифы мышкой на имя другой закладки.

Автор: driver1991, Отправлено:11:26 12-09-2021

bolega

Прежде всего - спасибо за ответ.

Там тонкие перемычки на не очень хорошей бумаге (скажем так). Пересканировать все с разрешением 600 дпи - довольно много работы, но пару станиц я сделаю, чтобы попробовать. Посмотрю результат. Из-за тонких перемычек приходится увеличивать порог бинаризации, что не всегда есть хорошо.

В версии 6.71 есть команды Blur2 и Sharpen2 - они, кажется, тоже улучшают. Ну, а грязи там достаточно всегда - это уже с книг идет, поэтому там вручную чистить и чистить.

С глифами теперь все ясно.

Автор: bolega, Отправлено:12:26 12-09-2021

driver1991

Цитата:
Из-за тонких перемычек приходится увеличивать порог бинаризации, что не всегда есть хорошо.

Да, поэтому я задал в опциях увеличивать порог только для букв "и" и "н". Плюс включил контурную резкость, это улучшило завитушки у букв. Blur2 и Sharpen2 тут ничем не помогут.


Цитата:
Там тонкие перемычки на не очень хорошей бумаге

Там шрифт такой, дореволюционные шрифты были с такими тонкими перемычками.
Да и бумаге уже наверно больше ста лет...

Автор: driver1991, Отправлено:12:40 12-09-2021

bolega


Цитата:
поэтому я задал в опциях увеличивать порог только для букв "и" и "н"


Я не знаю всех возможностей последних версий СК, мне каким-то образом попала версия 6.71. Поэтому, если можно - поподробнее, где и как это задается или где об этом почитать?

И еще вопрос: какая версия является последней и как можно ее получить?


Цитата:
бумаге уже наверно больше ста лет...


Это, само по себе очень хорошее советское издание, очутилось в библиотеке Майнцкого университета. Естественно, никаких указаний о том, как эти книги сюда попали - нет, хранятся они тоже не в стерильных условиях. Сохранность - соответственно.

Еще раз спасибо за ваши ответы.



Автор: TelecomUral, Отправлено:20:18 12-09-2021


Цитата:
driver1991
где об этом почитать?

в комплекте с СК идёт текстовый файлик whatsnew. Там описано достаточно, чтобы разобраться в новых фичах.
Если у вас комплект неполный, то скачайте из шапки этой темы.

оффтоп

Цитата:
само по себе очень хорошее советское издание

вроде же СС Толстого, как раз 90-томное, сканировали и распознавали файнридеровцы+общественность. Публичный такой проект был, солидный. Обещали что всё останется в бесплатном доступе.

Автор: niccolo, Отправлено:21:19 12-09-2021


Цитата:
вроде же СС Толстого, как раз 90-томное, сканировали и распознавали файнридеровцы+общественность. Публичный такой проект был, солидный. Обещали что всё останется в бесплатном доступе.


Был такой проект у них в 10-11 годах. Только они вычитку отсканированного и распознанного делали. За участие давали FR11 или уже 12 вроде....

Автор: asku, Отправлено:22:56 12-09-2021


Цитата:
Был такой проект у них в 10-11 годах. Только они вычитку отсканированного и распознанного делали. За участие давали FR11 или уже 12 вроде....


Ну так на их сайте были все 90 томов в pdf. Помню скачивал несколько томов.

Автор: TelecomUral, Отправлено:11:35 15-09-2021

bolega
А можно сделать так, чтобы при первом открытии свойств зоны окошко ее предпросмотра сразу становилось открытым? У меня как-то всё время получается, что оно нужно открытым раз уж я в свойства полез. Вроде и мелочь, а давно раздражает, что нужно кнопочку шёлкнуть.

Автор: kamenkapenza, Отправлено:14:42 15-09-2021

Здравствуйте, хлопчики!
Случайно не знаете на вскидку, где , в каком меню можно настраивать убирание всякой каки, мусора, точек на странице? А то, если в Талмуде (Хрестоматии) искать, месяц надобно потратить, а мне бы сразу хотелось узнать, незамедлительно.

Автор: daa2013, Отправлено:14:29 20-09-2021

bolega

Можно ли как нибудь сделать так, чтобы команда меню основного окна
Zones -> Picture zone - > Add zone from file
могла быть применена не к одному файлу, а к нескольким ? И соответственно выбранная группа файлов по порядку имен вставала последовательно на тот файл в списке, на котором мы находимся, и последующие за ним.
(Первый файл из группы на тот файл, где мы находимся, второй - на следующий за ним, и т.д.) При этом всей такой группе зон присваивался свой бы собственный индекс. (То есть, окошко Add zone from file должно спрашивать пользователя об индексе этой группы).

Если по каким-то причинам в диалоге невозможно сделать выделение нескольких файлов, то можно указать папку, и расставить в качестве зон файлы, лежащие в этой папке (по порядку имен).

Выравнивания, как происходит сейчас, в левый верхний угол будет вполне достаточно. Но можно заодно добавить гибкости и предоставить пользователю варианты (центр, другие углы, некая вводимая координата).

?

Автор: bolega, Отправлено:20:09 20-09-2021

daa2013
Мудрено как-то. Интересно, в чем смысл этого?
Добавить сразу несколько зон можно и сейчас, методом drag&drop из проводника например. А вот сделать это с заменой сразу нескольких существующих зон не получится.

Автор: daa2013, Отправлено:20:29 20-09-2021

Заменять ничего не нужно. Просто положить поверх уже существующих страниц (и имеющихся на них зон). И тут не нужно класть несколько зон на одну страницу. (Драг и дропом они все окажутся на текущей). Нужно первую зону (картинку) поставить на первую (текущую) страницу, вторую картинку - на вторую (следующую) страницу и т.д.

Именно так работает Add zone from file и сейчас, но только в отношении одной картинки и текущей страницы. А я бы хотел, чтобы это применялось пакетом к группе картинок и группе последовательных страниц. И чтобы при этом группе создаваемых зон присваивался выбранный индекс. (От 1 до 10 у вас они, кажется, предусмотрены.) Рассматривайте это как многократный вызов этой команды по числу вставляемых зон (картинок) с переходом каждый раз на следующую страницу.

Смысл - откроются большие возможности по работе со слоями картинок и битмапами.

Автор: TelecomUral, Отправлено:04:51 21-09-2021


Цитата:
daa2013
откроются большие возможности по работе со слоями картинок

типа - импорт background-слоя дежавю? Распилили внешней программой на два пакета, втянули чб текст как сканы, а потом этой новой командой наложили зоны? Да, но как быть с отличающимся дпи? А с прозрачностью?
Иных задач - практических! - я что-то не вижу. Если габариты зон не совпадают с габаритами страницы (не кратны), то ручное перетаскивание в нужную позицию и последующая настройка убьёт весь выигрыш в скорости. Удобнее тогда уж индивидуальный drag&drop из соседнего окна. В смысле - допилить его, чтоб позволял точнее (или лучше заранее) настроить параметры вставки. Я никогда не пользовался dd, так что пишу от балды, может уже и сейчас он такой умный.
То есть сначала выставляем нужные правила вставки, индекс зоны, что-то ещё, и потом между двумя открытыми окошками мышкой тягаем картинки поштучно.

Автор: daa2013, Отправлено:05:00 21-09-2021


Цитата:
Да, но как быть с отличающимся дпи?

Ну не надо абы какие первые попавшиеся картинки такими кучами вставлять.
Заранее подумать, посмотреть. Это проблема подготовки вставляемого.
Если вы собрались джву курочить (о чем я даже не подумал), то задники апскейлятся до передников при разборке.
Зато разделенные сканы можно будет без FSD в СК собирать.



Цитата:
А с прозрачностью?

Ставится галочка "траспарент" в свойствах зоны и размножается на группу с соответствующим индексом.

Автор: TelecomUral, Отправлено:05:38 21-09-2021

оффтоп

Цитата:
Если вы собрались джву курочить (о чем я даже не подумал)

из-за Долгополова, это была самая яркая мысль. Вы нашли плохие буквы, а метода их исправить в готовом дежавю без перекодирования не существует. Всё равно расслаивать. upd Ну, утилиты NME не в счёт, всё-таки они не удобны для массовой и уникальной замены одновременно.
Апскейл это всегда плохо.

Автор: NME, Отправлено:09:11 21-09-2021

TelecomUral

Цитата:
а метода их исправить в готовом дежавю без перекодирования не существует. Всё равно расслаивать.

Существует..
Чтоб здесь не оффтопить ответил в соответствующем топике..

Автор: kamenkapenza, Отправлено:13:48 24-09-2021

Братья, здравствуйте!
Где-то я слышал, что в Кромсаторе можно делать восстановление букв, когда буквы разъеденные, смазанные, обгрызенные, то есть имеют некий дефект. Вроде бы, это называется то ли глифирование, то ли гликирование. Может, кто-нибудь знает про это? В Хрестоматии (Энциклопедии) по Кромсатору не нашел я такого. а очень надобно бы для работы с кривыми буквами.

Автор: daa2013, Отправлено:21:20 25-09-2021


Цитата:
гликирование. Может, кто-нибудь знает про это?


Про глюкирование ?
Вот тут пишут, что это внедрение недокументированных эффектов:
https://zxpress.ru/article.php?id=11696

Автор: kamenkapenza, Отправлено:13:36 26-09-2021


Цитата:
внедрение недокументированных эффектов

А про документированные эффекты и функции? Есть ли в Кромсаторе возможность коррекции дефектного текста, про который я писал выше: обгрызенные буквы, т.е. пропадание элементов букв или наоборот заплывание букв - типографские кляксы, а так же убирание палочек между букв (бывает такая печать). Есть возможность решить эти проблемы в современной версии (6.71) или это дело последующих версий?

Автор: daa2013, Отправлено:14:42 26-09-2021

Автоматической коррекции - нет. Пока ручками только. См. раздел 2.10 хрестоматии.
Поставить подсветку спеклов на размеры покрупнее. (Так чтобы палочки как раз подсвечивались). Набрать библиотеку глифов, и вперед. Вклеил букву, удалил вокруг неё ошметки. Чтобы меньше нужного подсвечивалось и не отвлекало, можно выполнить распознавание и отключить подсветку для знаков препинания. Некоторые всё равно будут светиться, но станет попроще.

Я вижу тут возможности автоматизации.
ИМХО, если сделано распознавание, то СК может сам предлагать пользователю вставляемый глиф, да даже и автопозиционировать его внутри ячейки тессеракта. Если СК ошибся - пользователь от такой вставки всегда откажется. А поймать обгрызенную букву или букву с приклеившейся палочкой можно сравнивая число пикселей в ячейке с эталонной буквой из библиотеки глифов. Если тессеракт какую-то букву не распознал - это тоже повод подсунуть ее пользователю, т.к. что-то с ней не так.
Но поддержки мои идеи, увы, тут не нашли.

Добавлено:
Еще я погрызенные буквы стал ловить в DjvuEditor-е из пакета Document Express Professional 7.0
То есть из файлов от СК сделан джву, открыт в параллель СК. Там есть закладка Shapes и необычные шейпы подсвечиваются зеленым. Соответственно эти буквы можно найти в исходных тиффах и заменить.
(Почему такое нельзя встроить в СК - для меня загадка. Координаты ячеек тессератка есть, значит их можно расцветить или подсветить, как угодно)

Автор: TelecomUral, Отправлено:15:21 26-09-2021

daa2013

Цитата:
Если тессеракт какую-то букву не распознал - это тоже повод подсунуть ее пользователю

будет слишком много ошибок. Нерационально.
Я тут пересканировал себе Пигулевскую, про культуру сирийцев. Такие вот странички - впечатляют.

Или любой другой около-филологический многоязычный текст. Особенно санскрит и тэ пэ вязь.
А для одноязыкового текста и палочки убирать не стоит, глаз за них и сам по себе не цепляется. Родной язык. Нас же не бесят палочки в бумажных книгах. Ужирнять шрифт только не надо.
То есть если уж подсвечивать и/или предлагать к замене - то нужна чёткая логика подбора алфавита. А её кроме человеческого мозга, увы, не создаёт пока ничто. Причём на лету. Одна только "точка снизу" чего стоит.

Автор: daa2013, Отправлено:15:57 26-09-2021


Цитата:
будет слишком много ошибок. Нерационально.


Бесполезно спорить о вкусе устриц с тем, кто их не ел.
То есть в FR я ловлю плохо распознанные букы или орфографические ошибки, а потом их правлю в тиффах, и это рационально. Джву отсматриваю на предмет кривых шейпов - и это тоже оказывается рационально. Не для всех книг такое надо естественно. И не для всех срабатывает. Но такие встречаются (!)
(На самом деле это намного более лютые методы поиска, чем ячейки подсвечивать.)


Цитата:
Особенно санскрит и тэ пэ вязь.

Ну всё. Если книга с санскритом каким-то методом обработана быть не может, то в топку метод. Ассирия на марше.

Автор: TelecomUral, Отправлено:16:13 26-09-2021


Цитата:
daa2013
в топку метод

Да почему. Нет.
Но я не согласен с подходом, который потенциально умножает ошибки. Это, в общем-то, философский вопрос. Масштабность. Вы предлагаете такую автоматику, которая а) не автоматика в сути своей и б) реально может вносить новые трудноисправляемые ошибки, потворствует их появлению. Я высказался против подхода, и указываю на неочевидные недостатки метода, реализующего сам подход. А что по идее чего-то там можно распознать тессерактом - да ради бога, я "за". Просто общесистемно это ни к чему не ведёт. Масса ручной мозговитой работы как была так и остаётся.
Тут было бы приемлемо натравить вначале на страницу опознавание языка, разделение потока текста на одноязычные блоки, а уж потом применение конкретных глифов (шрифта). Возможно, подключить тексты из интернета. Ведь вполне возможно кто-то где-то уже данный текст (кусок) использовал и он доступен, цитирован, например. В сносках - литература, допустим. Библиозапись стандартна в пределах страны и периода. Вот это да, системно. Мы бы покрыли текст понятием "язык", или "культурная единица". А частные подправки-костылики - нее. Надо понимать их плюсы и минусы. Быстро, но иногда плохо.

Автор: TelecomUral, Отправлено:09:15 27-09-2021

bolega
на ютьюбе задали вопрос: можно ли применить настройки с панельки image adjustments сразу ко всем зонам страницы?
У меня как-то была мысль, когда вы только-только показали постеризацию, что будет в свойствах зоны опция "применить постеризацию с именем палитры таким-то".

Автор: bolega, Отправлено:12:03 27-09-2021

TelecomUral

Цитата:
можно ли применить настройки с панельки image adjustments сразу ко всем зонам страницы?

Нет.
В черновой версии СК есть возможность за раз загрузить все зоны во внешний редактор. И даже разбить зоны на отдельные куски с заданным максимальным размером.

Добавлено:
daa2013

Цитата:
Почему такое нельзя встроить в СК - для меня загадка. Координаты ячеек тессератка есть, значит их можно расцветить или подсветить, как угодно

Уже не раз говорилось, что координаты тессеракта увы весьма приблизительны. Т.е. включают в себя не только букву, но и мусор вокруг нее (например, спеклы, даже весьма далекие, или палки-марашки). Из-за этого размеры габаритов в тессеракте могут быть больше реальных размеров глифов до 2 раз. Это сильно затрудняет работу. Т.е. нужно внутри его габаритов еще дополнительно искать реальную букву таким же методом, как и при вставке глифа, т.е. нужен еще глиф-эталон, который придется выбирать для каждой буквы из заготовленной б-ки глифов. Это первая сложность. Вторая - на странице буква может быть разных размеров (разные размеры шрифта), тогда не понятно, какой использовать эталон, т.к. размер может больше как из-за неверных габаритов, так и из-за разного кегля.

Автор: daa2013, Отправлено:13:44 27-09-2021


Цитата:
Т.е. нужно внутри его габаритов еще дополнительно искать реальную букву таким же методом, как и при вставке глифа

Да, именно ! В этом и цель, чтобы СК букву вставил, а юзер только кликнул, чтобы она вклеилась, или Cancel paste (хоткеем) выбрал.
А после действия юзера - переход на другую ячейку.



Цитата:
больше реальных размеров глифов до 2 раз

Сейчас по ощущениям, мышку стало надо точнее к букве держать. Но в версии 6.00.5., кода автопозиционирование только появилось, на расстоянии 2-3 букв все прекрасно ставилось. (И работать, по рефлекторным воспоминаниям, было удобнее). Вообще Было бы неплохо в опциях выбор алгоритмов автовставки сделать. (Про крайне вредное уползание глифа вслед за мышкой при перевставке я уже писал.)



Цитата:
нужен еще глиф-эталон, который придется выбирать для каждой буквы из заготовленной б-ки глифов.

Да, эти ассоциации пользователю придется задать вручную. Либо индивидуально для глифа, либо какую таблицу букв и номеров глифов вывести по типу кодировочной.


Цитата:
на странице буква может быть разных размеров (разные размеры шрифта), тогда не понятно, какой использовать эталон

буквы одного кегля надо собирать на одной закладке. + будет кодировочная таблица, соответствующая этой закладке. Тогда буквы на закладке, но не попавшие в таблицу (другой шрифт, другой кегль) вставляться не будут.
Пользователю, видимо, придется указывать на странице зону, для которой должна активироваться такая автовставка с текущей закладки. (Ну, то есть пойманы координаты тессерактовских ячеек, попавшие в эту выделенную зону.)


Возможно, если будет опция включения и отображения тессерактовских ячеек на странице, то, глядя на них, придут какие-то идеи по уточнению их координат. Тессеракт же как-то ловит буквы внутри них.
Может, опорные линии строк определять, и на них корректировать. (Это я уже фантазирую.) Просто я прекрасно помню, как раньше точно всё автопозиционировалось.

Что касается сравнений с эталоном без вставки, а только подсветки - когда определена точка вставки глифа, можно для этой точки сплошную черную область взять и с эталоном сравнить - есть ли погрызы или пришлёпки.
Хотя можно и сразу вклеить (точнее, сначала наложить и пользователю показать), хуже от этого не будет.

Я про своё видение всей этой механики тут уже как-то писал.

Автор: TelecomUral, Отправлено:14:06 27-09-2021


Цитата:
Просто я прекрасно помню, как раньше точно всё автопозиционировалось

зачем помнить, вы попробуйте поработать в старой версии.

Автор: daa2013, Отправлено:14:39 27-09-2021

Открыл старый проект. в 6.00.5
летит на полтора буквы., т.е +- 0,5 буквы в стороны с межбуквенным пробелом. (Но это просто зона поиска такая выставлена, ) была бы она +- целая буква, то все равно бы вставала.
Эти 0,5 буквы там равны 22 пикселей. (размер глифа где-то 35*35 пикселей)


Открыл новый проект. в 6.71. Лажает уже даже при приближении к соседней букве. , т.е. где-то 0,1 буквы
Но тут 1200 дпи проект, и величина смещения = 15 пикселей. (А размер глифа где-то 80*80)

Ну все равно 15 и 22 окрестность поиска - это на 50% разница.

Upd
но визуально 0,1 буквы и 0,5 буквы воспринимаются как на 400% разница,
Было бы круто подстраивать вручную область поиска под разрешение и размеры глифа.

Upd2
В результате мышкой приходится шевелить точнее и аккуратнее. И это не то, чтобы раздражает или кажется неудобным, но сформулирую так: вызывает ностальгию по тем временам, когда деревья были большими (а глифы - маленькими).

Автор: kamenkapenza, Отправлено:21:41 27-09-2021

А про это глифирование (пусть даже и корявенькое) есть ролик на Ютубе или это тайна Ордена СканКромсаторщиков?

Автор: shch_vg, Отправлено:00:51 28-09-2021

bolega
Несколько почему, появившихся в ходе конкретной работы.
Обрабатываю комплект из 12 номеров, каждый их которых содержащий множество шахматных диаграмм, которые призодится помещать в пикчер-зоны.

1. Почему при копировании стандартной зоны последующее ее пастэ делается не в месте нахождение курсора, а в месте копирования? При работе с большим масштабом это довольно затруднительно. (Это вопрос задавался уже давно).

Далее завожу зоны трех видов, которые запоминаю в свойствах зоны.
2. Почему при прерывании работы и возобновлении ее на следующий день эти три вида не запоминаются, и приходится их заново восстанавливать.
Неплохо бы и запоминать тип выбранной зоны.

А может быть это реализовано, просто я об этом ничего не знаю?

Автор: bolega, Отправлено:08:30 28-09-2021

shch_vg

Цитата:
Далее завожу зоны трех видов, которые запоминаю в свойствах зоны.

Вы имеете ввиду запоминаете в трех карманах?
Там все восстанавливается, кроме карманов 4 и 5 в последней версии, из-за бага они не восстанавливаются

Автор: bolega, Отправлено:15:27 28-09-2021

kamenkapenza

Цитата:
Может, кто-нибудь знает про это? В Хрестоматии (Энциклопедии) по Кромсатору не нашел я такого. а очень надобно бы для работы с кривыми буквами.

Ну вот же было видео от AAW:
https://www.youtube.com/watch?v=KbfM3JQym9g

Автор: kamenkapenza, Отправлено:17:27 28-09-2021

bolega, спасибо за ссылку! Без вас было бы не найти. Этот AAW на басурман работает ))) У него названия роликов на английском языке. Например, этот называется "aaw16 SK glyphs". Не знаю, как вам, а мне бы век не найти в поисковике по таким тегам.
Я чего то по этому видео особо ничего не понял. Откуда взяты эталонные буквы из библиотеки глифов? Там про это ничего не сказано.
Уважаемый bolega, я хоть ваш личный враг №1, но без вас никто не прояснит народу коррекцию букв (в том числе чистка мусора, замена букв, улучшение качества без замены) А также в меню зоны картинки про пункты Фильтерс, Фильтерс2, Блур, Шарпен, наглядно показать, что и как). Вы умеете доступным языком и подробно шаг за шагом всё объяснить (про картинки в предыдущем ролике даже я всё понял)) ).



Автор: TelecomUral, Отправлено:04:36 29-09-2021


Цитата:
kamenkapenza
мне бы век не найти в поисковике

Если что, там описание к видео "Чистка мусора и замена плохих буковок."

Автор: nuget2, Отправлено:12:57 29-09-2021

TelecomUral, было бы неплохо добавить ссылку в шапку, типа ( Чистка мусора и замена плохих буковок ).

Автор: trion1, Отправлено:13:01 29-09-2021


Цитата:

Цитата:
Цитата: kamenkapenza
мне бы век не найти в поисковике
Если что, там описание к видео "Чистка мусора и замена плохих буковок."
Никому не найти из-за "БУКОВОК"

Автор: TelecomUral, Отправлено:13:29 29-09-2021

trion1
Да, но я и не веду записи на канале для поиска. Предполагалось, поскольку Кромсатор - "комбайн" инструментов, изучение записей, поэтому в помощь - описание записи и вот таймлайны я сделал к последним видео bolega. Но полный просмотр всего записанного - обязателен. Иначе в СК как бы и не поработаешь. Не стояло задачи создать легкий поиск решения конкретной микропотребности, просто идеология программы не та.
nuget2
думаю, не стоит. По вышеописанной причине "комбайна". На каждый чих не наздравствуешься.

Автор: nuget2, Отправлено:13:49 29-09-2021

TelecomUral, человек задал конкретный вопрос, на который есть ответ на вашем канале. Причем здесь "комбайн"? Или программа поддерживает несколько функций замены глифов?

Автор: TelecomUral, Отправлено:14:09 29-09-2021

nuget2
при том, что если вписывать здесь в шапку все возможные вопросы от людей, то шапка превратится в копию списка команд Кромсатора, который составляет порядка 800 строк. Неразумно это.

Хрестоматия была писана для таких вопросов. Конкретный kamenkapenza не умеет её читать и в ней искать. Я не хочу чтобы из-за него все остальные люди имели неудобную шапку темы.

Автор: nuget2, Отправлено:15:06 29-09-2021

TelecomUral, ну зачем переворачивать. Речь идет только о видео на вашем канале. Куда проще добавить ссылку по ключевым вопросам, чем каждый раз дублировать в сообщениях...

Автор: TelecomUral, Отправлено:15:11 29-09-2021

nuget2
Вы Хрестоматию прочли всю? Сколько будет таких "ключевых" вопросов? Ведь в СК нету ненужных фич. Всё по делу.
Не надо ничего дублировать, здесь и я, и daa2013, и shch_vg, (и другие люди тоже, по-моему) несколько раз моментально давали ссылки на главку и пункт, находили тему в Хрестоматии и давали место. Она для этого удобно сделана, сколько daa2013 бился с drExplain, пока всё заработало. А видео, повторяю, для другого созданы. Туда не надо лепить ссылки отсюда. Достаточно одной.
Впрочем, если хотите - вставьте под "Подробнее". Я тут не начальник, а шапка не залочена.

upd
я наверное, потому ещё не хочу ссылок, что мне не нравятся свои видео Больно много там воды, неточностей. Вот у bolega всё хорошо.

Автор: daa2013, Отправлено:16:00 29-09-2021

nuget2
kamenkapenza



Цитата:
было бы неплохо добавить ссылку в шапку

Цитата:
если вписывать здесь в шапку все возможные вопросы

В шапке выложена подборка всех ответов болега на вопросы за 2003-2016 гг., но ее тоже не читают. Коротенький раздел про глифы там - 8.3. Про то, как делать pdf - 9.1


Цитата:
Речь идет только о видео

В другой ветке форуме капенца высказывал конструктивную мысль:


Цитата:
если есть Хрестоматия, то на каждый раздел, на каждый подраздел надо видео, короткими фрагментами, но подробно на каждый пункт меню с демонстрацией, что происходит при изменении каждой настройки ....

Ну так возьмите и сделайте. Я много раз писал, что я всегда рад встроить в хрестоматию что-нибудь в ней отсутствующее. Напишите это только и в инете опубликуйте.

А) Разработайте индекс с вопросами или темами, которые, как вам кажется, в Хрестоматии просто так найти не получается.
Можно вставить в конце как альтернативное оглавление или индекс.

Б) Видео в chm от эксплейна можно вроде так встраивать:
https://www.drexplain.ru/help/insert_video_window_into_help_manual.php#
Запишите такие ролики и укажите, куда вставить. Только коротенькие, четкие и понятные.

Автор: nuget2, Отправлено:18:16 29-09-2021

TelecomUral

Цитата:
Вы Хрестоматию прочли всю? Сколько будет таких "ключевых" вопросов?

А сколько ключевых вопросов охватывают ваши видеоматериалы?


Цитата:
я наверное, потому ещё не хочу ссылок, что мне не нравятся свои видео Больно много там воды, неточностей.

Интересно, я не обратил внимание. На мой взгляд, видео вполне годное.


Автор: TelecomUral, Отправлено:18:29 29-09-2021

nuget2
наверное, процентов 20. Хотя как посмотреть.

Автор: kamenkapenza, Отправлено:19:59 29-09-2021


Цитата:
Никому не найти из-за "БУКОВОК"

"Чистка мусора" она и есть чистка мусора. "Буковки" это и есть буковки. А тут был вопрос по секретной процедуре глифирования (библиотека глифов). Если набирать в поисковике именно так, то хрен чего найдешь. Вот басурманам (англичанам) проще: набрал "SK glyphs", и они могут смотреть видео №16 (похоже, что оно на них и рассчитано, раз зашифровано по-ихнему). Единственное радует, что всё-таки на русском языке.

Добавлено:
Про глифы (глифирование, библиотеку глифов) нам всем не мешало бы послушать начальника транспортного цеха (Роман Карцев, юмор ))) ) многоуважаемого bolegу, потому что ничего про это никто толком не знает, а очень бы хотелось.

Добавлено:

Цитата:
Вот у bolega всё хорошо.

Это на самом деле так. Я вообще в Кромсаторе ничего не кумекаю, а посмотрел его видео и всё по данной теме понял (кстати в поисковике их тоже не найти, видео надо было назвать "Скан Кромсатор. Удаление фона страницы в иллюстрациях. Полное объяснение от автора программы". Если не знаешь, у кого искать на ютуб-канале, то видео не найти.
А такие вещи надо помещать на самый верх шапки, потому что: 1. Объясняет сам автор Кромсатора ( про это и тема); 2.Объясняет простым понятным языком, человек умеет это делать; 3. Объяснения доскональные исчерпывающие, логически связанные, нет воды (ничего лишнего, уводящего от темы)
Извиняйте, друзья, но то, что в шапке - в подметки не годится, если сравнивать с объяснениями автора программы. Жаль, что никто шапкой не занимается, а то бы много что удалить из-за неумения преподнести материал, углубиться в главное, а не прыгать по верхам с 5-е на 10-е.

Автор: daa2013, Отправлено:01:12 30-09-2021


Цитата:
Жаль, что никто шапкой не занимается, а то бы много что удалить из-за неумения


Удалил из шапки всю инфу не от болега.
Несите ответственность за свои действия и слова в интернете.
Займитесь шапкой и наполните её понятными материалами.

Upd
Добавил ссылки на оригинальные видео bolega, т.к. при заливке их на ютуб произошло пережатие и уменьшение пиксельных размеров картинки, она стала менее четкой.

Автор: shch_vg, Отправлено:02:47 30-09-2021

daa2013

Цитата:
Удалил из шапки всю инфу не от болега.

Надеюсь, Вы сохранили то, что удалили, потому что в этом деле немного перестарались и удалили как раз "инфу от болега", а зачем-то оставили мою.

P.S. Боюсь, что в этой теме наступит хаос, если любые нелепые требования вновь появляющихся будут вызывать не совсем адекватную реакцию.

Автор: TelecomUral, Отправлено:03:20 30-09-2021

оффтоп


Цитата:
shch_vg
если любые нелепые требования вновь появляющихся будут вызывать ...

ну а что. зато "проверка на прочность". есть хоть у кого-то твёрдое понимание "как правильно и как неправильно", или хаос абсолютен. как там у постмодернистов - ризома, в которой концов не найдешь и ничто ни от чего не зависит.

Автор: daa2013, Отправлено:07:56 30-09-2021


Цитата:
Надеюсь, Вы сохранили то, что удалили

Удаленный кусок спрятал тут под коврик.
Удачи будущим шапкостроителям !

#

Автор: shch_vg, Отправлено:14:14 30-09-2021

daa2013

Цитата:
Удачи будущим шапкостроителям !

Сейчас кое-кто лоб расшибёт, внедряя туда свои идеи.

P.S. Пардон, забыл, что начальники не внедряют, а только дают указания.

Автор: daa2013, Отправлено:14:17 30-09-2021

Вот вы сейчас только что продублировали информацию. Там, где вопросики "Что делать, ...".
Я же объединил все тексты. Три вопросика ИМХО никто читать не будет. Достаточно одного. Почитайте повнимательнее. Советую удалить вновь вставленное.

Автор: kamenkapenza, Отправлено:14:28 30-09-2021


Цитата:
Видео по обработке зон

Как то вообще ни о чём! Смысл этого видео от автора программы (просьба была моя, я прекрасно помню, о чем просил, и автор подробно всё рассказал) в удалении фона страницы в иллюстрациях. Особенно это присуще первой части, во второй части автор продолжил рассказывать про удаление фона , а также про малоцвет, работу с обложкой и создание джву. Название "Видео по обработке зон" здесь совсем не подходит, потому что это слишком объемлюшая тема, зоны бывают разные: цветные, контрастные, черно-белые и ещё какие-то... Поэтому название надо специализировать, чтобы не вводить людей в заблуждение, что в этом видео раскрыта тема обработки зон.
Тему надо выделить (она у вас обычным шрифтом, хотя другие темы у вас выделены), указать, что видео от автора программы (проявим в нему уважение) и название темы сузить до того наименования, какое я указал (ч.1 Удаление фона станицы в иллюстрациях: Ч.2 Удаление фона станицы в иллюстрациях (продолжение), малоцветные иллюстрации, работа с обложкой и создание джву)

Автор: daa2013, Отправлено:14:58 30-09-2021

Именно с таким описанием его автор выложил.
Вперёд - исправляйте. Шапка же не залочена.

А ! Вам надо 202 сообщения набрать. В правилах написано, что редактирование открыто для Member-ов.
http://forum.ru-board.com/topic.cgi?forum=13&topic=1624

Вы, наверно, опцию "редактировать" и не видите. Ну, создайте в своем сообщении методом постепенного редактирования подобие шапки, я потом перенесу, если явных глупостей не будет.
А каждый чих править тут не буду.

Автор: kamenkapenza, Отправлено:15:55 30-09-2021

Объяснения от автора программы bolega: это наверху, титульный лист, так сказать, того, что пойдет ниже (будем надеяться, что автор не ограничиться тем, что уже объяснил)
Ниже пойдут ролики от автора шрифтом на порядок ниже. Я не имею права редактировать, так как пишут, что имеет право владелец сообщения.
Первый ролик будет выглядить так:
Удаление фона страницы в иллюстрациях, малоцвет, работа с обложкой и создание djvu
ч.1 Удаление фона страницы в иллюстрациях (ссылка на ролик)
ч.2 Удаление фона страницы в иллюстрациях (продолжение), малоцвет, работа с обложкой и создание джву (ссылка на ролик)




Автор: daa2013, Отправлено:16:08 30-09-2021

Нет. Как я уже писал, имеет право любой форумчанин со статусом Member. Это значит 202 сообщения и выше. У вас же пока 130.
Что, зеленым выделять ?

Автор: kamenkapenza, Отправлено:16:23 30-09-2021

В таком духе, в таком разрезе,как показано выше. Будет возможность обособить видео из первых рук от создателя программы.

Добавлено:
Бояре! Можно как то настраивать красненькую кисточку (та что в левом верхнем углу идёт второй после всеудаляющей кисти) на более крупный мусор?

Автор: daa2013, Отправлено:18:54 30-09-2021

Да, блин. Уже говорил, где почитать.

В окне RV кликать ПКМ > Options > Speckle size не помню какой именно, настраиваю оба.

Автор: kamenkapenza, Отправлено:20:02 30-09-2021

Вроде, нашел. Панель Клир Опционс. Там чего только нет в этой панели.... Тема для отдельного разъяснения.
Прочитал этот раздел Хрестоматии (Клир Опционс), думал - сейчас научусь, порадуюсь,... Ещё хуже стало, не порадовался, не научился ))). Ничего не понял. Понял, что можно не только удалять мусор, но и восстанавливать буквы. Кстати, недавно задавал вопрос о восстановлении обгрызенных букв, никто не написал, что это можно делать через красную кисть, а указали на глифирование (про которое кто-то слышал, но никто не знает). Про настройку красной кисти и восстановление букв, похоже, что тоже знает только один человек ))))
Нет визуального представления материала. Плохо, очень плохо!!!

Автор: shch_vg, Отправлено:20:48 30-09-2021

daa2013

Цитата:
Советую удалить вновь вставленное.

На вкус и цвет товарищей нет!
Мне гораздо больше нравилось так, как было. Вы же даже не сообщили, что что-то объединили. Хотите, чтобы было по-вашему, флаг в руки, исправляйте еще раз!
Мне вообще непонятно, зачем Вы стали корежить шапку, я бы Вам посоветовал восстановить ее предыдущее состояние.
Все это временно. С такой активностью недавно появившийся пензяк очень быстро наберет нужное количество мусоропостов и тогда научит Вас, какие шапки нужно писать.

Автор: TelecomUral, Отправлено:00:20 01-10-2021

оффтоп

Цитата:
shch_vg
и тогда научит Вас

к счастью, есть модераторы.

daa2013, я так и не вкурил, зачем вы всё это затеяли. Написал ведь в ЛС, почему началось и чем кончится. Была не идеальная, но очень приличная шапка, она как-то правилась по чуть-чуть. Зачем вестись на низкопробные сиюминутные выпады. Эталон же в голове. Значит, придёте в канаву по уровню подачи материала. "Ниже плинтуса". Какие книги из обработки у каменки выходят, такое и качество обучающих материалов будет. Вы это зачем делаете - ? upd он же не будет писать видео, по качеству равные роликам от bolega

Автор: daa2013, Отправлено:02:58 01-10-2021


Цитата:
Вы же даже не сообщили, что что-то объединили.

Я понимаю, когда капенца не воспринимает прочитанное. Это просто такой (другой, отличный от нашего) образ мышления. Но от вас-то я уж такого не ожидал, что вы редактируете, не посмотрев.

Сообщаю поэтому, если вы не заметили, что я также ссылку на ветку СТ в шапке заменил ссылкой на ветку э-книг.


Цитата:
зачем Вы стали корежить шапку


Цитата:
зачем вы всё это затеяли


Шапка она не для тех, кто СК знает, а как раз наоборот, только осваивает.
Часть идей капенцы мне кажутся разумными. Посмотрим, что будет.


Цитата:
Написал ведь в ЛС, почему началось и чем кончится.

А я вам также в ЛС ответил, в каком направлении ИМХО должна измениться шапка.

Автор: kamenkapenza, Отправлено:13:32 01-10-2021


Цитата:
Какие книги из обработки у каменки выходят

Книги у меня нормальные, не надо принижать качество, у меня на твердую "четверку". Были бы плохие книги, автор сканов послал бы меня побоку, а сейчас мы в тесном сотрудничестве. А вам бы, уважаемый AAW, не мешало бы прилежнее делать сканирование. Мне ваши сканы приходится прогонять через Ирфанвью, чтобы править дпи. Непонятно, почему у вас дпи страниц разные, особенно обложек.
Пензяк с Череповца научит вас хорошему (можете не переживать!)
Основная суть темы - научить новичков работе в Кромсаторе. Я просто общаюсь с людьми, которые делают книги и выкладывают их на некие сайты. Часто вижу, что книги никудышные. А это от того, что люди неспециалисты шарахаются Кромсатора, бояться его не то, чтобы из-за его сложности, а потому что нет нормальных разъяснений по программе, чтобы сделать её доступной среднему классу. Я опираюсь на своё восприятие программы, смотрю некоторые ролики и понимаю, что народ то не поймет. Не поймет из-за неумения логически выстроить рассказ. Ролиеи, тут представленные в основном рассчитаны на уверенных пользователей. А в роликах, якобы рассказывающих об азах, первоначалах программы, не сказано ничего, что . Тык-мык,... и всё.
Понравился видеообзор автора программы: нет ничего лишнего в объяснениях, следующее вытекает из предыдущего, и не упущено ничего. Это и есть то, что надо новичку. Поэтому я и попросил поднять блог автора, так сказать, наверх. Лучше его никто не объяснит. Я это понял ещё по тому, что когда попросил тут кого-нибудь рассказать про удаление фона в картинках, ничего путного никто не сказал, а автор дал подробный исчерпывающий ответ, после которого даже мне всё стало ясно ))) и будет ясно всем. Говорунов на ютубе много, на всякие темы калякают, но это не значит, что от каждого какой то прок.
Поэтому автора программы наверх, всех остальных вниз ( в виде дополнения) Тему автора выделить пожирнее (что это видео от автора), новичкам будет проще ориентироваться. Честно сказать там было напёхано фиг знает чо)))

Автор: shch_vg, Отправлено:13:36 01-10-2021

daa2013

Цитата:
Но от вас-то я уж такого не ожидал, что вы редактируете, не посмотрев.

Интересно, почему я должен изучать всю шапку перед тем как поправить самый конец. Вы же не удосужились изменить мой заголовок, поэтому мне и не пришло в голову проверять, что Вы там наизменяли. Я просто взял из-под коврика отсутствующее и добавил его.
Вы тут выше упоминали про чих, а мне на ум пришла мудрая поговорка "на каждый чих не наздравствуешься". Пензяк из Каменки без году неделя здесь, а уже начинает наводить свои порядки, а Вы под него подстраиваетесь, не учитывая, что в этой теме еще очень много участников, и их мнение может не совпадать с Вашим.
В фильме "Операция Ы ..." предлагали сначала потренироваться на кошечках.
Так и займитесь с пензяком в привате, достаньте из него то, что Вам "кажется разумным", тогда можно будет что-то обсуждать.

Автор: kamenkapenza, Отправлено:13:46 01-10-2021


Автор: shch_vg, Отправлено:13:59 01-10-2021

kamenkapenza

Цитата:
Основная суть темы - научить новичков работе в Кромсаторе.

Вот наглядный пример что бывает, когда слон врывается в посудную лавку.
Нет, пензяк с Череповца, вы попали не по адресу. Эта тема образовалось для того, чтобы помочь автору программы находить ошибки в его текущей версии, предлагать разумные (и неразумные) добавления в программу. Но для этого надо было начать изучение темы не с последнего в нем поста, а с первого.
Станьте первопроходцем и "посейте разумное, доброе, вечное". Создайте дружественную с этой темой свою тему под примерным заголовком "Сканкромсатор для начинающих" или "Продвигаем Сканкромсатор в массы". Вот там ваш неиссякаемый темперамент найдет применение, и вы действительно заслужите признание темных неокрамсаторненных масс за их просвещение.
Сюда же в этом случае можно обращаться к автору программы (а лучше в Личный Ящик) за разъяснением того или иного неясного вопроса.

Добавлено:

Цитата:
Вам устное предупреждение!

Правильным путем идете, товарищ!
Скоро достигнете пустыми постами заветного рубежа, дающего доступ до шапки.

P.S. Я понимаю, что ваш ник это чистое совпадение с населенным пунктом Каменка в Пензенской области.

Автор: kamenkapenza, Отправлено:14:09 01-10-2021


Цитата:
он же не будет писать видео, по качеству равные роликам от bolega

и НИКТО их не будет писать по качеству от автора программы, поэтому от меня и поступило разумное предложение обособить, поднять наверх ролики от bolega. Или вы не согласны? Сами признались, что это первооснова, высшее качество. Ну и к чему чему сыр-бор? Я понимаю, что вы все тут амбициозные, хотите быть равные создателю (я имею в виду программы))) ), но вы не он. Печально конечно, задета гордыня, не хочется сдаваться, но надо признать, что я не неправ. Когда идет обсуждение чего-либо, то на бис вызывают автора. А у вас тут чего? Понапёханы все крупными буквами (видео от такого то, видео от другого то) (как же без этого? ))) А видео от автора какими то малюнесенькими буквами, захочешь найти - не найдешь! Вот и я хотел, чтобы всё было по-честному, а вы расстроились.



Добавлено:

Цитата:
Я понимаю, что ваш ник это чистое совпадение с населенным пунктом Каменка в Пензенской области.

Это всё домысла, хотя, возможно, что правильные. Если бы я тоже расшифровкой занялся, то по ассоциации приравнял бы вас к ВВГ-Пнг СВЧ - что-то связанное с электрощитовой ))) Получается, что я вас так должен называть.

Автор: shch_vg, Отправлено:15:24 01-10-2021

Пензяк с Череповца
Вы бы лучше написали об идее создать Вам дружественную тему продвижения Сканкромсатора в массы, о чем вы так пламенно выступали, а вы все о никах, да о никах.

P.S. Если вас все еще будоражит мой ник, напишите мне в Личный Ящик (заодно и познакомитесь с ним) и я объясню.

Автор: kamenkapenza, Отправлено:16:23 01-10-2021


Автор: shch_vg, Отправлено:17:11 01-10-2021

Пензяк с Череповца
А про дружескую тему почему-то ни слова.
Там ведь надо дело делать, а не болтать.

Автор: kamenkapenza, Отправлено:19:08 01-10-2021


Цитата:
Там ведь надо дело делать, а не болтать.

Это точно, заболтался я тут, надо дело делать. Про дружескую тему не совсем понятно.

Автор: shch_vg, Отправлено:21:07 01-10-2021

Пензяк с Череповца

Цитата:
Про дружескую тему не совсем понятно.

Надо читать внимательней, тогда и будет понятно, правда тогда времени на побалоболить будет меньше.

Автор: kamenkapenza, Отправлено:18:30 02-10-2021

Если вы гутарите про продвижение Кромсатора в массы, то надо мне самому продвинуться (Про Тейлор я знаю практически всё, про Кромсатор практически ничего). А как продвинуться, если местные снобы только и посылают к Талмуду (Хрестоматии по Кромсатору)? Будет толк, если рассказывать про сложные вещи понятным простым языком. Поэтому и ещё по другим причинам я просил в шапке выделить покрупнее и поместить на самый верх ролики от bolega.

Автор: shch_vg, Отправлено:22:00 02-10-2021

ОФФТОП

Цитата:
надо мне самому продвинуться

Именно в этом ваше преимущество.
Человеку, давно работающему в СК, довольно скучно рассказывать от элементарных для него вещах, при этом он автоматически пропускает множество нюансов, которые ему кажется очевидными. А вы, судя по всему недавно стали использовать СК и получать результат, который вас устраивает. Так поделитесь этим небольшим опытом с начинающими. По обратной связи будете получать вопросы, находя ответы на которые и сами быстрее будете продвигаться. Новичок, попадая в нашу тему, быстро понимает, что здесь обсуждение идет на более продвинутом уровне, и вскоре теряет интерес к программе.
Я начал использовать СК в марте 2006 года, а в конце этого же года написал пример изспользования СК для обработки шахматной литературы, который сейчас можно посмотреть в Хрестоматии.
Естественно в нем было мало информации, просто пошагово на конкретном примере показывалось, как можно получить читаемый вариант, начиная с нуля.
До сих пор удивляюсь, как у меня хватило терпения написать этот пример, не считаю его верхом совершенства, но по крайней мере несколько человек высказали мне личную благодарность за него.
Убежден, что эффективно заниматься обучением любому предмету ( в данном случае обучению СК) может либо профессиональный преподаватель, либо человек, у которого не намного больше знаний, чем у обучаемого. В этом случае он не будет сразу выдавать массу не совсем нужной на начальной стадии обучения информации. Я здесь не изобретаю велосипед, это метод обучения в обычной школе.
На уровне создания отдельной темы это будет гораздо эффективнее именно из-за обратной связи.
В этой же теме это дело бесперспективное, т.к. она была создана и работает для других целей.
Помещение в шапку списков отдельных роликов не дадут желаемого результата.
Попробуйте сами создать ролик на обработку конкретной небольшой книги (не вдаваясь в нюансы обработки), тогда и поймете насколько это непростое и трудоемкое дело. Зато при наличии его можно постепенно добавлять ролики с описанием конкретных дополнительных действий как бы добавляя знания вокруг основного исходного ролика.
Знаю уже ваш ответ, что вам некогда, очень много книг требуют обработки и т.п.
Но точно также у большинства появляющихся в этой теме есть масса своей необходимой работы, поэтому трудно рассчитывать, что кто-то бросит свои дела и начнет писать ролики или какие-то письменные инструкции.
Вот если будет виден системный подход в вопросе обучения новичков, только тогда можно ожидать более активного отклика на подобные просьбы.

Автор: kamenkapenza, Отправлено:23:16 02-10-2021


Цитата:
Человеку, давно работающему в СК, довольно скучно рассказывать от элементарных для него вещах, при этом он автоматически пропускает множество нюансов, которые ему кажется очевидными

Вы неправы! У этих товарищей, чьи ролики удалили из шапки - да. Но есть автор программы, он умеет объяснять. Наверное, он недавно работает в программе )))

Цитата:
Попробуйте сами создать ролик на обработку конкретной небольшой книги (не вдаваясь в нюансы обработки)

Ролики уже давно созданы. Подробное объяснение Скан Тейлора 4 года назад было выложено.

Автор: shch_vg, Отправлено:23:58 02-10-2021

Что вы зря воздух трясете.
Вам было предложено создать тему для новичков, естественно вам это делать не хочется, так скажите прямо, что не будете, и дело с концом.
А то какая-то чушь про Скантейлор (причем он здесь в этой теме), что-то про какую-то карасевскую библиотеку (не объясняя, что это такое), про какого-то бразильца.
С вами мне все ясно, заканчиваем, ждите вожделенные ролики.

Автор: kamenkapenza, Отправлено:01:26 03-10-2021

Ждём-с! Про тему я уже говорил.

Автор: nuget2, Отправлено:04:11 03-10-2021

daa2013, вы можете добавить видеоматериалы в таблицу?

Автор Плейлист
bolega Часть 1. Удаление (чистка) фона страницы в иллюстрациях
Часть 2. Другой способ чистки фона, малоцветные зоны и создание djvu
wasp238 Основные принципы работы в программе ScanKromsator
TelecomUral 07. Бинаризация плохого текста. Групповые операции. Выпрямление строк (в Book Restorer)
08. Азы подготовки качественных djvu-файлов
16. Чистка мусора и замена плохих буковок



Автор: daa2013, Отправлено:06:02 03-10-2021

Могу, конечно. Но тут я не до конца понял.

А что делать с другими роликами ? У TelecomUral их там штук 14. Шапка столько не выдержит.
Вы эти три его ролика считаете самыми полезными, а остальные хотите спрятать ? Прятать внутри таблицы ?

Каменкапенца выше ратует, что дать только ролики от болега. (Все остальные, видимо, спрятать.)

Я- то хотел дать только три уже приведенных (ролик от васпа попробую перезалить на я-диск, а то ютуб тоже его подрезал), а на остальные дать вот такого типа ссылку, только порядок, возможно, изменить:
https://www.youtube.com/playlist?list=PL6ZCZFyULOwcKWpswDUsbz0ldg4LgJ17K

Попробую воткнуть таблицу, посмотрим, что другие скажут.

Автор: nuget2, Отправлено:06:32 03-10-2021

daa2013

Цитата:
А что делать с другими роликами ?  У TelecomUral их там штук 14. Шапка столько не выдержит.

Как вариант, можно создать скрытую страницу (на ваше усмотрение).

Идеальный вариант, на мой взгляд, -- это ссылка на плейлист YouTube. Но для этого нужно чтобы заголовки были оформлены надлежащим образом. Кроме того, управление плейлистом остается за автором видео. Пусть автор сам решит, какие видео можно добавить в плейлист, а какие нет...


Автор: TelecomUral, Отправлено:06:35 03-10-2021


Цитата:
А что делать с другими роликами ? У TelecomUral их там штук 14. Шапка столько не выдержит.

единственное, что нужно делать с роликами, это написать подробный таймлайн к каждому. тогда и одной ссылки будет достаточно - на сводный текст (pdf) этих таймлайнов.
nuget2, имеете шанс сделать хорошее дело.

Автор: antabu, Отправлено:06:53 03-10-2021

V 6.71
Никак не удаётся настроить, чтобы обрезаемые части станицы отображались цветным.
А так же, масштаб изображений по умолчанию по размеру окна.

Автор: bolega, Отправлено:07:48 03-10-2021

Про мои ролики: чистка фона на мой взгляд узкое толкование.
Там и про раскрашенные зоны, и про переобработку зон, и про настройку панелей с командами для работы с габаритом, и ребинаризацию, и про удаление спеклов.
Про раскрашенные зоны я аж два примера привел, но для кого-то это видимо все без толку




Автор: TelecomUral, Отправлено:08:17 03-10-2021

antabu
можете сгенерировать видеопример?
UPD
В смысле: поясните - хочу использовать фишку, описанную там-то, пробую, а видите, не получается.
Иначе неясно, как вообще может что-то "не получиться".

Автор: kamenkapenza, Отправлено:08:43 03-10-2021


Цитата:
Вам было предложено создать тему для новичков

А что даст создание темы для новичков??? Прилетят специалисты с другой галактики, добрые и отзывчивые, и подробно объяснят и покажут "бесплатно кино"? Те же самые бездельники и лентяи будут пальцы гнуть, морали читать про балбесов, про то-сё. Такое уже было на форуме библиотеки Ершова: создал тему "Почемучкины вопросы", никто ничего и не отвечал в виду своей особой значимости.

Цитата:
А что делать с другими роликами ?  У TelecomUral их там штук 14

Я уже говорил по этому поводу, что надо просто давать ссылку на канал. В данном случае это ссылка на канал Алексея Алексеева (AAW), у него там нет роликов, как он еду готовит и бельё стирает ))), а все только про Кромсатор. Для других товарищей, если у них кроме Кромсатора есть велопоходы, рыбалка, перетягивание каната, то пусть создают плейлист по программе, и указывать ссылку на плейлист. В противном случае Боливар столько не выдержит. А то раньше у вас была не шапка, а мусорное ведро: понапёхано всё кое-как, чёрт ногу сломает.




Создадим наверху раздел ответов автора (его видео) и потом можно будет просить выпустить ещё фильмов по разъяснению Кромсатора. Архиважное разъяснение,как я уже говорил, это коррекция текста, когда буквы слишком жирные, слишком бледные, огрызенные, обглоданные, бахромистые и т.п., удаление мусора, библиотека глифов и полный обзор меню "Clear options" на панели результатов.



Цитата:
А так же, масштаб изображений по умолчанию по размеру окна.

Если вы ведёте разговор про фиксированный масштаб (установить определенный размер для всех просматриваемых страниц на главной панели), то это делается так: в левом верхнем углу в окне списка страниц правой клавишей выбираете Special-Zoom-Fix current zoom, и все страницы у вас пойдут в том масштабе, который вы установите для одной.

Добавлено:

Цитата:
Текущая версия программы: ScanKromsator v6.71 Подключаемые утилиты и их настройка 


Это из шапки темы.
В текущую версию программы (( в папку с программой) изначально следовало бы поместить файлы fft3dfilter.dll, fftw3.dll, ocr.dll, чтобы начинающий пользователь не рыскал по интернету, пытаясь их откуда-то скачать.
"Текущая версия программы. Настройка" вообще непонятно, откуда что брать.
Цитирую некоторые пункты настройки:
"1. Файл bps.cfg, fftw3.dll, ocr.dll поместите в папку, где находится исполняемый файл sk.exe."
Откуда берутся эти файлы? Следует поместить ссылку на эти файлы на Яндекс-диск, чтобы пользователь мог их скачать. Или более здравомыслящий вариант: поместить их заранее в папку программы, чтобы пользователь скачивал усовершенствованный вариант.

Далее идём:
"Папку tessdata со всем содержимым поместите в любое место на диске. В настройках СК
File>Options>Apps>Tesseract укажите полный путь к файлу eng.traineddata, напр.,
"C:\SK\tessdata\eng.traineddata""

Где её брать, также не написано.
- "- Tesseract: используется при работе специального метода despeckle. Доступен на https://code.google.com/p/tesseract-ocr."
Наверное, это очень нужная программа для удаления мусора (деспеклы), но как её скачать с https://code.google.com/p/tesseract-ocr., знают только басурмане. Там какой то винегрет, что беда. Если кому удосужиться её скачать (как я понимаю, там не одна версия, просьба положить ей на Яндекс-диск и дать ссылку простому русскому народу.




Добавлено:

Цитата:
ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе СК.


Раз это такой архиважный, жизненный вопрос, тогда сделайте видеоролик по этому поводу, подробно покажите, как делать субтаск, для чего он нужен, какую пользу он приносит людям, и тогда ни у кого не будет поводов игнорировать этот пункт.

Автор: daa2013, Отправлено:11:30 03-10-2021

Вы не видите, что в слове "утилиты" спрятана ссылка на архивчик с этими файлами ?

Автор: kamenkapenza, Отправлено:11:56 03-10-2021


Цитата:
Вы не видите, что в слове "утилиты" спрятана ссылка на архивчик с этими файлами ?  

Пардон! Извините, был не прав! Увидел. А где fft3dfilter.dll? Я так понимаю, что это нужно для работы закладки filters2.
Про субтаск ещё можете решить вопрос в видеообзоре?

Автор: antabu, Отправлено:12:07 03-10-2021


Цитата:
В смысле: поясните - хочу использовать фишку, описанную там-то, пробую, а видите, не получается.   Иначе неясно, как вообще может что-то "не получиться".

Можно считать меня новичком, т.к. программой пользуюсь редко, в тех случаях, когда без неё трудно обойтись, и только простыми функциями. Обычная логика работы подсказывает, что без раскраски - неудобно, особенно в случае с разрезкой разворотов. Неужели разработчику это не очевидно?
Если приложение развивается, хотелось бы видеть раскраску в новой версии. А так же дефолтные настройки, удобные для работы с реальными сканами.

kamenkapenza, благодарю за подсказку.

Автор: kamenkapenza, Отправлено:13:46 03-10-2021


Цитата:
kamenkapenza, благодарю за подсказку.

antabu, всегда рад помочь!



Добавлено:

Цитата:
Можно считать меня новичком, т.к. программой пользуюсь редко, в тех случаях, когда без неё трудно обойтись, и только простыми функциями


Вот ещё один свидетель правоты моих слов, что разжевать надо программу, чтобы она была более доступной простому народу. Программа кажется слишком сложной, но она отпугивает народ не своей сложностью, а то что нет нормального толкования (Энциклопедия по Кромсатору написана для специалистов, надо это отметить, все вопросы там представлены в общих чертах, не раскрывая самих механизмов). Обзор программы для новичков следует вести с самых азов, постепенно, не стараясь в одном ролике объять необъятное и рассказать якобы основные этапы работы в одном ролике. Как бы я начал академический видеокурс по программе, если бы владел необходимыми знаниями? Первый ролик часа на 1,5-2 (студенческая пара) я бы посвятил теме общего обзора программы: что она может (такое есть и в Хрестоматии), затем показывать подробно, откуда взять, скачать и как прикрепить необходимые приложения для создания джву, пдф и усовершенствования программы. На этом первый ролик заканчивается.
Второй ролик "Подробное объяснение меню "File", при этом берется многостраничная книга, чтобы продемонстрировать конкретно, а не на пальцах. Если такие то пункты меню не удастся объяснить на этапе первого ролика в виду неактивности некоторых элементов меню, которые активируются на последующих этапах, то в следующих роликах надо добавить в описании, что разбирается момент из ролика 1 (меню "File" )
Третий ролик по меню "Edit", подробное по всем пунктам полный показ работы и результатов изменения параметров, затем четвертый и последующие по меню Process, Result, Image, Zones, View, Tools. После подробного рассказа про всё это начать разъяснят вкладки Page (отдельным роликом) , Book (отдельным роликом) досконально, каждый пункт меню). А не так как некоторые товарищи: Основы программы за полчаса, галопам по Европам, чих-пых, они сами поняли, другим ничего не рассказали, хотя видно, что они сами не понимают функционала программа, только вершки, чтобы кое-как сварганить книгу.
Если новичку непонятен какой то пункт меню, то он посмотрит соответствующий ролик с таким названием, а не лезть искать "Основы работы с программой", а там ничего нет, даже упоминания, только легкий дым над гладкой равниной.
Вот так! В таком духе, в таком разрезе.

Автор: TelecomUral, Отправлено:15:03 03-10-2021

оффтоп
daa2013
Дайте человеку необходимое — и он захочет удобств. Обеспечьте его удобствами — он будет стремится к роскоши. Осыпьте его роскошью — он начнет вздыхать по изысканному. Позвольте ему получать изысканное — он возжаждет безумств. Одарите его всем, что он пожелает — он будет жаловаться, что его обманули, и что он получил не то, что хотел.
Эрнест Хемингуэй

Автор: qwaxym, Отправлено:15:31 03-10-2021


Цитата:
нет нормального толкования (Энциклопедия по Кромсатору написана для специалистов, надо это отметить, все вопросы там представлены в общих чертах, не раскрывая самих механизмов).

Всё там нормально описано, нужно лишь уметь читать и понимать написанное! )) И искать там не так уж сложно, всё примерно разбито по темам.
А если чего-то нет в описании, всегда можно задать вопрос автору программы.

Автор: daa2013, Отправлено:16:37 03-10-2021

bolega

Цитата:
Про мои ролики: чистка фона на мой взгляд узкое толкование.
Там и про раскрашенные зоны, и про переобработку зон, и про настройку панелей с командами для работы с габаритом, и ребинаризацию, и про удаление спеклов.
Про раскрашенные зоны я аж два примера привел, но для кого-то это видимо все без толку


Название же не может охватить всё. Только основную мысль.
Добавил второму ролику в название слова "раскрашенные" и "габариты", хотя мне кажется, что может возникнуть путаница между painted zone и colorized zone . Но если не уточнять, кто где, то и норм.

Раз такое дело, то добавил ссылки на ютуб, так как там таймлайны расставили. Очень мне не хотелось это делать, так как размеры оригинального видео 1356*720 , а ютубного 1280*680. и как мне кажется, я при просмотре разницу вижу. (надписи на панельках в окне "свойства зоны").

Добавлено:



Цитата:
А где fft3dfilter.dll?

Первый раз слышу про такую dll в контексте кромсатора. Вроде, нужная fftw3.dll в архиве есть. Откуда такой запрос ?

Автор: TelecomUral, Отправлено:17:01 03-10-2021


Цитата:
daa2013
так как размеры оригинального видео 1356*720

по-моему, с ютьюба всегда можно скачать оригинал.
А так - да, в браузере обычно заметна небольшая мутность для больших видео, которые уменьшили.

Автор: bolega, Отправлено:18:15 03-10-2021

daa2013

Цитата:
Название же не может охватить всё. Только основную мысль.

Да называйте как хотите, мне без разницы.

Автор: kamenkapenza, Отправлено:19:00 03-10-2021


Цитата:
Дайте человеку необходимое — и он захочет удобств. Обеспечьте его удобствами — он будет стремится к роскоши. Осыпьте его роскошью — он начнет вздыхать по изысканному. Позвольте ему получать изысканное — он возжаждет безумств. Одарите его всем, что он пожелает — он будет жаловаться, что его обманули, и что он получил не то, что хотел.
Эрнест Хемингуэй

Похоже, что Эрнест Иванович про бездельников писал (здесь такие водятся)

Добавлено:

Цитата:
А где fft3dfilter.dll?

Первый раз слышу про такую dll в контексте кромсатора. Вроде, нужная fftw3.dll в архиве есть.  Откуда такой запрос ?

Когда скачивал все прибамбульки для Кромсатора, подцепил где-то и такой. Засунул в папку с программой, чтобы получше дело шло, для улучшения качества работы фильтра.

Автор: daa2013, Отправлено:19:21 03-10-2021


Цитата:
Да называйте как хотите, мне без разницы.


К сожалению, мне тут прочитывается некоторое недовольство. Поэтому предприму новую попытку. Ну, действительно, видео получает название, которого у него не было. И это не есть хорошо. Однако, названия роликов-то "ч1" и "ч2".
Надо их не переименовывать, а просто прокомментировать их содержание !

Используя при этом оригинальные авторские фразы про видео и внутри видео:

1. " Первая часть видео по обработке зон. Присутствует шум к сожалению.
В следующей части немного про малоцветные зоны и создание djvu"

2. "Как правильно обрабатывать зоны с фоном " - начало 1 ролика.

3. "Там и про раскрашенные зоны, и про переобработку зон, и про настройку панелей с командами для работы с габаритом, и ребинаризацию, и про удаление спеклов. "

Автор: kamenkapenza, Отправлено:21:23 03-10-2021


Цитата:
1. " Первая часть видео по обработке зон. Присутствует шум к сожалению.  
В следующей части немного про малоцветные зоны и создание djvu"
 
2. "Как правильно обрабатывать зоны с фоном "  - начало 1 ролика.
 
3. "Там и про раскрашенные зоны, и про переобработку зон, и про настройку панелей с командами для работы с габаритом, и ребинаризацию, и про удаление спеклов.  "


Основная тема этих двух роликов: удаление фона с картинки. ( Это я приставал как банный лист на эту тему) Так и надо именовать! По крайней мере ч.1 этому полностью посвящена. Во второй части тоже удаление фона, сложноцветный рисунок, малоцвет и обработка обложки. Спеклы? Это так же не основная тема, как ребиниризация и т.п. Если что-то проскакивает в данном ролике, то не обязательно в название вносить комментарий происходящего, иначе название просто не уместиться в 255 знаков. Когда будет видео по удалению мусора, тогда в названии можно упоминать спеклы и т.п. В названии пишется основная суть, а это удаление фона.

Название должно быть кратким и лаконичным!
??? "Как правильно обрабатывать зоны...."???? В названии следует избегать глаголов. Зачем они там нужны? "Присутствует шум, к сожалению" это что? Основная тема ролика? Такие вещи в названии никогда не пишут. А должно выглядеть вот так:
ч.1 -Удаление фона страницы в иллюстрациях.
ч.2 - продолжение ч.1+обработка сложноцветных и малоцветных рисунков и цветных обложек.
Всё!!! Остальное в описании,а не в названии.

Автор: shch_vg, Отправлено:01:45 04-10-2021

Вопрос ко всем создающим ролики и ратующим о них
Кто-нибудь из вышеперечисленных пробовал посмотреть их на 20-ти дюймовом мониторе?

Автор: bolega, Отправлено:08:17 04-10-2021

daa2013

Цитата:
К сожалению, мне тут прочитывается некоторое недовольство.

Да нет. Я же их не для себя делал. Называйте так, как понятнее и удобнее тем, кто ими будет пользоваться. Просто не хотелось бы, чтобы завтра было "мы так и не услышали начальника транспортного цеха", напр., "когда же наконец запишут ролик как раскрашивать зоны?" и т.п.


Автор: kamenkapenza, Отправлено:15:33 04-10-2021


Цитата:
Кто-нибудь из вышеперечисленных пробовал посмотреть их на 20-ти дюймовом мониторе?

Странный какой то вопрос! Как это "пробовал"? Я на 23 дюймах всегда смотрю. Будете смеяться (или удивляться), но смартфоном я пользуюсь только в велопоходах в качестве навигатора и носителя интернета, а вся работа в интернете (или вне интернета) на компьютерах с 23-дюймовым экраном.
А что вам смущает? Качество видео замечательное!
А на вашем смартфончике хреноватенькое качество? Срочно переходите за компьютер!)) Там всё гоже!


Цитата:
Я же их не для себя делал

Можете их назвать " Видео для каменкипензы и других ребят -трулялят"
Некоторые с ума сходят, не знают, как видеоролик назвать, лишь бы не называть тем именем (отражающем суть), которое я предложил.
Если к вам придёт успокоение, то вы можете назвать любое видео "Задница" (не имею в виду это видео, исходя из его исключительной полезности и благодарности автору). Представляете, сколько народу его посмотрит?! Каждому захочется посмотреть, что там за задница такая)))




Цитата:
"когда же мы услышим начальника транспортного цеха, и он запишет нам ролик, как раскрашивать зоны?" и т.п.

Это не архиважный вопрос, а про коррекцию текста (букв) - не мешало бы! Про это тут никто не знает.

Автор: shch_vg, Отправлено:17:08 04-10-2021

Пензяк с Череповца
Вы б засунули сами знаете куда подальше свой солдафонский юмор.
Я вижу вы не способны отличить 23 дюйма от 20.
Что вы лезете в каждую бочку затычкой, если не используете 20-ти дюймовый монитор?
На 20-ти дюймовом я могу слышать только слова, вижу двигающийся курсор, но не вижу четкой картинки.

P.S. Я не такой крутой, как вы, чтобы иметь 20-ти дюймовый смартфон.

Автор: kamenkapenza, Отправлено:17:43 04-10-2021


Цитата:
На 20-ти дюймовом я могу слышать только слова, вижу двигающийся курсор, но не вижу четкой картинки.



ВВГпнг СВЧ,
А причем тут претензии к видео, если у вас проблема с аппаратом? (Не можу смотреть на смартфоне...))) )
По аналогии с вашим случаем некоторые товарищи выдвигают претензии к книгам формата djvu и pdf в том плане, что не надо их делать, а подавай им книги формата епуб, фб2, ртф, док, чтобы в смартфон побольше запихнуть и удобнее смотреть на улицах походя, в метро, в трамваях и тролейбусах, одним глазом при езде на автомобиле..... Это разве причина привередничать, что видео какое то не такое?
Если на вашем смартфоне ничего не шеволиться и не балакает, то следует обратиться в другую ветку форума (про телефоны и смартфоны), может, там кто что присоветует по аппаратной части, чтобы на смартфоне всё закалякало и можно было всё позырить без проблем )))


Автор: Vixerunt, Отправлено:18:10 04-10-2021

Что-то в последнее время ветка стала превращаться в дискуссию "пикейных жилетов"! Сначала воевали с "шахидом", прости Господи. Потом появился человечек, гордо несущий по жизни свой ник в велопоходах, и которого не устраивает... а что его не устраивает, я уже и забыл...! Вслед за ним - бедняга без 20-дюймового смартфона! Что же происходит-то? Модераторы! А можно как-то пальцем погрозить? Ну никакой полезной информации! Какой-то бред! Простите за излишнюю эмоциональность!

Автор: shch_vg, Отправлено:18:25 04-10-2021

Пензяк с Череповца

Цитата:
Если на вашем смартфоне

Приходится согласиться с тов. Папановым, сказавшим в "Бриллиантовой руке": Если человек идиот, то это надолго.
Прежде чем что-то писать, прочтите то, на что вы хотите ответить.

Vixerunt
Уже целых 122 сообщения за почти 16 лет, а так и не научились нажимать в сообщении на "Сообщить модератору". А полезной информации вам чуть выше выдали столько, что может не хватить жизни.
Не отвлекайтесь по пустякам, изучайте Сканкромсатор.

Автор: Vixerunt, Отправлено:19:02 04-10-2021

[more]
Цитата:
Уже целых 122 сообщения за почти 16 лет, а так и не научились нажимать в сообщении на "Сообщить модератору". А полезной информации вам чуть выше выдали столько, что может не хватить жизни.
Не отвлекайтесь по пустякам, изучайте Сканкромсатор.

То, о чём я и хотел сказать! От таких как Вы полезной информации не получишь! Я, если Вы заметили, уже давным-давно избавился от дурацкой привычки задавать здесь вопросы - как правило натыкаешься на таких баранов, как Вы - и привык читать вопросы и редкие грамотные ответы в форуме! А Вам, вместо того, чтобы считать чужие сообщения, рекомендовал бы проанализировать собственные на предмет "полезности" информации, изложенной в них! 90% ответов - изучайте Хрестоматию! Вроде бы и свою безграмотность не показал и в собственных глазах стал эдаким "гуру"!![/more]

Автор: D1D1D1D, Отправлено:06:12 08-10-2021

Как настроить вставку определенного глифа по клику?

Нашёл в настройках, отмена)

Автор: Skay91, Отправлено:00:11 11-10-2021

bolega
А возможно ли как то, чтоб изменения о новых размерах, записанные в проект, после применения обрезки зон (crop), при reprocess zone не сбрасывались?
А то по мне так немного не логично получается (или не интуитивно). Если бы кроп делался через прозрачность как с полигонами - тогда было бы логично что при reprocess размер сбрасывается. Но в нашем же случае меняется и физические размеры, и информация в проект заносится.
Еще и файл проекта становится совершенно не переносимым без out.

Автор: bolega, Отправлено:12:16 12-10-2021

Skay91
Размеры в проекте всегда соответствуют текущим физическим. Если после переобработки физические размеры поменялись, а координаты оставить прежними, будет искажение.
Если обработали, потом редактировали зону, но не меняли положение ее верхнего левого угла, потом переобработали, то СК сам корректно восстановит ее последнее положение, если в глобальных настройках включена опция restore zone position.
Если же редактирование зоны повлекло изменение ее "точки отсчета" (например, был Crop слева или сверху), то опция restore zone position не спасет (она ничего не знает про ручное изменение точки отсчета после обработки), более того, ее лучше отключать. Чтобы в таких случаях восстановить прежнее положение, нужно после переобработки повторить Crop, и только после этого в КМ зоны выбрать команду restore position (эта команда станет доступна, когда отключена глобальная опция restore zone position). Идеального восстановления вряд ли удастся достичь, т.к. едва ли можно идеально повторить crop, выполненный ранее, до переобработки.

Автор: shch_vg, Отправлено:23:10 12-10-2021

bolega
Почему не запоминаются координаты текстового блока после финализации?
Если затем переобработать имеющуюся зону на странице, то она позиционируется местом ее первоначального положения, а не реальным после изменения границ текстового блока.

Автор: TelecomUral, Отправлено:07:58 13-10-2021

shch_vg

Цитата:
а не реальным после изменения границ текстового блока

я тут не понял, уточните этот момент: вы нарастили поля (финализация, вы сказали, была сделана), и "текстовый блок" как объект пропал. На внешнем виде страницы в VR его границы не рисуются. Как вы их в этом случае изменили?

Автор: bolega, Отправлено:09:51 13-10-2021

Наверно, имеется в виду не текстового блока, а зоны. Я же выше описал. Включите restore zone position в File > Options и положение зоны будет восстанавливаться само. Иначе вручную командой из КМ зоны (если выйти из СК, то информация о предыдущем положении потеряется, поэтому это надо делать сразу же).
Если же речь идет о переобработке всей страницы, то естественно, ничего не восстанавливается. Мало ли что изменилось в опциях за это время, может страницу вообще повернули на 90 градусов и переобработали, тогда чего там восстанавливать.

Автор: shch_vg, Отправлено:17:12 13-10-2021

bolega

Цитата:
Включите restore zone position в File > Options и положение зоны будет восстанавливаться само.

Или это не работает, или я что-то неправильно делаю.
Т.к. затруднительно сделать суб-таск, приходится нарушать написанную мной инструкцию и надеяться на экстросенсов.
Что есть:
1 маркированный скан с диаграммой, галочка в restore zone position (кстати, не понял, что означает "вручную командой из КМ зоны")
Что делаю:
Включаю обработку с аутомаржинс, но без зоны и резаков.
Что получаю:
До финализации синий пунктир вокруг текстового блока (ТБ) далек от желаемого, поэтому передвигаю его вплотную к ТБ и делаю финализацию.
Вид диаграммы меня не устраивает, поэтому в главном окне заключаю ее в пикчер-зону с нужными параметрами и обрабатываю только ее прямо из главного окна.
Независимо от того, есть галка в restore zone position или нет, в RV обработанная диаграмма смещается относительно своего местоположения вниз и вправо ровно настолько, насколько перед финализацией я смещал левый верхний угол синего пунктирного прямоугольника.
В дальнейшем как бы я не перемещал положение зоны в RV, повторная обработка ее будет возвращать в то же место.

Автор: kamenkapenza, Отправлено:18:34 13-10-2021


Цитата:
Т.к. затруднительно сделать суб-таск


Цитата:
ВАЖНО ! Выкладывайте субтаск своего задания, когда задаёте вопрос о работе SK.


Господа! Никто не сел за создание ролика по Субтаску? Имеется в виду: не то что получил наказание в виде лишения свободы, а наоборот. чтобы получить ореол славы и благодарность от тех, кто хочет задать вопрос по Кромсатору, но не владеет сверхсекретной миссией создания. Про это знают только особо посвященные. Откройте тайну Золотого ключика!


Цитата:
Как настроить вставку определенного глифа по клику?
 
Нашёл в настройках, отмена)

Товарищ! Нашел сам - поделись с другими про эти самые глифы.


Автор: kamenkapenza, Отправлено:11:40 14-10-2021

У меня гоп-стоп, оказывается: во-второй части поста попался на преступлении(где я намекнул про глифы рассказать того, кто про них знает). Выходит, что библиотека глифов - самая секретная часть Кромсатора. Про это тут не принято калякать.

Народ честной, можно ли создать зону картинки во втором окне программы (панель результатов, вроде бы, называется). Имеется в виду, когда картинок мало, не выискивать их, а сразу запустить обработку, а затем после обработки, когда откроется панель результатов, в ней выделить зону картинки и обработать эту страницу, не закрывая панели результатов и не возвращаясь на главную страницу Кромсатора?

Автор: shch_vg, Отправлено:12:09 14-10-2021


Автор: kamenkapenza, Отправлено:15:27 14-10-2021


Цитата:
Вторая часть поста это то, что УДАЛЕНО модератором.

Там как раз было предложение создать вторую тему по Кромсатору для простого народа (по вашему совету), где не было бы жлобов, посылающих в Хрестоматию.

Автор: gsn13n, Отправлено:15:55 14-10-2021


Автор: daa2013, Отправлено:16:59 14-10-2021

[more]
Цитата:
Там как раз было предложение


К сожалению, там были оскорбления, на которые я хотел утром ответить, а потом передумал. Но раз это успели и удалить, и по новой запустить...

Удаленный кусок:

Цитата:
Тема создалась для того, чтобы автору понять и освоить программу. Прикольно! Это общепризнанный факт или отдельное мнение товарища shch_vg ? В таком случае надо создать отдельную тему по обучению новичков, но тут проблема: где взять нормальных специалистов-учителей, а не тех жлобов, которые на каждый вопрос будут орать: "Да иди ты в Хрестоматию!"



Почему вас отправляют в Хрестоматию ? Когда вы просите о помощи, то это может быть одна из трех ситуаций:

1) вы не можете найти какую-то инфу, которая есть в опубликованных материалах
Вам как раз и помогают. Отвечают, где именно это написано. (Не просто Хрестоматия - а такой-то раздел Хрестоматии ! или такой-то раздел "ответов".) Информация из whats new к версиям программы, ответы болега, Хрестоматия, возможно какое-то старинное обсуждение на форуме. Надеюсь вы умеете искать по веткам форума, нажав "версия для печати" ? Только, увы, тут веток уже много.
Инфа же не только в Хрестоматии. Но так как ваши вопросы, как правило, базовые, то описания этих процессов в Хрестоматии уже есть. (разными авторами изложенные)


2) вы не понимаете длинный текст
С этим сложнее. Вопросы же разные. На некоторые можно ответить коротко, и на такие вам отвечают, типа "ищи такую-то кнопку на такой-то панели". Но некоторые требуют ответов - простынь, рассказывающих о 10-15 операциях. И тогда возникает проблема: а) зачем это писать, если это уже было написано ? б) какой смысл вам отвечать в постах, если вы все равно длинный текст не воспринимаете ?


3) это не просьбы о помощи, а некая стратегия троллинга и оскорблений, направленная на мотивацию записи и выкладывания роликов общественной пользы для.

Это очень странная стратегия, так как ролики из активных пользователей СК в последние 10 лет записывали ровно три человека. (болега, ТелекомЮрал и имверден.). Вообще странно пытаться заставить кого-то что-то делать. Если вы считаете какие-то действия правильными, то сами их и сделайте. Тут кто что может, тот это и делает. Люди искренне недоумевают, почему вы не можете прочитать и осмыслить написанное. Потому что у большинства это сделать вполне получается.


тексты кажутся непонятными - изложите ваш опыт коротко и ясно
хотите ролики - возьмите и запишите
не хватает индексов и оглавлений для поиска ответов - сделайте свои
пытаетесь освоить СК и затыкаетесь на каждом шагу - пишите очередность, в какой что вы осваивали и структурируйте ответы в порядке появления лично у вас вопросов.

Хрестоматия тем и хороша, что какие тексты есть - такие туда и попали. Появятся новые туториалы, будут в неё добавлены. Десять лет назад кроме форума ничего особо и не было. Все методом тыка СК осваивали, некоторые свой опыт излагали, и друг с другом делились.

Теперь же на форуме эдакая цаца завелась, которой индивидуальное обучение требуется.[/more]

Автор: Maz, Отправлено:18:01 14-10-2021

Для всех:
После этого поста - троллинг, продолжение срача, взаимные обвинения, обсуждения не по теме ПО - буду сразу в бан отправлять на 30 суток!

Автор: TelecomUral, Отправлено:19:54 14-10-2021


Цитата:
kamenkapenza
можно ли создать зону картинки во втором окне программы

Нет, так нельзя. Выигрыша всё равно не будет - в окне результата ведь постраничный просмотр. Хоть первичные сканы листать, хоть обработанные.
Я бы на такой задаче предварительно в примитивном вьювере (типа ирфана, или вообще Проводника винды) в режиме просмотра крупных превьюшек ("плитки") переименовал файлы с картинками, добавив длинный спецсуффикс после номера. Тогда файлы прекрасно видно в списке файлов в СК.
Что-то вот такое выйдет:




Автор: shch_vg, Отправлено:20:14 14-10-2021

TelecomUral

Цитата:
Выигрыша всё равно не будет - в окне результата ведь постраничный просмотр.

Как раз выигрыш будет!
Обработал все сканы скопом, финализировал и стал просматривать.
Вижу, что нужно какую-то область заключить в зону и обработать с другими параметрами.
В RV это было бы удобно, если бы после выхода из него зона на основном скане позиционировалась бы правильно. А так я должен выйти из RV, сделать зону и запустить ее на обработку. А если при этом идет обработка разворота, а зона создается для правого листа, то после обработки зоны выбросит в RV сначала на левый лист.

Автор: TelecomUral, Отправлено:20:22 14-10-2021


Цитата:
shch_vg
Как раз выигрыш будет!...
А так я должен выйти из RV...

А вы в него не заходите, не надо будет и выходить, а потом по разворотам прыгать. Выигрыш будет именно тут. Если вы в принципе отсматриваете каждый лист, не пропуская и не перепрыгивая, то выгоднее это делать сразу при расстановке опций. На это в Хрестоматии есть прекрасные рассуждения в первых разделах введения. Как эффективно сработать с пачкой сканов.

UPD
лично я никогда(!) не работаю так, как вы предложили, через "скопом, а потом в VR смотреть", и вот почему.
На бинаризованном выходном файле часто не видно утраченных первичных деталей. То есть, если вы не рассмотрели цветной оригинал, где глубина цвета или яркость серого дают много информации глазу, то вы запросто пропустите косяк на выходе, где информации много меньше. Чисто технически и при всём желании "честно-красиво" сделать книгу. Вы оригинал-то "никогда не видели".

Автор: shch_vg, Отправлено:20:40 14-10-2021

TelecomUral

Цитата:
А вы в него не заходите

Вы предлагаете на стадии ввода оценить, как каждый скан будет выглядеть после обработки с заданными параметрами?
Это утопия, как говорил Меньшиков в известном фильме.
Но даже если так, то иметь возможность создать пикчер-зону в RV это было бы удобно в определенных случаях. Обрабатывать все скопом и сразу хорошо это довольно редкое явление, и никакие рассуждения в Хрестоматии этому не помогут.

Добавлено:

Цитата:
если вы не рассмотрели цветной оригинал

А Вы можете предположить вариант, когда это и не надо рассматривать в связи с отсутствием наличия цвета.
Вы говорите о многоцветных книгах, но их значительно меньше, чем просто черно-белых, особенно в советские времена.

Автор: TelecomUral, Отправлено:21:31 14-10-2021


Цитата:
shch_vg
Вы говорите о многоцветных книгах

Нет. Я говорю в целом, т.е. об утрате любых деталей. Вы не заметите что они утрачены.
Конечно, бывают качественно отпечатанные и примитивно сверстанные чб книги. Плакаты какие-нибудь, списки телефонов горадминистрации, и тэ пэ. Там нет никаких таких "деталей". Тупой шрифт, тупая вёрстка, банальный смысл. Но тогда ведь и функции СК не нужны. Понизили адаптивным Вольфом цветовую размерность до "2 colors", и всё на этом. Даже и отсматривать не надо. А вы начали говорить о таких книгах, в которых "детали" таки есть, зоны-то зачем-то потребовались. Значит вы сам оригинал считаете непримитивным. И смотреть на негорезультат будете, и будете это делать внимательно. Так выгоднее смотреть тогда на оригинал, он богаче по нюансам.

UPD
Ну вот самый такой простой-простой пример: пятно непропечатки на шахматной диаграмме. Слабовидимая фигура, допустим брак бумаги, и краска не удержалась. При бинаризации фигура исчезла бесследно, остался мелкий мусор который деспекл смёл в небытие. Я не спец, я по виду рисунка (чб) не определю такую ошибку логически. А глядя на оригинал я увижу бледносерую фигуру и вытяну ее зоной.
У меня совсем недавно была на руках книга с подобной проблемой, сугубоматематическая и на белёной бумаге с весьма тонким шрифтом. Автопорог дал мне совершенную ерунду, пропадание массы мелких индексов, разрывы в буквах, тильдочки, штришочки попропадали. Выборочно, естественно. При этом с виду книжка выглядит прекрасно, автопорог среднюю жирность ведь вытянул. И если бы я не видел оригинал, выпустил бы этакий испорченный напрочь продукт в Сеть.


Автор: shch_vg, Отправлено:23:03 14-10-2021

TelecomUral
Мы говорим ни о чем, ведь изначально было сказано, что неплохо бы иметь возможность создавать зону прямо из RV. Такая возможность дала бы в любом случае дополнительные возможности обработки. А в предложенном Вами варианте нужно знать гораздо больше о возможностях СК, что делает его менее доступным для не самых искушенных пользователей.

Автор: daa2013, Отправлено:07:44 15-10-2021

Мне кажется, вы вообще о двух разных вещах говорите.

1) Не выходя из окна RV, создать пикчур-зону и получить её.
Мне кажется тут в общем случае будет сложность с тем, что это может потребовать переобработки всей страницы. Но опции влияния на основную страницы в такой сразу устанавливаемой в RV зоне, наверное, можно и заблокировать.

2) В окне RV создать выделение, транслировать его в окно MV (назначить вообще любую зону) и оттуда переобработать. Т.е. главное - выделение из окна в окно передать.

Автор: bolega, Отправлено:08:05 15-10-2021


Цитата:
Т.е. главное - выделение из окна в окно передать.

Правильно схватили. Этот вопрос уже поднимал когда-то TelecomUral в связи с необходимостью создавать транзитные зоны на выходе (их удобнее именно там создавать). Я тогда пояснял, что это есть в планах и требует создания матрицы аффинных преобразований всей обработки. Если такая матрица будет, и будет обратная ей, то проблем перехода от исходника к out, и наоборот, будет решена. Но это пока так и не реализовано.


Добавлено:

Цитата:
может потребовать переобработки всей страницы

При переобработке зоны всегда полностью переобрабатывается вся страница. Отличие только в том, что результат не сохраняется. По другому невозможно.

Автор: daa2013, Отправлено:08:28 15-10-2021


Цитата:
При переобработке зоны всегда полностью переобрабатывается вся страница. Отличие только в том, что результат не сохраняется. По другому невозможно.


А почему нельзя просто вырезать кусок из исходного изображения и объявить его обработанной пикчур-зоной, а пользователь пускай уже дальше сам его редактирует ?
Ведь когда внешнюю зону подключаете, что тоже переобработка идет ?


Цитата:
требует создания матрицы аффинных преобразований всей обработки

Ну вот я, например, в СК deskew не делаю.
Мне, правда, обсуждаемая хотелка никогда для пикчур-зон и не требовалась, так как можно и руками бекапы сделать, если почистил и зону пропустил. Чтобы обратно все утраченное вернуть после переобработки и появления новой зоны.
Но я это к чему, может, можно для некоего частного случая обойтись и без этой матрицы.

Автор: TelecomUral, Отправлено:08:36 15-10-2021


Цитата:
daa2013
Мне кажется, вы вообще о двух разных вещах говорите.

Лично я говорил о порочности подхода "смотреть закрыв глаза". А для транзитных зон - да, фича трансляции выделения в MV будет полезная. Тут shch_vg попал в точку.



Цитата:
daa2013
Ну вот я, например, в СК deskew не делаю.

со скана обычно удаляются края. резаками. Именно поэтому зона смещается, если ее создать после финализации. Утрачен (0,0). И новый (0,0) в VR не совпадает с исходным в MV, если вручную двигать границы ТБ. Сама логика исключает связь. Из исходника сделана обрезь ТБ, затем наращены поля, затем к этому конструкту примонтированы зоны с адресами их (0,0). А в MV базовый (0,0) это сам скан.
Хотя мне всегда казалось странноватым, почему было сразу не протащить некую точку исходного скана в VR, параметром страницы. Хуже не будет, а польза может быть. Почему те самые матрицы аффинных преобразований страниц не были предусмотрены изначально. Весь PDF стандарт на этих матрицах покоится

Автор: daa2013, Отправлено:08:41 15-10-2021

Резаками я тоже стараюсь не пользоваться

Добавлено:
Хорошо, утрачен (0,0).
Но руками ведь можно зону подвинуть. Я имею в виду сместить саму картинку обработанного изображения относительно обработанной основной страницы в RV . Это компенсирует.

Афинная матрица - это повороты и смещения. Если дело только в ней, то значит координаты нуля где-то хранятся.


Добавлено:
TelecomUral
Ну хорошо, вот мой случай: deskew нет, резаков нет, финализации нет.
Пиксельные размеры исходника совпадают с пиксельными размерами результата.
В чем, по вашему, будет проблема передать выделение ?

Автор: bolega, Отправлено:12:11 15-10-2021

daa2013

Цитата:
Ну хорошо, вот мой случай: deskew нет, резаков нет, финализации нет.


ОК, вот еще случай: издательский pdf. Deskew нет, резаков нет, финализации нет, бинаризации нет, ничего нет. Ничего не надо, расходимся довольные.

Автор: shch_vg, Отправлено:15:36 15-10-2021

bolega
Обсуждение на уровне "матрицы аффинных преобразований", конечно, интересен, но нельзя ли узнать, можно ли в приведенном мной выше алгоритме обработки сделать так, чтобы созданная после финализации зона после ее обработки попадала на нужное место в выходном скане в случае, если перед финализацией синяя пунктирная линия возможной финализации перемещалась?

Автор: daa2013, Отправлено:15:57 15-10-2021


Цитата:
ОК, вот еще случай: издательский pdf. Deskew нет, резаков нет, финализации нет, бинаризации нет, ничего нет. Ничего не надо, расходимся довольные.




Как это ничего не надо ? !! ???
А большая (ещё лучше - просто гигантская) кнопка "Сделать хороший pdf из плохого" ???

Автор: kamenkapenza, Отправлено:16:07 15-10-2021


Цитата:
Цитата:
kamenkapenza
можно ли создать зону картинки во втором окне программы

Нет, так нельзя. Выигрыша всё равно не будет - в окне результата ведь постраничный просмотр. Хоть первичные сканы листать, хоть обработанные.


Нельзя так нельзя. А то я думал, что все умные дятьки делают зоны прямо из страницы просмотра результатов, а мне это неведомо. Выигрыш в любом случае будет, если кому то захочется подправить зону на месте (может, по ошибке не тот индекс присвоил или пропустил рисунок) на какой то странице, чтобы не выходить на страницу обработки (секунды тратятся на выход в страницу обработки). А для создания и коррекции зон непосредственно в зоне просмотра результатов самый оптимальный вариант с малоиллюстрированной книгой. Объясняю: не выискивать эти малочисленные иллюстрации в книге, а сразу запустить общую обработку, а зону картинок устанавливать в панели просмотра результатов и делать репроцесс. Было бы и так хорошо, и эдак гоже. Наверное, это будет в 7-й версии. "Я так думаю!" (Хачикян "Мимино") )))

Автор: bolega, Отправлено:16:27 15-10-2021

shch_vg

Цитата:
можно ли в приведенном мной выше алгоритме обработки сделать так, чтобы созданная после финализации зона после ее обработки попадала на нужное место в выходном скане в случае, если перед финализацией синяя пунктирная линия возможной финализации перемещалась?

Старайтесь корректнее задавать условия. На это я ранее ответил: "можно". Но потом вы уточнили, что, оказывается, зоны то изначально не было! Она была задана уже после обработки. В этом случае ответ "нельзя". Будет можно, если появится матрица трансформаций. Объясню, почему нельзя. Когда вы вручную меняете на выходе габарит, координаты всех зон меняются синхронно и хранятся вместе с зоной. Хранятся именно текущие координаты, а не манипуляции, которые привели к этим изменениям. Перед пере-обработкой координаты запоминаются и после нее восстанавливаются, авто или вручную. Когда же вы новую зону создали после обработки (и после изменения габарита), то СК просто неоткуда восстанавливать положение зоны. Нет сохраненных координат, которые бы учитывали сдвиг габарита.


Добавлено:
TelecomUral

Цитата:
Почему те самые матрицы аффинных преобразований страниц не были предусмотрены изначально. Весь PDF стандарт на этих матрицах покоится

Меткий выпад. Я в нокауте ...

Автор: nuget2, Отправлено:19:33 15-10-2021

Некоторые соображения с точки зрения пользователя начального уровня.

Первое, на что я обратил внимание, -- это метод добавления изображений в проект. Почему нельзя было установить целевой каталог в качестве инициализации файла проекта? В данном случае все необходимые файлы заданий и каталогов можно было создать по умолчанию на этапе инициализации, относитльно корневого каталога проекта. Это потребовало от пользователя всего лишь одного действия -- указать целевой каталог.

Второе, -- это сохранение уже существующего задания. Почему программа всегда сохраняет файл в режиме Save As?

Третье, что явно сбивает с толку, -- это создание дополнительного задания (out-task). Как я понял, все файлы типа (*.spt) используются в качестве прототипа файла проекта, но с некоторым различием в конфигурации. Нельзя ли объединить все файлы в один, а переключение между ними реализовать на уровне пользовательского интерфейса?

В целом, программа довольно интересно сделана. Но не понятно, какова цель этого проекта? Если это часть какого то коммерческого продукта, было бы неплохо дать пояснение в шапке. Если цель проекта некоммерческая, то почему его код до сих пор закрыт? Сравнивая ScanTailor Advanced и ScanKromsator, навскидку можно с уверенностью сказать, последний имеет больший потенциал для развития (имеется ввиду, если этот проект появится на GitHub).

Автор: nemoW, Отправлено:23:44 15-10-2021

Добрый день.
Подскажите, как сделать, чтобы ScanKromsator использовал progressive JPEG при создании PDF ? А то я из полученного PDF с помощью xjpg извлёк JPEG изображения, скормил Image Catalyst и получил 20% уменьшение размера:

Код:
-------------------------------------------------------------------------------
File Name | Original | Optimized | Savings | % Savings
| Size | Size | |
-------------------------------------------------------------------------------
xj_00000.jpg | 304.75 KB| 245.08 KB| -59.66 KB| -19.57%
xj_00001.jpg | 297.82 KB| 239.31 KB| -58.51 KB| -19.64%
xj_00002.jpg | 307.13 KB| 246.16 KB| -60.96 KB| -19.84%
xj_00003.jpg | 331.00 KB| 270.21 KB| -60.79 KB| -18.36%
xj_00007.jpg | 251.27 KB| 194.39 KB| -56.87 KB| -22.63%
xj_00008.jpg | 339.96 KB| 278.31 KB| -61.65 KB| -18.13%
xj_00009.jpg | 252.25 KB| 196.66 KB| -55.59 KB| -22.03%
xj_00010.jpg | 273.48 KB| 216.52 KB| -56.95 KB| -20.82%
xj_00004.jpg | 312.27 KB| 251.97 KB| -60.29 KB| -19.30%
xj_00005.jpg | 297.62 KB| 238.33 KB| -59.29 KB| -19.92%
xj_00006.jpg | 300.32 KB| 240.82 KB| -59.50 KB| -19.81%
-------------------------------------------------------------------------------

Total
-------------------------------------------------------------------------------
JPG [11/11]: | 3.19 MB| 2.55 MB| -650.10 KB| -19.89%
-------------------------------------------------------------------------------

Автор: Archivist, Отправлено:23:48 15-10-2021

nemoW
Насколько мне известно, PDF не поддерживает формат прогрессивных JPEG.
Но вы можете использовать этот формат, наряду с WebP в CBR/CBZ.

Автор: TelecomUral, Отправлено:05:22 16-10-2021

nuget2
Суть в том, что программа СканКромсатор разработана её автором прежде всего для себя и под себя. Большинство ваших вопросов отпадают по этой причине. bolega ей просто поделился.

Добавлено:
Archivist

Цитата:
Насколько мне известно, PDF не поддерживает формат прогрессивных JPEG

поддерживает. В доке на v1.4 (стр.61) указано что подвид формата закладывается прямо в поток (stream) данных и не требует специального указания в начинке pdf. Хороший вопрос. Там есть и примечание, что пользоваться progressive JPEG не следует, так как это медленнее при открытии и жрёт больше памяти. И что-то про выгоду только при использовании внешних ссылок.

Автор: kamenkapenza, Отправлено:09:00 16-10-2021

Товарищи, доброго здоровья! Хотелось бы спросить про настройки выходного джву, какие ставить в панели джву визард? Для цветных у меня стоит ДЕЕ профиль 300 дпи (может, 600 сделать?), Кволити стоит 80 (может сотенку сделать?), Хроминанс кволити - дефолт. Для черного-белых Текст компрессив стоит агрессив (может, лослесс поставить?) бэкграун и фореграунд кволити стоит по 75 процентов (может, 100 делать?), ДЕЕ профиль дефолт (может, 600 дпи сделать?) Про зоны (шаг 3): там тоже какие то цифры стоят (ратио 1 и т.д.), но я в этом вообще не кумекаю. И настройки каждый раз возвращаются на какие то свои параметры (по умолчанию), каждый раз надо переделывать. Нельзя их как то зафиксировать, чтобы они не менялись?

Автор: TelecomUral, Отправлено:10:38 16-10-2021

kamenkapenza
лосслесс или квазилосслесс я обычно ставлю для особомелких деталюшек на чб графике. Особенно где штриховка или если буквы рваные с тонкими перемычками.
Подымаю кволити до 80 если зона содержит бледный растр (почти проплешины). Либо если лезут артефакты.
Во всех прочих случаях установки по умолчанию дают наилучшие результаты кодирования. Всё разборчиво, нет потерь ("инь", артефакты), приемлемый размер.
Можно ратио два выставлять для зон, исходно сканенных в 600, но я стараюсь и это не делать. Фиг с ним с размером, а то на понижении-повышении разрешения можно лишние зазубрины получить во вьювере. От муара. Нужно очень с умом сканировать и обрабатывать картинки, чтобы поджимать их настройками кодирования джву по максимуму но без повреждений.

Автор: shch_vg, Отправлено:12:10 16-10-2021

TelecomUral

Цитата:
Подымаю кволити до 80 если зона содержит бледный растр

Речь идет о о втором шаге или третьем?
Если о втором, значит, какие-то параметры второго шага влияют на третий?
Но в третьем есть свое кволити, тогда не 80, а 8?

Автор: romanef, Отправлено:12:51 16-10-2021

Как можно ускорить листание страниц в СК (хоткеи Q,W)?
В моем компе 128 ГБайт памяти, 12 ядер, использую RAM-диски как рабочие папки.
Все равно листание довольно медленное.
Можно ли как-то включить предзагрузку страниц, как это сделано в просмотрщиках картинок?

Кстати, в версии 6.71 тягать мышкой пикча-зоны получается медленнее, чем в 6.53.

Автор: TelecomUral, Отправлено:13:51 16-10-2021

shch_vg

Цитата:
Речь идет о о втором шаге или третьем?

о третьем. Не "80", а "8", при умолчании "6".

Автор: ndch, Отправлено:14:09 16-10-2021

Archivist

Цитата:
PDF не поддерживает формат прогрессивных JPEG

Поддерживает. На очень слабом железе тормозит (тормозило).
Но jpeg2000 ещё меньше по размеру и ещё более требователен к железу.
Вот почему интересуетесь прогрессивным JPEG, а не jpeg2000 ?
Насколько помню bolega прикручивал очень хороший кодер jpeg2000 - kakadu.

Автор: kamenkapenza, Отправлено:14:46 16-10-2021


Цитата:
лосслесс или квазилосслесс я обычно ставлю для особомелких деталюшек на чб графике. Особенно где штриховка или если буквы рваные с тонкими перемычками.
Подымаю кволити до 80 если зона содержит бледный растр (почти проплешины). Либо если лезут артефакты.

TelecomUral, спасибо!


Автор: Archivist, Отправлено:16:55 16-10-2021


Цитата:
Но jpeg2000 ещё меньше по размеру и ещё более требователен к железу.

Для меня в электронных документах на первом месте стоит быстродействие, поэтому использую только baseline JPEG и избегаю lossless JBIG2 (lossy на удивление быстро работает). Верстаю на старом компе, читаю иногда на eInk. Ситуация, когда пользователь листает книгу и видит вместо контента "подождите..." неприемлема.

Автор: nuget2, Отправлено:18:48 16-10-2021

TelecomUral

Цитата:
Суть в том, что программа СканКромсатор разработана её автором прежде всего для себя и под себя. Большинство ваших вопросов отпадают по этой причине. bolega ей просто поделился.


Просто так ПО не выкладывают в публичный доступ. Как минимум, это помогает разработчику отладить ПО на этапе тестирования. Чем больше пользователей принимают участие в этом мероприятии, тем стабильнее ПО. Но важна не только отладка, также может быть полезным некоторые идеи. Поэтому я уточнил, какова цель проекта. Если автор не заинтересован в реализации пожеланий пользователей, нужно об этом написать в шапке.

Автор: romanef, Отправлено:19:45 16-10-2021


Цитата:
Чем больше пользователей принимают участие в этом мероприятии, тем стабильнее ПО.


мы тут тестируем уже шестнадцать (!) лет.

Автор: TelecomUral, Отправлено:20:07 16-10-2021


Цитата:
nuget2
Поэтому я уточнил, какова цель проекта

по-моему, я вам уже ответил. Реализация пожеланий пользователей проходит через фильтрацию "для себя". Например, некоторые (многие) люди упорно просили убрать идеологию резаков из этой превосходной программы Как вы можете видеть, пожелание не учтено. Ну а недавно упомянутые транзитные зоны - учтены.

Автор: nuget2, Отправлено:22:01 16-10-2021

TelecomUral, ну знаете, такая практика применяется практически во всех открытых проектах. Пожелания пользователей, также проходят фильтрацию. То есть, реализуются только те пожелания, которые согласуются с основной идеей проекта. В этом смысле, я не вижу противоречий.

Автор: kamenkapenza, Отправлено:08:11 17-10-2021


Автор: Maz, Отправлено:11:47 17-10-2021

Для всех:
Обращу внимание, что в теме много нарушений правил, включая п.п. п. 1.8. главы VIII Соглашения по использованию, п. 2.5.5. главы VIII Соглашения по использованию, п. 2.4. главы VIII Соглашения по использованию и других.
Ближе к делу. В ином случае тему отправлю в тестирование.

Автор: nemoW, Отправлено:11:29 18-10-2021

Archivist

Цитата:
Насколько мне известно, PDF не поддерживает формат прогрессивных JPEG.

Как пишут ниже, поддерживает.

TelecomUral

Цитата:
пользоваться progressive JPEG не следует, так как это медленнее при открытии и жрёт больше памяти.

Ну хз, я сделал PDF из progressive JPEG и разницы не заметил.

ndch

Цитата:
Поддерживает. На очень слабом железе тормозит (тормозило).
Но jpeg2000 ещё меньше по размеру и ещё более требователен к железу.
Вот почему интересуетесь прогрессивным JPEG, а не jpeg2000 ?
Насколько помню bolega прикручивал очень хороший кодер jpeg2000 - kakadu.

Поставил для интереса это kakadu, выставил в настройках SK jpeg2000 для PDF. Получил жуткие тормоза при скроллинге в Acrobat Reader DC на моём Ryzen 3800X.

Автор: Archivist, Отправлено:14:39 18-10-2021

nemoW
Ответил в общей теме, чтобы не офтопить - http://forum.ru-board.com/topic.cgi?forum=93&topic=3514


Автор: niccolo, Отправлено:23:40 19-10-2021

Подскажите, что надо сделать, чтобы правильно обрезать страницу. Не обрезает нормально только и именно эту страницу - на других нет этой проблемы

Вот ролик проблемы
https://www.upload.ee/files/13565884/Kroms.wmv.html

Вот субтаск
https://www.upload.ee/files/13565888/dic.rar.html



Автор: shch_vg, Отправлено:01:48 20-10-2021

niccolo
Что Вы понимаете под словами "правильно обрезать страницу"? Что Вы хотели бы получить?
Это стоило бы указать в текстовом файле в выложенном архиве.
Если Вам нужно два скана, то на закладке Page галку в окошко Split, а правый резак правее прямоугольника М

Автор: TelecomUral, Отправлено:08:43 20-10-2021

niccolo
видимо, вас не устраивает что слева обрезана вертикальная граница черного прямоугольника? Я снял зеленую галку с файла в списке, нажал draft kromsate, подвинул вручную правый резак к середине скана и обработал страничку. Граница появилась.
А вот почему так переклинивало программу - бог весть.

+
Занятные у вас тиффы, с превьюшками (multipage tiff). Чем это сделано?

Автор: bolega, Отправлено:09:54 20-10-2021

niccolo
За последние 15 лет впервые вижу задание, в котором включили опцию Special > More > clear shadow )))
Очень специфическая опция, из 1-й версии СК, предназначена была для ч/б сканов, в которых тень от середины разворота бинаризована в черные полосы с наездом на текст. Таких сканов уже очень давно не делают.
Зачем ее включили?, просто интересно.
Опция с помощью эвристики иногда умудрялась неплохо отделить текст от черноты тени. Повторю, только для ч/б сканов!

Автор: niccolo, Отправлено:10:13 20-10-2021


Цитата:
Что Вы понимаете под словами "правильно обрезать страницу"? Что Вы хотели бы получить?


Правильно — не обрезать рамку картинки.


Цитата:
Занятные у вас тиффы, с превьюшками (multipage tiff). Чем это сделано?


FR 5


Цитата:
За последние 15 лет впервые вижу задание, в котором включили опцию Special > More > clear shadow )))


Оно как раз из задания тех лет. Надо было исправить несколько дефектных страниц. Спасибо за подсказку - убрал галку - всё стало ОК.

Автор: asku, Отправлено:12:58 21-10-2021

Добрый день.
Подскажите пожалуйста как обрабатывать такие картинки с текстом так, чтобы и рисунок сохранился и текстовый слой можно было сделать.


Вот тест-файл всего разворота.
Тест СК

Автор: ndch, Отправлено:13:57 21-10-2021

nemoW
http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=3520#20

Автор: TelecomUral, Отправлено:14:24 21-10-2021


Цитата:
asku
и текстовый слой можно было сделать

разве это проблема Кромсатора? Если ocr-программа распознает текст на сером фоне, то распознает. А нет так нет. По-моему, вид обработки тут ни при чём.

Автор: daa2013, Отправлено:15:10 21-10-2021

asku
поставьте одну зону над другой

https://disk.yandex.ru/d/9Te99Wecz8k0TQ

Автор: asku, Отправлено:19:13 21-10-2021


Цитата:
поставьте одну зону над другой


Так и сделаю. Спасибо.

Автор: daa2013, Отправлено:10:02 22-10-2021

Вдогонку к обсуждению передачи выделения.

Хотелка (несрочная):

Сначала опишу ситуацию. Изготавливаю комплект "разделённых сканов", открыто три СК с оригиналом, фоном, маской. У всех одинаковые пиксельные размеры и разрешение. Из оригинала делаю пасте попорченных кусков в фон. Они, естественно, теряют свое положение и вставляются по мышке.

Можно ли как нибудь вставлять их точно в исходное положение ? Например:

а) при копи (модификатор обычного или хоткей на специальное копи) запоминать координаты положения вставлять с их учетом ? (Тут, правда, у меня два разных СК ....)

б) сделать возможным такой перенос в режиме окна RV "compare", а я уж руками в нужные папки размещу какие надо редактируемые комплекты

в) сделать новый режим окна RV именно для работы с оригиналами/масками/фонами, с прицелом на то, что когда-нибудь вообще импорт джву появится.

Автор: shch_vg, Отправлено:13:06 22-10-2021

daa2013

Цитата:
Они, естественно, теряют свое положение и вставляются по мышке.


Цитата:
Можно ли как нибудь вставлять их точно в исходное положение ?

Эк, Вы хватились!
Радуйтесь первому отквоченному предложению, тем более это передается из одного задания в другое.
Здесь уже долго не получается вставка по мышке скопированной зоны в пределах одного задания.
Все время вставляет в место копирования, и приходится вручную перетаскивать в нужное место.
Для десятка случаев это терпимо, когда же дело доходит до несколько сотен, то это уже проблема.

Автор: TelecomUral, Отправлено:05:34 23-10-2021


Цитата:
shch_vg
Здесь уже долго не получается вставка по мышке скопированной зоны в пределах одного задания.
Все время вставляет в место копирования, и приходится вручную перетаскивать в нужное место.
Для десятка случаев это терпимо, когда же дело доходит до несколько сотен, то это уже проблема.

Зачем копировать несколько сотен? Можно же выделить свойства в буфер обмена, просто расставить зоны одной группы, обычным способом, а затем на эту группу скопировать все нужные свойства из буфера. Так проще выйдет, чем копировать зону и двигать её.
Или вам зачем-то нужна полная идентичность размеров? Но зачем?? Всё равно вы мышкой зону на рисунок с точностью до пикселя не наведёте, тогда какой смысл в одинаковости габаритов? Если внешняя программа этого требует, тогда конечно да, но что это за программа такая убогая что не может принять на вход разнобойные файлы.

Автор: bearjrgm, Отправлено:09:18 23-10-2021

TelecomUral
и размер зоны тоже копируется?
Смысл точности габаритов возникает приобработке шахматных диаграмм и их замене

Автор: shch_vg, Отправлено:11:48 23-10-2021

TelecomUral
Создается впечатление, что Вы никогда не видели ни одной шахматной книги. Во многих из них может быть огромное количество диаграмм ОДИНАКОВОГО РАЗМЕРА. Надеюсь, я дал полный ответ на Ваш расширенный вопрос?

Автор: TelecomUral, Отправлено:13:12 23-10-2021

shch_vg
нет, вы не дали мне ответ. Я спросил: "зачем". Ну, будут вокруг одинаковых диаграмм не вполне равновеликие зоны. И что с того. Зато это много быстрее чем копировать и двигать.

Автор: daa2013, Отправлено:14:37 23-10-2021

shch_vg

К сожалению, вы не выложили задание, поэтому не совсем ясно, что именно у вас не получается.

Но по-моему, в окне MW зона копируется.
1. Поставить зону, затем через ПКМ Copy zone to clipboard.
2. Через меню Zones - Paste zone to pages и там выбрать диапазон, на какие страницы копировать.

Если целевые страницы расположены несколько хаотично, то либо можно потом лишние зоны удалить (это проще чем ставить). Либо предварительно поиграть с выделениями. Там есть галочка "пропустить выделенные", и соответственно можно сразу выделить ненужные страницы. А можно, наоборот, выделить нужные, а потом перед расстановкой зон выделение инвертировать.



А в окне RV можно автопозиционирование глифов задействовать. Я когда куски графиков таскаю, объявляю весь график гигантским глифом. Жалко только, что для цветных глифов автопозиционирования нету.

Если же нужно хорошей диаграммой перекрыть плохую на 100 страницах в идентичной позиции, то можно хорошую как внешнюю зону вставлять.


Но если это сто раз диаграмму с левой страницы на правую скопировать (каждый раз разную диаграмму), то это да - как раз мой случай
Но только это не зона, а выделенный кусок изображения...

Кстати, да. На худой конец я мог бы нечетные страницы заделать оригиналами, а чётные фонами - и в пределах одного задания выделенное копипастить.

Автор: shch_vg, Отправлено:15:28 23-10-2021

daa2013

Цитата:
К сожалению, вы не выложили задание

Я не понимаю, какое нужно здесь задание?
Представьте сканы шахматной книги с множеством диаграмм равной величины.
Необходимо их все обработать с параметрами, отличными от параметров обработки текста.
Для этого каждую из них надо заключить в пикче-зону.
Заключаю первую и копирую ее зону.
Перехожу к следующей, т.е. перемещаю мышь в район следующей диаграммы, нажимаю Ctrl+V и получаю новую зону не в районе мыши, а на месте копирования предыдущей зоны.
Если же при этом приходится увеличить просмотр в главном окне, чтобы четче расставить зоны, то скопированная зона может даже не попасть в зону визуализации главного окна.
Подробнее я уже вряд ли смогу объяснить ситуацию.

Цитата:
что именно у вас не получается

Не получается, потому что это не реализовано в программе.

Добавлено:
TelecomUral

Цитата:
нет, вы не дали мне ответ.

Прочтите внимательно мое последнее сообщение, может быть Вы поймете проблему.
Я мельком прочитал Ваше сообщение и пропустил следующее: "Можно же выделить свойства в буфер обмена, просто расставить зоны одной группы".
Вот о просто расставить зоны и идет речь.
Либо подводить мышь к очередной диаграмме и СОЗДАВАТЬ зону вокруг нее, либо, единожды скопировав ее, размножать по Ctrl+V кстати с уже запомненными свойствами зоны из первой диаграммы.
Улавливаете разницу в действиях?

Цитата:
Зато это много быстрее чем копировать и двигать.

В этом суть моей проблемы. Если бы была реализована функция помещения скопированной зоны в скан по месту нахождения мыши, то ничего бы не надо было бы двигать, т.к. свойства зоны автоматически запоминаются при ее копировании.

Автор: TelecomUral, Отправлено:15:45 23-10-2021

shch_vg

Цитата:
Улавливаете разницу в действиях?

Улавливаю Но ответ я так и не получил. И бог бы с ним, мне просто интересно стало, зачем так неоптимально работать. Какой смысл. Можно меня проигнорить.

+
Вам кнопки "Mouse-Up mode" - знакомы? Включаете автосоздание пикчур-зоны, и дальше только выполняете выделение прямоугольника над диаграммой. Кнопку мышки отпустили, пикчур-зона сразу создалась. Со свойствами от предыдущей созданной зоны. В ваших шахматных книжках обычно все рисунки совершенно однотипные, так что с разнобоем свойств проблемы не будет.

Автор: daa2013, Отправлено:16:22 23-10-2021

shch_vg
Вот теперь понял. Если мне надо в окне RW в ту же позицию, то вам надо в окне MW и по мышке.

TelecomUral
Я, например, вижу в этом смысл при маленьком экранчике и большой диаграмме.
Если в окне видна вся диаграмма, то надо очень точно позиционировать, чтобы попасть в промежутки рядом. Это неудобно и трудно.

Если же увеличить, то виден только один угол диаграммы, а до противолежащего, чтобы зону выставить, поди доберись с этими мелкими треугольничками зума и перетягявианиями по экрану. Плюс мышь все время норовит слететь в перелистывание списка файлов, если колесико заденешь. Всегда, кстати, хотел отключение в опциях перемещения колесом по списку.
Видишь только угол - удобно сделать пасте.


Автор: TelecomUral, Отправлено:16:34 23-10-2021


Цитата:
daa2013
Видишь только угол - удобно сделать пасте.

Да.
Сейчас нам автор скажет, что это давно реализовано по какому-нибудь "удерживая Shift"

Автор: daa2013, Отправлено:16:39 23-10-2021

Упс, отключение колеса есть

Автор: shch_vg, Отправлено:16:50 23-10-2021

TelecomUral

Цитата:
Вам кнопки "Mouse-Up mode" - знакомы?

Нет, не знакомы, но я прекрасно обхожусь без них.
При создании первой зоны и задании ее свойств, они автоматически запоминаются СК и проставляются в следующую независимо от размера зоны. То же самое происходит при копировании зоны.
Вопрос-то только в том, чтобы зону делать руками один раз, а потом копировать в нужное место скана, а не в то место, откуда она была скопирована, т.к. в этом случае ее приходится еще и двигать. А бывает, что при большом увеличении и искать, а где появилась только что скопированная зона.

Автор: TelecomUral, Отправлено:18:01 23-10-2021

shch_vg
Ну вот, пожалуйста: поискал и нашёл. Среди хоткеев наличествует "move zone(s) to cursor position". Решает вашу проблему.

Автор: shch_vg, Отправлено:21:36 23-10-2021

TelecomUral
Спасибо за находку, я обрадовался, посмотрел в хоткеях для MV:действительно есть и повешена на Alt+Z. Стал разбираться, как это работает. Обстучал эти две клавиши, пока не нашел принцип работы.
Это паллиатив моего запроса: перемещение возможно только в пределах зоны.
Т.е. проще перетащить зону руками, чем постукивая, переместить этим хоткеем в нужное место.

Автор: daa2013, Отправлено:21:45 23-10-2021

А какая версия СК ?
у меня хоткея для команды задано не было, двигает куда угодно в пределах страницы.

копи - пасте - передвинуть.

причем передвинуть можно сколько угодно раз.

Автор: shch_vg, Отправлено:23:18 23-10-2021

daa2013
Версия последняя официальная 6.71

Цитата:
двигает куда угодно в пределах страницы.

кто двигает?
Если Вы имеете в виду, что можете руками передвинуть зону, то это понятно.

Еще раз повторяю, я обсуждал единственный вариант: создаю зону со свойствами, копирую ее в клипборд, затем помещаю курсор мыши в нужное место на скане и нажимаю Ctrl+V.
Если бы в месте, указанном курсором, появилась бы копия зоны, это бы было идеальным вариантом.
Но, к сожалению, зона появляется на месте скопированной зоны.

Добавлено:
TelecomUral

Цитата:
Решает вашу проблему.

При более тщательной проверке действительно таким способом можно добиться помещения в нужное место, но все же для этого требуется каждый раз делать дополнительное действие, а именно, сначала выполнить хоткей "Paste zone", после которого вставляемая зона помещается в позицию скопированной зоны, а затем хоткей "move zone(s) to cursor position".
Кстати, непонятен смысл (s) в названии этого хоткея.

Автор: daa2013, Отправлено:03:33 24-10-2021


Цитата:
кто двигает?

Ну вот видите, разобрались же.


Цитата:
Кстати, непонятен смысл (s) в названии этого хоткея.


Вы можете выделить сразу несколько зон и они все вместе передвинутся.

Автор: TelecomUral, Отправлено:04:29 24-10-2021


Цитата:
daa2013
Вы можете выделить сразу несколько зон

уточню: выделить их можно и при начальном копировании в буфер. Они по Paste zone вставятся все, и их можно подвинуть сразу. Поэтому и "(s)". Наверное Я так не пробовал двигать.

Автор: shch_vg, Отправлено:13:09 24-10-2021

daa2013
Цитата:
они все вместе передвинутся.

TelecomUral

Цитата:
их можно подвинуть сразу

Т.е. все лягут одна на другую, т.к. это сдвиг в положение курсора?
Если это так, то осталось придумать ситуацию, когда это может понадобиться.

Добавлено:
Только что проверил Ваше предположение и оно действительно работает. Даже удалось найти ему применение, когда большинство страниц заполнено диаграммами на одних и тех же местах, но все же в варианте копирования одной зоны (а в большинстве случаев диаграммы расположены на странице в случайном порядке) вместо одного хоткея приходится вызывать два для каждой диаграммы.

Автор: asku, Отправлено:19:27 26-10-2021

Добрый вечер. Такой вопрос возник.
Сначала картинка.



Почему СК часто "не видит" во такие линии наверху под колонтитулом? Как-то это можно исправить?

Автор: shch_vg, Отправлено:02:21 27-10-2021

asku

Цитата:
Как-то это можно исправить?

Может как-то и можно. но первое, что приходит на ум: подберите на типовой странице достаточно большое значение параметра H.Gap value, чтобы финализация не обрезала линию, затем подставьте значение этого параметра и полученное фиксированное значение по ширине в задание и обработайте. Вроде бы должно сработать.

Автор: TelecomUral, Отправлено:03:59 27-10-2021

asku
shch_vg
Мне кажется, что СК "правильнее" сделал. Он же резаками не отхватил линию. А содержимое сцентровал лучше, именно текстовый блок нашёл.
upd
То есть, выставив правильный размер надставляемых полей, вы ничего не утеряете при финализации.

Автор: shch_vg, Отправлено:14:13 27-10-2021

TelecomUral

Цитата:
То есть, выставив правильный размер надставляемых полей, вы ничего не утеряете при финализации.

И чем это отличается от моего совета?

Автор: TelecomUral, Отправлено:14:31 27-10-2021

shch_vg

Цитата:
И чем это отличается от моего совета?

Ничем.
Но если книга с различными полями, ваш совет не поможет. А мой указывает, что поля бывают "правильные" именно для данной страницы.

Автор: Skay91, Отправлено:11:34 29-10-2021

shch_vg

Цитата:
вместо одного хоткея приходится вызывать два для каждой диаграммы.

точно все равно не спозиционировать курсор будет + размеры чуть плавают. вставить и подгонять размеры тоже не медленно. Проще нажать и нарисовать новую зону. А когда много, как было на предыдущей странице - вставить пачку и поправить позиции.
Если именно шахматы - то скриптом питоновским пройтись предварительно по заданию для расстановки зон для шахмат.

Автор: shch_vg, Отправлено:14:25 29-10-2021

Skay91

Цитата:
точно все равно не спозиционировать курсор будет + размеры чуть плавают. вставить и подгонять размеры тоже не медленно. Проще нажать и нарисовать новую зону.

Это ваше личное мнение, мое ровно противоположное. Если бы вы обработали столько шах.книг, сколько за 15 лет обработал я, вы бы не были столь категоричны.Размеры диаграмм не плавают, единственная проблема может быть из-за некоторого поворота диаграммы, но это сущие пустяки по сравнению с отрисовкой каждой диаграммы.
Цитата:
А когда много, как было на предыдущей странице - вставить пачку и поправить позиции.

Сами себе противоречите. Одну диаграмму проще нарисовать, много- проще скопировать, а потом "точно все равно не спозиционировать".
Цитата:
скриптом питоновским пройтись предварительно по заданию

Давая такие советы, нужно бы приложить ссылку на такой скрипт, а если ее нет, то это бессмысленный совет. Не все умеют работать в пайтоне.

Автор: TelecomUral, Отправлено:16:46 29-10-2021

shch_vg
[more=скрипт на питоне для выделения зон СК]

Цитата:
А это: https://github.com/U235a/chess4SK выделитель шахматных диаграмм (квадратных рисунков) в зоны SK.

http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&start=3260#16
[/more]

Автор: shch_vg, Отправлено:22:33 29-10-2021

TelecomUral
Я это видел, но запустить не смог.

Автор: Skay91, Отправлено:22:40 29-10-2021

shch_vg

Цитата:
Это ваше личное мнение, мое ровно противоположное.

думаю тут скорее дело привычки. Если же говорить именно о шахматах - то единственный случай когда делал, оказался с поплвышей печатью, так что все разные были))
А про вставлять зону под курсор было бы в принципе удобно, согласен. Просто ввиду наличия скрипта не думал что оно так нужно часто.

Цитата:
Сами себе противоречите.

не противоречу. там было про точнее, а в этом случаи очевидно с запасом.

Цитата:
нужно бы приложить ссылку на такой скрипт,

Вы тут дольше меня, и раз интересуетесь темой шахмат то решил, должны были его видеть, потому не подумал приложить. Извиняюсь.
Чтоб скрипт заработал, после установки python Надо будет в консоли еще

Код:
pip install opencv-python
pip install numpy

После чего в папке со скриптом

Код:
python chess4SK.py

либо запустить установившийся IDLE вместе с python, и там открыть скрипт, запустить

Автор: shch_vg, Отправлено:23:20 29-10-2021

TelecomUral
Skay91
Вспомнил сейчас свою эпопею с этим скриптом. Автор выложил его в марте, я запустил на большом задании. Скрипт нашел на одной странице половину диаграмм, на остальных пропустил.
После этого я потерял к нему интерес и, по-видимому, пропустил исправленный вариант.
Сейчас взял чуть больший по размеру chess4SK.py из архива по ссылке TelecomUral и заменил им старый. Запустил на довольно неважных сканах книги 30-го года (более 300 стр).
Вначале скрипт на одной странице из 6 диаграмм обнаружил только три, затем на нескольких дальнейших сканах вообще не обнаружил диаграмм, но затем раскочегарился и выделил почти все остающиеся диаграммы. Неопознано всего диаграмм 15 из примерно 300, как для меня, то очень приличный результат.
Рекомендую!

Автор: daa2013, Отправлено:08:29 30-10-2021

И снова про выделения.

Решил перечитать про глифы в whatsnew. И что я вижу:


Цитата:

- VR: В КМ списка цветов палитры панельки Posterization добавлена команда Copy color layer to clipboard. Работает следующим образом:
создается копия всего изображения либо выбранного фрагмента при наличии выделения. Все пикселы, имеющие цвет, отличный от текущего
выбранного в палитре, либо находящиеся внутри ограничителя FF-limiter, заменяются на белый цвет и становятся прозрачными. Результат
копируется в буфер обмена. При необходимости слой из буфера обмена можно поместить в библиотеку глифов командой Add from clipboard.
Если команда применялась к выделению, то вместе со слоем в буфере сохраняется точка расположения выделенного фрагмента, т.е.
координата его верхнего левого угла. При использовании в дальнейшем команды Paste слой будет вставлен в исходную позицию, независимо
от положения курсора мышки. Чтобы добиться такого же эффекта для случая, когда полученный слой добавлялся в библиотеку глифов,
необходимо выполнить двойной щелчок на глифе, затем вызвать стандартную команду Paste; просто перетаскивания глифа из библиотеки
на изображение будет недостаточно для автовосстановления его исходной позиции.



То есть я могу сделать постеризованный глиф, который помнит свое местоположение.
Более того, я могу его из окна RV перетащить в окно MW и там вставить.
(Из меню вызвать Result - Show source file и оттуда в библиотеку глифов залезть).

То есть сделать-то дополнительно всего ничего: запоминать так (с координатами) в библиотеку глифов не постеризованный глиф, а цветной. (Просто выделенное туда отправлять без накладывания всяких масок прозрачности.). Обычные цветные-то глифы возможны. Да и черно-белые тоже можно. (На самом деле я этот постеризованный цветной вставляю в ч.б исходники и он прекрасненько, как черно-белый, и встаёт в итоге).

Автор: shch_vg, Отправлено:13:26 30-10-2021

Двигал окно глиф-библиотеки, как вдруг она заняла всё окно. Никакие мои усилия не заставили это окно вернуться к его нормальному виду сбоку окна RV. Как-то это можно починить?

Автор: TelecomUral, Отправлено:13:54 30-10-2021


Цитата:
Как-то это можно починить?

двойной щелчок на управляющей полоске (узенькая, такая же как у других панелек).

Автор: shch_vg, Отправлено:17:59 30-10-2021

TelecomUral
Спасибо за информацию. Не знал об этой полоске.
Чисто экспериментально возил курсор по окну, пока курсор не стал крестообразным (как раз на этой линии). Интеллекта на двойной щелчок не хватило, но когда я оттащил этот крест ниже окна, нужный мне формат окна глифов восстановился.
Век живи - .......... помрешь!

Автор: asku, Отправлено:21:49 30-10-2021

TelecomUral

А есть еще скрипты для работы с СК? Вот например, если в книге очень много фотографий, и скрипт бы каждую внес в рамку (Create picture zone).

Вот пример такой книги. Разворот, точнее. А таких разворотов около 250-ти.



Автор: bolega, Отправлено:21:50 30-10-2021

daa2013

Цитата:
То есть сделать-то дополнительно всего ничего

так в итоге нужно то что? сохранять произвольный глиф с координатами? А зачем?

На текущий момент в последней версии выявлены баги. Приведу их списком:
- При выполнении команды Special > OCR page в окне VR в ocr-файл сохранялось неверное значение ориентации текста.
- Вызов OCR для файлов с dpi=1200 как правило заканчивался ошибкой (проблема где-то в ocr.dll). Чтобы избежать это, СК в таких случаях выполняет даунсемплинг изображения перед применением OCR.
- В библиотеку глифов не сохранялся слой прозрачности для серых/цветных глифов.
- при удалении глифов из библиотеки глифов память, занимаемая изображениями, не высвобождалась, что со временем могло привести к общей нехватке памяти.
- при загрузке задания игнорировались опции зоны, сохраненные в 4-м и 5-м кармане.
- изменение положения зоны после команды Place relative to basis zone не сохранялось.
- изменение поправки порога бинаризации для правой половинки разворота на сохранялось.
- тип сортировки файлов, выбранный в диалоге открытия изображений, сохранялся в ini-файл, но не восстанавливался.
- при обработке external pic-зоны слой прозрачности имел некорректные размеры, если для зоны были заданы изменение dpi и опция transparent одновременно.
- если external pic-зона выступала за пределы резаков или скана, на выходе ее форма деформировалась.
- цветная зона с включенной опцией Few-color coding кодировалась в djvu некорректно, если она содержала более 256 цветов.

shch_vg
- MW: Новый хоткей Paste zone to cursor. Вставляет зону(ы) из кармана в точку, определяемую курсором мышки.

Автор: VadimirTT, Отправлено:21:55 30-10-2021

asku
Я, как то, сделал несколько каталогов марок, рука не отсохла.

Автор: daa2013, Отправлено:22:09 30-10-2021


Цитата:
так в итоге нужно то что? сохранять произвольный глиф с координатами? А зачем?


Я уже писал. Когда работаю с разделенными сканами и исправляю ошибки сегментации.
Мне надо перетащить кусок из оригинала в фон или маску на ту же самую позицию, чтобы уже там выполнить бинаризацию / постеризацию; залить буквы или обтравить картинку.

Я этот кусок, получается, могу и как цветной глиф перетащить. Костыль, конечно.
Но возможность ИМХО полезная. Так, например, можно виньетки всякие перетаскивать и размножать. Они же не обязательно постеризованы будут. Цветные/серые тоже вполне себе могут быть. Градиенты в колонтитулах ...

Автор: bolega, Отправлено:22:44 30-10-2021

daa2013

Цитата:
Я этот кусок, получается, могу и как цветной глиф перетащить.

Так я и спрашиваю, это не столько для глифа нужно, сколько просто команда Copy to clipboard with position

Автор: TelecomUral, Отправлено:02:20 31-10-2021

asku

Цитата:
А есть еще скрипты для работы с СК?

мне неизвестны

Автор: daa2013, Отправлено:05:20 31-10-2021

Copy to clipboard with position - это то что надо ! Прямо вот очень !
Но, например, клипборд может только одну копипасту запомнить, а через библиотеку можно несколько кусочков передать.

Вот сейчас подумал, что библиотеку глифов одного СК можно загрузить в другом СК, и таким образом туда выделенное отправить.
В одном СК копить, а в другом - постоянно делать reload библиотеки и пастить.

Кстати, наверное, через маску глифов можно и сами выделения передавать. Сделать как-нибудь так, чтобы маска глифа служила маской непрямоугольного выделения.

Ну, и как я в предыдущем посте писал. А постеризованные одноцветные глифы в библиотеке зачем нужны ? Мне кроме раскрашенных завитушек в колонтитулах ничего не придумывается. Так ведь они и многоцветные бывают. То бишь, если одноцветные глифы с координатами зачем-то нужны, то полноцветные и черно-белые глифы с координатами для этого же самого тоже пригодятся

Добавлено:
Кстати, видимо, баг:

Если в RV в опциях на панели Actions указано, что по двойному клику мышки изменения режимов метелки не происходит, то в библиотеке глифов галочка Paste by dbl click это самое пасте по двойному клику не включает.

Автор: TelecomUral, Отправлено:06:47 31-10-2021

daa2013

Цитата:
Так ведь они и многоцветные бывают

наверное, это удобно для старой полиграфии: расслоить полноцветный рисунок по паре-тройке главных цветов, отправить их в глифы, затем стереть всё намусоренное (остатки-ошмётки) и на белом листе восстановить красивую постеризованную картиночку из тех глифов. То есть б-ка глифов как набор карманов для копипаста.

Что-то мне сомнительна идея делать полноцветные глифы. Неаккуратно это, идеологически. С однотонным глифом понятно, добавляется номер цвета к чб-картинке. Красиво и целесообразно. А полноцвет - сомнительно. Это прям фотошоп с его слоями получается. Но там хоть панель слоёв справа, вкл/выкл, маски, всё удобно.

Автор: daa2013, Отправлено:07:28 31-10-2021


Цитата:
расслоить полноцветный рисунок по паре-тройке главных цветов, отправить их в глифы


Только в СК это не расслоить - Фотошоп нужен. А вот чтобы из фотошопа потом это пакетом собрать, тут нужна хотелка, которую я сформулировал ранее - вставлять кучу зон из указанного каталога (или кучу выбранных файлов) последовательно на страницы задания в окне MW.


Цитата:
Что-то мне сомнительна идея делать полноцветные глифы.

Так вы и сейчас можете их делать. Ничто не мешает отправить любое выделение в библиотеку глифов.
Они могут быть цветные/серые, черно-белые и, как вот неожиданно обнаружилось, даже раскрашенные.
Но вот координаты привязать можно только к последним.
ИМХО целесообразно эту возможность дать для всех глифов.
Допустим, я делаю копи. Знаю, что мне это потом потребуется, но не сейчас. Пускай полежит в библиотеке.
На практике я цветными глифами никогда не пользовался, конечно. Но вот полноцветные колонтитулы - встречал.

Уточнение №1. Возможно, "раскрашенные" тут и не совсем верно писать = изготовленные по описанной в whatsnew технологии. Там всё-таки постеризация, потом захват маски.

Уточнение №2. Как я уже отмечал, привязать координату к чёрному (псевдо-чёрному) глифу можно. Перевести в цвет, постеризовать, раскрасить черный в черный - и вуаля. (Потом покажу это в видео )



Цитата:
Это прям фотошоп с его слоями получается.

Если вы снова про технику, описанную slava_kry https://www.youtube.com/watch?v=9WEqfdBn0qA
То там еще важная штука - диффузная бинаризация.
С цветами я как-то особо не связывался, но всегда, когда мне надо было передать точками оттенки серого, я делал её в БукРесторере, а потом перетаскивал результат в СК.
Может, попробовать в СК встроить дополнительные алгоритмы этой самой бинаризации ?

Добавлено:
И раз уж про алгоритмы речь зашла.

Хорошо бы выбор алгоритма деспекла из далних опций переставить на закладку PAGE.

У меня например СК никак запомнить мой выбор Fine+Normal не может (баг ?) и я при каждом создании проекта в эти опции лезу.
А во-вторых, переключать тип деспекла все-таки время от времени на разных проектах по-любому нужно. И лезть для этого каждый раз в настройки ...

Автор: TelecomUral, Отправлено:07:50 31-10-2021


Цитата:
Только в СК это не расслоить - Фотошоп нужен.

магическим выделением же.

Автор: daa2013, Отправлено:07:53 31-10-2021

Это когда цвета не налезают друг на друга. Если налезают, то нужно цветоделение.

Автор: TelecomUral, Отправлено:08:05 31-10-2021


Цитата:
Если налезают, то нужно цветоделение.

нет, вводите новый цвет. Я же показывал это в своей старой статейке про CLA.

Автор: daa2013, Отправлено:08:25 31-10-2021

Книги разные. Для каких-то (однотонных) это, действительно, сработает.


Цитата:
Я же показывал это в своей старой статейке про CLA.

Она была опубликована ? Дайте ссылку. Я только черновые наброски в личку помню.



Цитата:
нет, вводите новый цвет.

Если третий цвет (наложение) нужно приклеить и к первому, и ко второму слою (маске), то тут раскрашенные глифы с координатами и будут полезны.

Но ИМХО если два цветных градиента наложены друг на друга, как у Славы, то тут только цветоделение:








Автор: TelecomUral, Отправлено:08:55 31-10-2021


Цитата:
Она была опубликована ? Дайте ссылку.

http://publ.lib.ru/cgi/forum/YaBB.pl?num=1156785706/183#183

Автор: bolega, Отправлено:09:15 31-10-2021

daa2013

Цитата:
Вот сейчас подумал, что библиотеку глифов одного СК можно загрузить в другом СК, и таким образом туда выделенное отправить. В одном СК копить, а в другом - постоянно делать reload библиотеки и пастить.

Можно проще. У библиотеки есть в КМ copy/paste. Они могут использоваться для переноса глифа (или выделенной группы глифов) между разными копиями СК.


Цитата:
А постеризованные одноцветные глифы в библиотеке зачем нужны ?

Я использовал для временного хранения разных цветов (слоев) малоцветки, чтобы потом накладывать их на результат. Там то и понадобилось точное восстановление позиции. Библиотеке на самом деле все равно, постеризованные там глифы, или полноцветные, или ч/б. Просто в тот момент мне нужна была команда именно для малоцветки. Сейчас СК 6.71 поддерживает: 1) хранение в библиотеке глифа вместе с его позицией; 2) сохранение в клипборде windows изображения вместе с позицией и его восстановление; 3) добавления в библиотеку изображения из п.2. Проблема в том, что п.2 реализован только как команда из меню постеризации. Хотя ничего не мешает сделать ее универсальной, т.е. добавить Copy to clipboard with position для редакторов.

Автор: Skay91, Отправлено:15:30 31-10-2021

А возможно как то для зон с одним Group index, исправить разово только один какой то параметр? К примеру изменить всем разово цвет в Pain-Text не меняя threshold, или добавить сглаживание.

Автор: TelecomUral, Отправлено:15:46 31-10-2021

Skay91
Да, можно. По ПКМ на параметре, и "Copy sub-option to group..."

Автор: Skay91, Отправлено:16:33 31-10-2021

TelecomUral
Додумался проверить только через Ctrl/Alt... Спасибо.

Автор: TelecomUral, Отправлено:19:43 31-10-2021

Skay91
Не за что.
Смотрите мои видео, я не меньше половины всяческих фишек СК, хоть чуть-чуть, но зацепил-показал. В Хрестоматии целый подраздел про групповые операции в 2.8.

Автор: TelecomUral, Отправлено:04:10 01-11-2021

bolega
Что это за меню? Тут нет ошибок?


Автор: daa2013, Отправлено:08:45 01-11-2021

Раз уж я начал снова свои хотелки по эргономике писать, то вот еще до кучи:


1. В окне RV на панели preferences2 кучу кнопочек надо включить галочками. , так как по дефолту они выключены. При этом каждый раз КМ закрывается. Я, бы конечно их все предпочел иметь сразу включенными. Но, может, если не включать их все сразу, то хотя бы КМ не закрывать. Сначала все нужные вкл /выкл, а только потом закрыть. Или вообще через опции в основном меню настройку сделать, какие кнопки там включены:



2. По аналогии с включением кнопочек на этой панели сделать отключение ластика на панели Edit. Причем хорошо бы, чтобы кнопка ластика не просто исчезала, а так, чтобы на её месте оставалась пустышка. (Тогда если ткнул не туда, то не включилось ничего.) То есть вот так:

Мотивация: при переключении метелок, если случайно задействуешь ластик, то потом и Undo делаешь, и метелки перещёлкиваешь. Как паллиативный вариант, через опции хотя бы отключить возможность одновременного включения и ластика, и метелки.

3. (Кажется, уже писал об этом). В окне MW для инструментов группы Enhance сделать так, чтобы можно сразу было видеть все закладки. Точно также, как сделано для основных закладок PAGE, BOOK и т.д. Чтобы можно было не жать на эти маленькие треугольнички в поисках нужной, а сразу до неё добираться:


Я кажется, понимаю, почему вам так кажется лучше - вы его паркуете слева и больше пространства для страницы остается. Но это на маленьком экране хорошо.

Если сложно сделать "резиновость" закладок, как у основных:


То хотя бы как вариант - растяжение этого окна. То есть подвинул рамку вправо - и увидел все закладки, чтобы по стрелкам не щелкать.
Upd: А стрелки были бы видны только при минимальной ширине этого окошка.
Upd2: ну или снова через опции выбирать, минимальная или максимальная конфигурация этого окна будет.

Автор: bolega, Отправлено:10:07 01-11-2021

TelecomUral

Цитата:
Что это за меню? Тут нет ошибок?

Я им часто пользуюсь

Автор: TelecomUral, Отправлено:11:21 01-11-2021


Цитата:
То хотя бы как вариант - растяжение этого окна.

я бы предпочёл фичу передвигать почаще нужные закладки - влево, а менее нужные - вправо.

Автор: djdtyfhu, Отправлено:21:24 04-11-2021

Столкнулся со следующей проблемой - в книге много таблиц в виде клеток тетради (для записей учениками итогов работ). Как такие части страниц обрабатывать?

Пока придумал помещать их в pictire-зоны и настройками пытаться удалить фон. Сложность в том, что клеточки не очень контрастны и есть разрывы в линиях.

Примеры страниц ниже:
[more]1.
2. [/more]

Автор: TelecomUral, Отправлено:04:15 05-11-2021


Цитата:
Как такие части страниц обрабатывать?

смотря что вы хотите получить. Хочется типографского идеала - нарисуйте линии с нуля. Можно и ext.pic.zone (во внешнем редакторе нарисовать сетку и как картинку вставить). Бумага-то тонкая, линии тусклые. Если разрыв есть, а вы хотите чтоб его не было, придётся рисовать вам.

Автор: djdtyfhu, Отправлено:05:27 05-11-2021


Цитата:
TelecomUral



Цитата:
смотря что вы хотите получить


Ну понятно, что идеала не получится, но хотелось бы как можно лучшего качества - пока делаю в picture-зонах и там фильтры подбираю, но выходит много ручной работы по очистке "проступающей" грязи.

Автор: TelecomUral, Отправлено:06:32 05-11-2021

djdtyfhu
тогда, может быть, вам стоит указать пример "достаточного качества линий БЕЗ ручной очистки". Тут ведь "либо-либо": труд по очистке или согласие на грязь Вы же не можете заменить оригинал?
[more=о труде]Общая беда задающих вопросы: вы не можете сформулировать свой критерий затрат на качество. "А вот хотелось бы получше..." - ну так нарисуйте в программе вёрстки с нуля. Надо ж задавать и вторую границу, трудоёмкость именно в ваших единицах. Вместо этого начинаются мучения/мычания "ой, что-то трудновато..." Ну дык и не делайте тогда вовсе, легко и будет. Кто кроме вас определит личную грань равенства между трудностью и качеством. Бессмысленно другим это задавать. Кто-то вообще в ФШ виртуоз, или в САПР. Ему такие сетки нагенерить и вставить - полминуты.[/more]

Кстати, а не поможет ли вам глиф в виде крестика - ? Я так никогда не пробовал, но вдруг это будет самый идеальный вариант работы. Насоздавать идеальных глифов в виде сетки различных размеров, и вставлять. Автопозиционирование есть, так что вполне может получиться.

Автор: daa2013, Отправлено:09:29 05-11-2021

Копипасту из издательского макета сделайте:

https://files.lbz.ru/pdf/978-5-9963-5757-4f.pdf

Автор: djdtyfhu, Отправлено:11:59 05-11-2021

TelecomUral
daa2013

Пошёл по пути вставки картинки во внешнюю picture-зону.
Труд благороден, а так как делаю для жены - поэтому только подойдёт идеальный вариант - да медленно, но и страниц не так много.

[more=пример [/more]

Автор: daa2013, Отправлено:13:00 05-11-2021

А я бы сохранил издательский pdf как картинки в 600 дпи.

Захватил таблицу (сетку), наложил ее поверх имеющейся, включив размер прозрачности. Если размер сопадает не очень, то масштабировал бы с альтом.
Сделал одну большую идеальную таблицу, и везде ее бы вставлял, отрезая лишнее.
В оригинале они серенькие. - Еще потом и раскрасил бы.
Рисование же таблицы в ворде кажется мне тут странным. Но на вкус и цвет ...

Автор: djdtyfhu, Отправлено:15:45 05-11-2021


Цитата:
Рисование же таблицы в ворде


Весь процесс ещё странное:
- создаётся таблица в MS Word максимально совпадающая с исходной;
- файл сохраняется в формате PDF;
- PDF в Adobe Acrobat сохраняется в JPEG;
- JPEG в FastSone Viewer обрезается как надо.

Далее созданные шаблоны с различным количеством строк уже используются для вставки на страницах.

Вот так не оптимально, но мне удобно.

А насчёт того, что исходные таблицы серые - итоговый фаул у меня B/2 и не увижу разницы.

Автор: daa2013, Отправлено:04:35 08-11-2021

хотелка

может, оно и реализовано, а я просто не знаю.

Допустим у меня красная метелка. с шифтом она будет работать как зеленая.
Зеленая с шифтом будет работать как красная. (Вроде по дефолту опций именно так.)


А можно, чтобы с альтом при любой метелке ставилось выделение, как если бы они обе были отжаты ?

Автор: daa2013, Отправлено:08:55 08-11-2021

Можно ли на панели глифов в группу команд КМ change gliphs добавить горизонтальный и вертикальный флипы. И, возможно, ротейты.

Добавлено:
Можно ли для глифов сделать что-то вроде зума/лупы.
Чтобы при мышке с чем-нибудь он крупно отобразился по центру окна.

Автор: TelecomUral, Отправлено:09:44 08-11-2021


Цитата:
И, возможно, ротейты.

поддерживаю. Как-то пришлось править буквы в вертикальной таблице обыскался красивых вариантов.

Автор: bolega, Отправлено:12:23 08-11-2021


Цитата:
А можно, чтобы с альтом при любой метелке ставилось выделение, как если бы они обе были отжаты ?

Нет, отработка alt встроена в ядро графического движка редактора, используется для выдерживания пропорционального взаимного соотношения сторон при выделении или изменении размеров (квадратное или круглое); при полигональном режиме рисует только горизонтально или вертикально.

Цитата:
Можно ли на панели глифов в группу команд КМ change gliphs добавить горизонтальный и вертикальный флипы. И, возможно, ротейты.

ОК

Автор: daa2013, Отправлено:12:32 08-11-2021


Цитата:
Как-то пришлось править буквы в вертикальной таблице

Можно было кнопкой страницу на 90 повернуть, поменять, потом повернуть взад. (если подходящие буквы, но только не повернутые, уже были в библиотеке)


Цитата:
Нет, отработка alt встроена в ядро графического движка редактора

Да, знаю про масштабирвоание, но может где-то в опциях модификаторы есть.

Я про "имеется" имел в виду наличие некой комбинации, чтобы без отжатия мтелок, а только некой клавшией (лучше одной) выделения ставить. Чтобы например для того же выделения глифа метелки не отжимать, потом зажимать. А клаву нажал и ставь выделения. Отпустил клаву, и снова работаешь метелками.
Конечно, хорошо, чтобы такая клава не в недрах клавиатуры, а на краю ее была. Или назначалась куда-нить. Или давался выбор из клавиш, которые так себя вести могут.

А таб или капслок для модификации поведения инструментов никак нельзя задействовать ?

Автор: bolega, Отправлено:13:43 08-11-2021

Если не нужен режим, отключите его и выделяйте спокойно. Чем это хуже?
Зачем обязательно клавишей блокировать режим?? Первое же отпускание мышки после этого все равно применит режим к выделенному.

Автор: daa2013, Отправлено:14:13 08-11-2021

Вот смотрите: мне нужно выделить глиф.
Лезть мышкой в кнопки метелок я не хочу.

зажал клаву
выделил с клавой
отпустил клаву
через КМ загнал глиф в библиотеку
выделение в момент команды add gliph пропадает (у меня во всяком случае сейчас так)
чищу дальше

Цель хотелки не делать два раза движения мышкой в кнопку панели (выкл и вкл обратно), а просто клаву зажать.

Я когда чищу = у меня првавя рука на мыши, а левая - кнопки на клавиатуре слева нажимает

то есть чтобы при некоей клаве (желательно в левой части клавиатуры) при зажатых метелках ставилось выделение, как если бы они обе были отжаты

UPD

даже если будет применяться режим и без этого никак, то я просто по ctrl+Z отменю это изменение


Автор: TelecomUral, Отправлено:14:24 08-11-2021

daa2013
"Toggle clear mode = despecle" - хоткей. Вкл/выкл метёлку. upd И на autoclear хоткей есть.

Автор: daa2013, Отправлено:14:35 08-11-2021

Это все равно вкл/выкл метелки = два лишних действия.
Я хочу модификатор выделения.

Автор: TelecomUral, Отправлено:14:45 08-11-2021

daa2013
угу, особенно капсом или табом Туда ещё фиг попадёшь не глядя.
Я повесил хоткей на shift-Z. Всё равно вначале думать приходится, потом уж не так затратно нажимать.

Автор: daa2013, Отправлено:05:16 09-11-2021

Еще одна идея пришла. Не знаю заранее, насколько будет полезно. (Т.е. это не хотелка.)

Если есть выделение и ставится глиф, то ищется его лучшее положение внутри этого выделения.
(возможно лучшее положение верхнего угла внутри выделения).

Так можно полностью контролировать зону поиска. Расширять/сужать.

Автор: bolega, Отправлено:21:08 12-11-2021

daa2013

Цитата:
Еще одна идея пришла. Не знаю заранее, насколько будет полезно.

У меня сейчас по другому сделано. Если выполнен ocr, то достаточно подвести курсор в любое место внутрь прямоугольника буквы (который, к слову, для удобства подсвечивается при наведении на него), и бросить глиф там, положение тогда ищется внутри этого контура. Получается очень точно и без ошибок.

Автор: daa2013, Отправлено:00:30 13-11-2021

Круто !
Но я в данном случае не из-за букв это предложил. Я вставлял график где-то на одну шестую листа страницы. Так мало того, что СК думал долго, так рисунок от правильного положения улетал далеко.
Даже кажется больше, чем на 13-23 пикселя, обсуждавшиеся ранее, так что, как эта зона поиска при вставке определяется СК, это пока загадка и черный ящик для пользователя.



Цитата:
положение тогда ищется внутри этого контура. Получается очень точно и без ошибок.


Ещё бы автоматически этот вставляемый глиф пользователю после OCR предлагать, и скорость работы ИМХО возрастет. Ну, писал уже об этом ...

Upd

Например так. Снова фантазия, пришедшая сейчас в голову.
Наводишь мышку на ячейку. Справа в рамке-окошке показывается, какой глиф предлагается на замену. (С учетом выполненного OCR и сделанных ассоциаций.) Если видишь, что он лучше, чем имеющаяся буква, кликаешь, и он вклеивается.

Добавлено:
Upd2
Кстати, тогда, как у вас сейчас сделано, если ячейка тессеракта вдруг определена неправильно (случай, о котором вы писали ранее), то указание пользователем правильной зоны поиска вставки тоже было бы полезным дополнением.

Автор: daa2013, Отправлено:08:16 17-11-2021

Баг

В окне RV не запоминается положение панели с кнопками - стрелочками, масштабированием, синхронизацией. Она всегда переползает в левое верхнее положение после открытия/закрытия окна, даже если была передвинута.

Автор: bolega, Отправлено:11:17 17-11-2021

Это не баг, так и предполагалось в свое время.
Сейчас панелей стало больше, надо бы и ее положение сохранять.

Автор: bolega, Отправлено:09:17 18-11-2021

daa2013

Цитата:
Справа в рамке-окошке показывается, какой глиф предлагается на замену.

Предполагается, что будет несколько вариантов одного и того же глифа?
Если например, в б-ке есть глиф для "а", то он и будет использоваться. Зачем его показывать, если он и так показан в панели глифов?
Сделано по другому: в подсказке просто отображается распознанная буква (как текст), этого достаточно, чтобы понять правильно выполнился для нее ocr или нет. И для нее существует только один вариант из библиотеки. Если в б-ке несколько вариантов, то выбирается либо первый, либо с текущей закладки, т.е. т.е. задача "какой лучше" не стоит. Да и задача эта сложная и неоднозначная.

Автор: daa2013, Отправлено:11:10 18-11-2021

Нет не несколько, подсказки достаточно имелась в виду подсказка.


UPDATE
Всё-таки, я подумал и не совсем так.

Мне представлялось именно визуальное сравнение двух букв - на скане и в окошке - одинаковые или нет.
При подсказке, как мне кажется, мозгу нужно делать дополнительное усилие по "считыванию" буквы.
Из-за разных шрифтов в книге и подсказке тоже будет дополнительное раздумывание.
Но вот чтобы глиф показывать в размере буквы (для целей контроля одинаковости), это же ещё настройки дпи и масштаба экрана учитывать придется. Так что, наверное, пока и подсказки достаточно, а там видно будет.



Автор: daa2013, Отправлено:20:46 18-11-2021

Еще хотел об одной задаче написать.

Ситуация: я в качестве глифа выбрал плохую О и стал ее везде шлепать. Потом понял, что О на самом деле другая, и я должен заменить одни вставки на другие.
Т.е. надо найти один пиксельный объект и заменить его на другой.

Иногда похожая задача возникает при правке плохих джву. Например, при поиске ошибок И-Н. Надо найти ч.б объект конкретной формы на всех страницах.

Когда распознаны буквы и автоматом предлагаются вставки , то проблем нет. Не заслуживает и отдельного обсуждения. Но вот если автоматом вставки не предлагаются, то задача замены одного связного ч.б объекта на другой, видимо, может решаться и какими-то другими способами.

Автор: daa2013, Отправлено:10:27 19-11-2021

И вот еще что в голову пришло.

1. Я вам несколько ранее писал о вредной опции смещения глифа за мышкой при перевставке. Я подобрал примеры, и могу даже видео записать. Это две основных ситуации. Первая: несвязные буквы типа й, ы, ё. Возле мелкой части часто бывает мусор и он чистится вместе с ней. Тогда повторная вставка возвращает эти точки и палочки на место. Но из-за этой крайне вредной опции буква при перевставке смещается в неправильное положение. Итог - много лишних действий, которых ранее не было. Вторая ситуация перевставки - вклеил букву - а она от базовой линии отъехала. Тогда вставил повторно и еще до вклейки подвинул ее контрол-стрелками. Но если буква уехала вслед за мышкой, то имеющаяся в голове комбинация движений стрелками уже оказывается неудачной. И надо по новой соображать, куда двигать. Снова трата времени.
Как уже писал, хотелка - опция в глиф-преференсах, возвращающая старое поведение СК при вставке.


2. В связи с этой второй ситуацией и моей переклейкой буквы О. Новая при автопозиционировании часто встает чуть левее неправильной. И я ее двигаю. Может, при автопредложении глифов имеет сделать модификатор +N пикселей в ту или иную сторону. Если заранее понятно, что новый идеальный глиф встает по отношению к типичному грязному с некоторым стандартным смещением.
Это я на самом деле стал думать на вашим постом о нескольких глифах одной буквы. Бывают ли они нужны. Вроде, уже писал о том что у меня бывают прозрачная и непрозрачная, толстая и тонкая версии буквы. (На разных страницах текст, бывает, гуляет). Но я думаю, что для автопредложения держать несколько версий глифа - это всё-таки избыточно. Нестандартные варианты надо руками выбирать.

UPD
нет, просто модификатора мало. У меня сейчас микс их хороших и плохих О. Но на хороших-то никуда ничего смещать не надо. То есть, снова получается, какой-то распознаватель конкретного пиксельного объекта нужен.

Автор: bearjrgm, Отправлено:11:33 19-11-2021

Как использовать ocr, файлы распознования есть, но никаких результатов на странице результатов - нет, я что-то не включаю?

Автор: daa2013, Отправлено:14:07 19-11-2021

OCR к СК прикручен для :
- управления порогом бинаризации отдельных букв,
- защиты указанных букв от деспекла
- исключением выбранных символов при подсветке спеклов

Автор: bolega, Отправлено:14:17 19-11-2021


Цитата:
1. Я вам несколько ранее писал о вредной опции смещения глифа за мышкой при перевставке.

У меня нормально работает практически всегда. Поэтому отказываться от нее не собираюсь. В основе ее такая логика: если юзер вставляет букву повторно в то же самое место (под местом имеется в виду не точка курсора, а то положение, которое СК определил в результате применения adjust), то логично предположить, что это место ошибочно, следовательно, это вторая попытка, при которой юзер более аккуратно выбрал точку вставки, и чтобы СК снова не увел глиф далеко от места вставки, он область поиска просто уменьшает вдвое. Вот и все дела. В вашем варианте получается, что вы и второй раз бросаете букву неаккуратно. Но в этом нет смысла. Либо из-за мусора в окрестности есть несколько совершенно равнозначных мест, подходящих для глифа, такое тоже может быть.
Однако опцию отключения такого поведения сделаю, хуже не будет.




Добавлено:

Цитата:
OCR к СК прикручен для управления порогом бинаризации отдельных букв и подсветкой спеклов,

Ну еще для защиты отдельных букв (или их частей) от despeckle и hole-filling

Автор: asku, Отправлено:16:43 19-11-2021

Добрый вечер. Подскажите пожалуйста. При пастеризации картинки показывает сообщение Command cannot be applied to b/w image
Что нужно поменять в настройках?


Автор: TelecomUral, Отправлено:16:46 19-11-2021

asku
фокус на правое окно перевести (мышкой на нём щелкнуть). Вы пытаетесь постеризовть чб текст основной страницы.
смотрите на зеленую рамочку, она указывает активное окно.

Автор: asku, Отправлено:11:35 20-11-2021

TelecomUral спасибо. Еще такой вопрос, если можно.
Просматриваю нефинализированные страницы, отсортировав их по ширине. Можно ли как-то клавиатурно переходить от одной страницы к другой (в отсортированном списке).
Обычный переход назад—вперед это клавиши Q и W. А как здесь можно переходить? Спасибо.



Автор: TelecomUral, Отправлено:11:51 20-11-2021

asku
стрелками же

Автор: asku, Отправлено:12:14 20-11-2021


Цитата:
стрелками же


Точно. Спасибо.

Когда желтую рамку поправляю, то фокус уже не на сортированном списке справа и стрелки уже не работают. Приходится мышкой на список нажимать, чтобы вернуть фокус.

Автор: asku, Отправлено:16:15 20-11-2021

Подскажите, пожалуйста как можно зафиксировать Масштаб изображения (Image Zoom), чтобы он от страницы к странице был одинаковый.


Автор: DmitryKz, Отправлено:16:21 20-11-2021

asku
В списке файлов — клик правой кнопкой — Special -> Zoom -> Fix current zoom.

Автор: daa2013, Отправлено:03:34 21-11-2021

bolega
Мне почему-то кажется, что автолевелы СК работают только с одним яркостным каналом, а ФШ - с тремя цветовыми.

Вот тут было некое обсуждение, но там этого момента не было:
http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=3940

Я правильно понимаю ? или это все-таки не так ?
Можно/целесообразно ли к СК прикрутить управление левелами в разбивке по каналам ? (по типу как это сделано в программе Capture One)
или вообще retinex добавить ?

UPD
Лёг спать, а в голове возникла картинка: квадратом четыре гистограммы RGB+L и на каждую по два (или три) ползуна посадить, вот уже и инструмент. Причем все эти графические элементы управления в программе уже есть.

UPD2
Попытка заснуть номер 2:
и еще кнопки/галочки авто в каждом квадранте. Так, чтобы можно было заодно видеть, как гистограммы ползут при нажатии на них.

Автор: daa2013, Отправлено:10:07 21-11-2021

bolega
А я правильно понимаю, что я не могу сейчас задать колоризацию пакетом для всех зон ?
Еще на стадии расстановки зон указать, что я их перевожу в грей, и задать оттенок раскраски.

Только после обработки в окне RV с каждой по отдельности надо возиться, колоризовать ?

Добавлено:
В связи с этой самой уникальной в каждом случае колоризацией. Так же оттенки раскраски в итоге разойдутся.

В Фотошопе есть такой инструмент как
Изображение -> Коррекция -> Подобрать цвет -> Источник

Это когда цветовая гамма одного изображения (открытого) начинает соответствовать цветовой гамме другого (источника). Может, и в СК такое можно встроить ?
Например, сделать копи цветового профиля одной зоны, а потом сделать пасте этого профиля для другой ?

Автор: shch_vg, Отправлено:17:57 21-11-2021

Может кто-нибудь напомнить, как, просматривая в RV и не выходя из этого режима, помечать сканы в главном окне?

Автор: VladoKV, Отправлено:23:08 21-11-2021

How corect line words on this picture?
Can some one explain me, or where can I see video for this?
http://images.vfl.ru/ii/1637525166/6a40abaa/36780600.jpg

Добавлено:
How corect line words on this picture?
Can some one explain me, or where can I see video for this?


Добавлено:


Автор: VadimirTT, Отправлено:23:52 21-11-2021

VladoKV
I dont now, but dont use jpg.

Автор: daa2013, Отправлено:01:42 22-11-2021

There is no option for correcting text baselines in SK.
Use BookRestorer and ScanTailor for this job.


http://www.djvu-soft.narod.ru/scan/curved_text.htm

http://djvu-converter.narod.ru/book-restorer/geometricheskaja-korrektsija-stranits.html

https://github.com/scantailor/scantailor/wiki/B.-Output-Tabs:-Dewarping

Автор: TelecomUral, Отправлено:05:33 22-11-2021

shch_vg
надо же, перерыл все "Вопросы и ответы...", так и не нашёл по "отметить" или "пометить" или "selection". А когда не надо было, постоянно эта инфа попадалась. Причём помню и кролика из шляпы, и что реализовано сообразно стилю, разумно кнопка выбрана. Потом нашёл в списке хоткеев Deselect-ы в Хрестоматии. И уже потом поэкспериментировав, и поняв что деселект именно "де"-селект, поискал и нашёл хоткей "Select file (red)". Оказалось "F2". Но в VR это "для левой панели". Я не припомню, чтобы bolega где-то объяснял всю логику в комплексе. Что такое тогда "правая панель"?

Автор: bolega, Отправлено:13:28 22-11-2021

TelecomUral

Цитата:
Что такое тогда "правая панель"?

та, что справа. Если вы не знали, есть режим two-page просмотра. Для правого файла F3

Автор: TelecomUral, Отправлено:14:01 22-11-2021

bolega
аа ну да, там же может быть другой исходник
Я знаю, но не пользуюсь.

Автор: bolega, Отправлено:14:43 22-11-2021

daa2013

Цитата:
Можно/целесообразно ли к СК прикрутить управление левелами в разбивке по каналам

Как вы уже могли заметить, фильтры в свойства зон и в прочие опции я добавляю исключительно по своему усмотрению и только по личной необходимости, и только тогда, когда понимаю, что потребность в этом не носит разовый характер.
По причине того, что не хочу тратить время на то, что не будет востребовано никем. Даже если я добавлю такую фичу, с вероятностью 99,9% вы как пользовались, так и дальше будете пользоваться привычными для вас инструментами (PH, xnview, pyton и т.п.), а фича будет висеть мертвым грузом, раздувая код и файлы данных

Автор: daa2013, Отправлено:20:02 22-11-2021


Цитата:
тратить время на то, что не будет востребовано никем


По-моему очень правильная позиция.
Хочу заметить, что я и формулирую эти предложения как идеи, а не как хотелки.


Цитата:
привычными для вас инструментами (PH, xnview, pyton и т.п.)


Только вот я в ФШ использую буквально пару инструментов: авто цвет.коррекцию и подбор цвета по исходнику. За них поэтому и высказываюсь. Т.е. у меня это не разовое, а постоянно используемое.
Ну, еще наложение слоев делаю, но это конечно уже другое. Хотя если сделать свободный морфинг для вклеиваемого (а не просто флипы и растяжки), то СК будет тут мощнее ФШ.

В КснВью я долгое время делал одну-единственную операцию: пакетом выравнивание холста. Так как долгое время и СК, и СТ выдавали мне не до пикселя точные страницы (был +/- несколько пикселей). Еще делаю для одиночных постеризованных изображений замену одного цвета другим.
В СК это можно сделать заливкой для связных областей, но тут сразу для всего изображения. Может, и новая панель это делает, до конца в этом еще не разобрался.

Если бы не обнаружил, что в СК нет пакетного HSL, а только одиночный то даже не узнал бы, для колоризации надо HSL крутить и что КснВью это делает.



Цитата:
фильтры в свойства зон


И вот перечитав прошлое обсуждение -- вычитал, что я тогда еще в зоны предлагал гистограмму встроить как инструмент контроля автолевелов и белой/черной точки. Т.е. не как фильтр или инструмент коррекции, а просто чтобы было видно, что после применения имеющихся инструментов изменилось.



А так нецелесообразно - и фиг с ним. Глифы важнее. Прямо с нетерпением жду новую версию. Надеюсь, станет панацеей для книг, где чуть ли не половину букв перенабрать надо.

PS
А может пакетный HSL в СК все же возможен, а я просто не догоняю, как ?

PS2
Вот еще такую штуку в ФШ время от времени делаю (как правило, для фото-сканов обложек на планетарнике с кривым освещением)

http://fotokto.ru/blogs/prostie-uroki-photoshop-viravnivanie-kontrasta-i-yarkosti-12688.html

Автор: bolega, Отправлено:12:39 23-11-2021

daa2013

Цитата:
Может, и новая панель это делает, до конца в этом еще не разобрался.

Делает.


Цитата:
А может пакетный HSL в СК все же возможен,

Нет. Но вы подали мне одну идею по поводу пакетного применения фильтров из окошка image adjustments


Цитата:
Надеюсь, станет панацеей для книг, где чуть ли не половину букв перенабрать надо.

Я тоже надеюсь. Учитывая, какие новые классные (не озвученные еще) фичи я уже заложил и еще планирую заложить в этот процесс.


Цитата:
Вот еще такую штуку в ФШ время от времени делаю

Алгоритмы от ФШ для меня вообще тайна за семью печатями. Да и вообще, по части алгоритмов у меня помощников никогда особо не наблюдалось. Кроме пары случаев ничего и не вспомню.
... А поэтому и я никому ничего не должен.

Автор: bolega, Отправлено:13:49 27-11-2021

daa2013
А не напомните, на какой странице вы давали идеи/предложения по использованию ocr в глифах?

Автор: daa2013, Отправлено:16:29 27-11-2021


Цитата:
А не напомните, на какой странице вы давали идеи/предложения по использованию ocr в глифах?


Автопозиционирование глифов:
http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=2420#6

Замена всех букв
http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=2900#4

Кластеризация джву-шейпов как букв:
http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=3240#16

Возможный интерфейс:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=260#18

Сопоставление djbz-словаря и массива тессерактовских ячеек по пространственным координатам + картинка с примером подсветки кривых шейпов в последнем DjvuEditor (присваивает буквам статусы match, refine, normal и расцвечивает красным, зеленым, синим).
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1220#7

Автовставка:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=280#4

Автовставка и подсветка ячеек нестандартных букв
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1660#18

Разделение шрифтов по закладкам и указание выделением зоны автовставки + опция включения и отображения тессерактовских ячеек на странице
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1680#4

Определение наличия спеклов в ячейках тессеракта (+ автоматическое перемещение по таким ячейкам) и усреднение глифов:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1120#9

Коэффициенты полноты букв:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1160#9

Подказка вставки:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1880#21
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1900#5

Ручное управление зоной автопозиционирования:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1880#19

Задача замены одного глифа на другой:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1900#6

Модификаторы смещения глифов при вставке:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1900#7

ghosty про базовую линию:
http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1720#5

TelecomUral о неуверенно распознанных буквах (тессеракт же, вроде, отдает значения уверенности в символах ...):
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1100#18

bolega как обычно упрямится:
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=260#21

Автор: bolega, Отправлено:18:09 27-11-2021

daa2013
Спасибо.
Я то уже сделал как смог (в пределах возможностей графического движка СК). Хочу свериться на предмет того, не упустил ли чего.
Речь о глифах. По поводу старой, но не угасающей идеи править шейпы djvu - это не ко мне, это пишите авторам djvutoy.

Автор: daa2013, Отправлено:18:27 27-11-2021

Ясный пень, что шейпы внутри джву поправить не удастся. Но приходят-то они из тиффов. Поэтому, если опознать плохие шейпы внутри джву, то можно поправить буквы, из которых они пришли. Для этого надо джву раскурочить, эти плохие шейпы найти. Тем более вроде сейчас он откуда-то же пишет эти матч/рефаин/нормал. Насколько я понимаю, к обычной букве бывают еще поправки - это рефаин. А если буква не попала в общий словарь, а уникальная для страницы - то она нормал. (Но это я просто догадываюсь). А потом после разборки джву можно вернуться к глифам и ячейкам тессеракта. Чтобы не все буквы менять, а только те, которые оказались плохими внутри джву. Если СК джву кодит, то может и обратный переход сделать.

Но это так - идея.

Автор: bolega, Отправлено:18:33 27-11-2021


Цитата:
Настраиваю такой размер спеклов, чтобы выделялись красным разорванные буквы, а потом ищу их, и заменяю на правильные.

Сразу скажу, что в основе сделанного: не просто информация после ocr tesseract, а ocr + набор глифов. Т.е. без задания глифов ничего не будет. Все идет в сравнении.
В этом смысле все дефекты букв сразу визуально видны, и это достигается исключительно специальным сравнением реальной буквы скана и глифа. Это конечно лучше показать, чем описывать. Но до релиза я не буду этого делать.
Возможно, мне удастся внедрить такие критерии, которые бы облегчали фильтрацию "плохих" букв. Например, как предлагаемые вами разрывы. Пока этого не сделал. Но буду над этим работать.


Добавлено:
daa2013
Вы априори отталкиваетесь от неверного посыла: шейпы в djvu не равны буквам. Это могут быть куски букв (наверно, зачастую так и есть). Поэтому определить, что такое "плохой шейп", невозможно. Уже вроде не раз про это говорили.

Автор: daa2013, Отправлено:18:51 27-11-2021

Я отталкиваюсь от того, что вот они мои щербатые буквы, подсвечены зелененьким в режиме просмотра шейпов:

https://disk.yandex.ru/i/6DKrJYNg7E5Www


а бугристые чаще синеньким:

https://disk.yandex.ru/i/iYVegw2jCclGOQ

И позволю себя процитировать:


Цитата:
Тогда видишь плохой символ в готовом джву со словарем, охватывающим все страницы. Идешь на эту букву на этой странице в СК. , а потом перемещаешься по всем тессерактовским ячейкам, который соответствуют позициям расположения соответствующего кривого шейпа.
(Ну, и руками исправляешь в глиф-редакторе те, где исходная буква действительно щербатая.


То есть, предполагалось, что в плохой шейп юзер пальцем ткнёт.
Нет, ну может, эта же задача и другими средствами решится. Я тут не настаиваю.

Автор: bolega, Отправлено:19:33 27-11-2021

daa2013
Разъясните пожалуйста.

Цитата:
Первая: несвязные буквы типа й, ы, ё. Возле мелкой части часто бывает мусор и он чистится вместе с ней. Тогда повторная вставка возвращает эти точки и палочки на место. Но из-за этой крайне вредной опции буква при перевставке смещается

тут ничего не понятно. Чистится мусор при вставке? Если это мусор, то разве это плохо, что он чистится?? Зачем его восстанавливать? Что возвращает повторная вставка? Возвращает точки на место мусора?

Автор: daa2013, Отправлено:20:15 27-11-2021


Цитата:
ничего не понятно


Обратите внимание на лишние действия (отмену действия, и смещение мышки с более аккуратным позиционированием) во втором случае:

https://disk.yandex.ru/i/3uMFce_5QqWAOw

Мышка при этом даже не отклонялась от первоначальной точки вставки. Просто у вас взяла и сузилась зона поиска.

Сужение может быть полезно, когда буква первоначально улетает, хотя в этом случае при перевставке надо просто контрол зажать.
Но когда она сразу точно встает, а потом просто перевставляется, то сужение вредно.
Чаще, чем чистка ЙЁ, перевставкой приходится базовую линию уточнять. В этом случае мышка от точки вставки вообще не уходит и это еще больше раздражает, а тут все таки после чистки мне пришлось ее в начальную позицию возвращать.

Автор: bolega, Отправлено:20:26 27-11-2021

А, вы про это. Ну теперь такой проблемы вообще не возникает )
Это как раз новая фича

Автор: daa2013, Отправлено:09:44 29-11-2021

Новая идея.
Может, в СК можно несколько настраиваемых жестов мышью встроить:

https://ru.wikipedia.org/wiki/%D0%96%D0%B5%D1%81%D1%82%D1%8B_%D0%BC%D1%8B%D1%88%D1%8C%D1%8E

Автор: bolega, Отправлено:20:51 29-11-2021

daa2013
Удалось сделать, чтобы СК мог выбирать наилучший вариант из нескольких доступных вариантов глифа. Это особенно актуально, когда на странице имеется несколько размеров шрифтов, напр., обычный текст и более мелкие сноски.

Автор: daa2013, Отправлено:08:38 05-12-2021

Подумал вот еще о чем:

1. Сейчас OCR можно вызвать лишь при обработке, а хорошо бы вызывать его и из окна RV. Часто никакие глифы использовать не планируешь, а потом понимаешь: "приплыли".

2. Чтобы использовать предложенные выше "коэффициенты полноты букв" нужен будет также инструмент, который сообщал бы число черных пикселей в выделении.

Автор: bolega, Отправлено:10:16 05-12-2021

daa2013
1. С чего вы взяли? Такая команда изначально была в КМ RV, в special. Я сейчас только добавил возможность корректировки ocr если tesseract ошибся.
2. Все уже сделано. И числа показывает, и позицию глифа, и разными цветами раскрашивает несовпадения, все наглядно. Можно фильтровать по критериям, например, по количеству разрывов буквы.
Замену на глифы можно делать двумя способами: интерактивно либо пакетно. Есть избирательность. Например, заменять только определенные буквы, либо буквы с определенной степенью повреждения (отклонения от глифа), либо буквы с разрывами, с прилипшими марашками, либо в заданной области страницы, и т.п. Кстати, и задача нахождения некоего образца буквы (т.е. 100% glyph matching) решилась сама собой.
Теперь мне понадобится пару месяцев, чтобы все это проверить на реальных книгах и добавить всякие защиты от неверных действий (это самое нудное и долгое).
Плюс нужно добавить третий способ замены, если получится: с помощью клавы, т.е. работа по типу текстового редактора.

Автор: daa2013, Отправлено:10:26 05-12-2021


Цитата:
С чего вы взяли? Такая команда изначально была в КМ RV, в special. Я сейчас только добавил возможность корректировки ocr если tesseract ошибся.


Можно поподробнее о её применении. Прежде чем предыдущую хотелку писать, я проверил:
Там есть команда OCR page, но так как я никакого OCR при обработке не делал, СК просто говорит "OCR-язык для страницы не задан". А задать -то я его и не могу, так как обработка уже выполнена, зоны расставлены и отредактированы, глифирование в процессе. То есть переобработка из MW не вариант.

UPD - вернулся в МW, задал язык без переобработки, потом в настройках изменил буквы неподсветки.
Ну да, можно. Не догадался.
Но хорошо бы в одном месте это настраивать


PS

"по количеству разрывов буквы" - т.е. по числу связных областей - не знаю. таким не пользовался. А вот по наличию спеклов определенного размера, имеющих размер, находящийся в заданных пределах, точно нужно.


PPS
Я еще кстати подумал, что если джву-кодер из миниджву прикрутить, то можно и начальный набор глифов генерировать. Ну то есть тот шейп, которым джву будет кодиться, сразу на закладку поместить, и только потом его улучшать , находя более совершенные образцы.

Автор: bolega, Отправлено:10:38 05-12-2021

daa2013
Обработка ни при чем. Задание языка не означает, что СК будет делать ocr. Но без него OCR не сделаешь.
Зайдите в Protect, выберите языки, советую сразу размножить опцию на все страницы (да и в дефолтном профиле не мешает сразу задать). Далее идете в RV и делаете там OCR. Все, обработка не нужна!! Для пакетного ocr выходных файлов можно юзать в главном меню Result > ocr output files.

Кстати, ocr при обработке и ocr для целей RV это разные независимые вещи. Первый используется только при обработке, т.к. на тот момент страница и выглядит еще по другому (она даже еще не бинаризована), и размеры имеет другие. Поэтому отдельный ocr после обработки для целей подсветки и проч. неизбежен.

Автор: daa2013, Отправлено:10:40 05-12-2021

Да, я уже добавил UPD в пост выше. Спасибо.

Автор: bolega, Отправлено:10:55 05-12-2021


Цитата:
"по количеству разрывов буквы" - т.е. по числу связных областей - не знаю. таким не пользовался. А вот по наличию спеклов определенного размера точно нужно

Если это внутри буквы, то отличить одно от другого невозможно. Например, перемычка "и" отделилась от боковых палочек, и еще возможно распалась на две-три части. Вот и получилось, что, с одной стороны, перемычка превратилась в спеклы, а с другой - в отдельные области. Именно поэтому СК делает подсчет несовпадений и областей раздельно для "внутри" глифа, и для "снаружи". И цветом другим метит

Добавлено:

Цитата:
А вот по наличию спеклов определенного размера, имеющих размер, находящийся в заданных пределах, точно нужно.

А для чего это? Хотите альтернативу despeckle что-ли?

Автор: daa2013, Отправлено:11:06 05-12-2021

Я внес исправление в предыдущий пост. Вместо "спеклов определенного размера" прошу читать "спеклов, имеющих размер, находящийся в заданных пределах".

Я правильно понимаю, что есть как бы две зоны, обсчитываемых отдельно. Первая "ячейка тессеракта" и вторая "пространство внутри буквы" ?

Я с числом связных областей не работал, не знаю. Мне кажется, это приплыло из задачи по удалению вертикальных палочек. Но я бы тут делал (и делаю это руками) в два прохода. Сначала глифы вставляю, потом ищу красные спеклы-ошметки. Но палочки бывают иногда очень крупные чуть ли не больше букв.
То есть ловить и подсвечивать не "букву с палочкой", а "букву со спеклом после вклейки образца".

Что касается спеклов внутри буквы, то можно, например, сначала удалить все спеклы из ячейки, а потом вклеивать в режиме прозрачности.

Я то просто время от времени меняю размер спеклов, которые ловлю.


UPD


Цитата:
А для чего это? Хотите альтернативу despeckle что-ли?


Просто именно так я и ловлю глазами плохие буквы. Меняю порог подсветки и ищу красные буквы.

Сначала прохожу боле маленькие, потом более большие спеклы.
Если ловлю конкретную букву, то настраиваю размер подсвечиваемого спекла под неё вплоть до пикселя.
Бывает, что для поиска плохой и нужны маленькте спеклы, а для поиска плохой Ы - большие.
Это будет непосредственная автоматизация того, что я делаю с глифами. У меня этот метод точно работает.

UPD2
да и для ручного деспекла это полезно.
Я сразу попаду в ячейку тессеракта, где есть возможный спекл.

Автор: bolega, Отправлено:11:29 05-12-2021

По поводу размеров. Сейчас я сравниваю не абсолютные значения, а %. Чтобы меньше зависеть от размера шрифта, dpi. Но это не принципиально, можно добавить и сравнение абсолютных значений частей/областей (спеклов по вашему). Надо учесть все варианты, т.к. только практика покажет, что удобнее и полезнее.


Добавлено:

Цитата:
Просто именно так я и ловлю глазами плохие буквы.

Просто сейчас, как это я сделал визуально в СК, дефекты стали более визуально видны. Возможно, ваш способ контроля в связи с этим можно упростить до одного прохода, без заморочек с контролем размеров. Надо экспериментировать. Фильтрацию я больше задумывал для того, чтобы пропускать буквы заведомо хорошего качества. Чтобы сократить количество визуальных сравнений.


Добавлено:
Фишка еще в том, что при наличии ocr СК перестал ошибаться при adjusting положения глифа, как это было раньше. Даже при наличии спеклов/марашек. Поэтому теоретически можно одним махом пакетно заменить все буквы на "красивые" глифы чтобы не мучать глаза.

Автор: daa2013, Отправлено:12:06 05-12-2021

Бывают сложные случаи. Например, в буквах и, н, п при печати пропали перемычки. Везде две вертикальных палочки - их только, опознав слово, исправить можно. Соответственно надо задать такой размер спекла, чтобы эти палочки и отображались красным.


Автор: bolega, Отправлено:12:58 05-12-2021

daa2013

Цитата:
их только, опознав слово, исправить можно

Вы опять мыслите своим прежним опытом. Если тессеракт их не распознал вообще, то и говорить нечего, функционал рассчитан только на ocr. Если распознал, но не правильно (тут выбор неправильного тоже невелик: и/н, н/п и т.п.), то все будет ок. Т.к. эта неправильность генерирует сильное расхождение и увеличение количества областей, а это СК сразу же детектирует и отображает визуально. Так что в указанном вами случае как раз таки все не так уж сложно. Придется конечно подкорректировать ocr если он не верен, но после этого СК автоматом пересчитывает параметры замены глифа.

Добавлено:
Кстати, про опознание слова. В планах есть задумка прикрутить как-нибудь проверку орфографии после тессеракта, чтобы сразу выявлять явные ляпы распознавания.

Добавлено:
Жаль только, что крове вас и меня это никому больше не интересно...

Автор: stoller, Отправлено:13:53 05-12-2021

bolega
Как минимум, мне интересно. Есть, думаю, ещё много пользователей, кто не принимает активного участия в обсуждениях, но активно пользуется программой.
Да, в программе текущей версии явно не хватает некой автоматизации. Не такой, как в тейлоре (полный автомат — нажал кнопку — на выходе приемлемый результат), а именно того, что обсуждается здесь (полностью настраиваемая автоматика с возможностью ручного изменения каких-то отдельных косяков после обработки) на протяжении последних страниц, условно с момента выхода 6.71. В Кромсаторе уже сейчас можно получить идеальный (у каждого свой идеал, конечно, я это понимаю) результат, но это достигается путём огромных временных затрат. И вот вся Ваша алгоритмика явно призвана максимально сократить эти затраты. Очень жду новую версию.

Автор: niccolo, Отправлено:15:13 05-12-2021


Цитата:
Кстати, про опознание слова. В планах есть задумка прикрутить как-нибудь проверку орфографии после тессеракта, чтобы сразу выявлять явные ляпы распознавания.


Болега - если будете прикручивать, я бы порекомендовал следующий вариант

Прогонка списка всех слов по словарям Hunspell и пользовательскому и далее просто подсветка несловарных слов с возможностью пакетной замены (учитывая то, как плохо OCR распознают несловарные слова).
Andreyefgs в теме словарей для Лингво когда-то написал программу для получения списка несловарных слов из файлов в UTF-8. Наверняка какие-то моменты смогут быть вам полезны.

Автор: TelecomUral, Отправлено:16:13 05-12-2021


Цитата:
крове вас и меня это никому больше не интересно...

Ну уж и "никому"

Вы как-то мне писали, что до разработки ocr и продвинутого алгоритма удаления марашек за многие книги не брались. И у меня такое есть. Из свежего - книги Фёдоровского по геологии, вы их на моём фтп можете увидеть. Вообще 30е годы богаты книгами, которые без вами описанной автоматики невозможно хорошо сделать за приемлемое время. Тут я со stoller солидарен на 100%. Те же путешествия, Главсевморпуть выпускал.
Когда-то очень давно, году в 2009м, я "напоролся" на книгу Капцова 1944 или 1946 года, где при уникальности материала нормальную обработку выполнить было невозможно. Я над пятью страницами с недельку посидел, и понял - не по зубам пока Кромсатору такие книжки, ждёмс. И вот уж недалече

Кстати.
Я тут опять припоминал свой поход к местным математикам насчёт смазов типографии. У вас часом нет ли в планах создания спецзоны-фильтра, который бы убирал такие смазы? Когда как-бы пятно задвоенных букв на странице, или несколько пятен. Я когда к математикам ходил, на кафедру в университет, предлагал им написать алгоритм, который бы учитывал бумагу как материальный объект и по виду смаза рассчитывал вектор движения и само пятно на бумаге. Думал, они студентов привлекут, но все схлыздили
Примитивно можно и вручную вектор трёхмерный задавать, чтобы совсем уж не умничать. Типа "отсюда и до туда, вначале сила смаза 20% в конце 80%, общее пятно такой-то формы".
В брошюрках НВЖНИТ такие пятна сплошь и рядом.

Автор: niccolo, Отправлено:16:16 05-12-2021


Цитата:
Когда-то очень давно, году в 2009м, я "напоролся" на книгу Капцова 1944 или 1946 года, где при уникальности материала нормальную обработку выполнить было невозможно. Я над пятью страницами с недельку посидел, и понял - не по зубам пока Кромсатору такие книжки, ждёмс. И вот уж недалече


С теми временными затратами, которые у вас, её можно перераспознать и переверстать 1:1 к оригиналу. Всяко пользы больше будет....

Автор: VadimirTT, Отправлено:18:16 05-12-2021


Цитата:
Жаль только, что кроме вас и меня это никому больше не интересно...

Так хрестоматия запаздывает за Вами, доки нужны.

Автор: asku, Отправлено:18:54 05-12-2021

TelecomUral а нет ли видео, показывающее то, что в последних комментариях обсуждают bolega и daa2013? А то ничего не понятно, но чувствую, что-то облегчающее создание дежавю-книги. )

Автор: TelecomUral, Отправлено:19:24 05-12-2021

asku
нет.

UPD
Речь примерно про такие рваные и искажённые буквы и марашки:
https://disk.yandex.ru/i/5XK1KRxlvTWFKQ
Присмотритесь к верхней части нижней страницы, у корешка, справа. Там разрывы в буквах "п", "а", "б", "л", "у", "х". На верхней странице идёт сгиб бумаги и буквы искажены.

Автор: daa2013, Отправлено:20:23 05-12-2021


Цитата:
Если тессеракт их не распознал вообще, то и говорить нечего, функционал рассчитан только на ocr.


А если это красный спекл, но ему не сопоставлена ячейка тессеракта, то СК может как-нибудь свою "типа ячейку" сгенерировать и мне в центр экрана её (спекл) подсунуть ? Или он попадёт в чужую ячейку ?

Я просто не видел, как располагаются ячейки. Поэтому, кстати, и просил опцию отображения их сетки. Что там ? пустая зона ? гигантская ячейка ? прицеп к соседней ячейке ? Можно же тогда какой-то режим придумать "спеклы не в ячейках" или "необычные ячейки" ?

Автор: bolega, Отправлено:00:30 06-12-2021


Цитата:
Я просто не видел, как располагаются ячейки. Поэтому, кстати, и просил опцию отображения их сетки

Сетка не отображается. Она абсолютно бессмысленна. На странице много сотен букв. От сетки кроме ряби в глазах ничего не будет. Да и отрисовка будет жутко тормозить.
Ячейки подсвечиваются рамкой только когда курсор мышки в них попадает. А preview с раскраской вообще в отдельном окошке отображается. Там свои элементы управления навигацией. Это позволяет быстро пробегать по всем буквам и включать/отключать ненужное. Естественно, оба элемента синхронизируются между собой.


Цитата:
А если это красный спекл, но ему не сопоставлена ячейка тессеракта

Мне пока такое не встречалось. Тессеракт хорошо работает. Говоря выше "не распознал", я говорил гипотетически. Но в принципе все может быть наверное. Нужно больше времени чтобы все это проверить.


Автор: daa2013, Отправлено:06:39 06-12-2021


Цитата:
Это позволяет быстро пробегать по всем буквам и включать/отключать ненужное.

Но я надеюсь, что это не юзер мышкой по экрану елозит, а СК букву за буквой (из выявленных "плохих") ему на центр экрана подсовывает ? И ячейка "активной" буквы как раз и отрисовывается ?



Цитата:
Мне пока такое не встречалось. Тессеракт хорошо работает. Говоря выше "не распознал", я говорил гипотетически. Но в принципе все может быть наверное.


Мне спросонок пришла в голову такая картинка. Может, и бред с учётом непоказа сетки.
Если обычные тесерактовские ячейки квадратные, то для спеклов за их пределами можно сделать круглые. Будут такие "СК-ячейки". Рассчитать обхватывающую спекл окружность и дать ее тонким пунктирчиком, а затем отступить от центра условные полсантиметра и дать вторую пунктирчиком пожирнее. Я-то думал, что они будут хорошо заметны на фоне квадратных ячеек. Но можно и их в особом режиме контроля подсовывать на центр экрана. (UPD речь идет о "красных" спеклах, естественно, т.е. имеющих заданные пользователем пределы размеров).

Автор: bearjrgm, Отправлено:08:32 06-12-2021


Цитата:
Жаль только, что крове вас и меня это никому больше не интересно...

1- Я так понимаю сейчас при добавлении букв в словарь СК пытается их защитить при обработке и все?
2 - Интересно для меня было бы для букв "и", "н" в квадратике из-за плохой полиграфии, и какой-нибудь способ автоматической их замены.
3 - И есть ли способ ускорить отображение исходных сканов, при 600 дпи цвета подтормаживает прилично.



Автор: bolega, Отправлено:08:42 06-12-2021


Цитата:
Но я надеюсь, что это не юзер мышкой по экрану елозит, а СК букву за буквой (из выявленных "плохих") ему на центр экрана подсовывает ?

Вам ехать надо или шашечки?
Я же сказал, что вся основная работа в отдельном окошке. Чтобы глаз тысячу раз не бегал по экрану, а работал с небольшой областью, где все и отображается. По типу лупы, что есть сейчас. Только неподвижной (кстати, и лупу теперь можно сделать неподвижной). СК при этом и на экране конечно букву подсвечивает, и если ее не видно, проскроллирует так чтобы она стала видна. Но не в центр, а чтобы просто видна. Иначе на сотню букв будет сотня скроллов. Вы вообще понимаете, что такое мельтешение будет негативно оказывать влияние на глаза. Но на экране выделение это не главное, просто для удобства, для ориентировки. В обратную сторону тоже синхронизирует. Т.е. щелчок на букве на экране находит и отображает ее замену глифом в окошке.
Есть и специальный режим, интерактивной замены. Это когда вы в окошке со всеми заменами разобрались, теперь можете применять их пакетно, либо просто щелкая на экране на букве. При каждом щелчке будет производиться ее замена. Кстати, если включен режим замены, и включена лупа, то и в ней будет показываться preview замены.


Цитата:
речь идет о "красных" спеклах

Я так и не понял, что это за красные спеклы. Тессеракт все символы распознает. Кроме реальных мусоринок. Давайте вернемся к этому вопросу когда вы в деле опробуете и тогда может покажете мне что имеется в виду.


Добавлено:

Цитата:
способ автоматической их замены

Про это и речь.


Цитата:
И есть ли способ ускорить отображение исходных сканов

отключить фильтрацию Image > Special > No zoom filter

Автор: daa2013, Отправлено:19:57 06-12-2021


Цитата:
Вам ехать надо или шашечки?

И ехать, и шашечки, да и сирена с мигалкой тоже не помешают.


Цитата:
. Давайте вернемся к этому вопросу когда вы в деле опробуете и тогда может покажете мне что имеется в виду.

Да, конечно. Потому что сейчас все мои затеи, они по определению мимо.
Но если мои посты вам какие-то идеи для работы подбрасывают, то уже толк.
Например, помимо % считать дельты в числе пикселей - ИМХО очень важно.


Цитата:
Я так и не понял, что это за красные спеклы.

Я хочу вот в такую ячейку при заданном критерии поиска "буква+спекл" попадать с любого места проекта.





Цитата:
вся основная работа в отдельном окошке. Чтобы глаз тысячу раз не бегал по экрану, а работал с небольшой областью


Я это приблизительно понимаю.
Но вот, допустим, я на 5-й странице, а щербатая буква на 40-й. У меня есть ее точный образец (выдран из джву). Я могу сказать СК: найди мне такую букву. И он меня переместит на это страницу и букву в окошке покажет ? Или нет ? Я должен сам руками перемещаться, скроллить и следить, что там справа в окошке, подсвечивается или пока не подсвечивается ?

Автор: bolega, Отправлено:23:04 06-12-2021


Цитата:
Я хочу вот в такую ячейку при заданном критерии поиска "буква+спекл" попадать с любого места проекта

Сейчас критерии позволят отобрать в окошко и букву "а", и букву "и", причем именно по критерию "две области". И не забывайте, что функционал предназначен не просто для поиска букв, а именно для сопоставления букв на скане и вашей б-ки глифов.
Т.е. в б-ку глифов вы должны поместить "а" и "и".

Если хотите, дайте свое out-задание из нескольких файлов вместе с глифами, я может сделаю вам скриншот.



Добавлено:

Цитата:
Я могу сказать СК: найди мне такую букву. И он меня переместит на это страницу и букву в окошке покажет ?

Ну пока у меня matching в пределах одной страницы. Теоретически, если сделать все страницы, то потом можно добавить уже и межстраничный поиск.


Добавлено:
niccolo

Цитата:
Прогонка списка всех слов по словарям Hunspell

Спасибо за наводку. Hunspell прикрутил. Осталось придумать ему применение

Автор: niccolo, Отправлено:07:41 07-12-2021


Цитата:
Спасибо за наводку. Hunspell прикрутил. Осталось придумать ему применение


bolega
С проверкой орфографии после OCR самой большой проблемой являются несловарные слова. Для Hunspell вдобавок, отсутствие интерфейса их добавления в словарь с нужными суффиксами, и надёжного алгоритма определения начальной формы....

По суффиксам проще — начальная форма выворачивается и сравнивается с вывернутыми словами из словаря на максимально длинное совпадение - обычно суффикс в словаре и будет верным...
А вот с получением начальной формы - тут стоит подумать...

Автор: daa2013, Отправлено:18:09 07-12-2021

Я понимаю первопричины проблем в книжке, с которой уже год как вожусь.
Поскольку в конце у неё указано: "Отпечатано с фотополимерных форм Целлофот".
Но вот только сейчас я эти "фотополимерные формы целлофот" погуглил.

И что я вижу по первой же ссылке ?
http://www.rusnauka.com/PRNIT_2006/Pravo/16001.doc.htm




Цитата:


В оттисках печатей (штампов), изготовленных из ФПЖК, можно обнаружить следующие признаки:

1) неодинаковая ширина элемента знака;

2) неровные края штрихов;

3) неодинаковая длина параллельных элементов в одной букве;

4) спрямление дугообразных элементов;

5) иногда неодинаковое расстояние между буквами;

6) искривление линии строки;

7) штемпельная краска концентрируется примерно в середине штриха, по краям штрих окрашен слабо, выделяются отдельные окрашенные участки;

8) обозначены края штрихов (краска по краям в достаточном количестве), но по всей площади штрихов - множество сгустков, наличие вкраплений;

9) в штрихах видны отдельные точки с неокрашенными вокруг них кольцами;

10) в штрихах видны неокрашенные участки круглой формы;

11) посторонние (дополнительные) небольшого размера штрихи, примыкающие к штрихам букв, цифр, линиям рамок и другим элементам оттисков. Так отображаются прилипшие к печатающим элементам частицы полимера;

12) отсутствие отдельных частей элементов букв и цифр в результате разрушения печатей;

13) наличие так называемых «марашек», образующихся при засоренности печатей волокнами бумаги и другими частицами. В связи с тем что в процессе эксплуатации эти частицы могут перемещаться на печати (штампе), одни и те же «марашки» в различное время обнаруживаются на разных участках оттиска.



Изобретатели хреновы.

Автор: daa2013, Отправлено:00:05 08-12-2021


Цитата:
Осталось придумать ему применение


Может, оно вот для такого пригодится:

Я время от времени встречаю книги, где не пропечатаны буквы слева или справа. Справа также часто теряются знаки переноса. Может быть при помощи словаря такое можно ловить. Особенно если в сочетании с контролем левой/правой границы текстового блока.

Автор: TelecomUral, Отправлено:15:06 09-12-2021


Цитата:
Изобретатели хреновы

так это вроде для криминалистов сведения.

Автор: daa2013, Отправлено:19:19 09-12-2021

описание ошибок соответствует

Автор: TelecomUral, Отправлено:10:49 11-12-2021

bolega
Слияние перемычек вашими новыми функциями СК тоже можно будет править? Типа такого:


Автор: bolega, Отправлено:13:31 11-12-2021

TelecomUral
Вы хотите только перемычки править или всю букву?

Автор: TelecomUral, Отправлено:13:55 11-12-2021

там вместо "п" квадрат с четырьмя хвостиками. Хотелось бы заменить. Но это ж не "буква" для тессеракта. Подкидываю вам "сложные случаи" для улучшения алгоритмов.

Автор: shch_vg, Отправлено:21:08 11-12-2021

TelecomUral
А чем н отличается от п, кроме палочки поперек?

Автор: bolega, Отправлено:16:52 12-12-2021

TelecomUral

Цитата:
там вместо "п" квадрат с четырьмя хвостиками

Попробовал несколько страниц. За исключением формул, тессеракт ни разу не ошибся

Автор: TelecomUral, Отправлено:17:48 12-12-2021

круто...

Автор: bolega, Отправлено:21:17 12-12-2021

И я спросил про перемычку, потому что СК после подбора глифа может заменить не всю букву, а только заданную часть, например, разлепить только слипшиеся нижние серифы для "п" или нижние и верхние слипшихся серифы для "и". И дело тут не в алгоритме, а просто в специально подготовленном глифе.

Автор: asku, Отправлено:21:41 12-12-2021

bolega
А вот такое черточки между букв как можно исправлять? Только вручную?




Автор: bolega, Отправлено:22:09 12-12-2021

asku
Можно, не вручную

Автор: asku, Отправлено:22:25 12-12-2021


Цитата:
Можно, не вручную


Кааак???

Автор: daa2013, Отправлено:06:23 13-12-2021


Цитата:
Кааак???

Интрига !



Цитата:
Можно, не вручную


А как ловить букву/лигатуру "ae" ? Тессеракт, скорее всего, будет видеть там "а" и "е".

Мне только такая мысль приходит - выполнить джву-кодинг до тессеракта и потом изолировать соответствующие ячейки.

Или вот: искать по паре ячеек. Везде, где буквы a+e идут последовательно, такие пары в отдельном режиме подсунуть под нос пользователю. И разрешить ставить свой глиф. То есть не только комбинация "буква = глиф", но и комбинации "две буквы=глиф", а зоной поиска считать объединение двух ячеек.

UPD Но просто может быть такой символ или лигаутура, который на две буквы не распадается, а просто не распознается. Так что перспективы в прикручивании джву-кодера ИМХО тут есть.

Автор: bolega, Отправлено:08:12 13-12-2021

А что это за язык? Может тессеракт его поддерживает?


Цитата:
Кааак???

В новой версии, которая еще пока не готова.


Автор: TelecomUral, Отправлено:08:19 13-12-2021


Цитата:
И дело тут не в алгоритме, а просто в специально подготовленном глифе.

часть глифа прозрачная?

Автор: bolega, Отправлено:08:24 13-12-2021


Цитата:
часть глифа прозрачная?

да. При подгонке глифа прозрачность не учитывается, а при замене - да

Добавлено:
Тут просили лупу для глифов. Я сделал по другому. Если включить специальную опцию, то в нижней части панели глифов появится мини-редактор глифа, где он будет гораздо больше чем в ленте, и его можно будет зумить и редактировать, правда, набор команд редактора сильно урезан по сравнению с основными панелями. Там же задаются и другие х-ки глифа, например, символ буквы.

Автор: daa2013, Отправлено:08:46 13-12-2021


Цитата:
и его можно будет зумить и редактировать, правда, набор команд редактора сильно урезан по сравнению с основными панелями.

Я обычно глиф в тексте дорабатываю. Пасте на поля, дообработка, вставка в библиотеку, удаление.

В таком окне с опциями редактирования ИМХО есть смысл, если оно даст такие возможности, которых в обычном большом окне нет, да и в маленьких ячейках тоже нет. (Есть прозрачность и будут флипы, вроде.)

Типа частичной прозрачности для половины буквы, как вы описали выше. Буква есть, но часть ее не вклеивается, насколько я понял.


Цитата:
Если включить специальную опцию

Базовую линию для глифа там нельзя задать /присвоить ?
или высоту букв сравнить ?

Вообще разные буквы в этом окне сравнивать, чтобы там просветы, равенство/неравенство засечек, толщины штрихов выявить. Какие-то параметры кернинга - минимальные расстояния до соседок, возможно.

Автор: TelecomUral, Отправлено:09:37 13-12-2021


Цитата:
Базовую линию для глифа там нельзя задать /присвоить ?

а зачем??...

Не, мне конечно хотелось частенько "выровнять" скачущие буквы внутри слова на обработанной странице. Но как вы собираетесь привязывать базовую линию глифа к странице - ?? Это какой-то полный изврат выходит, типа как век назад в типографии строки составляли по опорной линии.

Автор: bolega, Отправлено:09:53 13-12-2021


Цитата:
Какие-то параметры кернинга - минимальные расстояния до соседок, возможно.


https://frazy.su/26994-i-tut-ostapa-poneslo/


Добавлено:

Цитата:
Я обычно глиф в тексте дорабатываю. Пасте на поля, дообработка, вставка в библиотеку, удаление.

Лично меня это сильно утомляет. Поэтому сделал редактор

Автор: daa2013, Отправлено:09:58 13-12-2021


Цитата:
как вы собираетесь привязывать базовую линию глифа к странице

Если у каждого глифа есть заданная базовая линия, то для строки (горизонтального ряда ячеек тессеракта) можно высчитать по ним среднюю, а потом те, которые очень сильно от средней отклонились, принудительно сместить.

UPD - парметры кернинга - это соответственно смещения влево-вправо внутри ячейки, если четко видно, что буква внутри неё не выровнена относительно соседей. (и находится внутри слова при этом).
UPD2 Можно не автоматом а по клику

Я что ли славарь предложил встроить ? Его же нужно как-то к делу прислонить.

Автор: TelecomUral, Отправлено:10:04 13-12-2021


Цитата:
Если у каждого глифа есть заданная базовая линия

только не у глифа, а у каждой буквы на странице. Обратная последовательность, "изврат". По книге составляем полный словарь букв в библиотеке глифов, указываем для каждого глифа базовую линию, считаем где на странице строка, где каждый глиф, ну и так далее. А не проще ли файнридер готовый взять.

Автор: bolega, Отправлено:10:09 13-12-2021

Кстати, если вы любите дорабатывать глифы в основном редакторе, то там и флип можно быстро делать. Он поддерживается для любого вставленного фрагмента, через его КМ, до момента слияния. Т.е. кинули глиф, в КМ вызвали флип, слили, вставили снова в библиотеку. Пара секунд. Но именно эта операция вам вдруг в тягость стала. Редактировать глиф с переносом не в тягость, а это в тягость. Не поймешь вас.

Автор: daa2013, Отправлено:10:10 13-12-2021

Присвоили каждому глифу такую полоску:


вставили глифы на страницу. Получили для строки набор высот полосок.
Определили среднюю, сильно отклонившиеся глифы сместили.




Автор: TelecomUral, Отправлено:10:12 13-12-2021


Цитата:
вставили глифы на страницу

файнридер. или ворд.

UPD
То есть, вы понимаете, куда тянете? - Вы стремитесь к перенабору книги. Следующий шаг после выравнивания строки будет "а чего это буковки некрасивые, давайте их нарисуем с нуля, мы же их всё равно уже опознали".

Вот кабы сами буквы можно было подравнивать по щелчку, это может и неплохо бы было. На тех же книгах 30х-50х годов иногда попадается этакий "рассыпанный набор", буковки пляшут на полстроки вверх и вниз. Подвинуть бы их, но БЕЗ искажения.

Автор: daa2013, Отправлено:10:13 13-12-2021


Цитата:
то там и флип можно быстро делать. Он поддерживается для любого вставленного фрагмента, через его КМ, до момента слияния. Т.е. кинули глиф, в КМ вызвали флип, слили, вставили снова в библиотеку. Пара секунд. Но именно эта операция вам вдруг в тягость стала. Редактировать глиф с переносом не в тягость, а это в тягость. Не поймешь вас.


Да я так и делаю. Но флип внутри ячейки - это минус четыре-шесть действий, так как еще приходится включать/выключать однопиксельный контур.
К тому же, если флипится не буква, а колонтитул или часть рамки, то места на полях может не хватить и приходится заморачиваться с клонированием страницы или перетаскиванием в другой СК.

Автор: bolega, Отправлено:10:15 13-12-2021


Цитата:
Определили среднюю, сильно отклонившиеся глифы сместили.

Мне встречались djvu, в которых буквы в строках ужасно плясали. Не знаю причину этого. Вот для такого случая возможно пригодится.

Автор: TelecomUral, Отправлено:10:21 13-12-2021


Цитата:
Вот для такого случая возможно пригодится

ну вот, и я параллельно выше об этом написал.

Кажется это из файнридера старого такие чудеса выползали.

Автор: daa2013, Отправлено:11:20 13-12-2021


Цитата:
так как еще приходится включать/выключать однопиксельный контур.


Кстати подумал, что в КМ команд изменения глифа помимо флипов можно добавить автообрезку и добавление однопиксельного контура.

А то иногда это требуется и начинается:
-вставил на поля
-переключил режим
-захватил по новой
- переключил режим обратно
- удалил глиф с полей.



Автор: bolega, Отправлено:12:16 13-12-2021


Цитата:
можно добавить автообрезку и добавление однопиксельного контура

Сейчас это делается автоматически в мини-редакторе перед сохранением измененного глифа. Я называю это нормализацией. Т.к. именно белая окантовка создает оптимальный глиф. При его вклеивании, все ненужное отделяется от буквы (изолируется), что создает широкие возможности по дальнейшему удалению остатков, в том числе автоматическому. Глиф без белой прослойки оставляет грязь какая была, то же самое происходит и тогда, когда вклеивание идет с прозрачностью (daa2013 описывал выше как один из своих любимых методов)

Автор: asku, Отправлено:15:22 13-12-2021


Цитата:
А что это за язык? Может тессеракт его поддерживает?


Это осетинский язык. А что такое тессеракт я даже не знаю.

Автор: daa2013, Отправлено:19:23 13-12-2021


Цитата:
Я называю это нормализацией.

Я неудачно/двусмысленно сформулировал выше. Помимо того, что происходит в спецокне, я хочу ДВЕ отдельные команды в КМ:
- обрезка белых полей до черного контента
- наращение на однопиксельную белую окантовку.

Надо ли иметь возможность делать однопиксельную окантовку много раз - вопрос дискуссионный. С одной стороны, многократное повторение может дать поля в N белых пикселей. И в комбинации с обрезкой - будет гибче. С другой - если где-то поля есть, а где-то нет, то там где белое есть, не наращивать, оно будет проще. Не надо будет боятся повтора команды. Но меня и так и так устроит.

Зачем это мне надо ? Как справедливо отмечено, у меня основной режим - это когда и обрезка есть, и поля в пиксель наращиваются. Но когда я буквы редактирую, то мне бывают нужны ножки, крышки, засечки и т.д. + их флипы. Тогда и начинается бодяга по отключению/включению режимов, описанная выше.
Действительно, парой постов выше непонятно, зачем мне окантовку при флипе отключать ? Затем что я там вставляю только часть буквы !
А потом я включаю окантовку обратно. Иногда забываю. А иногда, вроде, как кликнул, а оно не включилось, и я не заметил. И пошла по книге тянуться буква, у которой с одной стороны нет окантовки и она цепляет мусор.

ВЫВОД: включение команд обрезки и окантовки в КМ сэкономит мне 5-6 действий и уменьшит ошибки. Это хотелка.



Цитата:
и тут Остапа понесло

Я писал выше, что я подумаю, если еть ячейка и контур буквы, как это юзать.
Это на самом деле и был возможный ответ.
Если у тессеракта ячейки ставятся равномерно (ключевое слово "если", возможность отображения этих ячеек сняла бы многие вопросы и, наверняка, породила бы новые идеи...), то заметные диспропорции правых и левых полей пространства между границами ячейки и контуром буквы сигнализировали бы о нарушении кернинга и вполне заслуживали бы подсветки , или демонстрации таких ячеек юзеру.

Кроме того я осознал, что мне напоминает минимальное пространство кернинга - это гапы для зон контента в СК. Как контент + гапы катаются внутри границ страницы, так контур буквы +минимальный кернинг могут кататься внутри ячейки тессеракта.

Это пока только идея.

Автор: niccolo, Отправлено:13:02 15-12-2021

bolega - по дискуссии о зонах в шломане на publ.lib - какие-нибудь решения планируются или нет, или может бетка какая уже есть?

Автор: bolega, Отправлено:15:04 16-12-2021

daa2013

Цитата:
"по количеству разрывов буквы" - т.е. по числу связных областей - не знаю. таким не пользовался. А вот по наличию спеклов определенного размера, имеющих размер, находящийся в заданных пределах, точно нужно.

Я не знаю, как мне прикрутить этот критерий к ocr. СК ищет совпадение буквы с глифом. Как и зачем ему контролировать спеклы (внутри глифа? или внутри буквы?)
мне не понятно.
Если вы хотите чистить спеклы заданного размера, то подсветите их, для этого в СК уже есть функционал подсветки. Зачем сюда примешивать ocr, не ясно. Т.е. я не вижу связи между буквами и спеклами.

Автор: daa2013, Отправлено:15:32 16-12-2021


Цитата:
как мне прикрутить этот критерий к ocr.

Я же уже писал, как. Подсвечивать ячейку или перемещаться на ячейку, если в ней есть спекл (связная область) размером N, где n1 < N < n2.
При этом желательно комбинирование этого критерия с другими. То есть, например, не любая ячейка, а ячейка с буквой "Н" и указанным спеклом.


Цитата:
Как и зачем ему контролировать спеклы (внутри глифа? или внутри буквы?)

внутри ячейки тессеракта


Цитата:
я не вижу связи между буквами и спеклами.

По-моему у меня это в Перле было. Но в любом случае пример сейчас не найду - поправлено все.
С точными значениями цифр тоже могу соврать. Но принцип был именно такой.
Хочу поймать разорванные напополам Н. Ставлю 37 - вообще все буквы красные. Ставлю 35 - все буквы серые, подсвечиваются только знаки препинания и кое-какая грязь. Ставлю 36 - как раз начинают подсвечиваться эти самые половинки. То есть именно до пикселя точность была нужна !
Кстати, так как у вас алгоритм подсветки немного хитрее, чем просто "спекл в N пикселей", то возможно именно этот алгоритм и сюда надо пристроить.



Цитата:
функционал подсветки. Зачем сюда примешивать ocr,

Затем, что интересную подсвеченную мне букву (в данный момент - подсвеченную частично), надо ещё глазами найти, это время. Потом притащить к ней глиф из библиотеки.
Здесь же она автоматом попадет на центр на глаза, да и глиф будет предложен.


Да, я понимаю. Вы исходите из того, что всё плохое поймаете по "количеству разрывов буквы".
Но так как я таким не пользовался, то в работоспособности этого критерия я не уверен, а в работоспособности размера спеклов - уверен. Только так и работаю. Не уверен, что при задании процентов удастся получить эту самую пиксельную точность, с которой я неожиданно столкнулся. (Обычно +5 пикселей шаг делал.)
К тому вы же сами писали, "неизвестно что пригодится".
Готов допустить, что на практике будут ошибки в буквах, для ловли которых потребуются комбинации критериев.

Автор: bolega, Отправлено:16:37 16-12-2021

daa2013

Цитата:
Хочу поймать разорванные напополам Н.

Известно, что Н состоит из одной части. Если частей >1, значит вот вам разорванная.
Ладно, пусть внутри мелкие спеклы. Они действительно могут ввести в заблуждение алгоритм, т.е. частей несколько, а буква все-таки не разорвана. Тогда согласен, можно не считать частью буквы те спеклы, которые меньше заданного размера. Но ограничивать размер еще и сверху это излишне.
Т.е. я согласен контролировать только нижнюю границу спекла, но не максимальную.

Автор: daa2013, Отправлено:17:06 16-12-2021

1.
Тогда это будет работать только в сочетании с заданием конкретной буквы и задействованием других критериев.

При подсветке вы контролируете именно максимальную границу !
И если задать только минимальную для группы букв, то подсветятся все нормальные буквы.


Вот как у меня, например, как другая книга выглядит (обратите внимание на Ы):

не буду перечислять подлежащие замене буквы.


2.
А просто со спеклами как вы будете бороться ? Допустим буква хорошая, но спекл мешается.
Автоматом удалять ? Глазами по всей странице искать ?
А так ячейка со спеклом будет продемонстрирована пользователю.
(глиф в этом случае вставляться не будет, руками метелкой почистится.)


3. Почему не дать лишнюю гибкость и возможность ?
Наверняка, обнаружится сценарий, где это будет полезно, тем более что сейчас так и работает (по максимальной границе).


У вас удаление вертикальных черточек сейчас полностью автоматическое или все-таки под контролем юзера ?

Автор: bolega, Отправлено:18:24 16-12-2021


Цитата:
не буду перечислять подлежащие замене буквы

нет уж, перечислите. Иначе я не пойму чего вы хотите от алгоритма

Автор: daa2013, Отправлено:18:45 16-12-2021

Соответственно, те буквы, в которых видны красные элементы:
чсь
учу
ызч
ч



Добавлено:
Другой пример:




Там где П не уверен, что она не будет опознана как Г. Там и ножка, и спекл есть.

Автор: bolega, Отправлено:19:23 16-12-2021


Цитата:
Соответственно, те буквы, в которых видны красные элементы:

ну так они все и так автоматом отберутся, т.к. в каждой из них есть разрыв. Т.е. никаких дополнительных критериев для их отбора не потребуется.
Для второй картинки отберутся щ,р и возможно н. Можно и ю, если другой критерий задействовать.

Автор: daa2013, Отправлено:19:48 16-12-2021

Вы мне так и не ответили, меняется тут автоматом или подсовывается под нос пользователю, и он каждую замену кликом "одобряет" .

Если все-таки подсовывается, то буду продолжать настаивать на необходимости контроля за спеклами по размеру.

Автор: asku, Отправлено:19:51 16-12-2021

bolega
А когда планируется выпустить новую версию СК?

Автор: bolega, Отправлено:20:20 16-12-2021


Цитата:
Вы мне так и не ответили, меняется тут автоматом или подсовывается под нос пользователю, и он каждую замену кликом "одобряет" .

Я же писал, замена в двух режимах: щелчком по букве (но ничего не подсовывается) или скопом. В любом варианте предварительно все замены демонстрируются в отдельном окошке, в котором список замен можно отсеивать, фильтром или вручную (галку убрать напротив замены).

Цитата:
удаление вертикальных черточек сейчас полностью автоматическое или все-таки под контролем юзера

В СК нет ничего полностью автоматического, неужели вы до сих пор этого не поняли.

Цитата:
А когда планируется выпустить новую версию СК?

СК это хобби, ни планов, ни графиков у меня нет. Как получится, так получится.



Автор: asku, Отправлено:21:09 16-12-2021


Цитата:
СК это хобби, ни планов, ни графиков у меня нет. Как получится, так получится.


Понял! Очень хочется научиться исправлять буквы (тессеракт и т.п.).

Автор: daa2013, Отправлено:04:40 17-12-2021

Давайте вспомним Долгополова.
Спекл прижался к букве и затерялся на 3000 страниц.

Был бы поиск по ячейкам со спеклами - нашелся бы вмиг.


Автор: TelecomUral, Отправлено:06:36 17-12-2021

daa2013

Цитата:
Спекл прижался к букве и затерялся на 3000 страниц.

Пробую осмыслить всё написанное за последние дни в комплексе. Плохо получается.
Откуда вообще возникает ситуация "поискать нечто мелкое в огромной куче"? Ведь из-за того, что в результирующем djvu вы увидели размноженную некрасивую букву, так? То есть в СК это не надо для его функционала?
Я вот поглядел на ваши примеры скриншотов - окромя изувеченной "п" лично я бы ни одного исправления делать не стал. Всё читаемо. Нафиг эти разрывчики у "з" и "у" исправлять, глаз их не отметит и не споткнётся.

Автор: daa2013, Отправлено:09:55 17-12-2021


Цитата:
лично я бы ни одного исправления делать не стал

Все замены проводятся под контролем пользователя.
Если не хотите заменять, то и не заменяйте.

Автор: TelecomUral, Отправлено:10:13 17-12-2021

daa2013
да я к тому, что выделено излишне много.

Автор: daa2013, Отправлено:12:34 17-12-2021

Большее число критериев отбора с возможностями комбинирования увеличит гибкость в формировании выделений.

Автор: TelecomUral, Отправлено:06:26 20-12-2021

bolega
Почему в режиме Compare на панельке ребинаризации около метода ("Auto", галка "The same" снята) порог то показывается, то не показывается? Обратил внимание на "мигание" в этом месте, быстро листая совершенно однотипно обработанные странички.

Автор: bolega, Отправлено:09:53 20-12-2021

TelecomUral
Не воспроизводится. Метод какой, custom или auto?

Автор: TelecomUral, Отправлено:10:21 20-12-2021

bolega
Метод Auto.
Видео https://disk.yandex.ru/i/qpTHW0XQSeQ2zQ
Логика моей работы:
Расставил метод "Auto", запустил процесс, потом в VR выбрал Compare. Пошёл листать от первой страницы, кнопкой "W", и глядеть жирность и габариты. Где-то к 70й странице понял, что мне надо выставить градиент, вверху жирнее и мелкие буквы снизу часто полупропадают. Открыл панельку ребинаризации, разместил её поудобнее в центре на чистом поле. Ну и почти сразу заметил мелькание циферок порога.
На видео видно, что я уже начал мотать обратно к первой странице, и в конце видео цифры порога появляются всегда. Вполне вероятно это потому, что я сделал там ребинаризацию.

Автор: bolega, Отправлено:12:11 21-12-2021

TelecomUral
Это баг. Если обработка идет в несколько потоков, то потоки не передавали в основной вычисленные значения порога.

Автор: shttd, Отправлено:13:45 24-12-2021

Подскажите пожалуйста при просмотре результата есть ли шорткат для действия "Finalize current page"?

Автор: TelecomUral, Отправлено:14:42 24-12-2021

shttd
я не проверял на практике, а в списке хоткеев есть: Finalize page. По умолчанию клавиши не назначены.

Автор: shttd, Отправлено:15:01 24-12-2021


Цитата:
в списке хоткеев есть: Finalize page

Спасибо большое, не заметил что радиокнопка переключает на другой список хоткеев, искал в "Main window".

Автор: TelecomUral, Отправлено:20:25 24-12-2021

bolega
Извиняюсь, но я опять позабыл, как менять в режиме Compare масштаб слева и масштаб справа. Напомните.
Синезелёная тонкая окантовка всё время вокруг правой панели. Однако, щёлкнув мышкой на левой панели, внешне ничего не меняется, но выбор масштаба из списка ("75%", например) действительно меняет масштаб именно слева. Щёлкаю мышкой на правой панели - и тот же список начинает работать для правой панели.
Или я неверно про синезелёную рамочку помню, что это указание на местонахождение фокуса?

Автор: bolega, Отправлено:00:50 25-12-2021

TelecomUral

Цитата:
что это указание на местонахождение фокуса?

Скорее это не классический фокус, а указатель редактора, к которому применимы команды редактирования. В compare левая панель не подлежит изменению, поэтому окантовка остается на правой. Из-за команд масштаба приходится все-таки фокус оставлять на левой панели, а иначе я бы его насильно переводил направо.

Автор: daa2013, Отправлено:08:47 02-01-2022

Подскажите, я забыл.

Если при бинаризации градиент идет не сверху вниз, а слева направо, то что надо делать ?

Автор: TelecomUral, Отправлено:11:16 02-01-2022

daa2013
помнится, повернуть скан Другого рецепта нет.

оффтоп
Кстати, мне не приходилось видеть боковой непропечатки, никогда. Подобрал бы ваш пример себе в коллекцию кривых типографских источников. Если не заворот у корешка, а именно типография так отпечатала. Равномерное изменение (падение) жирности оттиска всегда идёт только сверху вниз или снизу вверх.

Автор: daa2013, Отправлено:11:58 02-01-2022

Я вот тут применить хотел

https://disk.yandex.ru/i/cxuzJUWg7rC4sw

Автор: AlexeiPetrov, Отправлено:21:08 05-01-2022


Цитата:
1.  
Тогда это будет работать только в сочетании с заданием конкретной буквы и задействованием других критериев.
 
При подсветке вы контролируете именно максимальную границу !
И если задать только минимальную для группы букв, то подсветятся все нормальные буквы.
 
 
Вот как у меня, например, как другая книга выглядит (обратите внимание на Ы):
   
не буду перечислять подлежащие замене буквы.  

Совсем недавно начал осваивать данную программу. И вот встретил Ваше сообщение о подсветке букв. Это возможно делать в ScanKromsator? Если да, то не подскажете, как? Форумов о программе уже 4 штуки по 100 страниц, боюсь, что замучаюсь искать.

Автор: daa2013, Отправлено:10:45 06-01-2022


Цитата:
AlexeiPetrov


Первый путь:
1. Скачиваем из шапки "Подборка ответов bolega". Открываем в Акробате.
2. Из меню Edit -> Search открываем справа форму поиска и в самом верхнем поле вбиваем "подсветка" (без кавычек).
3. Первое же вхождение - это вопрос 742 и примечание к нему (№63).

Второй путь:
1. Скачиваем из шапки ScanKromsator. Хрестоматия 2.1. (версия от 25.12.2018).
2. Открываем её.
Если это делается в первый раз, то:
2.1. В загрузках броузера, кликаем ПКМ и выбираем "Открыть папку с файлом".
2.2. Затем в списке ПКМ на файле и выбираем "Свойства".
2.3. В открывшемся окне на закладке "Общие" жмём кнопки "разблокировать" и "ОК".
Далее можно пункты 2.1. -2.3. пропускать и сразу переходить к:
2.4. Двойной клик на скачанном файле.
3. Слева переключаемся на закладку поиск и вбиваем "подсветка". Он показывает, что про это рассказано в разделах 2.9. и 4.7.

Автор: AlexeiPetrov, Отправлено:11:17 06-01-2022

daa2013
Спасибо!

Автор: bolega, Отправлено:12:16 06-01-2022

del

Автор: TelecomUral, Отправлено:12:33 06-01-2022


Цитата:
Последние мои тестирования показали, что он часто заметно проигрывает FR

помнится, у вас очень древняя версия dll, может, поэтому ?

Автор: asku, Отправлено:12:40 06-01-2022


Цитата:
Задача заменить все такие буквы на "нормальную". Решается хорошо, т.к. букву "м" тессеракт распознает без проблем, даже сильно поврежденную. Сложнее, если перемычки пропали у "н" или "и". Тут тессеракт часто ошибается (так же как и djvu-кодер), путая и/н/п. Поэтому полную автоматику применять опасно, нужен контроль со стороны человека.


Да как же это делается? Подскажите где про это прочитать?

Автор: bolega, Отправлено:12:47 06-01-2022

del

Автор: AlexeiPetrov, Отправлено:13:02 06-01-2022


Цитата:
AlexeiPetrov
А вам для чего?

Именно для того, чтобы исправлять буквы без перемычек. Обычно я это делаю черным ластиком (дорисовываю перемычки в "Н", "П") или просто переклеиваю буквы (беру нормальную и ставлю ее на недоделанную). Иногда страницы встречаются настолько бледные, что дорисовывание и переклеивание занимает очень много времени. Кто-то, может, на это и не обращает внимание, но я стремлюсь к максимальному качеству. Поэтому и хочется хоть какой-то автоматизации.

Автор: TelecomUral, Отправлено:13:03 06-01-2022

Del

Автор: asku, Отправлено:13:22 06-01-2022


Цитата:
Я же говорил, что версия еще только готовится.


Я это помню, но вы это так активно обсуждаете, что я подумал, что что-то не так понял и такая функция уже есть в вышедших версиях.

Автор: bolega, Отправлено:13:22 06-01-2022

ОК, чтобы никого не смущать, обсуждение того, чего еще нет, прекращаю

Автор: daa2013, Отправлено:08:40 08-01-2022

bolega
А можно ли в окне RV при просмотре зон отключать показ выбранных зон ?

То есть не hide/show для всех, а например для той, с которой работаю ?

Добавлено:

UPD
Можно ли также изменить (sent to back, bring to front) в RV ?
(Ага, догадался. Вышел из RV в MW и переставил. Но было бы удобнее прямо в RV.)

Автор: TelecomUral, Отправлено:09:34 08-01-2022


Цитата:
То есть не hide/show для всех, а например для той, с которой работаю ?

поддерживаю. Иногда нужно было. Правда, редко. Хотелось что-то типа кнопочки рядом с замочком на контуре, когда зона выделена. Но чтоб пунктир остался и кнопочку обратно можно было отжать.

Автор: bolega, Отправлено:11:01 08-01-2022


Цитата:
Но чтоб пунктир остался

В RV вроде нет пунктира.
Скрыть зону совсем не проблема. Скрыть, но оставить квадратики по периметру, намного сложнее.

Добавлено:
daa2013

Цитата:
Я вот тут применить хотел

Получилось?
Я попробовал авто-заменой глифов заменить все жирные, вроде нормально вышло.


Автор: TelecomUral, Отправлено:11:11 08-01-2022


Цитата:
В RV вроде нет пунктира

я имел ввиду - чтобы кнопка возврата осталась. Для неё же нужно (желательно) видеть что за зона у кнопки.
Впрочем, альтернатива - хоткей вкл/выкл отображения текущей зоны. Но тогда при уводе фокуса с зоны надо чтоб она сама возвращалась

Это так, размышления.

Автор: bolega, Отправлено:11:32 08-01-2022

Сделаю проще. Кнопка сокрытия уже есть. Если на момент ее нажатия выделена зона, то скроется только она. Для возврата снова нажать. Т.е. ничего нового городить не надо.

Автор: daa2013, Отправлено:11:58 08-01-2022


Цитата:
Получилось? Я попробовал авто-заменой глифов заменить все жирные, вроде нормально вышло.

Я тоже так сделал. Только ручками всё



Цитата:
Сделаю проще. Кнопка сокрытия уже есть. Если на момент ее нажатия выделена зона, то скроется только она. Для возврата снова нажать. Т.е. ничего нового городить не надо.

Если спрятать так много зон, то хорошо бы, чтобы их можно было вернуть не поодиночке, а кучей, вызвав команду show zones.



Автор: TelecomUral, Отправлено:12:24 08-01-2022


Цитата:
вернуть не поодиночке, а кучей

это логично. Убираем индивидуально, те, которые хотим, а возвращаем пачкой по меню (ПКМ). Кнопка же работает тоже индивидуально. Типа "данную зону скрыл/показал её обратно".

Автор: bolega, Отправлено:13:28 08-01-2022

Нет. Убираем либо только одну, либо все. Возвращаем так же. Промежуточные варианты трудно реализовать, обойтись без них думаю вполне можно. Промежуточные можно легко сделать только в режиме zones, для ленты зон всегда доступно КМ, даже если слева зона спрятана.


Добавлено:

Цитата:
Я тоже так сделал.

Зато пример мне очень пригодился. Буду снимать видео, включу

Автор: TelecomUral, Отправлено:13:47 08-01-2022


Цитата:
для ленты зон всегда доступно КМ

упс! в голову не приходило, что там тоже есть КМ
... только вот не появляется КМ... Новая фича?

Автор: bolega, Отправлено:13:59 08-01-2022


Цитата:
Новая фича?

Да, там сейчас уже полно команд

Автор: kamenkapenza, Отправлено:16:25 08-01-2022

Господа! Никто случайно не знает: автор программы не собирается написать видеоролик по работе с текстом и его коррекции?
Вай-вай-вай!!! Какая хорошая фильма была в двух сериях про картинки, как с ними работать в Кромсаторе! Вот бы по работе с текстом подобный шедевр!!

Автор: bolega, Отправлено:00:14 09-01-2022

По тексту там и снимать то нечего. Все как правило тривиально.
Основная возня с зонами.
Может когда и сниму, если будут интересные примеры. Но сейчас их нет, т.к. я их не собирал.
Следующее видео будет про реставрацию текста с помощью ocr и глифов.

Автор: kamenkapenza, Отправлено:02:47 09-01-2022


Цитата:
Следующее видео будет про реставрацию текста с помощью ocr и глифов.

Это замечательно! Ждем!

Автор: D1D1D1D, Отправлено:06:29 09-01-2022

bolega

Цитата:

Цитата:
Возможна ли обработка полос между буквами, подобных которым много в книге? Как-то их затереть?

Можно, но в публичной версии фича недоступна. Возможно в следующей версии появится. Новая версия скорее всего выйдет не ранее следующего года.

Здравствуйте. Скоро ли планируется эта версия программы?

Автор: bolega, Отправлено:10:35 09-01-2022


Цитата:
Скоро ли планируется эта версия программы?

А есть нормальный образец скана? А то мне часто присылают вопросы, сопровождая их какими-то иконками вместо нормальных сканов. Я уже на такие вопросы не отвечаю, почему - написано в шапке красным шрифтом. Если пользователя жаба (или лень) душит выложить и прислать ссылку хотя бы на один типичный скан (мне такие примеры всегда пригодятся для отладки), то что я могу сделать?
Если пример по зубам СК, я покажу это в видео. Если не по зубам, я возможно покажу что можно выжать. И буду думать над совершенствованием алгоритмов. А так разговор ни о чем.

Автор: TelecomUral, Отправлено:11:28 09-01-2022


Цитата:
А есть нормальный образец скана?

на свой фтп вам положил книгу Капцова. Вдруг будет полезно для опытов. Это та самая, которую я в 2008м не смог в СК сделать.

Автор: kamenkapenza, Отправлено:11:48 09-01-2022

Господа!
Просьба собирать для учебного задания корявенькие страшненькие образцы текста, где буквы непропечатанные, обгрызенные, объеденные, с палочками между ними. Я как то занялся сбором подобного текста ( была специальная папочка с дефектным текстом), но потом мне сказали, что кина не будет, и к тому же эфилоп трансклюкировал меня отсюда до конца года, я не мог принимать участие в акцентировании проблем, и я всё удалил.

Добавлено:

Цитата:
книгу Капцова


Хм!!! Значит на самом деле проблемная книга, судя по фамилии автора.)))

Автор: stoller, Отправлено:12:18 09-01-2022

bolega, я правильно понимаю: нужны сканы с «марашками»?
Где-то у меня была тоже целая книга такая, куда-то потерял, нужно время, чтобы найти. Пока парочку сделал из другой. Можно и ещё наделать, если требуется, конечно.
https://disk.yandex.ru/d/gmOcNEMO5NXRsw

Автор: bolega, Отправлено:14:23 09-01-2022


Цитата:
я правильно понимаю: нужны сканы с «марашками»?

Не совсем. Таких сканов и у меня хватает.
Задача в другом: если есть вопрос по конкретному примеру, то выкладывайте этот самый пример, а не картинку из трех букв. А что я на нее скажу? "По идее должно сработать..." А если именно в этом случае не сработает? Буду выглядеть вруном...

Автор: stoller, Отправлено:14:31 09-01-2022


Цитата:
если есть вопрос по конкретному примеру

Понятно, спасибо. Я не пытался ещё их обрабатывать, жду готового решения, тогда займусь.

Автор: D1D1D1D, Отправлено:20:24 09-01-2022

bolega

Тут три примера скана и три — фото (если не ошибаюсь) — https://disk.yandex.ru/d/Ls9mvGRwgHMpuw

Добавлено:
Насчёт наличия сканов — выше я вроде скидывал их примеры, и вы тогда сказали, что обработка таких случаев в закрытой версии СК уже налажена и работает, поэтому подумал, что достаточно будет напомнить про существо вопроса.

Автор: shch_vg, Отправлено:17:03 14-01-2022

bolega
Несколько раз пытался получить дежавю в СК на сканах бюллетеней А3 и А4 с параметрами по умолчанию (Background subsample ratio = 1), подключая объединенные сканы к шагу2, но всякий раз компилировалось где-то до 30-35 скана, затем выдавалось Out of memory.
Каждый раз при подстановке параметров из лога в программу DjVu Small v0.4.4 она делала дежавю нормально. Не может быть это каким-то ограничением в СК?
Оперативной памяти вполне достаточно, что подтверждает и работа DjVu Small v0.4.4

P.S. При задании Background subsample ratio = 2 дежавю создается нормально.

Автор: bolega, Отправлено:10:15 15-01-2022

shch_vg

Цитата:
подключая объединенные сканы к шагу2,

Может к 3? Там только Background subsample ratio
Эта ошибка вылезает при вызове api-функции на 32-битной windows для очень больших сканов. В новой версии я сделал так, что при ее возникновении изображение разбивается на две части (с перехлестом, чтобы исключить артефакты на линии разбивки) и функция вызывается дважды, но с меньшей потребностью в памяти. Как правило, это помогает. На 64-битной windows такая ошибка у меня не возникала.

Автор: D1D1D1D, Отправлено:12:13 15-01-2022

bolega

Можно ли ожидать в ближайшем будущем версию с обработкой штрихов между букв?

Автор: shch_vg, Отправлено:14:39 15-01-2022

bolega

Цитата:
Может к 3? Там только Background subsample ratio

Нет, именно ко второму, на третьем аналогичный параметр называется несколько иначе. Сканы попадают ко мне уже со слитыми с текстом фото, поэтому зацепить 3 шаг они не могут. На втором шаге есть Background subsample ratio, в своих компиляциях я обычно использовал значение этого параметра = 3 (200дпи), но здесь меня попросили, чтобы бэкграунд фото был повыше (600дпи). Вот здесь я и столкнулся с вылетом.
Думал, что СК просто использует модуль DEE, но был удивлен, что DjVu Small на том же модуле успешно откомпилировал дежавю.
Информация о моей системе из "Сведения о системе":
Windows10Pro
Компьютер на базе х64
Доступно физической памяти - 20,3 ГБ

Автор: TelecomUral, Отправлено:14:51 15-01-2022


Цитата:
DjVu Small на том же модуле

модуль модулем, а параметров там два десятка.

Автор: bolega, Отправлено:14:59 15-01-2022

shch_vg
Даже если step2, зон там точно нет? Тогда это действительно очень странно. Если там нет вообще никаких зон, то СК просто вызывает DEE, там и ошибке то неоткуда взяться ((


Цитата:
всякий раз компилировалось где-то до 30-35 скана

Как вы это узнали? СК на втором шаге не выводит информацию о количестве закодированных страниц.

D1D1D1D
Думаю, раньше февраля вряд ли. Кстати, спасибо за пример. Вот что пока получается: https://workupload.com/file/YQANATjnPcr
Первые три страницы повторяются 3 раза: 1 - стадия до удаления марашек, 2 - стадия после простого автоматического удаления марашек, 3 - стадия после окончательного удаления марашек (и реставрация букв) с использованием нового метода на базе OCR после tesseract. 3-я стадия, можно сказать, полу-автоматическая, т.к. требует контроля и нередко вмешательства со стороны пользователя. Степень этого контроля практически полностью зависит от того, насколько правильно tesseract распознал буквы. К сожалению, иногда он лажает.
Остальные 6 страниц повторяются только дважды, там простейший случай, и 3-я стадия не понадобилась.


Автор: D1D1D1D, Отправлено:16:14 15-01-2022

bolega
Спасибо, юзабельно. Наверно, если предварительно немного осветлять текст, чтобы мусорные штрихи отделились от букв — результат уже на второй стадии будет лучше.

Автор: TelecomUral, Отправлено:16:37 15-01-2022

bolega
а как быть, если шрифт на странице от разных языков? несколько раз прогонять?

Автор: asku, Отправлено:17:07 15-01-2022


Цитата:
Думаю, раньше февраля вряд ли. Кстати, спасибо за пример. Вот что пока получается: https://workupload.com/file/YQANATjnPcr


Вот это результат!

Автор: shch_vg, Отправлено:17:24 15-01-2022

bolega

Цитата:
Даже если step2, зон там точно нет? Тогда это действительно очень странно.

Зон точно нет, все фото интегрированы с текстом.
Вот и мне это очень странно, т.к. Дежавю Смолл откомпилировал нормально.

Цитата:
Как вы это узнали? СК на втором шаге не выводит информацию о количестве закодированных страниц.

Из выданного лога.

Автор: bolega, Отправлено:17:28 15-01-2022

TelecomUral

Цитата:
а как быть, если шрифт на странице от разных языков? несколько раз прогонять?

Можно и один. Можно и несколько.
Но как правило, марашки только на кириллических буквах.


Добавлено:
D1D1D1D

Цитата:
осветлять текст, чтобы мусорные штрихи отделились от букв

ну-ну

Автор: kamenkapenza, Отправлено:18:20 15-01-2022

bolega, от себя пожелания:
чтобы в новых версиях программы можно было закреплять в профиль настройки полей. Например, я установил настройки полей "none" и они после закрытия и открытия программы так и оставались в "none". Сейчас настройки полей не сохраняются, они всегда возвращаются в "auto "

Автор: TelecomUral, Отправлено:18:36 15-01-2022

shch_vg
вспомнил, как я пытался без создания out-task на XP запустить дежавю-визард. То есть на первичных цветных сканах. В Диспетчере задач было видно, DEE забирал ступеньками всю оперативную память, где-то по сто мегов на страницу, и примерно на 28-32 странице СК грохался с "out of memory". В зависимости от количества прочих программ в оперативке.
Может, у вас словарь стоит большой для такого случая? Или в small столько же?

Автор: bolega, Отправлено:18:52 15-01-2022


Цитата:
чтобы в новых версиях программы можно было закреплять в профиль настройки полей

это уже сделал
и направление зума колесиком можно задать

Автор: shch_vg, Отправлено:19:11 15-01-2022

TelecomUral
Не понял, причем здесь DEE, если тот же DEE в рамках Дежавю Смолл отрабатывает нормально?
Я же писал, что в смолл повторил все параметры, представленные в логе СК, включая и размер словаря. Интересно, какой бы Вы поставили размер словаря при создании дежавю из 44 больших сканов размером А3?
Да и ожидать, что уже 35-й скан будет критическим при памяти в 24 гига, как-то несерьезно.

bolega
Если уж пошла речь о настройках, сделайте что-нибудь, чтобы управлять значением списка из окна "Открыть", в котором сейчас все время стоит Sort smart.
Периодически напоминает о себе ударом по мозгам

Автор: TelecomUral, Отправлено:20:27 15-01-2022


Цитата:
Я же писал, что в смолл повторил все параметры

виноват, не уловил, что из лога.

Цитата:
Интересно, какой бы Вы поставили размер словаря при создании дежавю из 44 больших сканов размером А3

30.
Попробовал загнать 53 скана, А3, в 600дпи (может у вас больше?). Всё получилось. На скриншоте виден размер скана в пикселях и лог с вызовом.

дежавюшка:
https://disk.yandex.ru/d/Vm4yEnrUrf5YYQ

Посмотрел итоговый лог, есть занятная строчка:
Step 2 finished at 15.01.22 22:11
Encoding completed successfully but with WARNING(s)

Автор: shch_vg, Отправлено:00:16 16-01-2022

TelecomUral
С Вашими параметрами у меня вылетело уже на втором скане.


Цитата:
Encoding completed successfully but with WARNING(s)

На такие сообщения я просто не обращаю внимания.

Автор: kamenkapenza, Отправлено:00:23 16-01-2022


Цитата:
и направление зума колесиком можно задать

bolega
Это хорошо, а то по инерции как в визарде хочется изменить зум на главной странице колёсиком, а вместо увеличения (уменьшения) перескок на другую страницу.

Автор: TelecomUral, Отправлено:06:46 16-01-2022

shch_vg
в логе у вас - типичная ошибка, documenttodjvu что-то не нашёл в своём окружении. То ли имя профиля, то ли параметр в профиле какой отличается. Редкая но типичная ошибка конфигурации программы. Ведь small у вас не этот же самый файл вызывает? Копию небось.

+
Я ваш очень старый пост нашёл

Цитата:
В моем батнике documenttodjvu.exe используется с множеством параметров, которые не понимает ни documenttodjvu.exe из выложенной Вами ссылки, ни documenttodjvum.exe из Djvu Small.

http://forum.ru-board.com/topic.cgi?forum=5&topic=29984&start=1360

Автор: bolega, Отправлено:10:30 16-01-2022

Я тоже подумал, что видимо, СК настроен на вызов другого documenttodjvu.exe, наверно из комплекта DEE, а про него был разговор, что там есть баги. А в модифицированной версии их нет

Добавлено:
kamenkapenza

Цитата:
Это хорошо, а то по инерции как в визарде хочется изменить зум на главной странице колёсиком, а вместо увеличения (уменьшения) перескок на другую страницу

Я вроде про другое написал: про инвертирование направления зума.
А то, что вы упомянули, нужно делать с зажатым Ctrl. Можно также в Files > Options отключить Scroll files by wheel

Автор: TelecomUral, Отправлено:10:51 16-01-2022


Цитата:
в модифицированной версии

я тут собирал
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/261#261

Автор: shch_vg, Отправлено:13:20 16-01-2022

TelecomUral

Цитата:
в логе у вас - типичная ошибка, documenttodjvu что-то не нашёл в своём окружении.

Интересно, а что он находит в своем окружении, стоит поменять значение Background subsample ratio с 1 на 2?

bolega

Цитата:
Я тоже подумал, что видимо, СК настроен на вызов другого documenttodjvu.exe, наверно из комплекта DEE, а про него был разговор, что там есть баги. А в модифицированной версии их нет

Чтобы отделить родной dee, нужно попотеть, т.к. он без своего окружения не работает. Гораздо проще взять из смолла екзешник с буквой м на конце, убрать эту букву и подсунуть его СК.

P.S. Кстати, для еще большего упрощения процесса нахождения этой программы в СК стоило бы добавить в поиск и вариант с М на конце, тогда появляется возможность непосредственно подключать модуль из смолла.

Автор: TelecomUral, Отправлено:13:26 16-01-2022


Цитата:
Интересно, а что СК находит в своем окружении

А бог его знает, какие там хитрости в его профилях зашиты. Допустим, не находит для дпиBG значений "=FG". Я когда-то читал древние описания-изыскания, какой параметр что означает и как с другими связан, так там не всё тривиально.

Тем не менее. Попробуйте взять по моей ссылке комплектный documenttodjvu из dsm, с папочкой профилей и дллкой. Подсуньте СК. Должно бы сработать, у меня же работает.

UPD
Разобрались в личке. Так и оказалось - dee надо было взять свежий пролеченный, из DSM.

Автор: bolega, Отправлено:13:53 16-01-2022

shch_vg

Цитата:
Гораздо проще взять из смолла екзешник с буквой м на конце, убрать эту букву и подсунуть его СК.

Так вот в чем проблема. Вы просто утащили из смола экзешник. Вместо того, чтобы задать путь к нему. Ведь что в DEE, что в small, есть важная папка Profiles, без которой хз как они там по дефолту работают.
Впрочем, некоторых это не переубеждает, у них железный довод: "ведь и без папок работает!"


Цитата:
Кстати, для еще большего упрощения процесса нахождения этой программы в СК стоило бы добавить в поиск и вариант с М на конце

Сейчас так и есть

Автор: TelecomUral, Отправлено:14:02 16-01-2022


Цитата:
некоторых это не переубеждает

зашейте проверку и предупреждение при задании пути: "а профилей нет!!"

Автор: shch_vg, Отправлено:14:28 16-01-2022

bolega

Цитата:
Так вот в чем проблема.

Если бы в свое время (до того, как в СК появилась возможность прописать путь к модулю из Смолла) я не утащил вместе с екзешником Смолла и папку Профайл, то как бы я столько лет видел в СК все профили в соотвествующем списке, даже те, которые я делал еще в DEE для себя?
Здесь появляется интересный вопрос, который некогда проверять: а будет ли вообще СК компилировать в рамках стандартных профайлов, если этой папки нет? Если да, то какая разница, перенесены ли профайлы вместе с экзешником или нет?

В связи с тем, что ком возникающих вопросов нарастает (особенно после неверного воспроизведения TelecomUral приведенных мной параметров компилирования, приведшего к тому, что теперь удалось аварийно завершить с его параметрами и Дежавю Смолл), а времени на их разрешение катастрофически нет, прекращаю это обсуждение.
Возможно неспеша когда-то удастся немного понять причины происходящего.

Автор: shch_vg, Отправлено:16:37 16-01-2022

bolega
TelecomUral
Чтобы зафиксировать проблему на определенном уровне, сообщаю, что удалось найти 1 (один, но думаю, что он не единственный такой особенный) скан, на котором и СК и дежавю Смолл дают Out of memory при Background subsample ratio = 1 и оба отрабатывают нормально при Background subsample ratio = 2.

Автор: kamenkapenza, Отправлено:17:58 16-01-2022

Господа! Каким способом Кромсаторе можно обработать такие страницы с серыми заголовками, где цвет фона страницы практически сливается с цветом фона заголовка? К тому же контур серого фона закругленный. https://disk.yandex.ru/d/XxOHFWrVrrLydA Просьба показать процесс обработки.

Автор: TelecomUral, Отправлено:18:24 16-01-2022

размойте и раскрасьте серым.

Автор: kamenkapenza, Отправлено:18:42 16-01-2022


Цитата:
размойте и раскрасьте серым.

Этого я не умею (малевать и красить), никто не учил. Сделал через зону цветных картинок. А то зашел в одну группу в Контакте, там марксисты заседают, книжки хорошие делают батенек Маркса, Энгельса, Ленина, но делают это хреновенько, даже хуже меня ))) Вот я и решил подсобить нашим, пусть делают нужные книжки хорошо.

Автор: asku, Отправлено:19:49 18-01-2022

bolega

А вы не могли бы попробовать убрать штрихи в примере, который я пришлю? Текст на осетинском языке — кириллица с лигатурой «ае».
Посмотреть как получится.

Добавлено:
Вот пример:
https://disk.yandex.ru/i/NTv-G8MRwZhrVA

Автор: bolega, Отправлено:20:16 20-01-2022

asku

Цитата:
Посмотреть как получится.

Нормально получается. Лигатура вообще не проблема, она хоть и не распозналась, но форма ее настолько непохожа на другие буквы, что СК нашел их практически все в один клик без ошибок.
https://workupload.com/file/YHN3yzQkmCj

Автор: asku, Отправлено:21:51 20-01-2022


Цитата:
Нормально получается.


Да, впечатляющий результат.

Автор: kamenkapenza, Отправлено:14:43 22-01-2022


Цитата:
Нормально получается. Лигатура вообще не проблема, она хоть и не распозналась, но форма ее настолько непохожа на другие буквы, что СК нашел их практически все в один клик без ошибок.


Вот посмотреть бы, как это делается, и мене научиться.
Это чего же???
В новой версии Скан Кромсатора всё это сделалось?
Похоже, что нашлось реальное средство по борьбе с палочками. Пока об этом знает только автор программы.))) Но это уже хорошо.

Автор: asku, Отправлено:16:54 22-01-2022


Цитата:
Вот посмотреть бы, как это делается, и мене научиться.


Ждем новую версию. ) Надеюсь не трудно будет научиться этой функцией пользоваться. А то сколько я вручную эти палочки убирал. А сколько мне в текст пришлось переводить такие сканы и потом исправлять ошибки. Уф...

Автор: kamenkapenza, Отправлено:09:42 23-01-2022

Уважаемый bolega!
Нельзя ли в новой версии программы во вкладке изготовления djvu (Create djvu vizard) сделать настройки профильными, то есть настроил для себя, и они потом при последующем открытии остаются, то есть не переходят по умолчанию (75 процентов передний и задний слой, качество Агрессив, профиль дефолт). Я бы, например, сделал для себя по 100 процентов, качество Лослесс или Квазилослесс, профиль 600 дпи, и чтобы все эти настройки сохранились для следующих книг. А то Агрессив и т.п. по умолчанию меня не устраивает, и каждый раз надо перенастраивать.
Может, как то уже можно и в версии 6.81 сохранять настойки кодирования джву, но я не нашел пункта сохранения этих настроек в профиль.

Автор: TelecomUral, Отправлено:11:44 23-01-2022

Поддерживаю просьбу. Я практически всегда перекидываю качество на quasilossless, потому что вожусь с библиотечными затёртыми экземплярами, там буквы полусъедены, пунктирчиками, и зон на них не напасёшься. Проще деспекл отключать и сохраняющие методы кодирования устанавливать.

Автор: bolega, Отправлено:12:19 23-01-2022

ОК, добавлю в профиль.

kamenkapenza
Вот вы часто чего-то требуете, то фичи, то видео. Вы делаете книги, которые из-за дурацкого обменника я скачать не могу. И на рутpekeр они в последнее время не выкладываются Кибальчичом. Сканами Absurdman практически перестал делиться, а в свое время я на них хорошо тренировал алгоритмы СК. Везде засада. Игра в одни ворота... Меня это печалит, особенно недоступность сканов

Автор: TelecomUral, Отправлено:13:39 23-01-2022

оффтоп
bolega
Я, конечно, сильно крамольную мысль для этой ветки скажу. Но.

Цитата:
Меня это печалит, особенно недоступность сканов

Так с вашей стороны это тоже выглядит игрой в одни ворота. Для абсурдмана, которому СК - как инструмент - по барабану, а важны только опубликованные готовые книги с его сканов.
Я как-то прикидывал, для него самый результативный как раз каменка, в обработке. Пара дней, книжка, ещё пара дней, и ещё книжка.
Так что не переживайте, это естественный отбор в действии. Кому качество, кому скорость.

Автор: bolega, Отправлено:13:43 23-01-2022

TelecomUral

Цитата:
а важны только опубликованные готовые книги с его сканов.

так в том то и дело, что теперь ни то, ни другое не скачаешь

Автор: TelecomUral, Отправлено:13:56 23-01-2022

я через тор качаю, если приспичивает. Занудно, конечно.

UPD
боюсь, вы не поняли мой посыл: берите на себя обязательства по обработке его сканов, тогда и доступ к сканам появится.

Автор: bolega, Отправлено:14:36 23-01-2022

TelecomUral

Цитата:
боюсь, вы не поняли мой посыл

А вы не поняли мой: новую версию в обмен на доступ
Шучу, но доля правды в этом есть.
Ведь он же тоже заинтересован, чтобы обработчик делал лучше и быстрее, разве нет?

Автор: kamenkapenza, Отправлено:15:16 23-01-2022

bolega, всё абсолютно не так.
Абсурдмэн мне ничего сейчас не даёт , он в Москве, последний.. без соли доедает, приехал книги посканировать, а денюжек не хватает.
Он вам всем давал на карасёвсой библиотеке ссылки на его сканы, но вы особо не заинтересованы были. И он потом закрыл ссылки из-за меня, что я открыл фабрику по производству книг с его сканов и делал это так, что качество его не устраивало. Но я поступил мудро, не ждал,пока он всё оттуда убёрёт из-за бездействия бездельников, всё к этому и шло. Я скачал эти террабайты сканов себе на компьютер, сделал себе задел наперед, с этого и делаю книги.
Потом Абсурдмэн сделал вторую попытку запустить свои сканы на Пабллиб, но опять толку никакого, никто не заинтересован работой. Тем более у него книги специфические, политические. Он их со всего света покупает, потом не знает, как с долгами рассчитаться за эти покупки. Человек старается для людей, только где они эти люди?
Насчет того, что он нашел в моем лице идеального работника - совершенная неправда. Называет меня земляным червяком )),если что не так. Рад бы он был поручить обработку специалистам профилем повыше, только нема таких, одни бездельники и специалисты на словах только.


Цитата:
Пара дней, книжка, ещё пара дней, и ещё книжка.

TelecomUral, это не про меня. Я и по 6 книг за день делал, одну книгу на два дня растягивать не буду, 10-15 минут разрезка и установка поле в Тейлоре,а потом в Кромсатор. Если картинок нет, то час максимум, а то и полчаса на книгу в двух программах. Сейчас начал делать текстовый слой и закладки, немного побольше времени уходит.
Сейчас времени меньше, снег валит каждый день, много работы на улице, одну книгу не спеша в день плюс скачивание книг с других сайтов, сделанных другими людьми.
bolega, мне не жалко сканов, они не мои, могу периодически делиться. Если хотите, забирайте ту книгу, которую вы делали в задании, картинки я оттуда давал. Алексеев "Становление человечества".
Кстати, если вы в Москве, то можете встретиться с Абсурдмэном, покалякать о жизни, о сканах, о хлебе насущном.



Автор: TelecomUral, Отправлено:16:25 23-01-2022


Цитата:
Ведь он же тоже заинтересован, чтобы обработчик делал лучше и быстрее, разве нет?

он даже не имеет доступа на руборду
я специально спрашивал недавно. На каменку ему жаловался про ФР.

+
мы как-то переписывались, к компьютерным программам, ко всем, у абсурдмана стойкое отвращение. Уж я его уговаривал-уговаривал обучить нормальной обработке, но нет.
По-человечески это понятно, возникает конфликт "скорость vs качество", и "лучше уж я вовсе буду не уметь обрабатывать, чем разрешать этот конфликт в себе".

Добавлено:

Цитата:
я открыл фабрику про производству книг с его сканов и делал это так, что качество его не устраивало

то есть вот кто нам новую версию СК перекрыл!

Автор: kamenkapenza, Отправлено:16:36 23-01-2022


Цитата:
он даже не имеет доступа на руборду

Человек ведет спартанский образ жизни, приехал в Москву сканировать частную библиотеку, там вся комната, а то, может, не одна в стеллажах с книгами до потолка. Где работает, там и спит. Ему не до Руборда. Тем более у него специфика другая, здесь нет ветки про сырые сканы.
А чего ему на меня жаловаться? Это бесполезно! Он мне на днях начал выговаривать, как это я смею выкладывать без его разрешения книги на сайт Миркниг, я на денек его трансклюкировал; заблокировал до праздника Крещения. Ну а на Крещение надо всех прощать)))
Вы то поймите, что я работаю сам по себе, независимо от автора сканов, я их когда то скачал своевременно, таперича работа идёт. Это же большое удовольствие - делать книги!


Цитата:
мы как-то переписывались, к компьютерным программам, ко всем, у абсурдмана стойкое отвращение. Уж я его уговаривал-уговаривал обучить нормальной обработке, но нет.

Вы не понимаете того, что человек целыми днями занят покупкой, доставкой, оплатой книг и их сканированием, он больше десятка книг может за день отсканировать. Где у него время на обработку??? Тем более по вашим высказываниям одна книжка в два дня - это супер быстрый процесс, её надо месяц изготавливать. Если он будет месяц изготавливать одну книгу, то кто будет сканировать горы купленных, присланных кем то книг, тем более он иногда поселяется на чьей то квартире и сканирует книги стеллажами. В этом деле разделение труда дает наиболее перспективную и плодотворную деятельность. Как у артели ремесленников или на большом предприятии: каждый работник выполняет свой цикл работы, это дает наивысший результат. Зачем ему ещё лесть в какой то цикл, если у него и так запарка в стадии сканировании (сканировать не пересканировать) TelecomUral, вы и сами специализируетесь на сканировании, а не на обработке, и в в деле обработке скорее теоретик,чем практик.


Добавлено:

Цитата:
то есть вот кто нам новую версию СК перекрыл!

И товарища Кеннеди мочканул. )))
Как чего то там перекрыть, если Кромсатором начал пользоваться осенью прошлого года?
Заодно перекрыл газ в Европу через Украину )))


Автор: imwerden, Отправлено:16:41 23-01-2022

Я, например, только сканирую. А обрабатывают все желающие, которых я ищу и нахожу редко. Кроме того, мне постоянно предлагают в Москве книги в подарок или на время - на сканирование. А у меня были два человека, скандирующих, да теперь они всё время чем-то другим заняты. Вот такие проблемы. Готов делиться и сканами и книгами.

Автор: kamenkapenza, Отправлено:16:46 23-01-2022

imwerden, большое спасибо!!! Я вашу библиотеку скачал от корки до корки )) плюс ежемесячные обновления Душеполезного чтения. Я всегда рад помочь, плюс научить всему, чему умею, есть одноименный канал на ютубе, где я делюсь тому, чему меня научили другие люди или допендрил своим умом.

Товарищи! Рекомендую милый наш диалог по поводу сканов, сканировщика и т.п. перенести в тему "Электронные книги: сканирование, обработка, сборка - часть V", там нас никто не тронет А то прилетит эцилоп и трансклюкирует всех на хрен)))

По поводу сканов для обработки создал тему http://forum.ru-board.com/topic.cgi?forum=93&bm=1&topic=4123#1

Автор: kamenkapenza, Отправлено:19:36 23-01-2022


Цитата:
Кроме того, мне постоянно предлагают в Москве книги в подарок или на время - на сканирование. А у меня были два человека, скандирующих, да теперь они всё время чем-то другим заняты.


imwerden, там где-то среди гор книг в чужой квартире в Москве прозябает незабвенный товарищ Абсурдмэн, днями и ночами сканирующий эти самые книги. Неплохо бы вам его найти, он и книги возьмет и отсканирует, на его счету скоро будет 10000 отсканированных книг, он со сканером спит в обнимку, если удастся поспать. Человек всем своим существованием предан этому делу.
Надо бросить клич: Сканировщики, обработчики и любители книг всех стран соединяйтесь!!! Хотя бы российские.


Автор: D1D1D1D, Отправлено:20:08 23-01-2022


Автор: daa2013, Отправлено:06:59 24-01-2022

Подумал, что еще такая штука была бы удобна:

Задал с клавиатуры букву, а справа открывается лента всех возможных образцов этой буквы на страницах. (Может быть, можно непосредственно из тессерактовских ячеек такую ленту и собрать.) И кликом по ленте можно было бы на соответствующую ячейку и страницу переместиться.

Во-первых, в начале работы так можно поискать приличные образцы для библиотеки глифов.
Во-вторых, в конце работы так можно поискать плохие варианты, подлежащие замене.

UPD
Например, создать пустой глиф, присвоить ему букву, получить справа в ленте всех распознанные вхождения.
При выборе же уже существующего глифа с присвоенной ему буквой, можно на ленту накладывать критерии: низкие отклонения - получить похожие в поисках идеала. Высокие отклонения - посмотреть крякозябры.
То есть, чтобы лента не была бесконечной.

Автор: kamenkapenza, Отправлено:12:33 24-01-2022

Я вот думаю: все мы тут просим автора программы сделать какую-нибудь прибамбульку в новой версии программы. Он сделает, а мы ему чего дадим? Чтобы его работа шла более плодотворной и стимулированной, предлагаю организовать систему донатов. Наверное, у него есть Яндекс-кошелек или на карту банка, можно на них от каждого хотя бы рубликов по 100-500 скинуться. Тогда всё будет чин чинарём, не стыдно будет что-нибудь просить.

Автор: TelecomUral, Отправлено:13:48 24-01-2022


Цитата:
То есть, чтобы лента не была бесконечной

на фантлабе недавно видел статистику - число символов, богатство словаря и тэ пэ. Вы оценивали количество экземпляров буквы в средней книге? Их же не полсотни, и не полтысячи. Выбор глазом более чем из 15 вариантов почти невозможен на практике. И долог.
Это для подготовки (ручного уточнения) дежавю-словаря была бы хорошая идея, но не для исходного текста, как мне кажется.

Автор: bolega, Отправлено:15:08 24-01-2022

на одной (!) странице в среднем от 1 до 2 тысяч букв.
Если собрать со всей книги, даже одну букву, лента просто лопнет от переполнения. А если еще выбирать глазами среди такого разнообразия, то лопнет в другом месте
Я обычно листаю результат обработки, останавливаюсь на страницах, имеющих наилучший внешний вид букв, и набираю там б-ку. Потом по ходу чистки, если встречается что-то лучшее, заменяю. Т.е. надо отталкиваться от какого-то изначального набора, а не собирать до кучи тысячи букв. Причем такой отбор букв сам по себе займет много времени, т.к. надо будет загружать все страницы.

kamenkapenza

Цитата:
предлагаю организовать систему донатов

Я уже не раз говорил, что это не нужно. Лучший донат - это поделиться сканом редкой н.-п. книги.

Автор: fozzie, Отправлено:15:21 24-01-2022

bolega

Цитата:
Лучший донат - это поделиться сканом редкой н.-п. книги.

Редкая н.-п. книга - продукт нишевый, на любителя. Обозначьте хотя бы сектор интересов. (Плиз-плиз!)

Автор: TelecomUral, Отправлено:15:31 24-01-2022


Цитата:
останавливаюсь на страницах, имеющих наилучший внешний вид букв, и набираю там б-ку

и я так же.

Добавлено:
daa2013
К слову о замене глифов.
Как-то пару раз я проделывал умопомрачительный по затратности ручного труда опыт - заменял плохие глифы на хорошие в целом "плохоотпечатанной" книге. На паре-тройке страниц, разумеется. Желая просто "нуу, немного получше бы..." И между делом обнаружил, что результат "заменить только самые-самые плохие" меня не устраивает. Появляются новые "плохие", которые раньше были незаметны. Я, конечно, в чём-то перфекционист, и понимал тогда, что глаз пристрелялся к методике и начинает выуживать всё более мелкие огрехи. Но даже с учётом такого поведения - если заменить среди в целом плохого текста несколько глифов на идеальные, то они либо будут бросаться в глаза, либо не улучшат восприятие текста (читаемость, гладкость пробега) всей страницы в целом. Или и то и другое вместе. Результат начинает устраивать где-то после 40-50% замененных букв.
Я и поэтому тоже, тогда ещё, лет пять-шесть назад, охладел к глифированию всей книги. Замена "и/н/п" - да. Замена конкретных непропечаток и почеркушек - да. А хреначить весь текст сплошняком на предмет "сделать получше" - плохая идея. Примерно тогда я всевозможными фильтрами quality и занялся - понял, что более грамотное их применение даёт лучшую читаемость, и при куда меньших затратах.
Вспомнилось

Автор: daa2013, Отправлено:16:50 24-01-2022

Я, кажется, много раз писал, что я правлю буквы с разрывами, ликвидируя красный цвет в режиме подсветки. "Читаемостью" я не занимаюсь.

Что касается ленты с буквами. Я же бегу глазами по странице книги, ища буквы. Почему бы не бежать по ленте - всё проще ? Раз суммарно слишком много, то с одной страницы можно собрать и, например, по числу черных пикселей в ячейке ленту отсортировать.

Но вот какие-нибудь ъ ц, кавычки , Ы-большое бывает, OCR в FR сделаю и потом листаю туда. Так если OCR в СК есть, то нафиг в FR пихать ?

Автор: bolega, Отправлено:17:11 24-01-2022


Цитата:
Что касается ленты с буквами. Я же бегу глазами по странице книги, ища буквы. Почему бы не бежать по ленте - всё проще ? Раз суммарно слишком много, то с одной страницы можно собрать и, например, по числу черных пикселей в ячейке ленту отсортировать.

Сейчас так и построено. Только вместо ленты - список и панель просмотра, где в отличие от ленты, виден только текущий выбранный символ, зато цветами раскрашено его отличие от эталона. Есть несколько вариантов сортировки (по дефектам, по степени совпадения, по коду и др.). Есть фильтр на код буквы. Есть фильтр на разные параметры дефектов.

Автор: TelecomUral, Отправлено:23:03 24-01-2022


Цитата:
Но вот какие-нибудь ъ ц, кавычки , Ы-большое

это точно. Как-то я в поисках заглавной то ли Ж то ли Ш перерыл буквально всю книгу.
Впрочем, почти всё это решается кардинально через векторные шрифты. К тому же, эту Ж/Ш я так и не нашел тогда, пришлось ластиком облагораживать.
Или через эталонные книги.

Автор: daa2013, Отправлено:03:37 25-01-2022


Цитата:
Сейчас так и построено. ... виден только текущий выбранный символ,


Так это когда эталон задан. Лента предлагалась к использованию не для основного процесса по замене, а для начала работы, когда символов-эталонов еще нет. И для конца - когда запланированное заменил, и хочешь найти "новые плохие" буквы.
И для того, и другого хочется сравнить буквы рядом, а не разбросанные по тексту.

Автор: kamenkapenza, Отправлено:20:10 25-01-2022

bolega, может вот такая книга вам покажется непростой для обработки и вы покажете, как с ней бороться в Кромсаторе. Было бы очень пользительно для многих товарищей-книгообработчиков. Как правильно было бы. Можно было бы просто выделить все эти рисунки, как зона картинки, но, наверное, для таких рисунков это было бы неправильно, некорректно. Вот тут она эта книжечка https://cloud.mail.ru/public/nswJ/DHe18AESb Балашов "О природе". Выкопал из нелегально мною скачанных сканов Абсурдмэна из карасёвской библиотеки сырых сканов.

Автор: qwaxym, Отправлено:21:31 26-01-2022

kamenkapenza, на известном форуме прочитал хороший совет для тех кто хочет освоить какую-либо программу:
1. Попробовал что-то в программе сделать сам.
2. Если не получилось, прочитал справку, доп. информацию. Ещё раз попробовал.
3. Если и сейчас не получилось - Спросил на форуме

т.е. Сделал. Прочитал. Спросил.
Но никак не в обратном порядке.

Автор: kamenkapenza, Отправлено:22:10 26-01-2022

qwaxym,
Как будто я не пробовал....Если бы я не спрашивал, то вообще ничего бы не умел. У каждого свой подход мировосприятия: вам лучше ковыряться,а мне лучше сразу спросить (мир не без добрых людей). Я чем дальше пытаюсь что-то понять самостоятельно, чем больше ничего не понимаю. Вот поэтому эти ваши тезисы ( типа умные советы какого то философа с форума) начинайте с пункта 1, а я сразу перехожу к третьему.

Автор: TelecomUral, Отправлено:07:42 27-01-2022

сильный оффтоп, bolega, простите. Я даже больше для себя самого этот текст написал.
[more]
Цитата:
т.е. Сделал. Прочитал. Спросил.
Но никак не в обратном порядке


Цитата:
начинайте с пункта 1, а я сразу перехожу к третьему

... ну а поскольку мозг учится только начиная с 1го пункта, и обмануть его свойства невозможно, то разъяснять каменке вообще что-либо - просто-напросто бессмысленно. Он сам делает из себя робота с программой. Вложили последовательность кнопок - повторить может быстро. Передвинули кнопку - коррекции действий не произойдёт пока кто-нибудь не вложит новую программу. А поскольку программ много, вариативности и в самих программах много, то "на каждый чих не наздравствуешься".
То-то я чувствую тут какой-то подвох, в этих жалобах про отсутствие видео, простые разъяснения и тэ дэ. А это просто "робот промахивается по кнопкам", не человек. Планета Шелезяка Ну, я не механик Зелёный, головы автомату перевинчивать.
Для интересующихся могу посоветовать педагогическую троицу - знание/умение/навык. Боле серьёзный подход это поинтересоваться текстами Г.П.Щедровицкого, что он делал на своих Организационно-Деятельностных Играх.[/more]

Автор: kamenkapenza, Отправлено:14:21 27-01-2022

Господа, не знаете случайно, можно ли будет сделать переобработку страницы в новой версии программы непосредственно в панели результатов? Поясняю ( выражаюсь я не всегда корректно, поэтому в основном разжевывать надо, что треба). Сделал я, например, полную обработку всех страниц книги через кнопку Процесс, потом всплыла панель результатов. Я смотрю и вижу, что некая зона рисунка вышла не так (фон виднеется, или настройки не те поставлены, или зона не полностью захвачена). Чтобы не выходить в главное меню Кромсатора,можно ли тут же ( на панели результатов) скорректировать зону и сделать переобработку текущей страницы, не выходя из панели результатов на главную панель? На главной панели то это без проблем, но возможно ли это делать через панель результатов?
Мне что то так кажется, что такая нужная вещь (переоработка страницы непосредственно на панели результатов) сэколномила бы уйму времени и понадобилась многим коллегам-обработчикам.

Автор: TelecomUral, Отправлено:15:58 27-01-2022

переобработку зон можно и сейчас делать в окне VR. По ПКМ, Zone properties | Reprocess zone.

Автор: kamenkapenza, Отправлено:16:34 27-01-2022

TelecomUral, спасибо! Это хорошо, что уже придумано.
Опять именно вы мне помогли, хотя и считаете меня дурачком в квадрате)))

Автор: TelecomUral, Отправлено:16:42 27-01-2022

только не двигайте габариты зоны, это исказит зону. перемещать ее по странице как "целое" можно, а изменять границы не рекомендуется. Чёткость пикселей поедет.

Автор: Benoni, Отправлено:16:43 27-01-2022

kamenkapenza

Цитата:
считаете меня дурачком в квадрате

Вы ведь не плоский... Вы пространственное тело... Поэтому больше подходит "в кубе"!

Автор: TelecomUral, Отправлено:16:54 27-01-2022


Цитата:
Опять именно вы мне помогли

пока помощь ограничена десятком слов, это не затратно. жаль, что это тупик.

Автор: bolega, Отправлено:18:00 27-01-2022

В ролике, что я выкладывал, переобработка была показана. Наверно, это другое...

Автор: kamenkapenza, Отправлено:18:43 27-01-2022


Цитата:
Поэтому больше подходит "в кубе"!

Согласен на кубического, но только для того, кто меня чему то учит, потому что только они понимают, какой им трудный ученик достался, двоечник и второгодник))).
Мусью! Как насчет книжечки https://cloud.mail.ru/public/nswJ/DHe18AESb Балашов "О природе"? Ваше мнение: тут ничего нового, что было указано в ролике по обоработке зон или нечто другое? Если маненько другое, то неплохой был бы материал для следующего обучающего видео.

Автор: bolega, Отправлено:19:03 27-01-2022


Цитата:
Балашов "О природе"? Ваше мнение: тут ничего нового, что было указано в ролике по обоработке зон или нечто другое?

Часть, но не все, можно сделать малоцветкой. Но нужно уметь, с наскоку не выйдет. Хорошо, когда три цвета. Но например, на синих шариках блик, а вокруг еще каемка промежуточного серого цвета. Возни в таком случае потребуется много. Я бы не парился, сделал бы обычной зоной. Вышло бы естественнее. Но если день-два нечего делать, и нравится деликатная обработка (за вами такого не заметил) то можно сварганить и малоцветкой.

Автор: kamenkapenza, Отправлено:19:12 27-01-2022


Цитата:
сделал бы обычной зоной

bolega, спасибо! Так и сделаю.


Автор: TelecomUral, Отправлено:19:14 27-01-2022


Цитата:
можно сварганить и малоцветкой

Если резко нарастить количество цветов палитры, при необходимых 3-4 сделать 8-10 или даже 12, то возни требуется вовсе немного. Практически автомат. Но никакого выигрыша в размере по сравнению с обычной зоной в таком случае не будет. Ну, может чуть-чуть.
Я почти не делал таких экспериментов, но по ощущениям выигрыш в таком избытке цветов - что не утрачиваются тона на переходе к фону бумаги, который удаляют на обычной зоне. Малоцветкой картинка получается сочнее.
Вообще акварельные рисунки - это мука при обработке.

Автор: kamenkapenza, Отправлено:19:53 27-01-2022


Цитата:
Если резко нарастить количество цветов палитры, при необходимых 3-4 сделать 8-10 или даже 12, то возни требуется вовсе немного. Практически автомат. Но никакого выигрыша в размере по сравнению с обычной зоной в таком случае не будет. Ну, может чуть-чуть.
Я почти не делал таких экспериментов, но по ощущениям выигрыш в таком избытке цветов - что не утрачиваются тона на переходе к фону бумаги, который удаляют на обычной зоне. Малоцветкой картинка получается сочнее.
Вообще акварельные рисунки - это мука при обработке.


Буду ещё раз смотреть 2 части видео по обработке зон. Там, вроде, по малоцветке есть информацию. И найти палитру.



Автор: katron, Отправлено:20:48 27-01-2022

ScanKromsator version 6.71 не хочет разрезать страницы если работать с PDF. Проблема сразу видна, инструмент черновая расстановка резаков очень плохо расставляет резаки, на у дальше страницы не режет и не разделяет, в случае если это развороты сканов. При работе с картинками такой проблемы нет. Что делать?

Автор: shch_vg, Отправлено:00:09 28-01-2022

katron

Цитата:
Что делать?

Делать то, что описано в шапке по ссылке зеленого цвета (Что делать, если ScanKromsator не делает то, что хотелось бы...).

Автор: kamenkapenza, Отправлено:15:01 28-01-2022

katron, не мучайтесь! На моем одноименном канале есть видео "Комбинированная работа" , там режется всё быстро. Не знаю, как поступили бы тутошние спецы, я бы перевел пдф-книгу в тиф с помощью Адобе Акробата Про и с этими тифами работал (резал, обрабатывал)

Автор: qwaxym, Отправлено:15:08 29-01-2022


Цитата:
ScanKromsator version 6.71 не хочет разрезать страницы если работать с PDF. Проблема сразу видна, инструмент черновая расстановка резаков очень плохо расставляет резаки, на у дальше страницы не режет и не разделяет, в случае если это развороты сканов. При работе с картинками такой проблемы нет. Что делать?

Не знал что в sk можно напрямую обрабатывать pdf файлы... Это что-то новое))

Автор: TelecomUral, Отправлено:17:10 29-01-2022

qwaxym
импортом. Я же недавно ролик давал, открывал pdf в СК.

Автор: qwaxym, Отправлено:20:58 29-01-2022


Цитата:
импортом. Я же недавно ролик давал, открывал pdf в СК.

TelecomUral, про импорт смотрел! Напрямую, это как я думал, как в акробате, редактируется "непосредственно pdf файл". ))

Автор: daa2013, Отправлено:08:38 30-01-2022

Вот здесь в одном слове полностью не пропечаталась буква:
https://disk.yandex.ru/i/9OQESfTuGL1GZA

Ловит ли такое сейчас CК ?

Автор: bolega, Отправлено:09:55 30-01-2022

daa2013
Словил. На закладке Words выводятся слова, которые СК посчитал сомнительными

[more=скриншоты]

Код:








результат замены двух букв. Задано заменять не все, а только при разнице в 20% и выше


[/more]

Автор: daa2013, Отправлено:10:38 30-01-2022

Здорово.

Но например на первом скриншоте во второй видимой строке я вижу "ходит по кругу нод", хотя там было "под" с разорванной "П". И это новый СК сам заменил !
Так что, возможно, для н/п/и/ш нужен какой-то дополнительный контроль.

Блин. Книжульку, видимо, до появления беты выкладывать мне не стоит ...

Автор: niccolo, Отправлено:10:49 30-01-2022

bolega

На всякий случай, что касается OCR, не забудьте о том, что в документах на одном языке часто бывают вставки на другом - чтобы была возможность выбора нескольких языков OCR/проверки правописания.
Об этом часто забывают или не думают многие разработчики.

Автор: bolega, Отправлено:10:50 30-01-2022


Цитата:
Но например на первом скриншоте во второй видимой строке я вижу "ходит по кругу нод", хотя там было "под" с разорванной "П". И это новый СК сам заменил !

В данном случае "нод" тоже была в списке words, просто здесь я не ставил цели контролировать все слова. По хорошему надо пройтись по списку, подправить буквы на правильные (СК дает такую возможность), проверить список замен, по крайней мере те, где расхождения существенные, и только потом делать замену букв.
А в данном случае получился хороший урок, показывающий, что из-за ошибок тессеракта надо обязательно делать проверку. Кстати, в предпоследнем скриншоте ошибка тессеракта, о которой я упоминал ранее: неверные координаты символов. Но т.к. СК выполняет adjust символов, эта ошибка часто не приводит к последствиям.

Автор: daa2013, Отправлено:11:09 30-01-2022


Цитата:
Кстати, в предпоследнем скриншоте ошибка тессеракта,

Да, я заметил.

Но мне так пока и непонятно. Работает ли СК так:

- переход на букву и демонстрация предлагаемой замены
- если пользователь согласен, то клик
- автоматический переход на другую букву с предлагаемой заменой.

Чтобы можно было только кликать и быстро по книге бежать.
Или надо будет постоянно между закладками переключаться ?


Автор: bolega, Отправлено:12:05 30-01-2022

daa2013

Цитата:
постоянно между закладками переключаться ?

Не понял, какими закладками?


Цитата:
Работает ли СК так:

1 этап (необязательный). Analyse на закладке words чтобы найти сомнительные слова. Можно подправить ocr, либо, если лень возиться, просто исключить слова из анализа.

2 этап. Analyse для поиска замен для всех или заданных глифов. Анализ и подбор выполняется сразу для всей страницы (или только для выделения, если оно есть). Обычно этап выполняется за время от 10 до 20 сек. Результат отображается в списке. Каждый элемент списка - одна замена. Если СК посчитает, что совпадение слишком плохое, замена в списке останется, но не будет отмечена галкой.

3 этап (рекомендуемый). Проверка списка замен, хотя бы до первой трети списка. Отключение ненужных элементов, включение нужных. Для удобства список можно сортировать, например, по степени убывания степени совпадения.

Когда список готов, нажатие apply all применит сразу все активные замены. Есть вариант выборочного применения.
Можно также кнопкой наверху включить интерактивный режим - режим замены по щелчку на букве.
В принципе, когда есть список замен, можно уже придумывать разные способы его воплощения. Но по умолчанию основным способом является пакетный.

Это вкратце. После 3-го этапа можно производить и другие действия, например, отфильтровывать замены. Можно уже в готовом списке замен исправлять одну букву на другую (если обнаружится ошибка распознавания), можно также править целое слово, в обоих случаях подгонка замененных глифов в списке будет выполняться уже автоматически.


Цитата:
быстро по книге бежать

Без 3-го этапа можно и бежать. Но я бы так не советовал.

Добавлено:
niccolo

Цитата:
была возможность выбора нескольких языков OCR/проверки правописания

СК и раньше поддерживал задание нескольких языков.
Соответственно и правописание тоже поддерживается для тех, что заданы.
Другое дело, как тессеракт будет распознавать похожие буквы (чтобы в одном слове не было сразу и русских, и латинских букв). Я не проверял. Но думаю, что результат будет не очень.

Автор: TelecomUral, Отправлено:12:24 30-01-2022


Цитата:
чтобы в одном слове не было сразу и русских, и латинских букв

такое?


оффтоп конечно

Автор: daa2013, Отправлено:12:50 30-01-2022


Цитата:
Не понял, какими закладками?

Видимыми на скриншотах:
Preview/Details/Words/Filters/Options



Цитата:
Анализ и подбор выполняется сразу для всей страницы (или только для выделения, если оно есть).

Да, про это вы и ранее писали. Хочется же последовательный автоматический переход от одной "плохой" буквы к следующей. Клик ЛКМ - замена (предложенная) и переход. Escape - переход далее без замены. В окне же справа, чтобы была видна информация сразу со всех закладок: и список слов, и расцвеченное наложение, и инфа о выбранных фильтрах-параметрах.


Цитата:
Когда список готов, нажатие apply all применит сразу все активные замены.

Это надо покрутить на предмет оценки удобства. За глаза ничего не могу сказать. Но мне кажется, что скорость прохождения страницы тут будет ниже.

Может, альтернативный дополнительный вариант с авто-перемещением попробуете реализовать ?

Автор: TelecomUral, Отправлено:12:50 30-01-2022


Цитата:
Но по умолчанию основным способом является пакетный

хм. а как контролировать что промаха не будет?

Автор: daa2013, Отправлено:12:55 30-01-2022

Насколько я понял, это так:

сначала формируется список замен, только потом он применяется.
То есть каждую замену надо глазами отсмотреть.
Но вот чтобы по этому списку перемещаться, по нему надо руками кликать. А это то самое время, которое и хотелось сэкономить.

Автор: TelecomUral, Отправлено:12:56 30-01-2022

интересно, а у тессеракта есть режим обучения? у ФР есть, подсовываешь плохопознаваемый глиф и приписываешь символ. А у тессеракта, видимо, надо тессдата генерить?

Автор: bolega, Отправлено:13:27 30-01-2022


Цитата:
а как контролировать что промаха не будет?


Так на preview в окошке показан результат замены/наложения. И все проверять не надо, по опыту скажу, максимум примерно треть от списка.
Вам наверно без проверки хочется. Но если от буквы две палки остались, как вы себе представляете без проверки, там на их место и "и" подходит, и "н", и "п" и т.п.


Цитата:
сначала формируется список замен, только потом он применяется. То есть каждую замену надо глазами отсмотреть. Но вот чтобы по этому списку перемещаться, по нему надо руками кликать.


Там же кнопки для быстрого перемещения по списку. "+"-одобряет замену и перемещает на следующий элемент в списке. "-" - отклоняет и перемещает дальше. Есть и хоткеи. Все очень быстро на самом деле. Удобство этого в том, что глаз работает всегда с небольшой областью экрана. Если все это контролировать прямо на скане, то придется бегать взглядом по всему монитору, это очень напряжно.

Но можно и альтернативные варианты придумывать. Но потом. Дайте блин хоть это закончить. Не, ну если хотите чтобы я тянул релиз до следующего года, пожалуйста. Могу не спешить, мне же лучше.

Автор: daa2013, Отправлено:13:35 30-01-2022


Цитата:
ам же кнопки для быстрого перемещения по списку. "+"-одобряет замену и перемещает на следующий элемент в списке. "-" - отклоняет и перемещает дальше.

И как об этом можно было догадаться по скриншоту ?



Цитата:
Дайте блин хоть это закончить. Не, ну если хотите чтобы я тянул релиз до следующего года

Медленно и терпеливо ждём. Не мешаем, не напоминаем, не отвлекаем ...

Автор: bolega, Отправлено:13:37 30-01-2022


Цитата:
Видимыми на скриншотах:

Ну это скорее для отладки и для углубленного анализа информация, если вдруг понадобится. Ну а в опциях, понятное дело, разные опции. Например, искать только 100% совпадения, или наоборот.


Автор: daa2013, Отправлено:03:09 31-01-2022

Да, вот такой еще вопрос.
В режиме прозрачности эталон можно задать (и вклеивать потом пакетом) ?



Автор: bolega, Отправлено:09:02 31-01-2022

daa2013
Можно.
Кстати, теперь СК при вклеивании детектирует кернинг (если включить соответствующую опцию). Если одна буква из-за кернинга какой-либо частью заходит на площадь соседней буквы, то СК проверит их пересечение и аккуратно вклеит ее, не затерев кончики соседних. В предыдущих версиях такого не было, что для ряда шрифтов приводило к небольшому повреждению букв.

Автор: TelecomUral, Отправлено:09:42 31-01-2022


Цитата:
для ряда шрифтов приводило к небольшому повреждению букв

да, это сильно нервирует. Я раньше не знал, что можно глиф с прозрачностью делать, так совсем плохо было.

Автор: bolega, Отправлено:11:27 31-01-2022


Цитата:
В режиме прозрачности эталон можно задать (и вклеивать потом пакетом) ?

Но имейте ввиду, что в этом случае не будут удаляться марашки, которые касаются букв. Ну либо для удаления касающихся марашек нужно будет применить замену еще раз в режиме только удаления марашек, такое тоже возможно. Но лучше всего прилипшие к буквам марашки удаляются в режиме реставрации букв.

Автор: daa2013, Отправлено:12:30 31-01-2022

Да, ИМХО, это очевидно.

Автор: daa2013, Отправлено:11:29 01-02-2022


Цитата:
Я раньше не знал, что можно глиф с прозрачностью делать, так совсем плохо было.

Помимо изготовления прозрачного глифа, непрозрачный глиф можно вклеивать с прозрачностью (не просто кликнуть ЛКМ, а кликнуть ПКМ и выбрать "Merge with transparence"), либо вообще перейти в режим прозрачности вклеиваемого: снова-таки после пасте вместо ЛКМ нажать клавишу T, и только потом вклеивать. (Отключение режима - повторное нажатие T).

Автор: TelecomUral, Отправлено:11:46 01-02-2022

daa2013
угу, спасибо!

Добавлено:
bolega
Хочу после хоткея "convert to ellipse selection" добавить область (через Shift). Однако при первом же нажатии ЛКМ эллиптическое выделение пропадает. Сие есть баг или фича?
Вопрос вызван примером от zaaley на publ.lib.ru про книгу Челышева. Там картинка не просто эллипс, а с выступающими за контур уголочками. Хотел их захватить через полигональные области в эту же зону.

Автор: bolega, Отправлено:16:15 01-02-2022


Цитата:
Хочу после хоткея "convert to ellipse selection"

В MW или VR?
Не смог воспроизвести. Ни там, ни там

Автор: TelecomUral, Отправлено:16:46 01-02-2022

bolega
В MV.
Странно, и я не смог повторить, как ни бился. Всё чётко работает. А предыдущий запущенный экземпляр - не хотел объединять области. Именно при хоткее на эллипс. Я раза три проверил.
Ну ладно, подождём

UPD
сейчас посоображал, в чём отличие в поведении экземпляров. При попадании мышки на эллиптическое выделение вид курсора не менялся, оставался стандартной стрелочкой-указателем. Контур пунктирный был виден, а действия - как будто его нет.

Автор: bolega, Отправлено:16:54 01-02-2022

TelecomUral
В новой версии есть режим принудительного мультивыделения. Правда, пока только для VR

Добавлено:

Цитата:
а действия - как будто его нет.

Может, зона как-то повлияла? Или включенный режим mouse-up. Наложилось и получилась неуловимая комбинация для бага, такое бывает

Автор: TelecomUral, Отправлено:17:04 01-02-2022

Не, всё проще Я таки вспомнил, и воспроизвёл.
Я тогда на прямоугольнике щёлкнул ПКМ, хотел Zoom selection вызвать. Но передумал, типа, нафиг тут точность. И щёлкнул мимо всплывшего меню на прямоугольник выделения, чтобы меню пропало. Вызвал хоткей, эллипс получился. А вот Shift+ЛКМ уже увы.

Автор: bolega, Отправлено:17:15 01-02-2022

А я не воспроизвел. Да и не может меню повлиять на это

Автор: TelecomUral, Отправлено:17:42 01-02-2022

нда... неустойчиво...
Что-то тут не то.
А вот вспомогательный вопрос: если при нажатом Shift щёлкнуть и отпустить ЛКМ, выделение должно пропасть? Сейчас пропадает. Я вот присмотрелся сам к себе - может, это я косячу, в мелком масштабе просто мимо мелких кусочков промахиваюсь, и дело в том, дрогнула в это время мышь или нет - ? Увеличил эллипс по ширине экрана, и уловил этот нюанс - если мышь тянуть, то всё чётко плюсуется, а если щёлкнуть и отпустить, поняв, что ошибся с местом щелчка, то неустойчивое поведение. Я-то был уверен, что раз я Shift зажал и держу, то никаких пропаданий имеющегося выделения быть уже не должно. В других программах именно так привык.

Автор: bolega, Отправлено:18:54 01-02-2022


Цитата:
то никаких пропаданий имеющегося выделения быть уже не должно. В других программах именно так привык.

Я уже несколько раз объяснял, почему так. Редактор распознает действие пользователя не по нажатию мышки, а по ее отпусканию. Иначе неопределенность, что хотел сделать пользователь: выделить объект щелчком, или начать обычное выделение. Если в момент окончания щелчка есть выделение, значить было выделение, если нет - была попытка выбрать какой-то объект (например, зону или то же выделение) и тогда СК ищет что находится в точке щелчка.
Обычно другие редакторы решают эту проблему введя кнопку, нажатие который переводит редактор в режим выбора объекта. В СК это было бы ужасно неудобно. Например, вы нарисовали зону и захотели ее тут же отредактировать, тогда нужно нажимать эту кнопку, потом снова отжимать и т.д.
И зачем каждый раз приводить в пример другие программы? У СК свои особенности интерфейса, заточенные под задание зон, mouse-up режимы и т.п.

Автор: daa2013, Отправлено:20:39 01-02-2022

Подумал о следующем.

Не будут ли умляуты, ударения, диакритические знаки восприниматься как спеклы и вычищаться ? Может, для них какую-то доп.защиту встроить ?
Например:
а) встроенную в СК библиотеку таких знаков
б) для гласных букв принудительный показ пользователю спеклов в зоне расположения таких знаков (сверху буквы).

Добавлено:
Еще одна идея появилась.
Допустим, произошли замены внутри выделения или на всей странице.
Как понять полезны они или вредны ? Организовать переключение (мигание) было/стало по PageUp, например. !
Т.е. юзер жмет клавишу и переключается на было, еще раз на стало, затем снова было - и т.д.
При таком постоянном переключении глаз и заметит, что изменилось. А при непрерывном повторении и определит степень полезности.
Но только это не автомигание, а именно по нжажтию клавиши переключение должно быть. И с достаточно высокой скоростью (индивидуально оптимальной для скорости чтения каждого пользователя).




Автор: bolega, Отправлено:22:15 01-02-2022


Цитата:
Не будут ли умляуты, ударения, диакритические знаки восприниматься как спеклы и вычищаться ?

А есть примеры?
Если вы про обработку, задайте такие буквы как despeckle-protected на закладке Protect окошка exclusive page options. Ударения так уже не задашь, но они больше точек, а точки при обычном despeckle не вычищаются.


Цитата:
юзер жмет клавишу и переключается на было, еще раз на стало, затем снова было

Это делается через undo/redo. Redo пока в СК нет.

Автор: TelecomUral, Отправлено:01:42 02-02-2022


Цитата:
И зачем каждый раз приводить в пример другие программы?

для объяснения. Видите, я даже не заметил сначала, в чём отличие. Посчитал багом. Теперь понятно.
Замечу, что в режиме лассо щелчок и отпускание не приводят к "выбору объекта"

Автор: daa2013, Отправлено:04:31 02-02-2022


Цитата:
А есть примеры?


https://disk.yandex.ru/d/soOk7rOmN1U0Tg

Левое и правое ударения:


поэтому я тут сам не сразу сообразил, что это тоже ударения



Здесь - такой знак встречается только один раз на всю книгу:



Добавлено:

Цитата:
Это делается через undo/redo. Redo пока в СК нет.


Чтобы не мышью, а с клавы это делать, им будут нужны хоткеи.

Автор: daa2013, Отправлено:07:08 02-02-2022

И еще возникла мысль. Вот я делаю Анду-Реду. Вижу ошибочную замену и втыкиваю правильный глиф. Ведь после этого Анду-Реду прекратит работу ? и будет помнить только последнюю коррекцию ?
А хотелось бы чтобы он как-то фиксировался именно на большой замене области или страницы (возможно, большой замене+малой коррекции), чтобы можно было переключением было-стало проверять дальше.

Автор: bolega, Отправлено:08:40 02-02-2022


Цитата:
Замечу, что в режиме лассо щелчок и отпускание не приводят к "выбору объекта"

И это специально. Иначе нельзя было бы поставить вершину в месте, уже занятом зоной.


Цитата:
Ведь после этого Анду-Реду прекратит работу ?

Да. Тогда undo/redo не пойдет.
Кстати, в окошке preview сейчас так и сделано. Там выводится наложение глифа на букву скана и цветами показано расхождение. Если нажать ЛКМ, будет показан результат наложения, если нажать ПКМ, будет показана исходная буква.

Добавлено:

Цитата:
https://disk.yandex.ru/d/soOk7rOmN1U0Tg

И что именно у вас там пропадает, и при каких параметрах обработки?

Автор: daa2013, Отправлено:08:55 02-02-2022

Поскольку новой версии у меня нет, то я всё делаю ручками, и у меня ничего не пропадает
Но, если я при контроле глазами нахожусь на грани ошибки, то возникают опасения, что для авто-режимов не помешает дополнительный контроль.

Повторно сформулирую идею: если удаляемый спекл/марашка находится в чувствительной области (вверху гласной буквы), то принудительно показать этот участок юзеру для дополнительного подтверждения действия по удалению. Возможно не всегда, а когда включен некий параметр "контроль диакритики".

https://ru.wikipedia.org/wiki/%D0%94%D0%B8%D0%B0%D0%BA%D1%80%D0%B8%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B5_%D0%B7%D0%BD%D0%B0%D0%BA%D0%B8

Добавлено:

Цитата:
Кстати, в окошке preview сейчас так и сделано. Там выводится наложение глифа на букву скана и цветами показано расхождение. Если нажать ЛКМ, будет показан результат наложения, если нажать ПКМ, будет показана исходная буква.

Проблема тут в том, что для контроля правильности нужно видеть слово целиком, иногда даже в тексте:

Это исходник, если что:

Автор: bolega, Отправлено:09:11 02-02-2022


Цитата:
Повторно сформулирую идею: если удаляемый спекл/марашка находится в чувствительной области (вверху гласной буквы), то принудительно показать этот участок юзеру

А я повторно поинтересуюсь: про какое удаление идет речь. Во время обработки никакого показа не предусмотрено. Это невозможно. В окне VR подсветка есть и сейчас. Смотрите и контролируйте сколько хотите. Я не пойму, что вы хотите.

Автор: TelecomUral, Отправлено:09:14 02-02-2022


Цитата:
А есть примеры?

https://disk.yandex.ru/d/HPZuwoN61NGAzA
особенно U с двумя штришками сверху. 10я строка в списке l4_0031a.jpg

Автор: bolega, Отправлено:09:16 02-02-2022

Вы дали пример обработанных сканов, похоже по методике начала 2000-х. Что вы там собрались обрабатывать? Мы обсуждаем замену глифов. Какое отношение к этому имеет удаление спеклов?

Автор: daa2013, Отправлено:09:25 02-02-2022


Цитата:
мотрите и контролируйте сколько хотите. Я не пойму, что вы хотите.


Хорошо.
Буду копить примеры и когда появится новая версия, и если с этим будут наблюдаться проблемы, то тогда сформулирую идею повторно и конкретнее. Книг с диакритикой, кстати, мне тоже ранее как-то особо не попадалось.
В данный момент я ничего не хочу. Я делюсь идеями, которые у меня возникают о работе программы, которую я еще не крутил и опираюсь пока только на собственные представления о её функционировании.

Добавлено:

Цитата:
Вы дали пример обработанных сканов, похоже по методике начала 2000-х. Что вы там собрались обрабатывать? Мы обсуждаем замену глифов. Какое отношение к этому имеет удаление спеклов?

Я там буквы с глифами восстанавливаю.

Добавлено:

Цитата:
Какое отношение к этому имеет удаление спеклов?

Кажется понял вопрос.

Вот я задал параметр отбора "разорванная буква" (из N частей). Он эквивалентен моему буква+спекл (красная буква) - т.е. в ячейке тессеракта помимо буквы есть еще какой-то штришок. Происходит замена, штришок пропадает. А это та-дам - была диакритика.

Добавлено:
Ну, или наплыв сверху +20%


Добавлено:
Или там триггер какой есть, удалять не удалять спеклы внутри ячеек при замене на идеальные глифы ?

Автор: bolega, Отправлено:10:17 02-02-2022

TelecomUral

Цитата:
особенно U с двумя штришками сверху. 10я строка в списке l4_0031a.jpg

О, известный случай - список литературы на нескольких языках. Хуже не придумаешь. Я обычно задаю для таких страниц despeckle=fine-2. И все получается нормально.
Попробовал ради интереса сделать ocr. Задал rus+eng+deu, получилось плохо, все немецкие диакритич. буквы распознались как английские. Задал rus+deu, получилось более-менее.

daa2013

Цитата:
т.е. в ячейке тессеракта помимо буквы есть еще какой-то штришок. Происходит замена, штришок пропадает.

Нет, СК делает не так. Все сложнее. Заменяется не ячейка тессеракта (это было бы слишком опасно), а ячейка глифа. Как правило, эти ячейки никогда не совпадают. Да и в любом случае размеры самих букв (эталона и реальной буквы скана) тоже не совпадают, после вклеивания по периметру в промежутке между ячейками глифа и тессеракта остается мусор. И вот здесь начинается самое интересное. Ранее надо было это мусор вычищать самому. Теперь есть режим, при котором СК сам чистит ошметки. Т.е. СК после замены буквы как бы прибирает в окрестностях замены, убирает спеклы и марашки. Размер спеклов используется тот же, что и при mouse-up-despeckle или подсветки. Если он стандартный, то потери маловероятны, но и чистка так себе. При оптимальном размере спеклов чистится намного лучше, но в примере

Цитата:
Ну, или наплыв сверху +20%

действительно, диакритика удалится, т.к. касается буквы. Чтобы СК не трогал мусор (или похожее на мусор), нужно, чтобы он был хотя бы на 1 пиксел отстоял бы от ячейки глифа. Все, что касается ячейки и имеет размер меньше предельного спекла, будет удалено. Я назвал такую авто-зачистку remove touching.
Если есть опасения на этот случай, то можно включить режим подсветки remove touching. Тогда вместо удаления всего того, что я описал выше, оно будет просто подсвечено. В этом случае удаление станет полностью контролируемым.
UPD
Можно в принципе усложнить remove touching, приняв для пространства над буквой другой порог размера спекла, сделав его более безопасным. Можно сделать это только для гласных, знать бы только как их отличать для других языков. Но повторю, если между ячейкой глифа и спеклом будет хотя бы одна пустая строка, СК спекл не тронет. Например, буквы "ё" как правило безопасно заменять буквой "е", точки не пострадают. То же и для "й"-"и".

Автор: daa2013, Отправлено:10:40 02-02-2022


Цитата:
действительно, диакритика удалится


Цитата:
Если есть опасения на этот случай


Ага.

Теперь смотрите - это единственная "о" с крышкой на всю книгу и появляется она на 167-й странице. (Крышка, кстати, была прилипшей.) Пока я до неё с чисткой руками не дошел, никаких опасений у меня и не было. В авто-режиме легко мог бы и пропустить.
Теперь повторю своё предложение - если спеклы или наплывы (подсвечиваемый touching) находятся в чувствительной зоне ячейки тессеракта (вверху гласной буквы - как наиболее типичный случай, но тут может быть и заданная пользователем согласная - польский, чешский, эсперанто) придумать какой-то дополнительный механизм индикации помимо обычной подсветки спеклов.

Я бы на глаза пользователю подсовывал. Можно в какой-нибудь пока еще неиспользуемый вырвиглазный цвет красить вместо обычной подсветки.

Автор: bolega, Отправлено:10:55 02-02-2022


Цитата:
придумать какой-то дополнительный механизм индикации помимо обычной подсветки спеклов.

А вы представляете сколько обычного мусора бывает в этой области, который вы советуете подсвечивать вырвиглазным цветом. И все это ради одной буквы в книге???
Я согласен, идея полезная, но надо учитывать, что в реальных условиях количество ложных срабатываний может быть велико (при наложении глифа на плохую букву сверху очень часто остается мусор, помимо того, что имеется там изначально).

Автор: daa2013, Отправлено:11:17 02-02-2022

Тогда можно так.
Допустим, конкретную букву я не знаю, но возможность существования диакритики предполагаю. (Знаю, что в книге есть странные иностранные языки.)
Тогда включаю этот спецрежим.

Автор: bolega, Отправлено:12:36 02-02-2022

Подсветка, о которой я говорил. В том числе марашки, касающиеся букв, одной или сразу двух соедних.

Автор: TelecomUral, Отправлено:12:47 02-02-2022

bolega
круть наикрутейшая.

а почему внутри "древних языков" спекл не засвечен?

Автор: bolega, Отправлено:12:57 02-02-2022

daa2013
Я подумал, что подсветка потенциальной диакритики, даже вырвиглазом, может быть бесполезна. Небольшие спеклы просто легко не заметить, хоть как их ни расцвечивай. Проверял на себе не раз. А вот сделать как фильтр в списке замен не сложно. Есть предложения как их отличать от мусора, чтобы максимально отсеять ложные? Например, особые размеры (в долях размера буквы), и т.п.

Автор: daa2013, Отправлено:13:12 02-02-2022


Цитата:
Небольшие спеклы просто легко не заметить, хоть как их ни расцвечивай.

Согласен, именно поэтому я предлагаю подсовывать ячейки с ними пользователю на центр экрана. Т.е. не он глазами такое ищет, а СК перемещает фокус вьюера на сомнительное место.

Как уже писал ранее, для привлечения внимания также можно накладывать что-то типа мишени:




Цитата:
Есть предложения как их отличать от мусора, чтобы максимально отсеять ложные?

Почти не встречал при обработке диакритику. Но подумаю.
Словари слов, библиотека значков, ...
ИМХО чувствительная зона внутри ячейки тессеракта для гласных даст не так много срабатываний, как вам кажется. Хорошо бы такое попробовать как работает. ...
Но это я вокруг уже звучавших предложений кручусь.

Я подумаю.

Автор: bolega, Отправлено:13:13 02-02-2022


Цитата:
а почему внутри "древних языков" спекл не засвечен?

Потому что он не касается ячейки глифа. Т.е. это обычный спекл, который удаляется стандартным способом, без применения нового алгоритма, напр., простой подсветкой спеклов. Если применять не просто подсветку, как в примере, а полную замену букв (реставрацию), то тогда он уйдет автоматом. А в примере именно показано, как без замены букв можно почистить скан от марашек. Вдруг вы не хотите заменять все буквы на эталонные.
Нет, не так. Там 3 уровня граничной чистки. Сейчас включил другой уровень, и подсветился и упоминаемый спекл. Но это плохо сказалось на другой букве, одной, но все же. Там сложный случай, который я пока не знаю как решить. Поэтому и уровень выбран не самый мощный. И это проявляется именно при граничной чистке/подсветке, при полной реставрации все ок.

Автор: TelecomUral, Отправлено:13:37 02-02-2022


Цитата:
Есть предложения как их отличать от мусора, чтобы максимально отсеять ложные?

мне немного приходилось листать юникодовские таблицы на эту тематику. Всякие "А с точкой снизу" и тэ пэ. Алфавиты разные в мире, и встречается очень разное. Логики не уловил. Поэтому приходит на ум только подключение образцов конкретного шрифта. Типа "для проверки на диакритику используй шаблоны из таких-то языков, такого-то кегля". Иначе - трудно.
Для европейских и ближневосточных всё очень просто: дополнения к латинской/базовой букве располагаются по восьми областям вокруг основной буквы, и мелкими не бывают (обычно), то есть заполняют почти всю отведённую область. Средняя верхняя и средняя нижняя могут быть расширены вбок симметрично, но менее чем до середины боковых областей. Какая-нибудь тильда надстрочная так выглядит, на память. Но вот титло церковнославянское, по-моему, всегда накрывает букву с запасом.

UPD
ИМХО
всё же, если СК использовать "интернационально", то системно-правильный вариант обработки с OCR это указывать, какие конкретно шрифты применены в книге в конкретном месте. "в данном task: Гарнитура Литературная, кегль 9пт", "зона OCR, шрифт моноширинный Courier Cyr кегль 7,5пт".

+
и адрес типографии указывать: "Вологда, комбинат №1, конец квартала, бумага №2, и краски недолили (разбавили)"



UPD2
вот такие непропечатки возьмёт новый СК?

"с" в 4й строке снизу.

Автор: daa2013, Отправлено:15:11 02-02-2022


Цитата:
истемно-правильный вариант обработки с OCR это указывать, какие конкретно шрифты применены в книге в конкретном месте. "в данном task: Гарнитура Литературная, кегль 9пт", "зона OCR, шрифт моноширинный Courier Cyr кегль 7,5пт".


можно попробовать тут образцы выдернуть
www.dxtf.ru

или еще где бесплатные варианты посмотреть

Автор: AlexeiPetrov, Отправлено:16:09 02-02-2022

Столько много вкусностей, а в программе я этого никак не могу найти. Где же всё это?

Автор: bolega, Отправлено:17:01 02-02-2022


Цитата:
то системно-правильный вариант обработки с OCR это указывать, какие конкретно шрифты применены в книге в конкретном месте

А как это можно применить?
Все основное зависит от тессеракта. Остальное вторично. Хороший ocr решает все.

Добавлено:
AlexeiPetrov
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2020#17

Добавлено:

Цитата:
вот такие непропечатки возьмёт новый СК?

Надо проверять. Скорее всего возьмет

Автор: D1D1D1D, Отправлено:17:41 02-02-2022

bolega

Цитата:
Попробовал ради интереса сделать ocr. Задал rus+eng+deu, получилось плохо, все немецкие диакритич. буквы распознались как английские. Задал rus+deu, получилось более-менее.  

Хорошо получается, если полностью отключить языки ФайнРидера и создать свой со своим алфавитом, в котором перечислены все встречающиеся в тексте символы — с умляутами и тп.

Автор: daa2013, Отправлено:17:51 02-02-2022

Про диакритику.

Идея № 1. Создать набор эталонных символов диакритики. (встроить внутрь СК.) Потом брать верхнюю и нижнюю субячейку от основной буквенной ячейки, где она может быть; отделять от базового символа; затем делать OCR субячейки с возможным знаком или еще каким методом определять близость к эталонному знаку диакритики.
И только уже после определения знака диакритики определять наличие буквы с диакритикой.

Вроде тессеракт можно натренировать на пользовательские знаки.
Либо после определения потеницальной дикаритики и следовательно потеницальной буквы с диакритикой, можно эту букву включить в набор символов используемых тессерактом.

UPD: Их же не так и много в конце-концов, если без экзотики.




Идея №2
Вот тут в патенте (насколько я понимаю суть всей написанной бредятины) они меряют не расстояние от диакритики до буквы, а от диакритики до базовой линии и это дает лучшие результаты. Ну и картинки в патенте забавные.
Впрочем, возможно, что это только только для арабского справедливо.
https://patents.google.com/patent/US8977057B1/en


Идея #3

вот тут
https://cyber.felk.cvut.cz/theses/papers/444.pdf

для идентификации используются следующие характеристики диакритики


Автор: TelecomUral, Отправлено:18:38 02-02-2022


Цитата:
Хорошо получается, если полностью отключить языки ФайнРидера и создать свой со своим алфавитом

вот кстати да! Я когда-то пробовал так - распознавание улучшалось на порядок, страница идёт часто со 100% опознавания. Было бы изумительно, если бы СК сумел запрограммировать используемый модуль тессеракта на основе найденных глифов. Эдакая самоподстройка и второй прогон.

Добавлено:

Цитата:
А как это можно применить?

по принципу, как и вышесказанное: известен шрифт, то есть известен контур. Точнее опознавание.

Автор: slava_kry, Отправлено:07:54 03-02-2022

Робяты... я, конечно, извиняюсь, но не пришли ли вы в результате своего рвения к понятию "перевёрстка"!?
Просто слегка завуалированному.

Автор: daa2013, Отправлено:10:34 03-02-2022


Вот тут к опознанию диакритики в алибата (Филиппины) якобы метод опорных векторов применили:


https://peerj.com/articles/cs-360.pdf


https://github.com/rbp0803/An-OCR-System-for-Baybayin-Scripts-using-SVM



Автор: Archivist, Отправлено:11:20 03-02-2022


Цитата:
не пришли ли вы в результате своего рвения к понятию "перевёрстка"!?

В идеале, к этому все и придет через N лет. Нейросети будут выдавать и проверять векторный текст, неотличимый на глаз от оцифрованного исходника.

Автор: daa2013, Отправлено:06:19 07-02-2022

Некоторое время назад я высказывал пожелание:


Цитата:
Еще одна идея пришла. Не знаю заранее, насколько будет полезно. (Т.е. это не хотелка.)
Если есть выделение и ставится глиф, то ищется его лучшее положение внутри этого выделения. (возможно лучшее положение верхнего угла внутри выделения). Так можно полностью контролировать зону поиска. Расширять/сужать.


Оказывается, что в 6.71 это уже реализовано. И, оказывается, что это несколько неудобно.
Я незаметно для себя ставлю выделение. Потом оно уползает за пределы видимой на экране зоны. Потом я ставлю глиф. И не вижу этого ! А он оказывается черти где (там где выделение). Я могу его и повторно воткнуть, думая что просто плохо нажалось пасте.

Хотелка:
Либо полный запрет вставки в невидимой для юзера области.
Либо (что лучше) в преференсах чекбокс. Вставка в выделенной области (если она есть) - или вставка строго в окрестности курсора мышки (невзирая на выделения).

Автор: TelecomUral, Отправлено:08:45 07-02-2022


Цитата:
думая что просто плохо нажалось пасте

на такие случаи удобно звуком подтверждать.

Автор: daa2013, Отправлено:08:49 07-02-2022

Я без звука работаю !

Автор: TelecomUral, Отправлено:13:20 07-02-2022

мелкий баг, как я понял: если из режима Clear метёлки вызвать клонирующий инструмент, а потом его отключить, то при выделении пунктир становится красного цвета, хотя инструмент Clear не выбран, и пунктир висит на странице после отпускания кнопки мыши. Как обычное выделение сделано.

Автор: shch_vg, Отправлено:13:27 19-02-2022

bolega
Сейчас в периодике приходится делать много пикчер-зон в полигональном режиме.
Довольно часто при двойном щелчке на последней точке выделения зона создается с сопровождающим сообщением: Zone has a self-intersecting edges! Приходится убивать зону и создавать ее заново.
На одном из фото удалось сделать зону только с пятого раза.
Можно ли как-то контролировать это?

Автор: TelecomUral, Отправлено:16:43 19-02-2022

shch_vg
зумом самое надёжное, по опыту. На мелких масштабах мышка дрожит при щелчках, получаются самопересечения. Поэтому приблизили и начали прощёлкивать узлы. Надо подвинуть экран за ползунки - не проблема, окно это позволяет прямо во время прощёлкивания.
upd
Если место пересечения одно, то проще узел подвинуть.

Автор: shch_vg, Отправлено:19:27 19-02-2022

bolega
Странное поведение режима создания дежавю.
Прежде чем зайти в него, заметил, что один скан повернут на 90 град.
Развернул его в нужном направлении, вошел в окно создания дежавю.
В окне этот скан позиционируется правильно. Делаю дежавю и в результате получаю начальное положение этого скана, повернутое на 90 градусов.

TelecomUral
Это тоже неудобный вариант. Проставляю зоны в режиме главного окна "По ширине", зафиксировав это в настройках. Если я буду зумом увеличивать, то на следующем окне буду иметь увеличенный вариант главного окна, и, как результат, мне придется искать следующее фото на последующих расширенных окнах.

Автор: TelecomUral, Отправлено:19:37 19-02-2022

shch_vg
тогда монитор покрупнее
кто мешает щелкать в конце снова "по ширине" - ?

Вы же понимаете, устранить неточное нажатие программно невозможно, критериев нет. Охватывающий полигон обычно тоже не помогает.

Автор: woodyfon, Отправлено:11:45 21-02-2022

При обработке сканов, обнаружил, что Ширина и Высота изображения в пкс от страницы до страницы разная. Т. е. одни страницы имеют размеры, например, Ш*В=3834*5340, а другие в два раза меньше: 1917*2670. Как размеры можно привести к единому значению? Пробовал установить размеры книги на вкладке Book, но к ожидаемым результатам это не привело.
+
Нашел изменение размера: в Result view вызвать контексное меню и выбрать Special... -> Resize...
Но после установки нужных размеров (увеличение в два раза) исходная страница "не разтягивается". Находится в левом верхнем углу.

Автор: trion1, Отправлено:11:56 21-02-2022


Цитата:
...Приходится убивать зону и создавать ее заново...
Было бы лучше не "убивать", а отредактировать...

Автор: TelecomUral, Отправлено:12:11 21-02-2022

woodyfon
Это вопрос новичка. Полистайте Хрестоматию по СК (в шапке есть) о расчёте габаритов и финализации. Объяснять вам тут всё и с нуля будет долго и непродуктивно.

upd
немного поразмышляв о "теоретических причинах" (а их может быть штук пять), возникла мысль: может, вы на закладке Files оставили DPI "Original"? Если сканы разных разрешений и вы хотите привести их к одному, то самое удобное выставить тут выходное разрешение всей книги.

Автор: shch_vg, Отправлено:12:48 21-02-2022

trion1

Цитата:
Было бы лучше не "убивать", а отредактировать...

Умный совет, только забыли написать как...

Автор: woodyfon, Отправлено:12:57 21-02-2022


Цитата:
Полистайте Хрестоматию по СК (в шапке есть) о расчёте габаритов и финализации.

Понимаю, что мой вопрос новичка. Но пока не могу разобраться как запустить финализацию, хотя в более ранних версиях запускад без проблем. По некоторым соображениям сейчас не могу загрузить хрестоматию и детально с ней ознакомиться. Натолкните, пожалуйста, куда копать, дальше точно сам разберусь. Неоднократно возвращался к Scan Кромсатору, но отталкивало, что нужно потратить достаточно много времени на ознакомление с возможностями программы. Когда редко обрабатываешь сканы, приходиться выбирать между временем и получаемым результатом.

Автор: bolega, Отправлено:13:22 21-02-2022

shch_vg

Цитата:
Довольно часто при двойном щелчке на последней точке выделения зона создается с сопровождающим сообщением: Zone has a self-intersecting edges! Приходится убивать зону и создавать ее заново.

Если область самопересечения небольшая (в пределах десятка пикселей от ближайшей вершины), просто игнорируйте. Это не скажется на результате. По крайней мере в случаях, когда края зоны выделяются не с супер-пиксельной точностью.


Цитата:
Странное поведение режима создания дежавю.

Это как посмотреть. Поворот скана - это опция обработки. А создание djvu не выполняет никакой обработки, все опции игнорируются. Не зря же для djvu создается out-задание, т.е. задание, в котором уже ничего обрабатывать не предполагается.
С другой стороны, можно было конечно для поворота сделать исключение. Я уже думал над этим.

Автор: TelecomUral, Отправлено:13:23 21-02-2022

woodyfon
я надеюсь, СК у вас 6.71 ? а то мало ли

Я конечно попробую что-то вслепую подсказать. Но не обессудьте...

1. вам надо определиться, чего вы хотите от готовой книги: просто обрезать или сначала сделать страницы одинаковыми. Я предполагаю, что вы хотите того же чего хочет большинство: одинаковых страниц в дпи=600. И что вы не снимали галки Automargins у страниц
2. раз вы уже получили результат в окне VR, наверное и габариты на закладке Book УЖЕ рассчитаны. Посмотрите - там будут большие числа, типа Fixed=5340.
3. предполагаю что вы установили на закладке Files выходной дпи=600.
4. переобработайте все сканы. В окне VR не задерживайтесь
5. в меню Process вызовите Calculate book size...
6. посмотрите что теперь на закладке Book, какие стали габариты.
7. пробегитесь в окне VR по обработанным страницам, ничего на них не меняйте. Возможны, я думаю, три варианта:
- все страницы имеют одинаковые и нужные вам габариты. -- вопрос закрыт
- часть страниц половинного размера -- тогда выкладывайте задание.
- почти все страницы какие надо, но пара-тройка имеет ненормальные габариты

При этом текст у вас залит жёлтым, то есть финализация не проведена (поля не надставлены).

Для последнего варианта вернитесь в главное окно и посмотрите на параметры дпи этих исходных сканов.
С ними возможно надо повозиться отдельно.

Я надеюсь что с габаритами у вас станет все в порядке и нужно в главном окне вызвать Finalize...

upd
для варианта номер два вполне вероятно что часть реальных сканов у вас в 300, а ВХОДНОЙ DPI на закладке Files вы принудительно поставили 600. Там галочка для этого есть. Ну вот тогда запросто получите именно половинные габариты - СК 300 оставит как "600", удваивать не станет.
А уж если вы automargins сняли ...

Добавлено:

Цитата:
Умной совет, только забыли написать как...

на выделенной зоне ПКМ>Edit vertexes... и таскайте узлы на здоровье. А также удаляйте их или добавляйте.

Автор: shch_vg, Отправлено:16:39 21-02-2022

TelecomUral

Цитата:
Я конечно попробую что-то вслепую подсказать. Но не обессудьте...

У Вас появились черты экстрасенса.
А мне кажется все проще, вопрос о том, как запустить обработку с финализацией, т.к. получать разные по размеру сканы можно только при обработке без финализации.

А для обработки с финализацией нужно:
1. галочка в окошке Automargines на закладке Page у всех сканов
2.На закладке Book в списках Page width и Page height значения auto
3. Нужное значение в поле H.Gap value для полей обработанного скана

Вроде бы все.
Программа сама выровняет сканы с разным дпи, если они были не умышленно изменены, а просто некоторые сделаны в 300, а некоторые в 600дпи.

P.S. Если известны заранее линейные размеры выходного скана, то можно их подставить вместо нулей в полях, указанных в п.2, заменив значения в списках на Fixed.

Автор: TelecomUral, Отправлено:22:54 21-02-2022


Цитата:
вопрос о том, как запустить обработку с финализацией

Не думаю, это самый простой случай. Неактуальный. Ко мне в личке намного чаще обращались со словами "да я уже половину почистил, не хотелось бы запускать бинаризацию заново..." Такие извраты требуют глубокого понимания, как работает расстановка полей и тэ пэ.

Автор: shch_vg, Отправлено:23:49 21-02-2022

TelecomUral
Думаю, что вопрос woodyfon до таких глубин не опускался.


Добавлено:
bolega

Цитата:
С другой стороны, можно было конечно для поворота сделать исключение. Я уже думал над этим.

А можно и не думать
Я просто забыл, что единичный скан можно повернуть прямо на месте.
Эта возможность интересна для группового поворота, но его нужно делать в основном задании.

Кстати, в связи с этим спрашивается вопрос, а вариант несовершения обработки распространяется и на создание пдф?

Автор: bolega, Отправлено:08:57 22-02-2022


Цитата:
Кстати, в связи с этим спрашивается вопрос, а вариант несовершения обработки распространяется и на создание пдф?

Создание pdf выполняется по кнопке, которая выполняет обработку. Поэтому возможна любая обработку. В этом отличие от djvu, которое создается с помощью отдельного визарда, не связанного с обработкой.
Еще отличие в том, что pdf создается непосредственно СК, а djvu - с помощью сторонних программ.

Автор: Benoni, Отправлено:21:13 22-02-2022


Цитата:
Создание pdf выполняется по кнопке

Есть волшебная кнопка? Какая?

Автор: shch_vg, Отправлено:23:24 22-02-2022


Цитата:
Есть волшебная кнопка? Какая?

Написано же:
Цитата:
по кнопке, которая выполняет обработку.

Автор: woodyfon, Отправлено:04:20 24-02-2022

shch_vg

Цитата:
А для обработки с финализацией нужно:
1. галочка в окошке Automargines на закладке Page у всех сканов
2.На закладке Book в списках Page width и Page height значения auto
3. Нужное значение в поле H.Gap value для полей обработанного скана

Ваше пояснение более понятнее и конкретнее. Дошел методом проб и ошибок последовательно до двух пунктов.
Есть скан с геометрическим искажением. Возможно ли это подправить непосредственно в ScanKromsator или для этого потребуется использование BookRestorer? Пробовал выставлять галочки на Art и Ortho для конкретной половинки разворота (правая), но это не привело к желаемому результату.
PS. Должен признать, что при достаточной сноровке и умению (хотите времени) SK выдает более качественный результат, чем Scan Tailor.

Автор: daa2013, Отправлено:05:42 24-02-2022

bolega
А я правильно понимаю, что если у меня глобально происходит замена И-Н при джву кодировании, то я могу через protect как-то назначить их внутренности зонами щадящего кодирования ? Не можете уточнить, как именно ?

А если мне это чудится, то, может, предусмотреть такую возможность через тессеракт-ячейки ?

(Ранее у меня был план: найти внутри джву не пострадавшие И, Н, и именно их по всей книге размножить. Но мне это не очень нравится.)

Автор: shch_vg, Отправлено:12:15 24-02-2022

woodyfon

Цитата:
Есть скан с геометрическим искажением. Возможно ли это подправить непосредственно в ScanKromsator

Нет, СК геометрических искажений не исправляет.

Автор: daa2013, Отправлено:22:14 27-02-2022

А почему на external zone состав фильтров не совпадает с обычной picture zone ?

Нпаример, blur есть, а blur2 нету. Sharpen2 нету.
Закладки Blur и Filter2, а там Filter2, Filter3 .

Получается, что у обычных зон интерфейс поменяли, а у внешних в оут задании - старый оставили.

Автор: niccolo, Отправлено:17:07 28-02-2022

Bolega - нет ли опции нумерации зон с привязкой к номеру страницы - типа ris № стр.-№ зоны, а не по порядку в пакете в целом?

PS. Полигональные зоны в панельке - по сути не полигональные а рисуемые (Freehand)... Сильно обманывает такое название

Автор: daa2013, Отправлено:19:20 28-02-2022

В 6.71 странно работает режим подсветки спеклов в раскрашенных зонах.
Он включается только после того как отжать/зажать кнопку подсветки. А просто при вставании на зону, когда он включен, не горит.

Без такого перещелкивания, кстати, и красная метелка там не работает.

Автор: bolega, Отправлено:14:48 01-03-2022


Цитата:
В 6.71 странно работает режим подсветки спеклов в раскрашенных зонах.

Посмотрел, да, было дело. В новой версии уже исправно. Сейчас все нормально.


Цитата:
А почему на external zone состав фильтров не совпадает с обычной picture zone ?

Потому что за последние 15 лет это никому не понадобилось.


Цитата:
нет ли опции нумерации зон с привязкой к номеру страницы - типа ris № стр.-№ зоны, а не по порядку в пакете в целом?

Уже отвечал на этот вопрос: нет и не будет. Именование никак не влияет на обработку. Возможно, кому то для решения его личных задач это было бы и полезно, но СК это не нужно. Вижу только один выход: СК мог бы генерировать например батник, который бы копировал файлы зон в другую папку с одновременным переименованием по правилу.


Цитата:
по сути не полигональные а рисуемые

по сути полигональные. Но если не делать щелчков, а двигать не отпуская, будут рисуемые. Т.е. это по сути универсальный способ.


Добавлено:

Цитата:
такую возможность через тессеракт-ячейки ?

я отказался от тессеракт. Перешел на использование FR. Небо и земля. Спасибо NME!

Автор: niccolo, Отправлено:15:10 01-03-2022


Цитата:
по сути полигональные. Но если не делать щелчков, а двигать не отпуская, будут рисуемые. Т.е. это по сути универсальный способ.


Вы и правы, и нет. У полигональных зон в типичных векторных программах все рёбра прямые....

Автор: TelecomUral, Отправлено:16:24 01-03-2022

niccolo

Цитата:
Вы и правы, и нет.

что-то я вас не пойму...

Цитата:
Полигон (от др.-греч. &#960;&#959;&#955;&#965;- «много» + &#947;&#969;&#957;&#953;&#7936; «угол»; &#960;&#959;&#955;&#965;&#947;&#969;&#957;&#959;&#962;. букв. «многоугольник»)

Т.е. между узлами всегда прямые линии. Которые и образуют упомянутые "углы".
А вы про что? Про полилинию, как в MS Visio? Т.е. линию, образованную полиномом с узлами в отмеченных точках? Но в СК это никогда не применяется, по-моему.

UPD
пардон за коды греческих символов. Не знаю способа вставить именно буквы.

Автор: niccolo, Отправлено:21:16 01-03-2022

TelecomUral
Типичная попытка выделить полигональную зону....

https://www.upload.ee/files/13927640/Polygon.wmv.html

В итоге - в разной степени кривоконтурные зоны получается. Сравните с любым векторным редактором, который просто растягивает прямую линию от предыдущей точки...

Картинка на кнопке обманчивая.

Автор: Benoni, Отправлено:21:22 01-03-2022

bolega

Цитата:
Именование никак не влияет на обработку
Не влияет, но хотелось бы иметь порядок в обработке зон. Меня также интересует этот вопрос. И я высказывался по нём.


Цитата:
СК мог бы генерировать например батник, который бы копировал файлы зон в другую папку с одновременным переименованием по правилу.

И это выход.

Автор: TelecomUral, Отправлено:04:56 02-03-2022

niccolo
хм...
https://disk.yandex.ru/i/MgFjp-SH_IjTSg

Автор: bolega, Отправлено:07:55 02-03-2022


Цитата:
Сравните с любым векторным редактором, который просто растягивает прямую линию от предыдущей точки...

СК так и делает. Только вы зачем-то все время мышь держите нажатой, как в режиме lasso. Вершины надо ставить щелчком, тогда линия от последней точки будет "резиновой" и будет тянуться вслед за курсором.
Как говорится, учите лучше матчасть, вместо того чтобы постоянно навязывать автору свое видение.

Автор: niccolo, Отправлено:09:24 02-03-2022

bolega

Спасибо. Разобрался. Держу по аналогии с другими векторными редакторами. Там без разницы. Для рисования произвольных зон там обычно есть Freehand tool.

Но ваше решение действительно элегантно, хотя и обескураживает после опыта работы с векторными редакторами.

Автор: bolega, Отправлено:10:55 02-03-2022

Я недавно добавил возможность удалять последнюю вершину непосредственно в процессе расстановки вершин полигона (нажатием delete). По просьбе kamenkapenza. Не понимаю, чего я раньше до этого не додумался.

Добавлено:
Benoni

Цитата:
Не влияет, но хотелось бы иметь порядок в обработке зон

Для этого потребовалось бы переписать сотни строк кода. А это чревато багами, порчей заданий и т.п. Однозначно нет.
Соответствие зон страницам выдать могу, в том числе в виде команд для батника. А вы уже делайте с ними все что угодно: исполняйте, корректируйте и т.п.

Автор: TelecomUral, Отправлено:11:42 02-03-2022


Цитата:
bolega
для этого потребовалось бы переписать сотни строк кода.

А разве нельзя сделать переименование в самом дереве задания? Специальной командой. Были созданы зоны со страниц 5,6,6,1,10,8,2, переидентифицировать их свойства в список "1,2,5,6,6,8,10" не должно быть сложно. Межзоновые связи же отсутствуют.
Или Benoni требуется иное именование, по типу "номер_страницы_номер-зоны" вместо порядкового числа?

Добавлено:
bolega
я зимой экспериментировал с конвертером в pdf в djvutoy. Мне кажется, его автор специальным образом использовал jbig2enc, не генерируя новый словарь, а применяя словарь из djvu. Потому что мне не удалось заставить конвертер изменить хоть один самый крошечный элементик дежавюшки. Или заменить символ на сходный. Это устраняет вероятные ошибки кодера. К вопросу оптимизации pdf СК

Автор: bolega, Отправлено:12:42 02-03-2022


Цитата:
Или Benoni требуется иное именование, по типу "номер_страницы_номер-зоны" вместо порядкового числа?

Именно, и не только он. Внутри СК все обращения к файлам зон выполняются по идентификатору. Но это полбеды. Жесть начнется, когда будет изменение порядка файлов в задании, в т.ч. массовое. Понадобится изменить все названия файлов зон. А зон в отличие от страниц может быть несколько тысяч. А если в этот момент отключится комп, или баг вылезит. Ужас. Сама потенциальная возможность массовой потери зон говорит о том, что идея такого именования плоха изначально.

Автор: TelecomUral, Отправлено:12:46 02-03-2022


Цитата:
Ужас.

согласен.
Сделайте "имя зоны"

Автор: bolega, Отправлено:12:55 02-03-2022


Цитата:
Мне кажется, его автор специальным образом использовал jbig2enc, не генерируя новый словарь

Использовать готовый словарь из djvu - это была моя первая мысль, когда я подумал о применении jbig2enc. Нужно только поменять формат хранения, вся работа уже сделана в djvu. Просто разбираться с форматами не было и нет времени, может быть когда-нибудь. Для меня размер файлов вообще на последнем месте. Для себя я делаю в максимальном качестве. Никогда не понимал помешанных на оптимизации размеров, сейчас же не 90 годы. Те же колхозники до сих пор здоровье готовы отдать за лишний килобайт, фанатики. Размеры электронных библиотек достигли уже таких значений, что все эти оптимизации любой ценой никакого влияния на общий объем не оказывают.




Автор: TelecomUral, Отправлено:13:56 02-03-2022


Цитата:
Никогда не понимал помешанных на оптимизации размеров

всё же размер имеет некоторое значение - для скорости работы. Я вот попробовал windjview3.1 недавно заюзать. Он может быть перенастроен на работу без реестра. Дежавюшек я смотрю много. Так оказалось, что пока прога 1000 с лишком файликов с диска считает, в которых инфа про ранее открытые djvu хранится - проходит секунд шесть. А раньше вьювер открывался мгновенно.

Автор: NME, Отправлено:17:00 02-03-2022

TelecomUral

Цитата:
всё же размер имеет некоторое значение - для скорости работы. Я вот попробовал windjview3.1 недавно заюзать. Он может быть перенастроен на работу без реестра. Дежавюшек я смотрю много. Так оказалось, что пока прога 1000 с лишком файликов с диска считает, в которых инфа про ранее открытые djvu хранится - проходит секунд шесть. А раньше вьювер открывался мгновенно.

ответил здесь http://forum.ru-board.com/topic.cgi?forum=5&topic=18322&start=1780#7

Автор: Benoni, Отправлено:19:10 02-03-2022

bolega
Я понял трудности.

Цитата:
Или Benoni требуется иное именование, по типу "номер_страницы_номер-зоны" вместо порядкового числа?

Нет, не требую. Я прошу. Достаточно этого:

Цитата:
Соответствие зон страницам выдать могу, в том числе в виде команд для батника. А вы уже делайте с ними все что угодно: исполняйте, корректируйте и т.п.

Спасибо.

Автор: TelecomUral, Отправлено:05:09 08-03-2022

Benoni
заинтересовался вашими трудностями, полез в файл задания. С виду там чёткая логика хранения зон: секция о файле скана, блок [X2], в скобках идут параметры зон, второе число её номер id. Вот так:

Код:

[A]=1
[FFNAME]=I:\scanshik10\obrabotka\s\vladimirsky_sbornik_belgrad_1938__BSB_Scanstation01\122.tif
[FNAME]=122.tif
[ B]=1,1,0,0,29859,0,0,1618,2352,459,3782,1,1,1,1,0,0,0,0,0,1,1,1,1,1,2,2,0,
0,0,0,0,0,0,0,0,0,0,222,2198,0,0,1,1,0,1,2,1,1,0,0,0,0,0,0,0,0,0,0,5,0,0,0,
0,0,0,0,1,1,0,1,1,4,0,12,0,0,0,0,0,134644292,3,0,0,0
[X]=(2526,3623,1809,1942);(2415,3754,801,1801);(804,1470,620,910);(771,1503,1019,1369);(767,1517,1471,1808)
[X1]=4,100,101,102,103
[X2]=(100,4,0,1,0,4105,286,1639,2965,3640,286,1639,2965,3640,0,0,0,0,100,
255,10,70,1,0,142606336,0,16777215,0,0,4,3,40,7,100,10,80,0,0,1,1,0,204816,
80,0,134644292,8,2570,0,16777215,772,53,0,0,,,0,0,41222,1311315,2,204900),
(101,68,0,0,0,2057,1165,1192,2498,1773,1165,1192,2498,1773,0,0,0,0,100,
255,10,70,1,0,1753262601,0,16777215,0,0,4,3,40,7,100,10,80,0,0,1,1,0,204816,80,0,134644292,
8,2570,0,15987699,772,53,0,0,,,0,0,41221,1311315,2,204900),
(102,69,0,0,0,2057,1099,1990,2564,2691,1099,1990,2564,2691,0,0,0,0,100,255,
10,70,1,0,1753262601,0,16777215,0,0,4,3,40,7,100,10,80,0,0,1,1,0,204816,80,0,
134644292,8,2570,0,15987699,772,53,0,0,,,0,0,41221,1311315,2,204900),
(103,70,0,0,0,2057,1091,2894,2592,3569,1091,2894,2592,3569,0,0,0,0,100,255,10,70,1,0,
1753262601,0,16777215,0,0,4,3,40,7,100,10,80,0,0,1,1,0,204816,80,0,
134644292,8,2570,0,15987699,772,53,0,0,,,0,0,41221,1311315,2,204900),
[E]=1536,8,1,1,1,1,0,255,0,3,20,200,-1,-1,0,1,0,0,1,9,150,0,0,0,0,0,0,0,1,0,0,
17,5,0,0,0,100,255,0,10,70,1,0,10,50,1,0,1,0,3,
100,1,0,6,5,1,0,0,2,50,1,0,180,0,0,0,0,1,1,2,0,39,0,0,30,204900,204900
[K]=0,
[D]=1,0,0,"","",0
[ENDF]

У скана 122.tif зоны имеют идентификаторы 4, 68, 69, 70.

Автор: bolega, Отправлено:12:01 08-03-2022

TelecomUral
pic-зоны имеют два идентификатора. Первый - внутренний, уникален в пределах страницы, начинается со 100. Внутренний номер нужен, чтобы различать тип зоны. Exclude и прочие типы зон имеют неуникальные номера, т.к. не содержат опций. Второй идентификатор pic-зоны - внешний, уникален в пределах задания, от него зависит имя файла зоны на выходе.

Автор: Benoni, Отправлено:09:40 10-03-2022

Спасибо TelecomUral, bolega


Автор: D1D1D1D, Отправлено:22:19 17-03-2022

bolega

Здравствуйте. Помнится, на февраль планировалась версия с обработкой мусорных штрихов на буквах. Было ли обновление?

Автор: VadimirTT, Отправлено:19:40 19-03-2022

Почему эти файлы не воспринимаются кромсаторм?
Всё делал, переименовывал, менял формат.
Ссылка

Автор: TelecomUral, Отправлено:19:54 19-03-2022


Цитата:
VadimirTT
Почему эти файлы не воспринимаются кромсаторм?

У меня воспринялись.

Автор: VadimirTT, Отправлено:20:10 19-03-2022

TelecomUral

Версия 6.71
Могу передать книгу на обработку, если она у вас открывается.

Автор: TelecomUral, Отправлено:20:26 19-03-2022

не, на обработку не надо

может, файлы блокированы виндой? Типа защита от вирусов и тэ пэ?

upd
так вы именно файл с номером 2 в архив не вложили

Автор: slava_kry, Отправлено:20:32 19-03-2022

TelecomUral
VadimirTT
Ковертнул в ТИФФ и ПНГ Шопом - тоже ошибка... интересно.

Добавлено:
Засунул в ПДФ. Импортирую - ошибка.
Сделал ТИФ через BMP - всё равно ошибка.
...Уникальные изображения!

Автор: daa2013, Отправлено:21:52 19-03-2022

В названии папки несистемный символ

словутинскии* (крышка-кратка от й )

Автор: VadimirTT, Отправлено:04:21 20-03-2022

daa2013
Спасибо! Заработало!

Автор: slava_kry, Отправлено:05:20 20-03-2022

daa2013
О! Интересно.
Спасибо.

Автор: shch_vg, Отправлено:14:06 20-03-2022

То, что Кромсатор не хочет работать, сталкиваясь с извращениями в имени папки, я заметил довольно давно. Вопрос к bolega: нельзя ли в таком случае просто выдать информацию о проверке имени папки?
В данном случае после скачивания архива с кривым именем Винрар прекрасно его открывает и при извлечении из него по умолчанию предлагает поместить в папку с именем архива. Полагаю, что TelecomUral при извлечении поменял это имя, поэтому у него Кромсатор принял эти файлы.
Оказывается, есть вариант обнаружить такую засаду, по крайней мере в вин10.
Я попробовал открыть скачанный в хроме файл непосредственно из загрузок, в результате чего хром при попытке передать в запускаемый винрар имени файла выдает следующее:

Не думаю, что я сделал большое открытие, скорее я написал это для себя, чтобы лучше запомнить ситуацию, но вопрос к bolega все же остается.

P.S. Не удалось правильно завести картинку. Желающие ее увидеть, открывайте в соседнем окне.

Автор: TelecomUral, Отправлено:18:08 20-03-2022


Цитата:
Полагаю, что TelecomUral при извлечении поменял это имя

Естественно.
Я ещё в конце 90х наелся проблем с кириллицей в именах файлов, и раз навсегда принял решение во всех критичных случаях использовать латиницу без пробелов. "Критичные" - это если я буду файлы или папки открывать какими-либо программами кроме Проводника и тоталкоммандера. Ну и неродными для формата прогами.
А сейчас иногда приходится сталкиваться с китайскими книгами, арабскими, так это вообще.

Автор: 1234olexiy, Отправлено:21:37 24-03-2022

дорогой bolega!
последнее время часто бывает такая проблема, что при нехватке места на диске вылетает ошибка и обработка обрывается, а можно перехватить эту ошибку, и поставить на паузу. А я бы например, освободил место и смог продолжить дальше.

И еще: при создании аут-теска кнопка "ОК" хотелось бы чтобы была дефолтной. Т.е. при нажатии на Ентер она срабатывала, а то очень не удобно.

Большое спасибо, вам за программу, пользуюсь ей каждый день почти, в течении нескольких лет. Не знаю чтобы я без неё делал

Автор: VadimirTT, Отправлено:23:57 31-03-2022

А пиксельный размер желательно делать с кратностью 12, в этом есть смысл?

Автор: TelecomUral, Отправлено:04:48 01-04-2022

VadimirTT
раньше в ходу были утилиты, которые не могли подклеить фон к переднику, если их размеры некратные. Кажется, djvu imager. Сейчас вроде необязательно, если djvu делается в СК.

UPD
http://djvu-soft.narod.ru/scan/djvu_imager.htm
в конце пункт "О формуле соответствия размеров субсканов"

Автор: daa2013, Отправлено:04:52 01-04-2022

Небольшой (ИМХО).

12 делится на 2,3,4 - субсэмплинги аккуратнее получаются, совмещение задника и передника точнее, при разборке (восстановлении до исходных размеров) может реже вылезти расхождение на пиксель, особенно, если pdf курочится.

Если 1200 дпи, и внутри проекта будет микс из 300, 400, 600, 1200 дпи , и наложение передника с буквами поверх картинок с буквами в заднике (буквы передника перекрывают буквы задника, которые при смещении могут начать торчать), то я иногда заморачиваюсь. Во всех прочих случаях нет.

Чаще, манипулируя размерами холста, проверяю кратность 6. Ну то есть, если я все равно руками меняю холст, то там 3333 или 3336 выставить - разница небольшая, а 3336 мне как-то симпатичнее.

Я также часто замечал, что при некратном апсемплинге возникает легкая размытость. Вроде, этот эффект должен и в обратную сторону работать.

Автор: VadimirTT, Отправлено:21:03 02-04-2022

Ссылка
Что нужно изменить в задании (подозреваю аутомаржинс), что бы размеры страниц были одинаковы, т.е. 3492х5292, горизонталь можно увеличить.
Проблема, верхняя плашка встык.

Автор: shch_vg, Отправлено:22:45 02-04-2022

VadimirTT
Подозрения надо проверять!
А если серьезно, то выложенное Вами вызывает некоторые вопросы.
Но сначала информация: не включив автомаржинс, Вы всегда будете получать размеры, которые задают резаки.
Теперь вопросы:
1. 3492х5292 - что за загадочные числа?
Имеют ли они какую-то связь с выходными данными книги?
2.
Цитата:
Проблема, верхняя плашка встык.

Вам это надо или нет?

Автор: VadimirTT, Отправлено:02:35 03-04-2022


Цитата:
1. 3492х5292 - что за загадочные числа?

Ширина это обложка, с делением на 12.

Цитата:
Вам это надо или нет?

Так это в книжке есть, без этого я бы тут и не спрашивал.

Добавлено:

Цитата:
не включив автомаржинс, Вы всегда будете получать размеры, которые задают резаки.

А, теперь понятно., но шо делать то?

Автор: shch_vg, Отправлено:03:15 03-04-2022

VadimirTT

Цитата:
Так это в книжке есть, без этого я бы тут и не спрашивал.

Я так и не получил ответ на мой вопрос. То, что так есть в книжке, я вижу по развороту.
А вопрос был, нужно ли Вам, чтобы "верхняя плашка" находилась строго "встык", или допускается над ней какое-то поле?

Цитата:
но шо делать то?

Для начала включить автомарджинс и посмотреть, что получится.

Автор: TelecomUral, Отправлено:05:33 03-04-2022


Цитата:
но шо делать то?

автомаржинс включить, выравнивание обеих половинок выбрать "вверх", на субзакладке Page/special.../More2 включить сверху Zero gaps.

Если надо стыковать не только верх, то центровку уточнить для сторон "лево-право", нулевые gaps тоже для них включить.
Gap=300 это явный перебор. Если такой gap действительно требуется на других страницах, тогда понятно.



+
Вообще-то фиксировать размер для беспольных книг неправильно. Получатся белые надставочки по краям и будет некрасиво и неправильно, как будто чб-скан книги читаешь. Чтобы было красиво, надо добавить зоны для краевых рисунков, а в конце обработки обрезать размер(ы) страниц под зоны.

обработка с зонами, группа команд обрезки страницы под край выбранной зоны:



итог:



Чтобы страницы остались одинакового размера после обрезки, зону надо размножить, а не выделять заново на каждом скане. Резаки тогда не должны проходить по зоне, потому что ее размер будет изменен под резак.
Можно и вообще круто сделать: одну и ту же внешнюю картинку для каждой половинки вставлять на каждый скан.

++
ну и конечно, если принято решение делать обрезку под зоны, то можно попытаться подстроить размер страниц сразу равным ширине зоны/зон. Может получиться

Автор: niccolo, Отправлено:12:53 05-04-2022

Поскольку контурные шрифты плохо распознаются Файнридером возник вопрос - нет ли в SK инструмента заливки надписей, сделанных контурными шрифтами, или как лучше действовать для адаптации таких надписей к распознаванию?

Автор: VadimirTT, Отправлено:19:35 05-04-2022

shch_vg
TelecomUral
Спасибо за ответы, но я уже сделал, плюнул на сохранение идентичности плашек.

Автор: asku, Отправлено:22:31 05-04-2022

Добрый вечер. Прошу помочь с опциями.
Полетела система на компе, а оптимальные опции СканКромсатора я не помню, восстанавливаю по памяти.
Вот архив с тест-файлом. Результат не нравится совсем. Может я какую-то опцию забыл?..

Автор: shch_vg, Отправлено:23:31 05-04-2022


Цитата:
Может я какую-то опцию забыл?

Забыли указать, что Вам не нравится в задании.
"Совсем" это слишком расплывчато.

Автор: TelecomUral, Отправлено:06:05 06-04-2022


Цитата:
Может я какую-то опцию забыл?

dpi на выходе маловато.

Автор: asku, Отправлено:08:21 06-04-2022


Цитата:
dpi на выходе маловато.


Вот!

Автор: TelecomUral, Отправлено:09:39 06-04-2022

asku
[more=оффтоп]
Цитата:
Вот!

к слову о поиске: вам удалось понять, что за программку вы не находите, которая букмарки ставит? Не стал в ЛС писать, многие туда не смотрят вообще
Меня заинтересовало, потому что я слышал только про Djvu & PDF Bookmarker.[/more]

Автор: asku, Отправлено:14:00 06-04-2022

Нет, пока не нашел. Всё ещё ищу.

Автор: asku, Отправлено:22:20 08-04-2022

Добрый вечер. Подскажите пожалуйста, как лучше обрабатывать вот такие страницы. Текст, но с серой рамочкой.
Не могу вспомнить, как это лучше делать в СК.


Автор: TelecomUral, Отправлено:05:10 09-04-2022

Встречный вопрос, а что тут затруднительного? Ставите полигональную зону BW-типа и красите ее серым. Если серый сделан растром (точками), используйте blur, чтобы точки слились. Порог бинаризации тогда надо будет подправить.
Если затруднение в занудном повторении идентичных зон на каждой странице, используйте зоновый карман по ПКМ на зоне и на скане.

Можно делать две больших прямоугольных наложенных зоны, снизу серая для рамки, сверху чёрная для текста. Тогда попадание текста в область зоны будет попроще. Но для неидентичных рамок не подходит. Обе зоны можно засунуть в зоновый карман, и вытащить оттуда одной командой.

Автор: asku, Отправлено:15:27 09-04-2022


Цитата:
используйте blur


Поясните пожалуйста, как его использовать в данном случае.


Цитата:
полигональную зону BW-типа


А как можно поправлять уже созданную полигональную зону? Не вижу инструмента для коррекции такой зоны.

Добавлено:
Как поправить уже готовую зону в Result view тоже не понял. Включаю там режим показа зон (в вываливающемся меню) и ...

Файл test

Автор: TelecomUral, Отправлено:15:43 09-04-2022


Цитата:
А как можно поправлять уже созданную полигональную зону?

выбираете мышкой зону, и по ПКМ команда Edit vertexes. Узлы можно перемещать, создавать, удалять. Закончив, снова даёте эту команду (там галочка будет).


Цитата:
Поясните пожалуйста, как его использовать в данном случае

в данном не знаю, на скриншоте никакого растра не видно. А вообще - ролик про заливку тут:
https://rutube.ru/video/d758b1876451cde33edc50b61ae9e748/
на всякий случай в ютубе он же:
https://www.youtube.com/watch?v=SiVO-CE3FDE

оффтоп
рутубом я начал пользоваться на днях, что там да как будет - терра инкогнита пока. например, ролик завис при полноэкранном просмотре в исходном разрешении 1080.

Добавлено:

Цитата:
Как поправить уже готовую зону в Result view тоже не понял.

смотря что хотите.

Автор: asku, Отправлено:15:57 09-04-2022


Цитата:
смотря что хотите.


Серые рамки кривоваты и слишком толстые получились. В RV как-ниб в моем тесте можно поправить?

За ссылки спасибо. Надо посмотреть и на ютубе и на рутубе.

Добавлено:

Цитата:
смотря что хотите.


Там еще посмотрите, серая рамка не должна касаться фотографии, а у меня касается.

Автор: TelecomUral, Отправлено:16:23 09-04-2022


Цитата:
серая рамка не должна касаться фотографии

это всё потому, что вы сделали рамку "разницей" между зонами Прикольно.

Слева я бы делал полигоном, обойдя фотку. И подобрав порог, чтобы рамка не забелилась.
Вот так:
https://dropmefiles.com/Th1dj

Показал справа розовым, как, imho, лучше делать рамку.

Автор: kamenkapenza, Отправлено:08:46 10-04-2022

Мои пожелания в новой версии программы следующие (для экономии времени):
- Сделать кнопку общей маркировки файлов задания, при нажатии на которую маркировались бы все файлы. Во всех версиях программы маркировка изначально неполная и самый оптимальный вариант пока что это маркировка вверх (самый крайний левый значок), надо встать на самый нижний файл, он выделяется синим цветом, от него уже маркируются вверх все файлы. Или есть маркировка всех файлов, но со сбросом всех предустановок. А зачем их сбрасывать,если они нужны пользователю как шаблон? Нужна кнопка мгновенной маркировкивсех файлов без постановки на какой лиюо файл и без сброса всех опций ,потому что изначально происходит работа со всеми файлами, а потом после общей обработки всех файлов можнобыло бы работать с какой то группой, если это требуется. И сделать эту кнопку рядом со списком загруженных для работы страниц. Смотрим правильность нумерации страници и наживаем кнопку, не отвлекаемся на низы, потому что всё это расположено наверху. Какому то небольшому значку общей маркировки нашлось место наверху.
- Установить значок по умолчанию Mouse-up-mode на позицию работы с цветными зонами. Есть там ещё рядом значок слева "Установка цветной зоны", но..сначала надо выделить зону, потом нажать на значок цветной зоны, после этого лишь зона работы станет цветной. Предлагаю по умолчанию (или сделать такую опцию в профиле пользователя, чтобы он мог устанавливать для себя) установку для цветной зоны. В основном подавляющее большинство задач это работа именно с цветными картинками или черно-белыми, но для которых так же можно выставить свойства цветного рисунка. То есть заходим на страницу, обводим зону и по умолчанию она как пикчуре-зона, а не так как раньше: сначала обвести,а потом указать, что она цветная. В большинстве случаев это так, а если не цветная, то через Mouse-up-mode войтив свойства иной зоны.
- В настройках пикчуре-зоны можно было устанавливать фиксированные настройки пользователя, чтобы изначально стояли настройки, часто используемые пользователем, например, для пикчуре-зон я всегда ставлю 600 дпи, колор 24 бит. Чтобы каждый раз для зоны рисунка не ставить параметры работы, предлагаю их сделать фиксируемыми в профиле пользователя, чтобы каждый мог настроить их под себя и не настраивать каждый раз, хотя каждый раз настройки практически всегда одни и те же, а если отличные от шаблона, то можно поменять значения в меню свойства зоны для конкретного случая.
- Поверхностное окно picture zone properties сделать по размеру на всю свободную зону от верхних значков до панели задач, то есть охватить полностью видимую зону установку резаков (белую свободную зону), окно всё равно нужно на время настройки, а потом закрывается, т.е. оно не перекрывает никакие другие настройки программы.
- В этом окне (picture zone properties ) по умолчанию сделать включенным показ зоны (show zone), потому что это больше нужно, чем не надо. Кому не надо для конкретного случая, может отключить, то есть выключатель зоны должен быть изначально поставлен в режим "вкл." , сейчас он стоит на "выкл"
-Зону просмотра изначально сделать максимальной по свободной области прямоугольника,где она располагается,то есть по высоте. Это особенно удобно, когда надо искать куски фона и вносить цвет фона в исключение. Приходится самостоятельно растягивать зону за углы и выделять куски фона. То есть изначально большой просмотр зоны обрабатываемой картинки имеет большие преимущества перед тем, какой вывод установлен сейчас. Если кому надо (хотя вопрос: зачем?, большая зона просмотра ничему не мешает), то может уменьшить размер через стягивание углов картинки.
В этих операциях будут экономиться секунды, вся обработка книги будет экономить минуты, несколько книг часы, месяцы и т.д.
Если гениальный мастер bolega прочитает эти пожелания, то большое спасибо. Если сочтет их нужными и внесет в новую версию - низкий поклон.
Если кто то из пользователей программы тоже заинтересован в этом и поддержит меня, я буду этому рад.

Автор: TelecomUral, Отправлено:16:54 10-04-2022

Поддерживаю пару мыслей:
- свойства зоны хранить в загружаемом профиле (а ещё лучше иметь шаблоны зон, допустим сохраняя карманы в профиль и из профиля). Эти рутинные операции тонкой настройки иногда раздражают
- свойства зоны открывались с картинкой зоны и сразу на полэкрана. или двойным щелчком на верхней полоске переходить в такой режим и обратно

Автор: bolega, Отправлено:17:26 10-04-2022

Вчера только собрал новую версию, бету для тестирования.
Хотел сегодня снять пару роликов, один про новые возможности, второй полностью про глифо-замену (реставрацию букв) и удаление марашек на основе ocr. Без них будет ничего не понятно. Но значит придется ненадолго отложить.

Часть пожеланий уже была учтена ранее.
Добавил сохранение размеров и вида окошек picture zone properties и image enhance в ini-файл. Т.е. делаете как вам надо и это сохранится и будет использоваться в следующих сессиях. Для image enhance есть поддержка multiline закладок, но пока не сделана возможность задавать их порядок следования.
В профили добавил несколько опций djvu-кодирования и несколько опций picture-зон, самые важные. Остальные нет никакого смысла пихать в профили, т.к. по сути от профиля они не должны зависеть. Лучше действительно сделать их как шаблоны, как советует TelecomUral. Сделаю, но уже в следующий раз.


Автор: asku, Отправлено:17:55 10-04-2022


Цитата:
про глифо-замену (реставрацию букв) и удаление марашек на основе ocr


Ждем!!

Автор: kamenkapenza, Отправлено:17:52 11-04-2022


Цитата:
Хотел сегодня снять пару роликов, один про новые возможности, второй полностью про глифо-замену (реставрацию букв) и удаление марашек на основе ocr. Без них будет ничего не понятно. Но значит придется ненадолго отложить.

Уважаемый bolega, будем ждать ролики, .... и побольше, побольше, чтобы все возможности программы показать.
Марашек ещё никому не удалось победить, это будет грандиозный кибернетический нанопрорыв. Плюс восстановление покоцанных букв... !!!!!!!


Автор: Benoni, Отправлено:18:03 13-04-2022

bolega
Очень часто пользуюсь библиотекой Glyphs. Неосторожное движение и она "паркуется" у края монитора. Нельзя это действие сделать вкл./откл.?

Автор: TelecomUral, Отправлено:18:16 13-04-2022


Цитата:
Неосторожное движение и она "паркуется"

точно! Хорошо бы это пофиксить как-нибудь.

Автор: bolega, Отправлено:07:44 17-04-2022

Пофиксил.

P.S.
И для тех, кто пишет в ЛЯ: если включено уведомление о прочтении, то такие сообщения я удаляю не открывая и не читая. Здесь не офис, отчетов о том, когда и во сколько я прочитал, и открыл ли его вообще, я не приемлю. Тем более если такие письма приходят от пользователей с нулевым количеством постов.

Автор: Benoni, Отправлено:10:48 17-04-2022

bolega
спасибо.

Автор: shttd, Отправлено:11:03 19-04-2022

Баг?
При перемещении глифа в другую группу глифов имя группы отображается неверно.
https://disk.yandex.ru/i/C4nBFFRqIJgXpw

Автор: Benoni, Отправлено:13:45 19-04-2022

shttd
Наверное, всё от того, что Вы используете не латиницу...

Автор: shttd, Отправлено:13:56 19-04-2022

Benoni
Однако заголовки групп отображаются верно.

Автор: TelecomUral, Отправлено:11:55 20-04-2022

Новые возможности СК 6.72: ролики от bolega
1й - https://rutube.ru/video/e6414edaa09e6616246ed13625c5fd3f/
2й - https://rutube.ru/video/407270e2b887f590aca22557c1458909/

Будут ещё.

От себя скажу в третий раз : охренеть!! По всей видимости, вопрос с глифированием закрыт окончательно, всё стало полноценно и удобно.
Баги только надо выловить, без них не бывает.

---
Вопрос ещё такой, интернациональный: а получится ли подключить нестандартный (редкий) язык? Какие тут возможны препятствия со стороны словарей, ФР, самой винды?

Автор: bolega, Отправлено:13:33 20-04-2022

TelecomUral

Цитата:
а получится ли подключить нестандартный (редкий) язык?

В принципе ничего не препятствует. Я там везде предусмотрел 16 битный юникод. FR кажется все языки понимает. Со словарями hunspell дело наверно посложнее.
Можно будет опробовать на китайском, только я не знаток.

Автор: asku, Отправлено:14:11 20-04-2022


Цитата:
Новые возможности СК 6.72:


А самой версии пока нет?

Автор: imwerden, Отправлено:14:32 20-04-2022


Цитата:
Новые возможности СК 6.72: ролики от bolega


Мне кажется у вас был канал на нормальном сайте. Сейчас не нахожу.... Будут ли ролики на youtube, чтобы не перепачкаться в rutube....

Ваш канал нашёл, но новых видео там нет пока....

Автор: TelecomUral, Отправлено:18:03 20-04-2022


Цитата:
Ваш канал нашёл, но новых видео там нет пока....

Потом может залью, но нескоро.
У нас в РФ всё грозят ютьюб перекрыть, так уж лучше превентивно переползти куда-нибудь. Хотя пока что рутуб мне сильно не нравится. О других видеоплощадках только краем уха слышал.

Автор: asku, Отправлено:18:14 20-04-2022


Цитата:
О других видеоплощадках только краем уха слышал.


Можно в телеграме канал открыть, посвященный СК. Обсуждать здесь, а видео выкладывать там.

Автор: TelecomUral, Отправлено:18:20 20-04-2022

asku
боже меня упаси от новомодных коммуникативных штучек Практика показывает что надежнее личной инфраструктуры ничего нет. А эти социальные фуфелки могут исчезнуть за полтора дня. Бесследно причём.

Добавлено:
4я часть - https://rutube.ru/video/1ed97c0bfbbf1229b8a7a6406bd4f4a7/

Автор: shch_vg, Отправлено:19:13 20-04-2022

TelecomUral

Цитата:
Добавлено:
4я часть

Чтобы добавить 4ю часть, надо сначала добавить 3ю.

Автор: TelecomUral, Отправлено:19:19 20-04-2022

shch_vg
добавляйте. а по мне и так сойдёт.

Автор: shch_vg, Отправлено:20:26 20-04-2022

TelecomUral

Цитата:
добавляйте. а по мне и так сойдёт.

Чтобы добавлять, нужно это иметь.
Вопрос остается открытым: 3я часть пропущена, или это ошибка в нумерации?

Автор: TelecomUral, Отправлено:20:42 20-04-2022

shch_vg
отвечу вашими словами

Цитата:
Чтобы добавлять, нужно это иметь.


Автор: bolega, Отправлено:20:46 20-04-2022

3-я часть получилась не очень удачной, я хотел бы ее переснять, поэтому попросил TelecomUral повременить с выкладкой.

В процессе подготовки роликов выплыло несколько багов. После их исправления новая версия будет опубликована.

Автор: Benoni, Отправлено:20:56 20-04-2022

bolega
Спасибо за труд!

Автор: shch_vg, Отправлено:21:58 20-04-2022

bolega
Спасибо за ролики и за информацию в данном сообщении.
Непонятно, почему нельзя было выкладывающему просто это объяснить.
Я говорю в данном случае не о себе, а о тех, кто это тоже увидит и будет также удивляться.

Автор: kamenkapenza, Отправлено:22:14 20-04-2022


bolega, огромное спасибо за доблестный труд, за гениальную программу!!! И за подробные разъяснения!!!


Автор: daa2013, Отправлено:00:04 21-04-2022

Может быть, это уже и сделано, но из роликов мне такого не видно.

Хотелось бы иметь режим (возможно, включающийся по чекбоксу), чтобы при наведенном курсоре на букву, когда выделен ее контур и внизу в желтом квадратике показывается её OCR-результат (например, "н"), то по клику ЛКМ на ней вставал её глиф с активной закладки (глиф, которому присвоена "н") и чистились ошмётки. Если же такого глифа нет, или их, вдруг, два и более (хотя это, наверное, контролируется при присвоении значений букв), то не происходило бы ничего.

В ролике для этого перетягивалась буква с панели. Но это лишние движения. Плохие буквы хотелось бы просто прокликать. И это уже головная боль пользователя, чтобы у него на активной закладке были правильные для этого глифы.

PS
Я бы вставил скриншоты, но этот порнографический рутуб дает похабные результаты. Хостинг - звездец. Своей рекламой он даже не дает мне их просмотреть до конца. Почему нельзя было залить оригинальные видео на яндекс-диск - загадка.

Автор: shch_vg, Отправлено:00:23 21-04-2022

daa2013

Цитата:
Почему нельзя было залить оригинальные видео на яндекс-диск - загадка.

А кто мешает Вам сделать это?

P.S. Подобные ролики лучше всего иметь всегда по рукой, т.е. на своем диске.

Автор: daa2013, Отправлено:00:39 21-04-2022


Цитата:
А кто мешает Вам сделать это?


А у меня они есть ? Только недоразумение с рутуба.

Автор: TelecomUral, Отправлено:04:59 21-04-2022

Я извиняюсь за наглость, но публикацией только там я (заодно) поставил задачу "оттестить" рутуб.
По идее, все баги и тэ пэ можете сообщать их команде поддержки. Ибо "никто кроме нас". Чем быстрее это убожество (или покажите иной хостинг) придёт в норму, тем лучше. Но для этого же попахать надо

[more=оффтоп]
Цитата:
shch_vg
Непонятно, почему нельзя было выкладывающему просто это объяснить

для меня это была настолько очевидная вещь, что я постеснялся вам на это указывать. Факт в том, что есть те ролики, которые есть, иного не опубликовано, поэтому остальные ваши вопросы - излишний шум.[/more]


Цитата:
daa2013
Хотелось бы иметь режим (возможно, включающийся по чекбоксу), чтобы при наведенном курсоре на букву, когда выделен ее контур и внизу в желтом квадратике показывается её OCR-результат (например, "н"), то по клику ЛКМ на ней вставал её глиф с активной закладки (глиф, которому присвоена "н") и чистились ошмётки. Если же такого глифа нет, или их, вдруг, два и более (хотя это, наверное, контролируется при присвоении значений букв), то не происходило бы ничего.

Это сделано: https://disk.yandex.ru/i/YkWqu8txuQkqxQ


Цитата:
daa2013
Почему нельзя было залить оригинальные видео на яндекс-диск - загадка.

А поиск и группировку видеоконтента как обеспечить? Сейчас на ютьюбе по слову "сканкромсатор" дофига материалов светится. Ссылки же из местной шапки не видны вообще нигде.


Автор: daa2013, Отправлено:06:03 21-04-2022


Цитата:
Это сделано:


Насколько я вижу, он работает не совсем так, как я прошу, хотя и похоже.
В ролике сначала надо сделать список замен, и желтый квадратик с опознанным OCR-результатом в этот момент там мне не демонстрируется.
Перетягивание же глифа с панели анализа списка не требовало. (Соответственно, как и запрашиваемое мной кликание.)

Для списка же было бы неплохо, если отобранные ячейки как-то будут на странице подсвечиваться. Например, рамки вокруг них станут ярко-сними.
Сейчас (в ролике) надо встать на замену в списке, тогда контур буквы подсветится. ИМХО имеет смысл, чтобы контуры (рамки) всех отобранных букв одновременно были юзеру на странице показаны.

Хорошо бы, чтобы это всё также работало и в режиме подсветки.

Автор: TelecomUral, Отправлено:06:17 21-04-2022

daa2013

Цитата:
Перетягивание же глифа с панели анализа списка не требовало

Я сам кроме роликов ничего не видел, и сходу все детали "не вкурил". Да там и наворочено нынче обалдеть сколько всего. Но мне кажется, что идеология списка замены неплоха, она от типографских особенностей печати идёт (ошибки-разрывы не во всех, а только в некоторых буквах). И она требует особого режима "включен ocr, при анализе скана буквы учитывай это". Если же идти как вы предлагаете, то могут возникнуть разнообразные неоднозначности при поиске глифа. Больно прямолинейное решение. Например, с ошибками распознавания как быть: опозналась "к", на самом деле "и", щёлкаем и получаем неверный глиф. А где исправить ошибку распознавания "к" - ? Приходится либо думать над вычитыванием заранее, либо предусматривать спецрежим полноценной работы со слоем текста. Вот он и сделан.

Автор: daa2013, Отправлено:06:36 21-04-2022


Цитата:
идеология списка замены неплоха


Список замен - штука отличная.

Но для ускорения работы нужны и альтернативные механизмы.


Цитата:
с ошибками распознавания как быть


смотреть на жёлтый квадратик перед тем как кликать

Автор: TelecomUral, Отправлено:06:40 21-04-2022

daa2013

Цитата:
смотреть

"смотреть" это не "быть", не "действовать".

Автор: bolega, Отправлено:08:21 21-04-2022

daa2013

Цитата:
Плохие буквы хотелось бы просто прокликать.

Такой режим есть. Я вроде демонстрировал его. Возможно, он как раз в не выложенном ролике. Список замен обязателен. Формируется очень быстро. Зато потом щелкай сколько хочешь. И при этом совсем не обязательно чтобы
Цитата:
И это уже головная боль пользователя, чтобы у него на активной закладке были правильные для этого глифы.
.

Цитата:
Для списка же было бы неплохо, если отобранные ячейки как-то будут на странице подсвечиваться. Например, рамки вокруг них станут ярко-сними.

Кстати, это и сейчас можно сделать, не режимом, а обходным способом, командой, которая превращает все буквы из списка в обычные limiter-зоны красного цвета (других типов постоянных подсветок просто нет в СК). Если таким способом выделить тысячу букв, в глазах будет рябить.

А в принципе, сейчас можно добавлять какие угодно варианты-режимы, базис для этого имеется.

Я предусмотрел несколько фильтров, чтобы сужать кандидатов на попадание в список. Задача стоит в том, чтобы понять можно ли с помощью них отфильтровывать плохие/хорошие буквы. Или нужны еще какие-нибудь критерии. Здесь рассчитываю на советы и опыт пользователей.
Под фильтрами понимаются параметры, описывающие отклонение буквы от глифа-эталона. В ролике я демонстрирую использование только двух из них

Автор: daa2013, Отправлено:08:30 21-04-2022


Цитата:
Список замен обязателен.


а вот я как раз прошу без списка замен способ.
Перетаскивание же есть. Добавить клик.

Добавлено:

Цитата:
можно ли с помощью них отфильтровывать плохие/хорошие буквы. Или нужны еще какие-нибудь критерии. Здесь рассчитываю на советы и опыт пользователей.


Это только после некоей эксплуатации станет видно про фильтрацию.
Так как и в режиме обычной подсветки у меня все ловилось, я думаю, что оно или сразу будет работать, или нужно будет обеспечить работоспособность списка в режиме подсветки.

У меня тут была книжка, где были бы полезны фильтры внутри/вне контура буквы (контур как очертание буквы, а не рамка) но мне кажется, что у вас что-то похожее как раз реализовано.

Автор: niccolo, Отправлено:09:10 21-04-2022

bolega

Впечатляет. Хотя без части 3 абсолютно непонятно, в каком виде и от какой версии ФР используется OCR информация.

Второй момент - может быть с данной технологией решить наконец проблему искажения геометрии строк у корешка...

Третье - в стремлении к идеальным глифам самый лучший вариант - векторный шрифт. Шрифты абсолютного большинства гарнитур уже есть в интернет...
Альтернатива - если вы разобрались с ФР — использование библиотеки глифов по данным распознавания... Набирать алфавиты вручную как-то совсем не комильфо.....

Автор: TelecomUral, Отправлено:09:35 21-04-2022

niccolo
Здесь упоминался парсер ФР12-15 от NME.


[more=оффтоп про шрифты]
Цитата:
Шрифты абсолютного большинства гарнитур уже есть в интернет...

ну-ну. Что-то я обыскался шрифтов классических советских гарнитур из энциклопедии "Книговедение". Куда ни плюнь, только экзотика. А классика в лучшем случае за большие деньги и всегда неполная.
пример гарнитур, статья из упомянутой энц. https://disk.yandex.ru/d/2h3Q6ptZWUHjKA Если кто даст ссылки, и чтоб без лицензий/запретов, буду безмерно благодарен, ибо задачка висит нерешённой еще с середины 90х годов. Время от времени пробую вяло поискать, и всегда ноль.[/more]

Автор: shch_vg, Отправлено:12:09 21-04-2022

daa2013

Цитата:
А у меня они есть ? Только недоразумение с рутуба.

Этому помогает поиск в инете по "как скачать видео с рутуб"

Автор: niccolo, Отправлено:12:20 21-04-2022

TelecomUral

Шрифты наиболее распространённых гарнитур находятся очень легко. Остальные - тоже вряд ли проблема особенно на этом форуме....

Единственная реальная проблема - отличие одинаковых гарнитур разных производителей, пока сами гарнитуры не были стандартизированы (ГОСТы 3489)

Автор: slava_kry, Отправлено:15:01 21-04-2022

niccolo
Говорится о бесплатных гарнитурах, а их нет. Создать свой шрифт - это лютый геморрой.

Некоторые гарнитуры есть бесплатные и свободно распространяемые, но в массе нет.

То что мы можем скачать любую - это о другом.

TelecomUral
С другой стороны, вы можете использовать подмножество (отдельные символы), а не весь шрифт... Хотя думаю и это запрещено.

Сами по себе все советские шрифты есть в электронном виде. Тем более оригинальных чисто советских, единицы.

Автор: niccolo, Отправлено:16:05 21-04-2022

slava_kry
Я прекрасно понимаю, куда вы клоните, и не прошу включать указанные шрифты в программный комплект.
Я говорю о том, что очень бы неплохо иметь такую возможность. А там каждый пусть сам решает - кому векторы нужны, а кому нравится с растром любиться.

Автор: daa2013, Отправлено:16:44 21-04-2022


Цитата:
видео с рутуб

вот вы сначала скачайте с рутуб и сравните с последним кусочком (3 хвостик), выложенным на яндексе.

Добавлено:

Цитата:
включать указанные шрифты в программный комплект


наверное можно включить пикселизированные наборы.

Автор: niccolo, Отправлено:18:08 21-04-2022


Цитата:
наверное можно включить пикселизированные наборы.


Говорите прямо РАСТРОВЫЕ ШРИФТЫ....

Вряд ли это хорошая идея, учитывая насколько хуже дробное масштабирование у растра по сравнению с вектором.

Автор: shch_vg, Отправлено:18:14 21-04-2022

daa2013

Цитата:
сравните с последним кусочком (3 хвостик), выложенным на яндексе.

А это что за чудо, м.б. я что-то пропустил?
Если Вы имеете в виду авишку, выложенную на яндексе, то как она будет выглядеть, если ее выложить на ютуб?

Автор: TelecomUral, Отправлено:18:26 21-04-2022

на ютьюбе точно можно выбрать "скачать оригинал".

Автор: shch_vg, Отправлено:18:33 21-04-2022

TelecomUral
Тогда другой вопрос: а что такое 3 хвостик?
Это добавка к неопубликованной 3й части?
Или сама 3я часть?
Прямо детектив какой-то!

Автор: TelecomUral, Отправлено:18:54 21-04-2022

shch_vg
что у вас за извивы мысли... какие-то фантазии, домыслы, практически инсинуации
Это просто хвостик, конечные минутки, от неопубликованной 3й части. Отрезан мной с помощью virtualdub для демонстрации daa2013. Там же цитата его приведена как причина.
Я ещё и промахнулся в номере стартового фрейма, хвостик вдвое длинее вышел. 58000 поставил, надо было 59000.

Добавлено:
кстати, кто-нибудь мог бы взяться за таймлайны роликов.

Автор: sergiokapone, Отправлено:20:38 21-04-2022


Цитата:
Новые возможности СК 6.72: ролики от bolega  
1й - https://rutube.ru/video/e6414edaa09e6616246ed13625c5fd3f/
2й - https://rutube.ru/video/407270e2b887f590aca22557c1458909/
 
Будут ещё.
 
От себя скажу в третий раз : охренеть!! По всей видимости, вопрос с глифированием закрыт окончательно, всё стало полноценно и удобно.  
Баги только надо выловить, без них не бывает.
 
---
Вопрос ещё такой, интернациональный: а получится ли подключить нестандартный (редкий) язык? Какие тут возможны препятствия со стороны словарей, ФР, самой винды?


А может кто-то перекинуть ролики на youtube или на облако. Смотреть на rutube под vpn адский ад. Спасибо.

Автор: kamenkapenza, Отправлено:21:12 21-04-2022

bolega, здравствуйте!
Можно получить от Вас оригиналы трех имеющихся в наличии частей обучающего видео по новой версии программы? Сделать ссылку на яндекс-диск, народ просит, каждому товарищу, умельцу-книгосоздавателю хочется иметь такие разъяснения у себя на компьютере, а не лезть на Рутуб каждый раз, тем более видео там отвратительного качества, максимальное разрешение не стандартное 720p или 1080p, а какое то непонятное 672p (максимально), т.е Рутуб уничтожил качество ролика. Если скачать ролики, с помощью Internet Download Manager на компютер, то качество визуального просмотра очень плохое. Я уверен, что народ со мной согласится: дать возможность скачать ролики-оригиналы напрямую без посредников (кому надо пусть выкладывает на ютуб и рутуб для своих подписчиков).
По обработке зон вы делали ролики и давали ссылки на яндекс-диск на оригиналы. Последние ролики пропущены через рутуб и напрочь убиты.


Автор: TelecomUral, Отправлено:21:14 21-04-2022

Похоже, рутуб не подходит для хранения видео. Почитал faq, грусть-тоска. Написал вопрос в поддержку, отчего такое плохое качество.
Но альтернатив я не знаю.
Берите пока с ЯД, чего мучаться:
https://disk.yandex.ru/i/eILgtxTrjNDqaA
https://disk.yandex.ru/i/6G8jrrozdQRSNA
https://disk.yandex.ru/i/NbgKHqrxZJ9r6g

3я: https://disk.yandex.ru/i/YqZtj9lGG9PExw

Автор: sergiokapone, Отправлено:21:19 21-04-2022

TelecomUral, благодарю!

Автор: kamenkapenza, Отправлено:21:21 21-04-2022

TelecomUral, спасибо!!!


Автор: TelecomUral, Отправлено:21:50 21-04-2022

[more=видео в сети ВКонтакте]Вот я ещё попробовал в VK загнать одну часть, от безысходности
https://vk.com/video557963068_456239119
Понятия не имею, можно ли оттуда выдрать обратно на локальный диск без потери качества. Пробуйте.
Пошерстил поисковики, никаких альтернативных площадок не нашёл. Можно vimeo, но там ограничение по объёму 500Мб в неделю, как пишут. Может врут.

UPD
нашёл в VK страничку РГБ, там на днях пошёл опрос о переезде с ютьюба.


UPD2
скачивать можно, но похоже только зарегистрированным


UPD3
К огромному сожалению, скачанный с ВК ролик имеет явные признаки пережатия. Несильно, но многие буквы интерфейса почти не читаются. Поэтому я склоняюсь к версии рутуб плюс ссылка на ЯД под видео.
Вероятно, хостинг как-то улучшится... с годами, блин![/more]

Автор: D1D1D1D, Отправлено:13:50 22-04-2022

TelecomUral

Может, PeerTube подойдёт — https://ru.wikipedia.org/wiki/PeerTube

Пример видео — https://tube.plandemia.news/w/31c05092-6dfe-4062-b176-a945808587bc

Автор: TelecomUral, Отправлено:14:27 22-04-2022

[more=оффтоп про видео]я думаю, стоит выждать месяц-два. Пока класть на ЯД.
Повнимательнее присмотрелся к списку своих роликов на рутубе, а он, собака, отчаянно глюкует. Удаляю один ролик, появляется - сам - другой, который был вроде бы ранее загружен, но не виден. Жесть.
[/more]

Автор: D1D1D1D, Отправлено:14:31 22-04-2022

OFF:
Интересная возможность автоматической бинаризации изображений с неоднородным фоном в пакете "Scikit Image" — https://scikit-image.org/docs/stable/auto_examples/segmentation/plot_niblack_sauvola.html

Автор: italia57, Отправлено:18:16 22-04-2022

Большое Спасибо за ссылки на ЯД!

Ждем обновленный СК 6.72!
Это действительно прорыв по борьбе с марашками и корявыми буковками...

Дадим бой марашкам, на удаление которых у меня уходит до 95 процентов времени от всего времени обработки

Автор: kamenkapenza, Отправлено:18:22 22-04-2022


Цитата:
Пока класть на ЯД

TelecomUral, это самый лучший вариант!

Автор: qwaxym, Отправлено:18:38 23-04-2022

Вроде нормально на VC, быстро загружаются видео и главное можно скачать. Сравнивал качество, мне кажется одинаковым. Может от плеера зависит?

Автор: TelecomUral, Отправлено:18:56 23-04-2022


Цитата:
Сравнивал качество, мне кажется одинаковым

присмотритесь к буковкам-подписям около галочек. в оригинале они всегда четкие, а возвращенный ролик у меня на этих местах рябит, кусочки пропадают.
хотя может и плеер.

Автор: nuget2, Отправлено:00:51 24-04-2022

TelecomUral

Цитата:
Понятия не имею, можно ли оттуда выдрать обратно на локальный диск без потери качества.

А изначально в каком разрешении было видео?

Вот что на выходе youtube-dl:

Код:

$ youtube-dl -F https://vk.com/video557963068_456239119
[vk] 557963068_456239119: Downloading JSON metadata
[vk] 557963068_456239119: Downloading m3u8 information
[info] Available formats for 557963068_456239119:
format code extension resolution note
url240 unknown_video 240p
url360 unknown_video 360p
url480 unknown_video 480p
url720 unknown_video 720p
hls-186 mp4 256x136 186k , 30.0fps
hls-261 mp4 426x226 261k , 30.0fps
hls-445 mp4 640x340 445k , 30.0fps
hls-653 mp4 852x452 653k , 30.0fps
hls-1149 mp4 1280x680 1149k , 30.0fps (best)


Максимальное разрешение, доступное для просмотра/скачивания, 1280x680.

Автор: TelecomUral, Отправлено:04:00 24-04-2022

nuget2
я ничего не пережимал. MPC-HC показывает:

Цитата:
Video: MPEG4 Video (H264) 1356x720 29.97fps 629kbps [V: h264 high L3.2, yuv420p, 1356x720, 629 kb/s]
Audio: MP3 44100Hz stereo 256kbps [A: mp3, 44100 Hz, stereo, 256 kb/s]

Вполне вероятно, дело в "1356", потребовалась перекомпрессия с обрезкой, отсюда и потери. Хотя какое кому дело до пикселей на видеосервере, непонятно. Хранилось бы в оригинале.

Автор: slava_kry, Отправлено:06:29 24-04-2022


Цитата:
Хотя какое кому дело до пикселей на видеосервере, непонятно.

Большое дело. У Трубы аппаратные компрессоры (насколько я помню), а у них конкретные значения, как у ваших дежавюшек.

Автор: kamenkapenza, Отправлено:07:48 24-04-2022


Цитата:
Впечатляет. Хотя без части 3 абсолютно непонятно, в каком виде и от какой версии ФР используется OCR информация.


Цитата:
Такой режим есть. Я вроде демонстрировал его. Возможно, он как раз в не выложенном ролике.


Будем ждать третью часть.

Автор: nuget2, Отправлено:08:14 24-04-2022

TelecomUral, как получилось такое разрешение (1356x720)? Формат HD 720p кодируется с разрешением 1280x720 (16:9).

Автор: shch_vg, Отправлено:13:02 24-04-2022

Кто-нибудь знает, в текущей версии (а м.б. в следующей?) СК есть фича автоматического выравнивания по вертикали набираемого из глифов слова?
В старой периодике формата А3, как правило, хранящейся в согнутом состоянии, на сгибе посредине пропадают слова и предложения, которые приходится восстанавливать по смыслу.
Основной геморрой возникает при наборе отдельного слова. Как ни выравниваешь очередную букву к предыдущей, после ее фиксации она часто смещается по вертикали, что сразу же заметно. Приходится повторять этот процесс, делая поправку на будущее смещение.
Мой вопрос о наличии фичи, которая автоматически выравнивает по низу предыдущей буквы.
Буквы типа р, ц, щ и т.д. могли бы дополнительно выравниваться по доп.щелчку на вставляемой букве.

Автор: imwerden, Отправлено:15:01 24-04-2022

1 часть на ю-тубе для наших эмигрантских кругов

https://www.youtube.com/watch?v=5iHfaVFOfXo

2 часть загружаю: https://youtu.be/0j3HQ7VrI6E

Автор: bolega, Отправлено:18:23 24-04-2022

3-я часть https://workupload.com/file/Tc6ewvvFtXh

Автор: sergiokapone, Отправлено:19:33 24-04-2022

bolega, спасибо за видео и за sk! Прям революция в нашем деле! Помню как я по глифику реставрировал 300-страничную книгу целый год.

Автор: italia57, Отправлено:20:09 24-04-2022

3-я часть на ЯД - https://disk.yandex.ru/i/AbTv4koTmCGogw

Автор: D1D1D1D, Отправлено:21:30 24-04-2022

Части 1—4 на ютубе

https://youtu.be/tds0FR7JYdA
https://youtu.be/brpbjRnvfNY
https://youtu.be/bhkS-asM8bY
https://youtu.be/oLez77QD094

Автор: slava_kry, Отправлено:05:54 25-04-2022

nuget2

Цитата:
как получилось такое разрешение (1356x720)? Формат HD 720p кодируется с разрешением 1280x720 (16:9).

Это разрешение монитора тех времён, когда ФуллХД ещё не вышел толком на рынок.

Автор: TelecomUral, Отправлено:07:27 25-04-2022

попробовал положить в ВК правильный размер 1280х720, не помогло. Мелкие кусочки букв исчезают (как деспекл )

Автор: niccolo, Отправлено:10:35 25-04-2022

Ролики посмотрели. Теперь вопрос - а где же сама программа?

Еще один вопрос к понимающим — из пакета SK с OCR информацией файлы можно будет сохранять в OCR PDF?

Автор: bolega, Отправлено:12:30 25-04-2022


Цитата:
Теперь вопрос - а где же сама программа?

Думаю, в ближайшие дни будет релиз.


Цитата:
Мой вопрос о наличии фичи, которая автоматически выравнивает по низу предыдущей буквы.

Такого пока нет


Цитата:
из пакета SK с OCR информацией файлы можно будет сохранять в OCR PDF?

Такого нет. Я как-то пытался добавлять текст, но ничего хорошего не вышло. Поместить в pdf картинку оказалось на порядок проще, чем не-английский текст.



Автор: TelecomUral, Отправлено:14:17 25-04-2022


Цитата:
проще, чем не-английский текст

ну уж, прям сложность. С вашим-то опытом да не подобрать кегль и межбуквенный интервал в слове.
Вот с самим файлом шрифта - да, проблема. И с внедрением, и чтоб все значочки нашлись, и без CMap. Подойдёт только ариал, и то не всегда.

Автор: bolega, Отправлено:17:09 25-04-2022

TelecomUral
Например, русский текст вставляется с любым шрифтом, и отображается корректно. Но поиск ничего не находит. Вот в чем была у меня проблема

Автор: TelecomUral, Отправлено:17:36 25-04-2022

bolega
это неверная отработка CMap (отсутствие её, вероятнее всего). Не хочу хвастать, но я в общем разобрался, как там всё устроено в стандарте, могу проконсультировать, если что. Уж по неработающему примеру - точно смогу, натренировался на ветке http://forum.ru-board.com/topic.cgi?forum=5&topic=17599&glp#lt

Автор: niccolo, Отправлено:17:38 25-04-2022


Цитата:
Но поиск ничего не находит. Вот в чем была у меня проблема


А копи-паст что выдаёт - крякозябры? А что за инструмент для создания PDF использовался?
Если память не изменяет - почти во всех ПДФ, созданных с адобовским шлаком версий года до 2008-2010, были проблемы кодировкой кириллицы.... Даже сейчас в куче истинных ГОСТов тех лет поиск не работает и копируются крякозябры.....

Больше, правда, удивило то, что ударившись головой в PDF, Abbyy не сделало автоматического инструмента для исправления этой проблемы....
А если пытаться через Infix - то если в файле 1-2 шрифта - можно помучиться и сопоставить их - хотя-бы в Infix всё заработает нормально (можно будет скопировать текст только с ошибками набора).... Но когда шрифтов больше 5...... (именно поэтому меня удивляет Bolega ваше стремление выбирать буковки ручками)....

При исправлению кривизны строк через OCR пока единственный вариант — выставлять буковки ровно вручную?

Вопрос к автору утилитки FR 12-15.
Для более ранних версий - типа 8, где текст ещё привязан к страничкам и находится в файлах frf, версии инструмента не будет?

Автор: TelecomUral, Отправлено:17:54 25-04-2022


Цитата:
Для более ранних версий - типа 8

кстати, да - восьмерка лучше опознавала буквы, можно ли ее результаты прикрутить к СК ?

Автор: nuget2, Отправлено:18:08 25-04-2022

TelecomUral

Цитата:
попробовал положить в ВК правильный размер 1280х720, не помогло.

OBS Studio пробовали?

Автор: TelecomUral, Отправлено:18:29 25-04-2022

nuget2
вы путаете: ролики не мои.

Автор: nuget2, Отправлено:18:39 25-04-2022

TelecomUral, ну я понял что это не вы делали..., я имел ввиду bolega пробовал делать запись через OBS Studio. Там вроде как настраивается разрешение экрана и кодировщик тоже...

Автор: TelecomUral, Отправлено:18:59 25-04-2022

nuget2
[more=оффтоп про видео 2] видеосерверы должны быть нормальные!!

В этих видеостандартах, кодеках и потоках чёрт ногу сломит, с чего бы обычный юзер должен вникать во все эти тонкости и нюансы. Я сколько ковыряюсь с видео, до сих пор от обилия вариантов голова плывёт. Это же не дело. А ещё и аудио в полусотне вариантов.
Плюсом разные программы и сервисы для обозначения одинаковых технически вариантов используют различные обозначения и сокращения. К тому же со временем обозначения ради успеха коммерции видоизменяются. И это вообще тупик.

Вот какого хрена у меня при обрезке поля с помощью HandBrake из 230Мб получилось 81Мб, а при скачивании этого чуда обратно с ВК - 410/411Мб, причем с потерями - ??!... И никаких настроек и объяснений!
Так что давайте эти темы тут не обсуждать. Не к месту. Есть оригиналы, есть ЯД, и точка.
[/more]

Автор: italia57, Отправлено:21:47 25-04-2022

bolega

Как я понимаю, ОСR-ить надо уже финализированные страницы, полученные из оригинальных сканов?

Автор: niccolo, Отправлено:23:03 25-04-2022


Цитата:
ОСR-ить надо уже финализированные страницы, полученные из оригинальных сканов


Те, что будут лучше распознаваться. Это могут быть как обработанные изображения, так и нет. Главное - строгое постраничное соответствие файлов в пакете SK и FR.

Автор: italia57, Отправлено:23:51 25-04-2022

niccolo
Ну я имею в виду для последующей реставрации букв и удаления марашек...

Потом то я все равно отдельно уже красивый текст будут распознавать в самом FR15

Автор: niccolo, Отправлено:00:58 26-04-2022

italia57

Я про это и говорю... Чтобы марашки удалить - нужен OCR. FR8, если грубо, в общем чуть лучше распознаёт переэкспонированный (светлый/тонколинейный) монохромный текст (по простой причине, что у «бедного» текста/букв меньше возможных вариантов, чем у «жирных», где чёрный кружок может быть и о, и с, и 0, и е и т.п.) Т.е. вроде ФРу лучше подсовывать как бы обработанные сканы. Но в данном случае, учитывая марашки, которые будут сильным фактором нестабильности именно для «бедных» сканов, это может быть и не так.

Автор: bolega, Отправлено:08:52 26-04-2022


Цитата:
Как я понимаю, ОСR-ить надо уже финализированные страницы, полученные из оригинальных сканов?

Да, реставрацию имеет смысл делать на самом последнем этапе.
Я бы еще рекомендовал сначала удалять изолированные марашки, и только потом делать ocr в tesseract/fr. Будет меньше "ложных" букв. Особенно падкий на них tesseract, часто принимает их за "г" или "т".
В fr нужно отключить всякие предварительные улучшалки (исправление перекоса, геометрии и т.д.), чтобы не нарушить соответствие между координатами букв на скане и в bookmark-файле. И конечно же после распознавания fr никаких исправлений ручками в самом fr. По крайней мере так предупредил автор утилиты NME




Добавлено:

Цитата:
А копи-паст что выдаёт - крякозябры? А что за инструмент для создания PDF использовался?

Копи-паст выдает крякозябры, если там, куда пастится, стоит английская раскладка. Если же включить русскую, то пастится нормально. Типичная проблема для не-юникодного текста в кармане.
Инструмент - СК ))


Цитата:
Для более ранних версий - типа 8, где текст ещё привязан к страничкам и находится в файлах frf, версии инструмента не будет?

Надо просить gencho. Его djvuocr в принципе все умеет, только нужно организовать соответствующий вывод в файл. Помню, что очень давно он по моей просьбе какой-то вывод добавлял, забыл какой, и сейчас не могу проверить, нет ничего под рукой.

Автор: TelecomUral, Отправлено:09:04 26-04-2022


Цитата:
очень давно он по моей просьбе какой-то вывод добавлял

штатный - пословно в html. Но какая-то первоначальная версия выдавала побуквенно. В хелпе об этом есть.

Автор: bolega, Отправлено:09:14 26-04-2022

И главное препятствие в использовании FR8 - неотключаемое исправление наклона. Причем исправление может быть разным для разных абзацев, что делает невозможным воспроизвести его.

Автор: TelecomUral, Отправлено:09:34 26-04-2022


Цитата:
Типичная проблема для не-юникодного текста в кармане

Почти 100% признак отсутствия таблицы character map в описании шрифта Где-то на хабре или на stackoverflow было краткое но исчерпывающее разъяснение логики связки кода знака на странице с номером юникода, который надо ему сопоставить при поиске и копипасте. По-моему даже в стандарте от адоба есть этот же кусочек. Только он там позаумнее, потому что учитывает китайские варианты.

Автор: bolega, Отправлено:10:06 26-04-2022


Цитата:
Почти 100% признак отсутствия таблицы character map

Это я понял. Вот добавить cmap это еще та морока. Будет время, займусь.
И не только китайские, корейские и еще кучу.

Автор: TelecomUral, Отправлено:10:46 26-04-2022


Цитата:
Вот добавить cmap это еще та морока.

если делать универсально, то я бы вообще на вашем месте не стал браться
Там же застрелиться составлять их под каждый используемый нестандартный шрифт. Но вот мне непонятно, зачем со шрифтами подробно возиться (да и платные они, когда для вставки в pdf/a). В djvutoy автор тоже сначала загрустил от комбинаций, а я ему предложил сделать попроще, только кегль вычислить, а русский шрифт брать всегда один. Но он накосячил еще и с интервалами, буквы разъезжаются по строке. То есть мышкой выделение чаще всего не сделать, промашка будет. Я уж не стал жаловаться, он и так много для русификации сделал.

А под стандартный виндовый шрифт, обычно ариал, одного слова - WinAnsiEncoding - хватает.

Проблемы возникают на узких шрифтах оригинала, типа Arial Narrow, или Архитектурного узкого. Но, повторяю, зачем так заморачиваться, не вполне ясно. СК всё же не верстальная программа, смысла подкладывать невидимые символы точно под каждый глиф лично я не вижу. В основном из-за трудоёмкости программирования этих изысков.

Автор: bolega, Отправлено:11:55 26-04-2022

TelecomUral
Да мне шрифт не нужен. Тем более я его ниоткуда не получаю. Возьму стандартный, например helvetica. Я хочу просто текстовый слой подложить, чтобы поиск работал. И слой из слов, а не букв.

Автор: slava_kry, Отправлено:12:40 26-04-2022

bolega
Вдруг...

https://habr.com/ru/company/ncloudtech/blog/661673/

Автор: TelecomUral, Отправлено:12:46 26-04-2022


Цитата:
Возьму стандартный, например helvetica

Думаю, не выйдет:
https://num.radiosit.ru/address/kak-uznat-kakie-shrifty-podderzhivayut-kirillitsu.html
там есть "Таблица соответствий шрифтов".

Ма Цзян в djvutoy взял Courier New. Выглядит ужасно - UPD я его раскрасил, чтобы посмотреть.

UPD2
вы не можете взять стандартное подмножество шрифтов (перечисленное в стандарте адоба), потому что для них нельзя прописать иную таблицу символов. В этом же и суть кириллической проблемы с 90х годов. Стандарт говорит "14 именованных шрифтов, и у них только западноевропейский набор букв". Я пробовал, помнится, в HEX-редакторе добавить определение кодовой страницы стандартному шрифту, но любой вьювер просто ломался и говорил что в pdf некорректное определение шрифта.
Поэтому, чтобы гарантированно нарисовать русскую букву, вам надо обязательно запихнуть в pdf бинарник шрифта, в котором - возможно! - есть эта русская буква. И CMap тогда сможет работать для копипаста. Шрифт-бинарник не обязан быть полным, главное чтоб логика перекодирования связная была. Если буквы (глифа) во встроенном шрифте нет, то вьювер pdf будет стараться подобрать схожий шрифт из операционки, где он запустился. Поэтому я Ариал поминаю.

Автор: niccolo, Отправлено:18:10 26-04-2022


Цитата:
Ма Цзян в djvutoy взял Courier New. Выглядит ужасно
\

Помнится был такой баг в ФР8 - когда программа подставляла Courier New в ПДФ при рендеринге страниц в картинки для распознавания, если в системе не было шрифта из ПДФ. Когда символы налагаются друг на друга порой в три слоя - это жесть....

Автор: kamenkapenza, Отправлено:22:04 27-04-2022

Вы всё про новенькое, а я про старенькое, т.е. про работу в существующей версии программы. Такая вот ситуация. На страницах с фотографиями в основном текст бледный, размытый, и надо поднимать бинаризацию. Можно ли не снимая маркировку страниц, как то выделить их группой для работы только с частью страниц (даже если они идут не по порядку, требуется выборка). То есть из всех маркированных страниц выделить часть, потом только эту часть обработать, не включая в обработку остальные страницы.

Автор: daa2013, Отправлено:04:20 28-04-2022

да.

в окне RV используй хоткей F2 (если разворот, то для правой части - F3)
и читай пар. 4.1. Хрестоматии про типы выделений

Автор: TelecomUral, Отправлено:05:14 28-04-2022

каменке
Главное меню Edit -> Select group -> Special... там галку на опции "Zones". Выделятся красным страницы с фото. Затем перенастроить порог бинаризации, размножить его на Selected файлы (по Alt+выбор или по ПКМ на уже настроенном параметре Apply option to group с радиокнопкой на "All selected"). И переобработать их (upd главное меню Process -> Group -> Process selected).
Но если страницы с разворотами, и то одна половина без фото, то другая, тогда будут проблемы.
Можно покрасить красным через маркирование зон, bolega это показывал в роликах.

Автор: bolega, Отправлено:08:34 28-04-2022

kamenkapenza
В главном окне файлы можно выделять красным. Пробелом или F2, повторное нажатие снимает выделение. Если нужно выделить подряд большой диапазон, то выделили первый файл, стали на последний в нужном диапазоне и нажали Shift-пробел. Передвижение фокуса в списке не отменяет красных выделений, как это бывает с классическими выделениями в списках. Для массового снятия выделений используются команды Edit > Clear selections > ...
Выделения сохраняются в задании.
Для обработки только выделенных: Process > Group > Process selected
Для просмотра в окне RV только выделенных Result > Show for selected only

Автор: kamenkapenza, Отправлено:15:09 28-04-2022

bolega, большое спасибо за разъяснения!!!

Автор: italia57, Отправлено:16:20 28-04-2022

niccolo и bolega

Большое спасибо за разъяснения!

Пожалуйста, не томите нас, выложите хотя бы завтра новую версию, руку набить на майских праздниках, довести до автоматизма...

Автор: TelecomUral, Отправлено:19:21 28-04-2022

вообще-то, чтоб нормально потестить софт, надо хотя бы неделю в нём поработать. я вот всё ещё подбираю сканы вдумчиво.

Автор: TelecomUral, Отправлено:07:27 29-04-2022

[more=оффтоп, качество ролика рутуб]рутуб меня в итоге "послал"



UPD

но я таки добил эту тему!! Кому интересно, посмотрите, как оно:
https://rutube.ru/video/d09bac7c8f2c1f80af5bc7376805f907/

Потребовалось а) нарастить поля до 1920х1080 (через HandBrake и .NET runtime 6.0),
б) изменить частоту кадров на 25,
и в) самое дикое, поднять битрейт до 4000кбит/сек. Последнее удалось только к сегодняшнему обеду, с помощью крякнутого "Movavi Video Converter 22.2.0 Premium RePack...". Нормальные старенькие конвертеры не имеют таких возможностей, там всё на сжатие видео заточено.

Матюкаюсь на программистов рутуба... и на стримеров тоже! Кретинизм какой-то, в двадцать почти раз (!) поднимать размер файла, с 81Мб до 1,3Гб. Без какого-либо практического смысла!
[/more]

Автор: kamenkapenza, Отправлено:14:11 29-04-2022

TelecomUral, оптимальный вариант выкладывать на рутуб, ютуб с качеством "как получится", а в коментариях давать ссылки на оригинал видео (какое то файлохранилище). Дилетантам и так сойдет, а профессионалам (где надо каждую закорючку рассмотреть) будет возможность оригиналом воспользоваться, качеством без потерь.

Автор: italia57, Отправлено:18:12 29-04-2022

Неплохо было бы залить на яндекс диск пару видео в оригинальном качестве bolega c обработкой зон. Очень ценный материал

Автор: daa2013, Отправлено:19:21 29-04-2022

по ссылкам в шапке кликать не пробовали ?

Автор: italia57, Отправлено:22:13 29-04-2022

Не пробовал. Спасибо что подсказали!

Автор: kamenkapenza, Отправлено:17:22 30-04-2022

Христос воскресе!
Друзья, всегда стеснялся, но сегодня решился спросить. Как правилно обрабатывать книгу с черно-белыми иллюстрациями в Скан Кромсаторе? Часть страниц книги для примера тут https://disk.yandex.md/d/pjYnaz5Q4zHTkw Если обрабатывать без создания зон, как черно-белая страница, то получается слишком много черноты (особенно где жирные элементы рисунков). Если создавать зоны (в режиме серого или цветного рисунка), то явно получается видна разность насыщенности черно-белого цвета: текст контрастный черный, а рисунок бледноватый, неконтрастный.
Вполне вероятно, что вариант 2 (через создание зон правильный), но через работу во вкладке Filter.
Честно говоря, я нигде ни в каких видеороликах (учебных материалах) по Кромсатору не видел, чтобы кто-то в этой вкладке демонстрировал работу (наверное, тоже как я,не умеют и не решаются пользоваться, но ведь для чего то они придуманы) А там много чего интересного: разные инструменты настроек Contrast, Brightness, point ( 2 вида), Smooth, Bloor, Sharpen, Bloor2, Sharpen2.
Есть такие специалисты, которые в этих настройках кумекают?

Автор: daa2013, Отправлено:17:34 30-04-2022

я не смотрел еще пример, но пикчур зоны можно заказать черными с кастомным поргом бинаризации ниже основного

Автор: kamenkapenza, Отправлено:17:43 30-04-2022


Цитата:
можно заказать черными с кастомным поргом бинаризации ниже основного

daa2013
Можно вам заказать видеоролик по этому поводу? Я даже расшифровать не могу это ваше выражение, а тем более как это выглядит в действии.))
Или последовательность шагов описать.

Автор: daa2013, Отправлено:17:52 30-04-2022

заберите эти рисунки в пикчур-зоны с такими параметрами:

https://disk.yandex.ru/i/IsNl39nTugiaIw

Автор: TelecomUral, Отправлено:17:58 30-04-2022


Цитата:
kamenkapenza
текст контрастный черный, а рисунок бледноватый, неконтрастный

Это вопрос из разряда "эстетических". Со стороны такому не научиться.

Никто вам не мешает исправить (покрутить) яркость и контраст в серой пикчур-зоне, чтобы черный стал почернее ("а белый побелее"). По собственному вкусу. Благо есть превьюшка.
Я вот лично с большим трудом вывожу такие рисунки в красивый вид. А фотошоперы со вкусом - одним движением, молниеносно.

Начать можете с применения фильтра "autolevels".

UPD
ролик.
https://disk.yandex.ru/i/b4MG7s0pxb9maw
ногами не пинать!

Автор: kamenkapenza, Отправлено:20:56 30-04-2022

daa2013, спасибо! То есть я так понимаю, что черно-белые в любом случае выводить зоной.
TelecomUral Автолевелсом я пользуюсь, благодаря ролику автора программы по обработке зон. Фотошоп я считаю суррогатом, Тейлор и Кромсатор - только этими программами надо книги делать!
Где-нибудь есть обзор по вкладке Filters, как ей достойно пользоваться? Я уже не говорю про вкладку Filters2, где ещё больше прибамбасиков. Моё такое мнение, что никто кроме автора программы (многоуважаемого bolega) не владеет навыками по использованию этих меню в полном объеме.

TelecomUral, большое спасибо за ролик! Всё подробно и понятно.
Я с удалением фона особо не мудрю: выделяю самое темное место фона и исключаю его, то есть фон страницы становится белым. Рисунок становится при этом блёклым, я через включение Автолевела цифрами вывожу рисунок (чем ниже верхняя цифра в автолевеле, тем контраснее рисунок, и чем больше цифра, тем бледнее). Это всё автор программы демонстрировал в ролике по обработке зон.


Уважаемый bolega, если у вас будет время и желание создать следующий ролик по обучению приемов работы в своей программе, то вот это как раз самая злободневная и неизученная тема (меню Filter, Filter2, Blur). Так как меню там сложные, многофункциональные, то,я так думаю, каждое меню отдельным роликом (а то и не в один). Я думаю, что многие товарищи поддержат мою просьбу.




Автор: kamenkapenza, Отправлено:08:06 01-05-2022

Здравствуйте! Такой вопрос. В торопях выключил компьютер. До этого делал книгу, всю её обработал, есть выходная папка, отдельно текст и картинки (как и надо). Задание не сохранено. Можно ли как то обеъдинить эти файлы (мерге зон) и создать джву?

Автор: qwaxym, Отправлено:15:56 01-05-2022


Цитата:
есть выходная папка, отдельно текст и картинки (как и надо)

Если выход сделан правильно(с белыми подложками под рисунками), то в Djvu small собираете текст ч/б в djvu, а Djvu Imager вставите в ч/б файл картинки. Возможно в sk это же сделать ещё проще.

Автор: TelecomUral, Отправлено:20:43 01-05-2022


Цитата:
Задание не сохранено

СК обычно сохраняет задание автоматически. Но я не знаю, требуется ли его перед этим сохранить хотя бы один раз вручную (чтобы папка и имя создались).
Поищите в spt *.sav*

Автор: niccolo, Отправлено:12:36 03-05-2022

Новую версию ещё не выкладывали?

А то у отдельных товарищей в теме про DJVU-утилиты вроде уже циферки 6.75 мелькают..

Автор: italia57, Отправлено:15:00 03-05-2022

niccolo
Пока нет. Только для тестировщиков.

Автор: kamenkapenza, Отправлено:23:30 04-05-2022

Как проще обработать вот такую страницу. https://disk.yandex.md/i/-iEhMm3eFwUEqA
Цветной вензель вокруг названияк книги, и местами всё это впритык, А вензель вкруговую. То ли этот вензель за два раза выделять, как две картинки и пристыковывать, делать разрыв. А в местах спорикосновения с буквами названия книги выводить зону тютелька в тютельку при большом увеличении страницы.

Автор: TelecomUral, Отправлено:05:29 05-05-2022


Цитата:
в местах спорикосновения с буквами названия книги

Это много проще малоцветкой (24-bit color и в VR довести до 3-хцветки), ведь сейчас даже палитру можно между VR и главным окном передавать. Остальные цветные куски в данном случае - крашеными BW пикчур-зонами.
СК не сдвигает зону относительно страницы, поэтому совпадение линий обычно полное даже в "перерезанной напополам" букве. Но можно выделить в одну зону все слова "Б.П.ХАШДЕУ ИОН -". Так проще.

Это я описал общее решение. Для светлых красок можно обойтись крашеной BW пикчур-зоной с прозрачностью, оставив текст под зоной и просветив маску прозрачности. Так можно вообще одной большой зоной всё накрыть, потом одной командой в VR решить вопрос.

Всё это было подробно показано в моих роликах.

Автор: shch_vg, Отправлено:12:57 05-05-2022

TelecomUral
А как такой вариант?
Сначала обработать в ч/б, затем сделать зону на всю страницу и залить цветом бордюра.
И, наконец, во второй вариант вставить ч/б текст из первого.

Автор: TelecomUral, Отправлено:13:10 05-05-2022

shch_vg
это пусть каждый сам решает, а СК лишь набор шикарных инструментов.

Автор: shch_vg, Отправлено:13:21 05-05-2022

TelecomUral

Цитата:
СК лишь набор шикарных инструментов

Так-то оно так, но средствами СК не смог в свойствах зоны получить нужный цвет бордюра.
При выборке для заливки вроде нужного цвета в результате получался совсем другой.

Автор: TelecomUral, Отправлено:13:28 05-05-2022

shch_vg
сделайте ролик или подробно опишите последовательность действий. Это любопытно: я если и ошибался в цветоподборе, то понимал что "сам дурак" - не учитывал окружение, откуда пипеткой беру цвет. Темножелтая бумага и конечный белый цвет фона - это две большие разницы для интегративной функции глаза.
slava_kry меня как-то учил жёлтый цвет подбирать, так я вообще посмеялся над методой: "тыкаете цвета rgb такие-то... а потом крутите насыщенность туда-сюда, пока не понравится. и другого способа нет". Оказалось - идеальный метод подбора

UPD
даже нашел в переписке, чтоб не соврать:

Цитата:
сначала ставите 255/150/0, а дальше регулируете зелёный в сторону увеличения, пока не понравится.
На 23-м скане я бы поставил именно 255/150/0. Делать такие формулы чистым желтым - это идиотизм.
А на 22-м 255/200/0.

Автор: kamenkapenza, Отправлено:18:12 05-05-2022

Не стал трехцветку делать (пока не особо изучил вторую часть видео про работу с зонами, где автор рассказывал про малоцвет и случаи находа одного цвта на другой (картинка с кайзером) Сделал проще: сначала обвел всё, как зона цветного текста, дпи дефолт,колор чб, паинт под цвет вензеля, а внутренний текст сделал черно-белой зоной.

Автор: shch_vg, Отправлено:23:43 05-05-2022

TelecomUral

Цитата:
сделайте ролик или подробно опишите последовательность действий.

Первое нереально, т.к. в этом вопросе я анти-kamenkapenza
Не знаю, насколько подробно будет описание, но я делал довольно просто.
Увеличиваю значительно колесиком прокрутки картинку просмотра, чтобы удобно выбрать область, содержащую нужный мне цвет заливки, затем на закладке Paint в окошко Enable для текста галочку и жму на пиктограмму кружка с рукой.
Уже выбранный цвет текста мало похож на реальный, а после обработки зоны разница еще более заметна.


Автор: TelecomUral, Отправлено:03:30 06-05-2022


Цитата:
выбранный цвет текста мало похож на реальный

скриншот тоже годится
Вы небось крупную область выбираете. Я приближаю до различимости отдельных пикселей, иначе можно всякую мелкую грязь зацепить. Пиксели ведь очень мелкие, и чистый цвет попадается в 10%.


Автор: imwerden, Отправлено:09:58 06-05-2022

Я тоже замечаю, что цвет другой. но... господа-товарищи, если у вас есть несколько экземпляров одной книги, особенно 60-70-х годов издания, то вы должны знать, что в них везде цвет шрифта и картинок разный.
Поэтому, лично я не заморачиваюсь.
Кроме того, цвет еще разный на разных мониторах...

Автор: kamenkapenza, Отправлено:16:47 06-05-2022


Цитата:
Не знаю, насколько подробно будет описание, но я делал довольно просто.
Увеличиваю значительно колесиком прокрутки картинку просмотра, чтобы удобно выбрать область, содержащую нужный мне цвет заливки, затем на закладке Paint в окошко Enable для текста галочку и жму на пиктограмму кружка с рукой.
Уже выбранный цвет текста мало похож на реальный, а после обработки зоны разница еще более заметна.


анти-kamenkapenza, всё это, вся эта простота, как раз показана автором программы в ролике Видео от bolega:
Обработка зон. Часть 1. (в шапке этой темы).
А ещё там показано, что можно не только взять цвет из увеличенного куска цветной части, но и подкорректировать его, сделать контрастнее с помощью нажатия на значок SK рядом с цветной пипеткой (присвоения нужного цвета), откроется цветовая палитра с гаммой, близкой нужному цвету. После такой корректировки можно добиться оригинального цвета, представленного в книге.
Это уже пройденная тема (меню Паинт). Автор в том ролике показал, как им пользоваться.
Есть в программе неизвестные меню Фильтерс, Блур, Фильтерс2, Шарпен. Там много всяких настроек, а как они работают, в каком случае включать и изменять - никто об этом не знает.



Автор: qwaxym, Отправлено:17:49 06-05-2022


Цитата:
 Есть в программе неизвестные меню  Фильтерс, Блур, Фильтерс2, Шарпен. Там много всяких настроек, а как они работают, в каком случае включать и изменять - никто об этом не знает.

Вставляете названия в переводчик, например,blur-размытие, sharpen-резкость и т.д. Тогда становится понятным когда их применять.

Автор: kamenkapenza, Отправлено:02:07 08-05-2022

[more]
Цитата:
blur-размытие, sharpen-резкость

ООО!! Это гениальное объяснние! Самое главное знать перевод. Да...уж!!! Тогда надо узнать, как переводиться слово ScanKromsator, и можно закрывать форум, потому что вместе с переводом всем всё сразу стало понятно.



[/more]

Автор: asku, Отправлено:17:52 08-05-2022

Когда же новая версия? Думал, на праздники время будет испытать ее...

Автор: qwaxym, Отправлено:10:55 09-05-2022

kamenkapenza, а как же иначе? Сначала переводите, становится понятно для чего фильтр, а в каких случаях применять разве не очевидно? А опциями можете сами побаловаться или вам жалко свое время тратить? Офтоп закончил!))

Автор: italia57, Отправлено:20:18 09-05-2022


Цитата:
Когда же новая версия? Думал, на праздники время будет испытать ее...


Наберемся терпения, тоже жду...


Автор: TelecomUral, Отправлено:08:38 11-05-2022

таймлайны к 4м роликам
---
1
00:15 изменения в Профилях: Book, Zones, Djvu Wizard
01:20 Новые Options: колесико мышки, Zones (превью, индекс, индикаторы)
08:00 Options: Processing (мин.размер hdd), View Result (пиксели для внешних редакторов)
10:02 Главное окно: кнопки маркировки файлов зелеными галками
11:40 selection: отмена узла
12:38 коррекция вершин зон (Edit Vertexes)
14:20 пепевод зоны в полигон
15:00 размер окошка Enhance image
16:27 команды масштаба
17:30 задание размера книги по выделению на скане
18:58 окно "special...": ограничение размера чёрного шейпа с белым спеклом
21:33 панелька карманов зон
24:09 команды для внешних зон: полупрозрачность, блокировка, вставка
27:57 массовые операции (Bulk)
30:43 Resize images / Resize output files



---
2
00:22 три опции VR Editor: слияние при вставке фрагмента
04:55 закладка опций OCR: подсветки, размеры спеклов
06:00 включение подсветки
08:20 marashki mode настройка
08:40 новые команды панельки глифов
10:00 миниредактор глифа
10:50 режим парковки панели глифов
11:50 зачем подсветка у глифа
12:20 в глиф можно сохранить выделения
14:00 режимы глифов: Adjust in OCR rect. (? и Check kerning)
16:27 Удаление мусора в момент слияния глифов
18:50 кнопки OCR:
19:30 кнопка Substract selection
20:08 панелька selection инструмента Image Adjustments
22:20 Copy with position
23:25 меню субпанельки "превью зон"
24:17 контекстное меню зоны: Move to..., Adjust (crop) page, Save to PNG file
26:00 FF delimiters в режиме мультивыделения. Также обратное выделение
26:55 эмуляция Shift
27:30 цветной Despecle: магический для малоцвета и воображаемая бинаризация
30:00 как включаются эти режимы
вопросы: магический с запасом или точно
как ограничить деспекл на фоне куском выделения

Автор: bolega, Отправлено:15:52 11-05-2022

kamenkapenza
Никаких готовых рецептов по использованию блюр и прочих фильтров у меня нет. Иногда интуитивно включаю какой-нибудь. Например, unsharp очень полезен для штриховых иллюстраций.

asku
Постараюсь прислать вам завтра в ЛС ссылку для тестирования.
Много тестов уже выполнено, найдена и исправлена куча багов. Это избавит остальных от лишних проблем.
По итогам тестирования кое-что добавилось новое, что не отражено в роликах.

Последние недели не могу зайти из дома на руборд, т.к. у провайдера какие-то проблемы с доступом (маршрутом) к этому сайту. Думаю, провайдер не при чем, т.к. трасер затыкается где-то на границе СПБ и финляндии.
Поэтому доступ к данному форуму у меня крайне ограничен.

Автор: italia57, Отправлено:16:43 11-05-2022

bolega
Будьте любезны и мне ссылочку. Спасибо!

Сейчас сижу на старой версии 6.00.5, редко, но бывает что при перетаскивании глифа на скан, выдается ошибка и прога полностью парализуется. Даже не удается сохранить изменения.

Надеюсь в новой версии это пофиксено. Испортил себе кучу нервов.

Автор: TelecomUral, Отправлено:17:53 11-05-2022

ролики, таймлайны
---

0 выбор тессеракт или ФР
05:17 парсер NME
10:48 соответствие нумерации ФР и СК, настройка сдвига
12:45 подсветка букв и слов, команды-кнопки
13:55 сопоставление глиф-символ
14:25 темная подсветка = disable
15:20 анализ страницы
15:58 FF delimiter ограничивает область анализа
17:20 что означают цвета в окне Preview
19:15 сортировка списка замен
20:55 ручной сдвиг наложения глифа на скан (кнопка левее кнопки сортировки)
21:40 закладка Details
22:50 число шейпов (связных областей)
23:35 кнопочки "вкл/выкл" замен
24:03 закладка Filers
26:45 применение фильтра в момент формирования списка: ПКМ на кнопке Analyse All
27:52 переход между списком и сканом
29:00 фильтр буквы на сам список
29:35 исправление ошибки распознавания, два варианта
32:04 спеллчекер на закладке Words
33:05 разные варианты поиска буквы: кнопка молнии мигающей подсветки, двойной щелчок перемещает курсор к букве
34:40 как добавить глиф(ы) в анализ ocr
36:32 добавить глифы из других библиотек
37:00 интерактивный режим замены глифов
38:25 ещё один способ замены, без матрицы замен (с помощью глифов сразу из библиотеки)
40:05 режим замены глифа прямо с клавиатуры
40:40 можно этот режим использовать и без опознавания координат буквы
43:25 работа лупы в режиме замены букв
44:45 фиксация лупы на одном месте
45:25 главное меню: Bulk operations: generate copy commands
вопрос: а как быть с переменой z-порядка


---
4
00:15 повтор общей логики, как выполнять исправления
01:30 поиск замен сразу для группы страниц (Analyse for files...)
03:35 опция Autoupdate list и кнопка ручного обновления
04:30 редактирование OCR (Edit OCRed word)
разбор примера заливки букв сбоку у корешка
11:45 сложная широкая марашка не удалилась
12:30 сложный сборный пример с многими листами глифов
12:50 выявление марашек (их подсветка)
13:15 логика работы с марашками
13:45 изолированные марашки, режим
14:30 куски букв попали в марашки, как это отключить/улучшить (кнопка с фонариком и буквой)
15:25 удаление мышью или кнопкой "D", объяснение
16:20 De-lightning mode: убираем подсветку ошибочно(!) найденных марашек внутри букв с помощью мыши, затем через "D" удаляем всё оставшееся сразу
далее пример работы
19:35 удалить из списка замен всё что находится в выделении на странице, команда по ПКМ
21:45 подправка ошибочно задвоенного знакоместа смежных букв
22:22 варианты замены букв: кардинальный по Apply all
23:35 вариант не меняем буквы, удаляем марашки: ПКМ на кнопке, команда "Remove only touched marashki"
24:10 донастройка режима не удаления, а подсветки марашек
24:48 отсмотр результата подсветки
26:16 нажали "D"
27:40 второй скан
28:15 напоминание о первоначальном удалении отдельных марашек
30:43 следующая книжка
31:43 вторая страница
32:35 повторный показ как не меняя буквы удалить марашки
33:50 что делать для подправки положения буквы: стрелочки
34:40 третья книга, осетинский язык
36:36 четвёртая книга, ингушский язык
39:45 пятая книга: слева жирнее чем справа
40:40 контроль кернинга при налазящих буквах
41:42 шестая книга: антенны Сазонова. Очень разорванные буквы
42:20 наклонный шрифт: метод исключения слов в selection (выделение)
46:35 новые команды в контекстном меню при наличии OCR
48:00 подбор заменяющего слова из словаря
вопрос: как удалить грязь между строками

Автор: kamenkapenza, Отправлено:21:25 13-05-2022

Счастливые тестировщика, ну как вам новая версия программы?
Есть там возможность для тех товарищей (наподобие меня), которые ничего в Кромсаторе не режут, не наращивают, а используют её для работы с геометрически готовыми страницами, возможность установить поля в ноль и зафиксировать это в провиле, чтобы программа при открытии помнила эту настройку?
И есть ли возможность зафиксировать в профиле настройки панели Create DJVU vizard в части взаимодействия её с программой djvu mode small (установленной в приложении для изготовления книги)? Настроить необходимые параметры один раз с сохранением настроек. Например, ставим DEE profile bw 600, background quality 100 и foreground quality 100, text compression losless, и это сохраняется, чтобы каждый раз не настраивать под себя.
Вроде, автор программы обещал такие необходимые вещи в новой версии закрепить.



Цитата:
Последние недели не могу зайти из дома на руборд, т.к. у провайдера какие-то проблемы с доступом (маршрутом)  к этому сайту. Думаю, провайдер не при чем, т.к. трасер затыкается где-то на границе СПБ и финляндии.  
Поэтому доступ к данному форуму у меня крайне ограничен.


Помощь уже идет. Скоро прекратятся поставки электроэнергии в эту страну... Первый шаг.. Потом будет видно, что с ними делать)))

Автор: shch_vg, Отправлено:01:53 14-05-2022

bolega

Цитата:
Последние недели не могу зайти из дома на руборд, т.к. у провайдера какие-то проблемы с доступом (маршрутом)  к этому сайту. Думаю, провайдер не при чем, т.к. трасер затыкается где-то на границе СПБ и финляндии.

У меня этот сайт ни пингуется, ни трейсроутится, но тем не менее АКАДО пока обеспечивает стабильный доступ до руборда.

Автор: qwaxym, Отправлено:13:33 14-05-2022


Цитата:
У меня этот сайт ни пингуется, ни трейсроутится

У меня было наподобие, приходилось заходиль с помощью VPN. Сообщил в соответствующей теме и с тех пор всё хорошо!))

Автор: niccolo, Отправлено:18:30 14-05-2022

Наблюдения....

Воюю с книгами из Архива (archive.org).... (PDF без оригинальных картинок). Остановился на сохранении картинок из акробата в png и их обработке.

1. Пытался подобрать параметры в СК и обнаружил, что Paint.net часто вытягивает такие картинки в почти идеально псевдочёрно-белые контрастом и яркостью (по 50 из 100) но ни Irfan в пакетном режиме, ни SK c настройками контраста и яркости на те же 50% не вытягивают - картинки остаются серыми и значительно проигрывают в контрасте. A Paint.Net - пакетную обработку не поддерживает.....
И снова задумался про настройки для данных книг с их хитрым кодированием...

2. Раз уж пошло увлечение FR — Bolega, FR довольно неплохо на автомате определяет положение и размеры на странице растровых картиночных зон. Почему бы не попытаться использовать и данную информацию?

3. Много вопросов по программе возникает из-за обратной бесскобочной логики выполнения многих операций — словил себя на простом - попытке убрать фон у картинки. Вроде действую логически - ставлю флажок - убрать, пытаюсь нажать кнопки с пипеткой для указания фона - а она не жмётся, потому что жмётся она, когда фрагмент фона уже выбран....


Автор: daa2013, Отправлено:19:57 14-05-2022


Цитата:
Воюю с книгами из Архива (archive.org).... (PDF без оригинальных картинок). Остановился на сохранении картинок из акробата в png и их обработке.


Вообще, крайне редко из архив_орга надо курочить пдф. (Как правило, только, что они от гугла в ранний период получали.) Следует либо оригинальные сканы в jp2 скачать, либо пакетно утянуть страницы в джипегах из вьюера.

Приведите пример того, с чем работаете.



Цитата:
2. Раз уж пошло увлечение FR — Bolega, FR довольно неплохо на автомате определяет положение и размеры на странице растровых картиночных зон. Почему бы не попытаться использовать и данную информацию?


Теоретически, можно в СК импортировать маски растровых картинок из СТ.
Автор форка СТУ, во всяком случае, предусмотрел такой экспорт.





Автор: niccolo, Отправлено:20:40 14-05-2022

daa2013

Работал над этим....
https://archive.org/details/dictionaryofgasi0000unse/page/n3/mode/2up

Автор: daa2013, Отправлено:00:20 19-05-2022

Gas:

https://disk.yandex.ru/d/_QlbZRG_ZXkgkg

Исходники:
https://disk.yandex.ru/d/4yo8-g0_Y9fDig

Автор: niccolo, Отправлено:09:06 19-05-2022

daa2013

Спасибо. Здорово. Но у меня цели немного другие и я уже давно распознал его и сконвертировал в Эксель.

И в чём смысл выкладывать исходники без файла пакета (skt), чтобы посмотреть настройки SK...

По косвенным признакам, полагаю, делали в еще широконедоступной 6.75 версии?

Автор: daa2013, Отправлено:09:49 19-05-2022

Нет, делал в старой.

Перед тем, как пихать в СК, была выполнена геметрическая коррекция в ST-Experimental и BookRestorer. Пару десятков нестандартных страниц (приложения) масштабировал под единую высоту блока контента в XnView.
Настройки обработки в СК очень простые - там где белая бумага (это до списков слов в конце) подобрал единый порог бинаризации 130. Там где цветная бумага (списки слов) - порог "Авто". + включен дефолтный деспекл.
Самое противное было - это руками спеклы на 800 страницах почистить. Для облегчения их поиска делал версию pdf в Acrobat ClearScan - в ней они хорошо заметны.

Автор: niccolo, Отправлено:11:53 19-05-2022

daa2013

Спасибо за инфо. Обратил внимание на ровность линий.... Но при таких широких полях для OCR это не принципиально.

Автор: kamenkapenza, Отправлено:18:42 19-05-2022


Цитата:
широконедоступной 6.75 версии

Извините, а это что за версия? Или речь идет о последней версии программы, которая на данный момент доступна, так сказать, по блату, только среди особ, приближенных к императору?

Автор: asku, Отправлено:22:03 19-05-2022


Цитата:
Извините, а это что за версия?


Текущая, всем доступная версия это v6.71.
Но на подходе новая версия, по некоторым параметрам — революционная.
Есть четыре видео от bolega, где он подробно рассказывает что и как. Я сам пока только два видео посмотрел.

Все ждут новую версию СК.

Автор: TelecomUral, Отправлено:06:58 20-05-2022

asku
вы не обольщайтесь, трудоёмкость чистки книги от марашек раз в пять больше чем обычная чистка от мелкого мусора.
Если не в пятьдесят.

Замена букв тоже не чай с сахаром пить. Мало кто этим будет заниматься в итоге.

Автор: italia57, Отправлено:07:07 20-05-2022


Цитата:
Мало кто этим будет заниматься в итоге


Я и буду )))

Автор: bolega, Отправлено:08:34 20-05-2022

Новая версия 6.75

программа
https://workupload.com/file/kJ5ujuvEHKk

добавки
https://workupload.com/file/BLuUj5mbpMx

примеры (из видеороликов)
https://workupload.com/file/kbWX87A4uLM
https://workupload.com/file/BLpfvda7t44

MD5:
ocr2.dll:    102a5e9615a89a06050a5581afb8f6a8
libhunspell.dll:bafe78b545f8055664287196665d3737
fftw3.dll:    dc4160196362c45165665b9ca5ea385b
sk.6.75.exe:    a7990992ff4bf1ce8caa5b8651a7934b
sk6.75.rar:    6d cc ac 55 3b 04 93 c9 4b d4 37 6a fd d6 4c 34
sk6.75-add.rar:    c3 4a a5 aa 83 c9 36 f7 7d 1f db 35 66 19 dd 3e
test-sk2.zip:    f3 a9 08 78 6c 11 e1 41 be 33 ff 05 5e 55 e1 35
testnb.zip:        1b d1 40 aa e1 a0 07 52 67 64 97 28 f4 d0 00 c9

По сравнению с видео добавились незначительные изменения. Чтобы не запутаться в опциях операций замены букв и чистки марашек (которые разбросаны по разным местам), рекомендую использовать для начала команду-помощник: OCR replace option's helper (как вызвать, описано в whatsnew).

Важные замечания:
1. Если используете для ocr FR, отключайте перед распознаванием в нем все улучшалки. В противном случае координаты букв не будут соответствовать реальному их положению на обработанном скане. Надо сказать, что они часто и так не соответствуют, но к счастью разница несущественна (1-3 пикселя).
2. Используйте самую последнюю версию ParserFR от NME.
3. Не используйте пока новый режим Outside letters mode (на момент снятия ролика его еще не существовало) при использовании ocr от FR. Я обнаружил, что из-за небольшого несоответствия координат могут ложно подсвечиваться края букв. В ближайшее время я поменяю алгоритм, чтобы избежать этого.

Всем
Не используйте в версии 6.75 опцию overwrite original scans after rotate в диалоге DRAFT!
Это приведет к повреждению исходных сканов, если их dpi>300 и они в любом формате, кроме jpg


Автор: italia57, Отправлено:11:29 20-05-2022

Спасибо за подарок на день рождения!)

Автор: Benoni, Отправлено:12:21 20-05-2022

bolega
Спасибо!

Автор: daa2013, Отправлено:14:36 20-05-2022

Если кто не в курсе,
то парсер версии 2.3.1 берётся в ветке утилит от NME:
http://forum.ru-board.com/topic.cgi?forum=5&topic=38467&start=580

Прямая ссылка:
https://disk.yandex.ru/d/QLj2Wq1tjvHm8w

одно из изменений:
"убрал лимит в 100 страниц на файл "result*.bookmarks" по-умолчанию.. теперь при запуске без параметров будет создаваться один файл result.bookmarks на всю книгу"

Автор: italia57, Отправлено:14:49 20-05-2022


Не вьезжаю, как подключить ФайнРидер к СК6.75?
Парсер12 я скачал. Файлы дополнительные расположил в той же папке что и СК.

При нажатии на OCR page вылезает
OCR file not found!

Обьясните пожалуйста, чайнику, на пальцах как подключить ФайнРидер15 на пальцах к новому СК?

Где найти эту папку c временными файлами FR?

Автор: TelecomUral, Отправлено:14:56 20-05-2022

italia57
берете пальцами файнридер, берете другими пальцами кромсатор ... и вуаля!


И для кого видео писано?? Для кого я таймлайны делал??

UPD


Цитата:
Где найти эту папку c временными файлами FR?

это не временные файлы, а обычные файлы проекта ФР. При выходе из программы ФР спрашивает "вам проект сохранить? Куда?" Вот там и будут *.dat в подпапке data. Например, так для 15го:


Автор: italia57, Отправлено:15:36 20-05-2022

TelecomUral

Спасибо, буду разбираться...
Видео я смотрел, но сразу не разобрался.

Автор: daa2013, Отправлено:15:44 20-05-2022

Как подключить, было показано в третьем видео.

1. Распознать страницы в FR
2. Сохранить OCR-проект.
3. В подпапке data этого проекта запустить парсер, получить файл result.bookmarks
4. Поместить его в подпапку out\ocr проекта СК
5. В окне MW на закладке page -> кнопка special -> закладка More2 включить язык/языки распознавания
(русский или русский+английский для всех страниц)
6. "На все страницы" команда распространяется кликом ПКМ в ячейке и выбором Apply option to all marked
7. Перейти в RV, кликнуть ПКМ, в опциях выбрать закладку OCR, и там задать OCR mode=FR
8. Далее, как мне помнится, в том же RV по ПКМ команда Special - > OCR page создаст много файлов *.focr, т.е. не только для текущей, но для каждой страницы. Если я ошибаюсь, то выполнить пункт 11.

Однако, можно подключать FR, можно тессеракт. Иногда лучше срабатывает тессеракт.
Для задействования тессеракта следует:
9. В опциях СК задать путь к файлу tessdata2\eng.traineddata (меню File - Options - Apps)
10. Если этого не было сделано ранее, в More2 задать языки распознавания
11. В том же окне MW из меню запустить команду Result -> OCR Outpiut files -> All

Можно вызывать распознавание и постранично в окне RV. Командой Special - > OCR page, когда OCR mode=Tesseract или Combined. Если для FR создавались сразу все возможные файлы *.focr, то для этих методов будет создан файл *.tocr только для текущей распознаваемой страницы. Но ИМХО, чтобы не ждать каждый раз, лучше заранее сделать сразу все tocr для всех страниц. То есть выполнить указанную в пункте 11 команду из MW. А уже потом в случае необходимости переключаться между вариантами OCR. Tesseract хуже распознает буквы, но FR иногда с ячейками лажает.

Автор: sergiokapone, Отправлено:19:04 20-05-2022

bolega, спасибо за новую версию.

Обнаружил баг. Мой старый ini-файл, после запуска 6.75 отображает не все кнопки Edit panel. Нету Highlight Recognized Chars и ряда других. Когда полностью снес ini, тогда все и заработало.



Ссылка на ini

Автор: daa2013, Отправлено:19:21 20-05-2022

А по новой их включить не пробовали ? В списке кнопок они есть ?

Ведь все опции приходится по новой настраивать. Поэтому ИМХО и выключившиеся кнопки по-новой включить - это ИМХО нормально. (Но я сам последнюю версию еще не смотрел.)

Автор: sergiokapone, Отправлено:19:30 20-05-2022

daa2013, пробовл. Не включаются.

Автор: italia57, Отправлено:19:58 20-05-2022

Благодарю daa2013 за туториал.
Что такое окно МW? Где его отыскать?
У меня неустановлены языки следовательно не работает Doubtful Words

Автор: TelecomUral, Отправлено:20:18 20-05-2022

italia57
Main Window, т.е. основное окно программы.

VR - View Result - окно обработанного скана, т.е. бинаризованного и с отдельными зонами.

Добавлено:

Цитата:
У меня неустановлены языки следовательно не работает Doubtful Words

цитата:
- VR: При работе функционала реставрации "плохих" букв возможно применение словарей Hunspell. Поместите файлы hunspell-dicts.cfg и
libhunspell.dll в папку с исполняемым файлом СК. Файл hunspell-dicts.cfg содержит описание местоположения словарей hunspell для
различных языков. Пути к словарям могут быть как абсолютными, так и относительными. Во втором случае путь задается относительно
папки с исполняемым файлом СК. Каждая строка cfg-файла описывает один словарь и состоит из обозначения языка (сокращенного названия),
двоеточия, имени aff-файла словаря (dic-файл должен находиться по тому же пути). Допускаются комментарии, которые начинаются с
символа "!" и продолжаются до конца строки. Обозначения языков жестко зашиты в код СК и совпадают с именами, используемыми в
Tesseract. Для одного и того же языка допускается указывать несколько словарей.

Автор: 1234olexiy, Отправлено:21:41 20-05-2022



Цитата:
Новая версия 6.75

Спасибо дорогой bolega!
А будет ли когда-нибудь в кромсаторе автоматическое выделение картинок?
очень нужно.

Автор: bearjrgm, Отправлено:21:52 20-05-2022

bolega спасибо за новую версию

Автор: asku, Отправлено:22:03 20-05-2022


Цитата:
парсер версии 2.3.1


Сегодня днем на работе скачал его и после двойного щелчка началась инсталяция. Сейчас дома (мой основной комп для СК) скачал, и после двойного щелчка ничего не происходит. Ничего не устанавливается.

Автор: niccolo, Отправлено:22:08 20-05-2022

bolega

Спасибо.

Я так понимаю, теперь будем выкладывать качественные наборы растровых шрифтов или растрированный вектор для исправления книг....


bolega, TelecomUral

В каком формате словари Hunspell должны быть? А то ведь одни программы, работают с ними только в Юникоде, другие в нативном KOI-8, про третьи вообще молчу.....

Вот здесь словари в Юникоде (UTF8) для разных языков....
https://github.com/wooorm/dictionaries

В сети можно найти комбо-словари - типа англо-русского (пролетал в ветке Emeditor)

Автор: daa2013, Отправлено:01:51 21-05-2022


Цитата:
Сегодня днем на работе скачал его и после двойного щелчка началась инсталяция. Сейчас дома (мой основной комп для СК) скачал, и после двойного щелчка ничего не происходит. Ничего не устанавливается.


Так парсер - это, типа, программа командной строки. Он не должен "устанавливаться". Его надо внутри конкретной папки запускать. Я это под виндой через менеджер FAR делаю. Болега в ролике - через Total Commander.

Автор: asku, Отправлено:10:37 21-05-2022


Цитата:
Так парсер - это, типа, программа командной строки.


Понял. Получилось. Спасибо.
Смотрю видео 3 )

Автор: SorokaSV, Отправлено:18:27 21-05-2022

В январе в связи с поломкой компьютера поставил новое железо, и соответственно перешёл на 10 с семерки. В 7-ке худо бедно работал планшет wacom в окне VR. В десятке не работает: ластик, не ластик, двигает изображение, и собственно всё. А жаль. Правда, так как размер ластика не регулируется, это так.

Автор: kamenkapenza, Отправлено:18:56 21-05-2022

Спасибо автору программы за новую версию, за следующий нано-рывок вперед!
К новой версии пока не решаюсь переходить. Скачал, но пока стесняюсь даже запускать. Досмотрю пока видео по версии 6.71, апосля буду к 6.75 переходить.


Цитата:
Однако, можно подключать FR, можно тессеракт. Иногда лучше срабатывает тессеракт.

Неплохо было бы увидеть видеоролик: с азов работу в Тессеракте и Файнридере от момента их закладки в программу до момента получения готовых результатов. Где тессеракт гож, а где Файнридер.
Набираю в поиске слова "Тессеракт" и "Кромсатор", может, кто-то показал, как эта связка работает....ничего нет, ни одного кина, только теория в умах просветленных.


Автор: Archivist, Отправлено:18:59 21-05-2022

SorokaSV
Возможно, на семерке режим ввода планшета был переключен с пера (по умолчанию) на мышь.

Автор: kamenkapenza, Отправлено:19:07 21-05-2022

Перво-наперво порадовала фиксация полей и фиксация настроек зон в профиле. Смело перехожу на новую версию.
https://www.youtube.com/watch?v=3Q9s0lga66Y

Автор: kamenkapenza, Отправлено:21:47 21-05-2022

Господа! Некиим образом ( к лучшему,очень удобно) изменилась модификация значков на панели просмотра результатов. Кто-нибудь разъясните каждый значок, какие функции он несет, на что влияет, когда и как пользоваться.

При окончании обработки страниц открывается панель результатов с рамкой вокруг текста или желтое пятно. Режим кисточки и ластика не работает, то есть корректировать страницы нельзя. Похоже, что из-за нахождения этой рамки. Как приступить к удаления надписей, мусора? Раньше, как я помню, можно было щелкнуть ПКМ по странице и выбрать Finalize page, но теперь такого выбора нет. Непонятно, что делать в этом случае.
Так же не нашел значка режима отображения двух страниц. Вот тут видеовопрос https://disk.yandex.md/i/dzowUBX8UsWLKA

Автор: qwaxym, Отправлено:13:04 22-05-2022


Цитата:
Раньше, как я помню, можно было щелкнуть ПКМ по странице и выбрать Finalize page,

И сейчас есть, в меню вторая сверху))

Автор: SorokaSV, Отправлено:13:08 22-05-2022

Archivist

Цитата:
Возможно, на семерке режим ввода планшета был переключен с пера (по умолчанию) на мышь.


Не был. Прекрасно работал в фотошопе. И сейчас работает.

Автор: kamenkapenza, Отправлено:14:20 22-05-2022


Цитата:

Раньше, как я помню, можно было щелкнуть ПКМ по странице и выбрать Finalize page,

И сейчас есть, в меню вторая сверху))


Ничего подобного нет. Желтое пятно никакими инструментами не убирается, соответсвенно невозможно начать редактирование. Плюс к тому отсутствие значка отображения двух страниц для быстроты просмотра книги.

Доказательства https://disk.yandex.md/i/lnX8z6DaIMzGZA

Автор: slava_kry, Отправлено:14:37 22-05-2022

Ответьте пожалуйста на форуме руборд на вопрос kamenkapenza (я не могу сегодня там писать)

Вы выбрали довольно забавный режим обработки. Хоть вы и не показали в видео самое главное - закладку book, но подозреваю, что там поля=0, width=height=none (по видимому так настроен теперь ваш дефолтный профиль). Необычно то, что при всем этом осталась включенная опция automargins. Именно она дает на выходе желтую рамку, т.е. СК ожидает финализации. А команды финализации в VR нет для такого нестандартного случая, это конечно баг. Хотя в главном меню такая команда тем не менее доступна (process > finalize). Но даже в этом случае вы получите не то, что наверно ожидали.
Рекомендую если уж выбираете режим при котором размеры = none, одновременно отключать automargins, в том числе и в своем профиле. Сейчас же получили следующее: СК находит полезный контур страницы (желтый), но из-за none и нулевых полей оставит после финализации размер каждой страницы равной размеру ее контура, в итоге все страницы будут отличаться по размеру. В принципе такой режим расчета имеет право на жизнь, но он очень специфический и для вашего случая явно не подходит.

По поводу кнопки two-page: она включается не через КМ области панелей, а через КМ той панели, на которой эта кнопка должна быть, в том числе доступна через КМ соседних с ней кнопок. Там есть команда show buttons. В ней и ищите Two pages layout. Вы там вызвали практически все КМ, что только есть, но по невезению так и не попали именно на ту панель, в КМ которой и была искомая команда Улыбка

Автор: kamenkapenza, Отправлено:15:08 22-05-2022

slava_kry, спасибо!
И спасибо тому таинственному лицу, у кого сегодня нет вдохновения писать)).
Отключил автомарганцовку (automargins) и deskew. В моем случае я работаю с готовыми полями, то есть тут ничего не режу.
Кнопку двойного просмотра кое-как отковырял, с трудом удалось найти.
Спасибо!!!

Автор: slava_kry, Отправлено:16:31 22-05-2022

kamenkapenza
Таинственное лицо - Болега.

Автор: kamenkapenza, Отправлено:19:11 22-05-2022


Цитата:
Таинственное лицо - Болега.


Автору программы огромное спасибо за очередную помощь!

Особо не искал по различным меню, но с наскока не удалось найти вот такую вещь https://disk.yandex.md/i/qN3uwqLxZFyScw (видеовопрос)

Второй вопрос по поводу добавочной папки, где находятся всякие прибамбульки: hunsdict, tessdata2 (по первоначальным буквам похоже, что эта папка для работы неведомого Тессеракта), bps.cfg, fftw3.dll, hunspell-dicts.cfg, libhunspell.dll, md5.txt, ocr2.dll, sk_sounds.txt
Куда всё это прикрепляется? Наверное, какая то часть в папку с программой, какая то часть прикрепляется приложением в меню Apps/

Третий вопрос, как раз при приложения. Есть там какие приложение FRGrab и JPG200. Особо важные?
Про Тессеракт. Я так понимаю, что для работы этой неведомой программы нужно указатьпуть в приложении к tessdata2, и оно должно потом каким то образом проявиться.



Автор: daa2013, Отправлено:21:34 22-05-2022


Цитата:
видеовопрос

Насколько я понял видеовопрос, речь в нём идет о том, можно ли изменить дефолтные параметры джву-кодирования в СК.

СК глобально параметры джву-кодинга не сохраняет и это вроде как сделано специально. Дефолтные подобраны наиболее оптимально (в среднем), чтобы юзер, который не понимает смысл этих параметров, особых дров не наломал. Не нравится вам что-то в вашем получающемся джву - можете попробовать подкрутить и посмотреть, не стало ли лучше. Но следующий проект эти изменения не испортят.

Изменённые параметры можно сохранить внутри задания. (Имеется в виду, естественно оут-задание из которого джву и делается). Т.е. если вы на изготовление джву так и не вышли, то после перезагрузки проекта можно продолжить работу, откуда остановились.



Цитата:
Куда всё это прикрепляется?


Это всё кладётся в папку с СК

Автор: kamenkapenza, Отправлено:22:13 22-05-2022


Цитата:
Дефолтные подобраны наиболее оптимально (в среднем), чтобы юзер, который не понимает смысл этих параметров, особых дров не наломал.

С этим доводом я абсолютно не согласен в виду его отрешенности от действительности. Почему там по умолчанию задний и передний слой по 75 единиц? Текст комперссион Агрессив,а опции черно-белого текста скинуты на дефолт? Это для сторонников делать книги походя на смартоне, экономя лишний килобайт?
Я не сторонник сжатия файла, теряя качество. Наоборот!!!
Если ничего нельзя сделать с фиксацией настроек сторонней программы, присоединеной к Кромсатору через приложение (это программа ДЖВУ-смолл), то каким то образом Кромсатор хранит постоянные дефолтные заниженные в край параметры параметры, то может каким то батником устанавливать эти парметры? Нажать на какой то запускающий файл с установленными параметрами для программы дэву-смолл и менялись параметры для Кромсатора.

Очень я сомневаюсь, чтобы специалисты использовали выходные параметры 75,агрессив и бв дефолт. Каждыйраз приходится перенастраивать.


Цитата:
Дефолтные подобраны наиболее оптимально (в среднем), чтобы юзер, который не понимает смысл этих параметров, особых дров не наломал.


Я тут один юзер, остальные мастера))) Их больше меня, поэтому фиксация этих параметров была бы им полезна, чтобы онм не чувствовали себя юзерами-лузерами, которые что-то навертят и будут тут спрашивать, как всё назад вернуть. Навертят для себя, сохранят, и это будет удобно.))).

И ещё мои пожелания, это уже для следующей версии. Не так критично, но я сторонник возможности выбора имени и папки для сохраняемого готового джву. То есть можно по умолчанию оставить как есть (подпапка аут), а по возможности выбрать имя и папку тем, кому это надо.


Автор: shch_vg, Отправлено:23:10 22-05-2022

daa2013

Цитата:
СК глобально параметры джву-кодинга не сохраняет и это вроде как сделано специально. Дефолтные подобраны наиболее оптимально (в среднем), чтобы юзер, который не понимает смысл этих параметров, особых дров не наломал. Не нравится вам что-то в вашем получающемся джву - можете попробовать подкрутить и посмотреть, не стало ли лучше. Но следующий проект эти изменения не испортят.

Для этого достаточно расположить в окне Create DJVU wizard кнопку default.

kamenkapenza

Цитата:
а по возможности выбрать имя и папку тем, кому это надо

Не пробовали прописать путь и имя файла в окошке Output File Name?

Автор: TelecomUral, Отправлено:06:23 23-05-2022


Цитата:
kamenkapenza
Это для сторонников делать книги походя на смартоне, экономя лишний килобайт

нет, это как раз наоборот. Для экспертов в книгообработке, видящих, где нужно применять транзитные Special зоны для защиты вероятных утрат кодирования. В остальных случаях текста метод "агрессив" правильнее. Вот для меня - да, лучше по умолчанию "лосслесс", чтобы не возиться с листками под печать. Я много отдаю их в библиотеки, там листки вклеивают на место вырванных. Нет смысла делать один листок идеальнее остальной книги. А если человек делает полную книгу, то он шлифует внешний вид всех страниц, и там уже "агрессив" это сплошная выгода. Если это эксперт, а не фуфел дутый.

Если вам так нравится DSM, кодируйте в нём. Там можно подстроить и сохранить любые параметры.


Цитата:
daa2013
Дефолтные подобраны наиболее оптимально

подтверждаю. Плюс: за очень небольшим исключением типа растрово воспроизведённых гравюр параметры процентного сжатия приемлемы. И размер некрупный и все значимые детали будут сохранены. Я кручу коэф. сжатия в одном случае из 30.

upd

тут кручу




а тут никогда


Автор: bolega, Отправлено:08:13 23-05-2022

slava_kry
Спасибо!

kamenkapenza

Цитата:
Почему там по умолчанию задний и передний слой по 75 единиц?

Насколько я знаю, при кодировании ч/б сканов эти параметры не играют никакой роли, именно поэтому я их не ввел в профиль. Они нужны, если не использовать раздельное кодирование. Но кому оно нужно сейчас, нераздельное?
Агрессию ввел в профиль.

Добавлено:
SorokaSV

Цитата:
В 7-ке худо бедно работал планшет wacom в окне VR

Вы чистили в нем ластиком? На планшет выводилось содержимое окна, или мышь просто повторяла движение стикера?
Для работы с планшетом по хорошему надо подключить к СК их SDK, но планшета у меня нет и вряд ли когда предвидится, а без него не отладишь.

Добавлено:
niccolo

Цитата:
В каком формате словари Hunspell должны быть? А то ведь одни программы, работают с ними только в Юникоде, другие в нативном KOI-8, про третьи вообще молчу.....

По идее, все нюансы кодировки обрабатывает dll.

Добавлено:

Цитата:
Куда всё это прикрепляется?

В sk-readme.txt вроде все написано, куда и зачем

Автор: niccolo, Отправлено:09:21 23-05-2022

bolega

Цитата:
По идее, все нюансы кодировки обрабатывает dll.


А без идеи есть такая нехорошая вещь, что dll никак не предупреждает о неверной кодировке словаря (например после пополнения) и просто перестаёт что-то находить....

Я так понимаю, теперь SK начнет двигаться в сторону по сути переверстки оригинала оригинальными растровыми шрифтами....


Автор: bolega, Отправлено:09:37 23-05-2022

niccolo

Цитата:
что dll никак не предупреждает о неверной кодировке словаря (например после пополнения) и просто перестаёт что-то находить....

СК взаимодействует со словарями только через dll, не напрямую. Поэтому тем более бессилен.


Цитата:
Я так понимаю, теперь SK начнет двигаться в сторону по сути переверстки оригинала оригинальными растровыми шрифтами....

Ни в коем случае. Зачем для переверстки использовать СК? FR разве не сделает это в сто раз лучше, по крайней мере в качестве первого приближения.
Я и в ролике заострял внимание на том, что менять все буквы подряд как правило нет никакой необходимости, только марашки и поврежденные. В редких случаях менять нужно все, но там как правило такое плохое качество печати, что бороться за аутентичность нет никакого смысла. И все равно глифы лучше брать нативные, а не сгенерированные из идеального шрифта.

Автор: niccolo, Отправлено:11:25 23-05-2022


Цитата:
Ни в коем случае. Зачем для переверстки использовать СК? FR разве не сделает это в сто раз лучше, по крайней мере в качестве первого приближения.
Я и в ролике заострял внимание на том, что менять все буквы подряд как правило нет никакой необходимости, только марашки и поврежденные. В редких случаях менять нужно все, но там как правило такое плохое качество печати, что бороться за аутентичность нет никакого смысла. И все равно глифы лучше брать нативные, а не сгенерированные из идеального шрифта.


Насчёт марашек, учитывая довольно верное замечание о том, что их удаление требует времени гораздо больше — может быть полезен вариант очистки подложки под правильно распознанными словами плюс по пол-интервала сверху и снизу.....

FR лучше делает 2 вещи - распознаёт и исправляет кривые строки (подушку). Всё остальное он делает гораздо хуже и самое печальное - без малейших признаков прогресса...

В Новом FR-PDF - если попробовать исправить текст в PDF он тупо заменяет абзац настроенным в системе шрифтом из-за чего он начинает резко выделяться в книгах...
Учитывая то, что при анализе у них наверняка составляется библиотека глифов - что мешало подставлять знаки из неё - абсолютно непонятно, да ещё и целый абзац...

Выбирая идеальные глифы из книги вы делаете по сути двойную работу - из шрифта они создаются быстрее. Проблема только в нахождении шрифта, идеально совпадающего с набором... (очень часто шрифты в интернет при одинаковой гарнитуре с набором отличаются по ширине)...


Автор: bolega, Отправлено:13:10 23-05-2022


Цитата:
учитывая довольно верное замечание о том, что их удаление требует времени гораздо больше

при правильном распознавании это не требует много времени

Добавлено:

Цитата:
из шрифта они создаются быстрее. Проблема только в нахождении шрифта, идеально совпадающего с набором...

а такое возможно?

Автор: niccolo, Отправлено:13:54 23-05-2022


Цитата:
а такое возможно?


А почему нет. Даже прямым способом - распечатал в 600 DPI нужную гарнитуру с нужным кеглем - и вперёд...



Цитата:
при правильном распознавании это не требует много времени


Цитата:
В редких случаях менять нужно все, но там как правило такое плохое качество печати,


Как думаете - какое в таких случаях качество распознавания? И сколько времени потребуется для таких случаев для набора алфавита в оригинале?

Речь чаще всего именно о таких случаях и идёт....

Автор: Archivist, Отправлено:13:57 23-05-2022

Finereader остро не хватает модуля, который бы "визуально" сверял преобразованный текст с исходником, но судя по заброшенному ClearScan, все кулибины покинули ABBY, а на их места взяли специалистов по квотам.


Цитата:
очень часто шрифты в интернет при одинаковой гарнитуре с набором отличаются по ширине

Ширина символов шрифта и межбуквенное расстояние регулируется в графических программах. Но тут надо сперва убедиться, что сканер не искажает геометрию (отсканировать CD/DVD-диск, или миллиметровку).
Недавно обрабатывал серию энциклопедий, в которой аннотация и анонс печатались на форзацах тонким шрифтом Garamond, перемычки исчезали еще в типографии. Вместо того, чтобы бинаризовать такие сканы, открывал их в фотошопе, поверх дублировал красным распознанный текст и подгонял параметры. Замечательно получалось.

Автор: niccolo, Отправлено:15:11 23-05-2022

Archivist

Я в основном работаю с текстом - поэтому мне больше интересна фича словарной проверки результатов (статистика - чтобы видеть, где возможные проблемы), да и требования к качеству обработки у меня ограничиваются достижением некоего предела в FR а не внешне идеальным видом....

Автор: TelecomUral, Отправлено:16:54 23-05-2022


Цитата:
bolega
а такое возможно?

если вы про файл шрифта, идеально совпадающего со старым (н-р советским) начертанием - то да, оказалось возможным. slava_kry в ответ на моё нытьё насчёт кудряшовской гарнитуры прислал паратайповский её вариант. С БСЭ-3 визуально совпал. Я не проверял тщательно-тщательно, но навскидку всё идентично. Узнаваемо.
Другое дело, что на вопрос "где, блин, взять шрифты?!" ответ "а шрифты любовно собираются всю жизнь..."

Автор: medvedik, Отправлено:22:45 23-05-2022

TelecomUral

У меня есть вопрос по видео о переделке gray в b/w. Вот это: https://youtu.be/_LEuxXoHa_E

Pdf файлы я проимпортировал. А дальше вот у вас выделение зоны, а у меня ничего не выделяется.
Может где чего заранее надо скпзать/кликнуть?

Автор: italia57, Отправлено:00:53 24-05-2022

Сделайте пожалуйста видео как добавить языки в СК. Хочу попробовать Тессеракт.
ФР лажанул на паре страниц.

Автор: niccolo, Отправлено:01:18 24-05-2022


Цитата:
Сделайте пожалуйста видео как добавить языки в СК.


В папку hunsdict кидаете словари нужных вам языков - aff и dic.

Скачать их - по ссылке, которую я давал, либо поиском - Hunspell+dictionaries.


Цитата:
ФР лажанул на паре страниц.


Лучше настройки ФР проверьте. С русским все распознавалки пока хуже FR.

Автор: TelecomUral, Отправлено:04:42 24-05-2022

medvedik

Цитата:
Pdf файлы я проимпортировал.

так я делал своё видео как ответ на конкретный вопрос конкретного человека (cuneiform) и для вполне определённого файла pdf В котором уже были зоны-"кусочки". Человеку надо было перевести текст в ЧБ.
Так что сначала разберитесь с вашим pdf и опишите (поймите сами для себя), что вам надо и почему не получается именно в вашем случае. Можете и пдф выложить. Там может и зон-то никаких нет. Поглядите структуру страниц(ы) в PDF-XChange Editor например.

italia57

Цитата:
Хочу попробовать Тессеракт

по-моему, надо положить в tessdata2 нужные *.traineddata по аналогии с eng и rus
А вот где их брать - ??

Автор: bolega, Отправлено:08:06 24-05-2022

TelecomUral

Цитата:
А вот где их брать - ??

Я конкретную ссылку где брать привел в sk-readme.txt

italia57

Цитата:
Сделайте пожалуйста видео как добавить языки в СК.

В СК сейчас заложено немного языков (опция special > more2 > ocr langs, в выпадающем списке отметить галками нужные для этой конкретной страницы). Если кому нужны те, которых в нем нет, заказывайте, я добавлю. Только если реально нужны. Ссылка на список поддерживаемых тессерактом языков опять же есть в sk-readme.txt
У FR конечно этот список больше. И наверно, есть словари hunspell для языков, которых нет в тессеракт, но они есть в FR. Поэтому их тоже можно добавить в СК, но не для распознавания, а чтобы можно было пользоваться словарями.

Заодно скажу, чего еще пока нет в последней версии: нет замены букв для вертикального текста и для текста в b/w-зонах. Со временем сделаю и это.

Автор: lis105, Отправлено:09:58 24-05-2022

Всем доброго дня!
Для быстрой навигации по видеофайлам от bolega с новыми возможностями SK добавил непосредственно в видеофайлы таймлайны от TelecomUral:
https://disk.yandex.ru/d/EGAHs78LWtygrQ


Автор: indinc, Отправлено:14:19 24-05-2022

Благодарю bolega за замечательную программу

Несколько замечания по работе с программой (SK-6.75.5):
1. В OS XP SP3 (в десятки работает) при распознавании (Special...->OCR page)
показывает сообщения о ошибке:
Access violation at address 03AFA3AF in module 'ocr2.dll'. Read of address 00000000
2. В новый профаил File->Profile->Pages, отсутствует V/H.Align - Auto,
а когда ставишь в H.Align=Left - Apply показывает в Page h.Align = A
3. Буду рад за добавления в OCR pумынскoгo языка
4. Можно ли использовать для распознаваний Finе Rеаdеr 8, есть ли парсер?

Автор: TelecomUral, Отправлено:14:34 24-05-2022


Цитата:
Можно ли использовать для распознаваний Finе Rеаdеr 8

нельзя

Автор: medvedik, Отправлено:14:58 24-05-2022

TelecomUral

Все понятно. Конечно, у меня никаких зон нет.

Автор: asku, Отправлено:15:05 24-05-2022

Добрый день. Вопрос по СК.
Есть две зоны, одна поверх другой. А можно (как?) поменять их местами? То есть, чтобы та, что сверху, была снизу, а другая наоборот.

И офтопик по Hunspell. Можно ли самому сделать словарь? Допустим, есть куча отредактированных (без ошибок) текстов, и на их основе сделать словарь.

Автор: TelecomUral, Отправлено:15:22 24-05-2022


Цитата:
А можно (как?) поменять их местами?

на выделенной зоне ПКМ "send to back" и "bring to front".
Правда, в случае трёх и более накладывающихся зон (я так с малоцветными граф.схемами баловался в древнем СК) будет трудно понять в каком порядке их давить к странице По-моему, надо начинать с верхней и "send to back", иначе не выходит правильный порядок.

Автор: asku, Отправлено:16:39 24-05-2022


Цитата:
на выделенной зоне ПКМ "send to back" и "bring to front".


Спасибо! Сейчас попробую.

Еще такой вопрос. Все никак не пойму, что там делать нужно.
Вот тест (папка в архиве):
test

Первая страница чуть шире остальных. Там картинка на всю страницу.

На вкладке Page, там, где Spec.gaps я выставлю галочки на Left, Right, Top, Bottom, то есть, чтобы не добавлялись поля.
На выходе у меня часто такие страницы отличаются (шире) от остальных.

Автор: TelecomUral, Отправлено:16:50 24-05-2022

asku

Цитата:
На выходе у меня часто такие страницы отличаются (шире) от остальных.

так вы придумайте, что вы хотите. Только тогда станет ясно, как настраивать. Или резать с краев или белые поля делать больше.

Обычная проблема, что пара страниц во всю ширину отличаются друг от друга по этой самой ширине
И возможны три варианта, имхо
- оставить каждую как есть
- подогнать узкую к (самой) широкой с помощью надставки (белого или однотонного)
- растянуть узкую пропорционально до ширины широкой

Самый такой яркий пример это современный журнал Юный техник. Он 80 страниц, согнут пополам, бумага толстая и первая от 40й отличается миллиметра на 4.

Лично мне больше нравится "оставить каждую как есть".

Автор: asku, Отправлено:17:03 24-05-2022


Цитата:
так вы придумайте, что вы хотите.


Я хочу одинаковую ширину для всех страниц дежавю-файла.
У бумажного журнала (моего) все страницы имеют одну ширину.

Автор: TelecomUral, Отправлено:17:12 24-05-2022


Цитата:
Я хочу одинаковую ширину

тогда вбейте в размеры книги габариты этой оборотки
Наверное, ещё нужно будет подобрать gap, а то в СК заложена хитрая логика на максимум-отклонение.

Автор: asku, Отправлено:17:27 24-05-2022


Цитата:
тогда вбейте в размеры книги габариты этой оборотки


А как это делать? На вкладке Book? Я делаю так -- при появлении новой версии СК захожу на вкладку Book. В полях H.Gap value и V.Gap value ставлю примерно 170-200 и больше не захожу туда, потому что боюсь испортить всякие мелочи.

Автор: TelecomUral, Отправлено:18:01 24-05-2022

asku

Цитата:
А как это делать? На вкладке Book?

Да.

Я сам также "боюсь испортить". Хотя в Хрестоматии вполне грамотные объяснения что как с чем связано.

Щас видео запишу по вашим файлам. Авось получится

upd
видео
https://disk.yandex.ru/i/gINvX38WtnYPSw

Автор: kamenkapenza, Отправлено:20:18 24-05-2022


Цитата:
Я хочу одинаковую ширину для всех страниц дежавю-файла.

asku
Всё намного проще. Ответил вам тут http://forum.ru-board.com/topic.cgi?forum=93&bm=1&topic=3514&start=4220#lt

6 минут недоумения https://disk.yandex.md/i/vorldiXnCpCgow Стамп недоумевал "А где же у него кнопка?", а я никак не могу понять: зачем эта кнопка в тех функциях, которые она на данном моменте представляет?


Автор: asku, Отправлено:22:21 24-05-2022


Цитата:
Щас видео запишу по вашим файлам. Авось получится


Спасибо за видео. Вот поэтому я и не захожу лишний раз на вкладку Book. Жуть, сколько нюансов.
НО в процессе просмотра я узнал как это сделать просто. То, что вы собственно и сделали в какой-то момент:
В режиме Result view нажимаю на правую кнопку мыши,
там в контекстном меню: Special..., дальше выбираю Resize, потом book size и Ok.

Все. Создал дежавю и эта страница с картинкой по ширине такая же, как и остальные.


Вот под цветной картинкой (первая страница теста) черно-белое (b/w) изображение остается. Я так и не понял почему. Вы на видео говорите про это, но я не понял.
А если под картинкой его нет, а я хочу, чтобы оно было, то, что надо сделать?

Добавлено:

Цитата:
на выделенной зоне ПКМ "send to back" и "bring to front"


Сейчас только попробовал поместить зону ниже/выше другой зоны.
А где в контекстом меню send to back и bring to front?



Добавлено:
И еще, вдогонку.

Вот страницы финализированы. И какие-то из них отличаются по размерам от других. А как их отсортировать, чтобы я мог сразу их (отличающиеся) найти и поправить размеры путем: ПКМ — Special — Resize — Book size ?


Автор: TelecomUral, Отправлено:07:00 25-05-2022


Цитата:
Вот под цветной картинкой (первая страница теста) черно-белое (b/w) изображение остается. Я так и не понял почему. Вы на видео говорите про это, но я не понял.
А если под картинкой его нет, а я хочу, чтобы оно было, то, что надо сделать?

у меня нет чб картинки первой страницы под цветной картинкой. Я же показал в конце - чанки BG44 и более ничего.

Чтобы чб было вместе с цветом, надо глядеть на страницу как на все обычные страницы в книге, где есть любые цветные картинки. Просто картинка, зона, здесь будет размером со страницу. И надо еще отключить очистку текста под зоной (Clear source area).


Цитата:
А где в контекстом меню send to back и bring to front?

В MW же



Цитата:
А как их отсортировать

в режиме Thumbs по ПКМ есть виды сортировки.

! Всё что вы спрашиваете, имеется в видео и в Хрестоматии. Не ленитесь изучить.

Добавлено:

Цитата:
6 минут недоумения

вы сами писали что не делаете полноцветные журналы. Именно при их обработке кнопка справа бывает необходима.

Автор: bolega, Отправлено:08:08 25-05-2022

TelecomUral

Цитата:
Авось получится

Сложно получилось, и много ручной работы. А всего-то нужно было на закладке Book убрать галку Use average sizes. Тогда расчет размеров будет не по среднему, а по максимальному размеру, что в данной книге и требуется, т.к. есть контент на всю страницу и желание обработчика иметь остальные страницы такого же размера. Ну и конечно ignore gaps в special не надо включать, т.к. опция как раз исключает страницу из расчета размеров. Вместо этого для левой половины включить все spec.gaps, т.е. задать нулевые поля со всех сторон.

На практике ignore gaps следует использовать для страниц, чьи dpi будут отличаться от основного, например, для обложки, если ее dpi остается на выходе 300. В остальных случаях поля лучше занулять с помощью spec.gaps.
И не забывайте что в отчетах (Reports) после расчета размера книги можно в отчете Book size calculation посмотреть какие страницы повлияли на размер. А в отчете Out page sizes всегда можно увидеть размеры всех страниц, и те, которые отличаются от размера книги, будут подсвечены. Все ссылки на сканы там кликабельны.

Автор: lis105, Отправлено:08:16 25-05-2022


Цитата:
Всем доброго дня!
Для быстрой навигации по видеофайлам от bolega с новыми возможностями SK добавил непосредственно в видеофайлы таймлайны от TelecomUral:
https://disk.yandex.ru/d/EGAHs78LWtygrQ

Прошу прощение!
Произошло расхождение звука с видео .
Исправил.
Выложил по той-же ссылке - https://disk.yandex.ru/d/EGAHs78LWtygrQ

Автор: bolega, Отправлено:08:18 25-05-2022

asku

Цитата:
Вот страницы финализированы. И какие-то из них отличаются по размерам от других. А как их отсортировать, чтобы я мог сразу их

В отчете вы можете увидеть какие отличаются.
И в последних роликах я показывал, как изменить (увеличить) размеры страниц, если финализация уже выполнена с помощью команды Result > Resize output files. Там переключиться в режим New sizes, задать нужные размеры. Все страницы, у которых размер меньше заданного, будут увеличены. Остальные трогаться не будут.

Автор: asku, Отправлено:08:57 25-05-2022


Цитата:
И не забывайте что в отчетах (Reports) после расчета размера книги можно в отчете Book size calculation посмотреть какие страницы повлияли на размер.


А как посмотреть этот отчет? Я понимаю, вы скажете, что это есть в справочнике, но я там не нахожу.
Смотрю в:
ScanKromsator_Answers_1.0.2.pdf
и
SK_Compendium_v2.1.chm

Автор: TelecomUral, Отправлено:09:28 25-05-2022


Цитата:
А как посмотреть этот отчет?

микрозкладка вверху списка сканов
а в хрестоматии как раз нету

Добавлено:

Цитата:
Ну и конечно ignore gaps в special не надо включать, т.к. опция как раз исключает страницу из расчета размеров.

Ааа!! Так вот чего я не догонял Пытался отключать эту average и получал непредсказуемый результат.
Наконец-то, срослось всё в голове про гапы и расчёты.

Автор: bolega, Отправлено:10:08 25-05-2022


Цитата:
А как посмотреть этот отчет?

В главном окне закладка Reports, выбрать нужный из списка и нажать кнопку обновить

Добавлено:
если хотите, я сниму небольшой ролик на основе вашего задания, покажу как в таких случаях поступать. еще бы были зоны впритык к краям, еще лучше пример был бы.

Автор: asku, Отправлено:15:59 25-05-2022


Цитата:
если хотите, я сниму небольшой ролик на основе вашего задания


Да, было бы отлично.
——————

По поводу способов.

«А всего-то нужно было на закладке Book убрать галку Use average sizes. Тогда расчет размеров будет не по среднему, а по максимальному размеру, что в данной книге и требуется».

Получается, если так делать, то поля на всех страницах могут увеличиться слишком сильно (если тот самый «максимальный размер» слишком большой).

Я сделал способом, который упомянул выше:
«В режиме Result view нажимаю на правую кнопку мыши,
там в контекстном меню: Special..., дальше выбираю Resize, потом book size и Ok»


и все нормально получилось. )

Автор: daa2013, Отправлено:05:58 27-05-2022


Цитата:
А как посмотреть этот отчет? Я понимаю, вы скажете, что это есть в справочнике, но я там не нахожу.


Ещё есть файлик sk...whats.new.txt

И там написано, что эта функция добавилась в sk 6.42 в июне 2019 года, а упомянутые "справочники" были составлены в 2016 и 2018 годах относительно версии 6.00.5


Позаписывал бы кто из вновь осваивающих кромсатор свои наблюдения. Что он хотел в хрестоматии найти и не нашёл. И как в итоге сделать получилось. Глядишь, и удалось бы её дополнить новыми параграфами.

Автор: bolega, Отправлено:14:59 27-05-2022

asku

Цитата:
Получается, если так делать, то поля на всех страницах могут увеличиться слишком сильно (если тот самый «максимальный размер» слишком большой).

но ранее писали:

Цитата:
Я хочу одинаковую ширину для всех страниц дежавю-файла.

Вы уж определитесь, что хотите, одинакового размера или небольших полей. В вашем примере может только одно из двух.

Автор: TelecomUral, Отправлено:17:06 27-05-2022

bolega

Цитата:
одинакового размера или небольших полей

да тут речь скорее всего шла про неверное выставление габаритов при первом расчёте. Картинки в лист deskew часто поворачивает градусов на 35-40. И если щелкнуть "рассчитай размеры" сразу после обработки, то потом и приходится много выёживаться с закладкой Book и перевычислениями.

Автор: asku, Отправлено:17:21 27-05-2022


Цитата:
Вы уж определитесь, что хотите, одинакового размера или небольших полей.


Одинакового размера!

Автор: bolega, Отправлено:07:58 28-05-2022

asku
А как вы, например в word, набираете символ лигатуры &#1237; ?
Интересно, есть ли для осетинского языка своя отдельная кодовая страница, типа как 1251 для русского?

Автор: asku, Отправлено:08:15 28-05-2022

bolega

Кстати, об этой букве. Я вчера решил испытать новую функцию новой версии СК для осетинского скана. Я имею в виду ocr. И когда я создавал библиотеку глифов и присваивал глифам значения, тодля этой буквы не смог присвоить, вместо буквы вопросительный знак печатается.

А печатаю я ее используя осетинскую раскладку.
Но если на компе не установлена раскладка, то просто копирую и из буфера обмена вставлять могу.
Как правило используется буква из датского алфавита, насколько помню (я не за компьютером сейчас) в раскладке именно она.
Хотя в юникоде есть отдельная такая буква именно для осетинского алфавита (входит в расширенную кириллицу) и по внешнему виду идентичная датской букве.

Автор: bolega, Отправлено:08:28 28-05-2022

asku
А пробовали мой пример test-nb.zip открыть, с которым я видео снимал. Там я без проблем задал лигатуру, в раскладке русской.

Цитата:
Хотя в юникоде есть отдельная такая буква именно для осетинского алфавита (входит в расширенную кириллицу) и по внешнему виду идентичная датской букве.

FR похоже именно ее использует, т.е. кириллическую а не латинскую/датскую. Не пробовали скопировать символ из моего задания или из FR, может тогда без "?" будет.

Автор: asku, Отправлено:22:55 28-05-2022

bolega

Вставил эту букву без проблем из буфера обмена (копировать-вставить). Причем вставились и кириллическая и латинская буква "ае". А вот если просто с помощью раскладки нажимать на клавишу и пытаться впечатать в поле, то получается вопросительный знак.

Добавлено:

Цитата:
А пробовали мой пример test-nb.zip открыть, с которым я видео снимал.


Не пробовал. Я на середине третьего видео пока. Времени пока не было все ролики посмотреть. )

Автор: asku, Отправлено:23:54 30-05-2022

Добрый вечер.
Не могу разобраться с новыми функциями (OCR) в новой версии СК.
Вроде как надо делаю.
Вот тест-файл.

В тесте несколько страниц. Там же в папке есть файлы ФайнРидера.

Файнридером распознал.
Парсер в папку data закинул, сгенерированный файл скопировал в папку ocr в папке out.
Потом в СК в режиме Result View: Special — OCR Page.

Создается файл с расширением focr только для одной странице (не для всех!) и то берет данные распознавания не для этой страницы, а другой.
На видео говорилось о сдвиге и его корректировке (File—Option—Misc). Я там тоже поиграл значениями. Только не понял, а зачем мне делать сдвиг, если и в тесте (в СК) и в ФайнРидере одни и те же страницы в одном и том же порядке.

Автор: TelecomUral, Отправлено:06:34 31-05-2022

asku
вероятно, старый ФР. Я открыл ваш проект с портабельного ФР15, пересохранил проект в новой папке, и сгенерировал новый result.bookmarks. Подсунул его Кромсатору - и всё чётко с ocr слоем.

Об этом была переписка с NME и krestik
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/305#305

файл букмарков
https://disk.yandex.ru/d/J39_ilg8r2umww

Автор: asku, Отправлено:07:36 31-05-2022

TelecomUral

Использовал ваш файл букмаков result. Опять файл с расширением focr создал только для одной страницы. Но зато слой для этой страницы получился как надо, все на месте.
Не знаю, почему только для одной страницы создает.
При этом в папке ocr (та, что внутри папки out) созданы файлы с расширением *.bookmarks для всех страниц.

Проверил версию Файнридера — у меня 15.

Автор: TelecomUral, Отправлено:07:51 31-05-2022


Цитата:
asku
Опять файл с расширением focr создал только для одной страницы

Загадочно А у меня все focr создались. По одной команде из VR.
Зато тессеракт не создаёт вообще ничего по команде из MainWindow.

Я готовлюсь писать статейку про функции СК, связанные с ocr. Чтоб хоть самому разобраться, а то каша и у меня в голове. Потом вставим в неё ответы разработчика. Больно сложно организованы процессы. Нарисую диаграммки в Visio, скриншотики.

Автор: bolega, Отправлено:08:21 31-05-2022


Цитата:
Потом в СК в режиме Result View: Special — OCR Page. Создается файл с расширением focr только для одной странице (не для всех!)

Все правильно, в VR команда ocr только для текущей страницы.
Если нужно сразу для всех, то это надо делать из главного окна, я в видео вроде упоминал про это.

Автор: daa2013, Отправлено:08:22 31-05-2022

Так вы же делаете OCR из RV. Это там так (только для текущей) и работает.

Для всех страниц сразу надо командой меню MW делать.

Автор: bolega, Отправлено:08:39 31-05-2022

asku
Если откроете в текстовом редакторе свой result.bookmarks, то увидите, что стр.2 на 8-месте, а не на 2-м! У вас что-то не то с FR
Вы не правили результат в самом FR?

Автор: asku, Отправлено:11:49 31-05-2022


Цитата:
Вы не правили результат в самом FR?


Правил. В смысле, если ФР неправильно распознавал букву, то я ее вручную исправлял. Порядок страниц в ФБ я, конечно, не правил.

Автор: TelecomUral, Отправлено:12:29 31-05-2022


Цитата:
Правил. В смысле

а вы попробуйте в том же ФР новый проект с этими же страницами. Но не править ни буквы, и сразу парсером сохраненный проектик жамкнуть. Тогда мы все хоть поймём - в чём же тут дело.

upd
наваял хоть какую-то схемку в помощь
https://disk.yandex.ru/i/t_48GjS9enyw0g
пока только ввод ocr в СК
кстати, если есть конкретные вопросы, то вот заготовка статьи. Куда двигаться дальше, мне непонятно и самому глаза разбегаются
https://disk.yandex.ru/i/uaTbyUdXGA-GKw

Автор: bolega, Отправлено:13:18 31-05-2022

Как и предупреждал NME, правка может спутать порядок страниц.
Хотя наверняка там должен быть где-то реальный номер страницы, просто NME еще не понял, где он записан.
Но лучше не править, так как после правки координаты букв тоже могут сбиться, а без них все не имеет смысла

Автор: asku, Отправлено:13:26 31-05-2022


Цитата:
правка может спутать порядок страниц


А как же быть. Ведь новые функции СК для того и нужны, чтобы улучшить скан, но скан можно улучшить с помощью распознанной инфы из ФР, а ФР плохой скан распознает плохо ) Это замкнутый круг получается. )


Цитата:
а вы попробуйте в том же ФР новый проект с этими же страницами.


Вечером попробую. Сейчас нет возможности.

Автор: TelecomUral, Отправлено:13:37 31-05-2022


Цитата:
А как же быть.

править в самом СК, там есть фичи коррекции распознанных символов.

Автор: bolega, Отправлено:13:46 31-05-2022

TelecomUral
"неправильный тессеракт"
Не помню с какой версии, но с какой-то файлы tessdata изменились и стали несовместимы со всеми предыдущими тессерактами. Новые tessdata подходят для любой новой версии (после той, переломной). Именно поэтому я изменил имя папки на tessdata2, чтобы оставить прежние данные на всякий случай (имена то файлов разработчики тессеракта оставили прежними).
По этой же причине и dll, работающую только с новыми tessdata, я переименовал в ocr2.dll


Добавлено:

Цитата:
А как же быть.

А вы как обычно правите, заменяете одну букву на другую или что-то добавляете. Если первое, то надо проверять, возможно, все прокатит. Добавление букв точно не прокатит, т.к. при этом в FR не создаются новые rectы для них. Но этот вопрос тоже надо исследовать на практике.

Автор: asku, Отправлено:14:00 31-05-2022


Цитата:
заменяете одну букву на другую или что-то добавляете


И то и другое. )

Автор: TelecomUral, Отправлено:16:26 31-05-2022

! мысль тут пришла:
я выше писал, что взял проект asku и пересохранил его с помощью своего ФР в новой папке. И он нормально потом скушался парсером и Кромсатором. Однако asku отписал тут, что он правил проект ФР вручную. Таким образом, вполне вероятно, что ручная правка проекта ФР "нейтрализуется" через пересохранение. Или через переоткрытие с пересохранением.


Автор: bolega, Отправлено:16:33 31-05-2022


Цитата:
И он нормально потом скушался

Это хорошо. Теперь надо проверить как повлияло добавление новых букв на работу парсера и соответствие скану.

Автор: TelecomUral, Отправлено:16:37 31-05-2022

bolega
ну, это домашнее задание для asku
Я, конечно, днём мышкой повозил по страницам, косяков не заметил, но точное место правки искать, да ещё осетинского языка - увольте... Пусть товарищ добьёт тему.

Автор: asku, Отправлено:17:43 31-05-2022

Сделал новый проект. В ФР ничего не правил. Сразу парсером сделал файл резулт. Создал все файлы focr. Правда сдвиг пришлось делать +1. Не знаю почему, я же ничего не сдвигал, не правил. Ну это мелочь.

Автор: asku, Отправлено:22:53 31-05-2022

Сейчас на всей 255-страничной книге попробовал. Опять нужно было делать сдвиг (хотя в ФР те же страницы, что и в СК). После сдвига на части страниц (вроде на большинстве) текст из ФР лег нормально, на других смещение на страницу.
Почему так может быть?

Автор: NME, Отправлено:00:37 01-06-2022

asku
чтоб страницы не смещались надо проект сначала сохранить, а не создавать файл result во временной папке.. если делать во временной, то порядок может быть нарушен.. при сохранении порядок страниц нормализуется..

Добавлено:
и еще.. править символы в файнридере бессмысленно, т.к. парсер берет данные из того блока, где они находятся в первоначальном виде.. информация о ручных правках, видимо, сохраняется в каких-то других местах.. но, на всякий случай лучше не делать ручных правок, т.к. программа мало тестировалась и теоретически могут вылезать всякие баги при этом..
критичным для парсера является изменение размеров блоков - в этом случае программа может не создать файл result вообще или создать, но с ошибками.. если все-таки нужно изменить блоки на странице по каким-то причинам (не определился или не правильно определился какой-то блок и т.п.), по после внесения данных изменений эту страницу нужно полностью перераспознать, тогда программа должна работать корректно.. но опять же - если без этого можно обойтись, то лучше ничего не трогать..

Автор: asku, Отправлено:08:03 01-06-2022

NME, так я так и делаю. Я даже не знаю где находится временная папка.
Может у меня какая-то неправильная версия ФР.

Автор: NME, Отправлено:10:06 01-06-2022

asku
Это очень странно, потому что пересохранив выложенный выше пакет файнридера страницы встали на свои места..

Предлагаю еще раз по пунктам выполнить следующее:
1. Открыть ФР, зайти в настройки и отключить все "улучшалки", такие как исправить перекос, искажение, разрешение изображение и всё остальное..
2. Добавить картинки для распознания. Распознать всё.
3. После полного распознания, ничего не изменяя, сохранить проект (файл -> сохранить документ finereader).. указать какое-то новое имя для сохранения..
4. Найти в этой сохранённой папке подпапку data и скопировать туда парсер последней версии (2.3.1)..
5. Дважды кликнуть по парсеру - должен появиться файл result.bookmarks.. далее скопировать этот result в нужное кромсатору место и провести работы с СК..
Далее следует НЕ ОБЯЗАТЕЛЬНАЯ К ИСПОЛНЕНИЮ инструкция по импорту файла result.bookmarks в djvu-книгу, которая КРАЙНЕ НЕ РЕКОМЕНДУЕТСЯ на больших книгах и при отсутствии WinDjview версии Extended!!! (актуальная 3.1)
[more]Можно еще до переноса в папку с СК проверить соответствие координат в result.bookmarks графическим символам в книге (если распознаётся не слишком большое число страниц, иначе комп может подвиснуть.. на моём компьютере 200 нормально обрабатывается, а 400 - вылетает) - для этого после п.3 надо сохранить результаты распознания файнридера как djvu, а после создания файла result.bookmarks (п.5) открыть этот djvu в программе WinDjview Extended (именно Extended, а не оригинальная версия, т.к. в оригинальной нет функции для массового удаления аннотаций), далее нажать Файл -> Импорт закладок и аннотаций, выбрать полученный на предыдущем шаге result.bookmarks.. Пролистав книгу можно убедиться в совпадении или наоборот - в различии координат символов в result'e и графических символов на странице..
Далее ОБЯЗАТЕЛЬНО!!! удаляем букмарки из книги - для этого на поле книги кликаем правую клавишу мыши и выбираем пункт "удалить все аннотации", после закрываем книгу.. Если не удалить эти аннотации, то всё это может записаться в реестр (при соответствующих настройках), так что лучше их предварительно удалить указанным способом..[/more]

Автор: asku, Отправлено:13:31 01-06-2022

При внедрении ocr в СК такое сообщение



На некоторых сканах рисунки без текста. Это же не может повлиять?

Добавлено:

Цитата:
Далее ОБЯЗАТЕЛЬНО!!! удаляем букмарки из книги - для этого на поле книги кликаем правую клавишу мыши и выбираем пункт "удалить все аннотации", после закрываем книгу.. Если не удалить эти аннотации, то всё это может записаться в реестр (при соответствующих настройках), так что лучше их предварительно удалить указанным способом..


Вот это я не понял. Не нашел, где это.

Добавлено:
В общем, я сделал, как вы написали, только без «Далее ОБЯЗАТЕЛЬНО!!!», и все вроде получилось. Текстовый слой везде на месте. Делал со сдвигом 0 (ноль).

Автор: NME, Отправлено:14:19 01-06-2022

asku

Цитата:
На некоторых сканах рисунки без текста. Это же не может повлиять?

не должно влиять..

Цитата:
Вот это я не понял. Не нашел, где это.

А что непонятного во фразе "на поле книги кликаем правую клавишу мыши"? Если такой команды при клике ПКМ в появившемся меню нет, то читаем выше фразу

Цитата:
WinDjview Extended (именно Extended, а не оригинальная версия, т.к. в оригинальной нет функции для массового удаления аннотаций)
нужно скачать Extended-версию WinDjview, есть здесь на форуме..

Добавлено:
Подправил предыдущее сообщение, спрятал инфу об импорте аннотаций в djvu-книгу.. А то хочешь как лучше, а получается как всегда..

Автор: daa2013, Отправлено:15:02 01-06-2022

А почему, уважаемые форумчане, вы не пишете, при помощи каких версий FR (номер, билд) и в каких ОС вы все эти действия совершаете ?

Я четыре книги при помощи 14-й FR (14.0.107.232), Win 7 распознал, проблем с их импортом в SK не было.

Автор: asku, Отправлено:15:35 01-06-2022


Цитата:
Я четыре книги при помощи 14-й FR (14.0.107.232), Win 7  распознал


А вы их где-нибудь в инете публикуете? Можно взглянуть?

Автор: daa2013, Отправлено:18:19 01-06-2022

Нет, распознанные FR ещё не публиковал.

Автор: niccolo, Отправлено:22:24 03-06-2022

Опять я с книжками с Архива...

Граблю книжки, выдаваемые на час, скринами на 4К.

1. При чёрных полях у SK проблемы с авторасстановкой резаков... Часто захватывает чёрные полосы...

2. Непонятно, как вытянуть книгу потом в 600 DPI в реальный размер — программа всегда вытягивает в экранный размер....(а на таком размере SK подлагивает, книги получаются размерами со слона, хотя распознаются почти идеально). Пытался выставлять примерно размер в пикселях (примерно в 2-2,5 раза меньше) - ерунда какая-то получается — с границами обрезанных зон на макете пустой страницы вообще какой-то треш начинается.... Лечится только перезагрузкой программы....
https://www.upload.ee/files/14197607/Video_2022-06-02_204645.wmv.html

Единственный пока найденный путь - обман программы подбором входного DPI.

Кстати TIPS and TRICKS для создателей книг — создаём чисто текстовые файлы и распознаём их в ФР 8 (именно в этой версии, в более новых версиях надо писать макрос для переименования каждого файла и подмены в подпапках)..... После вклеиваем картинки на странице, заменяем первоначальные страницы в пакете FR на новые и для сохранения в PDF перераспознаём (иначе будут ошибки), и сохраняем........ Получаем чистый текст без мусора ошибочного распознавания картинок для дальнейшей работы в в ВОРД или сохранения в PDf.....

3. В обработке картинок обойдён такой простой вопрос - а как лучше работать с перекошенными страницами с ортогональными картинками на них... Полагаю, без out-task c выпрямленными страницами, нормально, никак...

4. Выставить надпись - например название книги на 1/4 от верхнего края можно только отключением Automargin с примерным выставлением верхнего поля и переобработкой, или есть другие способы центрирования, отличные от LCR-TB.

5. Может кто нибудь знает способ создания OCR pdf c вклейкой цветных зон вместо их вклеивания на страницы для FR (размеры отдельных страниц получаются сопоставимыми с размерами книги)

Автор: VladoKV, Отправлено:12:06 04-06-2022

Who can help?
This is my picture taken with ScanKromsator. Here is problem with cleaning picture... I need someone who knows how to clean this picture very nicely.
Thanks.
https://ibb.co/W3h7J93
Here is original...
https://ibb.co/Dtc38Zv

Автор: daa2013, Отправлено:13:13 04-06-2022

try b/w output


Автор: niccolo, Отправлено:13:55 04-06-2022

Интересная картинка получается в SK последней версии при импорте вот этого файла

https://www.upload.ee/files/14199222/DEF05-2005.pdf.html

ВСЕ ФАЙЛЫ ПУСТЫЕ

При просмотре в папке импорта обычными смотрелками - половина файлов с текстом..
ЧЯДНТ.

Такое чувство, что импорт PDF - что-то такое само в себе, не сильно понятное непродвинутым пользователям.

Пришлось вычищать пустые фоны из папки и подгружать картинки в новый пакет.

В дополнение - на этой же книге - ни на одной странице с однозначным номером - 1-9 нижняя граница не была установлена верно... Как-то странно это, учитывая то, как часто боковые границы захватывают всякие точки и прочий мусор на полях.

Автор: slava_kry, Отправлено:16:49 04-06-2022

niccolo
Файло глюкавое.

Автор: daa2013, Отправлено:17:43 04-06-2022

А смысл это импортировать ?
сохраните пдф как тиффы

Автор: niccolo, Отправлено:23:39 04-06-2022


Цитата:
А смысл это импортировать ?


смысл у всех разный...

Полагаю, в данном файле слой текста наложен поверх....
Проблема в том, что в SK постоянно какая-то ерунда с импортом многослойных ПДФ и в самой программе если и есть способы борьбы с этим, они не очевидные и даже не логически вытекающие....

И даже с разрешением нельзя кратно уменьшить размер выходных файлов - надо изменять входное dpi.

Понимаю, что мои примеры не самые распространённые. Но они реально встречаются и по опыту 99% программ сыпется на таких примерах без предупреждения о том, что надо исправить входные файлы....

Автор: TelecomUral, Отправлено:04:38 05-06-2022

niccolo

Цитата:
Проблема в том, что в SK постоянно какая-то ерунда с импортом многослойных ПДФ

это не проблема Кромсатора, ведь bolega часто писал тут, что ему важен только импорт картинок, обычно упакованных сканов. Какой смысл закладывать в прогу все варианты применения стандарта, да ещё и ошибки отрабатывать. А вам здесь на это указывать как на косяк СК.

+
Если вы заранее признаёте, что с вашим pdf проблемы, то исправьте pdf, а не шифруйте свои цели использования именно данного pdf в СК.

Автор: niccolo, Отправлено:10:19 05-06-2022

TelecomUral

Указывать на недостатки наверное надо, тем более, что несмотря ни на что Болега всё таки внёс кое какие исправления в импорт ПДФ таких файлов и теперь количество страниц в пакете SK равняется количеству страниц в ПДФ.....

По сути такие файлы представляют нефинализованный результат обработки - текстовые и картиночные блоки наложены на подложку страницы..... В идеале это и хотелось бы видеть при импорте для чего Болега уже сделал много....

Для предотвращения ситуации, подобной приведённой, нужно либо удалить пустые подложки при или после импорта или переместить их вниз бутерброда страничных блоков, чтобы можно было создать аут-таск... Не исключаю, что подобная ситуация - это просто баг алгоритма сложения в бутерброд многоблочных страниц...


Цитата:
Если вы заранее признаёте, что с вашим pdf проблемы


ПДФ это не мой.... К сожалению с первого взгляда на любой ПДФ не скажешь, будет он проблемным или нет. Но если моё подозрение о наложении текста поверх верно - то, думаю, таких файлов в сети достаточно.

Автор: Archivist, Отправлено:12:26 05-06-2022

niccolo
PDF-XChange Editor в помощь. Можете с его помощью скопировать текст, или изображения со всех страниц в новый документ, избавившись от контейнеров. И делать с ним что угодно в СК.

Автор: medvedik, Отправлено:17:23 05-06-2022

niccolo

Некоторый оффтопик. Я давно не брал книги на archive.org, но раньше все, выдаваемое на ограниченное время, имело простой Adobe DRM, который легко снимался при помощи calibre и плугина.

Автор: slava_kry, Отправлено:21:01 05-06-2022

niccolo
Ответ Болега
На руборде не могу писать, отвечу niccolo тут: никаких пустых страниц после импорта СК нет, просто во всех зонах (туда попал текст) включилась раскраска белым цветом (почему так, надо разбираться). Если ее убрать, все станет видно.
Есть и более простой способ для этого pdf: при его импорте в опциях импорта поставить галку на do not use zones и отключить галку на use original pdf size

Автор: TelecomUral, Отправлено:21:49 05-06-2022

niccolo, я о другом веду речь. Вы концептуально неверно подходите к Кромсатору.
Поясняю.
Вы берёте произвольный пдф и при наличии кажущихся косяков импорта в СК заявляете что-то типа "а в данном случае надо чтобы СК сделал так-то, потому что я в других программах вижу то-то и то-то". Это порочный подход для импорта. Потому что pdf стандарт штука сложная, и на все комбинации код писать трудоёмко. Вам же сказали выше - перевели в тиффы и успокоились. А вы хотите чтобы сложноустроенный файл "был понятен непродвинутому пользователю".
Это и есть противоречие, на которое я указываю.
Вот вам болега отвечает "там раскраска белым". А вы-то почему сначала сами не разобрались? Чего сразу "какая-то ерунда с импортом"? ВЫ сами сначала разберитесь. Вникните в логику, найдите проверочный пример, тщательно оттестируйте и убедившись что реально есть недоработка в СК, тогда уже и пишите здесь.

Я к чему это всё пишу: если вы будете заваливать разработчика такими непроверенными заявками, он вообще уберёт фичу импорта pdf. Был ведь уже прецедент, и не один. Глупые раздражающие вопросы - ну и "а чтоб больше не спрашивали я фичу вообще убрал". Вы всем можете "нагадить". Запросто.


Автор: asku, Отправлено:01:14 06-06-2022

Офтоппик.
Добрый вечер. Есть ли у кого-нибудь опыт создания словаря в формате hunspell?
Хотел бы иметь такой словарь (для осетинского языка) для работы в новой версии СканКромсатора.

Автор: niccolo, Отправлено:10:35 06-06-2022


Цитата:
niccolo, я о другом веду речь. Вы концептуально неверно подходите к Кромсатору.
Поясняю.
Вы берёте произвольный пдф и при наличии кажущихся косяков импорта в СК заявляете что-то типа "а в данном случае надо чтобы СК сделал так-то, потому что я в других программах вижу то-то и то-то". Это порочный подход для импорта. Потому что pdf стандарт штука сложная, и на все комбинации код писать трудоёмко. Вам же сказали выше - перевели в тиффы и успокоились. А вы хотите чтобы сложноустроенный файл "был понятен непродвинутому пользователю".
Это и есть противоречие, на которое я указываю.
Вот вам болега отвечает "там раскраска белым". А вы-то почему сначала сами не разобрались? Чего сразу "какая-то ерунда с импортом"? ВЫ сами сначала разберитесь. Вникните в логику, найдите проверочный пример, тщательно оттестируйте и убедившись что реально есть недоработка в СК, тогда уже и пишите здесь.

Я к чему это всё пишу: если вы будете заваливать разработчика такими непроверенными заявками, он вообще уберёт фичу импорта pdf. Был ведь уже прецедент, и не один. Глупые раздражающие вопросы - ну и "а чтоб больше не спрашивали я фичу вообще убрал". Вы всем можете "нагадить". Запросто.


TelecomUral
Поясняю....
1. С каких пор подход по аналогии с другими программами стал концептуально неверным? Интересно, если производитель авто вдруг решит поменять местами педали тормоза и газа, и в ответ на понятные претензии начнёт говорить - вы концептуально неверно подходите к нашей машине - вы не покрутите пальцем у виска?
2. Я понимаю трудоёмкость импорта - но в данном и в других случаях можно подойти немного по другому - из полученного пакета удалить пустые файлы.
3.
Цитата:
Вам же сказали выше - перевели в тиффы и успокоились.
Я когда-то писал про проблему растра при сохранении в tiff из-акробата. Если бы PDF не было вообще в опциях импорта - всё было бы понятно и единообразно. А то вроде функция импорта есть, но одни PDF берёт, а с другими заморочки...
4.
Цитата:
А вы-то почему сначала сами не разобрались?
С очевидным? А что с ним разбираться. Если разбираться, то с причинами.
5.
Цитата:
Вы всем можете "нагадить"
. Понял. Постараюсь больше не задавать вопросы.

Автор: bolega, Отправлено:11:09 06-06-2022

niccolo

Цитата:
Постараюсь больше не задавать вопросы.

Раньше большое количество репортов о багах, реальных и кажущихся, меня действительно сильно расстраивало. Сейчас я уже к этому спокойно отношусь. Так что вопросы лучше озвучивать.
При этом надо понимать, что структура pdf бывает так сложа, что для нее просто нет аналога в концепции СК. У СК простая концепция: страница-подложка (как правило ч/б), сверху зоны. В pdf все намного сложнее, и иногда ее невозможно воспроизвести адекватно в СК. Т.е. страницу pdf проще нарисовать (на экран, в tif-файл), чем сэмулировать подложкой и зонами. Из-за разных подходов в pdf и СК. Простой пример: FR сохраняет чб скан в pdf. Казалось бы, берем тиф, кодируем в jbig2, задаем размер полотна страницы (в размер тифа) и располагаем тиф на нем. На самом деле FR делает по другому (и не только он): задается полотно, задается черный цвет фона, тиф внутри pdf-страницы накладывается на фон как трафарет, где прозрачные области соответствуют буквам и сквозь них как бы проглядывает тот самый черный цвет фона. Если бы СК в лоб импортировал такой файл, то пришлось бы поступать так же, т.е. делать абсолютно черную страницу-подложку, а поверх помещать текст как прозрачную зону. Но СК понимает, что для такого отображения существует более адекватный, привычный способ, при котором можно обойтись без черных подложек и прозрачности. Внутри pdf бывают намного сложнее комбинации слоев, с которыми СК уже может адекватно не совладать.
В вашем случае СК абсолютно корректно извлек изображения, но ошибся с раскраской текста: покрасил его в белый цвет, и он как бы исчез. Я посмотрел из-за чего это произошло. Не скажу, что pdf некорректный, все там корректно, просто сделан не совсем логично. Перед помещением скрытого ocr-текста там зачем-то выставляется белый цвет текста и после работы с текстом обратно в черный он не восстанавливается. В этом нет ошибки, но это просто дурной тон так делать (специально проверил как делает FR для цветного текста: перед работой с текстом активирует заданный цвет, а после - возвращает дефолтный, т.е. черный). СК не-черный цвет трактует как указание раскрасить картинку. Хотя здесь СК явно ошибся, сделав это для картинки, которая не объявлена как трафарет. Просто за все время мне такого ранее не встречалось, обычно генераторы pdf корректно оперируют с цветом, возвращая его всегда в дефолт. Постараюсь это учесть. Так что польза от вашего примера несомненно есть.


Автор: niccolo, Отправлено:11:28 06-06-2022


Цитата:
Так что польза от вашего примера несомненно есть.


Спасибо bolega. Я как-то тоже надеялся, что что-то полезное да будет. И хотелось бы понять - а что за поведение на предпросмотре обрезки - когда рамка обрезанного белая и уменьшая её под ней видишь текст. И как от него избавиться без перезагрузки. Второй раз ловлю.

medvedik

Цитата:
Я давно не брал книги на archive.org, но раньше все, выдаваемое на ограниченное время, имело простой Adobe DRM, который легко снимался при помощи calibre и плугина.


Занятые книги, выдаются на час и только просмотреть онлайн.... Я как-то попытался ждать одну такую книгу, пока освободится, но не дождался....

Автор: asku, Отправлено:14:06 06-06-2022

bolega а можно ли в СК сделать функцию поиска слов? Раз уж есть подключенный из Файнридера текстовый слой и в самом ФР редактировать распознанный текст категорически не рекомендуется, то было бы здорово дополнить СК поиском букв, слов, фраз.

Автор: TelecomUral, Отправлено:14:10 06-06-2022

asku
поддерживаю. перед выходными пришла в голову эта же мысль.

Автор: asku, Отправлено:14:16 06-06-2022


Цитата:
поддерживаю


Да, я поясню еще -- бывают например, типовые ошибки распознавания осетинского текста в ФР, которые я там же в ФР часто по поиску (иногда по поиску/замене) находил и исправлял.

Ну там,
вместо гъ в ФР гь,
ае вместо той лигатуры,

ну и так далее. И всегда, кстати, удивлялся скромному набору инструментов поиска в ФР.
Вот если бы еще регулярные выражения были бы в СК, то ммм. )))

Автор: bolega, Отправлено:14:20 06-06-2022


Цитата:
И хотелось бы понять - а что за поведение на предпросмотре обрезки - когда рамка обрезанного белая и уменьшая её под ней видишь

Не совсем понял, про какую рамку речь. Это в окне VR? Рамка, которая меняет цвет и вид при нажатии пробела?


Цитата:
Занятые книги, выдаются на час и только просмотреть онлайн....

Если листать книгу в максимальном масштабе в хроме (или edge), 2-page-mode, то можно вытаскивать из его кэша исходные сканы (это именно исходные, хоть и попорчены артефактами jpeg2000-кодирования, но это намного лучше чем убитый pdf или скриншот). В кэше имена совпадают с именем папки в ссылке на книгу, и нумеруются по порядку. Кэш-вьюер от nirsoft. Возни с этим много, но если нужно качество, то другого варианта нет




Добавлено:

Цитата:
а можно ли в СК сделать функцию поиска слов?

А для чего это нужно?

В планах стоит добавление ocr в pdf и djvu. Одновременно с их созданием.
Добавление в pdf почти победил. Там все сложно, намного сложнее чем в djvu, т.к. требует подбора параметров шрифта и его кодировки.
Правда, ocr будет только по словам.
Еще в планах добавление гиперссылок используя новый ocr.


Автор: asku, Отправлено:14:35 06-06-2022


Цитата:
А для чего это нужно?


А я же чуть выше пояснил -- поиском ищу типовые ошибки ФР в распознанном осетинском тексте. Словаря для него (для языка) нет, поэтому выявление ошибок сильно усложняется.

Добавлено:
Например, ФР часто в распознанном тексте встречается в конце слова «оп», когда в реальности в 90% случаях там должно быть «он», ну и так далее.
И я в ФР поиском искал эти «оп». Ну и так далее.

Автор: TelecomUral, Отправлено:14:46 06-06-2022


Цитата:
А для чего это нужно?

я про редкие буквы в хорошем качестве думал. Типа, как "Щ" найти. По-моему, по книге это сейчас в СК сделать невозможно. Сначала надо найти хоть какую-то, потом перебирать страницы и делать анализ глифов. А так по ocr-слою вжик и готово на нужную страницу и нужную букву.

Автор: bolega, Отправлено:14:57 06-06-2022


Цитата:
По-моему, по книге это сейчас в СК сделать невозможно.

Наоборот. Делаете анализ только для "щ" сразу для всей книги. Потом листаете смотрите списки замен, где лучше. И фильтр можно настроить, чтобы не включал сильно плохие экземпляры

Автор: TelecomUral, Отправлено:15:05 06-06-2022


Цитата:
Делаете анализ только для "щ" сразу для всей книги.

не понял. Это как? Во-первых, надо уже иметь глиф "щ". А вы вроде имеете ввиду "код буквы" - ?
Во-вторых, в видео было что анализ для данной страницы, плюс можно в панельке "бинаризации" задать плюс 5-10-20 страниц. Не книгу.

Автор: bolega, Отправлено:15:16 06-06-2022


Цитата:
Это как?

Берете первый попавшийся глиф "щ", лишь бы не рваный. В видео я для примера выбрал анализ для selected (чтобы время не терять. т.к. вряд ли за раз можно осилить всю книгу), а в общем случае в том диалоге ведь можно выбрать любой диапазон, в том числе all pages.

поиск добавлю, не проблема. Надо только интерфейс продумать. То ли постранично, то ли сразу весь список найденных в книге показать (но в случае поиска одной буквы может оказаться гигантский список, не влезет всё, да и не практично), то ли последовательно (типа find next), ...

Автор: TelecomUral, Отправлено:15:51 06-06-2022


Цитата:
последовательно (типа find next

так будет удобнее. лишь бы при нажатии был учёт текущей страницы, если от последнего сдвинулся вручную. Какой-то текстовый редактор или вьювер, помню, меня бесил тем, что если уж пошёл искать от начала файла, то уж будь добр прощелкай все-все найденные строго по порядку А выбрать "с текущей вверх/вниз" просто невозможно было.

Автор: daa2013, Отправлено:16:01 06-06-2022


Цитата:
он вообще уберёт фичу ... Был ведь уже прецедент



Цитата:
Раньше большое количество репортов о багах, реальных и кажущихся, меня действительно сильно расстраивало. Сейчас я уже к этому спокойно отношусь. Так что вопросы лучше озвучивать.


Вернёте команду PDF links ?
У меня 4 отсканированных энциклопедии лежат, и во всех индексы есть ...

Автор: bolega, Отправлено:18:12 06-06-2022


Цитата:
Вернёте команду PDF links

Если удастся переделать все под новый ocr и отказаться от frgrab

Автор: DmitryKz, Отправлено:23:41 09-06-2022

Подскажите, пожалуйста, что можно сделать, чтобы максимально улучшить результат? Книжка старенькая, сканировал сам, в разрешении 600, чтобы по итогу вышло максимально качественно, но это не особо помогло — буквы/символы страшненькие, детальки их отваливаются местами, хотя на сером скане выглядят более-менее прилично.

https://disk.yandex.ru/d/W62y_E0rAOBMSw

Автор: VadimirTT, Отправлено:00:26 10-06-2022

DmitryKz
У Вас разрешение 600 дпи, а пиксельный размер, как при 300, как такое?

Добавлено:
СсылкаСделал по старинке, это минимально, что можно получить от Крамсатора.

Автор: shch_vg, Отправлено:00:55 10-06-2022

VadimirTT

Цитата:
а пиксельный размер, как при 300

Если не меньше!

Добавлено:

Цитата:
как такое?

Неправильный выбор параметров при сканировании.

Автор: DmitryKz, Отправлено:06:07 10-06-2022


Цитата:
У Вас разрешение 600 дпи, а пиксельный размер, как при 300, как такое?

Хех, а ведь вы правы... А я не заметил.

Цитата:
Неправильный выбор параметров при сканировании.

Не, с этим все хорошо было — сейчас перепроверил, благо я исходные, до пихания в СК, сканы сохранил. В задачу попали те, что получились после разворота и пересохранения SK (6.75). Интересно, что в 6.75 и разделения на развороты (Split) не было, мне пришлось дважды черновое кромсание запускать, но я решил, что сам чего-то не то сделал.
В 6.71 такого не наблюдается — сейчас также проверил — и размеры картинки соответственно разрешению, и Split отработал.
Наверно, в 6.75 какой-то параметр появился...

Читаю What's new, там, в частности, есть такой пункт:
- MW: Увеличена скорость работы черновой расстановки резаков (draft) для сканов, имеющих dpi = 600 и более.
Может, увеличение скорости работы за счет уменьшения размеров картинки и происходит...

VadimirTT
Огромное вам спасибо. Ваш результат гораздо интереснее. Про "минимально" вы имеете в виду при качестве исходного скана? Я понимаю, что дальше имеет смысл работать с глифами — просто ведь и в этом случае хотелось бы добиваться максимума. Если сможете дать устные ЦУ я готов далее самостоятельно разбираться. В любом случае спасибо!

Добавлено:
В общем, не пойму почему, но в 6.75, если сканы изначально развернуты, то при черновом кромсании с размерами картинки ничего редуцирующего не происходит, и резаки по разворотам расставляются.
Если же попросить СК сначала развернуть картинки, то резаки, можно сказать, не расставляются — просто находятся в каком-то нелогичном положении. А если еще и флажок поставить, отвечающий за пересохранение поворачиваемой картинки, происходит уменьшение размера.
Посмотрим, что bolega скажет — похоже ли это на баг...

Автор: bolega, Отправлено:08:11 10-06-2022

DmitryKz
Это баг

Всем
Не используйте в версии 6.75 опцию overwrite original scans after rotate в диалоге DRAFT!
Это приведет к повреждению исходных сканов, если их dpi>300 и они в любом формате, кроме jpg

Я пожалуй эту ретро-опцию вообще уберу


Автор: DmitryKz, Отправлено:08:20 10-06-2022


Цитата:
Я пожалуй эту ретро-опцию вообще уберу

Имеет ли смысл ее убирать? Просто починить ее... А то если скан, скажем, в 600+dpi, может ли такое быть, что разворачиание "на лету" в MW будет медленнее, нежели чем если бы изображение было правильно ориентировано? Вам тут, конечно, виднее. Я-то не знаю механику — может, и так все будет нормально.

Автор: bolega, Отправлено:08:45 10-06-2022

Конечно же разворачивание на лету замедляет работу, особенно для 600dpi и больше. Но на этот случай лучше использовать предварительно команду Tools > Rotate and save. Я всегда ей пользуюсь и вроде глюков не было.
Единственный плюс разворота в draft был только для jpg-файлов: с какой-то версии фактического поворота не производилось, а использовалось свойство jpg поддерживать lossless-способ задания поворота. Такую же возможность в Tools > Rotate and save я еще не добавил.

Автор: DmitryKz, Отправлено:11:17 10-06-2022

Надеюсь, никто не против, что я добавил в шапку ссылку на версию 6.75 (снабдив предупреждением bolega, так как оно важно. Других изменений в шапке нет. bolega, возможно, вам тоже имеет смысл добавить свое предупреждение в ваш пост с версией 6.75...


Цитата:
Единственный плюс разворота в draft был только для jpg-файлов: с какой-то версии фактического поворота не производилось, а использовалось свойство jpg поддерживать lossless-способ задания поворота.

Тогда, пожалуй, лично я согласен с вами, что опцию оттуда стоит убрать, раз нет прозрачности и единообразия в том, как она работает с разными форматами картинок.
Примерно в этой же связи мне вспомнилась опция Despeckle на вкладе Processing опций. Обычно ведь Options в настройках программы это нечто, что раз и навсегда устанавливается и не меняется. Но при старте нового проекта Despeckle всегда установлена в Fine — что само по себе fine, нет проблем. Просто будто нелогична эта нестабильность именно в Options, которые ожидаются что будут статичными, раз и навсегда установленные, как, скажем, те же пути в Apps. Скорее, ее место в Profiles, разве нет? Я как-то выставил эту опцию в Safe, ожидая, что она теперь всегда будет по умолчанию, и несколько удивился, что каждый раз надо заново ее проверять — несколько раз я даже запамятовал это делать, поскольку на глаза она не попадается, а я полагал, что она в Safe.

bolega не нашел ответа в существующей документации и в командах СК — есть ли возможность в VR устанавливать опции Fixed deskew angle из Special, чтобы не выходить из VR каждый раз для подстройки поворота результата? Т.е. своего рода интерактивность. Или предполагается, что так не нужно работать со сканом на этом этапе?

Просьба — можно ли добавить в OCR Languages на вкладке More2 еще греческий язык? В математических формулах греческие символы часто встречаются.

Автор: bolega, Отправлено:13:50 10-06-2022


Цитата:
Но при старте нового проекта Despeckle всегда установлена в Fine

Она берется из дефолтного профиля. Т.е. по умолчанию ее задают в профили, а в конкретном задании меняют в options. Все логично. Хотите всегда safe - задайте в профиле, а не в текущих options.


Цитата:
есть ли возможность в VR устанавливать опции Fixed deskew angle из Special, чтобы не выходить из VR каждый раз

Нет. К тому же изменение этой опции потребует полной переобработки файла, а это делается только из MW.

Автор: daa2013, Отправлено:02:48 11-06-2022

В ST-Advanced есть интересный механизм направляющих.
Выставляется вертикальная или горизонтальная линия, и к ней можно прижать блок контента.

В SK есть рамка (Aux rectangle). Мне кажется что в RV для прямоугольного выделения можно сделать команду "прижать к рамке" и дать окошко со стрелочками, в какую сторону это выделенное и двигать. (А можно и просто с клавиатуры стрелками).

А вспомнил я об этом из-за проблемы базовой линии при работе с глифами.
Да, хотелось бы автоматом ее корректировать. Но если это сложно, то может вручную...
Сейчас включаю сетку и примеряюсь по ней с расстояниями. При зуме, сдвигах скана вверх-вниз настроенная линия по отношению к изображению страницы уползает.
Может, возможно выставить направляющую (а еще лучше две - верхняя базовая и линия по высоте строчных знаков), и к ним руками вверх/вниз глифы двигать ? А можно и стрелочками.




Автор: asku, Отправлено:23:10 12-06-2022

Нашел свободно распространяемый словарь Hunspell для русского языка:
Ссылка

Он по объему гораздо больше того, который прилагается к новой версии СК.
Может кому пригодится.

Добавлено:
Попробовал подключить словарь.
Сделал по инструкции.
Файлы hunspell-dicts.cfg и libhunspell.dll в папку с исполняемым файлом СК.
Сами словари в папке СК в папка hunsdict с файлами ru_RU.aff и ru_RU.dic.

Как я понял из видео 4 от bolega, для того, чтобы словарь выдал список слов с ошибками, нужно жать на Doubtful words. Нажал. Программа показывает сообщение:



А списка ошибок нет.

Автор: niccolo, Отправлено:01:14 13-06-2022


Цитата:
Сделал по инструкции.


Проверяйте кодировку ru_RU.aff и ru_RU.dic

До какого-то года эти файлы были в KOI-8. Потом вроде перешли на UTF-8

Автор: TelecomUral, Отправлено:11:10 13-06-2022


Цитата:
можно ли добавить в OCR Languages на вкладке More2 еще греческий язык?

поддерживаю

Автор: asku, Отправлено:22:08 13-06-2022


Цитата:
Проверяйте кодировку ru_RU.aff и ru_RU.dic
 До какого-то года эти файлы были в KOI-8. Потом вроде перешли на KOI-8


Словарь, который прилагается к новой версии в кодировке KOI-8, а тот, ссылку на который я дал — KOI-8, и результат с обоими словарями одинаковый — сообщение Langs not set.

Прошу помочь — что я не так делаю?

Автор: TelecomUral, Отправлено:22:10 13-06-2022


Цитата:
Прошу помочь — что я не так делаю?

я напомню прекрасную строчку в шапке: помощь оказывается после предоставления суб-задания.

Автор: asku, Отправлено:22:18 13-06-2022


Цитата:
я напомню прекрасную строчку в шапке: помощь оказывается после предоставления суб-задания.


Точно )
Суб-задание (test)

Автор: TelecomUral, Отправлено:22:41 13-06-2022


Цитата:
Точно

на закладочке Page/special.../More2 вы не выбрали ни один язык.

Автор: asku, Отправлено:22:51 13-06-2022


Цитата:
на закладочке Page/special.../More2 вы не выбрали ни один язык.


Вот сейчас выбрал Russian, результат тот же самый — Langs not set.

Автор: TelecomUral, Отправлено:22:58 13-06-2022


Цитата:
Вот сейчас выбрал Russian, результат тот же самый

а у меня немедленно словарь заработал:



ищите отличие. Может, надо сначала провести распознавание нескольких глифов, как я и сделал.

Автор: bolega, Отправлено:08:01 14-06-2022


Цитата:
Вот сейчас выбрал Russian, результат тот же самый — Langs not set.

Не забывайте, что опцию нужно скопировать на все страницы. А то если задали для одной страницы, а используете на другой, то такую ошибку и получите

Автор: bearjrgm, Отправлено:09:45 14-06-2022

bolega можно ли добавить произвольный поворот picture-зоны?
И на вкладке special для фиксированного угла поворота сделать таже отрицательные значения и приоритет заданного угла. Столкнулся с тем, что иногда для страниц с такой зоной проблематично выровнять картинку на странице.

Автор: bolega, Отправлено:10:36 14-06-2022


Цитата:
И на вкладке special для фиксированного угла поворота сделать таже отрицательные значения

Нажмите на кнопку с плюсиком, он поменяет знак на минус.

Цитата:
приоритет заданного угла

В каком смысле? Если опция угла включена, то автодетекция угла перекоса отключается и используется заданный угол.
Зону можно повернуть произвольно только в окне VR. При обработке она поворачивается синхронно со страницей, и по другому невозможно.
Если речь о том, что зона сбивает с толку СК и угол перекоса определяется неверно, то можно использовать вспомогательные deskew-зоны. Если они есть на странице, то СК будет искать угол поворота только по их содержимому, игнорируя все остальное (например, картинки).

Автор: asku, Отправлено:11:41 14-06-2022


Цитата:
Не забывайте, что опцию нужно скопировать на все страницы. А то если задали для одной страницы, а используете на другой, то такую ошибку и получите


Получилось. Спасибо!
А если я буду подключать словарь языка, которого нет в списке на вкладке More2, то как быть?

Автор: bearjrgm, Отправлено:12:07 14-06-2022

bolega
спасибо, теперь все понятно.

Автор: bolega, Отправлено:13:30 14-06-2022


Цитата:
А если я буду подключать словарь языка, которого нет в списке на вкладке More2, то как быть?

Это критично только для тессеракт. Если используется FR, то можно обмануть СК.
Например, в hunspell-dicts.cfg к существующему
rus:        hunsdict/ru_RU.aff ! Russian
добавить
rus:        hunsdict/XX_XX.aff ! какой-то язык
Тогда, если в more2 задать rus, то будут проверяться по обоим словарям.
Здесь используется тот факт, что для одного языка можно задавать несколько словарей.
Если rus не используется, можете взять любой свободный, например
ara:        hunsdict/XX_XX.aff ! какой-то язык
и в more2 задать только арабский

Автор: VadimirTT, Отправлено:22:17 14-06-2022

Если сканировалось на макоси, и в названии папки попадается й, то кромсатор, выдаёт ошибку на винде.

Автор: Skvodo, Отправлено:07:03 15-06-2022

.

Автор: TelecomUral, Отправлено:07:23 15-06-2022

Skvodo
а зачем? Вот если реально.

Автор: Skvodo, Отправлено:07:36 15-06-2022

.

Автор: TelecomUral, Отправлено:09:10 15-06-2022

оффтоп

понятно. "таблеток от жадности. и побольше!"

Автор: bolega, Отправлено:09:27 15-06-2022


Цитата:
но для мусорных размытых изображений было бы полезно.

Ну так и юзайте для них НН. Зачем эти г..ные изображения в СК пихать? СК для книг, а не для апскейлинга тупых японских комиксов.
Никогда не понимал людей, которые от большого ума сканят на уровне 100dpi, а потом покупают мега-дорогие GPU видеокарты, чтобы с помощью них и NN поднимать разрешение...




Автор: TpoTuJI, Отправлено:13:06 16-06-2022


Цитата:
Текущая версия программы со всем необходимым: ScanKromsator v6.75


File not found

Перезалейте, плиз

Автор: trion1, Отправлено:13:24 16-06-2022

TpoTuJI #

Автор: TelecomUral, Отправлено:13:24 16-06-2022

TpoTuJI
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1336222925/294#294

Автор: daa2013, Отправлено:08:17 17-06-2022

Мне почему-то кажется, что когда-то была команда "Merge with transparency" и по ней цвета вклеиваемого смешивались и усреднялись с тем, куда вклеивается.
То есть я на выходе получу что-то похожее на то, что вижу при нажатой клавише T.

Может, сделать такую ?

Автор: bolega, Отправлено:09:51 17-06-2022

daa2013
Ищите в whatsnew такую фразу:
VR: Если во время вызова команды Merge держать нажатым Ctrl

Автор: niccolo, Отправлено:14:43 17-06-2022

Пара наблюдений

1. Все Save (в меню и кнопка) - работают как Save as - требуют подтверждения. Может кнопку переделать в просто Save (ну или добавить) или добавить в опции автосэйв при запуске обработки всего пакета.
2. Есть ли возможность работать ластиком/метёлками по нефинализованным страницам?

Автор: VadimirTT, Отправлено:06:38 19-06-2022

Тут, в 6.71 сплит не работает.
Ссылка

Автор: daa2013, Отправлено:12:10 19-06-2022

Мне кажется, было бы полезным, если в режиме Compare в окне с исходником можно было бы сделать Copy для последующего Paste в результат

Автор: niccolo, Отправлено:23:55 22-06-2022

Некоторые наблюдения, которые возможно кому-то будут полезны....

1. Bolega - Для книг с Архива, которые можно брать на 1 час, в максимальном увеличении из кэша вивальди вытаскиваются картинки 1,5-2 мп - 1100 х 1500-1700 пикс. (150-300 кб) Вряд ли это натуральный размер исходников... Реальное разрешение таких картинок где-то между 150-200 DPI.

Это наблюдение противоречит вашему замечанию...

2. На бледных (пересвеченных) тиффах, полученных из jpg-файлов с Archive.org Файнридер показал результаты распознавания хуже, чем на немного недосвеченных (жирных). Это противоречит моему предыдущему наблюдению, когда на бедных сканах ФР показывал результаты лучше....Возможно, это обусловлено недостаточным разрешением исходников + болячками jpeg.

3. По SK - В страничном (или разворотном без Сплит) режиме все три кнопки - обработка целой страницы/левой-правой, по идее должны работать одинаково. Но кнопка обработки правой подстраницы не работает.

4. В окне VR - выпадающий список номеров страниц в больших книгах менее удобен, чем прямой ввод номера....
Привязка нумерации обработанных страниц к реальной нумерации в книге также была бы полезна. Вводные страницы можно нумеровать буквами или римскими...

5. В окне VR - так и не понял, что делает панелька - Page size adjustment - никакой реакции на нажатие кнопок


Автор: daa2013, Отправлено:08:36 23-06-2022


Цитата:
в максимальном увеличении из кэша вивальди вытаскиваются картинки 1,5-2 мп - 1100 х 1500-1700 пикс. (150-300 кб)

Это, конечно, от книги зависит, но обычно (2000-2500)*(3000-3500) размеры.
Или вы их плохо увеличиваете перед вытягиванием, или не вивальди тут нужно использовать.

Автор: niccolo, Отправлено:09:04 23-06-2022

daa2013

Цитата:
Это, конечно, от книги зависит,


Возможно... Но на 5 разных уровнях увеличения размеры скачанной картинки не менялись.

Еще момент - при прокручивании страниц колесом мыши в режиме просмотра по 1 странице картинки страниц в кеше не сохраняются... Листать надо только клавишами клавиатуры. Браузер - Вивальди.

Автор: daa2013, Отправлено:09:11 23-06-2022

Что за книга ?

Автор: bolega, Отправлено:09:15 23-06-2022

niccolo

Цитата:
Это наблюдение противоречит вашему замечанию

Согласен с daa2013, это вы или вивальди что-то не так делает.
Проверьте на этой книге: takeiqchallenge0000cart
Эта книга примечательна тем, что оператор ошибся с датой, вместо 1990 указал 1900 и книга автоматом стала свободно доступна, т.е. можно напрямую скачать исходные сканы jp2 и все прочие сопутствующие файлы с разными метаданными, которые обычно недоступны.
Это позволит сравнить исходный скан с тем, что вытаскивается из кэша.
Почаще они бы там так ошибались

Автор: niccolo, Отправлено:11:34 23-06-2022


Цитата:
Согласен с daa2013, это вы или вивальди что-то не так делает.


Спасибо за своевременную звиздюлину. Вы оказались правы.... Провёл эксперименты.

Цитата:
Что за книга ?

Elsevier's dictionary of building construction

В одностраничном режиме позволяет увеличивать до бесконечности и в итоге перестаёт вообще что-то отдавать, хотя в промежутке можно получить файлы и оригинального, и удвоенного по сравнению с оригинальным размером (1 vs 0,5 MB). Интервал отдачи файлов оригинального размера надо ловить, но отдаёт...

В двухстраничном режиме даёт возможность увеличить в 4 или 6 раз всего, после чего прекращает увеличение и без проблем отдаёт в кеше одностраничные файлы оригинального размера...

Кроме того в двустраничном режиме можно стать по середине разворота и фокус при перелистывании сохраняется, в отличие от одностраничного режима, где постоянно возвращается вверх страницы.

Браузер Вивальди....




Автор: bolega, Отправлено:11:58 23-06-2022


Цитата:
В двухстраничном режиме даёт возможность увеличить в 4 или 6 раз всего, после чего прекращает увеличение и без проблем отдаёт в кеше одностраничные файлы оригинального размера...

Точно. Ранние книги архива делались в 600dpi, и кнопка zoom срабатывала до предела 6 раз, года с 2018-2019 (а может и раньше) стали делать 300dpi, и zoom срабатывает только 4 раза. И да, это все работает именно в двухстраничном режиме, т.к. в нем zoom доходит до оригинального размера и более не растет, это очень важно, т.к. upscale тоже плохо.
И клавишу (стрелку) для листания можно нажимать программно с подобранным интервалом (от 20 сек до 2-х минут при большой загрузке сайта, зависит от времени суток), так что книга "скачивается" сама.

Автор: asku, Отправлено:13:37 23-06-2022

bolega, подскажите пожалуйста, можно ли сделать так, чтобы колонтитул так не обрезался?



Такое происходит очень часто в книгах стихов. Когда таких страниц несколько, то проблемы нет руками поправить, но если таких страниц сотни...

Причем резаки расставлены правильно, то есть с захватом колонтитула.

Автор: niccolo, Отправлено:15:11 23-06-2022

asku


Снимите флажок авто для соответствующего резака...

Автор: asku, Отправлено:15:20 23-06-2022


Цитата:
Снимите флажок авто для соответствующего резака...


А где это сделать?

Автор: bolega, Отправлено:16:31 23-06-2022

asku

Цитата:
так, чтобы колонтитул так не обрезался?

То, что он виден, говорит о том, что обрезаться он на самом деле не будет. Если что-то не попало в желтую область, это не значит что оно будет утеряно. Вы похоже, выбрали выравнивание по правому краю, из-за этого колонтитул хоть и вышел за желтую область, но обрезан не будет. Это штатное поведение СК. Так что при таком выравнивании поводов для корректировки нет, мне кажется. Попробуйте финализировать одну страницу, и вы в этом убедитесь. Тут принцип простой: если элемент виден на экране, то и после финализации он никуда не денется.

А вообще у меня было в планах специальная опция, которая бы контролировала вот такие случаи, когда имеется тоненькая линия, которая выступает за край основного габарита текста. Сейчас СК трактует ее как паразитный мусор (реально бывает, что почеркушки выглядят похоже, т.е. вылазят за пределы текста)

Добавлено:

Цитата:
А где это сделать?

Под-опцией automargins. Если какая-то подопция снята, то положение соответствующего резака СК трактует как нечто незыблемое, т.е. координату резака считает краем габарита, и самостоятельно искать этот край уже не будет.

Автор: asku, Отправлено:18:19 23-06-2022

bolega
Да, я не правильно выразился. Действительно, обрезаться не будет, но выравниваться тоже правильно не будет, насколько помню. Это если выравнивание по центру.
В этом примере выравнивание по правому (и левому — через страницу) краю. В данном случае может выравнилось бы все корректно, но я уже вручную все такие страницы подправил, а потом уже финализировал.

Автор: asku, Отправлено:12:09 24-06-2022

bolega
А возможно ли в качестве словаря сделать возможность использования не только Hunspell, но и например, просто txt-файл (кодировка UTF-8), где был бы просто список слов?

Автор: shch_vg, Отправлено:20:52 24-06-2022

bolega
В 6.75 не нашел опции Zoom в контекстном меню списка файлов гл.окна: Special

Автор: niccolo, Отправлено:21:12 24-06-2022


Цитата:
А возможно ли в качестве словаря сделать возможность использования не только Hunspell, но и например, просто txt-файл (кодировка UTF-8), где был бы просто список слов?


Никто не мешает вам добавлять слова в словарь Hunspell, не добавляя модифицирующие суффиксы/приставки

Автор: kamenkapenza, Отправлено:19:50 26-06-2022

Товарищи, добрый вечер!
Почему то у меня перестал отображаться оригинальный значок программы на панели задач. Вот видеоподтверждение https://disk.yandex.md/i/t48_iZmCc0_Rsg

Автор: niccolo, Отправлено:23:16 26-06-2022

Поделюсь своим опытом использования новых фич...

Для примера взял 5 язычный геологический словарь
https://www.geokniga.org/authors/56221

Импортировал в SK - отмаркировал, сняв все галки, подсунул файлы в портативный FR15(!!!), распознал, скопировал букмарки - в общем всё по описанной схеме.
1. ВРОДЕ как бы получается - но только вроде.....
Не знаю почему - но часть распознанных страниц не совпала с оригиналами. Выявить закономерность не удалось....То ли пустые страницы помешали, то ли цветные..... Ручные махинации с пакетом в FR15 - удаление картиночных блоков с цветной страницы и добавление пустого текстового блока на пустые страницы ухудшили ситуацию ....
Учитывая частые проблемы у ФР с правильной расстановкой зон/блоков распознавания - для нормальной работы функции явно требуются более глубокие знания структуры пакета/выходных данных FR.

IMHO FR8 с отдельными файлами распознавания для страниц кажется более простой альтернативой, если не касаться отсутствующих языков. Касательно вносимых искажений - поскольку ни от кого не слышал, что они заметны визуально - для OCR коррекции в качестве выходных можно использовать вместо пакетных файлы после распознавания FR8... Можно даже распознавать в FR только текстовые зоны до финализации.....

Еще одной альтернативой может стать использование Abbyy FR Hotfolder отдельно для самых проблемных файлов...Но тут лучший порядок действий пусть подскажут те, кто интенсивно пользуется данной функцией....

2. Опять я буду плакаться о том, что ручной набор глифов, охватывающих алфавиты, в СК - идея не самая здравая, точнее её трудоёмкость (минимум 2-3 гарнитуры по полному алфавиту красивых (т.е. часто требующих поиска) букв) оправдана лишь в исключительных случаях.... При наличии OCR информации собрать такую информацию из файла не проблема...
Второй альтернативой остаётся использование шрифтов - большую часть которых наверняка можно будет подобрать в сервисах подбора шрифтов по картинкам....

3. С точки зрения юзабилити - в текущем исполнении для функции FR-OCR разумнее забить Parser в настройки и просить у пользователя указать только расположение пакета FR.

4. После проблем с п.1 захотел создать субтаск только с польским индексом - как наиболее проблемным в части марашек.... Выбрать файлы в Windows-манере с нажатым SHIFT/CTRL - нельзя... Указать для субтаска поддиапазон страниц, как в типичном виндовом диалоге печати нельзя... Вроде мелочи - а раздражает....

Автор: NME, Отправлено:00:12 27-06-2022

niccolo

Цитата:
часть распознанных страниц не совпала с оригиналами.

вот здесь наиболее вероятные причины этого..
http://forum.ru-board.com/topic.cgi?forum=5&topic=38467&start=580#9
проблема несовпадения страниц наблюдается при использовании файлов из временной папки, если сохранить проект в новую папку, то страницы встают на свои места..
если же руками в проекте фр делать правки - то это также может привести к непредсказуемым последствиям вплоть до вылета программы, делать это крайне не рекомендуется..

Добавлено:
niccolo
и в данном топике на стр.127 тоже было обсуждение на эту тему..

Автор: niccolo, Отправлено:07:45 27-06-2022

NME

Спасибо за инфо. Как-то пропустил информацию про проблемы с результатами распознавания из TEMP-папки.

Остаётся вопрос - что делать со случаями, когда ФР упорно ставит блоки неверно? Для отдельных букв это не особо принципиально или даже вообще непринципиально, когда речь идёт об одноязычных документах, но с многоязычными это уже не так...

Сохранять шаблон блоков и накладывать их? Или?

Автор: NME, Отправлено:08:54 27-06-2022

niccolo
Можно попробовать вручную расставить блоки, но результат не гарантирован.. и есть особенность - блоки на странице нужно менять абсолютно ВСЕ! т.е. сначала все удалить, а потом вручную нарисовать новые и перераспознать страницу.. двигать блоки и их границы нельзя, т.к. в этом случае фр меняет идентификаторы блоков и программа их не находит..

Автор: niccolo, Отправлено:09:38 27-06-2022

NME



Цитата:
Можно попробовать вручную расставить блоки, но результат не гарантирован.. и есть особенность - блоки на странице нужно менять абсолютно ВСЕ! т.е. сначала все удалить, а потом вручную нарисовать новые и перераспознать страницу.. двигать блоки и их границы нельзя, т.к. в этом случае фр меняет идентификаторы блоков и программа их не находит..


Для одиночных страниц проще - исправил блоки, сохранил шаблон, удалил все, и вернул обратно из шаблона... А провернуть сие даже на 100 страниц уже утомительно...

Переносить пакеты блоков другим способом Абби тоже не позволяет...

Может тут умельцы напишут макрос сохранения блоков по всем страницам пакета и их последующим наложением например на исправленные страницы....

Автор: TelecomUral, Отправлено:10:08 27-06-2022

оффтоп
niccolo
абби вам не выполняет пожелания, так вы на болегу насели? Сами давайте.

Автор: niccolo, Отправлено:10:18 27-06-2022

TelecomUral


Цитата:
абби вам не выполняет пожелания, так вы на болегу насели?


Вы путаете указание недостатков/альтернативных путей решения проблем с требованиями. Я не заказчик софта и требовать ничего не могу...

Автор: TelecomUral, Отправлено:10:38 27-06-2022

niccolo
да я пошутил

Автор: bearjrgm, Отправлено:22:08 27-06-2022

TelecomUral а возможно при помощи постеризации утолщить контур?


Автор: TelecomUral, Отправлено:22:22 27-06-2022

bearjrgm
без примера непонятен вопрос.
постеризация это уменьшение количества цветов. если, допустим, на полноцветной картинке вокруг линии одного цвета тонкий контур другого цвета, то при постеризации можно особо назначить этому другому цвету "заменить его на цвет линии". Получится утолщение линии. Иначе я не понимаю, о чём вы.

Автор: bearjrgm, Отправлено:23:24 27-06-2022

TelecomUral спасибо, это то, что я хотел узнать


Автор: kamenkapenza, Отправлено:21:10 01-07-2022

Господа, мир всем! Не в курсе, как в новой версии 6.75 фиксировать масштаб? Пока не смотрел видео от автора (там, наверное, есть). В предыдущей версии масштаб открытия страниц (фикс) делался через Special – Zoom – Fix current zoom. Тут такого пути нет.

Автор: shch_vg, Отправлено:23:58 01-07-2022

kamenkapenza

Цитата:
как в новой версии 6.75 фиксировать масштаб?

На мой аналогичный вопрос я пока не получил ответ.

Автор: aylocin, Отправлено:00:43 02-07-2022


Цитата:
как в новой версии 6.75 фиксировать масштаб?

Думаю, с помощью меню Image -> Zoom -> Fix current zoom

Автор: kamenkapenza, Отправлено:08:05 02-07-2022

aylocin, спасибо!!! Работает.
shch_vg, проблема решена.



Автор: shch_vg, Отправлено:13:36 02-07-2022

aylocin

Цитата:
Думаю, с помощью меню Image -> Zoom -> Fix current zoom

Как Вам удалось это найти?
В sk.6.75.whats.new.txt нашел только следующее:
-----------------------------------------------------------
- MW: Новые команды Edit > Zoom > Save current zoom и Restore zoom. Для команды restore на панель команд добавлена отдельная кнопка.
-----------------------------------------------------------,
хотя этого в 6.75 нет.

Автор: kamenkapenza, Отправлено:10:19 03-07-2022

Здравствуйте!
Никто случайно из тутошних господ не знает, как отменить копирование зон на последующие страницы?
В некоторых книгах наблюдается цветной текст в определенном месте (нумерация или название главы), например, сверху посередине. Как полагается в таком случае, копируем зону цветного текста на последующие страницы через Zone - Paste zone to pages - From the nest to the last. В результате последующего просмотра и работы выясняется, что зоны на последующих страниц надо подкорректировать, сместить на несколько муллиметров, т.е удалить установленные фиксированные зоны с последующих страниц и сделать на последующие страницы другое местоположение. Или не удалять предыдущие, а сделать их коррекцию для последующих страниц.
Или,вероятнее всего, это невозможно (удаление и коррекция фиксированных последующих зон)?

Автор: shch_vg, Отправлено:13:24 03-07-2022

kamenkapenza
Zone ->Bulk operations...

Автор: TelecomUral, Отправлено:21:21 03-07-2022

shch_vg
или открыть заранее сохраненную копию задания (бэкап).

Автор: shch_vg, Отправлено:21:52 03-07-2022

TelecomUral

Цитата:
или открыть заранее сохраненную копию задания (бэкап).

Не прокатывает по тех.заданию
А если нужно удалять не сразу после первой, а после обработки определенного количества страниц?
Сохранять задание после каждой обработанной страницы?

Автор: kamenkapenza, Отправлено:23:14 03-07-2022


Цитата:
Zone ->Bulk operations...

shch_vg, спасибо! Посмотрю потом на деле, как проходит эта операция с булками)). Уже вручную подкорректировал.

Автор: aylocin, Отправлено:00:32 04-07-2022

shch_vg

Цитата:
Цитата:
Думаю, с помощью меню Image -> Zoom -> Fix current zoom

Как Вам удалось это найти?


Пунктов меню в SK не так уж и много, прошелся вначале по контекстному, потом по пунктам главного меню.

Автор: TelecomUral, Отправлено:06:51 04-07-2022


Цитата:
shch_vg
А если нужно удалять не сразу после первой, а после обработки определенного количества страниц?
Сохранять задание после каждой обработанной страницы?

Нормальный (опытный) человек, начиная сложную манипуляцию с данными, где есть риск ошибиться или прийти не к тому результату, делает резервную копию исходных данных. Чтоб если он пошёл "не тем путём", можно было вернуться к шагу ноль. В СК не зря предлагается сохранять задание с новым именем каждый раз при открытии диалога сохранения.
Я, пока учился работе с СК, вообще новую полную копию папки со сканами и подпапками делал перед каждым чихом, и на бумажку описание понятное выписывал, потому что не знал, что получу через 20-50 шагов после запуска какой-нибудь команды. Один раз пришёл в тупик с merge картинок, пришлось книгу делать с нуля, и стал тупо дублировать всю папку. Потом понял как и что работает и что на что влияет, перестал делать эти срезы состояний.

Автор: shch_vg, Отправлено:15:16 04-07-2022

TelecomUral
Вы уж совсем начинающего запугали.
Не надо забывать, что СК сам периодически делает бэкап, поэтому в каждый конкретный момент есть три версии задания: выполняющееся, запомненное СК (с расширением spt) и предыдущее запомненному. Этого практически хватает для большинства вариантов.
А вот есть теоретический вопрос, который мне не хочется проверять на практике.
Время от времени здесь появляется вопрос, что делать, если уже сделана финализация, а необходимо изменить размеры всех обработанных страниц. Напрашивается ответ, что нужно было перед финализацией сохранить задание, чтобы в таком случае сразу восстановить состояние перед финализацией. Но возникает другой вопрос, а что в этом случае будет, ведь финализация изменила линейные размеры выходных файлов? Как такое запомненное задание, рассчитанное на другие линейные размеры страницы, сработает на новых размерах?

P.S. Зам задал - сам ответил!
Похоже, что все должно сработать нормально, т.к. исходные сканы не менялись.

Автор: kamenkapenza, Отправлено:16:36 04-07-2022

Господа чатлане, здравствуйте!
Не знаете случайно, есть ли возможность создания зоны картинки уже на выходе, т.е. на панели результатов?
Например, везде зоны расставил, запустил процесс обработки, после обработки появилась панель результатов. При просмотре выясняется, что всё гоже, только на одной странице вышла оплошность - не проставлена зона рисунки, и он отобразился черно-белым. Или на панели результатов нельзя создать зону рисунка, не выходя на главную панель?

Автор: shch_vg, Отправлено:17:55 04-07-2022

kamenkapenza

Цитата:
есть ли возможность создания зоны картинки уже на выходе

Нет

Цитата:
Или на панели результатов нельзя создать зону рисунка

Да

Автор: kamenkapenza, Отправлено:18:07 04-07-2022


Цитата:
kamenkapenza

Цитата:
есть ли возможность создания зоны картинки уже на выходе

Нет

Цитата:
Или на панели результатов нельзя создать зону рисунка

Да


Значит пожелания для новой версии. Чтобы было, для удобства.

Упустил из виду такую деталь: в новой версии есть фиксация настроек для изготовления джву? Настроил во вкладке Create djvu vizard для изготовления djvu свои параметры, и чтобы их сохранить для изготовления следующих книг с такими параметрами, чтобы не устанавливать их каждый раз одни и те же.

Автор: DmitryKz, Отправлено:18:52 04-07-2022


Цитата:
Значит пожелания для новой версии. Чтобы было, для удобства.

А смысл? Это совсем какая-то редкая ситуация, чтобы не создать зону, когда она необходима. А переобработка страницы все равно будет в этом случае.

Я бы в новой версии "для удобства" пожелал, чтобы после редактирования зоны в VR объединить кнопку ОК в окне свойств зоны и пункт в контекстном меню Reprocess zone. Смысл редактирования зоны в VR как раз и состоит в последующем репроцессинге, и столько лишних телодвижений — сначала кнопку в окне нажать, затем еще в контекстном меню пункт "выловить" — особенно когда зона не одна.

Автор: kamenkapenza, Отправлено:19:06 04-07-2022


Цитата:
А смысл? Это совсем какая-то редкая ситуация, чтобы не создать зону, когда она необходима. А переобработка страницы все равно будет в этом случае.


Смысл, если случайно забыл поставить зону в какой то странице. Во вкладке просмотра результатов идет просмотр всех страниц, и случайно обрбнаруживается такая оплошность. Чтобы не выходить на главную, а потом опять попадать на вкладку просмотра результатов.
Если вы не в курсе, то переобработку зоны можно делать непосредственно на панели результатов, не выходя на главную. Во вкладке просмотра результатов для этого случая есть пункт Reprocess, так же во вкладке просмотра результатов есть возможность войти в свойства зоны и поменять параметры зоны и опять же нажать Reprocess.
Всё вот это есть, поэтому возможность создание зон на панели просмотра (без выхода на главную) была бы не лишней в дополнении к перечисленным возможностям программы.

Это не придирки. Программа великолепная!!! Просто заявка на расмотрение автором для следующей версии. Должны же быть какие то изменения для следующей версии, которые будут отличать следующую от предыдущей.)))

Автор: TelecomUral, Отправлено:20:19 04-07-2022


Цитата:
после редактирования зоны в VR объединить кнопку ОК в окне свойств зоны и пункт в контекстном меню Reprocess zone

Поддерживаю. Мне тоже казалось не раз, что было бы полезно рядом с "ОК" видеть кнопку "ОК+Reproc".

Добавлено:

Цитата:
Во вкладке просмотра результатов для этого случая есть пункт Reprocess

вы забываете, что для нужд репроцессинга не меняются контуры зоны. При создании же новой зоны или изменении контуров старой может возникнуть изменение на самой чб странице (вспомните параметр Clear source area). И практически всегда возникает.
Ни разу за всё время моего знакомства с СК я не думал, что хорошо бы было создать зону прямо в VR. Потому что мне надо при создании видеть оригинал, а не покореженное/сдвинутое/бледное/бинаризованное/etc гуано, которое почему-то у меня в данном месте получилось из-за моей же невнимательности.

Автор: kamenkapenza, Отправлено:20:39 04-07-2022


Цитата:
При создании же новой зоны или изменении контуров старой может возникнуть изменение на самой чб странице (вспомните параметр Clear source area). И практически всегда возникает.

Для моего случая ничего не изменится: я не пользуюсь резаками, полями и подобными геометрическими процессами и манипуляциями с размерами страниц в Кромсаторе.

Автор: shch_vg, Отправлено:22:22 04-07-2022

kamenkapenza

Цитата:
 Для моего случая ничего не изменится: я не пользуюсь резаками, полями и подобными геометрическими процессами и манипуляциями с размерами страниц в Кромсаторе

В этом случае нужно делать отдельный вариант СК только для вашего использования.
Если это сделать для всех, то для тех, кто пользуется перечисленными выше возможностями (да и для вас, когда вы захотите эти возможности использовать), возникают проблемы.
А именно, чтобы обработать нарисованную в VR зону, нужно ее точно идентифицировать НА ИСХОДНОМ СКАНЕ, что не является элементарным действием.
Поэтому получается, что при включении любой из перечисленных выше возможностей нужно создание зоны в VR блокировать.
Зачем тогда вообще огород городить?

Автор: asku, Отправлено:22:39 04-07-2022

Добрый вечер. Прошу подсказать, что я делаю не так.
Вот тест.

Хочу попробовать подключить для OCR новый словарь Hunspell.
Я просто взял список слов и поместил в файл *.dic.
В More2 указал арабский язык.
В файле hunspell-dicts.cfg добавил:
ara:        hunsdict/os_OS.aff ! Ossetian
Один из файлов словаря назвал соответствующе — os_OS.aff

Но почему-то в списке незнакомых словарю слов он показывает все слова страницы, включая те, что точно есть в словаре (os_OS.dic)


Автор: TelecomUral, Отправлено:06:29 05-07-2022


Цитата:
asku
Прошу подсказать, что я делаю не так.

вероятно, в словаре dic надо указать число реально присутствующих слов вначале и добавить пустую строку в конце. Сделать по аналогии с ru и en файлами - первое число там это число слов плюс 2. У меня после таких изменений всё заработало в вашем примере. Отсеялись "Фрося" и "самовар" а насчёт "фыцг" и прочих "уыныс" не поручусь. Вроде тоже корректно.

Автор: asku, Отправлено:08:13 05-07-2022

TelecomUral получилось. Спасибо)

Автор: niccolo, Отправлено:19:17 05-07-2022

Похоже, в последней версии не работает функция Scan folder monitoring - ни с флажком, ни без флажка не подгружает новые картинки из папки..... Или опять алгоритм поменялся и нужно нажать какую-то волшебную кнопку?

Автор: kamenkapenza, Отправлено:21:07 05-07-2022

Панель бинаризации у меня какая то обрезанная. Вот видеоподтверждение, и на версии 6.71 и на 6.75 https://disk.yandex.md/i/2CtaPxFO77Br1Q

Автор: niccolo, Отправлено:06:16 06-07-2022

С такими файлами

https://www.upload.ee/files/14298772/dictionaryofagri_0457.jpg.html


что-нибудь можно сделать, чтобы хотя бы качество распознавания поднять ....

Автор: daa2013, Отправлено:07:42 06-07-2022

Глифами вручную перенабрать.
Хорошие страницы, как источник глифов, там есть.

Автор: aylocin, Отправлено:13:34 06-07-2022

В SK 6.75, окно VR, при вставке глифов заметил не полностью корректную, на мой взгляд, работу функции отката изменений (включен режим 'Remove speckles that touch the pasted image'). Возможно, это уже известно, да и не критично.
Иногда, после вставки глифа и при дальнейшей попытке откатить изменение (по команде Undo/Ctrl+Z), не полностью восстанавливается предыдущее состояние. Часть изображения безвозвратно теряется.
Для воспроизведения можно вставить, например, маленькую 'л' на место большой 'Л', сверху.
См. пример на картинке:

Автор: bolega, Отправлено:16:15 06-07-2022

shch_vg

Цитата:
Время от времени здесь появляется вопрос, что делать, если уже сделана финализация, а необходимо изменить размеры всех обработанных страниц

Если размер нужно увеличить, то
Result > Resize output files


niccolo

Цитата:
Похоже, в последней версии не работает функция Scan folder monitoring - ни с флажком, ни без флажка не подгружает новые картинки из папки.....

Какая версия windows?
Проверил. Работает. Помните, что фича требует, чтобы файлы имели последовательные номера в конце имени (суффикс перед номерами допускается). Допускается нарушение последовательности номера, но не более чем на 3. Мониторинг работает примитивно, он не подхватывает новые файлы, он просто смотрит номер в имени последнего файла в списке СК, и ищет все номера в новых сканах, бОльшие этого номера.


Цитата:
что-нибудь можно сделать, чтобы хотя бы качество распознавания поднять ....

такие Motion blur неплохо восстанавливает topaz sharpen

aylocin

Цитата:
заметил не полностью корректную, на мой взгляд, работу функции отката изменений

баг нашел, исправлю


Добавлено:
kamenkapenza

Цитата:
Панель бинаризации у меня какая то обрезанная

странно, на такое еще никто не жаловался
Но вам это ни к чему. Ребинаризация работает только для обработки с включенным automargins. С выключенной опцией я так и не сделал.

Автор: kamenkapenza, Отправлено:16:45 06-07-2022

Уважаемый bolega! Вот такая проблема с панелью бинаризации. Ну если в моем случае не работает, тогда ладно.


Автор: bolega, Отправлено:17:07 06-07-2022

kamenkapenza
Ребинаризация не работает, если выключена опция обработки automargins (как у вас). К сожалению, пока так...

Автор: kamenkapenza, Отправлено:17:11 06-07-2022

bolega, спасибо! Я понял.



Автор: niccolo, Отправлено:19:48 06-07-2022

bolega

Цитата:
Проверил. Работает.

Не знал о такой особенности - проверял на вытащенных из кэша Вивальди файлах из архива. У них номер посередине имени....


Цитата:
такие Motion blur неплохо восстанавливает topaz sharpen


Это из архива - в книжке 0,5-1% таких страниц.... Спасибо за информацию. Буду пробовать....

Автор: kamenkapenza, Отправлено:21:43 08-07-2022

Друзья! Есть ли в новой версии фиксирование настроек изготовления djvu на панели Create DJVU vizard во вкладке Step2 (BW)? Например, выставить нужные для меня 600 bw, quality по 100, Text compression quasilossless, зафиксировать это в профиль и в следующий раз входить уже с этими настройками.
А то, может, добрые люди фиксируют как то эти параметры, а я всё по старинке работаю: каждый раз настройки выставляю.

Автор: niccolo, Отправлено:12:12 09-07-2022

bolega

Еще пара мелочей по Usability.

1. В окне указания разрешения исходных файлов, которое часто всплывает при работе с JPG, наверное стоит поставить фокус курсора на кнопку ОК.

2. Для subtask - ИМХО, наверное стоит сохранять названия выходных файлов, особенно с вашим подходом - не трогать исходники.... В субтаске помучал исходник - получил лучший результат - и просто скопировал его в выходную папку основной задачи. А сейчас приходится восстанавливать номер.

3. Для работы со сторонними источниками, у которых нередко обрезаны номера или колонтитулы встречаются пропуски страниц - ИМХО была бы полезной функция автонумерации в нижнем/верхнем поле набором циферок из текста/шрифтом и С ПРИВЯЗКОЙ НУМЕРАЦИИ В ПРОГРАММЕ К НУМЕРАЦИИ В КНИГЕ....
Вводные/оконечные страницы можно нумеровать латинскими/литерами или с добавлением литеры к нумерации....

TopazSharpenAI действительно вытягивает сфотографированный расфокусированный текст, снижая количество ошибок распознавания на порядок-полтора. Остаются только ошибки взаимной замены литер. похожих по контуру.
Причём, что странно, вытягивает он не фильтром Defocus, а фильтром Motion Blur (честно говоря, пока до него дошёл, хотел уже бросить это дело)....

Автор: shch_vg, Отправлено:15:30 09-07-2022

niccolo

Цитата:
2. Для subtask - ИМХО, наверное стоит сохранять названия выходных файлов

Этот вопрос поднимался уже давно (правда без такого сильного аргумента!), но пока не решен.
В свете предложенного Вами его можно было бы расширить до возможности обратного внедрения информации из spt субтаска в исходный spt.

Автор: TelecomUral, Отправлено:16:21 09-07-2022


Цитата:
была бы полезной функция автонумерации в нижнем/верхнем поле набором циферок из текста/шрифтом

поддерживаю. редко, но бывала нужна примерно такая фича. slava_kry мне сразу Иллюстратор советовал

Автор: kamenkapenza, Отправлено:18:11 09-07-2022

Есть возможность увеличить размеры значков в панели задач? У меня манюсенькие, у автора программы, многоуважаемого bolega, в видеоуроках большенькие.
https://ibb.co/cFNv38t
https://ibb.co/khcynFc
Или это зависит от расширения экрана, и размер значков менять нельзя?

Автор: Archivist, Отправлено:00:32 10-07-2022


Цитата:
была бы полезной функция автонумерации в нижнем/верхнем поле набором циферок из текста/шрифтом

Цитата:
поддерживаю. редко, но бывала нужна примерно такая фича. slava_kry мне сразу Иллюстратор советовал

Ну, тут в идеале нужен целый конструктор/редактор колонтитулов. Если говорить о PDF, рабочий вариант - делать их в сторонней программе и затем "наклеивать" на основной документ (с помощью PDF-XChange, или аналогичных редакторов). Причем, колонтитулы можно делать любой сложности, хоть с картинками - PDF будет считать 1000 одинаковых колонтитульных картинок за одну.

kamenkapenza

Цитата:
Или это зависит от расширения экрана

Только от разрешения экрана.

Автор: TelecomUral, Отправлено:05:00 10-07-2022


Цитата:
В субтаске помучал исходник - получил лучший результат - и просто скопировал его в выходную папку основной задачи

Вообще говоря, звёздочка сохраняет исходное имя.
Но в целом я не понимаю задачу. Зачем субтаск создавать, если можно мучать конкретный файл/файлы сразу в основном задании. И переносить ничего не надо будет. Вас же всё равно не устраивает обработка в основном задании (хотя как раз их и можно временно отложить в копию при экспериментах, если времени жалко на повторную обработку с исходными параметрами). К тому же новые зоны всё равно так не перенести, id собьются. Суб-таск нужен для экспорта в интернет, а для групповой обработки есть subsets.

bolega
По-моему, ненормально, если я открыл задание, выделил в списке два файла красным, создал субтаск, закрыл задание... а оно даже не предложило сохраниться

Автор: niccolo, Отправлено:12:34 10-07-2022


Цитата:
звёздочка сохраняет исходное имя.

Мы говорим об имени обработанного SK файла....Обработанные файлы нумеруются с 1 по порядку....


Цитата:
Зачем субтаск создавать, если можно мучать конкретный файл/файлы сразу в основном задании.


В книге не 1000 страниц пяток страниц размытые (только что пример из жизни). Насколько понимаю, для их ОCR восстановления гораздо разумнее создать субтаск, особенно учитывая то, что в него библиотека глифов переносится по дефолту, или нет? Это разумно вдвойне учитывая то, что в ФР расстановку блоков/проблемы распознавания исправлять вручную приходится довольно часто, а автор парсера не гарантирует правильный порядок следования текста для таких случаев (всё же для одной страницы вероятность такой проблемы меньше, чем для 200)....

Для юзабилити еще неплохо бы вынести на панель кнопки удаления изображений из пакета (третий уровень в меню для такой простой задачи - Special - Delete - Delete Current (or.....) - как-то слишком) - вставки пустой страницы после выделенной для поддержания совпадения нумерации при обнаружении пропуска страниц....

Кстати - сканировщикам/фотографам книг рекомендую запускать сканы сразу на распознавание, чтобы по нумерации/количеству ошибок на странице в подробном или табличном окне пакета в ФР сразу определять возможные пропуски страниц /проблемы с аппаратурой.

Вот тут я когда-то в небольшой статье описал КАК
https://www.upload.ee/files/14311988/FineReader.pdf.html

И судя по отзывам тогда в топике FR про это многие пользователи ФР не знают.

Автор: sirius12, Отправлено:16:34 10-07-2022

Прекрасная версия 6,75,5, работает более стабильно на XP. Но вот никак не могу разобраться с применением ParserFR12. В какую папку надо положить этот файл, как его подключить для работы в SK, как следует импортировать при этом для работы в SK OCR из FR. Будет приятно, если кто-то подробно обо всем расскажет. Да, и ещё вопрос: чем отличается tessdata2 от tessdata, который использовался в версии 6,71? Нужно ли после использования версии 6,75,5 удалять папку с tessdata? Спаcибо

Автор: daa2013, Отправлено:17:57 10-07-2022

Cколько-то страниц назад было видео от болега (про парсер рассказывается внутри части 3).
Надо бы его в шапку засунуть.

tessdata сидит внутри папки SK 6.00.5 / SK 6.71,
tessdata2 - внутри папки SK 6.75.5

Они друг другу не мешают, ничего удалять не надо

Автор: TelecomUral, Отправлено:22:20 10-07-2022


Цитата:
гораздо разумнее создать субтаск

нет, я не вижу тут разума.

Автор: sirius12, Отправлено:18:56 11-07-2022

daa2013

Цитата:
tessdata сидит внутри папки SK 6.00.5  / SK 6.71,
tessdata2  - внутри папки SK 6.75.5
 
Они друг другу не мешают, ничего удалять не надо

Благодарю, очень толково и понятно.

Но, тогда вопрос, зачем они нужны эти две папки из разных версий? Чем они отличаются друг от друга, или какая из них полезнее для практической работы? Спасибо




Автор: daa2013, Отправлено:19:34 11-07-2022

Насколько я помню объяснения bolega, был сделан переход на новую версию тессеракта.

Как минимум, там есть другие алгоритмы распознавания (LSTM).
Они не всегда лучше работают, чем старые, поэтому внутрь СК даже вшит переключатель (Tesseract/LSTM/Combined)

Понимаю ваше недоумение, так как в файле readme речь идёт просто о тессеракт, лежащем в tessdata. Без указания версий, что странно. Т.е. неважно, в какой папке файл лежит, главное путь к eng.traineddata прописать. К какому ? К тому, что в настоящее время распространяется с СК (а он лежит в папке tessdata2 ! и старая tessdata не нужна.).

Я вот теперь уже даже сомневаюсь, можно ли к 6.75.5 старый тессеракт подключить. А если подключить, то как будет себя вести этот переключатель ...

Автор: asku, Отправлено:21:06 11-07-2022

А тексты на каких языках может распознавать тесеракт?

Автор: qwaxym, Отправлено:21:26 11-07-2022


Цитата:
А тексты на каких языках может распознавать тесеракт?

Более 100 языков, включая русский.

Автор: asku, Отправлено:21:30 11-07-2022


Цитата:
Более 100 языков, включая русский.


А где можно на этот список посмотреть?

Автор: bearjrgm, Отправлено:22:28 11-07-2022

asku

https://tesseract-ocr.github.io/tessdoc/Data-Files-in-different-versions.html

Автор: asku, Отправлено:23:42 11-07-2022

bearjrgm спасибо. А как можно новый язык добавить, не знаете? Что для этого нужно сделать.



Добавлено:
bolega

Вопрос возник по последней версии.


Файнридер распознал как фастафдам (вместо лигатуры пишу букву "а", потому что здесь на форуме, лигатура некорректно отображается).
А надо: фаста’рдам. Как можно вместо «ф» написать «’р» ? Я смотрел ваши видеоролики, но вроде конкретно на мой вопрос там ответа нет.

А вот здесь возможно баг.

В списке слов-ошибок (по словарю Hunspell) не работает пункт меню Uncheck all. По крайне мере, у меня ничего не происходит.

И еще вопрос, точнее пожелание. Нельзя ли сделать так, чтобы можно было сохранять список слов, не найденных в словаре Hunspell в отдельный txt-файл? Вот на второй картинке нажимать правой кнопкой мыши и там чтобы был пункт меню «Сохранить в файл».

Автор: sirius12, Отправлено:18:26 12-07-2022

daa2013

Цитата:
Т.е. неважно, в какой папке файл лежит, главное путь к eng.traineddata  прописать.

Спасибо за объяснение, но у меня еще вопрос: почему надо прописывать путь на eng.traineddata, а не на rus.traineddata или osd.traineddata, чем они отличаются? Спасибо

Автор: daa2013, Отправлено:05:33 13-07-2022

Извините, а вам не пофиг ?
Потому что разработчик предусмотрел именно так.


Автор: sirius12, Отправлено:15:17 13-07-2022

daa2013

Цитата:
Извините, а вам не пофиг ?
Потому что разработчик предусмотрел именно так.

Если так рассуждать, то вся жизнь будет пофиг! Вам такая жизнь нужна?
Поэтому я бы хотел уточнить у Вас, как известного специалиста на форуме, для чего другие аналогичные файлы там имеются? Ведь разработчик не просто так их положил в папку, и они также запускные (*.exe)?
Если, конечно, Вы не знаете, то можете хотя бы дать ссылку, где об этом можно узнать? Спасибо.

Автор: daa2013, Отправлено:18:50 13-07-2022

https://tesseract-ocr.github.io/tessdoc/Data-Files.html

https://habr.com/ru/company/rosatom/blog/669020/?ysclid=l5jozh0pj7203384545

Автор: sirius12, Отправлено:20:47 13-07-2022

Благодарю Вас, daa2013 за ссылки
Наиболее интересная и полезная практически ссылка: https://habr.com/ru/company/rosatom/blog/669020/?ysclid=l5jozh0pj7203384545
Я изучил её, но она дается на примере Линукс-системы, и получается, что для распознавания русских текстов надо подключать rus.traineddata, а для распознавания английского, надо чтобы оба были подключены. Правда как это делать через SK, я пока не представляю себе. В Линуксах там всё проще, потому что делается через командную строку, но в Windows, да еще и через SK… Было неплохо, если бы кто-либо специально выложил бы в данной теме статью о том, как надо правильно пользоваться Тессерактом при работе с SK.

Автор: bolega, Отправлено:10:28 16-07-2022

shch_vg

Цитата:
Как Вам удалось это найти? В sk.6.75.whats.new.txt нашел только следующее: ----------------------------------------------------------- - MW: Новые команды Edit > Zoom > Save current zoom и Restore zoom. Для команды restore на панель команд добавлена отдельная кнопка.

Да, я забыл об этом написать в whats.new. Но вроде бы демонстрировал в первом видео.

asku

Цитата:
Как можно вместо «ф» написать «’р»

В текущей версии нельзя изменить количество букв. Задайте просто «р». Этого хватит для правильной замены глифа.


Цитата:
не работает пункт меню Uncheck all

исправил


Цитата:
Нельзя ли сделать так, чтобы можно было сохранять список слов, не найденных в словаре Hunspell в отдельный txt-файл

не хочу мороки с выбором файла, записью и т.п.
Поэтому просто сделал копирование в буфер обмена текущего слова, всех слов (т.е. списком построчно) и текста (все слова в одну строчку через пробел). А вы уже сами вставляйте куда хотите: в файл, в другой редактор и т.п.


Цитата:
а можно ли в СК сделать функцию поиска слов?

добавил поиск. обычный и через регулярные выражения. Нужно делать опцию "искать слово целиком"? А то с ней морока с учетом символов-разделителей слов.

sirius12

Цитата:
почему надо прописывать путь на eng.traineddata, а не на rus.traineddata или osd.

можете выбрать любой файл, хоть eng, хоть rus, хоть что угодно. Главное чтобы все они лежали в одной папке. Потому что важен путь, а не имя конечного файла.


Цитата:
зачем они нужны эти две папки из разных версий?

файлы для версий тессеракта начиная с 4 не совместимы с файлами из предыдущих версий 3.Х. При этом имена файлов остались прежними. Версии 4.Х не могут работать с файлами от предыдущих версий. Поэтому приходится хранить их в разных папках. Но если вы никогда не будете пользоваться предыдущей версией СК (которая работает только со старыми файлами тессеракт), то можете старые файлы удалить, если они так мозолят глаза.

Автор: asku, Отправлено:14:18 16-07-2022


Цитата:
Поэтому просто сделал копирование в буфер обмена текущего слова, всех слов (т.е. списком построчно) и текста (все слова в одну строчку через пробел).


А как это делается?


Цитата:
добавил поиск. обычный и через регулярные выражения. Нужно делать опцию "искать слово целиком"?


Отлично! Этого хватит, если морока.

Автор: asku, Отправлено:22:51 16-07-2022

bolega, еще хотел спросить. Нельзя ли добавить возможность редактирования картинки в этом
окне (см. рис.) с помощью ластика.


Автор: sirius12, Отправлено:10:57 17-07-2022

bolega

Цитата:
можете выбрать любой файл, хоть eng, хоть rus, хоть что угодно. Главное чтобы все они лежали в одной папке. Потому что важен путь, а не имя конечного файла.


Цитата:
файлы для версий тессеракта начиная с 4 не совместимы с файлами из предыдущих версий 3.Х. При этом имена файлов остались прежними. Версии 4.Х не могут работать с файлами от предыдущих версий. Поэтому приходится хранить их в разных папках. Но если вы никогда не будете пользоваться предыдущей версией СК (которая работает только со старыми файлами тессеракт), то можете старые файлы удалить, если они так мозолят глаза.

Вот это - ответ! Толково! Спасибо.

Автор: kamenkapenza, Отправлено:12:51 17-07-2022


Цитата:
Цитата:
не работает пункт меню Uncheck all

исправил


Цитата:
а можно ли в СК сделать функцию поиска слов?

добавил поиск. обычный и через регулярные выражения. Нужно делать опцию "искать слово целиком"?


Уважаемый bolega, а где скачать исправленную версию? Или эти изменения войдут в следующую версию, которая выйдет позже?

Автор: bolega, Отправлено:16:27 17-07-2022


Цитата:
которая выйдет позже?

именно так

Автор: asku, Отправлено:18:25 17-07-2022

bolega

Есть выделять букву рамкой, то для занесения этой буквы (глифа) в библиотеку есть возможность задать этой операции горячую клавишу (пункт Add glyph to library).
Занести глиф в библиотеку можно и с помощью OCR (пункт Add symbol to glyph library) — тогда глиф уже бывает с готовым значением. Но к сожалению для данной операции нет возможности задать ей горячую клавишу. Нельзя ли это предусмотреть?



Добавлено:
Кстати, сейчас заметил, что СК некорректно присвоил значения глифам с помощью OCR. До этого вроде все нормально было. Сам текстовый слой тоже правильный. Странно...

Автор: bolega, Отправлено:19:46 17-07-2022


Цитата:
некорректно присвоил значения глифам с помощью OCR

По команде Add symbol to glyph library? или что имеется ввиду под значением?

Автор: asku, Отправлено:19:57 17-07-2022


Цитата:
По команде Add symbol to glyph library


Да.

Автор: asku, Отправлено:11:11 18-07-2022

bolega

А то, что СК, используя словарь Hunspell, правильно учитывает переносы, это благодаря каким-то особенностям Hunspell?


Автор: bolega, Отправлено:14:16 18-07-2022

asku
Нет, это СК учитывает перед отправкой слова в hunspell. Переносы также учитываются при поиске.
Да вы это могли заметить даже по работе команды Edit ocr word. Слова с переносом там отображаются слитно

Автор: asku, Отправлено:14:37 18-07-2022

bolega

А как СК это учитывает?
Дело в том, что я сделал hunspell-словарь для осетинской орфографии. Правда я пока собрал временный вариант -- просто собрал большой список слов в разных падежах и т.п., почти не применял hunspell’ских тегов.
И переносы в моем словарике СК не учитывает, да и слова не все видит. Может треть слов (может чуть больше) не видит, хотя они точно есть в dic-файле.

Автор: bolega, Отправлено:14:46 18-07-2022


Цитата:
А как СК это учитывает?

сливает слово в одно, как будто переноса нет.


Цитата:
И переносы в моем словарике СК не учитывает, да и слова не все видит.

ищите ошибку у себя или в своем dic-файле. СК просто подает на вход функции из libhunspell.dll искомый текст слова и получает результат поиска.

Добавлено:
те, которые не видит - сравните попарно код букв, входящих в слово. Может они разные, хоть и выглядят визуально похожими. А слова в вашем dic по алфавиту сортированы?

Автор: asku, Отправлено:15:08 18-07-2022


Цитата:
А слова в вашем dic по алфавиту сортированы?


Точно. Но там же используется та лигатура (ае -- здесь на форуме она неправильно отбражается, поэтому ее не пишу), так вот она при сортировке помещается последней, то есть алфавитный порядок такой:
а
б
в
...
ае.

Добавлено:
Сейчас заметил, что те слова (посмотрел три слова), которые СК не видит в словаре, в dic-файле прописаны с большой буквы, а в ocr в тексте они с маленькой. Может с этим связано.
Но ведь одно и то же слово может начинаться и с большой (в начале предложения) и с маленькой буквы.

Автор: bolega, Отправлено:15:28 18-07-2022


Цитата:
Но ведь одно и то же слово может начинаться и с большой (в начале предложения) и с маленькой буквы.

А может и нет, например, Воронеж.
Наверняка чтобы поиск в hunspell был not case sensitive, нужно какой-нибудь тэг задавать для слова.

Автор: asku, Отправлено:16:02 18-07-2022


Цитата:
Наверняка чтобы поиск в hunspell был not case sensitive, нужно какой-нибудь тэг задавать для слова.


Проконсультировался:

Если слово в словаре с маленькой буквы - то оно при проверке в тексте будет распознаваться корректно и с большой и с маленькой буквы. Если с большой - то корректным написанием будет только с большой.

Не знаю, может и проблемы с переносами в СК с этим связаны.

Автор: asku, Отправлено:20:05 18-07-2022

Сейчас в словаре везде прописные на строчные поменял и все получилось в СК. )

Добавлено:
bolega
А нельзя в новое версии в More2 внести в список языков и осетинский?

Автор: bolega, Отправлено:07:51 19-07-2022


Цитата:
А нельзя в новое версии в More2 внести в список языков и осетинский?

Насколько я знаю, его нет в тессеракт. Сокращенные трехбуквенные обозначения языков я беру именно из него, чтобы была полная совместимость с ним. Для FR без разницы, т.к. СК не управляет им напрямую. В принципе могу внести что-нибудь, только вы сами придумайте уникальное обозначение для него.

Автор: DmitryKz, Отправлено:07:59 19-07-2022


Цитата:
А нельзя в новое версии в More2 внести в список языков и осетинский?

bolega и греческий, пожалуйста.

Автор: TelecomUral, Отправлено:08:21 19-07-2022


Цитата:
Сокращенные трехбуквенные обозначения языков...только вы сами придумайте уникальное обозначение

помнится, обозначения языков прописаны в давнем международном стандарте. Как двух- так и трехбуквенные.

Автор: bolega, Отправлено:08:27 19-07-2022

TelecomUral
Тогда "oss"

Автор: asku, Отправлено:08:59 19-07-2022


Цитата:
Тогда "oss"


Да, oss.

https://ru.wikipedia.org/wiki/%D0%9A%D0%BE%D0%B4%D1%8B_%D1%8F%D0%B7%D1%8B%D0%BA%D0%BE%D0%B2

Автор: bearjrgm, Отправлено:12:32 19-07-2022

Привет, что я делаю не так? При вызове OCR из главного окна, что-то обрабатывается, но никаких новых файлов не наблюдается. При вызове OCR из окна результата все распознаётся и файлы появляются.

Автор: bolega, Отправлено:13:25 19-07-2022


Цитата:
что я делаю не так?

Уже обсуждали. Баг. Уже исправлен в следующей версии.

Автор: bearjrgm, Отправлено:14:07 19-07-2022

bolega
спасибо, зачит где-то пропустил обсуждение.

Автор: kamenkapenza, Отправлено:20:14 20-07-2022

Мои пожелания для следующей версии программе остаются прежними - возможность выбора папки и фиксации её в профиле для выходного файла djvu. Выходной файл формата djvu всегда по умолчанию идет в папку out. Поясняю полезность фиксации пути выходного файла.
Папка out постоянно удаляемая: получили готовый файл djvu и после этого рабочие файлы-сканы вместе с этой папкой удаляются. Для последующей работы нужно иметь постоянную папку (я, например,назвал "Создание книг", т.е рабочая папка, откуда все последующие программы будут брать исходник, т.е постоянная неудаляемая рабочая папка, в которую можно направлять выходной файл djvu для последующей работы. Это было бы очень удобно.
Как тут некоторые товарищи советовали постоянно перед созданием прописывать путь к рабочей папке.... Но всё можно сделать проще, если дать возможность фиксировать путь выходного файла в профиле.
Кому то это будет удобно ( не только мне), а во-вторых это будет одна из модификаций программы, отличающей её от предыдущей.

Это пожелания, а вопрос такой: можно ли отключить колесико мыши от перехода на последующий файл в списке файлов? Чтобы было понятно о чем идет речь, видеовопрос тут https://disk.yandex.md/i/KmNprWm3KHXmuA


Автор: TelecomUral, Отправлено:20:59 20-07-2022

оффтоп

Цитата:
и после этого рабочие файлы-сканы вместе с этой папкой удаляются

я после получения джву в Кромсаторе в обязательном порядке отсматриваю его во вьювере. В windjview extended есть команда меню "Save Copy as..." - и она запоминает путь к сохраняемому файлу-копии. То есть открыли дежавюшку, если всё ОК - то "save copy as" в вашу папку "Создание книг".

Автор: daa2013, Отправлено:10:00 21-07-2022


Цитата:
можно ли отключить колесико мыши от перехода на последующий файл в списке файлов


File - Options - Main win - Scroll files by wheel

Автор: kamenkapenza, Отправлено:18:32 21-07-2022

daa2013, большое спасибо!

Автор: kamenkapenza, Отправлено:21:15 21-07-2022

TelecomUral, спасибо за совет!

Автор: bolega, Отправлено:20:49 23-07-2022

Версия СК 6.8
https://workupload.com/file/5NUBzqGwNCq

Автор: shch_vg, Отправлено:22:44 23-07-2022

bolega
А в будущем появится возможность вставлять зону не в место, откуда она копировалась, а в место, указанное курсором?

Автор: asku, Отправлено:22:48 23-07-2022

bolega
Почему-то не получается подключить ocr. Новая (6.8) версия его не видит. Те же самые действия делаю в предыдущей версии, и там ocr виден. Странно.

На закладку OCR окошка Image adjustments добавлен функционал поиска текста по ocr-слою страниц. Функционал располагается на закладке Find.

А где находится закладка Find?

Автор: TelecomUral, Отправлено:06:24 24-07-2022


Цитата:
А где находится закладка Find?

там же где и Words

Автор: bolega, Отправлено:07:39 24-07-2022

shch_vg

Цитата:
А в будущем появится возможность вставлять зону не в место, откуда она копировалась, а в место, указанное курсором?

Было сделано в предыдущей версии, через хоткей.

asku

Цитата:
Почему-то не получается подключить ocr.

А как именно не получается?


Добавлено:

Цитата:
А где находится закладка Find?

Чтобы были видны все закладки, рекомендую в КМ закладок самой панельки Image adjustments включить multiline.

Автор: sirius12, Отправлено:11:09 24-07-2022

[b]bolega
Версия СК 6.8[/q]
Благодарим за новую версию, она стабильно работает на Windows XP как и версия 6.75.5, тогда как версия 6.71 порою выдавала сообщения об ошибках.

Автор: shch_vg, Отправлено:12:43 24-07-2022

bolega
Проверил загрузку файлов в СК для разных режимов.
Похоже, теперь загружается в нормальном порядке для экзотических наименований файлов, но возник вопрос, чем теперь отличается вариант Sort smart от Do not sort?
Не удалось найти никаких различий.

Автор: kamenkapenza, Отправлено:16:21 24-07-2022

bolega. большое спасибо за новую версию! Не успеещь с одной версией разобраться, как другая выходит ))

"MW: File > Options > View Result: новый параметр Scale. Увеличивает размеры всех визуальных элементов окна Result view в заданное"
Это хорошо, я про это говорил. Теперь значки команд можно будет сделать поболе, а то в такой куче не совсем было понятно, где какой.

Чтобы прикрепить Тессеракт в Кромсатору, что нужно сделать? Есть папка с установленной программой sk6.8. Есть папка (удалось раздобыть) tessdata2:
а) в разделе FILE - Profiles - Apps в строке Tesseract указать к какому то файлу папки tessdata2?
б) положить папку tessdata2 в папку sk6.8?
в) и то и это

В новой папке sk6.8 находятся всего три файла: md5, sk.6.8.whats.new и sk6.8. Чтобы программа задействовалась на полную мощь, что там ещё должно находиться?

Пожелания для версии 6.9:
1. Сделать фиксируемой в профиле пользователя настройки панели для обложки и цветных вкладок - Ecklusive page options.
Каждый раз нужно вводить данные (я всегда ввожу 600 дпи и 24 бит). Эти настройки всегда для каждого пользователя постоянны: кто-то делает в 300, кто-то в 600, но с одними и теми же параметрами для себя. Сделать по умолчанию в профиль свои параметры, а если нужно изменить, то вписать другие данные на месте.

2. Сделать во вкладке Ecklusive page options (или каким то иным образом) функцию обработки страниц с параметрами Ecklusive page options, т.е. обложки, форзацы и полностью цветные страницы. На практике как происходит? Ну,например, как делаю я. Смотрю, какой параметр установить для бинаризации ч/б страниц; если есть зоны выделяю зоны, устанавливаю параметры для зон и запускаю общую обработку. Т.е. обложки и форзаци пока игнорирую и обрабатываю скопом как ч/б страницы. Потом перехожу на полностью цветные страницы (обложки) и устанавливаю для них специальные параметры Ecklusive page options, и для каждой делаю переобработку. Была бы кстати команда обработки страниц с параметрами Ecklusive page options. Особенно это бы пригодилось, когда полностью цветных вкладок больше, чем две (в обычном случае). Нажать на кнопку специальной обработки, и все цветные страницы разом обработались.

Автор: asku, Отправлено:22:16 24-07-2022

bolega

Цитата:
А как именно не получается?

Делаю как обычно, как делал в предыдущей (6.75) версии.

Распознаю в ФайнРидер 15. Парсером создаю в папке out/ocr нужный файл.
В More2 указываю язык для всех страниц проекта.
Потом Result — OCR output files — All.

Открываю окно Result View и слова не выделяются рамочкой.
При этом в окошке Image adjustments/OCR/Words кнопка Analyse all работает.
Кнопка Doubtful words тоже работает, но при двойном щелчке на слово в списке Doubtful words ничего не происходит.

Тест-файл

Автор: daa2013, Отправлено:04:17 25-07-2022

-

Автор: TelecomUral, Отправлено:04:34 25-07-2022

asku
у меня ваш тест-файл открывается исправно, всё подсвечивается и по щелчку на слове в списке Doubtful words мышка к слову сама едет.
Вы, может, кнопочку "подсвечивать буквы" не нажали? Если её отжать, тогда да, всё перестаёт работать.

Добавлено:

Цитата:
Каждый раз нужно вводить данные (я всегда ввожу 600 дпи и 24 бит). Эти настройки всегда для каждого пользователя постоянны

далеко не всегда и не постоянны. У меня не так часто, но возникают сканы в 400дпи. А для серых вкладок можно и нужно не 24 бита лепить, а 8. Если же обработчик берёт сканы с разных источников, то медианные значения не определить вовсе. Ненужное усложнение интерфейса.


Цитата:
Сделать во вкладке Ecklusive page options (или каким то иным образом) функцию обработки страниц с параметрами Ecklusive page options ...
На практике как происходит? Ну,например, как делаю я...

не усложняйте себе жизнь переобработками, и такая функция не понадобится вовсе. Задали все настройки, прогнали обработку единожды.
Кроме того, для поднаборов файлов есть закладочка subsets и выделения красным (selected). Я когда-то с bolega даже поспорил, что фича subsets нафиг не нужна, и уже потом понял прелесть частичных наборов для сложных пакетов сканов.

+
Как я понимаю, для выделения в группу красных selected можно задать их поиск по "special DPI" и "special color" как раз из настроек кнопки "special..." . Пользоваться самому не приходилось.

Автор: bolega, Отправлено:08:01 25-07-2022

TelecomUral

Цитата:
Вы, может, кнопочку "подсвечивать буквы" не нажали?

Наверняка.
asku
И отсутствие подсветки (т.е. визуализация) это совсем не
Цитата:
не получается подключить ocr


kamenkapenza

Цитата:
Сделать во вкладке Ecklusive page options (или каким то иным образом) функцию обработки страниц

В опциях - функцию обработки?
Если вы задали особые опции, они и так учтутся при обработке всего задания, никакого повторного прогона ради этого не требуется.
На закладке main окошка exclusive options в КМ свободного пространства есть команда Book cover options. Она делает как раз то что надо: взводит особые значения для color, dpi и ignore gaps, а также отключает Enhance image на закладке Quality основных опций.

daa2013
Вы проверяли новый параметр scale на своем широком мониторе?




Добавлено:
В поиске обнаружил баг: для разворотов список найденного формировался неправильно. И соответственно подсветка не срабатывала.

Если получится, сделаю подсветку и поиск в MW. Чтобы можно было пользоваться в out-заданиях. Сейчас out-task использует ocr только если задано помещать его в pdf.

Автор: asku, Отправлено:08:12 25-07-2022


Цитата:
у меня ваш тест-файл открывается исправно, всё подсвечивается и по щелчку на слове в списке Doubtful words мышка к слову сама едет.
Вы, может, кнопочку "подсвечивать буквы" не нажали? Если её отжать, тогда да, всё перестаёт работать.


Точно! Спасибо.

А вы тестировали функцию find в новой версии?

а) У меня не ко всем найденным словам идет курсор после двойного щелчка.
б) И СК кажется не чувствует пробел. То есть, например если искать "оп " (оп с пробелом), то он ищет все «оп», независимо, есть ли после этого буквосочетания пробел или нет. В регулярных выражениях пробел обозначается как \s. Но этого обозначения СК кажется не знает.
в) И поле Start from работает неудобно. Хотелось бы, чтобы после того, как будет указано, что искать надо с 1-й страницы, это значение и оставалось при других поисках, пока не будет указано другое.
г) После того, как найдя нужное слово/букву я исправлю его и снова ищу это слово, то в списке найденных слов оно опять показывается, хотя уже исправленно (ошибочная буква заменена на правильную).
д) в списке найденных слов в самом начале строки идет указание страницы (?) — напр. p.8. Но 8 — это файл из которого получился уже обработанный скан. Удобнее же иметь обозначение порядкового номера обработанного скана.
е) bolega, а трудно было бы сделать возможность не только поиска, но и замены? То есть, например, я ищу все вхождения оп и последовательно (или автоматически, «скопом»), нажимаю кнопку «заменить», меняю на (например) он.

Добавлено:

Цитата:
В поиске обнаружил баг: для разворотов список найденного формировался неправильно. И соответственно подсветка не срабатывала.


Да-да.

Автор: bolega, Отправлено:08:13 25-07-2022

shch_vg

Цитата:
но возник вопрос, чем теперь отличается вариант Sort smart от Do not sort?

Отличаются. Но могут совпадать:
1) они в реальности совпадают
2) в Win10, в отличие от предыдущих версий, диалоги выбора списка файлов наконец-то нативно возвращают список в smart-сортировке. В остальном новые версии windows как были тупыми со времен 3.0 так и остались. И это при сегодняшнем то развитии AI. А вся мощь AI используется исключительно в меркантильных целях - навязать юзеру тагетированную рекламу, на большее ума не хватает.

Добавлено:
asku

Цитата:
И СК кажется не чувствует пробел.

Да, если он в конце и после уже ничего не задано, то для обычного поиска он отбрасывается. Исправлю.
Но для регулярных выражений и сейчас работает например такая конструкция: "в[ ]"
И еще в СК есть опция end of word, это универсальнее, т.к. тогда найдутся кроме "в " и например "в, " или "в. ".
Или вот как быть с последним словом на странице? Если задать опцию end of word, то найдется, а если искать с пробелом в конце, то нет. Или считать что после последнего слова на странице тоже пробел, как думаете?


Цитата:
Удобнее же иметь обозначение порядкового номера обработанного скана.

Сейчас так и есть. Просто для разворотов из-за бага не то показывается


Цитата:
После того, как найдя нужное слово/букву я исправлю его и снова ищу это слово, то в списке найденных слов оно опять показывается, хотя уже исправленно

а список найденного после предыдущего поиска почистили?


Цитата:
И поле Start from работает неудобно. Хотелось бы, чтобы после того, как будет указано, что искать надо с 1-й страницы, это значение и оставалось при других поисках, пока не будет указано другое.

Здесь алгоритмическая сложность. Если там будет всегда "1", то как СК поймет что по команде find next ему нужно продолжать поиск с последней найденной страницы, а не с той, которая задана в start from. И наоборот, если на какой-то странице захотите возобновить поиск с начала, а не с текущей позиции, как сказать об этом СК? Ведь единственное поле для этого - start from всегда содержит одно и то же к примеру "1".
Ну либо вообще убирать кнопку с командой find next, оставить только find all, тогда неопределенности не будет.
Чтобы упростить я и добавил две кнопки для быстрого присвоения start from значения "1" или текущей страницы.

Автор: TelecomUral, Отправлено:09:15 25-07-2022


Цитата:
asku
А вы тестировали функцию find в новой версии?

нет.

[more=оффтоп]Сейчас пока время на сканы в хорошем качестве уходит: Немировского "Изобретение Иоганна Гутенберга" купил. Вообще с весны долгов сканировочных много держится около рабочего стола. Авось в августе разгребу.[/more]


Добавлено:

Цитата:
Или считать что после последнего слова на странице тоже пробел, как думаете?

не-не-не это фантазии

Автор: bolega, Отправлено:09:58 25-07-2022

asku

Цитата:
В регулярных выражениях пробел обозначается как \s. Но этого обозначения СК кажется не знает.

В СК пробел - это пробел " ", смысла в дополнительном "\s" нет.

Добавлено:

Цитата:
не-не-не это фантазии

ну хуже то не будет. Пробел можно не добавлять, если в конце перенос. Впрочем, обычно последнее слово - это номер страницы.

P.S. СК знает только про буквы и слова. Про все остальное (предложения, абзацы, шрифты и т.п.) он не знает.

Автор: daa2013, Отправлено:10:12 25-07-2022


Цитата:
Вы проверяли новый параметр scale на своем широком мониторе?


Первым делом

Стало лучше. Остановился на 1.3

Я еще высказывал пожелание, чтобы можно было сделать пользовательскую панель с совсем гигантскими кнопками (2+), куда дублем помещать те кнопки, что постоянно в работе.
(У меня это - метелки, режим замены символов, режим качественного отображения, сетка.)
Это заодно сняло бы проблему мешающихся рядом "ненужных" кнопок типа ластика.

Для них картинку в центре можно раза в два увеличить.

Автор: TelecomUral, Отправлено:10:35 25-07-2022


Цитата:
чтобы можно было сделать пользовательскую панель с совсем гигантскими кнопками

оу! а что, так разве можно?? Я давно мечтаю о такой панели, но считал что сгенерировать панельку именно под мои настройки невозможно технически. Только сделать универсальную плашку со всеми кнопками и ненужные отключать, что некрасиво и нефункционально. Соответственно и не запрашивал никогда. Вроде ведь даже частная переписка была про это. А так да, было бы удобно, а то я из стандартного интерфейса VR пользуюсь пятью-семью кнопками, и их пока найдешь и ткнешь - ...

Автор: bolega, Отправлено:11:20 25-07-2022

TelecomUral

Цитата:
что, так разве можно??

пока нет


Цитата:
а трудно было бы сделать возможность не только поиска, но и замены? То есть, например, я ищу все вхождения оп и последовательно (или автоматически, «скопом»), нажимаю кнопку «заменить», меняю на (например) он.

Да вроде не трудно.
Только так: заменять отдельной командой после поиска, и только в тех строчках списка найденного, напротив которых галочки будут.
Так будет безопаснее и под контролем.
Ну и количество букв менять нельзя. Пока так.

И по поводу неизменности start from. Сделаю компромиссно: по команде find all меняться не будет (ничего не потеряется от этого), по команде find next - меняться будет, иначе не поймешь, где сейчас текущая позиция начала поиска. Я ведь по просьбе TelecomUral отвязал start from от текущей активной страницы, что в общем-то нетипично для поиска, но зато гибче

Автор: asku, Отправлено:12:12 25-07-2022


Цитата:
Только так: заменять отдельной командой после поиска, и только в тех строчках списка найденного, напротив которых галочки будут.
Так будет безопаснее и под контролем.


Отлично!

Еще такой вопрос.


Когда меняю букву в слове, то после нажатия кнопки Accept список букв обновляется и сортируется заново. А нельзя отключить сортировку? То есть, чтобы буквы без галочек продолжали оставаться наверху.

Добавлено:
bolega

Еще пожелание, если можно.
Когда нажимаю на «Поиск везде» (см. картинку), то нельзя ли сделать возможность остановки поиска кнопкой Esc?


Автор: bolega, Отправлено:13:37 25-07-2022

asku

Цитата:
нельзя ли сделать возможность остановки поиска кнопкой Esc?

Вчера как раз сделал )

Автор: sirius12, Отправлено:15:59 25-07-2022

У меня такой вопрос, как у начинающего цифровальщика книг: многие делают, как я понял из комментариев, очень большие и хорошие книги, а потому куда вы деваете свои работы? Дома храните или выкладываете на сайты, чтобы другие могли читать эти книги? Я спрашиваю потому, что не хотелось бы, чтобы труд пропадал зря, а им могли пользоваться другие, тем более, что сейчас покупать книги на бумаге стало не под силу многим. Да и самому хочется увидеть отличные работы мастеров этого дела. Спасибо тем, кто ответит

Автор: TelecomUral, Отправлено:16:03 25-07-2022

[more=оффтоп]publ.lib.ru[/more]

Автор: asku, Отправлено:16:09 25-07-2022


Цитата:
а потому куда вы деваете свои работы?


Ссылка 1
Ссылка 2

Ну и на торренте (рутрекер) выкладывал.

Автор: sirius12, Отправлено:18:37 25-07-2022

[more] [TelecomUral

Цитата:
publ.lib.ru

asku

Цитата:
Ссылка 1
Ссылка 2
 Ну и на торренте (рутрекер) выкладывал.

Благодарю Вас всех за ответ. И в связи с этим, еще вопрос: почему не выкладываете свои работы на Флибусте? Сейчас это самая богатая библиотека, в которой можно найти практически то, что невозможно найти в библиотеках, указанных Вами. Рутрекер стал очень беден по части литературы. В publ.lib.ru я, например, не смог найти Майн К-ф, а только книги о нём, Протоколы сионских мудрецов только OCR текст. Лично я люблю читать книги в DjVu или PDF, они вызывают больше доверия, чем OCR, потому что его надо тщательно проверять. Ссылки уважаемого asku – это ВКонтакте, туда надо регистрироваться, чтобы зайти. А у меня принцип: никаких соцсетей! На Флибусте же я нашёл Протоколы в DjVu, причем как в плохом качестве, сделанном фото с подлинной книги из библиотеки, так и уже кем-то обработанной в СК. Не говоря уже о полном сочинении Л.Н.Толстого – там скачал без проблем все 90 томов и сейчас почитываю их с удовольствием, причем отличного качества в PDF.

Так что работы уважаемого asku я просмотреть не смог, уж больно он сильно засекретился в ВКонтакте…

Поэтому призываю вас всех выкладывать свои мастерские работы на Флибусте, не пожалеете! Публика там своеобразная, получите комментарии на книги, которые выкладываете очень разнообразные, но, главное во Флибусте – это богатство книг любого сорта, и, практически, их там не цензурируют, потому что эта библиотека построена по принципу Википедии – каждый выкладывает всё сам и сам редактирует.
[/more]

Автор: VadimirTT, Отправлено:19:13 25-07-2022


Цитата:
а потому куда вы деваете свои работы?

libgen

Автор: daa2013, Отправлено:19:37 25-07-2022


Цитата:
пока нет


Можно сделать их жёстко в два раза крупнее обычных.
И сажать такую панель в два ряда:

https://disk.yandex.ru/i/wwuuxYiogFBAFg

UPD
а можно еще и в три.

тогда получится что в опциях выбирается масштаб обычных. И выбор между тем, в 2 или 3 раза больше них кнопки-гиганты.

Автор: kamenkapenza, Отправлено:20:46 25-07-2022


Цитата:
На закладке main окошка exclusive options в КМ свободного пространства есть команда Book cover options. Она делает как раз то что надо: взводит особые значения для color, dpi и ignore gaps, а также отключает Enhance image на закладке Quality основных опций.
 

bolega
Понял.Спасибо!

Автор: sirius12, Отправлено:20:54 25-07-2022

VadimirTT

Цитата:
libgen

Впечатляет, качество книг очень высокое, и это подлинное мастерство. Мне понравился адрес: https://ru.de1lib.org/
Но книги Эрика Дьюбэа «Заговор Атлантов», найти не смог, зато Майн К-ф есть.
Но в целом хочу сказать, что поиск у них в сравнении с Флибустой, очень неудачный. Трудно найти быстро то, что тебе надо.
Но благодарю Вас за эту ссылку.

Автор: kamenkapenza, Отправлено:20:54 25-07-2022


Цитата:
У меня такой вопрос, как у начинающего цифровальщика книг: многие делают, как я понял из комментариев, очень большие и хорошие книги, а потому куда вы деваете свои работы? Дома храните или выкладываете на сайты, чтобы другие могли читать эти книги? Я спрашиваю потому, что не хотелось бы, чтобы труд пропадал зря, а им могли пользоваться другие, тем более, что сейчас покупать книги на бумаге стало не под силу многим. Да и самому хочется увидеть отличные работы мастеров этого дела. Спасибо тем, кто ответит


Миркниг.су и Литгу.ру. Кроме современных выкладывается очень много дореволюционных и советских книг разной тематики. Сайты одного владельца,первый сайт в блокироке https://mirknig.su/ (входить через расширение броусек), второй https://litgu.ru/ открытый

Автор: niccolo, Отправлено:21:02 25-07-2022

Для иноязычной литературы - archive.org вне конкуренции...

Правда качество там очень часто не ахти, а нередко и вообще полный ППЦ, и, самое смешное, под лэйбой - Оцифровано гуглом....

Новейшая русскоязычная литература - только трекеры...

Автор: daa2013, Отправлено:21:15 25-07-2022

Друзья,

это всё тут злостный оффтоп. Идите в соответствующую ветку:

Ссылки на электронные библиотеки книг (libraries)
http://forum.ru-board.com/topic.cgi?forum=93&topic=0277&start=900#lt


Обратите внимание и на другие ветки среди Ebookz ("Книгообменник", "Книги" и т.п.)
http://forum.ru-board.com/forum.cgi?forum=93

Автор: TelecomUral, Отправлено:21:25 25-07-2022


Цитата:
daa2013
Идите в соответствующую ветку.

это куда?? по-моему, не существует стандартной/общеизвестной интернет-страницы "куда мне сходить за е-книгой". Я именно поэтому посчитал возможным оффтопить тут. Злостно, да.

UPD

[more=оффтоп2 для sirius12]
Цитата:
И в связи с этим, еще вопрос: почему не выкладываете свои работы на Флибусте?

потому что безответственная помойка. каждый делает как считает нужным. а это быстро приводит к наихудшему среднестатистическому.

Вообще говоря, ваш вопрос не "куда выкладываете", а "где бы мне взять все мне нужное в одном месте". Это во-первых две большие разницы и во-вторых, огромная матерная переписка, содержащая крупицы истины, была пару лет назад в ветке "Книгообменник" http://forum.ru-board.com/topic.cgi?forum=93&topic=2861&glp
[/more]

Автор: bolega, Отправлено:07:48 26-07-2022

TelecomUral
Бот устроил опрос. А вы и распинаетесь как дети малые

Автор: TelecomUral, Отправлено:07:52 26-07-2022

bolega
может быть, может быть... но в ветке утилит NME он тоже чего-то там умное написал насчет ФР12. А зачем, если это бот - ?

upd
современная молодежь часто настолько тупа и бедна лексиконом, что нетрудно принять за недоделанного робота

Автор: bolega, Отправлено:07:56 26-07-2022

Да вы посмотрите его ответ VadimirTT, да и другие тоже, человек так не будет писать на форуме

Автор: sirius12, Отправлено:11:03 26-07-2022

[more] [more]niccolo

Цитата:
Для иноязычной литературы - archive.org вне конкуренции...


Цитата:
Новейшая русскоязычная литература - только трекеры...

Друзья, Вы очаровательны! Теперь я доволен! Честно признаться, иноязычная литература меня не очень волнует, потому что надо знание языков хорошее. А новейшая русскоязычная литература – полный абсурд и извращение нравов, поэтому полностью игнорирую её. Предпочитаю только старые книги (до создания России), и, конечно, приятно, когда они сделаны мастерски: это уже не только интересная книга по содержанию, но и собственно произведение цифрового искусства. Когда я вижу такие книги, то невольно сам желаю, чтобы научиться делать также прекрасно и выкладывать их в другие библиотеки, но я предпочитаю Флибусту, потому что там всё очень просто как для загрузки книг на их сервера, так и скачивания желаемой книги… Во всяком случае, еще раз благодарю всех за ответы, они прекрасны, и не считайте это оффтопом, потому что «скакать» по веткам ради этого – жизнь не из лучших. А тут всё сделали сразу и в лучшем виде! Теперь буду ждать версию 6.9, как я понимаю, и считаю, что версия 6.хх – очень и очень удачная.
Признаюсь, что мне не очень понятна политика уважаемого asku, работы которого так и не смог увидеть, чтобы оценить его мастерство и научиться у него многому, - который для оцифровывания книг использует очень ограниченную программу другого автора. Зачем это делать, если SK обрезает странички и выравнивает их очень и очень замечательно, только надо уметь пользоваться грамотно всеми его инструментами, предназначенными для этого. После SK я удалил из своих архивов всякие иные программы подобного рода, в том числе и ту, что использует уважаемый asku.
Еще одно пожелание: asku! Создайте доступный для всех сайтик, чтобы увидеть Ваши прекрасные работы! Поверьте, заходить на соцсети, - надо регистрироваться, а это значит, что будешь всегда под колпаком у Мюллера!

Добавлено:
TelecomUral

Цитата:
потому что безответственная помойка. каждый делает как считает нужным. а это быстро приводит к наихудшему среднестатистическому.
Вообще говоря, ваш вопрос не "куда выкладываете", а "где бы мне взять все мне нужное в одном месте". Это во-первых две большие разницы и во-вторых, огромная матерная переписка, содержащая крупицы истины, была пару лет назад в ветке "Книгообменник" http://forum.ru-board.com/topic.cgi?forum=93&topic=2861&glp

Я с Вами полностью согласен! Но, в этих недостатках есть и плюсы. Действительно, в поисках нужного натыкаешься на ужасно плохие работы. И вот тут-то начинают чесаться руки, чтобы это уродство исправить и довести до возможного совершенства, используя SK. Потом снова выкладываешь обновлённую книгу, старую оставляешь для сравнения, и люди начинают качать обновленную книгу и благодарят даже, бывает и с матерным.
Насчет матерного. Когда я к ним пришел, то прямо написал администрации, что это позор и дискредитирует библиотеку. Они восприняли это, и матерщина практически исчезла, но грубость, некоторая, остается. Но, что поделаешь, такое население в России. Но за отличные работы, там щедро благодарят ценители книги. Поэтому я и люблю Флибусту! А на ЛГ я так и не понял, как надо выкладывать свои цифровые работы... А то тоже бы стал делать это. [/more]


Добавлено:
TelecomUral

Цитата:
это куда?? по-моему, не существует стандартной/общеизвестной интернет-страницы "куда мне сходить за е-книгой". Я именно поэтому посчитал возможным оффтопить тут. Злостно, да.

Вот что значит - наш Человек!

Добавлено:
Еще одно пожелание: asku! Создайте доступный для всех сайтик, чтобы увидеть Ваши прекрасные работы! Поверьте, заходить на соцсети, - надо регистрироваться, а это значит, что будешь всегда под колпаком у Мюллера!
[/more]

Автор: asku, Отправлено:12:09 26-07-2022

bolega а в меню File пункт Save task... вы намеренно поменяли на Save task as... ? Не очень удобно стало.

Автор: kamenkapenza, Отправлено:12:09 26-07-2022


Цитата:
publ.lib.ru

Эта библиотека, к сожалению, уведает, я её всю скачал, и регулярно качаю ежемесячные обновления. Раньше там каждый месяц были выкладки по пару сотен книг. Теперь за последние месяцы (даже не стали делать помесячно, а объединили три последних месяца в один): май-июль кот наплакал, за июль не выложено ни одной книги. Видимо друзей у создателя библиотеки становится всё меньше и меньше, так как выкладывать туда можно только по блату.


Автор: sirius12, Отправлено:12:19 26-07-2022

kamenkapenza

Цитата:
Эта библиотека, к сожалению, уведает, я её всю скачал, и регулярно качаю ежемесячные обновления. Раньше там каждый месяц были выкладки по пару сотен книг. Теперь за последние месяцы (даже не стали делать помесячно, а объединили три последних месяца в один): май-июль кот наплакал, за июль не выложено ни одной книги. Видимо друзей у создателя библиотеки становится всё меньше и меньше, так как выкладывать туда можно только по блату.

Совершенно с Вами согласен. Поэтому, много раз посетив её, и попытавшись найти нужное, с очень малым успехом, я полюбил Флибусту.
Вопрос к Вам: и Вы все сотни книг, которые скачиваете, успеваете за месяц прочитать? Если это так, то похоже на прочтение материала в летние каникулы школниками советских школ по заданию учителей...

Автор: kamenkapenza, Отправлено:12:27 26-07-2022

sirius12, надо завязывать с этими крамольными разговорами ( не по теме), а то "прилетит эцилоп и трансклюкирует на хрен". Я уже попадал в эцих с гвоздями на несколько месяцев, не очень то и хотелось оказаться там повторно и на более длительный срок, а то и пожизненно, так как имею большой интерес к программе и всем разъяснениям автора и специалистов.

Автор: bolega, Отправлено:12:28 26-07-2022

asku

Цитата:
Не очень удобно стало.

Неудобно что?
Действие то по команде осталось прежним, ничего не поменялось, в названии прибавилось "as". Вы точно не робот? ))

Автор: kamenkapenza, Отправлено:12:32 26-07-2022

bolega
Мне так кажется, что "as" применяют в случае, когда файл на выбор может сохраняться в разных форматах,а здесь простое сохранение задания, так что просто "Save task". Если вы считатете, что надо Save task as, пусть будет так. Я точно не робот)).

Автор: asku, Отправлено:12:54 26-07-2022


Цитата:
Вы точно не робот?


Я? Я не робот. Почему действие осталось прежним. Когда таск только создается, то и в том и другом случае действие одно — открывается диалоговое окно для указания пути и названия таска.
Но когда таск уже есть, и в процессе работы я нажимал на Save task, то СК просто сохраняла изменения в таске, без открытия окна. Сейчас оно постоянно открывается. Может быть сохранять постоянно нет особого смысла, но у меня это уже на уровне рефлекса. Я и работая в Word постоянно жму на «Сохранить...».

Еще такое наблюдение. Заношу букву в глиф-лайбрери и редактирую ее, предварительно нажав на кнопочку редактирования (см. картинку)


Так вот для появления изменений в глифе нужно еще раз нажать на эту кнопку. Так задумывалось?

Автор: sirius12, Отправлено:13:01 26-07-2022

kamenkapenza

Цитата:
sirius12, надо завязывать с этими крамольными разговорами ( не по теме), а то "прилетит эцилоп и трансклюкирует на хрен". Я уже попадал в эцих с гвоздями на несколько месяцев, не очень то и хотелось оказаться там повторно и на более длительный срок, а то и пожизненно, так как имею большой интерес к программе и всем разъяснениям автора и специалистов.

Но ведь Вы написали очень интересный комментарий, я лишь, увидев оригинальность в нем, решил обучиться у Вас потрясающему скорочтению книг. Так за что же мне полагается эцих с гвоздями? Странное какое-то у Вас законодательство! Я думаю, что Вы неправы.

Автор: bolega, Отправлено:13:05 26-07-2022


Цитата:
и в процессе работы я нажимал на Save task, то СК просто сохраняла изменения в таске, без открытия окна

Да ладно. Окно всегда было. Возьмите любую предыдущую версию и проверьте.
А если бы вы еще читали whatsnew, то и вопросов бы не было.

Добавлено:

Цитата:
Так задумывалось?

да, либо выбрать другой глиф в списке.

Автор: sirius12, Отправлено:14:21 26-07-2022

[more] [more] kamenkapenza

Цитата:
Миркниг.су и Литгу.ру. Кроме современных выкладывается очень много дореволюционных и советских книг разной тематики. Сайты одного владельца,первый сайт в блокироке https://mirknig.su/ (входить через расширение броусек), второй https://litgu.ru/ открытый  

Честно признаться эти книжные сайты создают у меня жалкое впечатление: они, по сути, одинаковые во всем, кроме интерфейса и названия, и блокировки одного из них; книги хранятся на файлообменника, которые сейчас уже не вызывают доверия, поскольку по истечении времени содержимое удаляется, и ссылка не работает, т.е. у этой библиотеки нет собственных серверов; очень много пошлой и неприятной рекламы о, так называемых, публичных людях, которых порядочные люди не просто не уважают, а презирают. Пока просматривал этот сайт «Литературный гуру», настолько был измотан психологически всей этой рекламой, что решил посещать его только в крайних случаях. Флибуста всех этих недостатков лишена: имеет свои сервера, никакой рекламы и тупых лиц «звезд». [/more]

Добавлено:
Разобрался с ZLibrary, круто у них всё сделано. И понял, как к ним можно загружать книги. Спасибо ещё раз всем. Вот что делает шестая версия SK даже лучшие библиотеки книг позволяет отыскать страждущему!!! [/more]

Автор: asku, Отправлено:15:42 26-07-2022

bolega


Цитата:
СК учитывает перед отправкой слова в hunspell. Переносы также учитываются при поиске.  
Да вы это могли заметить даже по работе команды Edit ocr word. Слова с переносом там отображаются слитно


Все-таки слова с переносом у меня слитно не отображаются...


Автор: Maz, Отправлено:16:56 26-07-2022

Оффтоп и флуд закончили!

Автор: bolega, Отправлено:07:52 27-07-2022


Цитата:
Все-таки слова с переносом у меня слитно не отображаются...

Это потому что FR распознал их как обычное тире (дефис), а не как переносы. Для переносов у него другой символ зарезервирован, я на него и ориентируюсь. Вы кстати в КМ над тире можете заменить на символ FR-переноса и тогда увидите разницу.
Вопрос с этим неоднозначный. Я уже думал над тем, как можно поменять тире на перенос. Как сейчас, по одному, трудоемко. Может, выделить край текста, и для него команду типа "все тире внутри выделения заменить на переносы".
Вот для тессеракта я это автоматически делаю, т.к. в нем специального символа для переноса не предусмотрено, поэтому там другого способа и нет.
Интересно, что FR-символ переноса на самом деле обозначает отрицание. Его нет в списке символов, которые используются для переноса, согласно wiki

Автор: TelecomUral, Отправлено:11:58 27-07-2022


Цитата:
Я уже думал над тем, как можно поменять тире на перенос

имхо, надо тестировать будущее слово на словарность.

Автор: shttd, Отправлено:15:05 27-07-2022

Для "Режима замены распознанных символов" шорткат отсутствует?

Автор: asku, Отправлено:18:25 27-07-2022


Цитата:
Может, выделить край текста, и для него команду типа "все тире внутри выделения заменить на переносы".


Вы имеете в виду, что это можно было бы реализовать в новой версии? Сейчас же замены нет. Было бы очень хорошо!
По одному дефисы в конце строки менять на знак переноса, конечно, утомительно.
FineReader видимо правильно расставляет дефисы и переносы в текстах, языки которых имеют словарную поддержку. Как внедрить такую поддержку в FR не знаю, к сожалению.

Автор: fanfan1, Отправлено:19:28 27-07-2022

asku
А Вы не пробовали для исправления текстового слоя, сделанного в FR использовать программу FR11+ DjVu Text Layer Crutch версии 0,3,3, она имеется на этом форуме. Я теперь только ей пользуюсь, чотбы внедрять OCR в DjVu, сделанные Лизардом, результат потрясающий! FR11+ имеет очень высокий уровень распознавания, особенно в языках со словарной поддержкой. Не знаю, как вы все, но я провел сравнение распознавания одного и того же текста Тессарактом и FR12 и 15, и последние программы имеют значительно меньший процент ошибок.

Автор: asku, Отправлено:19:40 27-07-2022

fanfan1
Так чтобы СканКромсатор правильно воспринял текстовый слой ФР с помощью парсера, никаких действий над ним (слоем) делать нельзя. Видимо, в том числе нельзя программой DjVu Text Layer Crutch.

Автор: fanfan1, Отправлено:20:10 27-07-2022

asku

Цитата:
Так чтобы СканКромсатор правильно воспринял текстовый слой ФР с помощью парсера, никаких действий над ним (слоем) делать нельзя. Видимо, в том числе нельзя программой DjVu Text Layer Crutch.

Но вся суть заключается в том, что эта программа не уродует слой, а исправляет ошибки переносов, делая текст без переносов. А Вы попробуйте, но сначала изучите инструкцию к этой программе, она тоже есть, и Вам всё будет понятно. Думаю, что после исправления соля OCR, и внедрив его в тот же самый файл, а не другой, сможете парсером всё сделать. Хотя, я может быть ошибаюсь, потому что Вы используете не OCR в DjVu, сделанный FR, а сам текстовый слой, еще никуда не внедренный FR, Тогда у вас у всех много проблем…

Добавлено:
asku
Кстати, а Вы какой программой делаете DjVu?
В любом случае, с программой DjVu Text Layer Crutch Вам намного легче и качественнее будет делать распознавание, чем с парсером (этот парсер – тёмная лошадка).

Автор: asku, Отправлено:21:02 27-07-2022


Цитата:
Кстати, а Вы какой программой делаете DjVu?

СканКромсатором.

Автор: starter53, Отправлено:23:15 27-07-2022

[more] [more]Тупой кретин и идиот модератор Maz заблокировал два моих аккаунта: Сириус12 и Фанфан1, поэтому, видимо, больше помогать никому не смогу! Этому идиоту модератору Мазаю надо быть главой государств, тогда весь народ будет прыгать от счастья. И вот такие сволочи, стоят хоть где-то, но у власти! Даже заблокировал отправку сообщений, в том числе, и администрации![/more]

asku

Цитата:
СканКромсатором.

Разницы никакой. Делайте из полученных сканов DjVu в SK, затем эти же сканы используйте для создания этой же книги в PDF и DjVu в FR. DjVu пойдет для извлечения текстового слоя и затем вставления в DjVu, созданного SK, а в PDF создаете закладки (используйте для этого скриншотридер FR), которые затем легко переносятс в DjVu, созданного в SK. Результат будет потрясающий, особенно распознавания, Вы сами это заметите, когда сравните копирование в DjVu, созданном в FR и DjVu, созданном в SK. Я этим пользуюсь давно, счастлив, а парсер - это занятие для садомазохистов, как и Тессеракт.
С уважением, Сириус12 и Фанфан1 [/more]

Автор: NME, Отправлено:01:05 28-07-2022

asku
результаты распознания текста файнридером кромсатор берет из простого текстового файла result.bookmarks, который можно править любым текстовым редактором.. для замены дефиса на знак переноса нужно открыть этот файл в редакторе, позволяющем производить поиск и замену текста, в поле "что искать" вписать "- " (тире + пробел), а в поле "чем заменить" вписать нужный символ + пробел.. важно, чтоб количество символов не изменилось.. нажимая кнопки "найти далее" и "заменить" заменяем тире на перенос в нужных местах.. кнопку "заменить всё" я бы поостерёгся жать, т.к. в этом случае замены могут произойти и в тех местах, где этого не надо делать.. хотя, сделав бэкап можно поэкспериментировать с этим - вдруг результат будет удовлетворительным))

Автор: niccolo, Отправлено:10:11 28-07-2022


Цитата:
По одному дефисы в конце строки менять на знак переноса, конечно, утомительно.


А что мешает сделать это в ФР? Минус - сольются слова с дефисами.


Цитата:
Как внедрить такую поддержку в FR не знаю, к сожалению.

Если версия легальная - напишите в контору, которая вместо Абби по России. Может подскажут

NME

А что станет с координатной привязкой символов которая так важна для SK, после правки в любом текстовом редакторе7

Автор: bolega, Отправлено:10:46 28-07-2022

NME
Я правильно понимаю, что djvu вьюеры в отличие от акробат, не учитывают при поиске мягкие переносы? И единственный способ учесть, это применить вашу утилиту DjVu Text Layer Crutch?



Добавлено:

Цитата:
А что станет с координатной привязкой символов которая так важна для SK, после правки в любом текстовом редакторе7

ничего не станет, координаты то не изменятся

Автор: asku, Отправлено:12:59 28-07-2022

NME:
Цитата:
результаты распознания текста файнридером кромсатор берет из простого текстового файла result.bookmarks, который можно править любым текстовым редактором.. для замены дефиса на знак переноса нужно открыть этот файл в редакторе


bolega

А где еще хранятся файлы *.bookmarks ?
Они в out/ocr. Но я сейчас в одном месте исправил в СК кнопкой мыши дефис с пробелом (в скане он в конце строки) на мягкий перенос, закрыл СК. И в соответствующем файле bookmarks ничего не поменялось. Может СК их еще куда-то копирует?

Автор: bolega, Отправлено:13:30 28-07-2022

asku

Цитата:
А где еще хранятся файлы *.bookmarks ?

После команды ocr эти файлы больше СК не нужны, все необходимое он переносит во внутренний формат focr- или tocr-файлов (они отличаются только расширением, все остальное идентично по структуре). Это позволяет абстрагироваться от ocr-движка. Правка букв отражается только на focr/tocr.
Кстати, в новой версии СК заменить дефис на перенос стало совсем просто, без всяких выделений, сначала поиск дефиса с опцией end of the word или end of the line. Затем замена на символ переноса.
Вы только скажите сразу, нужен ли вам функционал замены внутри СК, или обойдетесь работой с текстовыми файлами. Если особо не нужен, я тогда буду делать очень не спеша, т.к. вообще то планировал выпускать следующую версию СК не раньше декабря. Только из-за ваших хотелок (впрочем, и к несчастью, интересных) приходиться до сих пор возиться, хотя мне уже хочется отдохнуть от СК, надоело и устал ))

Автор: asku, Отправлено:14:02 28-07-2022

Вы только скажите сразу, нужен ли вам функционал замены вну-три СК, или обойдете-сь работой с текстов-ыми файлами.

Очень нужен!!

Насчёт хотелок вообще — у меня сейчас есть время потестировать новую версию СК, и я сейчас этим пользуюсь, обрабатываю сканы, заодно с разными функциями экспериментирую )

Автор: NME, Отправлено:14:26 28-07-2022

bolega

Цитата:
Я правильно понимаю, что djvu вьюеры в отличие от акробат, не учитывают при поиске мягкие переносы?

Это зависит от конкретного вьювера.. В своём форке WinDjview Extended я специально делал подобную фичу - в окне поиска нужно отметить чекбокс "игнорировать переносы", тогда программа при поиске будет "склеивать" слова со знаком переноса или дефиса в конце строки со следующим словом.. В оригинальном WinDjview такой функции нет, за другие вьюверы не скажу, скорее всего тоже нет..

Цитата:
И единственный способ учесть, это применить вашу утилиту DjVu Text Layer Crutch?
НМЭдитор тоже так может))
А вообще склейка слов, как мне кажется, нужна больше не для поиска, а для более корректного копипаста)) ну, для кого-то, кто не юзает Extended, для поиска тоже пригодится))

Автор: asku, Отправлено:21:50 28-07-2022

bolega

Еще такие пожелания, если реализовать несложно.


В глиф-лайбрери (левая стрелка) очень удобная штука была бы — сортировка глифов в алфавитном порядке с помощью ПКМ.

В поле поиска в новой функции (правая кнопка) в контекстном меню только Paste и Copy, и нет Cut и Delete, к сожалению.

Автор: daa2013, Отправлено:02:33 29-07-2022


Цитата:
bolega а в меню File пункт Save task... вы намеренно поменяли на Save task as... ? Не очень удобно стало.


Хочу присоединиться к мнению asku, что стало хуже.

Save as используется, когда меняется тип файла. Если меняется только имя, то обычно Save (и при желании, можешь там внутри имя сменить.)
Так как никаких новых типов файлов заданий не введено, то это запутывает.


Сохранил новой задание в последнем SK и прямо аж прифиге сильно удивился.

Автор: TelecomUral, Отправлено:06:19 29-07-2022


Цитата:
Хочу присоединиться к мнению asku, что стало хуже.

народ, вы чего?? Полностью адекватная логика введена, прочтите whatsnew. Сами же хотели кнопку мгновенного сохранения без вопросов, ровно её и получили через допопцию.
(а я вообще только кнопку жал всегда, меню не пользовался)

Автор: DmitryKz, Отправлено:06:28 29-07-2022


Цитата:
Save task as...

Вероятно, bolega имел в виду, что данный пункт меню позволяет указать не столько тип файла, а сколько где именно на компе и под каким именем сохранить файл задачи. Если так, то as тут, насколько понимаю, вполне уместен — "сохранить задачу, как имеющую имя такое-то".


Добавлено:
Вот, например, вполне серьезная программа, Marmoset Toolbag, по Save Scene As... сохраняет только один тип файла:


Автор: daa2013, Отправлено:07:15 29-07-2022

Тогда должна одновременно быть команда Save task, которая ничего не меняет, а просто сохраняет.
В приведенном примере она есть. (просто Save Scene).


Upd

Во первых, когда команд две, они должны идти как в остальных программах:
Save task
Save task as...

а не наоборот.

Во-вторых, если уж так сделано, то я бы их всегда две и демонстрировал и вторую не отключал.

В-третьих, если демонстрируется только одна, то я бы ее называл как и ранее Save task ...

Сейчас же как-то сильно непривычно. И не как в СК раньше, и не так, как в других прогах.

Автор: DmitryKz, Отправлено:07:28 29-07-2022


Цитата:
должна одновременно быть команда Save task,   которая ничего не меняет, а просто сохраняет

Абсолютно правы. Иначе выглядит несколько коряво, неискушенному взгляду вообще непонятно, о Save чего идет речь.

По поводу офиса — увы, у меня такого не получается. Создаешь (Word 2021) новый документ, нажимаешь Save, подсвечивается ниже расположенная Save As и то же самое диалоговое окно Save As появляется. То есть это просто перенаправление на кнопку Save As. Открываешь существующий — действует без всяких диалоговых окон. Может, в каких-то прежних версиях так было, как вы описываете, но я этого уже не помню.

Автор: daa2013, Отправлено:07:33 29-07-2022


Цитата:
увы, у меня такого не получается

Я почти сразу исправил. Вы тут правы, я сначала некорректно указал.

Автор: TelecomUral, Отправлено:09:13 29-07-2022

[more=оффтоп]
Цитата:
daa2013
Во-вторых, если уж так сделано, то я бы их всегда две и демонстрировал и вторую не отключал.

Не забываем: СК автор пишет для себя и под себя.[/more]

Автор: DmitryKz, Отправлено:09:18 29-07-2022

[more=оффтоп]
Цитата:
Не забываем: СК автор пишет для себя и под себя.

Тем не менее, на просьбы и пожелания со стороны часто откликается и принимает во внимание, за что ему огромная признательность.[/more]

Автор: niccolo, Отправлено:10:09 29-07-2022

daa2013


Цитата:
Save as используется, когда меняется тип файла. Если меняется только имя, то обычно Save


В нормальных программах Save используется для сохранения файла, Save as для сохранения под другим именем (и другим полностью поддерживаемым расширением).
Для сохранения в другие типы обычно используется Зкспорт.

Болега привёл всё к нормальной логике... Понятно, что с привычки это вызовёт лёгкий дискомфорт. Но новым пользователям и тем. кто не привык, всё станет понятнее....

Автор: shch_vg, Отправлено:14:53 29-07-2022

Грандиозно!
После 15 лет использования СК создали, наконец, вопрос, аналогичный тому, который привел к непримиримому спору небезызвестных лиллипутов.

Автор: DmitryKz, Отправлено:15:14 29-07-2022


shch_vg
Где вы увидели спор, да еще непримиримый? Участники беседы обменялись своими мнениями и наблюдениями. Автор программы, если захочет, будет что-то с ними делать, или не будет. Уже полдня как прошло с последнего сообщения, никто не спорит.
Грандиозными, в смысле, неуместными, выглядят подобные вашим комментарии, не несущие вообще никакой полезной нагрузки, а сравнение участников беседы с лилипутами, еще и с претензией на оскорбление.

Автор: asku, Отправлено:15:56 29-07-2022

bolega уже ответил на вопрос о Save as — все есть в файле sk.6.8.whats.new.txt:


Цитата:
Options, закладка Task добавлена опция Menu command. Если задано значение "Save as+Save", то в главном меню в дополнение к команде Save task as добавится команда Save task, при вызове которой диалог выбора файла предлагаться не будет. На панели инструментов появится также дополнительная кнопка.


И будет в File оба пункта — и Save... и Save as...

Автор: D1D1D1D, Отправлено:20:20 29-07-2022

Привет. В архиве sub-task. Как добиться, чтобы элементы Й-краткого не сливались, при этом сохранив оригинальную толщину букв?


Автор: asku, Отправлено:22:09 29-07-2022

bolega
Есть еще идея. Не знаю, насколько это трудно реализовать, но вещь была бы мегаполезная — экспорт txt-файла из СК (из текстового слоя).
Ведь в процессе работы над сканами в СК исправляются ошибки и в конце работы над проектом в СК имеется фактически безошибочный (или почти безошибочный) текст книги, и как было бы хорошо воспользоваться им. Достаточно экспорта в простой текстовый формат, но кодировке UTF-8 (Юникод).


И еще вопрос. Можно ли реализовать автоматическую замену знака ' (юникод 0027) на знак (юникод 2019) ?

Автор: TelecomUral, Отправлено:04:03 30-07-2022


Цитата:
Как добиться, чтобы элементы Й-краткого не сливались, при этом сохранив оригинальную толщину букв?

играйтесь силой sharpen (я ставил 45) и порогом бинаризации (я не менял). Галку Blur уберите. Я вообще эти три галки на закладке Quality не ставлю никогда, больно они мощные.

В целом вы хотите противоречивой задачи: бледная грязь между кусочками буквы неизбежно ведёт к понижению порога, а значит утончению букв с краёв. Ну, ещё можете bw-зону на одну букву поставить Со своим порогом. Или заменить потом "й" на хороший глиф.

мой результат


Добавлено:
[more=оффтоп для asku]
Цитата:
Можно ли реализовать автоматическую замену знака ' (юникод 0027) на знак ’ (юникод 2019) ?

а зачем? (мне для общего развития хотелось бы понять цель.)[/more]

Автор: D1D1D1D, Отправлено:05:03 30-07-2022

TelecomUral
Спасибо!

Автор: kamenkapenza, Отправлено:10:02 30-07-2022

Мир всем!
Вопрос первый, для всех простой (кроме меня )) ): как выделить (чтобы они покраснели) группу файлов последовательно или выборочно в списке файлов (тот который главный в крайнем левом углу прораммы? Один файл выделяется через ЛКМ и нажатия пробела, так же можно выделять и другие, но это надо на каждый "вставать" и нажимать пробел. Чтобы выделить группу последующих файлов или в непоследовательности друг за другом файлов, а выборочно в программах обычно работает связка Ctrl+ЛКМ, Shift+ЛКМ. В данном случае для покраснения последовательных файлов или выборочного выбора файлов такая комбинация не работает.
Вопрос второй (могут не все знать): в панели показа страниц (Show tumbnails) есть возможность такого выделения файлов для функции "Выбранные файлы"? В отличие от простого списка файла на этой панели видно, что выделять (видны страницы) для групповой обработки. То есть через выделение нужных файлов на панели Show tumbnails выделялся (краснел) список файлов (в левом верхнем углу программы), и можно было эти выделенные файлы запускать в групповую обработку Process selected.

Автор: TelecomUral, Отправлено:10:14 30-07-2022


Цитата:
как выделить (чтобы они покраснели) группу файлов последовательно или выборочно в списке файлов

выделили красным начальный файл в будущем красном списке, перешли на последний, ПКМ/Select group/Up to previous selected. По-русски команда звучит Выделить группу/До предыдущего выделенного файла.

Автор: kamenkapenza, Отправлено:10:36 30-07-2022

TelecomUral, спасибо!
А про взаимосвязь (Show tumbnails) с простым списком файлов (слева вверху). Есть она? Хотелось бы, чтобы была. Нужные (визуально выбираем) страницы на панели Show tumbnails выделять выборочно (через Ctrl+ЛКМ) или последовательно (через Shift+ЛКМ) и в резульате этих действий эти выделения параллельно отображались в списке файйлов (тот который в левом верхнем углу), а затем эти выбранные страницы (простым и удобным путем обрабатывать через Process selected
И на панели Show tumbnails неплохо было бы сделать функцию отображения страниц. Сейчас она идет в один столбец вниз. Добавить кроме такого расположения расположение в два, три, четыре столбца при последовательности просмотра файлов слева направо (при четырех столбцах первые четыре, ниже вторые четыре и т.д.) Или сделать панель Show tumbnails растягивающейся с возможностью захвата ЛКМ тянуть вбок, и при этом один ряд преврещался в два, три, четыре по аналогии с просмотром паок на компьютере: чем шире папка, тем больше рядов просмотра файлов в режиме просмотра значков). Это было бы удобно, когда в книге идет череда картинок, они где то в одном месте книги, а в основном текст. В таком случае удобно было бы не выискивать их, запустить общую обработку, а потом, когда дойдем в панели просмотра до картинок, выйти на главную, установить зоны, выделить эти страницы и переобработать. Для такого случая было бы очень полезно то, что я предлагаю (если такого сейчас нет). Просто попалась сейчас книги 650 страниц, в основном один текст, а посередке затесалось 10 листов с фото. Чтобы не выискивать их, запустил общую обработку, а на панели результатов дошел до картинок и вернулся на главную панель для работы с этим истраницами и их переобработки.

Автор: TelecomUral, Отправлено:10:47 30-07-2022

Я не знаю, никогда не пользовался.
Мне не нужна панелька превьюшек, всю обрабатываемую книгу удерживаю в голове. Там не так уж много специальных блоков страниц. Текст, обложки с форзацами, и вклейки, ну текст бывает на разной бумаге или разной плотности печати, так это всё равно не требует особенной отдельной обработки, порог "auto" всё вытягивает. А если конкретные ляпы, непропечатки и тэ пэ - так они поодиночке встречаются, а не группой.

Автор: kamenkapenza, Отправлено:10:57 30-07-2022


Цитата:
Мне не нужна панелька превьюшек, всю обрабатываемую книгу удерживаю в голове.

Вам проще, а я не сам сканирую и, открывая сканы, даже не ведаю, что там, есть там картинки или нет.

Автор: TelecomUral, Отправлено:10:58 30-07-2022


Цитата:
Чтобы не выискивать их...

...надо было поставить им жирность или красноту в списке.

Добавлено:

Цитата:
Вам проще, а я не сам сканирую и, открывая сканы, даже не ведаю

и я не ведаю иногда. но в момент отсмотра правильности расстановки резаков формирую взгляд на книгу как на объект обработки. То есть до начала какой-либо бинаризации.

Автор: kamenkapenza, Отправлено:11:04 30-07-2022


Цитата:
...надо было поставить им жирность или красноту в списке.

Я считаю, что в случае, когда много текста и мало картинок, и они где то находятся в книге, запускать общую обработку и находить эти страницы с картинками уже на панели результатов, возвратиться в главное меню, выделить эти страницы и переобработать, а чтобы выделить, нужно видеть, что выделять, и возможность выделения на панели Show tumbnails и её связь со списком файлов (выделяя на Show tumbnails краснели файлы в списке файлов) была бы иной раз очень кстати.

Автор: TelecomUral, Отправлено:11:57 30-07-2022


Цитата:
запускать общую обработку и находить эти страницы с картинками уже на панели результатов

так я и тыкаю носом, образно выражаясь, в бессмысленность таких действий. Вы вообще не отсматриваете оригинальные сканы, и как же вы тогда боретесь за хорошо обработанную е-книгу. Одни громкие слова о превосходном СК, который фактически используется вслепую.
бог вам судья, разумеется.

upd
мне хотелось разобраться, откуда такая потребность в превьюшках

Автор: kamenkapenza, Отправлено:13:01 30-07-2022

Подожду ответа от высшей инстанции, что на это начальник скажет, если посчитает нужным )).
Моё предложение: в последующей версии сделать то, о чем я говорил выше (модифицировать вкладку Show tumbnails). Или сделать панель просмотра страниц всплывающей наподобии других панелей (например, панель глифов), но чтобы при выделении страниц на этой вкладке они так же выделялись в списке файлов для возможности внесение в процесс обработки выбранных страниц. Вреда от этого предложения никакого не будет,только польза

Автор: TelecomUral, Отправлено:16:42 30-07-2022

насколько я уяснил работу с режимом thumbnails окна VR, нажимая в нём F2|F3 можно красить красным оригинальные сканы.

Автор: bearjrgm, Отправлено:17:33 30-07-2022

bolega спасибо за очередную версию, некоторые наблюдения:
- tesseract вылетает при пакетном распозновании, но при этом работает распознавание этой же страницы из VR (где-то страниц 35-40, возможно по памяти?), но само распознование довольно неплохое, я бы даже сказал вполне на уровне
- замена букв работает хорошо (скорее отлично), но например не смог добавить в игнор нижние и верхние двойные кавычки, при этом СК прерасно съел польский язык с его диакритическиеми знаками. Что еще заметил, иногда почему-то точки над i, j оставались красными в режиме подсветки спеклом даже после перераспознавания страницы.
- при замене букв очень помогают фильтры (ширина и высота), а также марашки.
- очень полезная функция вставки зоны-картинки по горячей клавише.
- часть подсказок крякозябрами, что-то с кодировкой? Те же крякозябры для польского оказались в игнор. листе для деспекла (Win10)

Зачем верхние и нижние двойные кавычки в игнор листе?
Для корректного удаления марашек увеличиваю размер спекла (может это и не нужно???), при этом кавычки становятся марашками и если их много, то удаление марашек становится не таким быстрым.

Если возможно, хотелось бы когда-то для зоны-картинки принудительную ортогональность относительно страницы (так как получается при вставе через буфер обмена), чтобы не ломались диагональная штриховка на картинках.

Если возможно, то хотелось бы ролик по режимам бинаризации в разных сложных случаях в т.ч. и про AutoW.

Автор: bond012, Отправлено:20:06 31-07-2022

[more] [more] bolega
Столкнулся с книгой (все лежит в архиве по адресу: https://disk.yandex.ru/d/FKEkGhRjZAdSWQ ), которую скачал с библиотеки https://ru.bookshome.net/, где оказалось очень много плохо сдеданных книг. И на этой книге спотыкается программа в прямом смысле слова. Субтаск не делал, потому что провозился с книгой три дня, пока кое-как не сделал, пришлось просто фокусничать с заданием, чтобы добиться успеха, так что достоверности этого задания гарантировать нельзя.
Начал с версии 6,8: уже на расстановке резаков ушло много времени, более часа, хотя страниц всего 344 (после деления разворотов), сохранил задание, настроил задание, начал пастеризацию на которую ушло около 3 часов (такого никогда не было у меня, даже книги около 1000 страниц постеризуются не более часа). Начал редактировать в VR, на открытие каждой страницы уходит почти минута (такого ранее не было). Поэтому плюнул на эту версию и запустил 6,75,5, в которой переход по страничкам уже занимал не более 30 секунд. Процесс драфта доходит до последней странички, но не завершается появлением кнопки ОК, а просто висит до бесконечности. Принудительно прекращаю этот процесс абортом, выясняется, что резаки все же на всех страничках проставлены правильно. Но, главное, как при работе в VR, так и MW, периодически возникало сообщение о нехватке памяти (диспетчер задач при этом показывал занятость памяти на четверть, а у меня ее 8 Гигов). После этой ошибки продолжение работы было невозможно. Нашел выход из положения: закрываю программу, перезапускаю, снова открываю задание, и с этого места начинаю работу, - все идет далее нормально до очередной ошибки, после которой снова закрываю программу, запускаю, и продолжаю работать далее. Т.е. такое ощущение, что после перезапуска программы, на тех же операциях, где были ошибки о нехватке памяти, - все нормально, пока такая ошибка, по непонятным причинам, снова не возникнет. В итоге на этой книге всё равно не сработало добавление полей, как я ни крутил, никаких полей реально к страничкам не добавилось.
Решил попробовать версию 5,96,2: эта версия вообще эту книгу не потянула, Я по этой причине запустил всего 20 разворотов. Когда дошел до бинаризации, то программа выдала сообщение об отсутствии задания и все странички в главном окне удалились. Посмотрел в папку out, там все же странички сформировались, но без калькуляции и добавления полей, также был и файл задания на месте. Почему я и хотел бы, чтобы Вы на своих машинах попробовали сделать эту книгу. И всё проверить как на версии 6,8, так и на версии 6,75,5.
Благодарю за прекрасную программу и возможность обратиться к Вам за помощью.
[/more] для bolega[/more] [/more] [/more]

Автор: TelecomUral, Отправлено:06:02 01-08-2022


Цитата:
bond012
Столкнулся с книгой

в книге dpi=288, а число пикселей примерно соответствует dpi=600. То есть вы фактически обрабатывали книгу под 1200dpi.

Автор: bond012, Отправлено:07:49 01-08-2022

[more] TelecomUral

Цитата:
в книге dpi=288, а число пикселей примерно соответствует dpi=600. То есть вы фактически обрабатывали книгу под 1200dpi.

Приятно с Вами всеми общаться, быстро реагируете, прямо как отряд быстрого реагирования. Всё верно! Но, вот такая книга была, и возможно я делал ее под 1200 dpi, хотя я этого и не подозревал. Но ведь есть умники, которые делают именно такие книги изначально с разрешением 1200 dpi.
С другой стороны, если книга сделана под 288 dpi, то это нормальное разрешение, как могло оказаться, что она обрабатывалась под 1200 dpi?
И последнее, если всё так, как Вы пишете, то почему SK выдавал сообщения об ошибках, и не добавлял поля, и очень тягомотно работал и открывал странички в VR?
Сейчас я заканчиваю еще одну книгу, у которой также часть страниц с одним разрешением, часть с другим, т.е, всё то же самое, но книга идет легко, разрешение при бинаризации переключаю и поля добавляются, калькуляция страниц идет отлично, книга по объему еще больше, и SK работает быстро и стабильно, пока… Это всё книги с хваленого Вами https://ru.bookshome.net/, где оказалось бездарно и ужасно сделанных книг столько, сколько на Флибусте не бывает!
Вот все эти вопросы и хотелось бы мне разрешить, уважаемые друзья-форумчане!
[/more]для TelecomUral [/more]

Добавлено:

Цитата:
bolega

Уважаемый bolega!
Сейчас делаю книгу, все шло хорошо, просто отлично, но когда дошел до финализации файлов, программа профинализировала несколько первых файлов, а потом выдала сообщение об ошибке и не хочет остальные файлы финализировать. Как мне быть? Я снял для вас видео, чтобы Вы наглядно все увидели (видео в формате *.exe, просто запустите его, и оно откроется в своем проигрывателе с высоким качеством), сделал Ваш любимый субтаск, всё сложил в архив вместе с рабочей папкой книги, который можете скачать с адреса: https://disk.yandex.ru/d/CayQC8qgjFqtLw
Благодарю за возможность обращения. [/more]

Добавлено:

Цитата:
bolega

Уважаемый bolega!
Исследуя проблему с невозможностью финализации некоторых файлов, я обнаружил, что это производит на тех фалах, на которых включена иллюминация. При этом у меня была включена иллюминация на всех файлах, и при этом на части файлов финализация не происходила. Однако, как только я отключил иллюминацию на тех файлах, которые не желали финализироваться, финализация после этого, как только я перепроцессил их, прошла успешно. Вот такие дела!


Автор: D1D1D1D, Отправлено:14:48 01-08-2022

bond012
"видео в формате *.exe" — это подозрительно, тем более в сообщении новичка с двумя комментами.

"просто запустите его" — ага)

Автор: bond012, Отправлено:15:51 01-08-2022


Автор: shch_vg, Отправлено:15:51 01-08-2022

bond012

Цитата:
программа профинализировала несколько первых файлов, а потом выдала сообщение об ошибке и не хочет остальные файлы финализировать. Как мне быть?

Разбираться со своим компьютером!
Запустил ваше задание в СК 6.8, финализация прошла без вопросов, все выходные файлы получены.

Автор: D1D1D1D, Отправлено:15:58 01-08-2022

bond012
Вирус необязательно может иметься в базе антивирусов - это может быть новый алгоритм.

Автор: bond012, Отправлено:16:04 01-08-2022


Автор: daa2013, Отправлено:05:38 10-08-2022

в RV на панели binarization не работает кнопка re-binarize
изменяю порог, думаю, что она включится и даст сделать переобработку, но нет.

причем измененное значение запоминается вне зависимости от того, выполнена или не выполнена ребинаризация

версия 6.8.

файлы у меня одностраничные.
Почему можно нажать на надпись Left page и она станет красной. Что это означает ?



Вернулся в MW, включил в меню процесс опцию эллоу ребинарайз., переобработал страничку. Ничего не заработало.

Если эта опция в MW отключена, добавьте на панель не только кнопку ре-бинрайз, а кнопку ре-процесс.
(чтобы выполнялись все обработки).

Автор: MrLAG, Отправлено:21:31 13-08-2022

Несколько лет не проверял новые версии СК. Вижу что появилось много полезных вещей, что приятно. Особенно возможность вставлять зоны сразу на несколько станиц (сам просил такую возможность, когда переписывался с автором).

Но вот одну вещь я понять не могу:

"- Обработка теперь выполняется всегда без финализации."

Прочитал, и даже логин/пароль вспомнил. Зачем? Я имею в виду, была опция "Do not finalize". Можно было включить/выключить финализацию. Я лично эту опцию никогда не использовал (т.е. у меня программа сразу финализировала страницы). Очень удобно, не нужны лишние действия. Теперь появляется дополнительное действие в виде лазания в меню, чтобы финализировать страницы.

Кто-нибудь может пояснить, какой в этом смысл? Я понимаю, что кому-то нужен именно нефинализированный вариант, но для того и была опция "Do not finalize". Но зачем было убирать включение/отключение этой опции? Я не надорвусь лишний раз в меню залезьть, но... не понято!

За программу и её обновление огромное спасибо автору - пользусь много лет.

Автор: TelecomUral, Отправлено:06:19 14-08-2022


Цитата:
MrLAG
Кто-нибудь может пояснить, какой в этом смысл?

я точно не скажу, но думаю так: если вы расставляете новые поля, с помощью заложенного алгоритма-автоопределителя габаритов, то программа предлагает их визуально проверить. И затем уж финализировать.
Можно не ставить свои поля, тогда и финализировать не надо.

Автор: kamenkapenza, Отправлено:15:27 14-08-2022

Я отродясь финализацией не пользовался. Сохранить задание - Креате аут таск - Тулс -Джву. Как уважаемый TelecomUral сказал дело в полях,я тут с полями не работаю, прихожу в Кромсатор со всем готовым.

Автор: bolega, Отправлено:09:50 15-08-2022

daa2013

Цитата:
в RV на панели binarization не работает кнопка re-binarize

Ребинаризация доступна только если расчет был выполнен с включенными automargins, и book size был задан auto или fixed, т.е. не none. Пока так.
После финализации ребинаризация тоже становится недоступна.

MrLAG

Цитата:
была опция "Do not finalize". Можно было включить/выключить финализацию.

Было много жалоб, что забывали вовремя включить эту опцию. Последствия неприятные: часто требовалась полная переобработка. В этом смысле постоянно включенный режим намного безопасен, минус у него - один раз вызвать команду финализации, т.е. потратить одну секунду. Против возможно многих часов исправлений.

Автор: asku, Отправлено:13:51 15-08-2022

bolega добрый день! А когда можно ждать появление новой версии? )

Автор: shch_vg, Отправлено:15:11 15-08-2022

bolega
А какие есть доводы в пользу отсутствия возможного отключения финализации в случае уже проведенной финализации и необходимости переобработать выборочно массу отдельных страниц?
Здесь бы такая опция пригодилась.

Автор: bolega, Отправлено:17:09 15-08-2022

shch_vg
все те же.

Цитата:
Здесь бы такая опция пригодилась.

опция по отключению опции )

Автор: shch_vg, Отправлено:20:06 15-08-2022

bolega

Цитата:
минус у него - один раз вызвать команду финализации, т.е. потратить одну секунду

А если, допустим, при обработке 300 сканов для половины переобрабатываемых приходится делать ненужную в данный момент финализацию, то это уже не выглядит смешным

Автор: bolega, Отправлено:01:04 16-08-2022


Цитата:
приходится делать ненужную в данный момент финализацию

Ну так не делайте ее, в чем проблема...
Очередной раз жалею, что зашел сюда.

Автор: shch_vg, Отправлено:03:12 16-08-2022

bolega

Цитата:
Ну так не делайте ее, в чем проблема...

Проблема в том, что если не сделать финализацию вновь переобработанного скана, то не удастся получить нужный выходной скан , а таких переобрабатываемых сканов в задании может быть много.
Если не видите в этом проблемы, значит ее и нет.

Автор: shttd, Отправлено:10:25 16-08-2022

Вставьте ссылку на 6,80 в первый пост пожалуйста.

Автор: DmitryKz, Отправлено:08:37 20-08-2022

Ребята, подскажите, пожалуйста, как сделать, чтобы менялась только ориентация страницы, без увеличения ее размеров с огромными полями:
https://disk.yandex.ru/d/ZnOLry0NFMR7Ow
Не соображу...

Автор: bolega, Отправлено:09:09 20-08-2022

DmitryKz
У вас две страницы повернуты поперек, из-за этого размер книги берется с учетом развернутых, т.е. объективно завышен. Так делать нельзя.
Расскажу как в таких случаях поступать.
1 способ. Верните всем страницам портретную ориентацию (как в реальной книге). Обработайте, получите нормальный размер. После финализации нужные страницы в VR разверните на 90 градусов, там в панели для этого две кнопочки специальные есть, одна поворачивает по часовой стрелке, другая против.
2 способ. Не требует даже переобработки вашего задания. Для всех повернутых страниц в exclusive page options включаете галку Use alternate page size, даете команду Process > Calculate book size. Получаете что надо.

Автор: DmitryKz, Отправлено:09:19 20-08-2022

bolega, спасибо!
Я, собственно, и делал поначалу со всеми страницами в портретной ориентации. Но в этом случае для страниц в альбомной Deskew немного страницу не доворачивал, только при явном указании Orientation -90° получалось "ровно".

Цитата:
2 способ.

Отлично все отработало! Спасибо)

Автор: bolega, Отправлено:09:35 20-08-2022


Цитата:
в альбомной Deskew немного страницу не доворачивал

Для альбомных нужно просто включать подопцию deskew = ortho

Автор: DmitryKz, Отправлено:12:05 20-08-2022

bolega, еще раз спасибо — переделал "как правильно".
Единственно, иногда Ortho некорректно выравнивает, если имеется изображение (ЧБ, без picture зоны) в котором есть линии под углом друг к другу — будто выравнивание происходит по одной из этих линий, не той, которая нужна. Я так понимаю, в этом случае нужно вручную ввести значение в Fixed deskew angle, то, которое нужно?

Автор: bolega, Отправлено:13:16 20-08-2022

DmitryKz

Цитата:
в этом случае нужно вручную ввести значение в Fixed deskew angle

Да, можно вручную. Можно померить на скане угол инструментом "угломер", он сам умеет заносить угол туда если держать ctrl.
Можно поставить специальную зону с типом deskew (например, захватив абзац текста), тогда угол перекоса СК будет искать только в области, покрываемой зоной

Автор: DmitryKz, Отправлено:14:07 20-08-2022


Цитата:
Можно померить на скане угол инструментом "угломер", он сам умеет заносить угол туда если держать ctrl.

А есть ли способ измерять угол относительно вертикальной линии, не горизонтальной?
Скажем, на странице есть рисунок, но нет текста, по строчкам которого можно было бы измерить угол. Но есть рисунок с вертикальными линиями. Попробовал удерживать разные комбинации служебных клавиш Ctrl, Alt, Shift, но так не работает... вроде бы. Опций у "угломера" также вроде нет.

Автор: TelecomUral, Отправлено:09:08 22-08-2022

DmitryKz
я вычитал 90град в уме

Автор: DmitryKz, Отправлено:10:13 22-08-2022


Цитата:
я вычитал 90град в уме

ну это понятно!))
но хотелось бы воспользоваться фичой

Цитата:
он сам умеет заносить угол туда если держать ctrl


Просто скан не мой, выдернул из какой-то онлайн-библиотеки страницы, они все сикось-накось, плюс из 700 страниц процентов 10 в альбомной ориентации. Вычитать надоест...

Автор: DmitryKz, Отправлено:09:53 24-08-2022

В принципе, как вариант — изменить Orientation на альбомную у страниц с такой ориентацией. Замерить угол поворота с Ctrl. И вернуть Orientation на место (0°) через Apply option to all marked.

Автор: kamenkapenza, Отправлено:20:29 24-08-2022

Предлагаю Режим автосохранения страниц по умолчанию сделать включенным (или внести в профиль пользователя по умолчанию возможность выбора). А так же сделать по умолчанию (или внести в профиль) включенной первую (всё удаляющую кисть). Поясняю практически: после обработки страниц на панели результатов начинаем корректировать книгу. Первая - титульная страница, она обычно самая грязная, на ней ставят печати, надписи и т.п., так что за дело берется кисть, а потом уже доводится до кондиции, подтирается стеркой, ей выправляются грязные буквы и т.п. Т.е вначале кисть потом стерка. Я всегда в начале коррекции на странице резульатов включаю первую кисть и автосохранение. Неплохо было бы их изначально держать включенными. Вот, например, кнопка качественного отображения по умолчанию изначально включена. Сделать такое же и для автосохранения и "грубой" кисти.

Автор: kamenkapenza, Отправлено:22:58 25-08-2022

Help!!!
Что-то в последнее время происходит сбой при изготовлении джву. Вот видеоподтверждение https://disk.yandex.md/i/p6iiOg_lX9y7ig

Автор: TelecomUral, Отправлено:04:44 26-08-2022

суб-таск. с обложкой, парой чб страниц, и step*.

Автор: bolega, Отправлено:10:25 26-08-2022

kamenkapenza
Попробуйте обложки закодировать с качеством 90% (вместо 100, это перебор imho): run step1.
djvused почему-то спотыкается на них (step1.djvu)
Потом снова соберите djvu: на закладке Files команда create result djvu (чтобы не переделывать остальные step, с ними проблем нет).

Автор: kamenkapenza, Отправлено:19:07 26-08-2022

TelecomUral, благодарю!
bolega, большое спасибо!


Автор: asku, Отправлено:19:10 01-09-2022

Подскажите пожалуйста, как сделать так, чтобы в книге весь текст был не черного, а другого цвета.
Знаю, как сделать часть текста — Создать Picture Zone и т.д.
А как сделать всю книгу...

Автор: shch_vg, Отправлено:21:35 01-09-2022

asku

Цитата:
А как сделать всю книгу...

Если не хотите использовать на всех страницах пикчер-зоны, то никак.
В ирфанвью есть возможность менять цвет, но, к сожалению, только постранично.

Автор: VadimirTT, Отправлено:21:50 01-09-2022

asku
А если клонировать пикчерзону на все страницы?

Автор: asku, Отправлено:21:56 01-09-2022

VadimirTT
а как это сделать?

Автор: VadimirTT, Отправлено:22:07 01-09-2022


Цитата:
а как это сделать?

Я не делал, но, наверное, выделить одну страницу в пикчерзону, установить цвет текста, потом в меню Zones->Picture Zones->Process markced zones for files-All.
Может быть получится.

Автор: shch_vg, Отправлено:00:41 02-09-2022

VadimirTT

Цитата:
Может быть получится

Не получится.
Это распространяется только на уже имеющиеся зоны.

Единственный вариант, который приходит на ум, работает только в последней версии СК. В свойствах задания выбрать для главного окна хоткеи и посадить Paste zone to cursor на букву D. Затем на первой странице создать пикчер-зону на всю страницу с нужной заливкой текста и скопировать эту зону. Далее перейти на вторую страницу, установить мышь в положение левого верхнего угла скопированной зоны.
Далее автомат: нажимать по очереди D и W до конца задания.

Лучше это делать после нужной обработки задания в черно-белом, поместив затем полученные выходные файлы в новое задание (например, через out-task).

Автор: TelecomUral, Отправлено:03:19 02-09-2022


Цитата:
asku
А как сделать всю книгу...


Цитата:
а как это сделать?

регулярно перечитывать what's new. После пятого раза в голове начинает что-то откладываться, даже если фича не применяется. Потом всплывет само. Затрат времени - полтора часа на все, экономия огромная выйдет, чем ждать тут ответов на каждый новый вопрос по полсуток.

Команда "Paste zone to pages..." в меню Zones. Зона наверное д.б. в кармане (ПКМ Copy zone to Clipboard). Или активна (выбрана), я не помню деталей.

Можно и в графредакторе палитру поправить, и в image magic есть фича, скорее всего. Но уж кодить придётся вне СК.

Также можно на каждой странице менять цвет через Image adjustments\Posterization. Для извращенцев.

UPD
сам же когда-то просил у автора, и забыл - в out-task можно наложить зону раскраски (тип special), и размножить. Так проще, чем в основном задании подгонять зоны под резаки. Текст-то уже выровнен.

Автор: bolega, Отправлено:08:05 02-09-2022

asku
TelecomUral

Цитата:
в out-task можно наложить зону раскраски (тип special), и размножить.

Именно так и нужно делать. В Out-задании. Создать на одной странице pic-зону (на всю площадь страницы) с типом special и раскраской текста, и желательно включить там же опцию transparent, и размножить на все страницы, с цветных страниц удалить. Потом можно генерить djvu или pdf.
Размножать так: в КМ зоны "Copy zone to clipboard", затем в гл. меню Zones > Paste zone to pages...

Автор: asku, Отправлено:13:30 02-09-2022


Цитата:
с типом special


А что такое тип special?
Открываю out-task.
На первой же страница на всю страницу делаю Creat Picture Zone.
А дальше... ?
ПКМ Picture zone properties — Вкладка Paint — Text (Выбор цвета) — Кнопка ОК.
Я только так знаю. Потом распространить зону на все страницы.

Автор: TelecomUral, Отправлено:14:04 02-09-2022


Цитата:
asku
А что такое тип special?

См. выпадающий список Color на первой закладке свойств зоны.

Автор: asku, Отправлено:23:13 03-09-2022

bolega, TelecomUral
Все получилось, спасибо. Теперь главное — запомнить это на будущее. )

Автор: shch_vg, Отправлено:19:05 06-09-2022

bolega
Есть ли какая-то причина при повороте скана на закладке Page на +-90 градусов не менять местами в левом нижнем углу главного окна пиксельные значения высоты и ширины скана? По-моему, более естественно, чтобы эти значения соответствовали виду в главном окне обрабатываемого скана, как это сделано, например, в Ирфанвью.

Автор: romanef, Отправлено:12:01 08-09-2022


Request for new feature

Вставка пустой белой страницы вместо (!) текущей. Желательно одним кликом мышки.
На этапе до обработки либо на этапе VR.


Обоснование:
Пустые страницы приходится сканировать для сохранения сквозной нумерации.
При этом Оптикбук 3800 имеет неотключаемую автоплотность и вытягивает "мусор".
Приходится чистить мусор до белой страницы и тратить время.


Автор: TelecomUral, Отправлено:13:00 08-09-2022


Цитата:
romanef
Приходится чистить мусор

порог бинаризации в таких случаях ставлю вручную, очень низкий.
(замечу, что автоплотность у 3800 - отключаемая. В реестре ищите параметр.)

Автор: romanef, Отправлено:15:38 08-09-2022

Вставка пустой белой страницы никогда не помешает.
Размеры ее можно определять пресетами в Options/Profiles.

Если вставка страницы технически невозможна - тогда хорошо бы сделать заливку белым содержимое текущей страницы (стереть контент)как дополнение к Rotate.

Или как вариант - сделать еще одну, новую опцию Mouse UP - сlear zone



Добавлено:

Цитата:
3800 - отключаемая. В реестре ищите параметр


не нашел.
а можно ссылку на ветку реестра ?

Автор: TelecomUral, Отправлено:16:43 08-09-2022

[more=оффтоп]
Цитата:
romanef
а можно ссылку на ветку реестра

где-то тут. Это от другой модели ветка, но суть одна.
[/more]

Автор: bolega, Отправлено:08:58 09-09-2022

shch_vg
Исправил.

romanef

Цитата:
новую опцию Mouse UP - сlear zone

Есть же mouse-up clear. Мне всегда хватало. Выделил всю страницу, она очистилась.
Второй вариант, без режима: выделил всю страницу, нажал "С".
Третий способ: порог бинаризации задать 0.
Теоретически можно добавить новую опцию Blank page, чтобы СК сам ее чистил при обработке. Но учитывая что есть несколько простых альтернатив, даже и не знаю ... Неужели настолько лень вручную почистить парой движений?

Автор: VadimirTT, Отправлено:19:04 09-09-2022

Если сканировалось на макоси и в названии папки или фалов есть й, то кромсатор, это не ест.

Автор: TelecomUral, Отправлено:12:41 12-09-2022

bolega
Некий индиец через комменты в ютьюб и личную переписку просит добавить в список языков выбор "Odia". Говорит, тессеракт это поддерживает.
его почта ayasbaral@yandex.com, звать Ayaskanta Baral.

Автор: bolega, Отправлено:19:56 13-09-2022

TelecomUral
А он представляет себе, что он будет делать с ocr?

Автор: TelecomUral, Отправлено:00:30 14-09-2022

bolega
я его не спрашивал.
Но вроде не идиот, другие вопросы задает четкие. Например, запросил, почему у него при создании текстовой метки (Ctrl+L) выделение жёлтое, а при merge label изменяется жирность текста страницы. И на запрос "о чём это он??" моментально прислал адекватную видеозапись, я вам на свой фтп в корень положил. Я перепроверил, у меня не так.
Кстати, если неслитую метку выделить, изменить её размер и мышкой при этом зацепить зону рядом, возникает Access violation... но повторить этот фокус я не смог. Причем даже VR не закрылся, когда окно ошибки всплыло.

Автор: bolega, Отправлено:08:17 14-09-2022

TelecomUral

Цитата:
почему у него при создании текстовой метки (Ctrl+L) выделение жёлтое,

У меня тоже так бывает. Причину не нашел. Помогает закрытие и открытие окна VR.

Цитата:
а при merge label изменяется жирность текста страницы

Текст набирается в пространстве экрана стандартным контролом windows, при его помещении в изображение (т.е. в другое медиа с другим dpi) он сильно меняется. Чтобы не менялся, нужно наверно делать свой собственный редактор текста с поддержкой wysiwyg (а ля word, когда текст выглядит одинаково на экране, принтере и т.д.), это очень сложная история, я не осилю. Label в СК довольно примитивный, реализован на скорую руку, нужно работать с ним в строгой последовательности, иначе будут AV, защиты от некорректных действий нет никаких. Этим он сильно отличается от обычных зон, т.к. изначально рассчитан на минимальное применение в СК.

Автор: TelecomUral, Отправлено:13:42 17-09-2022

bolega

Цитата:
нужно наверно делать свой собственный редактор текста с поддержкой wysiwyg

я, конечно, дилетант... но неужто до сих пор никто в мире не состряпал бесплатную дллку, которой посылаешь (векторное?) окно стандартного контрола, а она возвращает его растром и в новом дпи. Задачка-то стандартная, по идее, мелкомягкие и сами могли бы чего-нибуь написать такое. Хотя, конечно, в СК у фичи "минимальное применение". Я ей помнится единственный раз в жизни пользовался, лет десять назад. Когда менюшки ПКМ впервые изучал.

Автор: asku, Отправлено:16:50 17-09-2022

Добрый день. Прошу помочь. Скан — печатная машинка. Можно ли еще улучшить качество на выходе. Файнридер что-то совсем плохо распознает.

Тест-файл

Автор: TelecomUral, Отправлено:17:11 17-09-2022


Цитата:
печатная машинка

всегда интересовался, нельзя ли пройти путём подмены: в ФР засунуть серый оригинал, чтоб распознавание получше прошло, а в СК нормальный ЧБ получить и затем готовый ocr файнридера заюзать. Можете попробовать.
Улучшать работу СК по бинаризации мало толку.

Автор: AlVaKo, Отправлено:18:49 17-09-2022

При распознавании, ФР скорее всего работает с ч/ б изображением. А значит, ФР сам будет бинаризировать серый скан. Тут вопрос, у кого кунфу круче по части бинаризации? У СК или ФР?

Автор: TelecomUral, Отправлено:19:01 17-09-2022

оффтоп


Цитата:
AlVaKo
ФР скорее всего работает с ч/ б изображением

где-то кто-то когда-то давно писал, а я запомнил, что ФРу лучше скармливать в оттенках серого/в цвете. Мол, чб он точно хуже кушает. Ещё в районе 2009-2011 годов писали. Там же возможны разнообразные кунштюки с математикой над цветовым пространством, а не только тупое весовое сравнение Ч/Б попиксельно.

И второй вариант для печатной машинки не надо забывать: матрица её букв крайне ограничена, можно попробовать провести обучение ФР. Должно помочь.

но это опять оффтоп

Автор: niccolo, Отправлено:20:44 17-09-2022


Цитата:
где-то кто-то когда-то давно писал, а я запомнил, что ФРу лучше скармливать в оттенках серого/в цвете. Мол, чб он точно хуже кушает. Ещё в районе 2009-2011 годов писали. Там же возможны разнообразные кунштюки с математикой над цветовым пространством, а не только тупое весовое сравнение Ч/Б попиксельно.

И второй вариант для печатной машинки не надо забывать: матрица её букв крайне ограничена, можно попробовать провести обучение ФР. Должно помочь.


1. Это было тогда - сейчас почищенные и обкромсаные кромсатором ч/б файлы FR распознаёт даже лучше и точно не хуже
2. В FR8 можно выбрать тип распознаваемого текста - печатная машинка.

Автор: daa2013, Отправлено:01:59 02-10-2022

Уберите нафинг команду Delete all glyphs из КМ глифов. Работа трех дней псу под хвост.
Она же еще и сразу сохраняется. Закрыл без сохранения проект, открыл - глифов нет.



UPD В bak осталось сильно не всё. При каком сценарии работы вообще нужна такая команда ? (Да еще на самом козырном месте в меню.)
Можно же выделить все и удалить, если надо. Ещё есть Delete sheet

Если что, то я хотел удалить два глифа, тыкал вроде как в Delete glyphs и поэтому подтвердил удаление.

Автор: TelecomUral, Отправлено:05:19 02-10-2022

досовские проги частенько имели двойное предупреждение "команда удалит ВСЁ. Вы УВЕРЕНЫ??"

Автор: asku, Отправлено:13:10 03-10-2022

bolega, добрый день.



Нельзя ли как-нибудь сделать, чтобы при нажатии плюсика (Check and select next) SK показывал в увеличенном виде букву, напротив которой он в списке ставит галочку? Очень неудобно бывает смотреть и на маленькую букву в столбике справа и на маленькую букву внутри скана.
Вот бы буква из столбика справа отображалась бы в увеличенном виде здесь на «экранчике» (см. рисунок).

И хотел повторить пожелание. Если не трудно, сделайте, пожалуйста возможность автоматической сортировки глифов в алфавитном порядке.

Автор: asku, Отправлено:23:01 03-10-2022

Еще возник вопрос.
Насколько помню, при создании PDF-файла в СК, в нем создавался и текстовый слой. Сейчас сделал PDF, а текста там нет почему-то.
Вроде бы создаю правильно:
Creat out-task.
На вкладке File выбрать PDF и там же написать название файла.
Потом жму Process.

PDF создается, но без слоя.
В чем может быть проблема?
Вот тест-файл.

Автор: shch_vg, Отправлено:18:31 04-10-2022

asku

Цитата:
Насколько помню, при создании PDF-файла в СК, в нем создавался и текстовый слой.

Если под выражением "текстовый слой" подразумевается результат процесса распознавания, то насколько я помню, при создании PDF-файла в СК, в нем НИКОГДА НЕ создавался текстовый слой.

Автор: asku, Отправлено:18:44 04-10-2022

shch_vg
в последней версии СК используется текстовый слой из Файнридера. Вроде бы месяца два назад я создавал PDF и там был слой. Может я что-то путаю.

Автор: bolega, Отправлено:18:56 04-10-2022

asku

Цитата:
Нельзя ли как-нибудь сделать, чтобы при нажатии плюсика (Check and select next) SK показывал в увеличенном виде букву

На закладке preview наложение буквы показывается, и довольно крупно. Каких-то еще дополнительных окошек не будет. Максимум, могу сделать синхронизацию с выбранным глифом в библиотеке. Если там включен показ мини-редактора, то будет еще одно увеличенное изображение.


Цитата:
Может я что-то путаю.

Надо включить опцию add ocr на закладке PDF. Возможно, что в той версии опция не сохраняется в задании. Нужно ее включать вручную

Автор: asku, Отправлено:20:01 04-10-2022


Цитата:
На закладке preview наложение буквы показывается, и довольно крупно. Каких-то еще дополнительных окошек не будет.

Ааа, понял.


Цитата:
Максимум, могу сделать синхронизацию с выбранным глифом в библиотеке. Если там включен показ мини-редактора, то будет еще одно увеличенное изображение.

А это не понял. ) Я обеими руками за то, что делает работу в СК удобнее. )


Цитата:
Надо включить опцию add ocr на закладке PDF. Возможно, что в той версии  опция не сохраняется в задании. Нужно ее включать вручную

Сделал. Получилось. Спасибо!

Автор: daa2013, Отправлено:02:18 08-10-2022


Цитата:
досовские проги частенько имели двойное предупреждение "команда удалит ВСЁ. Вы УВЕРЕНЫ??"

Может быть, там должна была быть команда
Disable all glyphs. ????

Вот она была бы, действительно, нужна.
(Ну, и с двойным предупреждением, видимо, раз несложно обмануться.)

Автор: asku, Отправлено:07:18 08-10-2022

bolega, скажите пожалуйста, когда ждать новую версию?
Очень хотелось, чтобы в конце строки в слое файнридера вместо дефиса был мягкий перенос. Мы это обсуждали некоторое время назад. Решил пока несколько проектов отложить и дождаться новой версии. С мягким переносом намного удобнее бы было.

Автор: kamenkapenza, Отправлено:15:32 09-10-2022

ООО!!! Тут народ требует уже новую версию, а я с прежними не разобрался ))).
Почему то у меня Кромсатор не видит входящие файлы. Вот тут видео по этому поводу и файлы, которые получились какими то не такими. https://disk.yandex.md/d/c5XqQngj9ELgpQ

Автор: asku, Отправлено:16:32 09-10-2022


Цитата:
Тут народ требует уже новую версию, а я с прежними не разобрался


Я благодаря новой версии СК заинтересовался форматом словарей Hunspell и успел на скорую руку сделать словарь для того, чтобы работать в СК, ну и заодно чтобы проверять орфографию. )

Автор: daa2013, Отправлено:01:50 17-10-2022

Хочу сделать ч.б пикчур зоны с лосслесс кодированием.
Расставил, обработал, сделал оут-файл.
Теперь хочу пройтись по ним, взвести галки спецкодирования, и чтобы подсветить в списке, где они стоят, делаю:

в оут задании на списке ПКМ -> Select group -> Special -> Options -> Zones

и ничего не выделяется.
Это баг ? В оут-задании не работает ?

Кстати, у меня только такие зоны, но могли быть разные. Хотелось бы иметь возможность выделять зоны определенной цветности (в частности, ч.б).

PS
в принципе, я нашел первую, а потом опции с неё распространил на все зоны.
Но всё равно, тем не менее...

Автор: daa2013, Отправлено:08:36 17-10-2022

Делаю для списка файлов resort by names

В ответ получаю index out of bounds = -1.

Это как ? Имена они и есть имена.

SK не понравилось:

0090
90_1
90_2
0091

Автор: bolega, Отправлено:11:00 17-10-2022

daa2013

Цитата:
и ничего не выделяется. Это баг ? В оут-задании не работает ?

Нет, опция zones не реагирует на внешние зоны, так задумано.
Для их поиска включите там не zones, а Special zones и в списке отметьте external picture zones.


Цитата:
Хотелось бы иметь возможность выделять зоны определенной цветности (в частности, ч.б).

Искать (маркировать) pic-зоны (внешние или внутренние) по значениям их суб-опций, напр., цветности, надо с помощью Zones > Picture zones > Mark zones. Как это делать я показывал в последних роликах.


Цитата:
В ответ получаю index out of bounds = -1.

Баг.

kamenkapenza

Цитата:
Почему то у меня Кромсатор не видит входящие файлы. Вот тут видео по этому поводу и файлы, которые получились какими то не такими. https://disk.yandex.md/d/c5XqQngj9ELgpQ

Баг.

asku

Цитата:
Мы это обсуждали некоторое время назад.

Функционал замены текста сделал. Но после этого перестает работать текущая (сгенерированная до начала замены) замена глифов. Нужно либо вручную списки замен везде пересобирать, либо перестроить их программно. Вот на перестройке я и остановился, там очень много кода писать, а времени сейчас нет.


Автор: asku, Отправлено:13:39 17-10-2022


Цитата:
Но после этого перестает работать текущая (сгенерированная до начала замены) замена глифов.

А что это за замена? Я не совсем понял...


Цитата:
Нужно либо вручную списки замен везде пересобирать

Может можно пока такую промежуточную версию сделать, раз времени нет?

Я как-то спрашивал вас насчет возможности экспорта текстового слоя (txt-файл) из СК. Возможно ли такое сделать?

Автор: bolega, Отправлено:08:04 18-10-2022


Цитата:
Я как-то спрашивал вас насчет возможности экспорта текстового слоя (txt-файл) из СК.

В последней версии есть такое: на закладке ocr > words нажать all words. В КМ списка дать команду Copy text


Цитата:
А что это за замена?

Замена букв глифами. Речь о списке замен на закладке OCR. Если была замена текста find&replace, или даже редактирование слова с удалением букв, то списком пользоваться сейчас нельзя. Если забыть, будет порча результатов.

Автор: asku, Отправлено:11:27 18-10-2022


Цитата:
В последней версии есть такое: на закладке ocr > words нажать all words. В КМ списка дать команду Copy text


Это же постранично? А весь текст проекта как можно скопировать?

Автор: daa2013, Отправлено:11:30 18-10-2022

Мне кажется, что для кнопок MW "перейти к следующей/предыдущей странице" имеет смысл сделать модификаторы "перейти к следующей/предыдущей выделенной странице". (какой-нибудь чекбокс по ПКМ)

Автор: daa2013, Отправлено:00:45 22-10-2022

Можно ли сделать скроллбары на панель Preferences в глифах, которые появлялись бы в случае, если конфигурация такова, что кнопки и галки на панели вылезли за отведенное ей пространство:


Автор: TelecomUral, Отправлено:03:54 22-10-2022


Цитата:
кнопки и галки на панели вылезли за отведенное ей пространство

а по-моему, это глюк самой винды. Наблюдаю на оптикбуке такую штуку, и ничего сделать не могу. На свежеустановленной XP (или семерке, забыл уже) такого нет, а потом становится почему-то неустранимо.

Автор: daa2013, Отправлено:04:20 23-10-2022

Удалил файл в исходной папке.
При нажатии на меню Edit (ищу, как его теперь удалить из списка, почему-то этой команды нет в ПКМ на списке файлов, хотя add там имеется) вылетает access violation

Автор: daa2013, Отправлено:08:48 23-10-2022

при работе с автоглифами команду analize можно применить сразу для нескольких страниц.
А команду apply all только для текущей.

Можно ли apply как-нибудь сделать сразу для нескольких страниц, пускай даже список со всеми буквами разных страниц и не высвечивается ?

(я один глиф меняю на другой и контролировать мне там уже нечего, а 200 раз применять apply - устал)

Автор: asku, Отправлено:16:06 26-10-2022

Добрый день.

Опять что-то не получается добавить текстовый слой проекту. Может забываю какой-то нюанс.
Использую Файнридер 15.

Насколько помню, в самом файнридере ничего менять (символы и т.п.) категорически нельзя.
Я открываю ФР, кидаю туда сканы ск-проекта, распознаю, сохраняю фр-проект и закрываю (делал и немного в другом порядке с тем же результатом: открываю фр, сохраняю проект, потом кидаю сканы, распознаю и закрываю).

Парсер помещаю в папку data, создаю файл result.bookmarks, который копирую в ск-проект/out/ocr.
Потом в СК в главном окне меню Result — OCR output files — All.

В результате этого в папке OCR создаются постраничные файлы с расширением *.bookmarks.
Сканов у меня в ск-проекте 42 штуки (формат tif) — на первых двух текста нет; bookmarks-файлов же создано 38 (с result00004.bookmarks по result00042.bookmarks), focr-файлов (в папке Out, рядом с тифками) создано 37 (!) — с 0005.tif.focr по 0041.tif.focr

Открываю СК, и там, естественно, текстовый слой смещен на всех страницах, которые я проверял.

Прошу подсказать что я упустил.
Sub-test нужен?

Автор: niccolo, Отправлено:16:40 26-10-2022


Цитата:
Сканов у меня в ск-проекте 42 штуки (формат tif) — на первых двух текста нет; bookmarks-файлов же создано 38 (с result00004.bookmarks по result00042.bookmarks), focr-файлов (в папке Out, рядом с тифками) создано 37 (!) — с 0005.tif.focr по 0041.tif.focr


Отсюда надо разбираться, почему распознанных страниц меньше, чем реальных.... Бывает и довольно часто очень странная расстановка блоков распознавания в FR.....

При условии запрета правки пакета - единственный путь обхода - создание постраничных пакетов в FR c ручным исправлением проблемных мест.....


Цитата:
текстовый слой смещен на всех страницах, которые я проверял.

Как вариант, можно попытаться перенумеровать файлы вручную в правильном порядке.....


Если OCR вы используете для исправления марашек и т.п. - теоретически можно попытаться сохранить файл из FR в ПДФ с исправленным текстом поверх страницы, предварительно создав или подобрав похожий шрифт а затем снова его сконвертировать в страничные тиффы. (сам пока не пробовал)

Автор: asku, Отправлено:16:43 26-10-2022


Цитата:
создание постраничных пакетов в FR c ручным исправлением проблемных мест


А если страниц в книге 100? 150? ) Тяжеловато.

Автор: niccolo, Отправлено:16:49 26-10-2022


Цитата:
А если страниц в книге 100? 150? ) Тяжеловато.


Ну во-первых, никто лёгких путей и не обещал....
Во вторых - проблемы могут быть не на всех страницах. и следовательно не нужно делать 150 пакетов.
В-третьих - ну попробуйте исправить пакет вручную, а потом по тексту вручную восстановить соответствие между tiff и focr. Может этот путь рабочий - тогда решается проблема ручного исправления в ФР,

Автор: bolega, Отправлено:18:46 26-10-2022

asku
А что задано в options > misc > bn type=? и v=0?


Цитата:
сохраняю фр-проект

"сохранить как" под другим именем пробовали? Мне это помогало, даже если я вносил правки

да в конце концов, откройте result00004.bookmarks (это обычный текстовый файл), посмотрите, какой реально странице он соответствует. Может у вас сдвиг задан в options > misc >

Автор: asku, Отправлено:23:26 26-10-2022

bolega
Вот тест-файл. Он правда объемный получился — под 50 мег, там первые несколько сканов.

Вот options > misc > bn type= и v=

Что такое bn type я не знаю, и не трогал ее.
А v изменял, думал, подгоню, но что-то я не понимаю, как там меняется. Пробую и -1, и +1, и -2, и +2, и т.д. По-моему никаких изменений.


Цитата:
да в конце концов, откройте result00004.bookmarks


Открыл. На самом деле у меня не две первые страницы пустые а три (первый разворот и левая страница второго разворота). Вот result00004.bookmarks соответствует первой странице (после пустых) на которой есть текст. Логично, но как подогнать options > misc > и v=.


Цитата:
"сохранить как" под другим именем пробовали? Мне это помогало, даже если я вносил правки

Все равно все смещено.

Автор: niccolo, Отправлено:00:27 27-10-2022

По тексту внутри определить номера страниц легко - но их перенумерация ничего не даёт. Где хранится информация о привязке - х.з.

Добавление 0 к названиям focr файлов не привело к удалению OCR информации из пакета..... Чудеса....

Автор: bolega, Отправлено:01:32 27-10-2022


Цитата:
Пробую и -1, и +1, и -2, и +2, и т.д. По-моему никаких изменений.

Задайте v=0, что означает, что в FR передавались все страницы, включая и первые пустые. Если передавать начиная со второй, т.е. пропустить одну, то v=1.
После изменения v обязательно в СК выполнить команду ocr all pages, чтобы пересоздать focr-файлы с учетом привязки v. Иначе ничего не поменяется.

Автор: asku, Отправлено:01:40 27-10-2022

bolega, получилось! Спасибо!

А что означает опция options > misc > bn type ?

Автор: bolega, Отправлено:02:04 27-10-2022


Цитата:
что означает опция options > misc > bn type ?

В FR-файле bookmarks страницы нумеруются всегда начиная с 1. Чтобы СК мог определить, какому выходному файлу задания СК соответствует i-я страница из bookmarks, используется bn type и v. V задает смещение, а bn type - тип соответствия. Если выходные файлы СК имеют сплошную нумерацию (по умолчанию так), то bn type=res#=#tif, т.е. номер страницы пакета FR равен номеру в имени out-файла. Если выходные файлы СК имеют произвольные имена (это когда задавалось prefix=*), то предыдущий вариант не сработает. Тогда bn type=res#=#out, т.е. номер страницы пакета FR равен порядковому номеру out-файла.
Таким образом, привязка ocr к out-файлам выполняется только в момент вызова команды СК ocr (всех страниц, или текущей). После этого bn type и v не используются.
Если уже после команды OCR выполнять изменение порядка страниц в задании СК (перемещать страницы, менять местами, удалять, добавлять, дублировать), то СК автоматически будет переименовывать focr-файлы. Но вот повторно давать команду OCR уже нельзя. Потому что внутри FR-файла bookmarks порядок страниц остался прежним и он уже не будет соответствовать порядку файлов в задании СК. В этом случае придется распознавать в FR по новой, с созданием нового задания.

Автор: niccolo, Отправлено:15:33 27-10-2022

bolega

Если не трудно, объясните, почему нельзя выставить соответствие tiff и focr простым переименованием?

Автор: asku, Отправлено:16:05 27-10-2022

bolega
Вы не могли бы еще добавить выбор буквы «й». Вот где к выбору предлагается «и», там чтобы и «й» была.
Мелочь, но облегчает работу.


Автор: bolega, Отправлено:16:42 27-10-2022

niccolo

Цитата:
соответствие tiff и focr простым переименованием?

Вы можете переименовывать focr в файловом менеджере, это не запрещается. Но следует иметь в виду, что СК считывает focr-файлы один раз, т.е. кэширует их. Если вы вручную что-то переименовываете, то надо обязательно переоткрыть задание, чтобы СК перечитал файлы с ocr-слоем.

Автор: asku, Отправлено:18:54 29-10-2022

bolega, опять та же проблема с текстовым слоем.
Сделал смещение 0, заново сделал Result — OCR output files — All..

На первой странице, имеющей текст (титул), все нормально с текстовым слоем, дальше смещение. Я не понимаю, в чем проблема. Неужели это будет теперь в каждом проекте происходить...

Прилагаю на всякий случай субтест.

Автор: daa2013, Отправлено:08:01 30-10-2022

Я уже книг 7 сделал с автоглифами, и ни разу не видел таких смещений, будь то титул или страницы-пустышки.
Посмотрел субтест, и рискну предположить:

я всегда сначала разрезаю развороты на отдельные страницы и только потом распознаю.
Т.е., когда я делаю автоглифы, у меня отдельный самостоятельный проект из одинарных ч.б. страниц. После "реставрации" я их возвращаю в тот проект, в котором пойдет сборка.
Может, в работе с разворотами причина проблемы ?

У меня версия FR 14.0.107.232

Автор: asku, Отправлено:08:26 30-10-2022

«я всегда сначала разрезаю развороты на отдельные страницы и только потом распознаю».

Я тоже, естественно, так делаю.

Автор: daa2013, Отправлено:08:29 30-10-2022

в смысле, что у меня в проекте, где я распознаю, вообще нет разворотов. Даже как входных.

Автор: asku, Отправлено:18:32 30-10-2022

bolega

Пересохранил проект файнридера под другим именем и все встало на свои места. Спасибо.

Странно как-то все-таки...

Автор: NME, Отправлено:19:28 30-10-2022

asku

Цитата:
Странно как-то все-таки...

ничего странного нет, надо соблюдать порядок действий, в котором сохранение проекта должно идти после распознания.. т.к. файнридер распознаёт файлы вразнобой и в этом же порядке инфу о них записывает в исходный файл textStorage.dat, то и получается несовпадение.. а когда проект сохраняется в новое место - он сортирует и записывает информацию о распознанных страницах в правильном порядке..

Автор: daa2013, Отправлено:19:28 02-11-2022

Мне помнится, я как-то писал, что в RV в режиме Сompare обработка и исходник должны показываться одинаково, но получил ответ, что там довороты, поля, и в общем, не получится.

Возникла идея:
сделать кнопочку или шорткатик, так чтобы если включить, оба окна как-бы залипали и синхронизировались. Т.е. в одном колескиом сделан зум - он делается и в другом на такую-же пропорцию. Одно окно скроллбарами или курсором-рукой подвинули - и другое тоже на такое же расстояние смещалось. При выключении же режима (отжатием кнопочки или повтором шорткатика), панели снова вели бы себя независимо.

Т.е. в момент нажатия этой кнопочки изображения условно признаются тождественными и далее отображаются одинаково (изменение отображения синхронно применяется к обоим).

Тогда, один раз настроив совпадение, далее можно об этом не думать.

Автор: daa2013, Отправлено:01:33 03-11-2022

Я опять удалил все тщательно собранные глифы ....

Автор: Benoni, Отправлено:18:00 03-11-2022


Цитата:
Я опять удалил все тщательно собранные глифы ....

Зачем? И не с кем не поделились...

Автор: daa2013, Отправлено:10:38 04-11-2022

Возникла идея об одном возможном усовершенствовании в работе с глифами.

На странице два шрифта. Обычный и болд. Болд забираю во флудфил зону, чтобы исключить из анализа. Проанализировал, заменил, всё ОК.
Но затем для болда мне надо переключиться на другую закладку глифов и по новой перевыставить это выделение, чтобы сделать там анализ.

Можно ли сделать так, чтобы иметь возможность объявить флудфил-участок участком простого выделения для анализа внутри него ? Тогда ничего перевыставлять будет не надо, а просто переключиться между закладками и сменить тип выделения. (кнопкой или шорткатом).


Автор: bolega, Отправлено:16:34 05-11-2022

daa2013
У кнопки создания FF-зоны в КМ уже есть команда: Convert FF-limiters to selection - преобразует все FF-зоны в сложное выделение.
Возможно, для вашего случая больше подойдет включение/выключение режима Inverse mode (там же, в КМ). Если он включен, то трактовка зон-ограничителей инвертируется, т.е. analyse будет применяться только к тем буквам, которые попадают в зону, а не наоборот.

Автор: TelecomUral, Отправлено:20:38 05-11-2022

bolega
что-то у меня не вышло выделить красным файлы с зонами типа Transit. Выделяются все файлы с зонами.
Попробовал два варианта установки: ставил только галку Transit и галки на Transit и Pic (это в разных выпадающих списках).

Автор: daa2013, Отправлено:12:18 06-11-2022

bolega
Это здорово, когда ты что-то придумал, а оно в СК уже есть !

Автор: kamenkapenza, Отправлено:13:21 06-11-2022


Цитата:
bolega
Это здорово, когда ты что-то придумал, а оно в СК уже есть !

Простора для творчества хватает. Есть пути, по которым никто не ходил, а если ходил, то давным давно, и они все покрыты мхом и зарослями.
Пора придумывать новую Хрестоматию (Энциклопедию)с подробным объяснением каждого меню. В старой, например, совсем ничего нет про настройки зон картинок, меню sharpen, blur, filters, filters2 и т.п. (там много всяких параметров, которыми непонятно как пользоваться и в каких ситуациях). Про это точно нигде нет, и никто про это ничего не знает. Это касается не только зон картинок. В Кромсаторе много всего такого, про что знает только один человек))).
И ещё есть какой то Тессеракт, видео про который не существуют. Какая то секретная программа. Про этот Тессеракт на ютубе (хотя там всё есть) ничего нет, а если и есть (с названием Тессеракт), то только какое то басурманское видео неизвестно про что, далеким от создания книг.
По большому счету неплохо было бы начать создавать видео (специальный видеоканал) систематизированно, начать от самых азов пользования программой, большое количество времени посвятить изучению каждого пункта меню (подменю), практически показывая на экране работу всех параметров. Это было бы грандиозно! Показать работу всех меню программы. не спеша, не торопясь.
Вот о чем мечтает простой советский российский народ!

Автор: daa2013, Отправлено:04:35 07-11-2022

Придумал еще одно усовершенствование для работы с глифами.

Кликнуть в распознанное слово (зеленую рамку), и чтобы оно автоматически по буквам перенеслось на активную закладку глифов с ассоциированными буквами. (Лишние буквы потом можно руками удалить, ошибочные ассоциации переназначить).

Upd

было бы здорово, если кнопка Set floodfill limiter работает в Inverse mode, то она приобретала бы другой оттенок цвета или рамку какую-нибудь. Путаюсь постоянно.

Автор: bolega, Отправлено:13:06 07-11-2022


Цитата:
Кликнуть в распознанное слово (зеленую рамку), и чтобы оно автоматически по буквам перенеслось на активную закладку глифов с ассоциированными буквами

А команда КМ Add symbol to glyph library когда мышь над буквой, не хватает? Нужно именно все буквы слова запихивать?
Т.е. в КМ еще одну команду Add word's symbols to glyph library

Автор: daa2013, Отправлено:18:02 07-11-2022

Да. По одной букве - слишком медленно. К тому же в поиске наилучших глифов не по одному претенденту приходится тестировать. (Смотреть, как в других местах книги после вставки смотрятся.)
Хорошие, как правило, кучкуются и с одной страницы их много приходит. Для заголовков также полезно.
Можно также выделение делать, и все буквы, кто внутрь него попал, на панель забирать.

К тому же тут сразу ассоциация между глифом и буквой будет - снова экономия на лишних кликах.

Автор: asku, Отправлено:21:41 08-11-2022

bolega
Не помню, может писал уже об этом здесь.


Нажимаю сортировку (на рис. стрелка), список отсортировывается. Но когда в список вношу изменение, то сортировка пропадает и снова надо кнопкой сортировать. Нельзя ли сделать так, чтобы сортировка не пропадала?

Автор: kamenkapenza, Отправлено:11:43 13-11-2022

Можно ли как то применять фильтры blur. sharpen. filters. filters2 к тексту? Это же фильтры улучшения букв,но они входят в настройки зон рисунка, т.е. вся работа с этими фильтрами происходит только в области выделенной зоны.

Автор: qwaxym, Отправлено:15:05 13-11-2022


Цитата:
Можно ли как то применять фильтры blur. sharpen. filters. filters2 к тексту?

kamenkapenza в гл. окне настроек выбрав Quality, ставите галку на Enhanse, появятся эти пять фильтров, а если мало, то ниже ещё кнопка Enhanse, там вообще всё что угодно!))

Автор: kamenkapenza, Отправлено:17:57 13-11-2022

qwaxym, спасибо!
Установка этих фильтров для конкретной страницы или есть применения для всей книги или группы выбранных страниц?
Жаль, что нет конкретного разъяснения по этим фильтрам, какой за что отвечает и кина по этому поводу, никто фильму не снял для учащихся (этой программе).
Надо будет на практике визуально проверить, что меняется при изменении параметра каждого фильтра.

Автор: qwaxym, Отправлено:22:02 13-11-2022


Цитата:
Установка этих фильтров для конкретной страницы или есть применения для всей книги или группы выбранных страниц?

Насколько я помню, если ставите галку с нажатой Ctrl—для всех страниц, без—для выделенной страницы. Фильтры Sharp—повышающие резкость, bloor—когда нужно размытие, применяют в паре.

Автор: xMARx, Отправлено:11:01 14-11-2022

__Всем привет. Можно ли в окне Result View вставлять глифы одним нажатием: то есть выбран глиф, я десять раз тыкнул в нужных местах и 10 раз вставил. Было бы очень удобно. Сейчас я 10 раз перетаскиваю глиф и 10 раз нажимаю ЛКМ - дольше выходит

Автор: TelecomUral, Отправлено:11:31 14-11-2022

xMARx
можно. различными способами. подробности в роликах от bolega и в whatsnew.

Автор: xMARx, Отправлено:15:29 14-11-2022


Цитата:
можно. различными способами. подробности в роликах от bolega и в whatsnew.

__В начале заметил, что можно вставлять глиф с помощью ctrl+v. Потом нашел галочку на вкладке preferences панели глифов, чтоб при двойном клике ЛКМ глиф вставлялся.
__В ближайшее время попробую разобраться с кнопкой режим замены распознанных символов.
Гугл ответ сходу не дал. Надеюсь в видеороликах от Болега он есть.

Автор: TelecomUral, Отправлено:15:43 14-11-2022

xMARx
whatsnew приложен к дистрибутивам. очень рекомендую его читать и перечитывать.

Автор: kamenkapenza, Отправлено:15:33 16-11-2022


Цитата:
Насколько я помню, если ставите галку с нажатой Ctrl—для всех страниц, без—для выделенной страницы. Фильтры Sharp—повышающие резкость, bloor—когда нужно размытие, применяют в паре.

qwaxym, спасибо!
Господа! Что особенно влияет на размер выходного djvu-файла, получаемого через Скан Кромсатор? Все страницы делаю 600 дпи. Делал книгу, на каждой странице черно-белый рисунок, пришлось делать каждый как зона картинки, потому что если этого не делать, то получается махрово черным. 430 страниц книги (djvu-файл) получился в 200 Мб. Плюс ещё в книге с десяток цветных вкладышей. Нормальный размер или не очень? Как то не привык я 300 дпи для страницы делать, а в 600, без потери качества изображения.


Автор: shch_vg, Отправлено:11:47 17-11-2022

kamenkapenza

Цитата:
430 страниц книги (djvu-файл) получился в 200 Мб. Плюс ещё в книге с десяток цветных вкладышей. Нормальный размер или не очень?

Конечно, нет!
В 2007 году я обработал книгу большого формата с множеством цветных и черно-белых фото и иллюстраций 378 страниц (включая обложки). Дежавю ее имеет размер чуть больше 17 мб.
Не преподношу ее как вариант идеальной обработки, да и возможности обработки 2007 г. и нынешние очень отличаются. Это книга Ежи Гижицкого "С шахматами через века и страны,1970". Сейчас ее можно найти во многих местах, например, по этой ссылке.
Еще раз повторяю, это лишь пример для ориентации, какой может быть размер книги примерно того же формата с огромным количеством разного рода иллюстраций.

Автор: TelecomUral, Отправлено:15:41 17-11-2022


Цитата:
kamenkapenza
Нормальный размер или не очень?

целиком зависит от содержания рисунка. "Нормы" не существует.

Автор: shch_vg, Отправлено:15:57 17-11-2022

TelecomUral

Цитата:
целиком зависит от содержания рисунка

Я бы добавил, что от параметров обработки зон и параметров компиляции дежавю.

Автор: TelecomUral, Отправлено:16:19 17-11-2022


Цитата:
shch_vg
Я бы добавил, что от параметров обработки зон и параметров компиляции дежавю.

это следствие, а не причина. Наилучший размер - естественно, ноль байт, т.е. вообще книгу не делать.

Автор: shch_vg, Отправлено:17:36 17-11-2022

TelecomUral

Цитата:
это следствие, а не причина

Любая обработка это следствие. Что Вы понимаете под причиной, не очень понятно, но качество результата определяется тем, что хотите и можете получить при обработке.

Автор: TelecomUral, Отправлено:19:15 17-11-2022

[more=оффтоп: норма UPD]shch_vg

Цитата:
Любая обработка это следствие

естественно.

Цитата:
Что Вы понимаете под причиной, не очень понятно, но качество результата определяется тем, что хотите и можете получить при обработке.

вы сами себе ответили: "что хотите". Из этого будет вытекать любая обработка. То есть параметры компиляции и тэ дэ. Поэтому каменке надо себя спрашивать, чего именно он хочет, а не людей. Тогда и норма определится, и любой размер станет адекватным норме. Иначе вообще нет смысла обрабатывать: наилучший результат при отсутствии осознаваемого желания/хотения - всегда ноль.

UPD
в либгене лежит Фалеева, про кружево. 336 стр, 271Мб. Выводы каждый делает по своей норме.
[/more]

Автор: daa2013, Отправлено:23:11 17-11-2022

вся идея сжатия джву заключается в разделении изображения на разные составляющие и кодирования каждой о своему методу.
текст с резкими контурами - 600 дпи - шейпами (повторяющимися пиксельными структурами = буквами)
картинки с плавными переходами цветов 300дпи - вейвлетами (грубо говоря - волнообразными структурами).

делать малоцветный текст вейвлетами - контуры плывут
делать рисунки попиксельно - либо конский размер при исходных дпи, либо неестественные переходы между участками (ступеньки, лесенки - ненужная пикселизированность).

делать всю страницы с текстом и картинками в режиме 600 дпи фото - это все равно что исходные сканы обрезать и выложить. Это избыточно.

Смысл обработки и заключается в разделении текст/картинки.
Наиболее часть встерчающаяся стандартная схема 600 дпи и 300 дпи.
Но ее может не хватать.

Мелкие буквы - возможно 1200 дпи текст потребуется.
Мелкие детали изображения - 300 мало - может 400 или 600 дпи картинки.
Изображение крупное - можно и до 200 уронить.

Джву позволяет отдельные старнциы делать не так как остальные.
Могу привести примеры где 600 текст и 600 картинки. Где 1200 текст, 300 картинки и 400 - карты.

Закодировал. Толсто. Уронил качество картинок и посмотрел не теряются ли детали, которые ты считаешь нужными.
Если теряются, то уменьшать нельзя.

Автор: TelecomUral, Отправлено:07:29 18-11-2022


Цитата:
daa2013
Закодировал. Толсто. Уронил качество картинок и посмотрел не теряются ли детали, которые ты считаешь нужными.
Если теряются, то уменьшать нельзя.

по идее да, квинтэссенция выбора метода кодирования именно такая. И обработки тоже. Бессмысленно блюрить (размывать) штриховую гравюру если я ценю как раз мелкие штрихи. Работу гравера.

Только я бы сказал, что сами детали, на которые надо обращать внимание, я выбираю либо в бумаге, при сканировании, либо во время отсмотра первичных сканов, когда расставляю зоны. Самое то выходит: весь скан тщательно отсматривается на предмет особенностей для простановки зон. Ну и автоматом вылазит список "деталей", за которыми слежу в итоговой дежавюшке. Пропали детали - меняю способ их обработки и сжатия.

Автор: kamenkapenza, Отправлено:12:37 19-11-2022

Господа! Спасибо за разъяснения по размеру djvu-файла!
Хотелось бы видеть в новой версии программы (предложение создателю Скан Кромсатора уважаемому boiega) возможность присвоения индекса группы без захода в свойства зоны.
Например, в книге цветной текст,черно-белые картинки и цветные картинки. То есть получается три индекса групп. 1-цветной текст, 2-черно-белые картинки, 3-цветные картинки. Последняя операция, например, была создание зоны цветной картинки, а следующая зона цветного текста, но она по умолчания (при обведении зоны) будет как зона картинки - как последняя созданная зона. Создаем зону, кликаем по зоне ПКМ и появляется меню присвоения индекса зоны, выбираем нужную (держа в памяти, какой индекс соответствует какой зоне). Это бы упростило задачу создания зон, когда их не одна, и они постоянно чередуются. Или не ПКМ, а на главной панели изменение индекса последней выделенной зоны.

Автор: DmitryKz, Отправлено:13:00 19-11-2022

kamenkapenza
Горячие клавиши для этой цели назначьте.
Тогда индекс группы будет назначаться либо при выделении зоны и последующем нажатии горячей клавиши. Либо при создании зоны и в самом конце нажатии горячей клавиши.

Автор: shch_vg, Отправлено:13:09 19-11-2022

kamenkapenza
Для трех вариантов зон запомнить их индексы может быть и не так трудно, а если их гораздо больше (например, плюс несколько вариантов заливки фона картинки разными цветами, плюс заливка текста картинки разными цветами, плюс еще можно придумать варианты)?
В этом случае без захода в свойства можно наставить не то, что надо.
Проще вместо предлагаемого меню привязать к клирборду номер индекса из первой закладки свойства зоны.
Тогда по двойному щелчку ЛКМ заходим в свойства, выбираем якобы нужный нам индекс и сразу видим изменения на первой закладке. Если они нас устраивают, то закрываем свойства зоны, если нет, можно поискать в соседних индексах (в случае различия зон по признакам из других зон придется переходить на соответствующую закладку свойства зоны).

Автор: kamenkapenza, Отправлено:17:58 19-11-2022


Цитата:
Для трех вариантов зон запомнить их индексы может быть и не так трудно, а если их гораздо больше (например, плюс несколько вариантов заливки фона картинки разными цветами, плюс заливка текста картинки разными цветами, плюс еще можно придумать варианты)?

shch_vg, это вариант для 2-3-х индексов зон (основная масса книг подпадает в эти требования). Особенно,когда в книге много однотипных картинок плюс цветной текст (название главы наверху каждой страницы), в этом случае было уместно поверхностное назначение индексов(без захода в свойства зоны)


Цитата:
Горячие клавиши для этой цели назначьте.

DmitryKz,а в каком именно пункте настроек горячих клавиш можно назначить смену индекса зон? Я по-английски не понимэ. Год надо будет искать нужную строчку.




Автор: DmitryKz, Отправлено:18:09 19-11-2022

kamenkapenza
меню File — Options — вкладка Hotkeys (переключатель в Main windows):

Автор: kamenkapenza, Отправлено:18:44 19-11-2022

DmitryKz, понял. Большое спасибо!
Не получается с помощью горячих клавиш, номера индексов не соответствуют их параметрам, вот практическое видео https://disk.yandex.ru/i/WE9KsGk8EEzt3A

Автор: TelecomUral, Отправлено:19:29 19-11-2022


Цитата:
Не получается с помощью горячих клавиш, номера индексов не соответствуют их параметрам

этого никто и не обещал.
индекс индексом, а параметры зоны сами по себе. хотите - размножайте параметр(ы) с ограничением по индексу.

Автор: kamenkapenza, Отправлено:20:38 19-11-2022

Ну и смысл тогда цыферки проставлять, если они не соответствуют действительности?!
Тогда мой запрос автору программы остается в силе для новой версии программы(всё равно же надо какие то прибамбульки вносить, отличающие новую версию от предыдущей).
Сделать возможность присваивать индексы зонам (каждому индексу соответствуют предустановленные заранее параметры) без входа в свойства зоны. Такая полезная вещь была бы нужна в следующих книгах: где немного различных зон (индексов); где, например, достаточное число картинок в книге и на каждой странице цветным текстом проставлено название главы, и приходится постоянно заходить в зоны и менять индексы (параметры). А сделать бы следующее: по зоне рисунка ПКМ - появляется список индексов (каждому индексу соответствуют предустановленные в свойствах зоны параметры), Или на главном меню функцию выбора индексов зон.

Автор: DmitryKz, Отправлено:21:07 19-11-2022

kamenkapenza
Сначала расставьте все зоны во всей книге со своими индексами, на параметры пока не обращайте внимания.
Затем параметры каждого индекса занесите в слоты буфера обмена. А затем размножайте эти параметры через кнопку Copy to group... в свойствах зоны с установленным флажком Apply only to group [индекс группы].

Автор: TelecomUral, Отправлено:06:55 20-11-2022


Цитата:
Ну и смысл тогда цыферки проставлять, если они не соответствуют действительности?!

действительности нет, пока кто-то её не создаст.
За вас что, болега должен был подумать, еще год назад, что в вашей книге индекс=1 это обязательно "цветная фотка" а индекс=2 обязательно "цветной текст"? Нет. Обработчик сам фантазирует над всеми свойствами конкретной зоны конкретной книги.
СК - инструмент. Хороший профессиональный инструмент. Вы от молотка не требуйте, чтобы он сам за вас гвозди забивал. В нужном вам месте и под правильным углом. Желательно не ночью, чтобы соседей не будить.

Автор: bolega, Отправлено:08:47 20-11-2022

В whatsnew было такое:

Цитата:
- MW: Добавлена панелька с кнопками для работы со свойствами зон: Show > Show paste zones options toolbar. Кнопки позволяют изменять свойства зон не вызывая диалога Picture zone properties. Первые пять кнопок присваивают выбранной зоне свойства, находящиеся в соответствующем кармане №1..5. Если выбранной зоны нет, то команда просто копирует в текущий набор свойства из кармана №1..5. Текущий набор - это набор свойств, который по умолчанию будет присваиваться очередной создаваемой зоне. Шестая кнопка присваивают выбранной зоне свойства, находящиеся в текущем кармане.

Автор: shch_vg, Отправлено:15:37 20-11-2022

bolega
Активировать панельку с кнопками для работы со свойствами зон удалось, но поместить в нее вновь созданную зону не получилось, хотя sk.6.8.whats.new.txt просмотрел
Еще непонятен смысл нахождения в хоткеях главного окна девяти строк Create picture zone with group, если максимум, с чем можно оперировать, это 5 + текущее.

Автор: TelecomUral, Отправлено:16:21 20-11-2022

shch_vg
работает. непривычно только.
сначала панелька с неактивными z1-z5. Открываете свойства зоны, по ПКМ на кнопке копирования свойств в карман выбираете карман #1, вуаля, первая кнопка на панельке стала активна. И в том же духе #2, #3...

Пока что нашёл минус: если индекс зоны в уголке подсвечен (на жёлтом поле), он при нажатии кнопки на панельке сразу не меняется. Только если вызвать свойства зоны.

А вообще - удобно. Я ещё не приспособился эту панельку юзать, но вот попробовал - да, вещь.

+
Мысль мелькнула: можно ли устроить режим "вставлять в зону все свойства, но кроме индекса группы". Вкл/выкл этот режим по ПКМ на кармашке или нечто подобное. Мысль свежая, возможно шальная и ненужная.

Автор: Ladina, Отправлено:17:04 20-11-2022

Иногда), возникает необходимость кое-что подчистить после обработки в IrfanView. Что странно, даже если ничего не менять в тифах, а просто сохранить после открытия, меняется размер файла. Он не ухудшает качество? Версия сканкрамсатора не новая,если имеет значение.

Автор: VadimirTT, Отправлено:17:18 20-11-2022


Цитата:
меняется размер файла

Меняется формат сжатия, вернее отменяется, сжатие ч/б в кромсаторе без потерь - fax4, т.е., можно не париться.

Автор: Ladina, Отправлено:17:32 20-11-2022

Можно понятнее написать? Не париться в каком смысле? Могу совсем в баню не ходить, если нужно для дела.
IrfanView-ом лучше не пользоваться после СК, или изменения, вносимые им можно не замечать?)

Автор: TelecomUral, Отправлено:17:53 20-11-2022


Цитата:
Ladina
меняется размер файла

?! вы используете СК как редактор оригинальных тиффов? Оригинально
Посмотрите в потрохах файла на метод его сжатия до и после сохранения, вот вам о чём VadimirTT написал. Лично я ни разу в жизни не столкнулся с такими проблемами в СК, но мало ли.
Проверочный путь - сравните попиксельно, есть спецпроги для этого. Или хотя бы приведите выходной файл к методу сжатия входного. Тогда отличия содержимого должны быть в нескольких байтах.

UPD
Хм...
перечитал вот это и завис

Цитата:
IrfanView-ом лучше не пользоваться после СК


получается, вы задали вопрос про ирфан, а не про СК.
А вот ирфан при сохранении "save as..." легко меняет метод сжатия. У меня стоит LZW, как самый выгодный. Но при чём здесь ветка Кромсатора?

Автор: shch_vg, Отправлено:18:05 20-11-2022

TelecomUral

Цитата:
вуаля, первая кнопка на панельке стала активна

Спасибо, я, честно говоря, думал, что панель эта замена Copy options из свойств зоны, а не такое экзотическое расширение.
bolega
А нельзя ли все эти наборы свойств зоны завязать на индекс в свойствах зон?
Типа активирую в хоткеях какой-то индекс, затем создаю зону с использованием этого хоткея, заполняю нужными свойствами. Далее при создании очередной зоны по этому хоткею все свойства зоны копируются из привязанной к индексу хоткея зоны. Вот тогда создание разных типов зон будет максимально упрощено. Дальнейшие изменения какого-нибудь свойства в зоне, привязанной к хоткею, должно приводить к изменению у всех зон привязанных к нему.

Добавлено:
TelecomUral
[more=оффтоп]

Цитата:
А вот ирфан при сохранении "save as..." легко меняет метод сжатия.

Я замечал, что иногда и увеличивает глубину цветности[/more]

Автор: TelecomUral, Отправлено:18:21 20-11-2022


Цитата:
shch_vg
Дальнейшее изменения какого-нибудь свойства в зоне, привязанной к хоткею, должно приводить к изменению у всех зон привязанных к нему.

вы не представляете, похоже, какие глюки начнутся при обработке с такими условиями Хорошая толстая красочная книга советского периода - это не одна сотня зон запросто. Иногда зона настраивается под содержимое или бумагу. И приплыли.

Автор: shch_vg, Отправлено:18:24 20-11-2022

TelecomUral

Цитата:
И приплыли.

Это я не понял, в чем проблема?
Вы хотите сказать, что при какой-то обработке будет более 9 различных зон?
Тогда можно отвести, допустим, индекс ноль для остальных.

Автор: Ladina, Отправлено:18:24 20-11-2022


Цитата:
получается, вы задали вопрос про ирфан, а не про СК.
Это логично, потому что в этой ветке точно знают IrfanView, а вот в теме редактора спросить про СК совсем дико.)

Цитата:
ирфан при сохранении ирфан при сохранении "save as..." легко меняет метод сжатия. У меня стоит LZW легко меняет метод сжатия. У меня стоит LZW

да, да, конечно "save as..." как CCITT Fax 4 и... происходит сжатие. Ведь простой вопрос, что он там ужимает ещё и влияет ли это на качество.

Спасибо за ответы.

Автор: shch_vg, Отправлено:18:31 20-11-2022

Ladina

Цитата:
Ведь простой вопрос, что он там ужимает ещё и влияет ли это на качество.

Вопрос-то простой, ответ на него посложнее.
Очевидно, что любое изменение метода сжатия не улучшает качество.

Автор: TelecomUral, Отправлено:18:32 20-11-2022

оффтоп

Ladina
а дайте страничку, пример до и пример после. Заинтриговали, что там ещё можно сжать.

Автор: Ladina, Отправлено:18:35 20-11-2022

Да откройте любой черно-белый тиф у себя на компе и посмотрите сами, с моей низкой скоростью в воскресный вечер утомительно этим заниматься.)

Автор: newTrampos, Отправлено:18:40 20-11-2022

shch_vg

Цитата:
Вопрос-то простой, ответ на него посложнее.

Все просто, любое "перегоняние" в другое качество = плохо, исходник - дальше хоть упрись, лучше не сделаешь. Всякие фильтры и прочую херь применить можно, но это 1 - видно, 2 - явная лажа даже для "слепошарых". Авидемукс для этих "целей" идеал непревзойденный.

Автор: TelecomUral, Отправлено:19:11 20-11-2022

оффтоп

Ladina
exiftool показал, что ирфан откинул некоторые данные об изображении. Действительно - это же тиффы, там внутри может быть много упихано про картинку. BMP из этих тиффов идентичны.

Добавлено:

Цитата:
shch_vg
Это я не понял, в чем проблема?
Вы хотите сказать, что при какой-то обработке будет более 9 различных зон?
Тогда можно отвести, допустим, индекс ноль для остальных.

я хочу сказать, что вы в голове не удержите более чем "7+/-2" объекта. Потом вам захочется как-то отмечать нестандартные моменты в зонах. И крыша поедет, ссылки на ссылки плюс уникальные спецограничения помнить. Это концептуальный тупик. Представьте, что вы отложили задание на две недели, в отпуск ушли. Посредине 500 страниц встали, и вот надо вернуться. Где там какие уникальности были?.. Какие индексы что означают?..
А если в параллельной обработке шесть книг различного типа?

Для типичной книги нынешних возможностей по зонам хватает с избытком. Я не смог придумать ни одной задачи, где бы Кромсатора "не хватало". Да, он неидеален для особых случаев. Но этих особых случаев - парочка на тысячи обычных.

Автор: bolega, Отправлено:19:33 20-11-2022

Размер тифа после СК может отличаться от размера в других прогах (из-за разных реализаций кодера). Но попиксельно будет то же самое, хоть FAX, хоть LZW, это все lossless методы сжатия.
Есть один нюанс, тиф может содержать внутри служебные и всякие дополнительные тэги, в них может храниться какая угодно информация и какого угодно объема. Т.к. эта информация к графическому содержимому картинки отношения не имеет, то СК при открытии тифов от нее избавляется. При пересохранении это приведет к изменению размера. Но на самой картинке это никак не скажется.


Добавлено:

Цитата:
Еще непонятен смысл нахождения в хоткеях главного окна девяти строк Create picture zone with group, если максимум, с чем можно оперировать, это 5 + текущее.

Вы видимо путаете номер кармана и номер (индекс) зоны. Это вещи абсолютно независимые.

Автор: kamenkapenza, Отправлено:20:46 20-11-2022


Цитата:
- MW: Добавлена панелька с кнопками для работы со свойствами зон: Show (View) > Show paste zones options toolbar.

bolega, большое спасибо! То, что мне хотелось - оказывается, уже придумано (хотя народ, судя по всему об этом даже и не подозревал )) ), поэтому каждый видеоролик от вас открывает глаза на существующее, но никому не ведомое.

Автор: shch_vg, Отправлено:02:06 21-11-2022

bolega

Цитата:
Вы видимо путаете номер кармана и номер (индекс) зоны. Это вещи абсолютно независимые.

Это-то я понимаю, я спрашивал, какой смысл заводить 9 хоткеев, если при работе я смогу через карманы использовать только 5, единственное объяснение этому вижу в том, что индекс используется и в других групповых операциях с зонами.
И еще не могли бы Вы ответить на вопрос, заданный мной здесь?

Автор: TelecomUral, Отправлено:05:26 21-11-2022


Цитата:
если при работе я смогу через карманы использовать только 5

хоткеи не применяются в карманах. хоткей ставит зону с индексом 1-9. содержимое кармана #1-#5 вызывается только его кнопкой. В любой карман можно сохранить зону с любым индексом. Н-р, в #4 зону 8.

Автор: bolega, Отправлено:07:59 21-11-2022

shch_vg

Цитата:
Это-то я понимаю, я спрашивал, какой смысл заводить 9 хоткеев

Потому что имея разбивку зон по индексам, можно выполнять практически любую массовую операцию, даже не имея карманов. Поэтому для индексов предусмотрено больше возможностей, чем для карманов. Логичнее был бы вопрос "почему карманов не 9 а только 5, карл?"

Если вы про это

Цитата:
Дальнейшие изменения какого-нибудь свойства в зоне, привязанной к хоткею, должно приводить к изменению у всех зон привязанных к нему.

то посмотрите, мне daa2013 всю плешь проел , потому что на удаление глифов у меня всего одно предупреждение, а не три-четыре, как в других порядочных прогах! А вы предлагаете неконтролируемое размножение свойств при каждом чихе. Нет уж, такого не будет. Достаточно и того, что в любой момент можно размножить опции (или даже одну или несколько) на все зоны с одинаковым индексом.
И не забывайте, что в карман можно помещать не все опции, а часть из них. И именовать их, чтобы не запутаться. Потом эти имена будут подсказками у кнопок.

Автор: TelecomUral, Отправлено:08:23 21-11-2022


Цитата:
bolega
И именовать их, чтобы не запутаться. Потом эти имена будут подсказками у кнопок.

тэкс! карманы можно именовать? не припомню такого в whatsnew и в роликах. Как сделать это и как сделать в карман пачку опций, а потом на зоны раскидать? Через текущий карман же как-то?

Автор: DmitryKz, Отправлено:08:45 21-11-2022

TelecomUral
Именовать — Правый клик на кнопке Past - нижний пункт меню Edit clipboard comments. Давненько уже эта возможность. По крайней мере, в 6.71 была уже.
Опцию в буфер обмена — правый клик на опции и Copy sup-option to clipboard. Последующие — Add...

Автор: bolega, Отправлено:09:06 21-11-2022

TelecomUral

Цитата:
не припомню такого в whatsnew и в роликах.

Было в моем ролике про чистку зон, еще до тех 4-х

Автор: TelecomUral, Отправлено:09:08 21-11-2022


Цитата:
Было в моем ролике про чистку зон

да, после комментария DmitryKz вспомнил.

UPD
что-то меня по стопам shch_vg повело Начал путать номерные карманы с текущим. Текущий-то я знаю как применять.

Автор: shch_vg, Отправлено:14:18 21-11-2022

TelecomUral

Цитата:
В любой карман можно сохранить зону с любым индексом.

Совсем необязательно сообщать то, что я сказал в предыдущем своем сообщении, что хоткеи и карманы никак не связаны.

Добавлено:
bolega

Цитата:
Поэтому для индексов предусмотрено больше возможностей, чем для карманов.

Это тоже понятно, но в моем предложении вообще не требуются карманы. Зона заводится по индексу, если есть соответствующий хоткей. Изменение индекса в зоне либо приводит к изменению свойств, подставляемых из СУЩУСТВУЮЩЕЙ зоны с этим замененным индексом, либо оставляет свойства без изменения, если не активирован соответствующий хоткей.
Насчет изменения свойств в зоне с активированным индексом, то одно предупреждение о том, что будут изменены свойства у всех зон с этим индексом, вполне достаточно задуматься, прежде чем принять окончательное решение.
Мне кажется, что плешь при этом уцелеет, но решать не мне.

Цитата:
И не забывайте, что в карман можно помещать не все опции, а часть из них.

А вот это дает почву для удивленных вопросов, мол, скопировал из кармана, а получил не то, что хотел

Автор: kamenkapenza, Отправлено:14:13 22-11-2022

Можно ли в Скан Кромсаторе склеить две страницы в одну? Видеовопрос тут https://disk.yandex.ru/i/GjAdsz46Abo20Q

Автор: shch_vg, Отправлено:14:31 22-11-2022

kamenkapenza

Цитата:
Можно ли в Скан Кромсаторе склеить две страницы в одну?

В версии 5.94 и ниже без проблем

Автор: serg28serg, Отправлено:18:32 22-11-2022

вкладке PDF есть OCR , ни как не могу найти мануал как наложить текст в PDF через SK.
просто чекбокс включить не достаточно , как я понимаю нужно еще подложить куда то уже распознанный текс в каком то формате , что бы во время создания PDF его подтянуло
просьба подсказать куда копать .....

Автор: TelecomUral, Отправлено:18:41 22-11-2022

serg28serg
в шапке кое-что есть.
распознаете ФР или встроенным тессерактом.

Автор: newquaker, Отправлено:18:50 22-11-2022

Здравия, подскажите каким образом выровнять эту страницу, сабж подходит для этого, или что-то другое попробовать? https://i.imgur.com/cS9XECW.jpeg

Автор: kamenkapenza, Отправлено:20:27 22-11-2022


Цитата:
Здравия, подскажите каким образом выровнять эту страницу

Я страницы в Скан Тейлоре выравниваю.

Автор: Skvodo, Отправлено:22:33 22-11-2022

newquaker

В программах Bookrestorer и Finereader есть геометрическая коррекция строк. http://www.djvu-soft.narod.ru/scan/curved_text.htm

Автор: serg28serg, Отправлено:01:13 23-11-2022

TelecomUral
Цитата:
или встроенным тессерактом.

так вот не могу найти мануал на "как включить встроенный OCR" (русский и инглиш)
просто галки в чекбоксе OCR , что то еще надо доустановить для тессеракта
есть где то мануал на встроенный в SK OCR ?


Автор: TelecomUral, Отправлено:04:57 23-11-2022

serg28serg

Цитата:
есть где то мануал на встроенный в SK OCR ?

размечтались.
да и кто бы зачем скрывал этот мануал, кабы он был в природе. Слушайте ролики от bolega, он все рассказал. Ну и whatsnew кратко излагает суть.
В принципе, когда вышел новый СК, тут в ветке было много вопросов и ответов, как настроить. Где-то с весны.
научитесь - напишите для других.

Автор: serg28serg, Отправлено:13:00 23-11-2022

ну что ж, напишу мануал по встроенному OCR через tesseract, пока все помню
что бы откликалось в поисковике яндекса :
"Как распознать текст через встроенный OCR в ScanKromsator", " tesseract"
1. скачать версию ScanKromsator v6.75 (эту версию потому как в шапке на текущий момент добавки для этой версии : ) скачать из шапки "добавки и замечания к v6.75 от bolega" архив sk6.75-add.rar, правда там папка 6.72
2. все файлы/папки из архива sk6.75-add.rar кинуть в папку с экзешником ScanKromsator
3. настроить путь до , файла "\tessdata2\rus.traineddata"" в меню SK "FILE->Options..->Apps->Tesseract" указать на данный файл
4. в "Page->special->More2->OCR Languares" отметить чекбокс Russian, English , отмечать обязательно с удержанием кнопки Ctrl !!!
5. OCR работает только с BW файлами , выбрать в Files->Color - B/W
6. сохранить как task и Закрыть-Открыт SK , с сохраненным task
......добавляем наши сканы... меняем остальные настройки как нужно нам....
7. Генерим выходной TIFF B/W
8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All
9. если нужен цветной TIFF , то меняем B/W на цветной , генерим TIFF на выход
10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page , наводим на слова , распознанное слово должно всплывать желтым текстовым хинтом

в ScanKromsator v6.8 есть прямо опция PDF сгенерить с OCR
но распознавание в v6.8 с комплектом sk6.75-add.rar - запустить не удалось, распознавание не работает
поэтому PDF создается без текстовой подложки

может будут всплывать сообщения о недостающей DLL или не указан язык или нет папки - значит что то не доделали по пунктикам, конечно касательно версии sk6.75.

может кому то поможет в раскопках по вопросу "как распознать текст в ScanKromsator"

Автор: bolega, Отправлено:16:28 23-11-2022

serg28serg

Цитата:
запустить не удалось, распознавание не работает

Попробуйте продолжить последовательность:
11. File > Create out task
12. В out-task задаем output format=pdf, задаем имя файла, ставим галку на Add ocr
13. Генерим pdf: т.е. process all или для проверки process current page
На выходе будет pdf с OCR слоем.


Добавлено:

Цитата:
5. OCR работает только с BW файлами

Это потому что OCR изначально предназначался для реставрации букв глифами.
Потом я подумал, раз он есть, почему бы его не применить для ocr-слоя. Так появилась возможность создавать ocr-слой в pdf и djvu, не пропадать же добру.
В принципе можно добавить ocr и для цветных страниц, потом сделаю.

Добавлено:

Цитата:
10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page

Это лишне, если до этого уже было:

Цитата:
8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All


Автор: asku, Отправлено:17:01 23-11-2022

bolega
«Так появилась возможность создавать ocr-слой в pdf и djvu, не пропадать же добру».

А разве в СК можно создавать djvu с текстовым слоем? Я думал, только djvu без, слоя (который я уже потом сторонней программой добавляю).

Автор: serg28serg, Отправлено:17:23 23-11-2022

bolega

Цитата:
Попробуйте продолжить последовательность:
11. File > Create out task
12. В out-task задаем output format=pdf, задаем имя файла, ставим галку на Add ocr
13. Генерим pdf: т.е. process all или для проверки process current page
На выходе будет pdf с OCR слоем.

Просьба уточнить , что бы как буду у компа - сразу проверить
вы про связку
ScanKromsator v6.8 с комплектом sk6.75-add.rar ? - то это я проверил и у меня даже на TIFF слой текста не наложился, на вьювере смотрел (то есть tocr в принципе не генерится на этой связке версий SK + Add)
или надо ставить в связке
ScanKromsator v6.8 с комплектом sk6.8-add.rar ? - но тут обыскал всю ветку в печтаном формате, нет упоминаний про sk6.8-add


Автор: TelecomUral, Отправлено:17:44 23-11-2022


Цитата:
11. File > Create out task
12. В out-task задаем output format=pdf, задаем имя файла, ставим галку на Add ocr
13. Генерим pdf: т.е. process all или для проверки process current page
На выходе будет pdf с OCR слоем.

не знаю-не знаю, у меня так не выходит. как только не изгалялся.
задание на свой фтп положил.

Автор: bolega, Отправлено:18:33 23-11-2022

TelecomUral

Цитата:
задание на свой фтп положил.

Не увидел там нужного задания, т.е. чтобы было и out-задание и вых.формат=pdf.
У вас есть out-задания без pdf, и наоборот, исх.задание с pdf (но так не сработает! нужно именно out task).
В итоге открыл test-out-ocr1.spt, задал вых.формат=pdf, включил Add OCR и все получилось...

Добавлено:
serg28serg

Цитата:
ScanKromsator v6.8 с комплектом sk6.75-add.rar

Да, то, что было в 6.75-add, годится для всех последующих версий.

asku

Цитата:
А разве в СК можно создавать djvu с текстовым слоем?

В новой версии уже можно. Но она еще не до конца готова.

Автор: TelecomUral, Отправлено:18:38 23-11-2022


Цитата:
bolega
В итоге открыл test-out-ocr1.spt, задал вых.формат=pdf, включил Add OCR и все получилось.

хм.
я просто это задание с параметрами pdf и add ocr не стал сохранять...
Попробовал - да, так вышло, как вы написали.

UPD
подумал, повспоминал. Вероятно, я всё же не поставил add ocr. Эта галка в странном месте, неассоциативном. Лучше, возможно, вынести её в опции, или ставить включённой по умолчанию.

Автор: Skvodo, Отправлено:04:04 24-11-2022

Раз уж тут пошла речь о Тессеракте, есть предложение по улучшению его функциональности в SK.
Сейчас в SK есть меню подключения языковых моделей к Тессеракт в виде файла (Options > Apps) и отдельно меню с выбором языков распознавания Page > Special > More2 (в котором нет таких распространенных языков как испанский, например).
Было бы очень полезно добавить в SK отдельную опцию, по которой для языков OCR можно было бы выбирать те языки или целые алфавиты, языковые модели к котором были бы просто скинуты в папку с файлами Тессеракта и они бы все подключались к SK автоматически, а галочки к нужным в данный момент языкам можно было бы ставить самому. Это бы решило проблему работы с редкими языками, чтобы каждый раз не переписывать программный код под малоиспользуемые языки, добавило бы возможность подключения языков c экзотическими сложными алфавитами, для которых вообще нет поддержки распознавания в Finereader, но она есть в Тессеракте.
На картинке нарисовано схематично, что я имею в виду. https://imgur.com/a/7jRZxJB

Автор: serg28serg, Отправлено:13:08 24-11-2022

TelecomUral
Цитата:
задание на свой фтп положил.
bolega
Цитата:
Не увидел там нужного задания, т.е. чтобы было и out-задание и вых.формат=pdf.

не идет в 6.8 OCR на TIFF, я вообще без PDF даже, мне бы просто - как и в 6.75 вначале текстовуху на TIFF увидеть (про PDF пока и речи нет)
не идет - ни через Result All , ни через спешел уже во вьювере на любой странице
делаю с теми же настройками что и в 6.75 (да и выше приводил уже мануальчик) , папки конечно индивидуальные под 6.8 и 6.75 , включая Add свои же вложенные

может кто то скинуть свое задание именно из 6.8 с проверенным уже рабочим наложением текстовухи на TIFF во вьювере - задаю вопрос вам, поскольку как миниму вы оба уже это проделали )
скину конечно свой TIFF_to_OCR.spt на яндекс диск , но там смотреть особо и нечего (упоминаю что я на TIFF тренируюсь, про PDF пока рано думать, увидеть бы на картинке слой текста как 6.75)



Автор: kamenkapenza, Отправлено:14:28 24-11-2022


Цитата:
ну что ж, напишу мануал по встроенному OCR через tesseract, пока все помню
что бы откликалось в поисковике яндекса :
"Как распознать текст через встроенный OCR в ScanKromsator", " tesseract"
1. скачать версию ScanKromsator v6.75 (эту версию потому как в шапке на текущий момент добавки для этой версии : )  скачать из шапки "добавки и замечания к v6.75 от bolega" архив sk6.75-add.rar, правда там папка 6.72
2. все файлы/папки из архива sk6.75-add.rar кинуть в папку с экзешником ScanKromsator
3. настроить путь до , файла "\tessdata2\rus.traineddata"" в меню SK "FILE->Options..->Apps->Tesseract" указать на данный файл
4. в "Page->special->More2->OCR Languares" отметить чекбокс Russian, English , отмечать обязательно с удержанием кнопки Ctrl !!!
5. OCR работает только с BW файлами , выбрать в Files->Color - B/W
6. сохранить как task и Закрыть-Открыт SK , с сохраненным task
......добавляем наши сканы... меняем остальные настройки как нужно нам....
7. Генерим выходной TIFF B/W  
8. Генерим выходной tocr (SCAN_0001.tif.tocr) - Result->OCR output files->All  
9. если нужен цветной TIFF , то меняем B/W на цветной , генерим TIFF на выход
10. смотрим через встроенный вьювер , во вьювер вызывая OCR через - правый клик->Special->OCR page , наводим на слова , распознанное слово должно всплывать желтым текстовым хинтом
 
в ScanKromsator v6.8 есть прямо опция PDF сгенерить с OCR
но распознавание в v6.8 с комплектом sk6.75-add.rar - запустить не удалось, распознавание не работает
поэтому PDF создается без текстовой подложки
 
может будут всплывать сообщения  о недостающей DLL или не указан язык или нет папки - значит что то не доделали по пунктикам, конечно касательно версии sk6.75.
 
может кому то поможет в раскопках по вопросу "как распознать текст в ScanKromsator"


Цитата:
serg28serg

Цитата:
запустить не удалось, распознавание не работает  

Попробуйте продолжить последовательность:
11. File > Create out task
12. В out-task задаем output format=pdf, задаем имя файла, ставим галку на Add ocr
13. Генерим pdf: т.е. process all или для проверки process current page
На выходе будет pdf с OCR слоем.
 
 


Эх! Некому всё это в ролике показать, было бы наглядное пособие по созданию pdf с ocr-слоем. Заодно продемонстрировали,что такое tesseract, про него только человек 15 знают, не более.

djvu-книгу я создаю так (нашел самый быстрый оптимальный и качественный способ:
1. После обработки файлов TIFF в Кромсаторе сохраняю задание под определенным именем - субтаск с этим именем - Тулс - Создание джву с установленными параметрами качества файла.
2. Выходной djvu-файл открываю программой Документ Экспресс Эдитор, в ней можно поменять местами страницы,удалить страницы и добавить djvu-страницы извне, если такая необходимость существует.
3. Открываю djvu-файл в Файн Ридере через меню Открыть в ОКР редакторе, распознаю и сохраняю файл с окр слоем так же в формате djvu
4. После выхода с Файн Ридера выходной файл получается раза в 2 по объему меньше оригинального, т.е. Файн ридер съедает качество изображения.
5. Для решения проблемы порчи файла Файн ридером меняем слои, вставляем слой с файла, изготовленного Файн ридером, в первоначальный файл с помощью программы FR11Djvu Text Layer Crutch 0.3.1
6. Оглавление создаем с помощью PdfDjvuBookmarker
7.Pdf-книгу я создавал путем конвертации из готового djvu с помощью программы DjVuToy, в результате получается Pdf-книга с оглавлением, но с текстовым слоем или нет не совсем понятно, потому что в Pdf-файлах неизвестно где находится поиск по тексту.

.... поэтому процесс создания pdf-книги с ocr-слоем очень актуален и нужен видеообзор!



Автор: TelecomUral, Отправлено:14:29 24-11-2022

serg28serg
обычно в новом СК забывают нажать кнопочку "отобразить текст" в окне VR.

Автор: serg28serg, Отправлено:15:13 24-11-2022

TelecomUral
Цитата:
обычно в новом СК забывают нажать кнопочку "отобразить текст" в окне VR.

это ж надо и вправду
в 6.75 она почему то нажата была (может когда текстовуху выжимал из SK - случайно клацнул) , а в 6.8 - отжата , а при запуске VR - морда свое старое состояние помнит, так сразу и не заметишь
спасибо

Цитата:
Эх! Некому всё это в ролике показать, было бы наглядное пособие по созданию pdf с ocr-слоем

не понятно востребованность этого действа
то есть в пределах одной софтины , клацая кнопками получить некий читабельный PDF как результат на выходе
мне то например понадобился - Жирный печатный документ , в котором надо чет постоянно искать, но глаза и мозги не казенные - много не на ищут, а тут будет стандарт - поиск по PDF текстовухе - то что я обычно юзаю по документам, и другим для поиска передавать.
если доберусь (будет время) до получения PDF OCR, то включу запись и запишу процесс, если кому то это нужно.


Автор: xMARx, Отправлено:18:15 24-11-2022

__Всем привет. Обработал статью (10 стр), осталось только pdf сделать. Увидел галочку "add OCR" и решил сделать pdf файл с распознаванием. Файл создаю из out task. Но почему-то SC не создает текстовый слой в выходном pdf файле на 7, 8 и 10 страницах (не могу выделить его в Adobe Acrobat Reader). На остальных страницах слой есть. Причем если задать обработку изображений с 7 по 10 (встать на 7 изображение и выбрать process from the current to the last), то текстовый слой на них появится. Если обработать изображения с 4 по 10, то на последней (7-й) странице текстового слоя не будет.
__Немного напрягает вывод величины зума в окне RV. Несколько раз приблизил колесиком изображение, при этом величина зума в соответствующем поле увеличивается. Потом один раз отдалил, а зум увеличился!?. Если продолжить отдалять, то величина зума будет уменьшаться.

Автор: kamenkapenza, Отправлено:18:48 24-11-2022

Особой сути наличия текстового слоя я так и не понял. Читатели открывают книгу (pdf или djvu) и читают текст, смотрят картинки. Кому надо искать и ковырять этот слой?

Автор: xMARx, Отправлено:18:55 24-11-2022


Цитата:
Особой сути наличия текстового слоя я так и не понял. Читатели открывают книгу (pdf или djvu) и читают текст, смотрят картинки. Кому надо искать и ковырять этот слой?

__Ну... в статье, наверно, смысла особого в текстовом слое нет. А в книгах (технических например) иногда бывает необходимо что-то поискать через поиск.
__В англоязычной литературе удобно копировать текст и вставлять в яндекс переводчик.

Автор: serg28serg, Отправлено:19:08 24-11-2022


Цитата:
Кому надо искать и ковырять этот слой?

для :
1. контекстный поиск
2. копирование цитат
например у меня есть книга на 600 (до 12000 бывает у меня) страниц, и надо найти где там упоминается число 3000H - искать глазками тратить время. и таких книг например сотня - бывают с текстовухой , а бывает только как скан.
и если таких книг много и чисел тоже - время на поиск ручками-глазками расходуется в какой-то некоей прогрессии .
контекстный поиск - ищет менее чем за минуту, можно сразу в нескольких файлах.

что-то вытаскивать и вставлять в какие то описание - тоже надо что бы был текст, не ручками же по клавишам стучать и ошибки еще плюс генерить.

Автор: bolega, Отправлено:19:13 24-11-2022

xMARx

Цитата:
Но почему-то SC не создает текстовый слой в выходном pdf файле на 7, 8 и 10 страницах

К сожалению, без самого примера не понять причину.

Автор: kamenkapenza, Отправлено:19:31 24-11-2022


Цитата:
для :
1. контекстный поиск

В Djvu-файлах (в программе WinDjView) есть меню "Поиск", т.е. по тексту можно найти его местоположение в книге. В pdf-программах типа Фокзит Ридер, Адобе акробат я меню поиска по тексту не нашел.

Когда изготавливается джву-книга непосредственно в Кромсаторе после Креате аут таск всплывает второе окно программы, где в меню Тулс выбирается пункт Креате джву. Почему в последующей версии программы не сделать бы тут же рядом ниже пункт Креате пдф и всплывающее окно Визард ПДФ, а все настройки для пдф-файла также внести в профиль?
Или вообще сделать запуск одновременного изготовления джву и пдф (для тех, кто создает и джву и пдф книги)

По изготовлению пдф-книги непосредственно в Скан Кромсаторе плюс наложение тут же текстового слоя понял только 6 пунктов, вот тут мои недопонимания ситуации https://disk.yandex.ru/i/qM9_1yLJ6Ujo1Q

Автор: bolega, Отправлено:20:45 24-11-2022

kamenkapenza
Все просто.
Открываете свой 3-out.spt
На закладке опций Files задаете Output format=pdf, после этого там же задаете PDF filename.
Никаких опций больше менять/задавать не нужно!
Нажимаете кнопку Process! в верхней панели MW.
И все. Ждете когда СК сделает pdf.

В этом и особенность out-задания: в нем все готово для одновременного создания как djvu, так и pdf.

Автор: qwaxym, Отправлено:21:09 24-11-2022


Цитата:
В pdf-программах типа Фокзит Ридер, Адобе акробат я меню поиска по тексту не нашел.
 

Должен быть! Обычно поиск Ctrl+F.

Автор: serg28serg, Отправлено:00:04 25-11-2022


Цитата:
В Djvu-файлах (в программе WinDjView) есть меню "Поиск", т.е. по тексту можно найти его местоположение в книге. В pdf-программах типа Фокзит Ридер, Адобе акробат я меню поиска по тексту не нашел.

Ctrl+F нажмите в акробате и ввести слово которое ищем

Цитата:
Должен быть! Обычно поиск Ctrl+F.

уже и ответили

Автор: shch_vg, Отправлено:00:30 25-11-2022

kamenkapenza

Цитата:
Особой сути наличия текстового слоя я так и не понял

Если хотите, чтобы с обработанной вами книгой знакомились только знающие русский язык, то выше уже указали, для чего может быть полезно распознавание, особенно это важно для справочной литературы или энциклопедий.
Распознавание других книг на русском позволяет не знающим этого языка через онлайн переводчики знакомиться с их содержанием.

Автор: xMARx, Отправлено:10:21 25-11-2022


Цитата:
К сожалению, без самого примера не понять причину.

__Попробовал открыть PDF файл с помощью браузера. В нем текст выделяется, но если текст с 7, 8 и 10 страниц вставить в WORD, то получаю кракозябры...
__Приложил другой пример, в котором задание состоит из скопированной 10 раз первой страницы из той самой статьи. Тут 1-я страница распознается нормально, а остальные 9 - нет (из браузера текст можно скопировать в WORD, где получаются кракозябры).
ссылка на файл проекта

Автор: TelecomUral, Отправлено:11:13 25-11-2022

bolega
У xMARx в pdf при открытии мой акробат ридер говорит что не найден шрифт Helvetika.
PDF-XChange Editor показывает со второй страницы кракозябры. Любопытно.


Автор: kamenkapenza, Отправлено:11:19 25-11-2022

bolega, большое спасибо!
qwaxym,serg28serg, shch_vg, большое спасибо!
Сегодня попробую.

Автор: serg28serg, Отправлено:12:25 25-11-2022

bolega
Цитата:
Попробуйте продолжить последовательность:
11. File > Create out task
12. В out-task задаем output format=pdf, задаем имя файла, ставим галку на Add ocr
13. Генерим pdf: т.е. process all или для проверки process current page
На выходе будет pdf с OCR слоем.

продолжаю
11. File > Create out task
12. в вкладках под файлами - в Files задаем имя выходного PDF - PDF Name : myfirstOCR (или имя какое придумаем) .
13. так же в вкладке Files задаем Output format : PDF
14. в вкладке PDF отмечаем обязательно галочку Add OCR (только в SK6.8 или старше)
15. Сохраняем task (не проверял есть ли автосохран)
16. Жмем уже "главную кнопку" в верхней морде "Process!"
и смотрим результат
(указал минималку что нужна для OCR PDF , остальное естественно по желанию и хотелкам)

пример уже копипаста из результирующего PDF в Word

добавлю :
на какой то странице может происходить ошибка преобразования и дальнейшее преобразование в текстовуху не происходит - может быть только треть документа будет с OCR - как повезет. лога нет - поэтому причина не ясна, надо будет разбираться как обходить.

Автор: asku, Отправлено:01:02 26-11-2022

bolega
Добрый вечер. Такой вопрос.



В проекте есть текстовый слой (из файнридера). Выделяю часть скана (см. рис). Можно этот выделенный кусок (т.е. не отдельный глиф, а целый кусок скана) поместить в библиотеку глифов.
А трудно ли сделать так, чтобы из выделенного рамкой куска в библиотеку помещались скопом отдельные глифы, захваченные рамкой? Я не знаю, понятно ли задал вопрос.

И второй вопрос.



Выделяю рамкой часть скана, нажимаю показ ошибочных слов (по Hunspell-словарю) и СК выдает их список. Но это список неизвестных словарю слов всей страницы.
А трудно ли сделать так, чтобы СК выдавал список только тех неизвестных слов, которые входят в выделенную рамку? Т.е. если выделенной рамки на странице нет, то выдается список всех слов, а если выделенная рамка есть, то только список неправильны «рамочных» слов.

Автор: bolega, Отправлено:10:11 26-11-2022

asku
ОК, учту

В свете последних выявленных проблем с ocr-слоем в pdf вы такое у себя не замечали? Т.е. пропадание слоя на некоторых страницах

Автор: asku, Отправлено:12:27 26-11-2022

bolega
Нет, такого не замечал. Пдф со слоем в СК я делал раза два-три, но это было в порядке эксперимента, то есть текстовый слой я внимательно не проверял.

По поводу группового занесения глифов из выделенной зоны (мое предыдущее сообщение здесь). Я как-то писал здесь, что хорошо бы иметь в СК возможность автоматической сортировки глифов в алфавитном порядке. Тогда работа по созданию библиотеки глифов очень ускорилась бы — скопом заносятся глифы, потом сортируются, и сразу видно каких глифов ещё не хватает в библиотеке.

Автор: bolega, Отправлено:13:20 26-11-2022


Цитата:
текстовый слой я внимательно не проверял

Вот это и плохо. Все чего-то хотят, но помочь отловить баги готовы немногие
(просто репорт не в счет)

Автор: xMARx, Отправлено:14:27 26-11-2022


Цитата:
Вот это и плохо. Все чего-то хотят, но помочь отловить баги готовы немногие  

__А что требуется? Я вчера в 10.21 выложил ведь проект с этой проблемой.

Автор: bolega, Отправлено:16:25 26-11-2022

xMARx

Цитата:
Я вчера в 10.21 выложил ведь проект с этой проблемой.

У меня в новой версии не воспроизвелось. Получился pdf с нормальным ocr-слоем на всех страницах.
А вот попробовал в версии 6.8 - действительно какие-то проблемы.
Возможно, что я что-то исправил с тех пор, и баг исчез. Буду надеяться, что проблема уже решена.

asku
Сортировку глифов уже сделал

Автор: xMARx, Отправлено:16:35 26-11-2022


Цитата:
У меня в новой версии не воспроизвелось. Получился pdf с нормальным ocr-слоем на всех страницах.
А вот попробовал в версии 6.8 - действительно какие-то проблемы.
Возможно, что я что-то исправил с тех пор, и баг исчез. Буду надеяться, что проблема уже решена.
 

__А когда, если не секрет, будет доступна новая версия?
ЗЫ: Что насчёт проблемы с зумом в окне RV?

Автор: bolega, Отправлено:16:46 26-11-2022

В версии 6.8 и младше при ocr с помощью тессеракт СК автоматически помечает слово с символом дефис в конце как слово с переносом. Отменить это невозможно.
Если ocr от FR, то там иначе - слова помечаются как слова с переносом только если FR поставил в конце слова символ мягкого переноса. Это позволяет управлять флагом "перенос" просто заменяя мягкий перенос на дефис, и наоборот.
В новой версии при использовании тессеракт я хочу предусмотреть 2 варианта:
- оставить как есть, но дефис автоматически менять на мягкий перенос.
- вообще не искать и не помечать переносы при выполнении ocr. А эту возможность перенести в функционал Find/Replace, в котором этот процесс сделан более управляемым.
Чем хорошо использование мягкого переноса? Тем, что поиск по ocr слою что в pdf, что в djvu будет корректно работать по словам, напечатанным с переносом.

И еще в новой версии корректнее подсвечиваются и добавляются в слой буквицы. Актуально только для FR, т.к. только он правильно их детектирует.

Добавлено:

Цитата:
Что насчёт проблемы с зумом в окне RV?

исправлю

Автор: kamenkapenza, Отправлено:19:39 26-11-2022

Автор программы (уважаемый boiega) обещает новую версию программы с созданием окр джву через Кромсатор. Если это так, то хотелось бы, чтобы в Кромсаторе можно было делать всё: менять страницы уже в готовом джву (например, я делаю книги из сканов, где обложка и цветные страницы расположены внизу папки, в начале делаю джву, не перемещая страницы,а уже вставляю страницы на место с помощью программы Эдитор про) , добавлять страницы в готовый джву-файл (бывает такое, что при просмотре изготовленного джву замечаешь что в одной странице, например, забыл удалить мусор, в этом случае, чтобы не создавать заново весь файл джву, переобрабатываю одну страницу, кодирую её в джву с помощью джву смол, вставляю в джву файл и удаляю бракованную страницу с помощью Эдитор про), а так же делать электронное оглавление непосредственно в Кромсаторе, чтобы была полноценная самодостаточная программа, не требующая вспомогательных программ для полного цикла создания книги (джву и пдф).

Автор: daa2013, Отправлено:07:38 27-11-2022

Обнаружил следующий баг.

Сделал автозамену, отлавливаю слова с ocr-ошибками. н/п
Т.е. вместо он - оп, вместе не - пе и т.д.
В режиме ocr find такое по всему тексту нашел, вижу в окошке список слов. Иду по нему и вклеиваю правильные глифы на место неправильных.
В списке слова с указанием страниц, откуда они пришли. Что-то типа:
p21: пе
p23: оп

Вот теперь собственно баг:
на странице 23 я вклеил правильное Н, затем кликаю по слову "пе" с 21 страницы, и происходит перелистывание на эту 21-ю страницу без предложения мне сохранить изменения на 23-й.
То есть то, что я там глиф вклеил, просто теряется.


Автор: ilynov2011, Отправлено:19:01 27-11-2022

Кажется, в версии 6.8 пропала очистка зоны страницы, выделенной рамкой,- то, что раньше работало при нажатии клавиши Delete.

Автор: Ladina, Отправлено:15:22 29-11-2022

Оцениваю свои возможности по переделке пдф.) Левый разворот с нормальными полями, а правый обрезан по самые буквы. А поля можно прибавить в Сканкромсаторе?

Автор: shch_vg, Отправлено:15:46 29-11-2022

Ladina

Цитата:
А поля можно прибавить в Сканкромсаторе?

Что делать, если ScanKromsator не делает то, что хотелось бы...

Автор: xMARx, Отправлено:17:14 01-12-2022


Цитата:
Вот это и плохо. Все чего-то хотят, но помочь отловить баги готовы немногие  
(просто репорт не в счет)

__Не получается распознать текст на выходном изображении, вылетает ошибка. Задание, содержащие исходный разворот и выходной обработанный файл прикладываю.

ошибка

задание

Автор: TelecomUral, Отправлено:19:09 01-12-2022

xMARx
похоже, дллка брешет на жирном тексте.

Автор: bolega, Отправлено:21:07 01-12-2022

TelecomUral

Цитата:
похоже, дллка брешет на жирном тексте.

Я провел эксперимент.
Вы правы, если сделать утоньшение хотя бы с радиусом=1, то все проходит успешно. Еще способ - обмануть тессеракт, указав ему, что dpi=300, а не 600, почему этот трюк помогает, я не знаю. Причем при утоньшении ошибок распознавания меньше.
Я учту это в СК, чтобы при такой ошибке он автоматом переходил на временный костыльный вариант.
Кстати, утоньшение (thining) - новая опция обработки в СК, а также как фильтр для интерактивного применения в окошке image adjustments VR.

xMARx
Спасибо!

daa2013

Цитата:
Обнаружил следующий баг.

исправил

kamenkapenza

Цитата:
например, я делаю книги из сканов, где обложка и цветные страницы расположены внизу папки, в начале делаю джву, не перемещая страницы,а уже вставляю страницы на место с помощью программы Эдитор про

никак не пойму, почему не хотите это сделать в out-задании перед тем как делать djvu. Т.е. сначала перенести обложку на первое место (даже команда для этого есть в КМ списка файлов в MW - move to top), потом уже запускать визард.


Цитата:
в этом случае, чтобы не создавать заново весь файл джву, переобрабатываю одну страницу, кодирую её в джву с помощью джву смол, вставляю в джву файл и удаляю бракованную страницу с помощью Эдитор про

Так не рекомендую делать, т.к. будет пухнуть размер файла из-за того, что для новых страниц создается свой собственный словарь. Оптимальнее полностью перегенировать djvu, чтобы получить единый словарь.

Добавлено:

Цитата:
ЗЫ: Что насчёт проблемы с зумом в окне RV?

исправил

Автор: kamenkapenza, Отправлено:21:14 01-12-2022

При клонировании участков (чистка обложки) не удается отделить один квадрат от другого. Вот тут я мучаюсь напрасно. https://disk.yandex.ru/i/T1ZQ_AnD67a76A

Добавлено:

Цитата:
в этом случае, чтобы не создавать заново весь файл джву, переобрабатываю одну страницу, кодирую её в джву с помощью джву смол, вставляю в джву файл и удаляю бракованную страницу с помощью Эдитор про

Так не рекомендую делать, т.к. будет пухнуть размер файла из-за того, что для новых страниц создается свой собственный словарь. Оптимальнее полностью перегенировать djvu, чтобы получить единый словарь.


bolega, спасибо! Про это понял.


Цитата:
никак не пойму, почему не хотите это сделать в out-задании перед тем как делать djvu. Т.е.  сначала перенести обложку на первое место (даже команда для этого есть в КМ списка файлов в MW - move to top), потом уже запускать визард.

Про это не понял, как менять местоположение страниц в Кромсаторе, например, когда их надо перетащить с десятка два (внизу все цветные фото в одном месте, а их надо разнести в разные места книги).
move to top нажал, тоже не понял, как этим пользоваться.
В Эдиторе про просматриваемые страницы в полэкрана компьютера; видно, что куда переносить. А во вторых я не меняю имена страниц на входе Кромсатора,т.е. оставляю их так, как их именовал сканировщик, например 1 - 0001-1L, 1 - 0001-2R, чтобы была возможность их найти по этой нумерации в исходной папке, если в каком то скане непорядок. Если мне, например, нужно менять порядок страниц, поставить 0101-1L между 0021-1L и 1 - 0021-2R, то надо будет постараться их увидеть в общем списке. Другое дело,когда я меняю страницы уже в готовом джву. В Эдиторе я их вижу (они визуально большие), плюс нумерация страниц в Эдиторе уже обычная: 1,2,3,4,.. Это очень удобно и быстро.

Автор: TelecomUral, Отправлено:22:25 01-12-2022


Цитата:
При клонировании участков (чистка обложки) не удается отделить один квадрат от другого.

мне помогает включить режим просмотра зон и обратно.

bolega
видимо, как-то это связано с порядком следования полноцветных сканов в списке файлов. У меня произошло то же самое, что у каменки, но на специально созданном задании, один листок ЧБ. А если стандартно делать как я делаю, пачка сканов, впереди цветная обложка, то Clone Tool отрабатывал без каких-либо проблем.

Автор: kamenkapenza, Отправлено:22:53 01-12-2022

Мне ничего не помогает, несколько раз пробовал всякими способами, переобрабатывал, и ничего. Как то я умудрился удалить нижнюю надпись, и с верхней как то получалось до сброса курсора, потом опять ничего. Придется опять старым дедовским способом: тиф обложки помещать в ирфан вью и там переставлять нужные участки цветов, потом обложку кодироватьв джву смолом и соединять 2 файла джву (обложку и выходное джву после Кромсатора) через Эдитор Про.
Вот тут опять подергался, подрыгался, но результата не достиг. Нажимал все, что можно и нельзя. https://disk.yandex.ru/i/xelVRo1Az93J6A

Добавлено:

Цитата:
пачка сканов, впереди цветная обложка

У меня обложка изначально впереди, а всего в книге 52 страницы,но все равно не удалось удалить с марксизма-ленинизма библиотечную наклейку на книге.
Эврика! Я понял почему: там скотчем наклейка приляпана, не удается за скотч проникнуть, это всё равно,что по зеркалу двигаться и пытаться на нем закрепиться и тем более с него что-то содрать. ))

Автор: bolega, Отправлено:01:39 02-12-2022

kamenkapenza
Вроде разобрался со штампом. После того как сделаете reset clone cursor, нажмите и отпустите кнопку мышки как можно аккуратнее, чтобы между нажатием и отпусканием она не сдвинулась ни на микрометр. Возможно, ваша мышка слишком чувствительна даже к малейшим сдвигам, в этом все дело. Т.е. нужно полностью исключить сдвиг между первым нажатием и отжатием.
А я подкорректирую код СК, чтобы убрать зависимость задания клонирующих курсоров от таких микросдвигов.


Цитата:
как менять местоположение страниц в Кромсаторе, например, когда их надо перетащить с десятка два (внизу все цветные фото в одном месте, а их надо разнести в разные места книги).

Выделить диапазон красным. Затем Cut selected group в КМ списка файлов. Потом Paste special. Появится окошко со списком красных файлов. Выбираете в окошке нужный файл (или несколько подряд), становитесь в главном списке файле на нужное место и в окошке жмете paste. Файл переносится в выбранную позицию, из окошка убирается. Далее следующий файл в окошке и очередное место в главном списке, paste и т.д. пока все файлы не раскидаете.

Автор: TelecomUral, Отправлено:08:29 02-12-2022


Цитата:
Возможно, ваша мышка слишком чувствительна даже к малейшим сдвигам

проще уж уменьшить немного чувствительность мышки в настройках винды. Причем сейчас в винде есть - если память не подводит - индивидуальная подстройка свойств мышки к конкретной программе.

Автор: bolega, Отправлено:09:40 02-12-2022


Цитата:
проще уж уменьшить немного чувствительность мышки в настройках винды

Да нет, это я в коде накосячил. В предыдущей версии такого не было. Вдобавок прозрачность перестала отрабатываться при рисовании клона, появлялась только в момент окончания, так тоже не должно быть.

Автор: kamenkapenza, Отправлено:11:06 02-12-2022


Цитата:
проще уж уменьшить немного чувствительность мышки в настройках винды

Этого делать никак нельзя! Я специально в настройках мыши делаю самую быструю скорость перемещения курсора, даже мышки покупаю всегда одни и те же, потому что скорость перемещения курсора зависит ещё и от модели мыши. Чтобы переместить курсор мыши от самого низа экрана до верха мне при моих настройках нужно проехать по столу мышью сантиметра 2-3, у меня уже на это рука настроена, перемещаться приходиться часто и быстро, особенно при групповом скачивании файлов. Если я настрою скорость передвижения курсора по вашему совету, то я по всему столу буду мышью елозить, у меня за день рука устанет. ))


Цитата:
Да нет, это я в коде накосячил. В предыдущей версии такого не было. Вдобавок прозрачность перестала отрабатываться при рисовании клона, появлялась только в момент окончания, так тоже не должно быть.


Ну вот! Хорошо хоть выяснилась причина, а то я подумал, что Скан Кромсатор сломал или в очередной раз туплю от незнания.


Цитата:
Вроде разобрался со штампом. После того как сделаете reset clone cursor, нажмите и отпустите кнопку мышки как можно аккуратнее, чтобы между нажатием и отпусканием она не сдвинулась ни на микрометр. Возможно, ваша мышка слишком чувствительна даже к малейшим сдвигам, в этом все дело. Т.е. нужно полностью исключить сдвиг между первым нажатием и отжатием.
А я подкорректирую код СК, чтобы убрать зависимость задания клонирующих курсоров от таких микросдвигов.

bolega, спасибо! По вашему совету всё-таки удалось удалить позорное клеймо с "Марксизма-ленинизма".

Цитата:
Выделить диапазон красным. Затем Cut selected group в КМ списка файлов. Потом Paste special. Появится окошко со списком красных файлов. Выбираете в окошке нужный файл (или несколько подряд), становитесь в главном списке файле на нужное место и в окошке жмете paste. Файл переносится в выбранную позицию, из окошка убирается. Далее следующий файл в окошке и очередное место в главном списке, paste и т.д. пока все файлы не раскидаете.  


bolega, спасибо! Это мне надо с этим неделю разбираться,как это на практике происходит, но постараюсь.


Добавлено:

Цитата:
Выделить диапазон красным.

А как выделить диапазон красным?

Автор: TelecomUral, Отправлено:11:23 02-12-2022

пробелом

Автор: kamenkapenza, Отправлено:11:58 02-12-2022

TelecomUral, понятно. Спасибо!

Автор: bolega, Отправлено:13:27 02-12-2022


Цитата:
По вашему совету всё-таки удалось удалить позорное клеймо с "Марксизма-ленинизма".

однако...


Цитата:
А как выделить диапазон красным?

стали на первый файл диапазона, нажали пробел. Стали ниже на последний файл диапазона, нажали Shift-пробел. Выделятся все файлы от текущего (т.е. последнего в диапазоне) вверх до предыдущего выделенного. Между первым и последним файлами в диапазоне не должно быть уже выделенных, иначе выделятся от последнего до крайнего уже выделенного (т.е. до самого первого не дойдет).

Автор: kamenkapenza, Отправлено:14:36 02-12-2022

bolega, большое спасибо! Надо всё это записать, я все советы по Кромсатору записываю в документ Ворд. Про такие тонкости (например,что Shift-пробел), мне кажется, никто и не знал, таперича будут в курсе)

Хотел потихоньку приступать к процессу создания окр через Кромсатор, попробовал через меню Резалт - ОКР оутпут файлс сделать что то, но ничего не получилось. И уже не первый раз всплывает какая то ошибка https://disk.yandex.ru/i/C_VXLmtz7flz4g

И вот тут мои пожелания для последующих версий,несение в профиль некоторых настроек https://disk.yandex.ru/i/9JFy-IeAfr_zcA

Автор: bolega, Отправлено:16:18 02-12-2022

kamenkapenza

Цитата:
И уже не первый раз всплывает какая то ошибка

Во-первых, это не ошибка, а предупреждение. О том, что OCR не выполнен для ряда файлов: цветных (напр., обложки), пустых или отсутствующих. Ничего критического.
Возможно, что вид окна я выбрал не самый удачный, и кажется, что какая-то ошибка.
Во-вторых, более подробно статус выполнения ocr можно посмотреть на закладке reports, если переключиться на нее по окончании ocr.
В третьих, тессеракт проигрывает FR в качестве и скорости распознавания. Лучше использовать его, если есть возможность.
Языки распознавания, чтобы каждый раз не задавать, можно внести в дефолтный профиль. Вы вроде бы должны знать, что такое профиль.

Автор: xMARx, Отправлено:16:31 02-12-2022


Цитата:
bolega, большое спасибо! Надо всё это записать, я все советы по Кромсатору записываю в документ Ворд. Про такие тонкости (например,что  Shift-пробел), мне кажется, никто и не знал, таперича будут в курсе)  


__Чтобы для каждой страницы не задавать в поле "OCR languages" язык распознования "[rus]", нажмите на данное поле правой кнопкой мыши и выбирите "Apply option to all marked"

Автор: bolega, Отправлено:17:03 02-12-2022

kamenkapenza
У меня не отрывается сайт mirknig, да даже если б и открывался, скачивать с обменников типа турбобит/депозит и т.п. все равно невозможно. Поэтому не могли бы вы выложить куда-нибудь на yandex свои обработки альманахов Круглый год (одним архивом), а ссылку скинуть мне в личку.

Автор: kamenkapenza, Отправлено:22:31 03-12-2022

В Хрестоматии по Кромсатору (вероятно, всё уже устарело) увидел, что для пдф нужно ставить какую то попугайскую программу (Какаду). Вроде, я как то пробовал (хотя пдф привык создавать конвертацией джву через Джву Той), пдф и так получился, какаду у меня не прицеплен. А зачем тогда нужен какаду?

Вот тут у меня злободневный видеовопрос про фильтры, с помощью которых можно улучшать текст https://disk.yandex.ru/i/PYPArldGF6sCvA Возможно, что про эти инструменты мало кто знает.

Автор: daa2013, Отправлено:01:14 04-12-2022

При включенном режиме remove speckles that touch the pasted image часто удалаяются дефисы (переносы) и малые тире, опознанные как таковые. (иногда, впрочем, ошибочно опознанные как другие символы).
Они удаляются и в ручном режиме, но это видно. И в автоматическом . Это опаснее, можно и пропустить.

Нельзя ли:

1. Вообще встроить какую-то проверку на дефисы и тире, возможно опциональную. (Условно говоря, галочка "не удалять спеклы в виде дефисов").

2. Те спеклы, которые OCR чётко распознал, как некие (любые) знаки, не удалять.

3. Как при подсветке спеклов (галочка Use OCR) выключает подсветку защищаемых знаков, так и при автоматическом удалении в режиме remove speckles that touch the pasted image , если для спекла выключена подсветка (соответствующий ему знак включен в список защищенных), то и в этом режиме он не удаляется. (Возможно, по специальной галочке в опциях.)

Автор: bolega, Отправлено:12:08 04-12-2022

daa2013

Цитата:
часто удалаяются дефисы (переносы) и малые тире, опознанные как таковые. (иногда, впрочем, ошибочно опознанные как другие символы).

Сможете дать примеры, желательно разные и побольше?
Я с таким не сталкивался еще.

Добавлено:
kamenkapenza

Цитата:
увидел, что для пдф нужно ставить какую то попугайскую программу (Какаду).

Не путайте "нужно" и "можно"

Автор: kamenkapenza, Отправлено:14:18 04-12-2022


Цитата:
Не путайте "нужно" и "можно"

А для чего оно это (этот) Какаду? С ней пдф получается покрасивше?

Можно ли бинаризировать часть страницы? Вот тут суть вопроса https://disk.yandex.ru/i/6UL38ChCBJ4aZQ

Автор: TelecomUral, Отправлено:15:39 04-12-2022

Часть - можно. Массой вариантов. b/w-zone, или exclude-zone, или picture-zone со своим порогом.
Также можно через выравнивание яркости: вкладочка Quality, субзакладка Correct illjumination, метод Soft.

результат

Автор: kamenkapenza, Отправлено:17:09 04-12-2022

TelecomUral, спасибо!

Автор: bolega, Отправлено:18:59 04-12-2022

kamenkapenza
Тут надо не бинаризацией делать, а побороть затенение от изгиба. Это исправляется
Ctrl-B > Correct illumination, метод safe например. Впрочем, у вас неестественный случай, из-за того, что тень имеет резкий переход слева в фон (из-за обработки в другой программе, был бы исходный скан, было бы лучше).


Автор: TelecomUral, Отправлено:19:23 04-12-2022

кто-то и метод Вольфа применяет. Тоже вытянется.

результат 2, при окошке 30


Автор: kamenkapenza, Отправлено:12:12 05-12-2022


Цитата:
Тут надо не бинаризацией делать, а побороть затенение от изгиба. Это исправляется  
Ctrl-B > Correct illumination, метод safe например. Впрочем, у вас неестественный случай, из-за того, что тень имеет резкий переход слева в фон (из-за обработки в другой программе, был бы исходный скан, было бы лучше).

bolega,спасибо!


Цитата:
кто-то и метод Вольфа применяет. Тоже вытянется.

TelecomUral!
Про такой и слыхом не слыхивал. Видимо, отец бывшего лидера ЛДПР приложил руку))

Значит выходит так, что, если делать обрезание и установку полей в другой программе (Тейлоре) , то это влияет на качество, т.е. вызывает его потерю. Обрезаю, устанавливаю полезную область, поля, сохраняю всё это в цвете и закладываю эти полусырые тифы в Кромсатор, то это уже не даст того, если бы я и резал, и устанавливал поля непосредственно в Кромсаторе?




Автор: bolega, Отправлено:21:28 06-12-2022

daa2013

Цитата:
При включенном режиме remove speckles that touch the pasted image часто удалаяются дефисы (переносы) и малые тире, опознанные как таковые. (иногда, впрочем, ошибочно опознанные как другие символы).

Сделал защиту от такого удаления.

kamenkapenza

Цитата:
Значит выходит так, что, если делать обрезание и установку полей в другой программе (Тейлоре) , то это влияет на качество, т.е. вызывает его потерю.

Про качество не знаю, но на иллюминацию влияет. Ее желательно исправлять до добавления полей

Автор: asku, Отправлено:23:53 12-12-2022

bolega добрый вечер. Прошу в новой версии СК по возможности расширить выбор символов в вываливающемся меню. Удобная штука.
Вот например, там, где предлагается «и», чтобы было и «й»; там где есть «о», там вместо нее СК бы предлагал еще и «р» и «б».



Автор: daa2013, Отправлено:15:20 13-12-2022

А может вообще дать пользователю возможность это редактировать ? Импортировать некую "таблицу замен" взамен дефолтной, а потом, когда не надо сбросить обратно. Иногда такие вычурные сбои бывают. И регулярные притом.
UPD: для данной конкретной книги регулярные, что-нибудь типа "з-ц"

Автор: karst, Отправлено:00:35 15-12-2022

Подскажите как настроить эту программу, чтобы она выполняла только четыре операции и ни в коем случае ничего больше не трогала?
Нужно
1. Разрезать развороты
2. Выровнять разрезанные страницы
3. Обрезать страницы по заданной рамке (размерам)
4. Сохранить полученный результат ничего не меняя ни в цвете, ни в чем нибудь другом

Развороты как правило цветные, 600 dpi

Автор: TelecomUral, Отправлено:12:46 15-12-2022

karst
Хрестоматию читали? В СК разбираетесь (что-то делали уже)? А то довольно много объяснять придётся.

Автор: bolega, Отправлено:21:40 15-12-2022

решил я все-таки разобраться, что такое изменилось в djvulibre версиях 3.5.27-3.5.28, что код СК перестал быть совместим с ним. Пока что обнаружил две вещи: 1) ошибка при извлечении чанка INCL в случае если его нет, т.е. когда djvu вообще не содержит словарь. В версии 3.5.25 djvulibre просто не извлекает этот чанк, более поздние версии возвращают ошибку. Ладно, пусть будет ошибка.
2) оказалось, при создании djvu из отдельных файлов-чанков чанк имя файла INCL в новых версиях не должно содержать пути! Это очень странно, т.к. для всех остальных типов файлов djvulibre ожидает в командной строке полное имя. Ладно, формирую командную строку с чанком INCL без пути. Как и ожидалось, возникает другая ошибка, типа INCL-файл не найден, что и следовало ожидать. Выход только один - запускать djvulibre, предварительно делая папку с INCL-файлом текущей папкой операционной системы. Так все начинает работать.
Вот фрагмент кода Леона Боту djvumake.cpp:
старая версия 3.5.25 (из командной строки из полного имени файла извлекается только имя):

Цитата:
else if (!dargv[i].cmp("INCL=",5))
{
create_incl_chunk(iff, "INCL", GURL::Filename::UTF8(5+(const char *)dargv[i]).fname());
}

новая версия 3.5.27 (из командной строки просто берется имя какое есть):

Цитата:
else if (!dargv[i].cmp("INCL=",5))
{
create_incl_chunk(iff, "INCL", (const char *)GUTF8String(dargv[i].substr(5,-1)));
}

Дальше по коду идет проверка, что в имени нет символов /\\ , если есть (а в полном пути они обязательно есть), djvumake считает это катастрофой и вылетает, вместо того, чтобы просто отбросить от имени файла его путь, как это было в предыдущих версиях.
Интересно, что такая трактовка имени применяется только к одному типу чанка.

После того, как я подстроился под эти изменения, СК нормально сгенерировал сложный djvu-файл. Буду еще тестировать, возможно, что еще чего-нибудь вылезет.

Автор: TelecomUral, Отправлено:06:41 16-12-2022

bolega
теперь у вас в СК нормальный ocr. Вы запланировали сделать генерацию гиперссылок?

Автор: bolega, Отправлено:08:46 16-12-2022

TelecomUral

Цитата:
Вы запланировали сделать генерацию гиперссылок?

Уже сделал. И генерацию оглавления для djvu сделал. Но вы же видели какой там убогий интерфейс. Я сам с трудом пользуюсь. Возможно, когда-нибудь дойдут руки причесать там все.
Была попытка еще автоматизировать задание гиперссылок, которые представляют собой номерные ссылки по тексту и отсылающие куда-нибудь в конец книги или в конец главы. Для этого в функционал поиска добавлен поиск возрастающей последовательности номеров, потом результат поиска копируется в окно гиперссылок и там парсится и расставляется. Но остались проблемы.

Автор: TelecomUral, Отправлено:09:03 16-12-2022

он не убогий он сильно нетривиальный в использовании. А идеи заложены толковые.


Цитата:
bolega
Уже сделал.

ухх! здорово

Автор: niccolo, Отправлено:19:24 16-12-2022

bolega

А можно все обработки в фоновый режим убрать - примерно как фоновое распознавание в ФР8, чтобы можно было работать с уже обработанными файлами?
И еще непонятка или я что-то неверно делаю - но в последней версии (6.8) мусор из-за пределов страницы (резаков) попадает на обработанные страницы тоже за пределы вырезанной части на добавляемые поля. Как так?

Автор: shch_vg, Отправлено:20:41 16-12-2022

niccolo

Цитата:
Как так?

Что делать, если ScanKromsator не делает то, что хотелось бы...

Автор: niccolo, Отправлено:21:26 16-12-2022

shch_vg


Цитата:
Что делать, если ScanKromsator не делает то, что хотелось бы... [?]


Спасибо за напоминание. Похоже сам ошибся - после обработки последняя версия сама определяет границы текста а весь мусор между текстом и резаком из оригинала выносит на поля....

Автор: Benoni, Отправлено:01:21 17-12-2022


Цитата:
И генерацию оглавления для djvu сделал.

Отлично! Спасибо, bolega

Автор: bolega, Отправлено:11:48 17-12-2022


Цитата:
Отлично! Спасибо

Функционал не скоро появится в публичном СК (если вообще появится), так что не за что...

Автор: asku, Отправлено:12:33 17-12-2022

bolega, а когда примерно новая версия появится?)

Автор: karst, Отправлено:13:38 17-12-2022

TelecomUral

Цитата:
Хрестоматию читали? В СК разбираетесь (что-то делали уже)? А то довольно много объяснять придётся.

Если для выполнения трех стандартных операций приходится "довольно много объяснять" то значит с интерфейсом программы есть серьезные проблемы.

У ABBYY Разрез разворотов и Выровнивание страниц задаются на одной вкладке и прекрасно решаются, но вот нормальной автоматической обрезки нет

Автор: shch_vg, Отправлено:14:33 17-12-2022

karst

Цитата:
Если для выполнения трех стандартных операций приходится "довольно много объяснять" то значит с интерфейсом программы есть серьезные проблемы.

Вам шашечки или ехать?

Автор: TelecomUral, Отправлено:14:38 17-12-2022


Цитата:
не скоро появится в публичном СК

Хорошая когда-то вышла вещь, к Новому Году новая версия Кромсатора

Если что нужно по тестированию фич - у меня новогодние праздники довольно свободны оказались. Дней пять полноценно можно наскрести. Именно ocr и автоглифы я не приветствую, не лежит у меня душа к массовым заменам. Но ради полноценных тестов можно и ими заняться, благо пару-тройку книжек считаю нужным опубликовать, из последних посканенных.

Добавлено:

Цитата:
karst
значит с интерфейсом программы есть серьезные проблемы

зато нет проблем с отсеиванием "пользователей".

[more]Напомню, между прочим, что СК - единственная полноценная специализированная программа подготовки книг из сканов. Аналогов, насколько я в курсе, нет практически 20 лет. Уж наверное за 20 лет интерфейс был отшлифован [/more]

Автор: slava_kry, Отправлено:16:17 17-12-2022

karst
https://elarscan.ru/modelnyj-ryad/programmnoe_obespechenie/elar-skanimidzh/

И прекращайте уже фигнёй страдать...

Автор: bolega, Отправлено:17:18 17-12-2022

TelecomUral

Цитата:
Именно ocr и автоглифы я не приветствую

если вы против ocr, тогда к чему этот вопрос:

Цитата:
нормальный ocr. Вы запланировали сделать генерацию гиперссылок?

А вот к автоглифам я тоже с опаской отношусь, это тот же инь/янь только в квадрате Но это меня не останавливает. В некоторых книгах такое ужасное качество текста, что противно смотреть, глифирование единственный способ улучшить. Поэтому в новой версии даже появилась функция, кот. условно пока назвал glyph word replace player. СК меняет текст скана, слово за словом, делая небольшую паузу между ними, а пользователь просто следит за процессом, в любой момент его можно остановить и отменить, продолжить, ускорить или замедлить.

asku

Цитата:
а когда примерно новая версия появится?)

Думаю, до НГ дам уже бету потестировать

niccolo

Цитата:
А можно все обработки в фоновый режим убрать

я подумаю над этим

Автор: niccolo, Отправлено:19:57 17-12-2022

bolega


Цитата:
я подумаю над этим


Разумно сделать в виде флажка в настройках. А то опытные пользователи могут не понять новый подход, как с кнопкой сохранения пакета...

И кажется я не ошибся - последняя версия действительно подтягивает мусор из-за пределов резаков.

https://www.upload.ee/files/14754513/scan_test.rar.html

На второй странице разворота остаётся мусор от названия книги и номера тетради для переплёта - тонкий ряд точек на нижнем поле.

Автор: shch_vg, Отправлено:21:22 17-12-2022

niccolo

Цитата:
На второй странице разворота остаётся мусор от названия книги и номера тетради для переплёта - тонкий ряд точек на нижнем поле.

Сейчас проверил на версии 6.00.1. Эти точки есть и там.

Добавлено:
В версии 5.95.beta.02 с включением Do not finalize этих точек нет!

Автор: TelecomUral, Отправлено:21:50 17-12-2022

bolega

Цитата:
если вы против ocr, тогда к чему этот вопрос

я неточно выразился. Я с опаской отношусь к введению фич, связывающих слой текста и бинаризованные символы. Когда юзер начинает опираться при правке bw страницы не на первичный полноцветный скан, а на результат авторасчухивания значков хрен знает какими алгоритмами. Особенно проверка целых слов из словаря. С одной стороны, для худтекста это суперская функция. С другой, низкая умственная развитость юзера, слабая начитанность, узкий кругозор и т.п. легко может привести к таким жёстким ошибкам в обработке, что лучше бы уж он вообще к книге не притрагивался. А орать он будет "это у вас алгоритмы г..ные!" То есть растет шанс выдачи из СК плохосделанной книги.
...впрочем, изгадить скан и сейчас можно

Но вообще использование ocr - это круто. Тут вопросов нет. Совершенно верно, в некоторых книгах есть большое желание тупо всё перенабрать с нуля.

Автор: shch_vg, Отправлено:21:51 17-12-2022

niccolo
Это каким-то образом связано с кривизной нижнего резака. При его прямолинейности подобной грязи не наблюдается.

Автор: niccolo, Отправлено:00:56 18-12-2022

shch_vg

Цитата:
Это каким-то образом связано с кривизной нижнего резака.


Полагаю, не только нижнего - первый раз наблюдал такое на боковых.

Автор: kamenkapenza, Отправлено:09:46 18-12-2022

[more]
Цитата:
Полагаю, не только нижнего - первый раз наблюдал такое на боковых


Да простит меня автор программы за крамольную мысль! Я делаю без резаков в другой программе, хотел бы со временем научиться с резаками, но пока делаю без них
[/more]

Автор: bolega, Отправлено:11:44 18-12-2022

Как говорится, если хочешь надолго отбить охоту у человека делиться своим продуктом, расскажи ему в глаза какая есть замечательная альтернатива...

Автор: TelecomUral, Отправлено:11:54 18-12-2022

bolega
да нашли кого слушать

Автор: kamenkapenza, Отправлено:15:08 18-12-2022

[more]
Цитата:
bolega
да нашли кого слушать


Так и есть, на мои выходки не надо обращать внимания.

bolega, простите маленького засранца!

То видео (ссылка на которое уже удалена) было рассчитано не склонить народ в противоположный лагерь,а показать метод,который мог бы быть использован для экспериментальной версии Скан Кромсатора на базе другого подхода к построению геометрических размеров страниц. Своего рода гибридная версия программы.


[/more]

Автор: bolega, Отправлено:21:06 18-12-2022

niccolo

Цитата:
Полагаю, не только нижнего - первый раз наблюдал такое на боковых.

По идее если и было, то только справа, слева и внутри не должно быть. Но если вдруг встретится, дайте знать.
shch_vg

Цитата:
В версии 5.95.beta.02 с включением Do not finalize этих точек нет!

Да, именно после этой версии я кое-что и поменял
kamenkapenza

Автор: asku, Отправлено:23:49 19-12-2022

Добрый вечер.
Когда-то спрашивал, но забыл ответ (

Две зоны, одна выше другой. Как нижнюю зону поместить наверх, или наоборот — верхнюю зону под нижнюю.

Вроде бы по логике, нужно жать на правую кнопку мыши и там в контекстном меню искать. Там в меню есть пункт Move to... Но там речь о перемещении зоны не вверх-вниз, а вправо, влево и т.д.

Автор: daa2013, Отправлено:01:05 20-12-2022

В окне MW ищите на ПКМ

Добавлено:

Цитата:
glyph word replace player. СК меняет текст скана, слово за словом, делая небольшую паузу между ними, а пользователь просто следит за процессом


Шальная идея появилась, что может синтезатор звука какой прикрутить (говорилка/балаболка), чтобы книжка при этом еще и озвучивалась.
(в полезности этого, впрочем, не уверен)

Автор: TelecomUral, Отправлено:06:34 20-12-2022

asku
по ПКМ, да:


Автор: TelecomUral, Отправлено:08:46 20-12-2022


Цитата:
daa2013
синтезатор звука

речевой канал медленнее визуального. пока ухо поймёт, глаз уже найдёт ошибки и руки примутся править.

Автор: daa2013, Отправлено:09:05 20-12-2022

зато если глаз не заметит, на слух неправильное слово услышится
в этих прогах заявлена подгонка скорости чтения.

Если читается с той скоростью, что и СК автоматически листает, то будет задействовано два канала восприятия.

Я вообще при массовых заменах пользуюсь только списком букв. (Не читаю.) А тут два удовольствия сразу - и книжку прослушал, и буквы вычитал.

Но повторюсь, я не готов ратовать за эту идею.

Автор: mvk2006, Отправлено:10:20 20-12-2022


Цитата:
синтезатор звука

необоснованная идея, на мой взгляд не только бесполезная, но и вредная.
Для того, чтобы работа была плодотворной, надо сосредотачиваться, не отвлекаться и не распылять силы.

Цитата:
зато если глаз не заметит, на слух неправильное слово услышится

субъективно и бездоказательно. Кроме того, кто Вам запрещает читать вслух для этой цели.

p.s. Кроме того, забывается смысл данной процедуры: нужно следить, чтобы программа не нарушила идентичность скана и результата, даже если в скане (исходной книге) есть опечатки

Автор: kamenkapenza, Отправлено:22:03 20-12-2022


Цитата:
может синтезатор звука какой прикрутить (говорилка/балаболка)


Это хорошая идея. Мне бы такая вещь очень пригодилась. Нажал куда то не туда по незнанию, и тут же ругань: "Куда жмёшь, поганец!? Иди читай Хрестоматииию, мать ети")

Автор: TelecomUral, Отправлено:22:20 24-12-2022

bolega
а в постеризации сейчас точно работает инструмент замена пары двух цветов третьим? Который селектором "+" обозначается. Что-то в 6.8 у меня это не получилось. Другие СК не открывал пока.

Автор: mvk2006, Отправлено:07:29 25-12-2022


Цитата:
точно работает инструмент замена пары двух цветов третьим?

TelecomUral
у меня работает (простенькое тестовое), может какие-то нюансы (большая палитра или что иное)?

Автор: bolega, Отправлено:13:46 25-12-2022

TelecomUral
Вроде работает. Может FFill надо включить? Или цвета местами поменять. Цвета идут в таком порядке: base+src>dest (в dest преобразуется src, а не base)

Автор: TelecomUral, Отправлено:14:03 25-12-2022


Цитата:
Вроде работает.

положил на фтп видео. Или лыжи не едут...
разобрался. В случае замены цвета (src=dest) не рисуется третий прямоугольник. Поговорку стоило продолжить.

Автор: bolega, Отправлено:09:16 26-12-2022


Цитата:
В случае замены цвета (src=dest) не рисуется третий прямоугольник.

это сделано специально

Автор: TelecomUral, Отправлено:10:57 26-12-2022

да, я помню. просто делал шесть дел одновременно, и мозгов не хватило опять раскрутить логику. Почему-то вскользь посчитал что раз третий прямоугольник не рисуется то никакой замены вообще не будет. Типа запретной ветки. Посидел, включил мозги, и всё получилось.

Автор: asku, Отправлено:23:54 26-12-2022

Добрый вечер.
Обрабатываю одну книгу. Никак не могу подобрать в СК параметры для сносного качества на выходе.
Прошу подсказать, что можно в опциях подправить, чтобы улучшить.
Вот папка с тестом:
архив zip

Автор: TelecomUral, Отправлено:11:03 27-12-2022

asku
если потом будете пользоваться ocr для удаления мусора, то выгоднее уменьшить радиус аншарпа до 4х и включить гамму 3.8. Отключить обязательно деспекл. Ещё я выбрал бинаризацию по Вольфу с малым окошком 25.

Автор: asku, Отправлено:11:09 27-12-2022

TelecomUral, спасибо, попробую как вы говорите. Вообще ocr бы хотел использовать, да.

Автор: TelecomUral, Отправлено:17:49 27-12-2022

asku
не пробовали сканить в цвете и выделять канал черного до СК?

Автор: asku, Отправлено:18:19 27-12-2022


Цитата:
не пробовали сканить в цвете и выделять канал черного до СК?


Нет, не пробовал. Результат лучше бывает? А как выделить канал черного?

Автор: TelecomUral, Отправлено:18:22 27-12-2022

asku
вообще это тут оффтоп, я был неправ, задавая такой вопрос.

у slava_kry где-то в видео было. Давно. Бывает получше, всё-таки допизмерение появляется.

Автор: asku, Отправлено:22:07 27-12-2022

TelecomUral

Цитата:
Ещё я выбрал бинаризацию по Вольфу с малым окошком 25.


А где находится б-ция по Вольфу?

Автор: TelecomUral, Отправлено:01:54 28-12-2022

метод autoWolfautoW на закладке Binarization

Автор: shch_vg, Отправлено:02:49 28-12-2022

TelecomUral

Цитата:
метод autoWolf на закладке Binarization

Нужто autoW?

Автор: TelecomUral, Отправлено:03:17 28-12-2022

кстати, также как и все прочие фичи в своё время был подробно описан в whatsnew

Автор: asku, Отправлено:07:57 28-12-2022

TelecomUral

AutoW, наверное. Попробовал поменять опции как вы сказали — результат намного лучше. Единственное, если убрать галочку с Деспекла, совсем много «шума» остаётся.

Автор: TelecomUral, Отправлено:08:06 28-12-2022


Цитата:
совсем много «шума» остаётся

Так надо потом возиться с глифами, чтобы лишнее убрать. Иначе деспекл выкидывает кусочки букв.

Автор: bolega, Отправлено:08:07 28-12-2022


Цитата:
если убрать галочку с Деспекла, совсем много «шума» остаётся.

Поменяйте на метод safe (File > Options > Processing > Despeckle), будет получше

Автор: shch_vg, Отправлено:13:39 28-12-2022

bolega
В версии 6.8 криво работает запоминание зума в главном окне.
Устанавливаю нужный мне размер скана в ГО, выбираю Image->Zoom->Fix current zoom, закрываю задание с сохранением. Снова захожу в это задание и имею в ГО скан в формате 100.

Автор: mvk2006, Отправлено:14:40 28-12-2022


Цитата:
запоминание зума в главном окне

shch_vg
Я так понял опция «Fix current zoom» работает в текущем сеансе, а для более глобального добавлена «Save current zoom» (и соответственно «Restore saved zoom value»)

Автор: shch_vg, Отправлено:15:33 28-12-2022


Цитата:
Я так понял опция «Fix current zoom» работает в текущем сеансе

Почему тогда после закрытия программы этп опция не теряется?

P.S. сейчас снова проверил написанное мной выше, зайдя в такое задание, и не увидел то, что было ранее. А ведь я тогда проверял на многих форматах окна и неизменно получал 100%.
Что это, глюк системы?

P.P.S. Закрыл СК, запустил заново и получил 100%.
Мистика!

Автор: bolega, Отправлено:15:49 28-12-2022

shch_vg
У меня чего-то не воспроизвелось. Зум все время восстанавливается как надо.
Цитата:


Я так понял опция «Fix current zoom» работает в текущем сеансе, а для более глобального добавлена «Save current zoom»

наоборот


Автор: mvk2006, Отправлено:15:49 28-12-2022

shch_vg
Я понял так: При установленном fix и сохраненном save, при открытии задания восстанавливается значение zoom. Сохраненное значение восстановить можно в любой момент, независимо...

Как должно работать знает автор, подождём вердикт...
Автор своё слово сказал.


Автор: shch_vg, Отправлено:15:51 28-12-2022


Цитата:
а для более глобального добавлена «Save current zoom»

Проверил и это. Установил формат по ширине, сохранил текущий зум, вышел из СК с сохранением задания. После повторного запуска СК задание открылось с форматом по высоте.

Автор: bolega, Отправлено:15:52 28-12-2022

кто готов потестировать новую версию на праздниках, пишите, лучше в ПМ.
сразу предупреждаю, наверняка много багов осталось

Добавлено:
shch_vg
Может, вы неправильно трактуете fix zoom. Fix zoom означает, что текущий zoom будет применяться для следующего отображаемого файла. Но если вы измените zoom, то с этого момента текущим станет измененное значение zoom и далее будет использоваться уже оно.

Автор: mvk2006, Отправлено:16:01 28-12-2022

Я употребил эпитет "глобальный" имея ввиду, что команда «Restore zoom value» имеет свою штатную кнопку и может отрабатывать и после закрытия/открытия

bolega
Тогда у меня пара вопросов: привязывается ли значение масштаба (фиксированного/сохраненного) к конкретному заданию?
И еще в окне VR есть подобный механизм сохранения/фиксации масштаба?

Автор: bolega, Отправлено:16:26 28-12-2022


Цитата:
Автор своё слово сказал.

Уточнение: в задание пишется зум, но не текущий, а который был в момент включения опции fix current zoom. Если же после этого была команда save zoom, то сохраненный зум заменяется на текущий. Как-то так... Возможно, надо по другому.
Зум пишется в каждое задание.

Цитата:
в окне VR есть подобный механизм сохранения масштаба?

а там тоже нужен?

Автор: shch_vg, Отправлено:16:43 28-12-2022

bolega

Цитата:
Может, вы неправильно трактуете fix zoom

Вроде нет. Сейчас не удается воссоздать возникшую ситуацию. При появлении ее постараюсь зафиксировать процесс ее получения

Автор: mvk2006, Отправлено:16:51 28-12-2022


Цитата:
а там тоже нужен?

для меня было бы полезно. Частный случай - при переключении между метелками и ластиком масштаб сам по себе меняется (видимо по последнему применению). Ну и не всегда удобно использовать стандартные (страница целиком или по ширине). Хотя это ж не критично. Я приспособил хоткей на ширину и работать можно, просто поинтересовался, может я чего-то не знаю.

Автор: bolega, Отправлено:16:58 28-12-2022


Цитата:
при переключении между метелками и ластиком масштаб сам по себе меняется

потому что включена Clear options > Actions > Restore zoom after eraser

и напомню, что в 6.8 если изображение ч/б, то режим clone stamp работает как ластик, при этом размер курсора плавно регулируется колесиком с зажатым shift, форма курсора выбирается на закладке tools панельки image adj.

Автор: mvk2006, Отправлено:17:58 28-12-2022

bolega
Спасибо за разъяснение (и напоминание). Самое трудное это сопряжение теории, привычки, понимания своих действий и правильного пути к цели. Ну ничего, дорогу осилит идущий...

Автор: shch_vg, Отправлено:20:21 29-12-2022

bolega
В 6.8 слетает позиция нижнего резака при запоминании для всех последующих, если он не активирован.Позиции трех остальных резаков запоминаются.

Автор: kamenkapenza, Отправлено:11:40 01-01-2023

С Новым годом!!! Здоровья и всех благ всем участникам форума и автору программы,которая постоянно улучшается и совершенствуется на радость нам!!!

К началу нового года хотелось бы приурочить следующее вполне интересное предложение.
Ни один раз заикался и теперь не устану повторять, что нужно нести программу в массы, для обычных людей среднего уровня интеллектуальных способностей,чтобы можно было полностью освоить Кромсатор не на научно-техническом уровне мировозрения (не всем это дано), а через практический показ всех возможностей программы, т.е. через последовательные видеоролики, своего рода академический курс освоения программы: полный неспешный разбор всего меню, всех пунктов с практическим показом,что происходит на деле при изменении настроек, ну и конечно же объяснения для чего эти настройки нужны и в каких конкретных случаях.
То что по Кромсатору есть в интернете (видеоролики) это в большой массе представлено от людей, которые знают про Кромсатор на 0,01 % от всех его возможностей, нахватаны и представлены верхушки сведений, а во-вторых, если у кого создан специальный канал про Кромсатор, скачки с 5 на 10,а потом с 10-го на 3 и т.п.
И получается так, что по Кромсатору что-то есть (с мира по нитке), а если брать в целом, то ничего толкового нет (за редким исключением) в смысле стройности изложения предмета.
Нужен именно академический курс. Для этого нужно очень толковому и сведующему человеку (желательно бы автору программы, так как лучше него никто последовательно не расскажет, ну или создателю Хрестоматии по Кромсатору, обновив при этом саму Хрестоматию в соответствии с последовательностью изложения академического курса, в соответствии с многочисленными изменениями последней версии программы.) создать видеоканал академического курса изучения Кромсатора. Методика изложения была нацелена именно на новичков,но так как будут обсуждаться все возможности программы,все меню и подменю, то этот материал интересен будет от "школьника" до профессора", потому что много чего неизвестно даже мудрецам.
Курс проводить не спеша, разбирая все темы (все меню и подменю) досконально), пусть уроков будет десятки или сотни и каждый по полтора часа, но всё будет разобрано от и до. Если какой то товарищ задаст тут какой то вопрос, то можно будет отослать его.. к какому конкретному уроку (урок номер такой то)
Полезность этих уроков будет просто колоссальной, привлечет десятки тысяч людей на канал, подписчиков. В этих уроках проставлять реквизиты помощи (карта Сбербанка, Юмоней и т.п. или какими то другим путем). Будет возможность стимулировать автора программы не только через словесную благодарность, но и материально, создавая условия для творчества и стремления. Я склоняюсь к тому, чтобы нам всем попросить автора программы начать академический курс хотя бы в тестовом варианте, а потом свести дебет с кредитом )) и сделать вывод: нужно ли продолжение. Я просто смотрю на то,что на многих каналах открыто идет процесс донатизации, поощрения, стимула, ничего в этом предосудительного нет. Кто-то собирает деньги типа на курево, кто-то на выпивку ("Эх ты!! Бутылочку пожалел" (Лёха Николаев "Агент национальной безопасности" https://www.youtube.com/watch?v=R60HuYtOuuY, на бутылочку мне пожалел )) ), кто то на бензин для автомобиля, чтобы ездить по местам съемки новых роликов (может, даже кто-то на новый автомобиль для поездок с камерой)) ), кто-то на покупку книг для сканирования и т.п. Можно оформить канал через подставное лицо, не светив свои данные, вариантов много, но я так думаю, что всё это будет взаимно интересно, как для учителя, так и для учеников. По крайней мере нужно сделать попытку, под лежачий камень деньги рекой не текут ))).
А начать следовало бы так https://disk.yandex.ru/i/eQUNH1prbN7VXA

Автор: Simonthe, Отправлено:19:42 01-01-2023

Во-первых выражаю признательность разработчику(-ам) за столь нужный инструмент(-ы)

Много лет следил за развитием проекта. много работал с FR, ScanTailor разных версий...
И SK тоже пробовал. но не освоил.
В наличии лицензионный FR12 и, кажется SK 6.8 с этим совместим, но...
Сильная - слабая сторона:
открытость возможно всех настроек - это шикарно, но для построения конкретного алгоритма для конкретной задачи - это... Не освоил.

С чего бы начал? с "инфографики": например в yedGraphEditor построить общую диаграмму - дерево возможностей и указать их применимость для конкретных задач:
1) задача "электронное переиздание страниц книги"
коррекция изображения по резкости, освещенности, контрасту,
нормализация освещенности скана
удаление размытия контуров
2) задача " переиздание текста книги", т.е. OCR перевод в текстовый формат.
коррекция изображения для OCR (макс. послед. шагов: начиная от коррекции изобр. и заканчивая autoglyph)
в т.ч. восстановление контуров букв в автоматическом/полу-автом. режиме.
для вариантов ФР, Тессеракт

Было бы классно организовать сквозную рубрикацию доступа к функциям типа "рабочий стол".
Продвинутоу пользователю - это не надо - ему быстрее прямой доступ.
А начинающему - самое то: т.е. "выставил задачу" - получил сокращенный обозримый набор функций.
Выставил общую задачу обработки ( переиздание страниц / подготовка OCR) и получил функции прямо полезные для задачи.



Например - текущая задача: книга около 1850 года 500 страниц,
искажения прорисовки букв в, н, и, п, м.
500 страниц по 2-3 минуты на страницу 17 - 25 часов.
Если бы запустить в автоматичеком режиме, чтобы хоть половина букв превратилась в распознаваемы.

по сути, нужна бы функция типа указать SK пути:
-- к оригинальному PDF/DJVU
-- к пакету ФР
и чтобы сопоставление ФР данных и страниц было в авто-режиме
после чего
прогон в СК - autoglyph
и повторное распознавание в ФР.

С уважением






Добавлено:
Уточнение:
исправление для OCR фотографий с дефектами печати требует:
1. Выделить зону буквы/слова
2. оценить яркость зоны (?гисторгамма)
2.1 среднюю
2.2 расхождение между медианами (1/2 .. 1/3) светлого и темного
3. диапазон разницы медиан предоставить пользователю/алгоритму на получение макс. ясного контура.
4. установить цвет - границу разделения контраста
5. всё что темнее границы - отемнить, что светлее - осветлить
6. проверить получение идентифицируемого контура буквы, Оценивать возникновение слияния линий относительно эталонного начертания.
7. соотв. исходной относительной жирности буквы подставить глиф.
8. естесстно возможно подключение словаря (и получим почти OCR )
Если не ошибаюсь, у ФР - такой алгоритм отсутствует.

Этот подход не годится для картинок, но для текста - подходит.

P.S. может ли кто-то указать шаги для автоматического улучшения картинок для распознавания?
Рассматриваю опции: изменения контраста, разделения уровней яркости, автоглиф.

С уважением.

Автор: xMARx, Отправлено:13:41 02-01-2023

__Всем привет. Заранее прошу прощение за некоторую дотошность
__1. Несколько напрягает один момент, связанный с работой ластика в окне Result view, про который я уже как-то тут говорил. Пиксели, которые стираются, всегда находятся несколько левее и выше ластика. На прикрепленном рисунке справа снизу плохой вариант, при котором стертый пиксель далековато от ластика. Примерное положение курсора (т.е. ластика) выделено красным цветом.

__Можно ли как-то приблизить удаляемый пиксель к указателю мыши (т.е. ластику)? Такое ощущение, что при определении того, какой пиксель удалить, используется не та функция округления координат курсора.

__2. Аналогичная ситуация при удалении с помощью Mouse-up-clear mode. Чтобы удалить правый черный столбец необходимо прикоснуться к нему прямоугольной областью с правой стороны, чтобы удалить левый необходимо захватить два левых столбца.

__Может имеет смысл сделать так, чтобы правый столбец удалялся при касании прямоугольной областью с правой стороны, а левый – при касании с левой стороны. Или при выделении данного столбца с правой и левой стороны. Ну то есть, чтобы поведение функции было одинаковым как с правой, так и с левой стороны.

__3. Иногда хочется сравнить букву в окне RV с повернутым и увеличенным оригиналом изображения для того, чтобы поправить ее самостоятельно ластиком и занести в библиотеку глифов.
__То есть тыкнул мышкой на кнопку – исходное изображение (повернутое и увеличенное), еще раз тыкнул – бинаризованное….

__Возможно, при более серьезном овладении СК, необходимости в пункте 3 нет.

Автор: TelecomUral, Отправлено:14:12 02-01-2023

xMARx
при выключенном сглаживающем фильтре позиционирование курсора - безупречное, сейчас проверил ещё раз.

Автор: xMARx, Отправлено:15:15 02-01-2023


Цитата:
xMARx
при выключенном сглаживающем фильтре позиционирование курсора - безупречное, сейчас проверил ещё раз


__Спасибо за ответ. Буду иметь это ввиду.

Автор: Simonthe, Отправлено:16:29 03-01-2023

Здравствуйте.

По поводу workbench/рабочих столов:
// ознакомился немного с функционалом SK.
для SK концепция рабочих столов в смысле изменения доступности инструментов - не нужна.

Вместо workbench: ориентирующая подсветка:

ИДЕЯ: есть основные случаи обработки: конечная задача Х требования сканов

ЗАДАЧИ: восстановление картинки страниц // распознавание

ТРЕБОВАНИЯ СКАНОВ:
1. геометрические: повороты(deskew), скручивания, сдвиги(), изгибы (dewarp)...
2. сканирования/фотографирования: контраст, резкость, освещение
3. дефекты печати: артефакты, подчеркивания, смазанность, спеклы, марашки, низкое качество печати (ужирнение, истончение, пропуски, сложные глифы)
4. сложная печать: структура, цветность, формат текста: B-I-U, шрифт ....

Например, при подготовке к распознаванию в FR12 нужно только 2. и 3. и не создать дополнительных помех (напр. ужирнение текста)

Но: настроек много, туториалы длинные - высокий порог начала пользования.

Если вести подсветку / управление функциями - это улучшит ориентацию и понизит порог начала.
Алгоритм:
1. Reset all task settings - при начале нового задания
2. Меню настройки управления (на подобие Customize Toolbars)
* Создать/изменить режим обработки -> установить галочки напротив отключаемых/сбрасываемых настроек, установить цвет подсветки.
3. Исходя из знаний авторов, опытных пользователей... составить списки функционала, используемого в категориях конечная задача Х требования сканов
4. ввести менюшку выбора режима обработки: наверное - галочками: где отметить конечную задачу и требования сканов.

5. составить режимы подсветки инструментов:
1. Зеленый - надо использовать
2. синий - использовать по-усмотрению
3. красный - отключено, сброшено
4. маджента - Осторожно, возможность внести искажения

6. подсветку показывать - или цвет названия инструмента или рамочки вокруг кнопки.

К примеру, в данный момент стоят на очереди страниц так ... на 4..5 тыс. и как-то тратить на вычитку-коррекцию 200-300 часов не улыбает.
Будет более чем достаточно улучшить четкость контуров букв, повысить контрастность, м.б. автоглиф - получится хоть в 2 раза сократить время на обработку OCR.

и не нужны ни зоны, ни деление страниц - это сделает FR.

И когда мало понятно как настроить опции, на прикручивание автоглифа - уже терпения не хватает.

Сейчас, для того, чтобы по-мануалам собрать маршрут действий, надо выучить все мануалы...

С уважением.

Автор: daa2013, Отправлено:17:51 03-01-2023


Цитата:
Сейчас, для того, чтобы по-мануалам собрать маршрут действий, надо выучить все мануалы...


Именно в этом и проблема !

Автор: TelecomUral, Отправлено:20:05 03-01-2023

[more=оффтоп]
Цитата:
daa2013
Именно в этом и проблема !

да щас! есть нормальные туториалы в Хрестоматии. Сел, прочёл, это около 20 минут, и за полтора-два часа мучений и тыков в интерфейсе типовые задачи - сможешь решить. Я в личке уж десяток человек точно видел, прошедших этим путем и сказавших в конце "да в принципе - ничего сложного, спасибо. но нетривиально, очень". Да больше чем десяток.
В нетривиальности дело. Чтобы что-то сделать, надо вскрыть для себя неочевидный задуманный алгоритм обработки. То есть надо не шаги прописывать, а схемы прорисовывать, как я про пикчур-зоны прорисовал. Для этого надо визуализировать абстрактные объекты. На чем ум некоторых местных нетоварищей ломается. Им конкретику подавай. А если это абстрактная модель, типа пикселя, обладающего помимо места, десятком свойств, проявляющихся в различных местах различными способами, это же невозможно "нарисовать", это только в уме формируется. Что у пикселя и место, и окружение, и цвет, и малоцветность в поле, и градиент на том же поле, и цветовое пространство, и маска, и порог для его бинаризации. Всё сразу. И выходной какаду в пдф. Можно прорисовать или описать частичные схемы для каждого процесса, что и будет "мануалом", а в целом увидеть - невозможно. Поэтому просьбы о типовых задачах или объяснении кнопок - признак малограмотности. Половина кнопок интерфейса - "гвоздь в доме", а не "дверь" и не "окно". Гвоздь можно почти где угодно вбить, важно зачем его вбивают. Остальная половина интерфейса уже объяснена.

Можно ли свести двигатель трактора к бензину, взрыву, и коленвалу с цилиндрами? Можно. А будет ли трактор с таким двигателем пахать реальную землю? Думаю, не более полуметра пропашет, а дальше мы начнем удивляться, что нужно ещё масло, кольца, спецсталь, свечи... иначе вспахать не получается.[/more]

UPD
и все опять забывают, что Кромсатор писан автором для себя и под себя Какие нахрен "типовые задачи" для автора программы

Автор: daa2013, Отправлено:22:55 03-01-2023

Да нет никаких "типовых задач" или "маршрута". У каждой книжки свои проблемы. Тут надо знать весь арсенал, чтобы знать, куда из чего палить.
Нельзя как мартышка тупо нажимать кнопки в определенной последовательности.
А чтобы понимать чего и за чем, надо иметь представление, что имеем на входе и что хотим получить на выходе. И это уже даже не совсем вопрос кромсатора.

Я тут лет пять назад накидал некий планчик, может, кому и пригодится:


https://disk.yandex.ru/i/VQeTfN2CjbVEmQ

Автор: Simonthe, Отправлено:00:39 04-01-2023

Пример страницы

Проблемы распознавания букв в, н, и, п, м.

хотелось бы ограничить зону воздействия:
1. на осветление обрабатывать только линии/элементы шириной больше чем 4 px...
2. на утемнение только элементы шириной больше 2 px
предположительно - палочки внутри букв станут толще, а контуры тоньше -> эффективное распознавание.

Страниц в книге 550+

мобуть подскажете?
Пока что просматриваю туториалы из серии AAW01-AAW17


Добавлено:
искажения прорисовки букв в, н, и, п, м.
https://dropmefiles.com/I25Fq
// хранение 14 дней

Добавлено:
daa2013
Цитата:
Да нет никаких "типовых задач" или "маршрута".


Простите, за возражение, кабы не было совсем никаких типовых - то и общеприменивые инструменты были бы невозможны, ан SK - сделан.

Как описано выше "основные случаи обработки: конечная задача Х требования сканов".
XXXXXXXXXXXXXXXX Первичная обработка Постобработка глифы
Коррекция яркости Illumination, Contrast, Brightness ?? ??
Коррекция контуров Blur, Sharpen, Enhance ?? ??
Коррекция цветности ?? ?? ??
Коррекция артефактов Despeckle, ?? ??
Коррекция марашек ?? Marashki ??
Коррекция геометрии Deskew, Dewarp, Split Pages ?? ??
Контуры букв autoglyph



пока что познания выглядят так.
Предположительно, по такой таблице было бы легче подбирать маршрут:
Что и насколько сделать в первичной обработке, во вторичной, что глифами.

Помогла бы схема типа - противоположностей по эффекту или ... надо ещё изучить, чтобы спросить правильно.





Автор: TelecomUral, Отправлено:07:50 04-01-2023


Цитата:
искажения прорисовки букв в, н, и, п, м.

200дпи, 16 цветов. Явно джипег поучаствовал, т.к. квадратики россыпью вокруг линий. Ну-ну.
Сканировать надо нормально.
Это подробно обсуждалось ещё лет пятнадцать назад, что не стоит использовать СК на принципиально неприемлемых сканах, хорошего всё равно ничего не получится. Если уж глаз читает букву с трудом, то и компьютер ничем не поможет. Отсюда вытекли минимальные требования к сканировочному процессу для текста: 300дпи, 256 оттенков, честный тифф. Для кегля менее 8пт - не ниже 600дпи.

оффтоп
попробуйте поднять вдвое-втрое дпи через гигапиксель и скормить результат файнридеру. Может помочь, вполне вероятно.

Автор: daa2013, Отправлено:09:25 04-01-2023

Самый лучший способ что-то освоить - начать это преподавать

Осваивайте, делайте для себя заметки, может быть, позже они выльются в статью. А когда-нибудь потом я включу этот материал в Хрестоматию.

Если вы какую-то инфу в Хрестоматии искали и не нашли - разберитесь и запишите.


Добавлено:
Через гигапиксель лучше всего в 4 раза поднимать. Он тогда пропуски как бы восстанавливает. А в 2 раза - обычный апскейл с усилением резкости получается.

Автор: asku, Отправлено:09:36 04-01-2023

Добрый день. Подскажите, пожалуйста.
Вот здесь же есть смысл все буквы (и строчные и прописные) добавить?


Просто подумал, раз этого не сделано по умолчанию, а нужно вводить их посимвольно, то может есть какие-то подводные камни.

Автор: TelecomUral, Отправлено:09:39 04-01-2023

asku
по памяти, добавление сюда буквы исключает также и анализ спеклов в её поле. Итог: мусора больше.

Добавлено:

Цитата:
daa2013
Самый лучший способ что-то освоить - начать это преподавать

вот, кстати, да! Поражает, что тот кто просит инструкцию и её не получает, не начинает писать её сам. Ну нет чего-то, не существует ещё, так возьми и сделай. Тебе же самому это уже нужно. Что блокирует, загадка. Видимо, свинячье отношение к людям. Хапнуть и не поделиться.

Автор: asku, Отправлено:12:45 04-01-2023

TelecomUral
Может тогда имеет смысл помимо посимвольного внесения в список, иметь возможность внесения всех символов разом (напр. кнопкой).

Автор: TelecomUral, Отправлено:12:53 04-01-2023

asku
всего набора UTF-8 ?

Автор: asku, Отправлено:13:00 04-01-2023

TelecomUral
Мне хватило бы кириллицы +- несколько букв)

Автор: TelecomUral, Отправлено:13:19 04-01-2023

asku
зачем такие обходные пути. Надо исключить алфавит - есть язык страницы и её ocr.

Автор: bolega, Отправлено:13:36 04-01-2023

asku
Включите просто режим подсветки outside letters в КМ кнопки с фонариком

Автор: daa2013, Отправлено:17:41 04-01-2023

Хотел бы обратить внимание, что Simonthe пишет про следующий функционал:


Цитата:
2. оценить яркость зоны (?гисторгамма)
2.1 среднюю
2.2 расхождение между медианами (1/2 .. 1/3) светлого и темного
3. диапазон разницы медиан предоставить пользователю/алгоритму на получение макс. ясного контура.
4. установить цвет - границу разделения контраста


его в СК вроде как сейчас нет. Но помнится я в 2018 г. предлагал к пикчурзонам прикрутить гистограмму и приводил пример интерфейса уровней из программе Capture One (входные и выходные точки ползают по верхней и нижней сторонам окошка, также даётся разблюдовка по каналам):

Автор: Simonthe, Отправлено:23:37 04-01-2023

TelecomUral, вы писали:

Цитата:
200дпи, 16 цветов. Явно джипег поучаствовал, т.к. квадратики россыпью вокруг линий. Ну-ну.
Сканировать надо нормально.

- оригинал книги не доступен - только две версии в PDF. и таких других книг - десятки...
- сам давно фотографирую на 8..10mpx - тогда распознавание почти точное.


Цитата:
попробуйте поднять вдвое-втрое дпи через гигапиксель и скормить результат файнридеру.

Гигапиксель - платная(199USD). Такой возможности не имею, и варез сильно не нравится... собстно потому большая признательность за SK.
Есть ли другие возможности, программы?

Есть ли где-то история изменения (добавл, изменение, удаление) функционала в версиях SK?
С какой версии легче начинать?
В каких версиях был уникальный функционал?

daa2013, вы писали:

Цитата:
Осваивайте, делайте для себя заметки, может быть, позже они выльются в статью. А когда-нибудь потом я включу этот материал в Хрестоматию.

В текущем периоде перегнал вашу (?) хрестоматию 2.1 в *.odt - изучаю матчасть.
Однако объемчик-с...


Добавлено:
Альтернативы Гигапискеля (free)
waifu2x
Upscayl



Добавлено:
по направлению Гигапиксель собрано вот такое ( всё free / freemium )

a_sharper_scaling_1_2_((NetCF3.5.zip -> a-sharper-scaling.com/download/a_sharper_scaling_1_2.zip
a_sharper_scaling_1_2_setup ((.NETCF 3.5.exe
bigjpg-win-x64.zip -> bigjpg.com/en
chaiNNer-0.16.1-x64-linux-debian.deb // github...
chaiNNer-0.16.1-x64-windows-setup.exe
chaiNNer-linux-x64-0.16.1.zip
chaiNNer-windows-x64-0.16.1.zip
Cupscale.1.39.0f1.zip
reshade-install.exe ->reshade.net/
ScapixSetup.exe -> github.com/Specy/Scapix/releases/tag/v2.0.0
Update-W2xEX-v3.98.01-FROM-v3.97.01.7z
upscayl-2.0.1-linux.AppImage
upscayl-2.0.1-win.exe -> github.com/upscayl/upscayl/releases/tag/v2.0.1
waifu2x-caffe.zip -> github.com/lltcggie/waifu2x-caffe/releases/tag/1.2.0.4
Waifu2x-Extension-GUI-v3.5BWsMieN.98.01-Win64.7z
Waifu2x-Extension-GUI-v3.98.01-Win64.7z

Пробовать начну естесстно с портативных *.zip

дальше проверенные ссылки.
QualityScaler (Платно (5$), OSS - если кто - скомпилирует...?) не знаю как с Win7
Upscale.media Free • Proprietary
github.com/cszn/BSRGAN
github.com/Djdefrag/QualityScaler :: https://jangystudio.itch.io/qualityscaler

Добавлено:
a_sharper_scaling_1_2_.zip.
Обработка по-одной, ограничение 8 бит.


Добавлено:
Пока-что, waifu2x-caffe - самая перспективная, но как-то не сработала:
Portable,
input: png-jpg-jpeg-tif-tiff-bmp-tga
output: png-bmp-jpg-jp2-tif-hdr-exr-ppm-webp-tga
Denise + Magnify, CPU/CUDA(cuDNN)

ScapixSetup(uses waifu2x+RealEsrgan) - по сути - портативная, два движка (waifu2x и )
на вход: video-gif-webp.ехе
Сглаживание ровное, про вытягивание слабой печати не ясно.

reshade (Pro) - медленно (на 27 стр - от 8 до 18 часов[i7-3520M-16 GbRam-ramdisk]).
не плохо, но не так чтобы ахнуть,
Но: удобная превьюшка, настройки движками, удобно прикидывать настройки.
тени плохой печати - почти вытягивает. возможно разработчикам стоит посмотреть.






Добавлено:
ПРО ФУНКЦИОНАЛ:
есть ли такой алгоритм для области букв: "оценка формы тени"?
Напр. при слабой печати соединения в буквах в/н/и/п, с/е/о, з/э/3, м...
алгоритм
1. оценивает форму/контур/размер глифа по отношению к эталону (авто/пользователь)
2. оценивает контур тени(-ей) внутри/вокруг глифа
3. вместо выравнивания по цвету/яркости/контрасту - строит "вектор тени" - вытянутость т.е. пробует найти направленнность потенциально размазанного отрезка.
4. Пробует проверить степень совпадения с различными вариантами: (будет запрос проработаю детальнее)
--- для и/н похоже их только 2: - /
--- п - обязательное соединение сверху
--- и - диагонально удлиненная тень или диагональное просветление
--- н - если есть горизонтальная тень - точно н.
--- если есть нижнее соединение - чаще всего н
5. сравнивает наличие признаков: закрытие сверху, снизу, наличие*наклон соедниняющей черточки.
6. проводит по какому-то алгоритму пробную оптическую обработку: контраст/яркость/бинаризация.
7. итого:
--- гипотеза оценки направленности тени(-ей),
--- набор "матриц" оптической обработки(из этапов итерации)
--- совокупный набор признаков начертания букв:
8. по максимальному совпадению,
--- если (совпадение > х) {подставить черточку или глиф и пометить подсветкой для проверки}

Если изобрел велосипед, простите...





Добавлено:
## Перепробовал многое. "сдаюсь"
Уважаемые форумчане,
Если будут прямые подсказки по распознаванию книги, буду очень радъ.

Добавлено:
[more=Книга]rusneb.ru/catalog/000199_000009_008689810/[/more]

Добавлено:
И вот примерно таких на очереди десятки.

Автор: daa2013, Отправлено:05:19 05-01-2023


Цитата:
Есть ли где-то история изменения (добавл, изменение, удаление) функционала в версиях SK?

Смотри в конце в файле "Подборка ответов bolega про работу ScanKromsator"

Автор: Simonthe, Отправлено:05:23 05-01-2023

Так что подсказкамъ по-обработк&#1123; буду весьма радъ.
Вероятнее всего - в пределах СК.
Надо повысить читаемость глифов.
Наиболее переспективным кажется функция автоглиф... aaw16, aaw17, и в хрестоматии есть, но... сложновато пока.
Нашел трюк в пределах FR12:
1. уменьшить освещенность - фон становится серым, а тени - черными.
2. изменить уровни в осветление - и черное остается черным и сколько-то истончается.
Проблема, что в общем ужирнение контуров.
Кажется, если бы в СК такое сделать и применить автоглифы - было-б привлекательно.
Но... настройки куда и что "тыц"?

Автор: daa2013, Отправлено:05:28 05-01-2023

А чего вы именно в издание 1867 года уперлись ? Распознайте 2 том из 1878-го. Оно лучше отсканировано, переводчик вроде тот же.

Добавлено:
"функция автоглиф" базируется на OCR, поэтому для улучшения OCR её задействовать не получится

Добавлено:
http%3A%2F%2Fdlib.rsl.ru%2Frsl01004000000%2Frsl01004902000%2Frsl01004902807%2Frsl01004902807.pdf

Автор: TelecomUral, Отправлено:06:34 05-01-2023

сильный оффтоп для Simonthe
[more]
скачал ваш файл из руснэб, распознал страничку. процент неудачного распознавания в ФР15 - 0,7%, куда выше-то.
Подробности в файле txt в архиве
https://disk.yandex.ru/d/VFeAthw-x9wdHw
Думаю, вы плохо экспортировали изображения из пдф в ФР. И от этого все заморочки. Или ФР старый.
[/more]

Автор: Simonthe, Отправлено:12:02 05-01-2023

TelecomUral,
Очень признателен за поставленный эксперимент...
ФР12 -это сильно старый? ФР15 намного лучше? Как посчитан процент?
По результату распознавания этого сказать не могу.
Чего ищу? Распознавания на уровне 1..2 знака ошибки на страницу и не на каждой странице.
Пусть комп поработает ночь-другую, но вычитка занимает время только на просмотр - до 30 сек/страницу. Судя по улучшению контуров применением UpScaling - это возможно.

Итого - искомая обработка - алгоритм с применением СК и какой-то "UpScale" программы с фриварной лицензией.
И ещё вопрос: поскольку исходники движков AI -доступны на Гитхабе...
Мобуть к СК такое прикрутят? это... так мечтания...


Автор: TelecomUral, Отправлено:12:15 05-01-2023

Simonthe
прямым текстом говорю третий раз: оффтопите. Есть общая ветка про эл.книги
http://forum.ru-board.com/topic.cgi?forum=93&topic=3514&&glp#lt

Автор: Simonthe, Отправлено:19:28 05-01-2023

Спасибо, прямой принял

идея функционала СК: восстановление начертания букв:
в распознавании букв - три основных вар-та проблемы:
-- элемент потерян
-- элемент ужирнен - слияние
-- искажение/нестандартность начертания
С точки зрения различимости - важнее всего само наличие элемента, его выделимость.
в сером/цветном:
-- слияние элементов обычно - не полное, а с просветлением на месте бывшего отступа контуров.
-- потеря элемента обычно не полная а с высветлением в сторону фона
-- искажение - это нерегулярность, редкость - погоду не меняет
-- нестандартность - для этого применимо обучение.

Итого: надо: затемненный просвет осветлить, осветленный контур затемнить, если есть направленность - учесть направленность (т.е. моду/регрессию относительного затемнения)
1. выделить предполагаемую строку -> слово -> букву
2. оценить контур буквы: габарит, форму
3. построить "карту" расположения центров зон просветов и линий -> гипотеза(ы)
4. найти расположение и вытянутость зон затемнения и осветления
5. сличить их расположение и форму с зонами эталонных глифов
Построить вывод о превоначальной букве и соотв. пометить.
В зависимости от степени совпадения - вероятности гипотезы
А. только пометить
Б. (!) в соотв. с гипотезой слегка скорректировать цвет/яркость пикселей :
почти темное - осветлить, почти светлое - затемнить
В. подставить глиф.

В частности - ищу в "хрестоматии" есть ли уже возможность выполнить пункт Б. без распознавания, в автоматическом режиме.


Автор: Simonthe, Отправлено:01:50 06-01-2023

1. стоит ли, куда выложить перерабатываемую для себя "Хрестоматию 2.1"? И на каком
этапе?
2. планирую добавить в "Хрестоматию" содержание ответов ув. Bolega из ссылки https://yadi.sk/i/Pqo1GMfC39xHKr.
3. будет ли офф-топ обсудить здесь и добавить в "Хрестоматию" -> "SK Руководство" спец-раздел по улучшению OCR? Например шаги по получению оптимизированных картинок с разрешением в 300dpi, поскольку по указанию ув. niccolo:

Цитата:

Поскольку когда FR делали еще люди понимающие, преобладающим разрешением было 300 DPI, то на обычном тексте такое разрешение дает лучший результат...
Увеличение до 600 DPI при отсутствии дефектов текста не меняет картины....
Но если работаете с хим. формулами и текстом с большим количеством включений мелким шрифтом - 600 DPI может быть получше.....
Чего точно не любит FR и начинает чудить - всякие некруглые разрешения, часто присущие фотографиям..... Когда-то экспериментировал с одним текстом меняя DPI - на 299 DPI начали появляться совсем непонятные ошибки....



Добавлено:
[more=ПО ФУНКЦИОНАЛУ: ]
ПО ФУНКЦИОНАЛУ: исправление печати:
идея замены пиксельного паттерна:
предпросмотр в окне расстановки резаков:
увеличение 2000
шрифт с засечками (на примере буквы "н":
размер буквы в сетке клеток 12 *14 клеток

если буквы делить на три или 5 уровней:
низ - середина - верх
высота уровня: низ (2)- промежуток(4) - середина(2) - промежуток(4) - верх(2)
ширина уровня: низ (12)- промежуток(8) - середина(8) - промежуток(8) - верх(12)

Тогда возможны варианты обработки:
1. обработка малыми вставками: например палочка соединяния в буквах и / н:
//на примере палочки соединяния в буквах и / н:
палочка соединения в букве н - 5*3 клетки с достаточно специфичным расположением тени.
такой не будет ни в букве и ни в какой-то другой. Причем такая палочка с расположением в среднем уровне буквы - уникальный признак буквы н в русском.
палочка соединения в букве и: размер области 5*7 клеток с достаточно четким диагональным расположением тени.
В рассмотренных случаях - элемент с таким расположением отличен от слияния концов засечек в верхней и нижней части букв, от подобных элементов в буквах а, д, я, з, в, е, э.

поиск - замена такого паттерна - кажется даст 80-90 % правильного восстановления очертания буквы и, опять же - уникальный признак - эти признаки дадут почти гарантированное распознавание в ФР, даже при наличии других дефектов печати.
При такой обработке важна последовательность замены паттернов, чтобы была возможность исключения уже замененных.

2. обработка различительными паттернами:
//на примере палочки соединяния в буквах и / н:
берем премоугольник 4*7 - по габариту косой в "и".
прописать допуск разброса цвета по-ячейкам, наподобие замены цвета.
вероятность совпадения такой маски с другими буквами - минимальна.
произвести поиск замену всех похожих масок на соответствующие с заданным значением цвета - т.е. соотв. с элементом буквы для и либо для н.

3. если для каждой буквы составить 5 масок с допуском под некачественную печать - возможно получение алгоритма восстановления очертания букв и, похоже, даже движка OCR.
4. ясно, что максимально сложная обработка такого рода - автоглифирование целыми буквами... но это понятнее разработчику.
Шаги - интерфейс для настройки такой маски:
увеличить масштаб предпросмотра, найти букву,
выделить клетки сетки, вызвать меню ПКМ: создать паттерн графической замены

Окно настройки:
* левая сторона: сетка клеток с 4 параметрами для каждой:
<[V]изменять>
<[rgb] опорный цвет>
<[%]толерантность>
<[#rgb]целевой цвет или [%xyz]вектор на цветовом пространстве>

* правая сторонa: предпоказ выделенной области с сеткой клеток.
* дополнительный инструмент - цветовая пипетка, для взятия опорного цвета из правой стороны для активной клетки в левой стороне.

Продолжая идею, кажется (всётаки далек от разработки),
Отличие такого способа от общей настройки цвета/деспекла и т.п. - узконаправленное логическое восстановление контура в текстовых зонах.
1. будет нужен функционал выделения-копирования-настройки таких паттернов на этапе перед обработкой, и замена ими во-время обработки или отдельным проходом до/после изменения разрешения скорее - после.
2. потенциально - этот способ плотно свяжется с "автоглиф"





[/more]

Автор: kamenkapenza, Отправлено:14:51 07-01-2023

Simonthe, редактирование Хрестоматии хотелось бы поручить её автору.

Господа! Как через Кромсатор внести изменение в страницы на стадии обработки или на стадии завершения, добавить, например надпись через текст или создать какое то изображение такого рода: Скан - Иванов Петя, Обработка - Васечкин Коля

Автор: bearjrgm, Отправлено:17:08 07-01-2023

kamenkapenza
Через буфер обмена любую картинку вставляете или используете штамп

Автор: kamenkapenza, Отправлено:17:15 07-01-2023


Цитата:
или используете штамп

bearjrgm, а как пользоваться функцией штампа? В каком меню она находиться и на какой стадии обработки вставлять?


Автор: bolega, Отправлено:17:19 07-01-2023

kamenkapenza
В любом графическом редакторе создаете свое изображение-штамп и сохраняете в Tif, желательно в ч/белом 2-битном формате, и желательно с dpi не менее 300.
В окне VR держа нажатым Ctrl, щелкаете на кнопке stamp, появится диалог выбора графического файла. Выбираете свою заготовку. Она появляется поверх скана. Двигаете ее в нужную часть страницы, при необходимости изменяете размер. В КМ выбираете команду Stamp > Merge. Штамп сливается со страницей, но остается и над ней (на случай, если нужно повторно на другие страницы его вставить). Отжимаете кнопку stamp, штамп исчезает.
СК запомнит какой файл вы использовали в качестве штампа. Поэтому в последующие разы просто жмете на кнопке stamp (без Ctrl), и СК сразу загрузит и отобразит ваш штамп.

Добавлено:
Simonthe

Цитата:
Например шаги по получению оптимизированных картинок с разрешением в 300dpi, поскольку по указанию ув. niccolo:

По моему требование о 300dpi было актуально лет 5-10 назад, сейчас для последних версий FR dpi 600dpi будет только на пользу.

СК не занимается OCR, наоборот, он использует OCR от сторонних программ. Например, уже в процессе обработки с помощью встроенного в СК tesseract он может без проблем получить информацию о буквах, словах и строках (поэтому велосипед изобретать не требуется). Насколько правильно распознавание - это другой вопрос. Но тем не менее информацию о буквах он имеет. И использует ее, например, при бинаризации. Вы можете указать СК, какие буквы (и даже части их, например, в области перемычек), бинаризовать с увеличенным порогом - см. опции на закладке окошка page > special > protect. Это примерно то же самое, что вы описывали.

Автор: kamenkapenza, Отправлено:18:06 07-01-2023

bolega, спасибо за ответ!


Цитата:
Вы можете указать СК, какие буквы (и даже части их, например, в области перемычек), бинаризовать с увеличенным порогом - см. опции на закладке окошка page > special > protect.


Наверное,про это показано в ваших последних роликах (про новую версию, глифирование), я пока это побаиваюсь смотреть, надо настроиться, чтобы всё принять к сведению и запомнить.


Автор: xMARx, Отправлено:21:32 07-01-2023


Цитата:
таймлайны к 4м роликам


__TelecomUral, может имеет смысл указать таймлайны в комментариях под четырьмя видеороликами?

Автор: asku, Отправлено:23:19 07-01-2023

Добрый вечер. Прошу подсказать, какую опцию подправить, чтобы не было внутри черной буквы белых пустот (см. буквицу на скрине):


Почему-то мне казалось, что здесь на форуме когда-то посоветовали на вкладке Page кнопку special..., и там в открывшемся меню на закладке More воспользоваться этой опцией:


Я там перепробовал разные значения, но ничего не меняется.

Автор: bolega, Отправлено:02:00 08-01-2023

речь о буквице? Если она в оригинале черная, то в задании похоже normal-метод illumination.

Автор: TelecomUral, Отправлено:07:11 08-01-2023

xMARx
меня так взбесил рутуб в прошлом марте, что я вообще не хочу видео больше заниматься.
Впрочем, lis105 воткнул таймлайны прямо вовнутрь:
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1535746511/30#30

Да, вот ещё позавчера пришлось для индийца тупой ролик записать. Про совмещение ocr FR и СК. Интересно, что русский голос он как-то понимает, а прямые ссылки на инструкции почему-то не может "прочесть". Или он чисто на картинку смотрит, без перевода.
https://disk.yandex.ru/i/eopejlQ6Vb5Vvg

Автор: asku, Отправлено:11:46 08-01-2023


Цитата:
речь о буквице? Если она в оригинале черная, то в задании похоже normal-метод illumination.


Да, буквица. В illumination стоит normal. Но я там сейчас все перепробовал (Safe и т.д.) — результат тот же.
У меня вообще normal по умолчанию стоит. Я меняю на safe когда скан не очень (темный и т.п.)

Автор: TelecomUral, Отправлено:12:04 08-01-2023


Цитата:
asku
Да, буквица.

вот для вас, с вашим опытом, какие сложности были сразу же в первом сообщении выгрузить и приложить суб-задание? Ладно новичок, но вы-то.


Автор: kamenkapenza, Отправлено:12:23 08-01-2023


Цитата:
Да, вот ещё позавчера пришлось для индийца тупой ролик записать.


Ну вот даже для индийцев академический курс открылся. Теперь всякие Чопры, Мехры, Мухандасы, Чакраборти, Пратаны, Кумары, Капурята будут счастливы! А для простого русского народа начальную школу по изучению Кромсатора открыть никто не хотит.

Автор: bolega, Отправлено:12:55 08-01-2023


Цитата:
Но я там сейчас все перепробовал (Safe и т.д.) — результат тот же

сомнительно. ставьте safe

Автор: asku, Отправлено:12:55 08-01-2023


Цитата:
приложить суб-задание


Я думал, там совсем просто — где-то галочку поставить и все )
Тест-папка

Автор: TelecomUral, Отправлено:13:13 08-01-2023

asku
просто, конечно. я так и предположил, что после моей "рекламы" адаптивной бинаризации по Вольфу вы её стали бездумно лепить везде
Надо ж соображать, что именно делает метод. А он "окошком" отбирает близлежащие пиксели и усредняет их плотность перед бинаризацией, приводя ее к половине диапазона, к 128. Вот вы и имеете при окошке 60 и ширине вертикальной палочки буквицы примерно 28, что для пикселей которые посредине черной полоски фон сильно высветляется перед бинаризацией.
Я, конечно, сильно утрировал - метод похитрее чем просто "взять близлежащее и усреднить фон". Но для практических целей достаточно понимать и это.

Автор: asku, Отправлено:13:18 08-01-2023


Цитата:
после моей "рекламы" адаптивной бинаризации по Вольфу вы её стали бездумно лепить везде


Точно) Спасибо.

Автор: bolega, Отправлено:13:21 08-01-2023

Да, с AutoW надо осторожнее если есть протяженные темные объекты.
Раз уж его решили применить, увеличьте windows size=100 (сейчас 50) и тогда будет ок.

Автор: Simonthe, Отправлено:22:23 08-01-2023

TelecomUral,
Замечательное видео

Вы написали:
Цитата:
Про совмещение ocr FR и СК.

В ролике - ФР15.
Для ФР12 - процедура такая же?

Автор: AlVaKo, Отправлено:10:06 09-01-2023

По поводу адаптивной бинаризации.
Метод Вульфа, это модификация метода Сауволы.

У Сауволы, исходя из формулы расчета порога, будет железобетонно страдать бледная перемычка у букв "Н" и "И". Для уменьшения такого негативного эффекта, надо уменьшать размер локального окна до длины перемычки и даже меньше. Но при уменьшении размера окна, начнут страдать жирные штрихи заглавных букв, и прочие обширные черные области.

В плане деградации перемычек, Вульф мало отличается от Сауволы. И ещё, меня терзают смутные сомнения, что различные реализации/применения метода Вульфа для бинаризации сканов книг соответствуют по сути тому, что писал Вульф в статье про локализацию и выделение текста на мультимедийном изображении.

Автор: esys, Отправлено:13:07 09-01-2023

Вульф дает жирноватые буквы, но никогда не гробит мелкие детали и не скругляет излишне входящие углы как другие методы (по опыту работы в скантайлоре адвансед).

Автор: asku, Отправлено:17:04 09-01-2023

Добрый день.
Книга с такими страницами


Правильно ли я понимаю, что такие страницы надо делать так:
создать picture-зоны и распространить их на все страницы?

А как нужно расположить зоны на всех страницах? Вроде недавно что-то такое читал здесь на форуме и забыл (

Автор: xMARx, Отправлено:18:39 09-01-2023

__Здравствуйте. Наткнулся на ситуацию, в которой СК (версия 6.8) неправильно распознал букву "д" и перепутал ее с "ц". Если бы буква "д" выглядела бы совсем плохо, то неточность была бы вполне объяснима. Но с ней, вроде, все ок. Для распознавания применяю тессеракт.
__Задание прикладываю . Deskew и despeckle в данном случае отключены ( исходный файл есть обработанное изображение, которое я снова скормил СК).

Участок обработанного изображения, на котором не удалось распознать букву "д" https://transfiles.ru/ix4wt
Проект https://wdfiles.ru/86b622e. (эту ссылку поправил)

__Если в окне RV удалить нижние и верхние строки текста, то СК нормально распознает букву "д", но "Ж" перед ней будет большая.
ЗЫ: если на букве нажать ПКМ, далее change letter to... , то там можно будет выбрать букву "д".

Автор: daa2013, Отправлено:19:53 09-01-2023

ну дык это ж тессеракт так распознал, пишите об этом его разработчикам

Добавлено:
распознавание FR попробуйте, раз тессеракт лажает.
у тессеракта в СК аж три метода , попробуйте Combined

Автор: xMARx, Отправлено:20:19 09-01-2023


Цитата:
ну дык это ж тессеракт так распознал, пишите об этом его разработчикам

__Да я хотел на проблему с тессерактом указать, не более того. Но, признаться честно, ветку хорошо не изучал. Возможно эти проблемы уже тут обсуждали, и ничего полезного в моем посте нет...


Цитата:
у тессеракта в СК аж три метода , попробуйте Combined


__Спасибо за совет. Надо будет посмотреть.

Автор: bearjrgm, Отправлено:14:07 12-01-2023


Цитата:
Добавлено:
распознавание FR попробуйте, раз тессеракт лажает.


ФР тоже лагает, особенно на шахманой нотации, например, Cc6 и Се5 легко становятся Ceб. Я уже молчу про ході в которых f, которая лекго превращается в Г, 1 и еще во много что. Я так понимаю, там или тренировать нужно его, или словари дополнять.

Так что ФР не совсем панацея.

Автор: shch_vg, Отправлено:14:14 12-01-2023

bearjrgm
[more=оффтоп]
Цитата:
ФР тоже лагает, особенно на шахманой нотации, например, Cc6 и Се5 легко становятся Ceб.

Какой пустяк!
Сейчас большинство фигур как в нашем шахматном издании, так и в забугорном представляются в виде фигур. Вот на них-то фантазии ФР становятся безграничны. [/more]

Автор: bolega, Отправлено:16:46 12-01-2023

Кстати, реализовал просьбу

Цитата:
А может вообще дать пользователю возможность это редактировать ? Импортировать некую "таблицу замен" взамен дефолтной, а потом, когда не надо сбросить обратно. Иногда такие вычурные сбои бывают. И регулярные притом. UPD: для данной конкретной книги регулярные, что-нибудь типа "з-ц"


Добавлено:
Кстати, половина из тех, кому я отправил ссылку на тестовую версию, даже не стали ее скачивать. Очевидно, тестировать придется самому. Но на это уйдет как минимум месяца три, сейчас я сильно загружен другими делами.

Автор: bolega, Отправлено:20:03 12-01-2023

Вдогонку: файл с шаблонами sk_templates.txt нужно положить в папку с sk.exe.
Можно добавлять в файл свои собственные шаблоны. Синтаксис кратко описан внутри. Кодировка файла значения не имеет (ANSI, UTF8, Unicode)

Автор: Simonthe, Отправлено:00:44 13-01-2023

Редактирование руководства:
Попытка объединить найденные печатные руководства.
Версия на суд/обсуждение/дополнение.
[more=смотреть]
ссылка: http://sendfile.su/1663626
пароль: http://forum.ru-board.com
[/more]
Остальные комментарии в файле.

Автор: TelecomUral, Отправлено:07:34 13-01-2023

Simonthe
Еще лучше было бы собрать ответы bolega с момента окончания сбора списка "1000 ответов...". Он аж 2016 года. И не только в этой ветке их собрать.
Зачем было переводить многомерный chm в линейную простыню, непонятно. Неудобно крутить, трудно читать.

Схемка хороша. Прям душа радуется, я такие рисунки люблю. Компактно и наглядно.

Автор: bolega, Отправлено:12:04 13-01-2023

bearjrgm

Цитата:
ФР тоже лагает, особенно на шахманой нотации, например, Cc6 и Се5 легко становятся Ceб.

В СК при подключении ocr можно такие ошибки отлавливать через Find с регуляркой:
([КК][рр]|[ФПСCКK])[ceсе]б
Типичные шаблоны поиска можно заранее занести в файл шаблонов и вызывать при необходимости. Это конечно имеет смысл делать, если внедрять ocr слой в djvu/pdf через СК.


Автор: kamenkapenza, Отправлено:12:35 13-01-2023


Цитата:
Кстати, половина из тех, кому я отправил ссылку на тестовую версию, даже не стали ее скачивать.

Вот такие неблагодарные... (слово можно добавить любое ругательное, по вкусу )) )
А зачем тестировать последующую версию с правом использования (тестирования) её "избранными"?

Нужно просто после каждой конверсии программы указывать в шапке ссылки две ссылки: на "обкатанную" (прижившуюся) версию программы и на последнюю экспериментальную. Во-первых это было бы справедливо (могли бы скачать не только лучшие друзья (которым иной раз некогда попробовать), но и не совсем друзья )), обычный народ. И,во-вторых, может, даже от гласа и действий народа будет пользы больше, чем от касты избранных.
И, в третьих, дать возможность стимулировать труд автора: предоставить реквизиты донатизации. Каждое доброе стремление должно приносить радость творчества, в том числе и материальную.
И,в четвертых, (в восьмой раз про это говорю, про это архиважное дело): начинать процесс внесения программы в народ: академические видеоуроки для рабоче-крестьянского класса. Содержимое видеоуроков использовать для редактирования Хрестоматии. В видеоуроках указывать реквизиты помощи автору,чтобы польза была взаимовыгодная.
Всё это вышесказанное будет всем на пользу.

С наступающим Новым годом (по старому стилю), друзья !!!


Автор: Simonthe, Отправлено:15:27 13-01-2023

TelecomUral, вы писали:

Цитата:
Еще лучше было бы собрать ответы bolega с момента окончания сбора списка


[more=Комментарии]
Отвечу притчей из програмистской области:
Приходит в программирование гениальный программист. Видит, что языков - куча, запутаться - легче-легкого и у всех языков есть недостатки.
Поскольку способности вроде бы позволяют - этот гениальный программист создает новый язык, устраняющий (важные на его взгляд) недостатки других языков.
Но... этот язык имеет свои недостатки вследствие несовершенства самого человека и технологических ограничений.
И... неразбериха языков программирования возрастает ещё на 1 язык...

Так вот, ответ по-существу:
Сперва надо подготовить полочки: как вариант - "причесать" существующее руководство.

И вот имея готовое место - ответы автора и опыт других пользователей - лягут сразу куда надо и будут доступны для пользования.
Кстати - с этой целью перевожу картинки кнопок в текст: возможность поиска.

Почему надо было перегонять многомерный chm в линейную простыню - каждый пользуется знакомым инструментом.
Редактор chm эффективный и фриварный мне не известен. А большие реструктуризации легче делать без риска неожиданных скачков -> LO. Предполагаю, что имея готовый линейный документ - перевести его в chm формат - вопрос желания и дело умения.

Схемка... сделана в редакторе yEd. туда надо ещё добавить категорию обработки "глифы".

Из вообще необходимого: нужна точная инструкция (в тексте) по связке с FR. Чтобы сделать блок-схему.
Будет полезна общая блок-схема последовательного подбора параметров обработки.
В планах - схема связок и балансировки применения функций.
Наиболее "чувствительный" пункт: восстановление шрифтов/глифов для OCR. - расписать бы кто знает...
По поводу собрать ответы... если кто-то организуется их скопировать нарезкой в один файл, то м.б. "причешем" я или кто-другой.
Говоря честно, мой энтузиазм скорее всего окончится после освоения подготовки текстов для OCR.
Но пока это не достигнуто - добро-пожаловать с вопросами, запросами, подсказками, указаниями и т.п.
С уважением.
[/more]

Добавлено:

Цитата:
Зачем было переводить многомерный chm в линейную простыню, непонятно. Неудобно крутить, трудно читать.

Для удобного просмотра в Lib.Off. есть оглавление - навигатор. там все рубрики видны.

Автор: bolega, Отправлено:23:07 13-01-2023

asku обнаружил серьезный баг, возникающий при какой-то из операций по изменению теста. Портятся координаты букв, сильно портятся. Причину этого я пока не выяснил. В связи с этим рекомендую пока функционалом ocr (точнее, его корректировки) не пользоваться.

Автор: bolega, Отправлено:16:03 14-01-2023

Причину бага нашел.
Если была корректировка ocr-текста, при которой:
- удалялись буквы
- на одной странице изменялось более одной буквы текста с использованием функции Find/Replace
то файл focr/tocr непоправимо портился ((
Как правило, портилась информация о буквах (которая используется для глифирования), информация о словах вроде бы не страдала.
Приношу извинения за неудобства, которые этот баг явно доставил.

Добавлено:
Это кстати, ответ на вопрос

Цитата:
А зачем тестировать последующую версию с правом использования (тестирования) её "избранными"?


Автор: VadimirTT, Отправлено:16:58 14-01-2023

Новый Мир за 1926-й год.
Какие параметры надо, что бы текст был синий, без фона? Никак подобрать не могу.
Ссылка
Кстати, идёт непрерывный поток сканов, от imwerden.de, может кто, если есть время, может помочь обрабатывать.

Автор: TelecomUral, Отправлено:17:38 14-01-2023


Цитата:
VadimirTT
Новый Мир за 1926-й год.
Какие параметры надо, что бы текст был синий, без фона? Никак подобрать не могу.

DPI Default (чтоб 600 как у книги на выходе)
Color B|W
внизу Threshold = Auto
На закладке Paint уберите галку Background и tolerance =0 везде. Это просвечивание, оно не требуется если под зоной чисто.

Но результат поганый. Никогда такого скана не видел, чтоб с муарчиком-мусором от джипега именно на синем. Прямо образчик в какую-нибудь энциклопедию.

Андрей (imwerden) всегда норовит сделать очень плохие сканы.

Автор: VadimirTT, Отправлено:17:54 14-01-2023


Цитата:
Андрей (imwerden) всегда норовит сделать очень плохие сканы.

Это не его, а от гуманитариев из издательства НМ.

Автор: TelecomUral, Отправлено:19:16 14-01-2023

VadimirTT
не знаю... но с этим файлом что-то не то. Приближая, синее пропадает. Возникают вертикальные муарные полоски.

Автор: shch_vg, Отправлено:22:45 14-01-2023

VadimirTT
А зачем здесь вообще пикчер-зона?
Почему текст строки должен отличаться по цвету от остальных строк?
Грязная строка?

Автор: VadimirTT, Отправлено:22:48 14-01-2023


Цитата:
Почему текст строки должен отличаться по цвету от остальных строк?

Ну, они же там синие. Почему, откуда мне знать.

Автор: shch_vg, Отправлено:23:48 14-01-2023

VadimirTT
Вы хотите в цветном скане изменить цвет текста?
В бинаризированном он становится черным.

Добавлено:
Сделал чуть более читаемым, но возни много.

Автор: VadimirTT, Отправлено:01:01 15-01-2023

shch_vg
Почему они синие, я не знаю, но у Вас ч/б.

Автор: shch_vg, Отправлено:01:30 15-01-2023

VadimirTT
Вы что, серьезно считаете, что в бумажном варианте журнала эти строчки синие?
По-моему это дефект сканирования или печати.
Если журнал переводится в ч/б вариант, то нужно переводить все, а не смотреть, что в скане как выглядит.

Автор: bolega, Отправлено:09:40 15-01-2023


Цитата:
Это не его, а от гуманитариев из издательства НМ.

От тети Зины из бухгалтерии НМ? Сканирут на мфу, доставшемся в наследство от дедушки?

Автор: VadimirTT, Отправлено:10:02 15-01-2023


Цитата:
От тети Зины из бухгалтерии НМ? Сканирут на мфу, доставшемся в наследство от дедушки?

Так, другого то нету. Если нет гербовой, пишем на простой.
Вопрос в том, как это лучше сделать. Я вряд ли смогу добыть НМ за 26-й год в бумаге.

Автор: bolega, Отправлено:11:07 15-01-2023


Цитата:
Так, другого то нету.

Ну тогда успехов вам в создании зон с синим текстом ))
Небось через ризограф прогоняли.


Автор: trion1, Отправлено:12:09 16-01-2023


Цитата:
Редактирование руководства:
Попытка объединить найденные печатные руководства.
Версия на суд/обсуждение/дополнение:

ссылка: http://sendfile.su/1663626
пароль: http://forum.ru-board.com

Остальные комментарии в файле.
Формат А3 альбомной ориентации ни читать с экрана, ни печатать, а потом читать с бумаги, особого желания не возникает "от слова совсем". Очень не удобно(

Пароль в самом файле нафиг не нужен.

Автор: slava_kry, Отправлено:15:19 16-01-2023

VadimirTT
Не нужно там ничего делать, кроме подбора уровня размытия по гауссу.
По Шопу 0,8 выходит.
Нет там никакой синевы...

...И сканирование словно сквозь линзу Френеля или линейный оптический растр.

Автор: Simonthe, Отправлено:22:39 16-01-2023

trion1, здравствуйте. Вы писали:

Цитата:
Формат А3 альбомной ориентации ни читать с экрана, ни печатать, а потом читать с бумаги, особого желания не возникает "от слова совсем". Очень не удобно(

Спасибо, учту на будущее. Эта версия не "публичная " - удобно для редактирования. А вообще буду рад подсказкам по-содержанию и оформлению.
Сейчас главное - добраться до итоговой версии: собрать в одно место всю базу и упорядочить.
Отформатировать - меньшая трудность.

Если у кого-то будет настроение - возможно отметить устаревшее, измененное, дополнительные особенности.
Просьба - открывать в Либре/Опен Офисе иначе "слетает" форматирование.
Просьба ничего не удалять: только отмечать форматированием( как - см. в файле), поскольку есть идея собрать универсальное руководство для всех версий.
Если справлюсь - предстоит соединение двух файлов: этого и "хрестоматии".
[more=собранное из двух версий monday2000 (2006-2007: SK 5.5b-5.6A)]
открыть: http://forum.ru-board.com
https://dropmefiles.com/ma76e
[/more]


Всё что касается оформления для удобства пользования - в конце - посло окончания обработски.
Если очень надо: Format>Page>Size =[A6...A5...A4-Custom] - кому как удобно.

Автор: Simonthe, Отправлено:23:05 20-01-2023

Руководство в пределах совмещения инструкций СК 5.6А и 6.00.5
Часть первая: интерфейсы
Черновая версия.
Libre Off., форматирование А3, цветовые пометки.
Помощь знатоков - очень востребована.


С ув. [more=Руководство #1. Черновик в.1.а]
пароль: forum.ru-board.com
ссылка: https://ru.files.fm/u/xj28fvd5y
[/more]

Автор: esys, Отправлено:20:25 22-01-2023

В ворде или пдф можно сделать?

Автор: kamenkapenza, Отправлено:20:50 22-01-2023

Господа, видеовопрос про паст селект групп https://disk.yandex.ru/i/0c0y1ji7WhD58A

Автор: Simonthe, Отправлено:23:42 22-01-2023


Цитата:
В ворде или пдф можно сделать?

Добрый день, esys,
Да, LibreOffice->File>Export as PDF. Сейчас не буду этим заниматься: надо закончить общую обработку и возможны множество предпочтений по оформлению (размер страницы, оглавление и т.п.)
Поэтому, собственно экспорт оставлю вам. Настройки:
LibreOffice->Format>Page
Но оговорюсь: файл "сырой" - требует подтверждения более опытных пользователей.
Всего доброго.



Автор: TelecomUral, Отправлено:10:27 23-01-2023


Цитата:
про паст селект групп

1) выделили группу файлов красным
2) вызвали команду cut selected group
3) вызвали команду paste special
4) в появившемся окне со списком ВЫБРАННЫХ файлов выбираете мышью один нужный
5) в окне ОБЩЕГО списка файлов мышью встали на тот файл НАД КОТОРЫМ надо вставить выбранный из группы
6) давите в ОКОШКЕ кнопку Paste selected (не надо мышью команду вызывать). Файл в ОБЩЕМ списке переместится в новое место, а из группы пропадет
7) выбрали в списке ВЫБРАННЫХ новый один нужный
8) повторили пункты 5 и 6. и так по циклу пока группа ВЫБРАННЫХ не опустеет.
9) закройте окошко команды.

По сути это как тарелка с блинами. Напекли в одну стопку на одной тарелке, пришли к общему столу и раскидали по личным тарелкам в том порядке, как захотели.

Автор: bolega, Отправлено:11:43 23-01-2023

Добавлю к сказанному TelecomUral:
в п. 4 можно выбрать не один нужный, а несколько подряд.
Под selected group подразумевается группа подряд идущих выделенных файлов, без пропуска, внутри которой находится текущий фокус (т.е. фокус не обязательно должен быть на первом файле группы). Отличие selected group от просто selected в том, что если в общем списке есть другие выделенные файлы, но они разбросаны по списку, и не контачат с текущей группой, то они считается вне группы и игнорируются.
Список отобранных "блинов" подтормаживает, поэтому спешить с нажатием команд не нужно

Автор: kamenkapenza, Отправлено:22:56 23-01-2023

TelecomUral, большое спасибо!
bolega, большое спасибо!

Автор: Simonthe, Отправлено:01:32 24-01-2023

Доброго дня
Ищу поддержку:
Собрана в одно место бОльшая часть известных руководств по СК.
Для дальнейшего упорядочивания нужна ясная схема изложения.
В целом кажется, что знакомство с СК следует начинать не собственно с функционала, а с типовых решаемых задач.
Напр.: геометрия страниц, общее улучшение изображения, чистка-доводка-восстановление, формирование книги.
И подпунктами - основные задачи для каждой категории.
И в этом разделе - описать общие эффекты инструментов, принципы применения фильтров с точки зрения принципа подбора и формирования последовательности.

Дальше - хорошо бы расположить описание в последовательности применения в максимальном сценарии обработки.
Для этого (кажется) надо знать:
>>минимальный путь обработки типа формирования книги:
импорт файлов -> Процесс! -> сохранить.
>>максимальный путь обработки типа:
1. пробная обработка страницы, оценка результата, подборка параметров**, подготовить файл настроек *.ini
2. открыть задание->импортировать(отдельные стрр. из PDF/DJVU?)/удалить файлы-> обнулить установки на дефолтные->применить файл настроек *.ini ->черновой проход->оценка, -> правка настроек**->применение зон-> Процесс! ->
3. ->постобработка: чистка, восстановление контуров, цвета, глифы,
4. ->экспорт pdf, djvu, изображения и т.д.
**
>список решаемых задач, функциональное описание действия фильтров и возможных комбинаций для конкретных решений,
>последовательность пробы фильтров общая или для разных случаев,
>Последовательность применения фильтров (В общих чертах - описания доступны, но хочется подтверждения).

Где искать максимально полный перечень настроек sk.ini ?
Есть ли возможность выбора файла настроек изнутри СК или надо вручную заменять этот файл в папке?

Если есть дополнения к запуску с кэшем на рам-диске - хотелось бы список параметров для *.bat файла, в т.ч., если есть возможность - последовательного запуска обработки нескольких пакетов: типа когда компьютер не занят - пусть шуршит подготовленные задания.
Напр.: {запустить СК для обработки сценария А}, {....сценария Б}, {потом....}.....
Это фантазии - не знаю есть ли такая возможность.

Ещё вопросы:
использует ли СК openGL, openCL ? какие версии?

Если получится, постараюсь учесть любые подсказки, вопросы.

Всего доброго.



Автор: daa2013, Отправлено:07:25 25-01-2023

Заказал на авито совершенно гениальную (ИМХО) брошюрку "картотека шрифтов":

https://cloud.mail.ru/public/B5Sn/HHStRTDdN

И стал думать, если её, когда приедет, на 1200 или даже 2400 дпи посканить, то можно ли будет к СК прицепить.
Пока додумался до такого - хранить такие глифы в цвете.
А для закладки с набором глифов сделать команды: масштабировать (все глифы) и бинаризовать (все глифы). Это чтобы не делать несколько комплектов высотой 7,8,9,10,11 и т.д. пикселей.

Можно и какой-нибудь другой каталог шрифтов отсканировать, где буквы покрупнее ...

Автор: daa2013, Отправлено:20:16 25-01-2023

Еще будет нужна команда клонирования закладки с глифами. Чтобы с мастер-закладки создать копию, и уже её трансформировать и подгонять.

Возможно, также не помешает опционально показываемая первая закладка с оглавлением = гиперссылками на другие закладки. (Имя закладки и некий комментарий, что там). То бишь, список пар Sheet caption (с переходной ссылкой) + Sheet hint

Автор: bolega, Отправлено:08:09 27-01-2023

daa2013

Цитата:
Еще будет нужна команда клонирования закладки с глифами.

Ну, можно и copy/paste выделенных глифов обойтись. Причем используется не внутренний карман СК, а буфер обмена windows, чтобы переносить между разными копиями СК (версии могут отличаться).


Цитата:
также не помешает опционально показываемая первая закладка с оглавлением = гиперссылками на другие закладки.

идея хорошая. Можно еще некий внешний индекс подключать, для загрузки например, других доступных внешних библиотек глифов.

P.S. Новая версия СК будет поддерживать сложные глифы, т.е. состоящие из нескольких диакритических символов, отображаемых как одна буква

Автор: daa2013, Отправлено:09:56 27-01-2023


Цитата:
Ну, можно и copy/paste выделенных глифов обойтись.


Можно. Но у меня в голове сейчас сидит образ картотеки на пару десятков начертаний шрифтов 1930-х годов, которая импортируется. И если через копи-пасте, то там действия:
- копи
- создать
- перейти
- поименовать
- пасте

Потом понял, что шрифт не тот, и всё по новой .... Если закладок с образцами много, еще черта с два найдешь.
Хочется упростить. Да, получается, важный момент упустил - автоименование клон чего был сделан.

(Может затея с картотекой и дурацкая, но хочется попробовать.)

Автор: mvk2006, Отправлено:12:22 27-01-2023

озвученные идеи с глифами, их масштабированием и т.п. интересные, прямо витают и просятся к реализации...
Но мне хотелось бы добавить пару желаний поскромнее:
• При выборе глифа, если окошко details отображается, нельзя ли фокус ввода автоматически переводить на поле ввода Char (особенно если оно пустое)
• При выборе группы глифов хотелось бы иметь возможность так же группой их блокировать/разблокировать

Автор: bolega, Отправлено:14:42 27-01-2023


Цитата:
При выборе глифа, если окошко details отображается, нельзя ли фокус ввода автоматически переводить на поле ввода Char

плохая идея, напрочь лишает пользователя возможности например скролить список стрелками на клаве.

Цитата:
При выборе группы глифов хотелось бы иметь возможность так же группой их блокировать/разблокировать

это можно

Автор: mvk2006, Отправлено:16:01 27-01-2023


Цитата:
плохая идея, напрочь лишает пользователя возможности например скролить список стрелками на клаве.


Идея была в чем: наполняю list глифами, потом обхожу глифы для заполнения символами. Приходится щелкать глиф-char, ввод символа, снова глиф-char... из-за того что они далеки друг от друга не очень удобно.
Сейчас попробовал можно табуляцией переключаться на char - это лучше, но все равно нелогичное поведение, табуляцией к глифу вернуться уже нельзя.
За скролл стрелками я не подумал, т.к сам их не использую.
Может есть более оптимальный алгоритм работы?


Автор: daa2013, Отправлено:03:50 03-02-2023

Пытаюсь представить себе работу с картотекой шрифтов. Возникли следующие соображения:

1) после бинаризации цветных букв потребуется их автообрезка до 1 пикселя ширины. Или автоматически, или командой для всех. У цветных-то оригиналов поля явно шире 1 пикселя должны быть.

2) У некоторых сканеров разрешение по горизонтали/вертикали не совпадает. Перевернул книгу на 90 град - ширины зоны контента изменилась на букву. В масштабах одной буквы это незаметно, но, возможно, окажется полезным и различное масштабирование по вертикали/горизонтали. Т.е. вместо штатного (увеличить на 10%) иметь возможность опционально задавать на 9% туда и на 11% сюда).

3) вычитал в "Производстве шрифтов" Спирова про ростиск краски. Это ИМХО означает, что новый фильтр "утоньшение" к глифам тоже может быть полезно прикрутить:



Автор: asku, Отправлено:20:44 03-02-2023

Добрый вечер. Скопировал зону на все последущие страницы до конца книги: Меню Zones — Paste zone to pages...
Вопрос. Можно ли эту операцию «откатить» назад?
И можно ли расставленные таким образом зоны чуть сдвинуть на всех страницах?

Автор: shch_vg, Отправлено:23:49 03-02-2023

asku

Цитата:
Можно ли эту операцию «откатить» назад?

Насчет "откатить" не знаю, а удалить запросто: Zones->Bulk operations...
Цитата:
можно ли расставленные таким образом зоны чуть сдвинуть на всех страницах?

Только ручками либо по хакерски.
Можно чуть длинее: удалить все кроме от которой копировали, чуть сдвинуть, а потом снова скопировать на все последующие.
Пострадает только нумерация зон в результате увеличения порядкового номера.

Автор: bolega, Отправлено:01:50 04-02-2023


Цитата:
И можно ли расставленные таким образом зоны чуть сдвинуть на всех страницах?

Zones->Bulk operations > Move. Выбрать тип зоны, интервал, группу и т.п.
New position: absolute=off, задать относительный сдвиг

Автор: Simonthe, Отправлено:01:54 04-02-2023

Добрый день!
Смотрел кто-то поделки по мануалу?

Автор: shch_vg, Отправлено:02:48 04-02-2023

bolega

Цитата:
Zones->Bulk operations > Move

Так глубоко я не копал

Автор: jourmager, Отправлено:11:34 04-02-2023

Simonthe

Цитата:
Смотрел кто-то поделки по мануалу?

Я смотрел. А что интересует?
И какие поделки? Тут сдохли ссылки на files_fm. Я пробежался по этой версии.

Автор: asku, Отправлено:01:48 05-02-2023


Цитата:
Zones->Bulk operations > Move. Выбрать тип зоны, интервал, группу и т.п.
New position: absolute=off, задать относительный сдвиг


bolega

А как сдвигать вправо? Что-то не совсем понял.



Добавлено:
И шаг сдвига большой. Влево сдвигал с шагом 1, получилось слишком много.

Автор: bolega, Отправлено:08:06 05-02-2023


Цитата:
Что-то не совсем понял.

И что можно понять из вашего скриншота? Нулевой сдвиг exclude зон?

Автор: asku, Отправлено:08:25 05-02-2023

bolega
Чтобы сдвинуть влево нужно поставить галочку «Влево». А вправо?
Сдвигать я хотел зону, отмеченную стрелкой на каждом развороте, чуть вправо. Они принадлежат одной группе.

Автор: bolega, Отправлено:08:44 05-02-2023


Цитата:
Чтобы сдвинуть влево нужно поставить галочку «Влево».

Не, не так.
Left/Top означает верхний левый угол зоны. сдвиг с "+" смещает его вправо, с "-" - влево. Это если убрана галка на absolute (вы же не забыли ее убрать?)
Если галка стоит, то зона устанавливается в точку [Left,Top]



Автор: asku, Отправлено:10:54 05-02-2023

bolega, все получилось. Спасибо!

Добавлено:
Еще хотел спросить.
Не могу в горячих клавишах найти пункт Скрыть/показать зону.
Раньше вроде он там был, когда-то у меня было назначена клавиша, и было удобно пользоваться.
Сейчас не могу найти.




Автор: shch_vg, Отправлено:12:18 05-02-2023

asku

Цитата:
Не могу в горячих клавишах найти пункт Скрыть/показать зону

Alt+Z

Автор: asku, Отправлено:13:10 05-02-2023


Цитата:
Alt+Z


Не работает.

bolega
А можно ли скрывать зоны, принадлежащие определенной группе?

Автор: TelecomUral, Отправлено:16:23 05-02-2023


Цитата:
asku
Не работает.

Toggle zone visibility хоткей. Его же настроить надобно, если по умолчанию не работает.

Автор: shch_vg, Отправлено:18:37 05-02-2023

Интересно, а кто мне настраивал его? Я просто поместил 6.8 в новую папку и уже давно работаю с ней, а в Toggle zone visibility стоит Alt+Z.
Какой барабашка его туда засунул?

P.S. А ведь действительно в голом 6.8 не задан этот хоткей. Значит, проник из предыдущих версий

Автор: daa2013, Отправлено:20:05 05-02-2023

Начал сканировать разные старые каталоги шрифтов и возникли следующие соображения:

1. В одном каталоге одна страница была испорчена в типографии (замятие еще до печати), в другом - алфавит дан не полностью. Т.е. хотя цель - это собрать напечатанные в одинаковых условиях буквы (а не пришедшие с разных страниц, где качество гуляло), всё равно могут возникать ситуации включения букв разного происхождения. Это я к чему. Возможно окажется полезным не только фильтр утоньшения, но и утолщения, причем применяемые не только ко всем глифам листа, но также и индивидуально. (Особо оговорюсь и повторюсь, я пишу тут "возможно".)

2. С масштабированием цветных глифов. Хорошо бы иметь возможность делать его колесиком мышки. Ctrl+колесико. И еще в режиме прозрачности. И так чтобы результат после бинаризации+вклейки где-то запоминался и демонстрировался. Чтобы подобрав на одной букве "Н", например, его можно было к остальным применить. Какое-нибудь окошко с индикацией (условных) +11% .
Вообще ALt + колесико, Shift + колесико , как мне кажется, можно шире задействовать. Я несколько лет назад писал об автоматическом изменении уровня бинаризации колесиком. Ну, допустим, ко всей странице это применить, действительно, будет медленно и не пойдет. Но к крошечному глифу, мне кажется, можно сделать подбор порога бинаризации колёсиком с автоматической демонстрацией конечного результата.

3. Описание шрифтов получается длинным шрифт+начертание+ кегель+язык+источник оттиска+особенности (тип набора, например)+(возможно сканировщик / собиратель закладки). В хинт такое не засунуть, а если засунуть, то не увидеть. Хорошо бы для закладок предусмотреть либо какое-то развернутое текстовое описание (простыню), либо 6-7 разных строчек (полей). Возможно, демонстрируемые опционально. Главное, чтобы они корректно импортировались. Не могу сказать за последнюю версию, не проверял, но сколько-то версий назад я наблюдал, что СК при импорте терял названия закладок. Вместо "Строчные" становилось +List1. Что-то такое. Счел это тогда фичей.

Автор: asku, Отправлено:11:48 06-02-2023

TelecomUral

Цитата:
Toggle zone visibility хоткей. Его же настроить надобно, если по умолчанию не работает


Получилось. Спасибо!
А делать невидимыми зоны одной конкретной группы видимо нельзя?..


Добавлено:
Я вот подумал по поводу OCR в СК. Такая идея для себя.

Можно ведь сканировать книгу как обычно с разрешением 300 Grayscal, НО несколько страниц книги сканировать с разрешением 600. И именно из этих страниц брать символы для библиотеки глифов, как наиболее качественные.

Автор: bolega, Отправлено:08:01 08-02-2023


Цитата:
А делать невидимыми зоны одной конкретной группы видимо нельзя?..

добавил такую возможность

Цитата:
как обычно с разрешением 300 Grayscal

В последние лет пять приходилось обрабатывать только 600dpi сканы. Так что для кого-то 300 - это совсем не "обычно".


Цитата:
Хорошо бы для закладок предусмотреть либо какое-то развернутое текстовое описание

Если устроит описание с поддержкой несложной html-разметки, то могу реализовать

Автор: daa2013, Отправлено:08:54 08-02-2023


Цитата:
Если устроит описание с поддержкой несложной html-разметки, то могу реализовать

Было бы неплохо






Автор: asku, Отправлено:09:27 08-02-2023

bolega
У меня простой сканер, поэтому, если бы с разрешением 600 делал, то каждую книгу бы сканировал неделю)

Автор: xMARx, Отправлено:14:18 08-02-2023

__Всем привет.
bolega Имеется задание с одним файлом. В файле текст и картинка. Обработал текст, но потом решил сделать picture zone с картинкой и обработать с другим порогом бинаризации. B/W зона тоже подошла бы, но не нашел, как обрабатывать ее отдельно (без остального текста). Сделал прямоугольную picture zone, обработал только ее. В окне RV она почему-то съехала немного вниз и наехала на текст.
__Ссылку на задание прикрепляю. Можно самому проделать все действия: 1) убрать зону (exclude zone), 2) обработать, 3) потом вернуть picture zone (разрешение х2, b/w) и увидеть съехавшую вниз зону.
https://transfiles.ru/je1e3

__Upd: Если границы зоны оттащить подальше от резаков, то зона съезжает, но слабее.

__2) Всё-таки не все хорошо с зумом. Отдаляю изображение в окне RV, соответствующее отображаемое значение зума уменьшается. Потом начинаю колёсиком приближать значение в начале уменьшается ?!, а потом уже увеличивается.

__3) В окне Image adjustments на вкладке Selection если поднести мышку к кнопке Emulate shift press mode
появится всплывающая подсказка "Режим отображения двух страниц....". Вроде неверная подсказка.

__Пожелание
__4) Может имеет смысл сделать так, что бы при выделении области (move selected area) в окне RV, стрелки на клавиатуре отвечали за соответствующий сдвиг данной области на 1 пиксель в разные стороны. Величина сдвига может задаваться в настройках. Сейчас при выделении области и нажатии стрелок вверх и вниз, СК переходит на другую страницу.

Автор: TelecomUral, Отправлено:14:58 08-02-2023


Цитата:
она почему-то съехала немного вниз и наехала на текст

потому что вы специально обошли работу по вычислению координат новой зоны.

Автор: bolega, Отправлено:16:12 08-02-2023

xMARx
Скажите, какие у вас сейчас значения настроек в Files > Options >Zones > Processing:
- Restore zone position
- crop b/w picture zones
вкл/выкл ?
Проблема такая действительно существует, тогда, когда вновь созданная зона своим положением влияет на расчетный габарит страницы. Другими словами, начало координат габарита страницы после ее создания и переобработки отличается от начала координат, которое было вычислено в предыдущем расчете, когда зоны не было. Если создать новую зону где-нибудь полностью внутри габарита страницы, то такой проблемы вообще не возникнет.
Чтобы минимизировать отклонение вновь созданной зоны после ее переобработки, старайтесь создавать ее максимально внутри прошлых габаритов, и включайте вышеупомянутую опцию crop b/w picture zones.
В рамках текущей версии СК проблему сдвига координат из-за изменении габаритов страницы в промежутке между двумя обработками к сожалению не решить. Я уже думал над этим. В todo у меня стоит разобраться с этим, путем расчета и хранения в задании матриц афинных преобразований, которыми подвергается страница в процессе обработки.


Цитата:
Всё-таки не все хорошо с зумом.

Об этом уже писалось. Я исправил в новой версии.


Цитата:
__4) Может имеет смысл сделать так, что бы при выделении области (move selected area) в окне RV, стрелки на клавиатуре отвечали

Используйте для смещения участка не стрелки, а Ctrl+стрелки.

Поведение клавиш можно настроить в опциях окна VR




Автор: xMARx, Отправлено:17:13 08-02-2023


Цитата:
Скажите, какие у вас сейчас значения настроек в Files > Options >Zones > Processing:
- Restore zone position
- crop b/w picture zones
вкл/выкл ?

__Обе настройки были выключены.


Цитата:
Чтобы минимизировать отклонение вновь созданной зоны после ее переобработки, старайтесь создавать ее максимально внутри прошлых габаритов, и включайте вышеупомянутую опцию crop b/w picture zones.

__Спасибо за совет. Включил эти настройки. В crop b/w picture zones установил gap=0. B/W picture zone внутри резаков. Зона практически не отклонилась.


Цитата:
Об этом уже писалось. Я исправил в новой версии.

__Прошу прощения. Несколько запутался в версиях. Оказывается пользовался 6.8, т.е. не самой свежей.

Автор: xMARx, Отправлено:16:35 14-02-2023

bolega А почему, когда я вставляю в окне RV скопированную область при помощи ctrl+v, она вставляется сразу. А если нажать ПКМ и выбрать paste ctrl+V, то у меня будет возможность это выделение подвигать. Последний вариант мне и был нужен; не сразу понял, как мне иногда удается двигать выделение. Можно ли сделать так, чтобы и при нажатии ctrl+v была возможность двигать выделение?
__Я не нашел шорткатов для движения слева направо и справа налево по тексту в окне RV. Они есть? Было бы удобно с помощью клавиатуры двигаться по тексту, а мышкой менять исправлять неудачные буквы.
__В окне Rotate selection кнопку paste, мне кажется, имеет смысл переименовать в rotate или apply.

Автор: bolega, Отправлено:08:28 15-02-2023

xMARx

Цитата:
почему, когда я вставляю в окне RV скопированную область при помощи ctrl+v, она вставляется сразу. А если нажать ПКМ и выбрать paste ctrl+V, то у меня будет возможность это выделение подвигать.

В options окна RV отключите опцию Editor > Merge immediately.
При этом по идее и через paste должна была вставляться сразу же при включенной опции, почему я не сделал так, я не помню.


Цитата:
для движения слева направо и справа налево по тексту в окне RV

не понял, что такое движение по тексту клавиатурой.
В СК подсветка OCR возможна только по положению указателя мышки. Другого пока не предусмотрено, т.к. это не текстовый, а графический редактор.

Автор: xMARx, Отправлено:11:03 15-02-2023


Цитата:
не понял, что такое движение по тексту клавиатурой.  

__Сейчас это делается с помощью полос прокрутки снизу и справа окна RV. В автокаде это называется панорамированием. Не нашел шорткатов для панорамирования слева направо и справа налево по тексту в окне RV.


Цитата:
В options окна RV отключите опцию Editor > Merge immediately.


__Спасибо.


Автор: bolega, Отправлено:13:24 15-02-2023


Цитата:
Сейчас это делается с помощью полос прокрутки снизу и справа окна RV

options RV >Actions > Special keys used for = image scroll
не оно?

Автор: xMARx, Отправлено:13:56 15-02-2023


Цитата:
options RV >Actions > Special keys used for = image scroll
не оно?

__Да оно, спасибо. До этого искал в главном окне в options-hotkeys. Единственное хотелось бы иметь возможность настроить скорость движения. Я приближаю текст, двигаюсь по нему, читаю и меняю неудачные буквы. При этом текст движется медленно.

Автор: bolega, Отправлено:11:59 16-02-2023


Цитата:
Единственное хотелось бы иметь возможность настроить скорость движения.

Да, мелковатый сейчас шаг. Увеличил и сделал настраиваемым

Автор: asku, Отправлено:12:29 19-02-2023

Добрый день. Прошу подсказать.
Что нужно сделать, чтобы красным подсвечивался мусор и неподсвечивались буквы.



На скрине подсвечены и буквы.
Включаю режим Marashki mode либо режим Outside letters mode (либо оба сразу) и красная подсветка отключается вообще.

Ссылка на тест

Автор: shch_vg, Отправлено:13:11 19-02-2023

Следил краем глаза за проблемой борьбы с "марашками", но сейчас этот вопрос встал всерьез.
Может ли кто-нибудь просветить меня по этому вопросу, как это обстоит на текущий момент.
Первый главный вопрос: возможно ли эту процедуру оуществлять в текущей (6.8) версии СК?
Если да, то есть ли где описание этого процесса, или в нем надо разбираться самому по разрозненным описаниям в теме и в "что нового в ..."?

Автор: TelecomUral, Отправлено:13:37 19-02-2023

видео от bolega есть. по таймлайнам найдете кусок про марашки.

Автор: asku, Отправлено:14:25 19-02-2023

TelecomUral
Да, есть видео, четвертая часть. Честно говоря, смотрел, но ничего не понял в этом моменте

Автор: xMARx, Отправлено:14:45 19-02-2023


Цитата:
Включаю режим Marashki mode либо режим Outside letters mode (либо оба сразу) и красная подсветка отключается вообще.

__Подсветка не выключается. Просто подходящего мусора мало, а его подсветка имеет маленький размер. На второй строке снизу кое-что у вас все-таки выделено. В этом плане, мне кажется, имеет смысл сделать так, чтобы посветка маленьких спеклов в программе была лучше видна. Например, чтобы ее размер зависел от зума : при отдалении размер большой, а при приближении - уменьшается.
__Если включить опцию "Исключать подсветку спеклов в областях, занимаемых символами из защищенного набора" (Marashki mode, Outside letters mode я выключил), то выделяется уже больше мусора, но не весь. Пусть мусор находиться в области, которую занимает буква (синие рамки в Edit OCRed word), а данная буква исключена из подсветки (то есть находится в Non-highlighted chars). Тогда такой мусор в этом режиме, наоборот виден не будет ?! Например, в слове "дзыхы" близко к центру страницы, перестает быть виден мусор под буквой "х". Также мусор может возникнуть при замене символа (например, если в данном слове заменить букву "х"), и он тоже не будет виден при включении этой опции.
UPD: вспомнил, что мусор, о котором упомянул в конце, можно убрать выбрав опцию Remove speckles, that touch the pasted image перед заменой символа.

__Это не столько ответ на ваш вопрос, сколько мысли вслух ... Возможно, кто-нибудь меня поправит или уточнить.

__Также хотел бы обратить внимание, что
1) в окне RV почему-то не получается сделать так, чтобы комбинация ctrl+двойной клик меняла цвет ластика.
2) у меня для движения области используется комбинация клавиш ctrl+M. Если я выделю область (например, с символом) и нажму эту комбинацию два раза (поторопился или по другой причине), то символ нельзя будет стереть ластиком. Если потом сохранить страницу, выйти из окна RV и войти, то символ пропадет. Может имеет смысл как-то исправить этот момент.

Автор: TelecomUral, Отправлено:14:55 19-02-2023

asku
может, у shch_vg не возникнет проблем.
А так - с марашками всё довольно примитивно. Сложно пройти путь с подключением текстового слоя. В шапке есть подробности.

Автор: daa2013, Отправлено:08:17 20-02-2023

Для некоторых книг, особенно если нет OCR, оказывается, бывает нужна постоянно повышенная точная позиционирования глифа (уменьшенная зона поиска). Приходится постоянно зажимать контрол, а еще иногда это мешает тасканию глифов.
Нельзя ли на закладке преференсов сделать чекбокс, который как бы напостоянно её включает.
Т. е. вставка всегда как бы с зажатым контролом шла.

Автор: asku, Отправлено:12:41 20-02-2023

TelecomUral
Пересмотрел видео, где говорится о марашках
Видео от bolega, часть 4 (откроется там, где про марашки)

Там при включении режима Marashki mode, красная подсветка не исчезает (она исчезает только там, где затрагиваются сами символы). В моем же тест файле (он чуть выше) исчезает вся подсветка.

Автор: TelecomUral, Отправлено:13:29 20-02-2023

asku
внимательно изучил ваши выходные тиффы из задания. Ни единой марашки не увидел. Ткните носом, что должно остаться по вашему мнению красненьким при включении режима M.

Напоминаю, что "марашка" - типографский термин, обозначающий лишнюю грязь между буквами, обычно из-за касания основанием литеры бумаги. Или, допустим, краска слишком липучая и осталась висеть мостиком между литерами на ребрах матрицы. Как правило, это выгляит на бумаге как прогонистая вертикальная кляксочка. Палочка. Сильно сбивает глаз при чтении, так как сопоставима по размеру с вертикальными элементами букв и такая же жирная.
В СК марашки делятся по методу убирания на касающиеся буквы и не касающиеся её.

У вас с виду не марашки, а корявые глифы. С лишними элементами-зазубринками. По классу анализа, мне кажется, это никак не марашки.

Автор: asku, Отправлено:13:42 20-02-2023

TelecomUral
Вот это получается не марашки?


При включении режима Marashki mode картина такая:



Автор: TelecomUral, Отправлено:13:52 20-02-2023

asku
мне кажется что нет, не марашки. Они длинненькие должны быть. А это обычный мусор.
Но вы учтите, я с этими фичами СК ещё плотно не разбирался, опыта не нажил. Могу и ошибаться, пусть лучше bolega ответит вам.

Автор: mvk2006, Отправлено:14:17 20-02-2023


Цитата:
Вот это получается не марашки?

получается.


Цитата:
"марашка" - типографский термин, обозначающий лишнюю грязь между буквами, обычно из-за касания основанием литеры бумаги


Цитата:
6.75 05.2022
- VR: добавлен режим подсветки типографских палочек (марашек).




По идее для "не-марашек", обычных спеклов нужно использовать режим "Outside letters mode"

Цитата:
- VR: добавлен режим подсветки спеклов, расположенных за пределами областей, занимаемых буквами текста. Режим работает если для изображения имеется ocr-информация. Для включения режима используется команда Outside letters mode в контекстном меню кнопки включения подсветки. Режимы Marashki mode и Outside letters mode могут использоваться одновременно.

Автор: asku, Отправлено:14:31 20-02-2023


Цитата:
По идее для "не-марашек", обычных спеклов нужно использовать режим "Outside letters mode"

Да, по идее вроде так. Но при включении этого режима, результат тот же — все эти (см. скрин) «не-марашки» перестают подсвечиваться. OCR работает нормально.
Может быть есть какая-то галочка, которую надо включить (или выключить).



Автор: mvk2006, Отправлено:14:37 20-02-2023


Цитата:
результат тот же

да, какие-то тонкости тут есть, работа режима иная, чем в общепользовательском понимании..(всё, что выходит за границы букв) Поскольку речь идет о спеклах, я пробовал варьировать размером Speckle size... Иногда что-то получалось...
Да, я обратил внимание, что после работы с текстовым слоем (см. замечание bolega об обнаруженном баге), режимы подсветки также бывает работают некорректно

Автор: bolega, Отправлено:15:58 20-02-2023


Цитата:
«не-марашки» перестают подсвечиваться.

в вашем примере вроде все понятно. марашек нет, но практически все спеклы входят в габарит букв (так выдал FR очевидно). А раз они в букве, то Outside letters mode не сработает. И в добавок вы еще практически все буквы со спеклами внесли в исключения подсветки. После все этого естественно никакая подсветка не сработает. Тут сложный случай, боюсь надо вручную чистить. Либо сначала подправить ocr, выполнить замену букв, потом сделать ocr по-новой, тогда может FR более корректно определит габарит букв.

Автор: asku, Отправлено:16:06 20-02-2023


Цитата:
И в добавок вы еще практически все буквы со спеклами внесли в исключения подсветки.

Убрал. (Сделал все по «дефолту»).

А ПКМ—Options—Вкладка Despeckle ничего не изменит значит?
В пункте Speckle size (fine) делаю огромное значение (напр. 70) и ничего не меняется.

Автор: TelecomUral, Отправлено:21:34 20-02-2023


Цитата:
(так выдал FR очевидно)

любопытная вещь: я решил перераспознать странички этого задания тессерактом (хотел перепроверить как он буковки выделит). И не получил желаемого результата - страница опозналась как состоящая из русских букв. Вместо буквы "ае" - две раздельные "а" и "е". Язык страницы - oss. Я ничего не правил в задании, только в Options переключил на Tesseract и в MW вызвал Result\OCR output files\Current.

UPD
решил поглядеть что с модулями, а oss у меня нет

Автор: asku, Отправлено:21:43 20-02-2023

TelecomUral
Осетинский навряд ли есть среди языков тессеракта. Если бы я знал как языки туда добавлять, то сделал бы )

Автор: bolega, Отправлено:07:47 21-02-2023

TelecomUral
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2700#14

Автор: TelecomUral, Отправлено:08:14 21-02-2023

bolega
не уловил, куда вы меня послали.

Я говорю, что модуля тессерактовского на осетинский язык не существует. А Кромсатор это проглотил.

Добавлено:
asku

Цитата:
Если бы я знал как языки туда добавлять

поскольку проект открытый, то должна быть внятная инструкция для изготовителей модулей. Скорее всего нейросетка предложит вам запихивать в нее сканы и отсматривать результат. Предварительно подать алфавит. Но есть ещё и всякие хитрые штучки с грамматикой.

Автор: bolega, Отправлено:09:37 21-02-2023

TelecomUral
По итогам того обсуждения договорились, что СК вместо осетинского будет вызывать тессеракт с русским языком. Ведь отличие между ними вроде бы только в одной букве-лигатуре.

Автор: kamenkapenza, Отправлено:15:02 25-02-2023

Вот жду и никак не дождусь, когда появится видео про Tesseract, эту таинственную программу. Если набрать "Tesseract" в поиск браузера, то вместо искомой программы появляются какие то трубадуры.

Автор: KPGA, Отправлено:15:24 25-02-2023


Цитата:
Вот жду и никак не дождусь, когда появится видео про Tesseract, эту таинственную программу. Если набрать "Tesseract" в поиск браузера, то вместо искомой программы появляются какие то трубадуры.

А, именно обязательно видео?
Tesseract на Хабр в поисковом запросе

P.S. Х.З. какая нейронка у этой программы, но есть и другие проекты OCR на Github

Автор: los, Отправлено:16:16 25-02-2023

asku, TelecomUral
_https://tesseract-ocr.github.io/tessdoc/tess4/TrainingTesseract-4.00.html
_https://tesseract-ocr.github.io/tessdoc/tess5/TrainingTesseract-5.html


Автор: MrLAG, Отправлено:03:15 27-02-2023


Цитата:
Было много жалоб, что забывали вовремя включить эту опцию. Последствия неприятные: часто требовалась полная переобработка. В этом смысле постоянно включенный режим намного безопасен, минус у него - один раз вызвать команду финализации, т.е. потратить одну секунду. Против возможно многих часов исправлений.


Уважаемый bolega, не подумайте, что я привередничаю. Я, конечно, не предлагаю переделывать программу специально для меня. И вообще я много использую SK и программа мне очень нравится. Очень Вам за неё благодарен!

Но, может это можно как-то исправить один раз включаемой галочкой где-то поглубже в опциях, или в самом ini файле? Я имею в виду, что если человек не использует автоматическую финализацию, т.е. его полностью устраивает текущий вариант заложенный в программу, то он поставит такую галочку и забудет о ней (тем более в ini лазить не будет). С другой стороны, я наоборот использую финализацию всегда. Вероятно я не один такой. Когда прогоняешь пару десятков книг за вечер, лазить в меню за этой опцией надоест быстро. Есть еще такой момент: когда разрешение высокое, обрабокта идёт долго. Оставляешь комп работать и занимаешься чем-то другим. Чем обльше промежуточных действий надо выполнить вручную, тем чаще надо подходить к компу. Впрочем, для моих задач подходит и версия 5.96 в которой финализацию можно было включать/отключать, так что это не то что бы трагедия. Но с другой стороны, хотелось бы и новой программой попользоваться, изучить новые возможности заодно. Ладно, это всё лирика.

У меня вот возник более насущный вопрос. Возможно это исправлено в более поздних версиях. Как я уже написал, моя версия 5.96. При кодировании djvu есть возможность задать отдельно качество для черно-белых зон (step2 BW, B/W zones options). И в ряде случаев, если есть мелкий пунктир, например, это реально нужно - поставить опцию losless для сжатия. Проблема в том, что выбор этой опции для ч/б зон вообще ничего не меняет. Вот если поставтить losless для сжатия ч/б страниц (step2 BW, DEE options), тогда сжимается без потерь. Но т.к. это применяется ко всем страницам, то раздувается весь djvu. Сжимать страницы по отдельности слишком утомительно. А если зоны сделать серыми, то, естественно, размер сильно увеличится. Есть какие-то варианты как правильно обработать ч/б зоны с мелким пунктиром? Или может в последней версии это всё работает корректно? Просто мелкие точки при любом варианте сжатия, кроме losless попадают (и рисунок превращается в ерунду).


Добавлено:
Во, кстати, пришло в голову. Можно сделать, чтобы при включённой автоматической финализации программа выдавала предупреждающее окошко (и галочку "больше не показывать это предупреждение", для таких как я, которым такое окошко тоже быстро надоест). Тогда вероятность, что кто-то, забыв поставить галочку "do not finalize", запустит обработку будет много меньше. Но, безусловно, радикальный вариант, применённый в последних версиях проще и действенней. А мои неудобства связанные с заходом в меню для запуска финализации это ерунда. И все таки, пожалуйста, подумайте над вариантами.

Автор: bolega, Отправлено:08:17 27-02-2023

MrLAG

Цитата:
Проблема в том, что выбор этой опции для ч/б зон вообще ничего не меняет.

Меняет, просто это работает по другому: у каждой зоны на закладке djvu есть опция Separate b/w-coding, вот если ее включить, то эта зона начнет кодироваться своим отдельным методом, который задан в "BW zones options" визарда djvu. Т.е. задание метода еще не достаточно, нужно еще указать, какие зоны будут его использовать, а это, похоже, вы не учли.
Кстати, сам я много лет пользуюсь этой возможностью, и там все работает как надо.


Цитата:
при включённой автоматической финализации

что-то вы не договариваете , не верю, что один лишний вызов меню представляет неудобство. Ощущение, что это нужно не вам, а кому-то совсем уж ленивому. "Откройте мне правое веко...".

daa2013

Цитата:
Для некоторых книг, особенно если нет OCR, оказывается, бывает нужна постоянно повышенная точная позиционирования глифа

Тоже не верится, мне такие не встречались, где прям постоянно такие проблемы бы были. Как говорится, нет примера - нет фичи.

Автор: xMARx, Отправлено:21:33 28-02-2023


Цитата:
Если создать новую зону где-нибудь полностью внутри габарита страницы, то такой проблемы вообще не возникнет.

__1) Вроде правая зона находится внутри габарита страницы. Соответствующие галочки в оциях поставил
(restore zone position, crop b/w picture zones) поставил, но правая зона в приложенном задании все равно прыгает сильнее, чем хотелось бы.
ссылка на задание
__В задании, как и в прошлый раз, в начале обрабатываем страницу без зоны (выбираем exclude zone), а потом обрабатываем только правую зону.

__2) В окне RV при использовании прямоугольного выделения, если нажать на точку вне выделенной области, то текущее выделение отменится, а новое выделение не начнется. Если же использовать полигональное выделение, то нажатие на точку вне выделения не только отменяет текущее, но и начинает новое. Может для единообразия имеет смысл сделать так, чтобы во втором случае при нажатии вне выделенной области, выделение отменялось и только при втором нажатии начиналось новое выделение?

__Также, на всякий пожарный, повторю замечания из своего прошлого сообщения (19-02-2023 |), т.к. не уверен, что вы их увидели
__3) в окне RV почему-то не получается сделать так, чтобы комбинация ctrl+двойной клик меняла цвет ластика.

__4) у меня для движения области используется комбинация клавиш ctrl+M. Если я выделю область (например, с символом) и нажму эту комбинацию два раза (поторопился или по другой причине), то символ нельзя будет стереть ластиком. Если потом сохранить страницу, выйти из окна RV и войти, то символ пропадет. Может имеет смысл как-то исправить этот момент.

Автор: TelecomUral, Отправлено:02:58 01-03-2023


Цитата:
xMARx
нажатие на точку вне выделения не только отменяет текущее, но и начинает новое. Может для единообразия имеет смысл

при чём здесь единообразие, кому оно нужно на практике? Сейчас правильно сделано для полигонов, удобно выделять.

Автор: bolega, Отправлено:08:04 01-03-2023

TelecomUral

Цитата:
Сейчас правильно сделано для полигонов, удобно выделять.

Имелось наверно в виду, что при таком поведении невозможно просто снять текущее выделение, находясь в режиме polygonal. Приходится либо отключать polygonal, либо делать двойной щелчок, чтобы тем самым задать пустое выделение, что кстати является аналогом ординарного щелчка при прямоуг. режиме. Так что на самом деле тут единообразие и есть, другое дело, что для снятия выделения нужно больше действий. Это так, и я не знаю как это обойти. Так, как предлагает xMARx, можно сделать, но тогда, наоборот, пропадет единообразие: для перехода от текущего выделения к новому нужно делать лишний щелчок, зато отменять выделение удобнее. Тут надо смотреть, что делается чаще.

xMARx

Цитата:
__3) в окне RV почему-то не получается сделать так, чтобы комбинация ctrl+двойной клик меняла цвет ластика

Для этого нужно, чтобы был активен режим чистки метелкой (зеленой или красной). Так и задумано. Т.к. в других режимах чистки двойной щелчок используется по другому, он контекстно-зависимый.


Цитата:
__4) у меня для движения области используется комбинация клавиш ctrl+M

Исправлю.
Спасибо

Автор: TelecomUral, Отправлено:09:10 01-03-2023


Цитата:
Имелось наверно в виду, что при таком поведении невозможно просто снять текущее выделение, находясь в режиме polygonal.

Это мне понятно.
Я практически не сталкивался с цепочкой "удалить выделение и снова его начать", это ж полигон. Промазал с точкой - ну сделай новую правильную, или на крайний случай поправь потом узлы. Обычно - и мне даже часто - требуется "удалить ошибочно начатое полигональное выделение и переключиться на прямоугольный режим". Я просто тянусь к кнопке. Морально напрягает, линию тянуть, но работает
А так - двойной щелчок, чтобы снять выделение, это вполне удобно.

Автор: xMARx, Отправлено:11:08 01-03-2023


Цитата:
...
Для этого нужно, чтобы был активен режим чистки метелкой (зеленой или красной). Так и задумано. Т.к. в других режимах чистки двойной щелчок используется по другому, он контекстно-зависимый.
...

__Но ведь двойной щелчок и crtl+двойной щелчок - это разные вещи. Или я чего-то не понимаю? Я иногда исправляю картинки: в одном месте что-то удалю, в другом - нарисую, в третьем - снова удалю. Было бы удобно, если бы была возможность быстро менять цвет ластика. Это даже важнее в данном случае, чем менять форму.
bolega, TelecomUral
__Двойной щелчок для отмены полигонального выделения на первый взгляд должен подойти.

__Есть ли в планах ввести в программу автовыравнивание положения букв в слове по средней линии? Чтобы те буквы, которые от нее сильно отходили вверх или вниз, сдвигались в правильное положение.



Автор: TelecomUral, Отправлено:11:52 01-03-2023

xMARx
а как выравнивание букв с выступающими частями делать? Это же целая наука, выровнять шрифт по вертикали. Одни полуокруглости чего стоят, да и кернинг пар тоже "даст прикурить" алгоритмически.

Автор: bolega, Отправлено:11:53 01-03-2023


Цитата:
Я иногда исправляю картинки: в одном месте что-то удалю, в другом - нарисую, в третьем - снова удалю. Было бы удобно, если бы была возможность быстро менять цвет ластика

Тогда скажите конкретно, в каких режимах чистки у вас не меняется цвет при Ctrl-дв.щелчок. Я сейчас проверил, практически во всех режимах (кроме ластика и transparent-mode) цвет меняется при Ctrl-дв.щелчок.


Цитата:
Есть ли в планах ввести в программу автовыравнивание положения букв в слове по средней линии?

К сожалению у меня нет алгоритма определения базовой линии. Фича конечно полезная, но увы.


Автор: xMARx, Отправлено:12:32 01-03-2023


Цитата:
Тогда скажите конкретно, в каких режимах чистки у вас не меняется цвет при Ctrl-дв.щелчок. Я сейчас проверил, практически во всех режимах (кроме ластика и transparent-mode) цвет меняется при Ctrl-дв.щелчок.

__Ну я как раз и говорил про ластик, что исправляю им картинки. Удалил им что-то в одном месте, дорисовал в другом. Иногда исправляю картинки с помощью линии. Допустим, имеется линия, некоторые участки которой отсутствуют или у которой край рваный. Я исправляю это дело черной линией. Если край рваный, то могу, наоборот нарисовать рядом белую линию и край будет лучше смотреться.
__UPD: С линией ситуация лучше: я могу выбрать вместе с ней одну из метелок и ее цвет можно будет менять с помощью ctrl+двойной клик.



Цитата:
а как выравнивание букв с выступающими частями делать? Это же целая наука, выровнять шрифт по вертикали. Одни полуокруглости чего стоят, да и кернинг пар тоже "даст прикурить" алгоритмически.

__Да я просто как пользователь интересуюсь. Алгоритмист в области обработки текста из меня вообще никакой.


Цитата:
К сожалению у меня нет алгоритма определения базовой линии. Фича конечно полезная, но увы.

__Просто хотел уточнить один момент. Представим, что мы заменяем вообще все буквы в слове. Каждой букве соответствует глиф. Для этого глифа СК может определить нижнюю границу, ну или ее может задать пользователь. И тогда СК надо будет заменить буквы в слове так, чтобы нижние границы были на одной линии. Я пропустил какой-то сложный момент?

TelecomUral
bolega
__А вы не выравниваете, получается, буквы по высоте при обработке книг?

Автор: TelecomUral, Отправлено:12:50 01-03-2023

bolega

Цитата:
у меня нет алгоритма определения базовой линии

разве что проанализировать книгу и вычислить б.л. у каждого глифа. В предположении нормальности отклонения положения глифа от теоретического идеала.

Автор: bolega, Отправлено:13:14 01-03-2023


Цитата:
Для этого глифа СК может определить нижнюю границу, ну или ее может задать пользователь.

Строки выравниваются по базовой линии.
Базовая линия описывается в каждом конкретном шрифте.
В предыдущем предложении первые четыре слова лежат нижним краем на базовой линии. В следующих словах низ букв д,р,ф лежит ниже базовой линии. Вот выравнивание таких букв и составляет
Цитата:
какой-то сложный момент?

В некоторых шрифтах даже для обычных, а также заглавных букв, нижний край может лежать ниже БЛ, из-за всяких замысловатых серифов. Именно из-за того, что низ буквы "гуляет", и используется понятие воображаемой базовой линии, на которой как на жердочке сидят буквы, кое-кто "свесив ножки". Некоторые символы, наоборот, "парят" над линией, например математические знаки, кавычки и другие знаки.


Добавлено:

Цитата:
Ну я как раз и говорил про ластик, что исправляю им картинки.

Так бы сразу и сказали, что нужно в режиме ластика добавить переключение цвета, а не описывать проблему как глобальный косяк.

Автор: shch_vg, Отправлено:13:49 01-03-2023

bolega

Цитата:
Строки выравниваются по базовой линии.  
Базовая линия описывается в каждом конкретном шрифте.

А если попробовать предварительную настройку выравнивания?
Для определенного шрифта выравнить все буквы понизу по этой линии и дать возможность попиксельно поправить в вертикальном направлении. После такой поправки производить будущие выравнивания по этой поправке. При наличии нескольких шрифтов делать это для каждого отдельно.
Запоминать эти поправки для возможности передачи их в последующие задания.

Другой вариант без предварительной настройки.
Делать выравнивание по базовой линии, как это считает программа.
При визуальном обнаружении диспропорции дать возможность выделить плохо выравненное слово и переместить неверно расположенную букву по вертикали с запоминанием сдвига для последующих выравниваний.
Результаты сдвига запоминать для каждого шрифта.
По мере продвижения по тексту информация по выравниванию будет дополняться.

Автор: TelecomUral, Отправлено:17:57 01-03-2023

shch_vg
БЛ - фича шрифта, то есть автора его. А не произвол юзера, как вы предлагаете.
Вполне устоявшееся понятие.



Другой вопрос, что для ручных шрифтов докомпьютерной эры вряд ли возможно найти эталонное описание этой линии. Тогда никто не заморачивался этим, ИМХО. Поэтому можно попробовать рассчитать. В некоторых книгах руки чешутся подравнять все буквы.

Автор: shch_vg, Отправлено:18:59 01-03-2023

TelecomUral

Цитата:
В некоторых книгах руки чешутся подравнять все буквы.

Дело скорее даже не в этом, а в том, что, например, бывает на сгибах старых газет стертости.
Текст просматривается или можно догадаться, но слова и даже предложения приходится набирать вручную. Вот здесь подставляемые буквы и начинают прыгать по вертикали, нужна какая-то горизонтальная линия, на которую садится очередная буква, с возможностью попиксельно двигать букву по вертикали, да и по горизонтали не помешало бы.

Автор: TelecomUral, Отправлено:19:22 01-03-2023

shch_vg
кто ж вам не дает aux rectangle наложить, он для того и создан. По ПКМ в Special, при наличии выделения.



Автор: bolega, Отправлено:08:02 02-03-2023

shch_vg

Цитата:
А если попробовать предварительную настройку выравнивания?

Единственный надежный метод - использовать глифы, для которых вручную задана БЛ. Алгоритм мне в целом понятен. Осталось найти время все это реализовать.


Цитата:
даже предложения приходится набирать вручную.

Тут подход можно применить похожий.


Добавлено:
daa2013

Цитата:
Для некоторых книг, особенно если нет OCR, оказывается, бывает нужна постоянно повышенная точная позиционирования глифа (уменьшенная зона поиска). Приходится постоянно зажимать контрол, а еще иногда это мешает тасканию глифов. Нельзя ли на закладке преференсов сделать чекбокс, который как бы напостоянно её включает.

Для случая изорванных или сильно поврежденных букв (когда от них остаются только части) я придумал отдельный способ поиска позиционирования глифа, работает с обычной зоной поиска, но медленнее. Только не знаю как его лучше включать/отключать.

Автор: daa2013, Отправлено:08:37 02-03-2023

Мою проблему решил бы чекбокс, включающий контрол.

Автор: shch_vg, Отправлено:00:53 04-03-2023

TelecomUral

Цитата:
кто ж вам не дает aux rectangle наложить, он для того и создан.

Не понял удобства этой фичи.
Она что, задает только горизонтальное направление, а буквы все равно выравнивать по вертикали вручную?
Я же предлагал автоматическое выравнивание по низу буквы, а буквы, у которых есть снизу выход за общий уровень (их немного) устанавливать вручную с запоминанием ее новой позиции.
Наверное, это действительно проще задавать на глифе указанием на нем базового уровня глифа и возможностью вручную попиксельно изменять этот уровень.

Автор: romanef, Отправлено:15:43 04-03-2023


Цитата:
И все таки, пожалуйста, подумайте над вариантами


есть чудесная программа автоматизации mouse robot

Автор: TeXpert, Отправлено:16:56 04-03-2023

Господа мастера!

Прошу обработать одну книгу, плохо сделанную

Заранее благодарен

Автор: xMARx, Отправлено:20:19 04-03-2023

bolega Почему-то не получается удалить мусор в виде одного пикселя около цифры 4 (слева снизу). Приложил две картинки: цифра 4 с мусором размером с пиксель в нескольких местах, цифра 4 после замены глифа. Видно, что мусор удалился во всех местах, кроме одного в нижней части цифры

Рисунки: до удаления мусора и после
Ссылка на задание

__Кстати, если оставить только цифру 4 или несколько цифр 4 на листе, то при распознавании вылетает ошибка. Панель Page_down__text не нужна для этого примера, но удалить ее не получилось, т.к. кнопка Delete sheet не активна.

__В Clear options во вкладке editor для окошка Grid step всплывает не правильная подсказка "Page width in pixels". Про это в сообщении от 03-04-2019 говорил daa2013,



Автор: Benoni, Отправлено:21:23 04-03-2023

TeXpert
https://www.upload.ee/files/14991706/step2.djvu.html
Фрагмент.
Так Пойдет?
P.S. На первых страницах много кривых строк, но я исправить не могу.

Автор: TeXpert, Отправлено:00:44 05-03-2023

Benoni
Спасибо, в принципе, терпимо. А нельзя разрешение повыше задать? Просто, обидно за такую полезную книжку

Автор: Benoni, Отправлено:08:37 05-03-2023

TeXpert Что значит разрешение повыше задать?
Сделано 600 dpi.


Автор: bolega, Отправлено:08:40 05-03-2023

xMARx

Цитата:
Видно, что мусор удалился во всех местах, кроме одного в нижней части цифры

Вижу, что глиф "4" имеет маску прозрачности. При наложении то, что не в маске, не меняется. Наверно, в этом причина. Уберите маску (change glyph > remove transp), и все будет ОК

Автор: TeXpert, Отправлено:09:18 05-03-2023

Benoni
Цитата:
Что значит разрешение повыше задать?
Имел в виду сглаживание глифов
Цитата:
Сделано 600 dpi
Это изначальное разрешение?

Автор: bearjrgm, Отправлено:09:52 05-03-2023

TeXpert
150 dpi color изначально

Автор: Benoni, Отправлено:09:54 05-03-2023

Изначальное разрешение было 150.
Поэтому такие пироги.

Автор: bolega, Отправлено:10:40 05-03-2023


Цитата:
Изначальное разрешение было 150.

В первоисточнике archive.org есть аж два варианта сканов этой книги, оба 300dpi color. Можно сделать вполне приличный djvu. ХЗ, что там за обработка в либгене.
Если кому надо, скачаю сканы из архива.
Совет: если в либгене видите упоминание что pdf-книга взята с архива, держитесь от нее подальше Лучше самому скачать с архива сканы и сделать по человечески.

Автор: TelecomUral, Отправлено:11:24 05-03-2023


Цитата:
Изначальное разрешение было 150

это вряд ли. С виду 300дпи, книга некрупного формата, А5 скорее всего.

Автор: TeXpert, Отправлено:11:48 05-03-2023

Понятно, спасибо, коллеги

Benoni, может быть, тогда, как предлагает bolega, взять исходный архив?
Будет качественная книга

bolega
Цитата:
Если кому надо, скачаю сканы из архива
Был бы признателен

Автор: Benoni, Отправлено:12:20 05-03-2023

А пока из этих исходников, чтобы было с чем сравнивать:
https://www.upload.ee/files/14993343/Hall.djvu.html

Автор: TeXpert, Отправлено:12:30 05-03-2023

Benoni
Спасибо за ваш труд!

Автор: bolega, Отправлено:13:44 05-03-2023

Скачиваю. Там оказывается один вариант - 1е издание, второй вариант - 2е.
А ту, что в либгене, я узнал. Ее заливал в архив лет 10 назад пользователь artmisa, он залил тогда около тысячи книг по математике, физике, астрономии, в свободный доступ. Я их тогда почти все скачал, только не помню, куда их дел. Точно не скажу, но кажется там не менее 300dpi было, хотя могу и ошибаться. К сожалению, года 3-4 назад все, что залил artmisa, было удалено из архива по непонятной причине.

Автор: Benoni, Отправлено:14:37 05-03-2023

bolega, спасибо!
А адресочек можно?
Или не все там могут скачивать?

Автор: TeXpert, Отправлено:15:55 05-03-2023

Benoni
Цитата:
А пока из этих исходников, чтобы было с чем сравнивать:
https://www.upload.ee/files/14993343/Hall.djvu.html
Спасибо, отличная работа! Тем более, книга, на мой взгляд, хорошо написана, причем вполне элементарно для неспециалистов, с уважением к читателю. Странно, что я недавно только наткнулся на эту книгу, причем, по поводу одного определения, отсутствующего в других руководствах

В связи с этим важный вопрос: в Либгене, когда ищешь что-то, часто натыкаешься на кучу ссылок, и пока не скачаешь, не понятно, какого качества скан. Может, оригинал этого тома из Либгена удалить, чтобы избавить пользователей от ненужного выбора (первая часть этой книги там в единственном варианте).

Когда bolega скачает архив, возможно, будет еще более качественный вариант (в сделанной, в принципе, все читаемо, лишь кое-где в индексах и степенях есть размытости)

Автор: Benoni, Отправлено:15:59 05-03-2023

TeXpert
У Вас есть возможность удалять что-то из Либгена?

Автор: bolega, Отправлено:17:04 05-03-2023

Hall оба издания https://workupload.com/file/CtYSFW84U3Y

Автор: Benoni, Отправлено:17:08 05-03-2023

bolega, спасибо.

Автор: TeXpert, Отправлено:17:15 05-03-2023

Benoni
Цитата:
У Вас есть возможность удалять что-то из Либгена?
К сожлению, нет. Думал, здесь есть люди с соответствующими правами

Автор: Benoni, Отправлено:21:43 05-03-2023

Как говорится, совсем другой коленкор:
https://www.upload.ee/files/14994898/Hall2.djvu.html

Автор: TeXpert, Отправлено:23:18 05-03-2023

Benoni, супер, загляденье! И еще --- копеечный размер. Огромное спасибо!

Отдельное спасибо создателю чудо-программы bolega!

Автор: Skvodo, Отправлено:23:32 05-03-2023

Benoni

Цитата:
У Вас есть возможность удалять что-то из Либгена?

На либгене есть возможность удалить файл, залив новый и указав в настройках ссылку на "Worse version", после этого старый удаляетя из результатов поиска. До недавнего времени можно было посмотреть старый файл по ссылке из нового, но сейчас либген стал старые файлы удалять. Поэтому удаление файлов - не очень хорошая идея. Например, недавно смотрел книгу с несколькими вариантами качества: отстойный, относительно качественный скан и издательский векторный. Только в векторном на десяток страниц меньше, потому что вкладки с иллюстрациями не добавлены. Поэтому уж лучше иметь возможность скачать все и сравнить самому.
А самое плохое - это когда на либген заливают криво "обработанный" файл, а называют "Worse version" Grayscale 300 dpi из которого, при желании, можно было бы получить нормальную книгу, такие примеры тоже есть.

Автор: TeXpert, Отправлено:23:38 05-03-2023

Skvodo
Цитата:
Поэтому удаление файлов - не очень хорошая идея
Ваши доводы мне понятны, я сам об этом думал. Мое предложение касается случаев, когда точно известно, какой вариант хуже. Надо удалять, пока не появились клоны (а они появятся!)

Автор: Benoni, Отправлено:08:20 06-03-2023

bolega выложил ещё хорошие Сканы первого издания (1966 года) этого тома.
Предлагаю перейти в Книги Физика Математика ...
http://forum.ru-board.com/topic.cgi?forum=93&topic=3921&start=6880

Автор: TeXpert, Отправлено:10:06 06-03-2023

Benoni
Цитата:
bolega выложил ещё хорошие Сканы первого издания (1966 года) этого тома
Вижу, у Вас второе дыхание открылось)
Надо бы для полноты картины вторую часть так же качественно сделать. Я скачивал, там вроде качество не очень
Цитата:
Предлагаю перейти в Книги Физика Математика ...
Тогда уж в топик по сканированию и обработке сканов?



Добавлено:
bolega
Цитата:
В первоисточнике archive.org есть аж два варианта сканов этой книги, оба 300dpi color. Можно сделать вполне приличный djvu. ХЗ, что там за обработка в либгене.
Если кому надо, скачаю сканы из архива
А может, и сканы второго тома имеются? В Либгене второй том вроде неважного качества

Автор: Benoni, Отправлено:12:35 09-03-2023

Кто скажет, что означают цифры 10,5,100?


Автор: TelecomUral, Отправлено:13:30 09-03-2023

всплывают подсказки вообще-то. Окно, чувствительность, коррекция. Можно догадаться, опираясь на эту пдфку
https://disk.yandex.ru/d/YlH0wZclLXoKDw

Автор: MrLAG, Отправлено:21:34 09-03-2023


Цитата:
у каждой зоны на закладке djvu есть опция Separate b/w-coding


Аааааах. Этот момент я упустил! Спасибо большое, теперь буду знать.

Я тут ещё перодически забываю про возможность очистки "shadow" по краю текста и пытаюсь делать это вручную. Иногда полезно освежить память, а иногда вообще что-то новое узнаёшь. А всего-то лет 10 программой пользуюсь )).


Цитата:
Ощущение, что это нужно не вам, а кому-то совсем уж ленивому (финализация)


В основном я поправляю уже готовые книги. Ну, например, книга без полей, страницы обрезаны в ноль. Я разбираю djvu (или pdf) прогоняю через СК и сжимаю снова. Таких книг за вечер могу штук 20-30 прогнать. Поверьте, лазить в меню надоест быстро. Особенно если делать этого раньше не прходилсь. К тому же СК еще и спрашивает посчитать ли размер книги. И потом, зачем лишние действия, если можно их не делать. Ну и там ведь и другой человек меня поддержал. Но я уже сказал, могу пользоваться и старой версией. Это не та вещь, из-за которой стоит копья ломать.

---

У меня тут новый вопрос родился при просмотре версии 6.75.5 . А почему пропал вариант Mouse UP mode - convert to b/w. Периодически пользовался, бывает полезно. Это вообще исчезло, или куда-то переместилось (или есть более удобная альтернатива)?


У меня есть несколько предложений по программе, сложавшихся в голове довольно давно но руки не доходили написать.

1) Проверка от дурака. Бывает по случайности перезатираю готовую книжку. В моем случае книга всегда называется book.djvu и было бы здорво, если бы программа проверяла наличие созданного ранее djvu файла. При совпадени имён или переименованик или предупреждение. Я уже заметил, что в новой версии можно поставить имя книги, например, по названию папки. Но тут тоже могут возникать подобное проблемы. А потом у меня прописан батник для дальнейших действий с книгой и удобно, если они все book.djvu называются.

2) Отмена действий при редактировании рисунка есть. Был бы наверное полезен и возврат действий, но я сейча сне об этом. При внесении изменений в задачу была бы тоже полезна возможность отмены хотя бы нескольких последних действий. Поясню: иогда при расстановке резаков случайно кликаю на соседнию опцию при выборе вметсо all down попаджаю по all up. Было дело запопрол так 15 минут работы. Можно попытаться загрузить автосохранённую задачу, но потом всё равно проверять. А если бы действие можно было бы отменить, ошибка была бы быстро исправлена.

3) Бывает нужен инструмент карандаш. [edit] Как мне объяснили есть вариант использования полигонального выделения с зажатым control. Карандаш в фотошопе, мне кажется, реализован несколько удобнее, т.к. отображается толщина кисти, например. Но сначала надо попользоваться рисованием линий в СК, чтобы понять, что к чему.

Это так к размышлению, может уже предлагалось...


Автор: xMARx, Отправлено:21:55 09-03-2023


Цитата:
А вот как в СК под наклоном соединить две точки линией не придумал. Бывает нужно подрисовать пропадающие линии.

__Можно использовать полигональное выделение. При этом держать нажатой клавишу ctrl при последнем щелчке ЛКМ.
__Единственное, не всегда понятно, как будут закрашены пиксели. Из-за этого приходится рисовать линию несколько раз, а потом отменять действие. Было , как мне кажется удобно, если бы СК в режиме реального времени показывал, какие пиксели будут закрашены. Это до того, как я выбрал конечную точку. Цвет для отображения может, например, задаваться пользователем.

Автор: MrLAG, Отправлено:02:40 10-03-2023


Цитата:
Можно использовать полигональное выделение. При этом держать нажатой клавишу ctrl при последнем щелчке ЛКМ.


Ах, тогда надобность в карандаше отпадает. С этим разобрался, в т.ч. и как менять толщину линии. Цвет вроде как задается, также как для ластика и инструмента очистки.

И еще доп. вопрос, столкнулся буквально только пару дней назад. Надо сделать inverse dithering. В свойствах зоны можно поставить галочку и указать количество иттераций от 1 до 8. Сколько иттераций рекомендуется?

Кроме того, правильно ли я понимаю, что если есть ч/б картинка после dithering то вернуть цвета серого можно, если выбрать inverse dithering и поставить цвет зоны серый? Что-то такое вроде получается, хотя вид не очень. Может лучше и не выйдет, буд рад полезным советам.

P.S. Вот и пригодилась вставка зон на множественные страницы. Когда-то давно предлагал такую функцию, здорово, что она появилась (я знаю, что появилась какое-то время назад, просто использовал только сейчас).

Автор: medvedik, Отправлено:17:44 10-03-2023

Исторический вопрос.
Уважаемый bolega, когда появилась первая версия программы?


Автор: TeXpert, Отправлено:19:58 10-03-2023

medvedik
Цитата:
Исторический вопрос
Намечаются мемуары?)
А вы посмотрели предыдущие части?

Помнится 2003-й год, только что появился формат djvu... В теме по физ-мат книгам в день по 5 страниц добавлялось, веселое было время. Рылись в кэше сайта, где в онлайн-режиме djvu генерировалось из разных форматов, интересно, есть ли тот сайт нынче?

Автор: medvedik, Отправлено:20:10 10-03-2023

TeXpert

Смотрел. Первая часть уже про версию 5.

Автор: TeXpert, Отправлено:20:37 10-03-2023

medvedik
Припоминаю, прежде чем была создана отдельная тема по ScanKromsator'у, обсуждение шло в теме по физ-мат книгам. Вам надо эти темы в виде отдельных файлов скачать и прошерстить

Автор: medvedik, Отправлено:21:15 10-03-2023

TeXpert

Ну это все косвенные данные. Надеюсь, создатель точно знает.

Автор: bolega, Отправлено:21:46 10-03-2023

Первая версия вышла 14-11-2003

Автор: Benoni, Отправлено:22:18 10-03-2023

В этом году юбилей!

Автор: MrLAG, Отправлено:23:56 10-03-2023

Кто подскажет, с чем связана ошибка

Run documenttodjvu.exe... Failed.
Error exit code = 1
File '-' : tif file
File '-' : tif file
File '-' : tif file
Error: [1-31206] Unsupported TIFF variant (Libtiff): Deflate compression support is not configured..

В версии СК 5.96.1 все работает, в версии 6.75.5 при попытке создать djvu вылезает вот такая ошибка. Исходные файлы поулчены экспортом pdf в tiff из акробата. После прогона файлов через СК на обработанных tiff всё работает. Но всё равно интересно в чём затык.

Автор: TelecomUral, Отправлено:04:56 11-03-2023

MrLAG

Цитата:
Но всё равно интересно в чём затык.

откройте в фотошопе да сравните внутренние форматы двух тиффов. Или нужно нечто другое?
тифф - контейнер, и не так уж прост.

Автор: los, Отправлено:11:02 11-03-2023

MrLAG, tiff допускает сжатие несколькими алгоритмами, если libtiff собран без поддержки какого-либо из них, то будет выводится ошибка.

tiffinfo foo.tif
Compression Scheme: LZW

tiffinfo bar.tiff
Compression Scheme: AdobeDeflate

Или воспользуйтесь exiftool для получении информации об используемом сжатии.


Автор: shch_vg, Отправлено:14:27 11-03-2023

MrLAG

Цитата:
В версии СК 5.96.1 все работает, в версии 6.75.5  при попытке создать djvu вылезает вот такая ошибка.

Если у вас версии разведены по разным папкам, сравните в опциях настройки на DEE и DjvuLibre.
Появится ли эта ошибка в версии СК 5.96.1, если прописать ссылки на эти параметры из версии 6.75.5?

Цитата:
Исходные файлы поулчены экспортом pdf в tiff из акробата.

А если тифы получить непосредственно в СК?

Автор: MrLAG, Отправлено:21:09 11-03-2023


Цитата:
А если тифы получить непосредственно в СК?


Работает. Но привычнее акробатом. СК при импорте помещает файлы в свою временную папку. А так чтобы в папку с pdf файлом помещал можно сделать?


Если у вас версии разведены по разным папкам, сравните в опциях настройки на DEE и DjvuLibre.
Появится ли эта ошибка в версии СК 5.96.1, если прописать ссылки на эти параметры из версии 6.75.5?


Версии то в разных папках, но сначала была продублирована старая папка, а потом в неё закинут 6.75.5. Настройки я не трогал, в самом ск все галочки совпадают. Рапзные варианты пробовал, дело именно в версии СК.

Автор: TelecomUral, Отправлено:21:23 11-03-2023


Цитата:
MrLAG
Смысл вопроса

смысл ответа в том, извините, что разработчик вынес окончательное решение, смотрите шапку темы.

Автор: MrLAG, Отправлено:21:58 11-03-2023


Цитата:
мысл ответа в том, извините, что разработчик вынес окончательное решение, смотрите шапку темы.


Понял. Я просто подумал, ответ может быть, СК больше не поддерживает такой формат. Для этого и прикладывать ничего не надо. Вполне возможно, что суть именно в этом, и мне вообще не стоило задавать вопрос. Если это какой-то принципиальный вопрос, связанный с работой СК, то я могу и старой версией СК пользоваться.

Большого смысла задание прикладывать нет. Исходный файл без какой либо обработки, сразу вызываю create djvu и получаю ошибку.

Вот файлик tiff https://disk.yandex.ru/i/Y7-JR8uE63J8PQ , который при попытке сжать в СК 6.75 и СК 6.8 выдаёт ошибку. В 5.96 ошибок нет. При использовании DEE напрямую ошибок тоже нет.


Цитата:
MrLAG, tiff допускает сжатие несколькими алгоритмами, если libtiff собран без поддержки какого-либо из них, то будет выводится ошибка.


los, да я уже сталкивался с ошибками, связанными с особенностями создания tiff файла. Просто ошибка стала появляться после перехода от одной версии СК к другой, при всех остальных неизменных факторах.

Автор: TelecomUral, Отправлено:06:57 12-03-2023


Цитата:
MrLAG
При использовании DEE напрямую ошибок тоже нет.

Есть. И именно насчет неподдерживаемого формата LibTiff.



Я, конечно, не фирменный DEE брал, а из DSM и из djvu small 0.4.4. То есть 5й крякнутый. Что у вас за DEE - ?

+
у меня нехорошее подозрение, что вы неверно юзаете визард джву СК.

++
"deflate" это, видимо, "ZIP" вид компрессии, так ирфанвью и СК показывают. Да, с этим видом много программ не работает.

Автор: bolega, Отправлено:07:33 12-03-2023

У меня ошибка DEE:
Ошибка: [1-31206] Неподдерживаемый вариант TIFF (Libtiff): Deflate compression support is not configured..
Так что тут СК однозначно ни при чем.

MrLAG
Скорее всего, у вас для разных версий СК вызывается разные DEE. Гляньте в лог djvu визард, он пишет строку запуска DEE, это же так просто. Заодно и мы узнаем, что за DEE такой есть, который deflate понимает.

Добавлено:
Пожалуй, добавлю в СК проверку метода сжатия, и если он deflate, буду подсовывать для DEE конвертированный вариант

Автор: daa2013, Отправлено:09:20 12-03-2023

1. В книге (той самой где буквы требовали точного позиционирования) много выделений курсивом внутри текста. Выделять их руками не вариант.

а) При замене автоглифами можно ли их как-то опознавать и замены не делать ? (Получить эту инфу из FR ? Или для отдельных слов - блоки слов то точно известны - попытаться наклоны штрихов оценить ?). Некая условная галочка "искать курсив".

б) может, если это возможно, тогда даже буквы с закладки "курсив" туда ставить.

в) Сейчас подумал, что можно еще проще. Может, даже это уже и сделано. Например даны две альтернативные "а" на закладке. При подстановке CК оценивает, какая из них лучше вписывается, ту и вставляет. (Вставляет ли ?) Правда, если мусора много или все буквы то толстые , то тонкие (такая печать) ложные срабатывания возможны. Снова какая-то опознавалка курсивных слов в целом не помешает.


2. У некоторых букв "о" проставлены ударения. Обсуждение проблемы диакритики уже было, повторяться не буду.
Прошу совета, как не потерять эти ударения при автоматической замене.

PS
задать две альтернативные "о" с ударением и без, а дальше СК выберет ? По-моему сейчас такого нет.



Автор: TelecomUral, Отправлено:09:27 12-03-2023

проблема ударений вероятно потребует их опознавания в ocr-движках.

(именно ударения лично для меня серьёзное препятствие в глифировании - а они ещё и различной формы бывают)

Автор: bolega, Отправлено:09:49 12-03-2023

Если для одной буквы задано несколько вариантов, например, обычная, наклонная, с ударением, то СК при построении таблицы замен (analyse) будет подбирать наилучший вариант из всех возможных. Почему бы вам самому не проверить, как это сработает, на своем примере? Про примеры вроде бы уже все знают...
Сейчас СК поддерживает диакритику в глифах, OCR, поиске и т.д. Осталось только придумать, как заставить FR распознавать ударения.
Информации по italic утилита NME не дает к сожалению. Тессеракт тоже у меня еще ни разу его нормально не распознал. Остается один вариант - задавать этот признак вручную для выбранных слов (в списке Words).

Автор: shch_vg, Отправлено:13:12 12-03-2023

MrLAG

Цитата:
Работает. Но привычнее акробатом.

В этом корень вашей проблемы. Я пользуюсь акробатом только в случае векторных пдф, а для растровых самый удобный вариант это СК.
Пользуясь для такого пдф акробатом, вы должны САМИ задавать разрешение вытаскиваемых файлов.
СК это единственная программа (из тех, которые я знаю), которая вытаскивает файлы из пдф с тем разрешением, с каким они были записаны в пдф, что дает гораздо более полное представление об исходных параметрах каждого входящего в пдф файла, и возможность более гибкой работы с этими файлами. Если после акробата все файлы "подстрижены под одну гребенку", то, вытащив их с помощью СК, я имею возможность сам решить, как их в дальнейшем обрабатывать.

Цитата:
СК при импорте помещает файлы в свою временную папку. А так чтобы в папку с pdf файлом помещал можно сделать?

Насколько я знаю, нет. СК не помещает файлы в свою временную папку, а помещает в создаваемую ей папку, имя которой совпадает с именем пдф. В свою очередь эту папку СК помещает в папку, которая прописана в опциях СК в параметре Temp folder.
Задав один раз папку в этом параметре, вы будете в дальнейшем получать в ней подпапки с именами извлекаемых пдф или дежавю, что очень удобно.
Не вижу большой проблемы одноразово перенести сам пдф либо в папку с его именем, либо в Temp folder, чтобы он был рядом с вытащенными файлами.

Автор: TelecomUral, Отправлено:15:12 12-03-2023


Цитата:
А так чтобы в папку с pdf файлом помещал можно сделать?

мне не удалось так настроить СК. А хотелось.

Автор: shch_vg, Отправлено:15:59 12-03-2023

TelecomUral

Цитата:
мне не удалось так настроить СК. А хотелось.

Интересно, зачем?
В чем удобство, может и я захочу?

Автор: TelecomUral, Отправлено:16:23 12-03-2023

shch_vg

Цитата:
Интересно, зачем?
В чем удобство

А.
Допустим, я выделил папку с файлами, интересующими меня с точки зрения сканобработки. Совсем на другом диске, так как такие сканы занимают нешуточное место, но нужны все время под руками (там и скриншотки поясняющие, и даже дока мелкая может лежать). Создал там подпапку со странным пдф, который хочу раскурочить с помощью СК. А вот фиг, поедут экстрагированные из пдф изображения совсем в другое место. Потом переносить, плюхаться с поиском этой папки.
Б.
Банально места может не быть. Скорость диска может быть неподходящая.
В.
Не хочу мусорить в temp-папке СК. Он же не затрет после закрытия то, что наделано. Хотя "temp". Япапки с такими именами считаю не содержащими априори ничего ценного к сохранению.

Автор: MrLAG, Отправлено:19:57 12-03-2023

Добавлено позже: все написанное ниже справедливо при выборе в Акробате ZIP сжатия для файлов. С LZW сжатием и uncompressed поблем нет, все работает - что вполне логично, другой алгоритм. С точки зрения работы проблема себя исчерпала.

Далее я решил кое-что проверить. Похоже, что старая версия СК при копировании файлов перед сжатием во ременную папку меняет формат tiff. Поэтому далее DEE его успешно сжимает. Новая версия СК файлы или не копирует, или не меняет формат. Я специально слазил в папку ...\AppData\Local\Temp , запустил СК 5.96, выловил временный файл skfz00A629E2.tif и попробовал сжать - как и ожидалось проблем не возникло.

Далее вниз можно не читать...


Всем большое спасибо за ответы по моему "несжимаемому" файлику! Пытаюсь установить, что же идёт не так. Вполне возможно, что я упустил что-то очевидное - бывает такое. Вот сейчас сел и постарался всё подробно сверить:

Я прошу меня извинить, DEE действительно выдает ту же ошибку. DEE 5.1.0 build 946. Я вижно не один и тот же файл подсунул.

Смотрите какое дело: я взял папку от СК 5.96, скопировал, и забросил в неё exe версию 6.75 (потом 6.8). Далее я добавил туда дополнительные файлы для 6.75. Затем открыв обе програмым я построчно скопировал пути к сторонним модулям в закладке Apps из 5.96 в 6.75. Т.е. должны программы использовать одно и то же.

Я сверил окошки djvu wizard обеих версий. У меня только один файл, шаг 2. В этом окне стоят одинковые галочки и там и там. Никаких настроек я не трогал. Я просто открываю файл в СК, маркирую, запускаю djvu wizard, attach auto и дальше run all steps.

Вот 6.8


и 5.96



Выбрав "Print all DjvuLibre messages" в версии 5.96.1 я получаю следующий лог:

Step 2 start at 12.03.23 19:22
===========================
===========================

Prepare files... Done.
Run documenttodjvu.exe... Done.
File '-' : tif file
File '-' : tif file
[Page 1]
Page: 2010x2970 dpi:300
User Time(s)/image: Preprocess=0.00 Segment=0.00 JB2=0.00 IW44=0.00
===========================
Step 2 finished at 12.03.23 19:22
Encoding completed successfully
Size of encoded djvu: 1Kb
===========================
Step 5 started at 12.03.23 19:22
===========================
Step 5 finished at 12.03.23 19:22
Encoding completed successfully
Size of encoded djvu: 1Kb
===========================



Саму строку запуска не пишет. Но, Run documenttodjvu.exe... Done.

Для версии 6.8

Step 2 start at 12.03.23 19:27
===========================
Prepare files... Done.
DEE command line: C:\Program Files\LizardTech\Lizardtech Document Express Enterprise\bin\documenttodjvu.exe --verbose --pages-per-dict=100 --aggressive --bg-subsample=2 --quality=75 --threshold-level=67 --filelist="C:\Users\Msha\AppData\Local\Temp\skdee20626282.txt"

Run documenttodjvu.exe... Failed.
Error exit code = 1
File '-' : tif file
File '-' : tif file
Error: [1-31206] Unsupported TIFF variant (Libtiff): Deflate compression support is not configured..
===========================
Step 2 finished at 12.03.23 19:27
Encoding failed (20)



А здесь Run documenttodjvu.exe... Failed.

Я проверил через диспетчер задач, обе версии программы вызывают один и тот же процесс documenttodjvu, ведущий к одному и тому же файлу documenttodjvu.exe по адресу ...\LizardTech\Lizardtech Document Express Enterprise\bin, который и прописан в СК. У меня нет других версий DEE, к которым мог бы обращаться СК. Это единственная версия, установленная в этой ОС. Но под старой ОС использовалась та же версия (даже если бы обращение шло к другому диску, там все равно тот же самый файл documenttodjvu.exe). Я не говорю, что дело в самом СК, но какая-то разница явно есть. Может я пропускаю что-то очевидное - поэтому приложил скриншоты.
---

shch_vg если ставить "determine automatically" в Акробате, разрешение для сканированных pdf вполне нормально определяется. Далее TelecomUral написал примерно мои же соображения.

Автор: Benoni, Отправлено:20:33 12-03-2023

MrLAG
У меня русский Акробат. где находится determine automatically?

Автор: MrLAG, Отправлено:21:18 12-03-2023

Benoni, у меня установлена 8я версия. Сейчас уже существует, если не ошибаюсь, 23я. Поэтому вполне возможно, что такой опции больше и нет.

В 8й при выборе экспорта в tiff в появившемся окошке есть кнопка настроек.


Автор: shch_vg, Отправлено:01:38 13-03-2023

За 17 лет использования СК впервые возникла необходимость определить размер выходного скана с определенным условием, а именно, есть набор текстовых блоков страниц без полей. Естественно у них разные линейные размеры. Если проводить стандартную их обработку, то получаемый размер страницы не может вместить некоторые блоки, так как выбирается средняя величина.
Мне же требуется получить такой размер, в который впишутся все блоки, но без превышений, т.е. по каждому размеру (высота, ширина) должен быть хотя бы один скан точно вписывающийся по этому размеру. Другими словами, надо определить максимальную ширину и высоту, чтобы при необходимости вбить их в фиксированные значения.
Как это сделать?

Автор: TelecomUral, Отправлено:04:27 13-03-2023

shch_vg
я не уверен, но вроде так:
поля ноль, average size галку снять.

UPD

при такой простой задаче я бы вообще определил и вбил размеры вручную.

Автор: bolega, Отправлено:11:05 13-03-2023

shch_vg

Цитата:
то получаемый размер страницы не может вместить некоторые блоки, так как выбирается средняя величина.

Как правильно заметил TelecomUral, если убрать галку на average size, будет учитываться по максимальному габариту. И заметьте, если финализации не было, переобработку можно не делать, достаточно пересчитать размер книги.
Кстати, в новой версии, будет возможность отменить финализацию


Добавлено:

Цитата:
если ставить "determine automatically" в Акробате, разрешение для сканированных pdf вполне нормально определяется

Это да, но shch_vg не упомянул один важный момент, если на одной pdf-странице несколько слоев (например, ч/б скан 600dpi) и зоны 300dpi, то экспорт из pdf в tif сольет все слои в один (пусть 600dpi), тем самым изменив цветность скана, а для зон еще и выполнив апсэмплинг (а оно вам надо?). СК же воссоздаст исходную слоистую структуру, т.е. скан и зоны будут в своих изначальных dpi. Впрочем, что удобнее - решать пользователю. Например, слоистость может быть настолько сложной (лоскутной), что проще сразу объединить в один файл.

Автор: shch_vg, Отправлено:14:50 13-03-2023

TelecomUral

Цитата:
при такой простой задаче я бы вообще определил и вбил размеры вручную.

Т.е. предлагаете просмотреть 300+ сканов и добросовестно записывать все увеличения размера (по ширине и длине)? Это развлечение для мазохистов
У меня сохранились какие-то смутные воспоминания о сортировке по возрастанию, м.б. это что-то другое?
А за "average size галку снять" спасибо.

Автор: TelecomUral, Отправлено:15:14 13-03-2023

shch_vg
да, сортируете thumbs.

Автор: shch_vg, Отправлено:16:26 13-03-2023

TelecomUral

Цитата:
сортируете thumbs

Если показать второе удалось, то отсортировать его это бином Ньютона

Автор: MrLAG, Отправлено:16:55 13-03-2023

bolega

Цитата:
если на одной pdf-странице несколько слоев (например, ч/б скан 600dpi) и зоны 300dpi, то экспорт из pdf в tif сольет все слои в один (пусть 600dpi), тем самым изменив цветность скана, а для зон еще и выполнив апсэмплинг (а оно вам надо?)


Согласен, удобно использовать в этом случае СК. И у меня как раз много таких случаев. Но в целом я и так на глаз вижу, какое было разрешение. Чаще всего у меня исходник книга ч/б 300 dpi c картинками 150 dpi. В ск потом просто обратно понижаю разрешение зон. На глаз серьёзной разницы качества не уловил. Во всяком случае мне было не так критично. Но в следующий раз попробую импорт в СК. Ибо так конечно удобнее. Если всё определится правильно, то дальше только останется книжку сжать.

Но я бы очень попросил добавить возможность сохранять импортированные СК страницы не во временную папку СК, а в папку с исходным pdf файлом. А то батники уже прописаны, да и файлы под обработку лежат на SSD.

---

Попробовал. В исходном PDF картинки на вид явно 150 dpi, но СК определяет их разрешение как 300dpi, т.е. апсэмпл им уже кто-то до меня сделал. Но самое потивное, что нижний слой - ч/б картинка содержит тот же рисунок, но ч/б. Если сразу делать djvu, не почистив страницу (т.е., например, прогнать файлы через СК и сделать clear image under zone), то ч/б рисунок при сжатии вылезает вперёд поверх цветного (это как-то лечится?). Ну и я не совем понял как отредактировать зоны, кроме как открыв сами файлы в новом окне СК. В общем в этом конкретном случае проще получается сначала получить объединённые слои экспортом в акробате, а потом самому расставить зоны.


Автор: bolega, Отправлено:18:08 13-03-2023

shch_vg
в whatsnew когда-то писал про reports, статистику по размерам страниц после обработки

Автор: shch_vg, Отправлено:01:32 14-03-2023

bolega
Информация к размышлению:
Нашел у себя девственный СК версии 5.96.2, девственный в том плане, что в опциях не прописана ни одна программа. Попробовал запустить на проблемном скане и получить дежавю, но СК потребовал DjVuLibre. Прописал путь к djvumake.exe, который прописан в версии 6.71, и снова попытался сделать дежавю. На этот раз СК запросил параметр DEE. Прописал тот же путь, что и у 6.71, после чего в версии 5.96.2 был создан нормальный дежавю, в то время как на том же скане 6.71 благополучно вылетел.
К сожалению в полном логе версии 5.96.2 нет строчки DEE command line, которая передается в модуль DEE, но другого объяснения этому различию нет, как в разнице передаваемой строчки DEE command line.
Пробовал в 6.71 менять профили, отключив все свойства на шаге 2, но результат все равно был отрицательный.

P.S. Вылет на проблемном скане начался уже на версии 6.00.0

Автор: bolega, Отправлено:09:02 14-03-2023

shch_vg
Посмотрел все-таки код 5.96.2, в нем перед вызовом DEE из-за бага все файлы независимо от формата конвертировались в стандартный тиф. Потом я баг исправил, но теперь выяснилось, что тифы тоже надо конвертировать, если у них специфическое сжатие.
Так что причина действительно в СК. Это тот редкий случай, когда баг шел на пользу.

Автор: MrLAG, Отправлено:16:20 14-03-2023

shch_vg, bolega я как раз это заметил, но добавил исправление в своё старое сообщение - надо было наверное написать отдельно, что разгадка найдена. Действительно оказался удобный баг. Всем спасибо, за помощь с поиском разгадки!

Я обратил внимание на появление deskew зон. По описанию "Если на странице имеется одна или более таких зон, то СК будет определять угол перекоса страницы только исходя из содержимого указанных зон."

Это очень удобно, когда картинка мешает или какой-то хитрый рисунок.

Но бывает другой случай - последнее время часто попадалось - весь текст идёт ровно, а какой-то из абзацев сверху или снизу совсем под другим наклоном. Обычно я такие поворачиваю после обработки в VR (rotate selected area). Но когда страниц 500+ то исправлять прямо скажем надоедает. Может быть имеет смысл добавить к deskew зонам настройку, чтобы либо она работала как указано сейчас, либо автоматически разворачивался кусок текста? Я, правда уже сразу вижу проблему: при развороте отдельного куска текста он может наехать на другой текст и это надо как-то отдельно отлавливать. В общем так к размышлению.

Автор: daa2013, Отправлено:02:05 18-03-2023


Цитата:
К сожалению у меня нет алгоритма определения базовой линии. Фича конечно полезная, но увы.


Цитата:
Единственный надежный метод - использовать глифы, для которых вручную задана БЛ. Алгоритм мне в целом понятен. Осталось найти время все это реализовать.


Сижу, обложившись шрифтовыми каталогами, и пялюсь в них, как баран на новые ворота
часто образцы даны вот так:


мне кажется, что тут для бинаризованной страницы можно и автоматически разобрать на связные черные области, назначив их глифами, и перед этим базовую линию автоматически всем буквам сразу приписать, вычислив её по строке.

Что касается вычисления, то мне кажется, что эта картинка (рис №11 отсюда) как раз об этом:


Автор: bolega, Отправлено:11:25 18-03-2023

Я вас умоляю, не надо тащить сюда умные статьи из журналов. То, что там описывают, на практике выливается в тысячи строк кода, месяцы исследований, обломов на большинстве реальных сканов и т.п. Говоря об алгоритмах, я имел ввиду готовый проверенный код, а не теоретические выкладки, между которыми и работающим кодом может быть в реальности целая пропасть. Да и нужно быть хорошим математиком, чтобы превратить абстракции, из которых как правило состоят статьи, в реальный код.
Журнальные алгоритмы, если и работают, то на каком-нибудь простом или частном случае. Если бы было так все просто (нашел статейку, закодировал, вуаля), то в мире были бы уже сотни и тысячи OCR-программ и программ по обработке изображений. Но увы, хорошо работающие сложные алгоритмы либо коммерческая тайна, либо в патентах.

Автор: daa2013, Отправлено:16:32 18-03-2023

Ну, хорошо. Руками линию задать/вставить для всех букв разбираемой на глифы образцовой строки. А вставить по букве "н".

Автор: MrLAG, Отправлено:20:59 19-03-2023

Коллеги, посоветуйте, как лучше подходить к таким вот книгам: https://disk.yandex.ru/d/dRhDuLBUdjxqUA (пример 1 стр.)

Есть сжатый в цветах серого djvu (исходников нет), с достаточно чётким выделением текста и минимальными потерями в фон на картинках. Можно извлечь маску при помощи DjvuOCR и фактически готова ч/б книга. Но приходится просматривать страницы по одной и если что добавлять потерявшиеся в фоне элементы. Приходилось инога повозиться.

Другой вариант, извлечь страницы в цвете, а потом перевести в ч/б в СК. Новый алгоритм AutoW очень неплохо справляется. Но кое-где на картинках тёмные пятна превращаются в чёрный цвет, вместо того, чтобы отсеятся.

Вероятно внимательной без проверки страниц всё равно не обойтись.

Автор: TelecomUral, Отправлено:21:15 19-03-2023


Цитата:
Коллеги, посоветуйте, как лучше подходить к таким вот книгам

искать бумажный оригинал и пересканировать заново. Трудозатраты на порядки меньше.

Автор: MrLAG, Отправлено:00:47 20-03-2023

TelecomUral

Ну нет, всё не настолько запущено. У меня на очистку этой конкретно книги ушло максимум час. Там весь текст нормально в foreground слое лежит. Трудозатраты на поиски бумажного оригинала будут побольше. Попадаются такие книги с разрешением 600dpi и вполне приличным текстом. После очистки книга вообще нормально смотрится.

Безусловно, бывают и такие варианты, когда проще выкинуть.


Автор: shch_vg, Отправлено:01:07 20-03-2023

MrLAG

Цитата:
Вероятно внимательной без проверки страниц всё равно не обойтись.

Непонятно, что вы под этим понимаете, но за 17 лет работы в СК проверку страниц приходится проходить несколько раз всегда.
Опять же не знаю ваши критерии приличного текста, но, используя СК+СТ (для выравнивания строк), можно получить примерно такое.

Автор: bolega, Отправлено:11:25 20-03-2023

MrLAG

Цитата:
Другой вариант, извлечь страницы в цвете, а потом перевести в ч/б в СК. Новый алгоритм AutoW очень неплохо справляется. Но кое-где на картинках тёмные пятна превращаются в чёрный цвет, вместо того, чтобы отсеятся.

Ну так на таких сканах надо включать в СК опцию correct illumination, method=safe. Тогда и AutoW не понадобится

Автор: shch_vg, Отправлено:13:20 20-03-2023

bolega

Цитата:
Ну так на таких сканах надо включать в СК опцию correct illumination, method=safe.

А чем хуже Background cleaner?

Автор: bolega, Отправлено:14:52 20-03-2023


Цитата:
А чем хуже Background cleaner?

Если есть ч/б иллюстрации или очень большие заглавные буквы, содержащие протяженные черные области, BC может их высветлить изнутри, safe CI - нет. В остальном очень похожи

Автор: shch_vg, Отправлено:16:44 21-03-2023

bolega

Цитата:
теперь выяснилось, что тифы тоже надо конвертировать, если у них специфическое сжатие.

Столкнулся с подобной проблемой при обработке исходного скана в режиме "Show source file", наблюдаемой в СК версии 6.ХХ и отсутствующей в 5.94.
Правда эффект этой проблемы обнаруживается не в СК, а в Ирфане.
Краткое ее описание.
В СК версии 6.ХХ обрабатывается в режиме "Show source file" скан, полученный из другой программы.
При правке скана и сохранения его СК продолжает нормальную работу с этим сканом.
Проблема возникает при просмотре сохраненного скана в Ирфане.
Вместо изображения скана в нем, появляется нечто, похожее на труд Малевича, только не квадратной, а прямоугольной формы, однако свойства этого невидимого скана в Ирфане просматриваются.
Вот пример такого скана.
При сравнении свойств скана до правки и после правки бросилось в глаза, что Ирфан показал в исходном скане "Original colors" = 32 BitsPerPixel, а "Current colors" = 24 BitsPerPixel, а уникальных цветов более 27 тысяч.
В файле после правки Ирфан увидел в обоих colors 96 BitsPerPixel, зато уникальный цвет 1 (один), откуда и прямоугольник имени Малевича.
М.б. стоит и сканы подобного типа включить в список "специфического сжатия", если не будет реализовываться предварительный перевод ВСЕХ сканов в нормальный вид?

ИМХО Вариант перевода всех сканов в нормальный вид выглядит предпочтительней в целях избежании правки программы при появлении какого-то левого файла нового типа.

Автор: asku, Отправлено:23:52 21-03-2023

bolega
Добрый вечер. Вопрос возник.



В окне Result View в режиме очистки спеклов (Mouse-up-despecle mode) при выделении зоны и одновременном удерживании Ctrl+Shift белые «пятна» внутри черноты (букв и т.п.) окрашиваются черным.
У меня черным окрасились только мелкие точечки. Более крупные остались без изменений. Что нужно в опциях поменять, чтобы вся белизна внутри черноты окрашивалась черным?
Попробовал в ПКМ—Options—Закладка Despecle—Поле Specle size (fine) сильно увеличить размер, не помогло.

На всякий случай оставлю здесь тест-папку
Тест

Автор: SVN75, Отправлено:00:09 22-03-2023

Добрый вечер!

Подскажите, пожалуйста, как лучше поступить, если страницы книги отсканированы с разным разрешением (250, 300 и 400 dpi). На выходе хочется иметь разумеется страницы одного размера.

Автор: MrLAG, Отправлено:00:37 22-03-2023

bolega,shch_vg

Спасибо! Я ведь это пробовал, но успел забыть, привык к вещам попроще. Давно не брался именно за такие сканы.
------

Стал потихоньку разбираться с реставрацией букв. Посмотрел видеоурок - в целом понятно, и не сложно разобраться. Взялся за поправку точек в оглавлении, наиболее насущный для меня вопрос.

Вот задача https://disk.yandex.ru/d/WEqSK4XCPfUqgg . Я уже провёл автоматическую замену, и на обработанном файле это будет легко заметить. И вот в чём мой вопрос: Тессеракт распознал все точки на картинке. СК после нажатия кнопки анализа опознал только часть. В строке со словами "Галогениды лития" идут позиции 1/29 затем 1/32 , т.е. позиции 30 и 31 пропущены.

Поиграв с настройками на закладке "options" мне удалось добиться включения более жирной точки в позиции 33. Но далее как я не менял, добиться включения мелких точек мне не удалось (распознанных тессерактом). Слишком малы?

Таких точек не очень много, я могу их заменить щёлкая на каждую. Но я вероятно что-то упустил из виду и буду благодарен за подсказки.
---

asku

Цитата:
В окне Result View в режиме очистки спеклов (Mouse-up-despecle mode) при выделении зоны и одновременном удерживании Ctrl+Shift белые «пятна» внутри черноты (букв и т.п.) окрашиваются черным


Посмотрел Ваш пример. Поставил в "Clear options" "White hole size" = 15 - указанные Вами области стали закрашиваться.

Добавлено:
SVN75


Цитата:
Подскажите, пожалуйста, как лучше поступить, если страницы книги отсканированы с разным разрешением (250, 300 и 400 dpi). На выходе хочется иметь разумеется страницы одного размера.


Можно попробовать установить на закладке Files выходное разрешение вместо Original, то, которое Вы желаете, например 400 или 600. Если это страницы одной книги, то в итоге должны получиться одинаковые.

Автор: TelecomUral, Отправлено:09:15 22-03-2023


Цитата:
На выходе хочется иметь разумеется страницы одного размера

вопрос непонятен. Размер в каких единицах?

Автор: SVN75, Отправлено:19:08 22-03-2023

MrLAG


Цитата:
Можно попробовать установить на закладке Files выходное разрешение вместо Original, то, которое Вы желаете, например 400 или 600. Если это страницы одной книги, то в итоге должны получиться одинаковые.


Спасибо, но я именно так и сделал (установил 600 dpi на выходе), но ширина текстовой области для случая, например, исходной страницы с 250 dpi получается больше, чем для страницы с 400-ми.

TelecomUral


Цитата:
вопрос непонятен. Размер в каких единицах?

Речь идёт во-первых размерах самих страниц (этого одного, конечно, не сложно добиться), во-вторых размерах текстовых областей на них. Вроде бы я читал, что СК не очень уверенно выставляет размеры в миллиметрах (хотя это было давно, может поправили), поэтому речь идёт о пикселях.

Автор: TelecomUral, Отправлено:21:10 22-03-2023


Цитата:
SVN75
ширина текстовой области для случая, например, исходной страницы с 250 dpi получается больше, чем для страницы с 400-ми

Одной и той же страницы?? Или таки разных? А если разных - так может сканеры различаются или сами страницы имеют разное число миллиметров в текстовых областях?
Короче, решение известно и описано в шапке. Насчёт субтаска.

Автор: shch_vg, Отправлено:00:12 23-03-2023

SVN75

Цитата:
Вроде бы я читал, что СК не очень уверенно выставляет размеры в миллиметрах (хотя это было давно, может поправили), поэтому речь идёт о пикселях.

СК работает одинаково уверенно что в мм, что в пикселях, но он не обязан разбираться, какое у сканов стоит разрешение. Это сугубо дело обработчика.
Сначала сравните размеры сканов в каждой из указанной вами групп.
Если, допустим, все сканы в одной группе примерно одного размера, то задача для вас заметно упрощается. Надо всего-навсего выбрать из каждой группы по одному скану, заключить их в один subtask и выложить результат сюда в архиве. Как это сделать, указано в шапке.
Если же в одной группе размеры разные, то дело швах , придется много возиться.

Hint: Для первого случая надо выравнять разрешение этих групп. Лучше это делать по ширине текстового блока, т.к. высоты могут заметно различаться. Из каждой группы выбираете по одному скану с полноценными строками по ширине и обрабатываете их в СК, обрезая вертикальными резаками по краям текстовой зоны. Далее принимаете разрешение любой группы (по желанию, я бы выбрал 300) в качестве правильного и простой пропорцией рассчитываете, какое разрешение нужно подставить для двух других групп (каждому свое).
После этого меняете в СК у каждой из этих группы разрешение на вычисленное и, наконец, делаете обработку всего задания. Величины текстовых блоков у всех сканов будут примерно одинаковы.

Автор: SVN75, Отправлено:20:40 23-03-2023

TelecomUral

Пожалуйста, вот sub-task: https://drive.google.com/file/d/1KFIvEYZhx6rMquKm6Gchi3Q3_kVElnKY/view?usp=share_link.

Там три страницы, имеющие в оригинале разный размер и разное количество dpi, а именно 250, 400 и 300. На первом из обработанных изображений величина картинки с текстом намного больше, чем на двух других. Я бы хотел, чтобы они были все одинаковы (как на первом изображении).

И второй вопрос. Почему, раз уж они обе отличаются от первой, нет различия между 2-й и 3-й страницами, хотя как размеры исходной картинки, так и dpi для них различаются? От чего это зависит?

shch_vg

Спасибо, буду думать над тем, что Вы написали и пробовать.

Автор: shch_vg, Отправлено:22:13 23-03-2023

SVN75
Те, которые якобы в 250дпи в реале сканировались в 300. Поменяйте у них дпи на 300 и посмотрите.


Цитата:
И второй вопрос.

Потому что у них стоят реальные дпи, в которых они сканировались. Исходные сканы в 400 и 300дпи и должны отличаться в той же пропорции.

Автор: SVN75, Отправлено:22:43 23-03-2023

shch_vg

Ваши знания превосходят мои, поэтому я не постигаю смысла. Что значит «250 в реале 300»? Я открыл файл в Photoshop, он показал 250, точно то же показал Image magick. Я поменял на 300... изменился размер рисунка. Это же ожидаемо, нет?

И хорошо, пусть первое изображение на самом деле 300. Но тогда первое и третье обработанные СК изображения должны бы быть одинаковыми. А одинаковыми оказываются второе и третье, хотя у исходных изображений разные dpi.

Автор: Darth_Max, Отправлено:23:02 23-03-2023

Есть документ. Размер примерно половина А4. Но двухсторонний. Мне нужно его отсканировать, чтобы на одной странице А4 были обе стороны. Я хочу сохранить этот образец, чтобы распечатать в любое время. Не нужно распознавать текст, можно картинку. Сабж это может?

Автор: shch_vg, Отправлено:23:33 23-03-2023

SVN75
Те, которые якобы в 250дпи в реале сканировались в 300. Поменяйте у них дпи на 300 и посмотрите.SVN75
В этой теме говорится о программе Сканкромсатор, а вы ссылаетесь на какие-то другие программы.
Они вам показывают то дпи, что прописано в скане, и не более того.
Проведите небольшой эксперимент.
Не где-нибудь, а в СК поменяйте дпи любого скана, прописал в него любое число, какое вам нравится, сделав предварительно копию исходного скана.
Затем загрузите в СК оба эти скана и убедитесь, что у них размеры в пикселях (да и в мм) будут точно сопадать, т.е. эти сканы одинаковы, а дпи любая из упомянутых вами программ будет показывать разное, т.е. с точки зрения этих программ эти сканы разные.
А вот если вы эти два одинаковых по размеру скана попытаетесь обработкой в СК привести к одному дпи (например, к 600), то СК изменит размер каждого скана пропорционально разнице между 600дпи и дпи конкретного скана. Теперь на выходе будут уже разные по размерам сканы в отличае от сканов на входе.

Цитата:
Но тогда первое и третье обработанные СК изображения должны бы быть одинаковыми.

Если бы это была бы одна и та же страница, причем сделанная на том же сканере с теми же параметрами сканирования, то размеры были бы одинаковы.
В вашем случае проводилась допечатка страниц не известно где и с какими параметрами, вы дали пример скана 250дпи явно зауженный, поэтому можно говорить только о примерном значении реального дпи скана.
Вы сами меняли в СК дпи, как я написал в предыдущем сообщении?
Сравнивали результаты такого изменения?
Доступ до сканера имеете?

Автор: TelecomUral, Отправлено:04:59 24-03-2023

[more=оффтоп для SVN75]SVN75
У вас базовые непонимания процесса.
Исходно компьютер оперирует числами. не миллиметрами.
что такое числовая последовательность, или натуральные числа, со школы помните же. 1, 2, 3, и до упора, то есть бесконечности. Но в нашем случае всегда упор есть Корпус сканера.
Картинку (скан) компьютер рассматривает как последовательность сосканированных точек с разным цветом. Первая точка - бежевый, вторая - светлобежевый, третья - почти белый, четвертая опять светлобежевый цвет. Только числами указаны сами цвета, а не словами, как я написал. Отсчеты же не нумеруются никак. Это не нужно, потому что известно правило считывания. Только указаны число отсчетов в строке и число строк.
Теперь встает вопрос - а как человеку-то картинку показать? Сколько чисел последовательности засветить на миллиметре(дюйме) экрана/принтера/и т.п. устройстве физического отображения. Ведь как вы видите, обычно в любом просмотрщике (фотошопе и др.) есть шкала/ячейка с масштабом (чаще всего это 100% при открытии, либо "вписать в экран"). То есть просмотрщик-то знает некое свойство монитора (а принтерный драйвер - свойство механизмов в принтере). Допустим, один пиксель монитора это по памяти стандартные 0,28 миллиметра. Сейчас наверное сильно поменьше, раза в два.
Поэтому в файле картинки указывают коэффициент перевода "сколько чисел в дюйме (в мм)". Чтобы программа смогла привязаться к реальности. Повторяю! Именно коэффициент пересчёта привязывает последовательность отсчётов к реальному миру. Это тот самый dpi, или "точек на дюйм".
Когда вы уясните для себя связь, которую я описал, вы поймёте, что если наврать в коэффициенте - то и на мониторе размер будет нереальным. Допустим, моторчик сканера вёз каретку и процессор считывал цвета с плотностью "600 dpi". А потом вы зашли в скан и какой-либо программой исправили dpi на другое. ВСЁ !! Реальность "разъехалась"
Я сознательно не стану разжёвывать предыдущие ваши вопросы, чтоб потренировали свой ум. Почему-то у многих людей вопрос о реальном смысле понятия "dpi" не имеет ответа в голове. Смотрят в экран и не соображают как именно сформирована картинка на экране. То, что видят.

В закрепление вышесказанного. Обращу внимание, что в акробат-ридере, просмотрщике пдф, есть в настройках ячейка "сколько пикселей в дюйме отображающего устройства":

[/more]

Автор: SVN75, Отправлено:16:21 24-03-2023

TelecomUral
Вы правы, спрорить не стану, пробелы в том, что касается растровых изображений, есть.

Спасибо за подробное объяснение. По правде говоря, примерно так я себе это представлял, но туманно (не было необходимости разбираться до сих пор, если честно, а с чем приходится разбираться, того и так хватает). Итак, у нас есть сканированное изображение и в зависимости от выбранных настроек сканера, оно содержит строго определённое количество точек. Но в той области монитора (принтера), которая отведена данной программой для показа этого изображения, столько точек может и не оказаться или наоборот оказаться больше, а значит нам нужен коэффициент пересчёта. И понятно, что если этот коэффициент задать другой, то показана будет только часть картинки или, напротив, будем иметь белое поле и маленькую картиночку в нём.

Это объясняет то, почему в моём случае картинки на выходе получаются разного размера. Хорошо. Но я спрашивал про то, как эту ситуацию лучше разрешить средствами СК. В принципе, разрешение в файлах можно изменить (не просто прописать другое, это бессмысленно, но конвертировать) и привести все исходные изображения к одному значению dpi в том же Photoshop. Но что же так кучу файлов обрабатывать руками? Допустим, можно в Photoshop это автоматизировать или использовать тот же Image magick или ещё как-то, чтобы не руками это делать, но я предполагал, что разработчик СК встроил какой-то механизм решения этой проблемы, поскольку случай в общем нередкий (да, кто-то сканировал и делал это криво и скорее всего на разных сканерах, но приходится работать с тем, что есть).

Добавлено:
shch_vg
Пока не смог найти время проверить Ваши рекомендации. Но обязательно попробую, спасибо.

Доступа до сканера нет и не имею ни малейшего представления, кто это сканировал (я бы уж во всяком случае сделал это с одними и теми же dpi, возможно, разные люди этим занимались).

Добавлено:
shch_vg

Я не понимаю, что означает фраза


Цитата:
в СК поменяйте дпи любого скана


Я проделал вот что. Обработал файл 250 dpi, выставив на выходе 300 dpi, установив фиксированные размеры, те же что и у исходного рисунка (без резания, без какой- бы то ни было обработки). Получившийся файл был несколько больше по ширине и высоте (ровно в 1.2, то есть 300/250 раз) исходного. И я не могу понять как бы он мог не быть больше.


Автор: TelecomUral, Отправлено:19:01 24-03-2023


Цитата:
SVN75
но я предполагал, что разработчик СК встроил какой-то механизм решения этой проблемы

и правильно предполагали.


Цитата:
SVN75
разрешение в файлах можно изменить (не просто прописать другое, это бессмысленно, но конвертировать)

а вот тут вы ошиблись. Именно прописать другой дпи. Через меню СК Tools/Correct DPI... это можно сделать как раз пакетно (группой).

Автор: SVN75, Отправлено:21:20 24-03-2023

TelecomUral

Да, я это проделал, прописал одно и то же разрешение для всех трёх файлов из моего примера выше. В соответствии с предсказаниями это ровным счётом ничего не изменило.

Всё хорошо, только как же решить мою исходную проблему и всё же получить на выходе файлы с одинаковыми размерами картинок?

Автор: MrLAG, Отправлено:21:20 24-03-2023


Цитата:
SVN75

Я проделал вот что. Обработал файл 250 dpi, выставив на выходе 300 dpi, установив фиксированные размеры, те же что и у исходного рисунка (без резания, без какой- бы то ни было обработки). Получившийся файл был несколько больше по ширине и высоте (ровно в 1.2, то есть 300/250 раз) исходного. И я не могу понять как бы он мог не быть больше.


Посмотрите какой у вас размер в пикселях, например высоту. И сравните, дает ли этот размер при делении на dpi примерно одну и ту же величину для разных страниц. Скажем если у вас высота 3000 пикселей, разрешение 300 dpi, то высота картинки будет 10 дюймов. А если другой скан имеет те же 3000 пикселей, но разрешение в свойствах файла прописано 250 dpi, то это уже 12 дюймов. Чтобы при обработке страницы получились одинаковые, надо через меню СК Tools/Correct DPI (как было написано выше) присвоить таким страницам одинаковый dpi. Другой вариант, предположим какая-то страница имеет высоту 2400 пикселей, при том же разрешении 300 dpi (8 дюймов), чтобы страница совпадала с отсальными ей надо присвоить разрешение 240 dpi. Теперь если для выходных файлов выставить 300 dpi, то все страницы примут одинаковый итоговый размер как по dpi, так и по пикселям. Что в итоге даст и одинаковый печатный размер. Естественно при наличии разных по ширине белых полей или разной обрезки точного совпадения не будет, но прикинуть можно.

Вот Ваши 3 листа исходники и обработака + сохранённая задача https://disk.yandex.ru/d/jhimhYaMU-5njg .

Обратите внимание, что для первого листа разрешение в 250 dpi я изменил на 300 dpi. После этого при установке выходного разрешения в 400 dpi я получил вполне нормальный результат. 400 dpi выбрал как наибольший из всех исходных.

Суть в том, что не для всех страниц надо менять разрешение. Для каких-то оно по каким-то неведомым причинам указано неверно. Вот их и надо поправить. Проще всего проверить какие страницы выбиваются и исправить для них.

Автор: asku, Отправлено:22:44 24-03-2023

Добрый вечер всем.



Прошу помочь. Не знаю, как улучшить результат на выходе. Разрешение 300, книга старая. Думал, результат будет все-таки получше. Может есть в недрах настроек что-то что улучшит качество?
Вот тест:
Ссылка

P.S. Да, OCR не буду применять для этой книги.

Автор: SVN75, Отправлено:23:02 24-03-2023

MrLAG
Большое спасибо. Ответ исчерпывающий и по сути. Я понял идею исправления из Вашего описания и даже смог получить практически такой же результат, что и в Вашем примере. Весьма признателен!

Добавлено:
asku
Вполне возможно, что можно ещё улучшить, но вот так уже получше смотрится на мой взгляд (файлы с буквой «a» на конце — Ваши собственные). Можно ещё попытаться поварьировать первое поле на вкладке «Binarization». Чем меньше значение, тем меньше остаётся паразитных точек, но также истончаются буквы и могут пропадать перемычки кое-где. И ещё я выставил в настройках самой программы параметр despeckle как «safe».

https://drive.google.com/file/d/1pky8PHxzr8G9_SmYVycok5f-ot9mDE35/view?usp=share_link

P. S. Просветите, что это за язык.

Автор: asku, Отправлено:00:37 25-03-2023


Цитата:
И ещё я выставил в настройках самой программы параметр despeckle как «safe».


А где это ставится?
Я знаю во вкладке Illumination (в Quality — окно Image enhance filters) есть Safe, и как раз он у меня и выбран.
А на вкладке Page есть галочка despeckle, она тоже включена.
Но что значит в настройках самой программы параметр despeckle как «safe» я не понял.


Цитата:
Просветите, что это за язык.


Осетинский.

Автор: SVN75, Отправлено:00:48 25-03-2023

asku
Меню File / Options. Потом в самом диалоге вкладка «Processing», в правой верхней панели будет параметр «Despeckle». Это не особо влияет, но у меня так пара перемычек сохранилась, которые без этой настройки исчезли.

Автор: shch_vg, Отправлено:13:22 25-03-2023

SVN75

Цитата:
Меню File / Options.

А если Safe не нужен для всех страниц?
Так не налазишься в общие настройки.
На закладке Page нажмите special..., а там можно установить нужный вариант очистки, причем есть возможность через клавиши Ctrl или Alt распространить этот выбор на нужную вам группу сканов.

Автор: daa2013, Отправлено:09:05 27-03-2023

занимаюсь подгонкой (стыковкой) иллюстраций на разворот:


Можно ли как-нибудь в RV при просмотре разворотами переключать со сдвигом на 1, а не на 2 страницы (например, с разворота 51-52 на 52-53, то есть как бы учитывать/не учитывать титул) ?
(интуитивно поискал чекбокс в КМ выпадающего списка номеров страниц, но такого там нет)


Я как-то писал о синхронизации (залипании) масштаба при просмотре в режиме Compare. Нет ли случайно такого в режиме Two pages ? (чтобы при увеличении масштаба левой такой же масштаб становился и у правой) ? чтобы при сдвиге вверх/вниз левой также ехала и правая.
Чтобы можно было визуально контролировать стык.


Кстати, скролл-бар посередине для контроля стыка тоже мешается. Может, целесообразно иметь возможность его убирать и прямо совсем встык изображения демонстрировать ? Такого, я понимаю, сейчас точно нет...

PS
рассматривать два изображения как одно и при редактировании прямо оба сразу менять, например, почистив ластиком что-то на стыке, захватить и изменить сразу оба изображения. Сделать копипасту на стык. И автоматически разрезать вставленное между обеими страницами.

Автор: xMARx, Отправлено:14:25 27-03-2023

__Всем привет. Столкнулся с одной проблемой. Для того, чтобы она возникла необходимо проделать следующие шаги с прикрепленным проектом СК:
_1) В окне RV распознаем текст на странице.
_2) На 7-й строке сверху редактируем "a=11°". Первый символ "о" меняем на русскую "а". Второй символ "Ъ" удаляем.
_3) На 4-й строке сверху редактируем "D=32.5". Первый символ "В" меняем на английскую "D"
_4) Закрываем окно RV, закрываем главное окно.
_5) Снова открываем проект, заходим в окно RV, наводим указатель на букву "д" в слове "длиною" (на 5-й строке сверху) и видим, что границы распознанного символа имеют такую же длину, как и вертикальный размер текста на странице. Подобные проблемы имеются и у других символов.
__Если поменять местами 2) и 3), то проблемы не возникает.
В опциях СК стоит tesseract - rus.traineddata.
__Можно ли как-то вернуть нормальный размер границам распознанных символов?

Проект     
Скриншот    

Автор: bolega, Отправлено:16:54 27-03-2023

xMARx
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=3180#14

Автор: SVN75, Отправлено:19:44 27-03-2023

Подскажите, пожалуйста, такой вопрос (строго говоря, он, наверное, даже не по СК как таковому, но по практике его использования).

Из обработанных страниц нужно создать djvu, в который хотелось бы добавить OCR. Я разобрался как это сделать, всё отлично работает, но, допустим, в тексте есть слово «азбука», последний слог которого не влез в строчку и был перенесён на следующую. Ведь поиск по этому слову теперь его не найдёт, ибо оно было разделено и теперь содержит знак переноса «азбу-ка». Это можно поправить какими-либо настройками (как я и сказал, проблема по сути не в СК, но вдруг что-то удалось придумать). Или может есть какие-то альтернативные решения?

Автор: TelecomUral, Отправлено:21:27 27-03-2023

SVN75
я не спец по этим нюансам, но вроде бы утилитка NME FR11 DjVu Text Layer Crutch
решает вопрос.
http://forum.ru-board.com/topic.cgi?forum=5&topic=38467&start=209&glp#lt

Автор: SVN75, Отправлено:22:57 27-03-2023

TelecomUral
Да, так и есть, решает полностью. Спасибо.

Автор: bolega, Отправлено:08:15 29-03-2023

daa2013

Цитата:
то есть как бы учитывать/не учитывать титул) ?

Если исходный скан - разворот, то на выходе в режиме two-pages обе половинки отображаются как пара, ради этого СК возможно предыдущую страницу дублирует. Так было всегда. А вот если исходные сканы одиночные страницы, то СК уже за этим следить не может.
Опцию добавлю, чтобы учесть все варианты.

Автор: asku, Отправлено:00:13 31-03-2023

Доброй ночи. Подскажите пожалуйста, как можно в зоне закрасить белые точки внутри черноты.


Обычным способом не получается. То есть: в режиме отображения зон (Zone), правой кнопкой мыши меню Options и т.д.
Не получается и при удерживании Ctrl+Shift соответствующей метелкой. Причем в последнем случае СК создает такие красные рамки (см. рис.). Не знаю, что это означает. Может баг, может нет.
Вот тест-файлы:
тест

Автор: daa2013, Отправлено:03:14 31-03-2023

Инвертируйте изображение, почистите красной метелкой, и инвертируйте обратно.
КМ - > Special -> Invert image

Зажимать дополнительно Shift при чистке, насколько я знаю, не надо. (Это, кажется, переход на другую метелку.)
Деспекл белого (заливка белых дырок) - это Ctrl+ красная метелка.

Видимо, режим цветного деспекла по Ctrl+ красная метелка не задействуется.


Красные рамки означают floodfill limiter - ограничитель заливки.

UPD
При чистке на красной метелке включите галочки
thresholding mode
use background color


Я в первый раз этого не делал и всё сработало. Но во второй раз без этого воспроизвести результат не получилось. Не исключено, что в первый раз значения волшебного цвета и порога применились из другого параллельно открытого проекта.





ВОПРОС
В окне MW если я делаю эллипсом выделение, я могу его потом сжать, используя грипы.
Но в окне RV грипы есть только для прямоугольника.

Может, я их как-то не так ищу ? Альт, Шифт, контрол не помогают.

В MW же эллипс по шифту еще можно вращать, а в RV не получается.


Автор: bolega, Отправлено:07:49 01-04-2023

asku

Цитата:
Подскажите пожалуйста, как можно в зоне закрасить белые точки внутри черноты.

Просто включите режим despeckle. Для малоцветки thresholding mode должен быть отключен, не слушайте daa2013. И никаких инвертирований, ctrl и shift. У вас не получается из-за того, что забыли наверно переключить текущий цвет на черный. Сейчас у вас спеклы чистятся, но белым цветом, т.е. ничего не меняется.

daa2013

Цитата:
В окне MW если я делаю эллипсом выделение, я могу его потом сжать, используя грипы.


Цитата:
В MW же эллипс по шифту еще можно вращать, а в RV не получается.

Вы наверно путаете выделение, зоны MW (набор вершин, т.е. векторный объект) и зоны на выходе (битмапы, растровый объект, всегда прямоугольной формы).



Автор: daa2013, Отправлено:16:52 01-04-2023


Цитата:
переключить текущий цвет на черный


да, это работает.


Цитата:
путаете выделение


Нет, я не путаю. Я понимаю, что в окне MW итогом будет пикчур-зона. А в окне RV я в данном случае хотел наклонным эллипсом задать floodfill limiter. (Не уверен, что он растровый.)

Но я кажется понимаю, что вы хотите сказать. Далее интерпретация:
В окне MW я ставлю выделение, потом получаю зону, и вращаю уже зону (векторную).
В окне RV я ставлю выделение, потом получаю растровый объект. И фиг тут вращать.


Однако, в окне MW, если маусап не задан, то есть временной разрыв между выделением и появлением зоны. В окне RV, если не включены метёлки, тоже есть этот разрыв (между выделением и удалением, например).

И я подсознательно (по аналогии с MW) считал, что если зажать какой-то модификатор - альт или контрол - после выставления такого не привязанного к какому-либо действию выделения в RV, то появится векторный объект с грипами и возможностью вращения по шифту, который после совершения сжатия или поворота снова по контролу или альту (а может быть и автоматически после завершения движения, хотя всё-таки лучше по дополнительному нажатию) превратится в растровый.

То есть работа в RV будет более-менее аналогична работе в MW.


Кстати, альтернативно, вместо лимитера наклонным эллипсом можно было задать заливку.

Автор: daa2013, Отправлено:19:35 01-04-2023

Повторюсь, что если ставить в RV прямоугольник, когда выключены метелки, то он же векторный и с грипами (белыми), а эллипс - почему-то нет.

Шифт для вращения, впрочем, ни там, ни там не работает.

Автор: daa2013, Отправлено:09:46 02-04-2023

Хотел преобразовать треугольное выделение в описанный круг, так оказывается в RV этого тоже нет

Автор: SVN75, Отправлено:14:17 07-04-2023

Добрый день!

Взгляните, пожалуйста, уважаемые знатоки, нельзя ли что-то улучшить в результатах обработки изображений. Отсканировано гнусно, поэтому очевидно, что ничего хорошего ожидать не приходится, но может хоть немного удастся подтянуть.

Я пытался варьировать пороги на вкладке «Binarization» и параметр «Sharpen2» ( включая и то, что можно использовать для улучшения резкости в диалоге «Ennhance», открываемой с этой же вкладки), но результат всё равно плачевен.

Ссылка

Автор: TelecomUral, Отправлено:17:08 07-04-2023

SVN75
стопицот раз твердили, почти двадцать лет:
из дерьма конфетку не сделаешь. Убили скан - всё. Это не лечится. 67кил на листок

Был бы художественный текст, можно было бы через ФР пропустить с проверкой орфографии. А формулы, извините, как проверять?

Автор: SVN75, Отправлено:17:27 07-04-2023

TelecomUral

Ну на тех, кто так сканирует, я повлиять не могу. Думаю, они мыслят согласно порочному принципу «Пусть вечно благодарны будут, что хоть так сделал».

Ну да, так я и подозревал, что ничего не получится. Спасибо, что хоть взглянули.

Автор: daa2013, Отправлено:18:01 07-04-2023

А где вы это взяли ? Может, там можно лучше наковырять

Автор: SVN75, Отправлено:21:22 07-04-2023

daa2013
На libgen.

Нет, там только в таком непотребном виде есть эта книга, это было первое, что я проверил.

Автор: TelecomUral, Отправлено:07:01 08-04-2023

оффтоп
daa2013
надо правильно спрашивать - реквизиты книги

Автор: daa2013, Отправлено:07:13 08-04-2023

Да, я тоже повеселился. Мог и ответ "в интернете" получить.

Но я нагуглил:


Ссылка на страницу 20


https://books.google.ru/books?id=wRPtCgAAQBAJ

Добавлено:
второе издание есть на архив.орг

Автор: imwerden, Отправлено:10:54 08-04-2023

Много раз сталкивался с тем, что „дешевле“ пересканировать, чем пытаться перекодировать. Последнее занимает несусветное количество времени,. а результат всё равно не радует.... И даже самые редкие книги в конце концов находятся снова.

Автор: asku, Отправлено:14:41 09-04-2023

Добрый день. Подскажите пожалуйста, можно ли вот этой кнопке назначить горячую клавишу?


Автор: bolega, Отправлено:16:19 09-04-2023

asku

Цитата:
можно ли вот этой кнопке назначить горячую клавишу?

Да, см. команду Replace colors of the image

Добавлено:
Версия СК 6.9.
Исправил много багов, добавил кое-что новое.
https://workupload.com/file/xFMn3BpNSVp

Автор: asku, Отправлено:18:13 09-04-2023

bolega
А я только сейчас подумал — спросить когда выйдет новая версия или нет. Потом передумал ) Отлично!

Автор: asku, Отправлено:00:39 11-04-2023

bolega
В новой версии такое сообщение при попытке вставить символ из библиотеки на страницу (без OCR).

Автор: Benoni, Отправлено:07:50 11-04-2023


Цитата:
новой версии... вставить символ

а у меня всё нормально!

Автор: mvk2006, Отправлено:12:20 11-04-2023


Цитата:
bolega
В новой версии такое сообщение при попытке вставить символ из библиотеки на страницу (без OCR)

Win7-64 аналогичная картина

Автор: TelecomUral, Отправлено:12:32 11-04-2023


Цитата:
Win7-64 аналогичная картина

подтверждаю. если мышкой потащить глиф на страницу, то error.

Добавлено:
панелька image adjustments не появляется, если окно VR открыто не во весь экран.

Автор: bolega, Отправлено:15:00 11-04-2023


Цитата:
В новой версии такое сообщение при попытке вставить символ из библиотеки на страницу

причина выявлена. ошибка появляется, если б-ка создается впервые (изначально пустая) и тут же используется. Чтобы этого не было, достаточно один раз после добавления первого глифа закрыть окно VR. После этого ошибок уже не будет.

Добавлено:

Цитата:
панелька image adjustments не появляется, если окно VR открыто не во весь экран.

А вот это я не смог воспроизвести, как ни пытался...

Автор: TelecomUral, Отправлено:15:11 11-04-2023


Цитата:
bolega
А вот это я не смог воспроизвести, как ни пытался...

чем помочь в поиске?

Довольно устойчиво выходит: если окошко VR справа вверху имеет кнопку "раскрыть до полного экрана", то увы, панелька не появится, пока не закроешь и снова не откроешь окно VR. А ежели на эту кнопку ("раскрыть...") нажать - то панелька сразу появляется.


Автор: ilynov2023, Отправлено:18:50 11-04-2023

Никак не возьму в толк, что произошло с функцией Clear - очистка изображения в области выделения (для удаления мусора, штампов и т.д.).
В версии 6.71 ещё работает (клавиша Delete или C) - в последних как бы номинально числится в настройках - Hotkeys - но уже не работает.
После версии 6.00.5. не сохраняет графический файл после изменения. Смотрю уже несколько месяцев форум - но не найду ничего по теме... Спасибо за помощь заранее!

Автор: bolega, Отправлено:19:13 11-04-2023


Цитата:
После версии 6.00.5. не сохраняет графический файл после изменения.

вы про это?

Цитата:
- MW: Убрана возможность сохранения исходных файлов в главном окне.

Автор: asku, Отправлено:19:44 11-04-2023

Пожалуйста напомните как нужно подключать OCR к СК-проекту. Что-то я забыл.
1. В Файнридер 15 закидываю сканы и распознаю.
2. Внутри папки с покетом файнридера в папку data закидывю парсер ParserFR12.exe и запускаю.
3. Сгеренированный файл result.bookmarks переношу в проект СК — в папке OUT папка OCR.
4. Дальше в СканКромсаторе ... вроде бы меню Result — OCR output files — All.

Выдает ошибку. Может вместо 4-го пункта что-то другое?

Автор: bolega, Отправлено:19:47 11-04-2023


Цитата:
Выдает ошибку.

а что в Reports пишет?

Автор: asku, Отправлено:19:59 11-04-2023



Добавлено:
Понял. Надо было тессеракт поменять на Файнридер.

Добавлено:
bolega, а почему в режиме подсветки спеклов, с включенной галочкой Marashki mode, красным выделаются части символов, при том, что файнридером они распознаны правильно.




Автор: asku, Отправлено:21:59 11-04-2023

bolega

И еще вопрос.
Вот при обращении к hunspell-словарю появляется такое сообщение.






При нажатии на кнопку Doubtful words. Если нажимать на кнопку All words, то все ок.

Автор: asku, Отправлено:14:55 13-04-2023


Цитата:
Вот при обращении к hunspell-словарю появляется такое сообщение.


Кто-нибудь заметил такую же проблему?

Автор: bolega, Отправлено:18:17 13-04-2023

asku
Проверьте:
1) Лежит ли в папке с СК файл libhunspell.dll
2) Лежит ли в папке с СК файл hunspell-dicts.cfg
3) задан ли для сканов язык распознавания, и если задан, то описан ли для него словарь в hunspell-dicts.cfg
Вроде бы это все не раз обсуждалось.

Автор: asku, Отправлено:19:51 13-04-2023

bolega, спасибо. Файла libhunspell.dll не было. Про него ничего не помню, взял его из папки с предыдущей версии программы и все заработало. Даже не знаю, откуда файл вообще

Вопрос еще. Как-то вы мне говорили как нужно дефис в конце строки (line) заменять на мягкие переносы. Там вы мне пишете еще:
«Затем в КМ списка — результата поиска даю команду Validate words with hyphen — в результате галочки снимутся со всех результатов, которые по идее не могут быть переносом».
Не могу найти команду Validate words with hyphen. Можете подсказать где она в новой версии?

Автор: bolega, Отправлено:20:35 13-04-2023

asku
Читайте whatsnew.txt

Автор: bolega, Отправлено:08:16 16-04-2023

Благодаря asku выяснилось (спасибо ему за плотное тестирование!), что в функционале изменения ocr-текста и find/replace все-таки остались какие-то баги, хотя мне казалось, что я там все отловил. Поэтому лучше этими возможностями пока не пользоваться.
К сожалению, из-за большой загруженности я сейчас не могу заниматься СК, смогу вернуться к нему не раньше осени.

Автор: SVK2I, Отправлено:11:06 16-04-2023


Цитата:
SVN75
Я пытался варьировать пороги на вкладке «Binarization» и параметр «Sharpen2» ( включая и то, что можно использовать для улучшения резкости в диалоге «Ennhance», открываемой с этой же вкладки), но результат всё равно плачевен.

Я с интересом просмотрел Ваш "test" через СК 6.9. Сканы получали фотосъемкой. Сейчас люди в основном делают книги так, качество плохое. Но Ваши настройки задания неверные.

Цитата:
imwerden
Много раз сталкивался с тем, что „дешевле“ пересканировать, чем пытаться перекодировать... И даже самые редкие книги в конце концов находятся снова.

Не могу согласиться, очень много книг, отсканированных плохо, и других вариантов нет.
Но в том и прелесть СК, что с его помощью в итоге можно получить приемлемый для чтения вариант. Второй день сижу на версии СК 6.9 и мне понравилось.
Благодарность автору за новую версию СК 6.9.

Автор: TelecomUral, Отправлено:13:20 16-04-2023

оффтоп


Цитата:
SVK2I
и других вариантов нет


читайте внимательнее: "находятся снова". Это про другое.

Автор: SVK2I, Отправлено:14:11 16-04-2023

TelecomUral

Цитата:
читайте внимательнее: "находятся снова". Это про другое.

Извините, если обидел Вас, но я понял слова так, как написал. Главное, мне хотелось помочь человеку в работе с СК или это оффтоп?

Автор: Dimi7777, Отправлено:16:24 16-04-2023


Цитата:
Благодаря asku выяснилось (спасибо ему за плотное тестирование!), что в функционале изменения ocr-текста и find/replace все-таки остались какие-то баги, хотя мне казалось, что я там все отловил. Поэтому лучше этими возможностями пока не пользоваться.
К сожалению, из-за большой загруженности я сейчас не могу заниматься СК, смогу вернуться к нему не раньше осени.


в версии 6.9 заметил баг (или я что-то не настроил неправильно? но ничего не менял в настройках)

Когда создал зону ч/б (внизу страницы), и обработал страницу - всё нормально.
Потом поменял параметры зоны и сделал "репроцесс" - зона съезжает со своего места вниз до края страницы и центрируется по горизонтали
(Настройки программы не менялись с версии 6.83)

А если зона была вверху страницы, то после репроцесса вообще пропадает!

Ошибка наблюдается при репроцессе как из главного окна, так и из окна результата.

p.s. На первом скане задания такого не наблюдается, только на 2-м и последующих

p.p.s. Не наблюдал ли кто чего-то похожего?

Автор: Benoni, Отправлено:20:16 16-04-2023


Цитата:
зона съезжает со своего места вниз до края страницы и центрируется по горизонтали

Вы финализацию после репроцесса случайно не делаете?

Автор: Dimi7777, Отправлено:21:50 16-04-2023



Цитата:
Вы финализацию после репроцесса случайно не делаете?

нет, это уже на финализированных страницах

Автор: bolega, Отправлено:22:38 16-04-2023

Dimi7777

Цитата:
На первом скане задания такого не наблюдается, только на 2-м и последующих

Причина стала понятна. Серьезный баг. Возможно повреждение задания и spt-файла - мусор вместо координат переобработанных зон.
Новой версией лучше не пользоваться!
Ссылку на новый СК удалил

Автор: SVK2I, Отправлено:15:52 17-04-2023

Dimi7777

Цитата:
Потом поменял параметры зоны и сделал "репроцесс" - зона съезжает со своего места вниз до края страницы и центрируется по горизонтали
(Настройки программы не менялись с версии 6.83)

Поработал на 6.9 с ч/б зонами и так и сяк, изменял их в picture zone и другие зоны, потом обратно, и ничего не съехало. А строго говоря, о каком репроцессе может идти речь для ч/б зон? Конечно, если Вы использовали ini-файл от предыдущей версии, сменив ему только название на 6.9, то, естественно, будут всякие «чудеса». Я раньше так делал, чтобы не настраивать программу заново, так у меня в итоге такое получалось, что теперь я каждую новую версию настраиваю заново и никаких глюков не бывает. Если я не прав, то пусть кто-то пояснит.

Добавлено:
daa2013

Цитата:
Да, я тоже повеселился. Мог и ответ "в интернете" получить.
 Но я нагуглил:
 Ссылка на страницу 20
 https://books.google.ru/books?id=wRPtCgAAQBAJ

Но по этим ссылкам скачать книгу для обработки в СК не получится, эти книги можно только купить в бумажном варианте, а затем сканировать самому... Разве это будет делать кто-то?

Автор: Dimi7777, Отправлено:19:01 17-04-2023


Цитата:
Поработал на 6.9 с ч/б зонами и так и сяк, изменял их в picture zone и другие зоны, потом обратно, и ничего не съехало. А строго говоря, о каком репроцессе может идти речь для ч/б зон? Конечно, если Вы использовали ini-файл от предыдущей версии, сменив ему только название на 6.9, то, естественно, будут всякие «чудеса». Я раньше так делал, чтобы не настраивать программу заново, так у меня в итоге такое получалось, что теперь я каждую новую версию настраиваю заново и никаких глюков не бывает. Если я не прав, то пусть кто-то пояснит.

Нет, не только с ч/б, но и с другими зонами.
ini файл был новый, баг все равно есть. Но он есть не везде и не всегда (возможно, даже зависит от операционки, может быть на разных по-разному)
+См. ответ bolega выше.

Автор: bolega, Отправлено:19:20 17-04-2023

Баг проявляется только если задано использовать при обработке более одного ядра процессора. Если используется одно ядро, или обрабатывается одна страница, то все ОК.

Автор: SVK2I, Отправлено:20:55 17-04-2023

bolega

Цитата:
Баг проявляется только если задано использовать при обработке более одного ядра процессора. Если используется одно ядро, или обрабатывается одна страница, то все ОК.

Дело в том, что у меня 2-х ядерный процессор, и я всегда на СК во всех версиях задействую все ядра. А как же иначе? Зачем обделять себя в этой прекрасной программе в мощностях? И все всегда отлично, за исключением тех багов, которые документированы у других и признаны автором программы. Правда, операционка у меня Windows 7, может быть она счастливая?

Автор: Dimi7777, Отправлено:21:10 17-04-2023


Цитата:
Баг проявляется только если задано использовать при обработке более одного ядра процессора. Если используется одно ядро, или обрабатывается одна страница, то все ОК.

У меня Вин-10, и 12-ядерный процессор, по умолчанию было включено 1 ядро, но баг есть все равно

Автор: daa2013, Отправлено:05:42 18-04-2023


Цитата:
Но по этим ссылкам скачать книгу для обработки в СК не получится, эти книги можно только купить в бумажном варианте, а затем сканировать самому... Разве это будет делать кто-то?


с архив-орга можно скачать и нормально сделать.
много раз в соседней ветке объяснялось, как именно

Автор: SVK2I, Отправлено:09:00 18-04-2023

daa2013

Цитата:
с архив-орга   можно скачать  и нормально сделать.
много раз в соседней ветке объяснялось, как именно

Я на этом форуме впервые, и не очень разбираюсь что такое ветка и где ее искать по-соседству. Не могли бы Вы просто указать ссылку, чтобы можно было почитать как такие книги скачивать и тому подобное.


Добавлено:
Dimi7777

Цитата:
У меня Вин-10, и 12-ядерный процессор, по умолчанию было включено 1 ядро, но баг есть все равно

Что-то не совсем понятно из Вашего отредактированного комментария: сколько же на самом деле на Вашем компьютере ядер в процессоре? Сначала Вы написали, что у Вас всего 6 ядер, а потом исправили на 12 ядер, а может быть у Вас 24 ядра, вот Вы и паритесь с ними?


Добавлено:
bolega

Цитата:
Баг проявляется только если задано использовать при обработке более одного ядра процессора. Если используется одно ядро, или обрабатывается одна страница, то все ОК.

На 6.9 я провел тестирование процесса на 1 и 2-х ядрах нескольких страниц. По времени разницы никакой. Стабильность работы одинакова была в обоих случаях. Но, фактически, загруженность была в обоих случаях только одного ядра. Так зачем нужна опция с выбором количества ядер?

Автор: Dimi7777, Отправлено:12:54 18-04-2023


Цитата:
Что-то не совсем понятно из Вашего отредактированного комментария: сколько же на самом деле на Вашем компьютере ядер в процессоре? Сначала Вы написали, что у Вас всего 6 ядер, а потом исправили на 12 ядер, а может быть у Вас 24 ядра, вот Вы и паритесь с ними?

Уточнил, 12. Но мне кажется, проблема не только в этом. По скорости обработки разницы между 1 и 12 не увидел, может, это только для каких-то спецрежимов?

Автор: asku, Отправлено:13:25 18-04-2023

bolega, можно ли задать горячую клавишу для режима марашек?


Автор: SVK2I, Отправлено:14:23 18-04-2023

Dimi7777

Цитата:
По скорости обработки разницы между 1 и 12 не увидел, может, это только для каких-то спецрежимов?

Только программисты при создании программ могут установить возможность задействования нескольких ядер, и тогда предусматривается возможность переключения их количества. В СК - переключение есть, а задействования нет, это и вызывает вопросы к автору, если он захочет ответить!

Автор: shch_vg, Отправлено:14:44 18-04-2023

Dimi7777
SVK2I
Не могу говорить за все варианты обработки, но точно знаю, что при включении всех 6 ядер (мой вариант) процесс обработки сканов идет заметно быстрее, что можно заметить по информации, сообщаемой СК. Количество необработанных сканов сразу уменьшается на 6 сканов за одну замену информации, да и визуально это гораздо быстрее, чем при работе одного ядра.

Автор: daa2013, Отправлено:19:10 18-04-2023


Цитата:
е могли бы Вы просто указать ссылку, чтобы можно было почитать как такие книги скачивать и тому подобное.

где-то внутри ветки "Электронные книги: сканирование, обработка, сборка",
ищите в режиме "Версия для печати"

Автор: SVK2I, Отправлено:19:28 18-04-2023

shch_vg

Цитата:
но точно знаю, что при включении всех 6 ядер (мой вариант) процесс обработки сканов идет заметно быстрее...

Провел повторное тестирование СК 6.9 на ядра. Лично я при проверке работы одного или 2-х ядер, запускал секундомер, а также диспетчер задач, отлично показывающий загрузку всех имеющихся ядер. Я проводил тестирование на цветной книге про грибы, изобилующей картинками с выделенными picture zones. Предыдущее тестирование было ошибочным потому, что оказывается, чтобы реально происходило переключение количества ядер, следует после каждого переключения производить перезагрузку программы, тогда переключение вступает в силу. Я этого прошлый раз не делал, потому и получил ложный результат. Сегодня результат таков: на одном ядре – время процесса 3 мин. 41 сек.; на двух ядрах – 2 мин. 1 сек., загружаются одинаково оба ядра на все 100. Качество результата одинаково отличное, никакие зоны не съезжают! Нравится опция thining!

Автор: SVK2I, Отправлено:09:04 19-04-2023

bolega
Я с интересом ознакомился с Вашим примером по ссылке https://disk.yandex.ru/d/6sHsHNBu3A6R5T
И вот что забавно. В описании Вы рекомендуете, что исходит их общих принципов, выставлять DPI выходного файла 600. Вместе с тем, в настройках Вашего задания выбран DPI «Twice greater», что означает «Вдвое больше». Поясните, пожалуйста, почему фактически Вы выбрали именно эту опцию? Может быть, ее и надо выбирать во всех случаях, тогда при любом разрешении входного файла, на выходе получится файл с двойным разрешением, что и будет отвечать принципам работы программы на получение лучшего качества выходных файлов?
При работе с примером использовал СК 6.9, версия превосходная!

Автор: asku, Отправлено:10:25 19-04-2023

bolega



Вот здесь по умолчанию предлагаются три символа.
А можно ли как-то этот список расширить под себя?
Искал в файле sk_templates.txt и не нашел.

Автор: SVK2I, Отправлено:11:09 19-04-2023

Мне очень понравилось делать PDF через СК 6.9, усвоил, чтобы итог был минимальный по размеру, соединять картинки с текстом не следует (Merge zones), только финализацию, но я никак не могу понять, как при этом присоединить ОСR слой? Какого формата должен быть этот слой и как подставить его потом в СК при создании PDF в out-task? Можно ли OCR создавать FR 8 и как потом результат извлечь для вставления в СК при создании PDF? В известной Хрестоматии ответа не нашел, там вовсе нет про создание PDF, а только про DjVu. Заранее благодарю тех, кто подскажет.

Автор: TelecomUral, Отправлено:11:51 19-04-2023


Цитата:
SVK2I
Какого формата должен быть этот слой и как подставить его потом в СК при создании PDF в out-task?

в шапке есть.

Автор: SVK2I, Отправлено:11:54 19-04-2023

TelecomUral

Цитата:
в шапке есть.

Благодарю, удивительно, сколько открываю страничку, а этого и не заметил. Буду изучать...
Внимательно прочитал все, что было по ссылкам даже, прочитал комментарии к ним, в итоге получилось, что вся эта информация мертвая!
Вопрос стоит проще: создать OCR в DjVu - не проблема, особенно, если создавал DjVu сторонней программой, да и через SK - все едино. Также легко извлечь OCR из DjVu (он извлекается как текстовый файл). Но кто-нибудь может подсказать, как этот текстовый файл вставить в PDF, создаваемый через SK, не используя тессеракт, подключенный к SK?

Добавлено:
Уважаемый bolega,
хорошо бы Вам предусмотреть возможность подстановки текстового слоя OCR, полученного иными программами, в создаваемый PDF через SK, как это сделал болгарин в известной программе DjvuOCR.
Тессеракт ошибается больше, чем FR 8, а Вы, по сути, привязали пользователей Вашей программы именно к Тессеракту.

Добавлено:
При попытке осуществить OCR на задании example от bolega выдается сообщение об ошибке: Access violation at address 0637A3AF in module 'ocr2.dll'. Read of address 00000000 File 1: 0001.tif

Автор: TelecomUral, Отправлено:13:28 19-04-2023

SVK2I
шапку надо изучать внимательнее. в разделе работа с автоглифами описано, как использовать FR.

Автор: SVK2I, Отправлено:17:49 19-04-2023

TelecomUral

Цитата:
шапку надо изучать внимательнее. в разделе работа с автоглифами описано, как использовать FR.

Не знаю как Вы, но если я буду все читать в шапке, которая стала как романы Толстого Л.Н., мне некогда будет заниматься иными, более важными делами. Так что уж простите, что спрашиваю, и благодарю за подсказки, это очень трогательно для меня.
Прочитал, и признаюсь, мало что понял. Не указано в какой версии FR создавать проект распознавания, зачем, если распознает страницы FR, надо в окне MW на закладке page -> кнопка special -> закладка More2 включить язык/языки распознавания (русский или русский+английский для всех страниц). Прошел все инструкции, но так и ничего не вышло. Пока СК будет для меня создавать PDF без OCR.

Автор: TelecomUral, Отправлено:18:10 19-04-2023

оффтоп

SVK2I
В справочном текстовом массиве не следует читать всё подряд, нужно искать специфические ключевые слова. В вашем случае FR|ФР|файн|fine.

Автор: SVK2I, Отправлено:18:32 19-04-2023

TelecomUral
Спасибо, но я всегда читаю все, чтобы ничего не пропустить, тогда выходит толк.

Автор: SVK2I, Отправлено:11:42 20-04-2023

Уважаемые Мемберы (золотые, серебряные, продвинутые и прочие со знаниями)!
Требуется Ваша простая, доступная помощь.
Создал в SK 6.9 задание книги с грибами, до финализации проверил положение, отредактировал картинки, после чего все финализировал, но Merge zones не делал. В итоге в папке out получил странички без картинок и отдельно картинки.
Затем создал проект в FR12, сохранил его, и после этого вставил странички без картинок в этот проект. Распознал все отлично, закрыл проект. В папку data, сохраненного проекта, поместил ParserFR12.exe, кликнул на него, после чего получил отличный файл result.bookmarks очень похожий на текстовый файл OCR, получаемый с помощью программы болгарина DjvuOCR.
Вот теперь, пожалуйста, подскажите, куда надо этот файл result.bookmarks помещать в программе SK 6.9 при создании с ее помощью PDF? И какие надо еще делать настройки, чтобы этот текстовый слой подключился при создании PDF?

Автор: TelecomUral, Отправлено:12:45 20-04-2023

SVK2I
результат
https://disk.yandex.ru/i/chCdDDwjMVoXDA
Всё делал строго по инструкции в шапке.

Автор: SVK2I, Отправлено:14:03 20-04-2023

TelecomUral

Цитата:
Всё делал строго по инструкции в шапке.

Результат отличный. Но, опять же, дайте конкретную ссылку на инструкцию, которой пользовались, ну не нашел я того, что мне понятно...
И еще, чем Вы распознавали: FR12 или Тессерактом?
Если распознавание было Тессерактом, то это не то, что нужно, во всяком случае мне.

Автор: TelecomUral, Отправлено:14:22 20-04-2023

SVK2I
не вижу ничего отличного, но дело ваше. Я бы поизвращался с распознаванием текста в зонах. Второй путь со слиянием зон бы делал, но ФР не распознает - кажется - цветной текст/текст на цветном фоне.

Итого рецепт, как копипаст из шапки с коррекцией по месту:
...
3. В подпапке data этого проекта запустить парсер (применил ФР15 portable), получить файл result.bookmarks
4. Поместить его в подпапку out\ocr проекта СК
5. В окне MW на закладке page -> кнопка special -> закладка More2 включить язык/языки распознавания
(например русский или русский+английский для всех страниц)
"На все страницы" параметр распространяется кликом ПКМ в ячейке и выбором Apply option to all marked. Либо, когда щелкаете первый раз галочку языка, удерживайте Ctrl.

* в меню File/Options СК на закладке Misc выбрать режим "OCR Mode" = "FR"

11. В окне MW из меню запустить команду Result -> OCR Output files -> All. Отсмотреть результат распознавания в окне VR. Чисто глазами убедиться что и на первой и на последней страницах текст совпадает с графикой.
...
11'. File > Create out task. Выбрать для версии 6.9 галочку "Set output format to PDF".
12. в out-task на закладке Files задаем имя выходного PDF - PDF Name : myfirstOCR (или имя какое придумаем) .
13. так же в вкладке Files задаем Output format : PDF проверяем эту установку формата если нельзя вписать имя файла PDF
14. в вкладке PDF отмечаем обязательно галочку Add OCR проверяем её автовключение
15. Сохраняем task (не проверял есть ли автосохран)
16. Жмем уже "главную кнопку" в верхней морде "Process!"
и смотрим результат.

UPD
есть нюанс с jpeg2000 зон в PDF: потребуется kakadu. При проверке настроек перед кодированием выяснилось что у меня в out-task сжатие зон PDF в jpeg2000 было установлено, и я переключил на голый jpeg.

Автор: SVK2I, Отправлено:14:35 20-04-2023

TelecomUral

Цитата:
получить файл result.bookmarks, поместить его в подпапку out\ocr  проекта СК


Это уже толково. Но вопрос: когда я создавал задание с грибами и затем все бинаризировал, то в папке out я не нашел подпапки ocr? Ее нужно самому создать?

Автор: TelecomUral, Отправлено:14:38 20-04-2023


Цитата:
SVK2I
Ее нужно самому создать?

угу

Автор: SVK2I, Отправлено:16:19 20-04-2023

TelecomUral
Знаете, принцип я понял, но при проведении команды Result -> OCR Output files -> All, стала выдаваться ошибка "Some files were not OCRed because they are not b/w, blank or not exists", хотя я загоняю в FR12 только BW тиффы. Не могу понять, в чем дело...
А объяснили Вы очень доходчиво, просто прелесть, из Вас отличный преподаватель вышел. Благодарю


Автор: TelecomUral, Отправлено:16:29 20-04-2023


Цитата:
SVK2I
стала выдаваться ошибка ... blank ...

первая страница в субтаске - чистая, blank. На неё и ФР ругался.

Автор: SVK2I, Отправлено:16:58 20-04-2023

TelecomUral
Дело в том, что ругается не FR, а SK. FR отлично и спокойно все распознал и ему безразлично какие страницы пустые или с текстом, картинками... В этом его и прелесть. Дело в том, что болгарская программа построена на распознавании именно FR и его результат отлично вставляет в DjVu с идеальной точностью, даже если пустые или цветные. А здесь такие сложности...

Добавлено:
TelecomUral
Вообщем, получилось, но в итоге 5 страница осталась нераспознанной...
Но принцип понятен, и, как говорится, процесс пошел...
Еще раз благодарю Вас и дай Аллах Вам здоровья, Ваши инструкции сохраню, потому что они очень понятны!
И еще, все получилось на 6.9, на 6.8 - мрак, не знаю почему!

Автор: TelecomUral, Отправлено:18:47 20-04-2023

графический хелп по вставке ocr



https://disk.yandex.ru/i/9Xl4SKrfJ3E_uA если сервер с картинкой умрёт.

bolega
прошу сделать в визарде дежавю параметр "при вставке слоя ocr добавить к имени суффикс", можно _ocr. А то ведь ни черта не определишь - вставлен невидимый слой в файл, или не вставлен. Естественно, исходник при этом пусть останется нетронутым.

Автор: SVK2I, Отправлено:20:17 20-04-2023

TelecomUral
За картиночку особенная благодарность... Попробую прогнать её через SK, предварительно разбив каждый пункт на отдельную картинку, потом выложу, а Вы уж перебросите туда, где будет лежать в шапке.
Но есть вопрос: если прогнали файлы для OCR в FR, а там уже языки распознавания установлены, и затем используем результирующий файл в SK, зачем после этого надо еще выставлять языки распознавания в SK, если Тессеракт использовать не будем?

Добавлено:
TelecomUral
В знак благодарности сделал вам всем из картинки Инструкцию в PDF-файле. Инструкция просто чудо и всё понятно, думаю многие поймут. Ещё раз благодарю Аллах Величайшего перед Вами и Вас всех за огромную помощь, проблем теперь у меня нет с созданием OCR в SK через FR.
Качать отсюда: https://disk.yandex.ru/i/m-xTY4KOjsJYhA
Но перезалейте на другой обменник, у меня уже заканчивается место, могу его удалить.
Версия SK 6.9 работает безупречно, зря удалили ссылку!

Автор: SVK2I, Отправлено:11:11 21-04-2023

Сделал более качественный вариант прекрасной инструкции "Как создавать OCR слой в PDF (и в DJVU) с помощью СканКромсатора", единственно понятной из всех, что мне приходилось читать на этом форуме: https://disk.yandex.ru/i/m-xTY4KOjsJYhA

Автор: bolega, Отправлено:11:27 21-04-2023

SVK2I

Цитата:
стала выдаваться ошибка "Some files were not OCRed because they are not b/w, blank or not exists",

Это не ошибка, а всего лишь предупреждение.


Цитата:
зачем после этого надо еще выставлять языки распознавания в SK, если Тессеракт использовать не будем?

Для FR действительно можно не задавать, но в СК предусмотрена еще возможность проводить проверку орфографии с использованием hunspell (команда Doubtfull words на закладке OCR>Words окошка Image adjustments). Без указания языков такая проверка невозможна

В предоставленном примере часть грибов повреждена (выбелена) магической чисткой; как от этого защищаться, я показывал в ролике про обработку зон.

TelecomUral

Цитата:
графический хелп по вставке ocr

Туда бы еще маленький скриншотик Reports после ocr, чтобы знать где увидеть более подробный результат процесса распознавания


Цитата:
прошу сделать в визарде дежавю параметр "при вставке слоя ocr добавить к имени суффикс", можно _ocr

Лучше "(T)". Сделаю.
В принципе можно еще сделать, чтобы СК по команде копировал утилиту NME в папку проекта FR (запрос папки - через диалог), запускал ее и результат помещал в out\ocr.


Добавлено:
И еще дополнение к фразе "крайне не рекомендуется править орфографию в FR". Это так, и к тому же абсолютно бессмысленно: утилита NME не умеет извлекать исправленный текст, т.к. он хранится отдельно от первоначально распознанного.

Добавлено:
Еще дополнение: после OCR с помощью функционала СК Find/Replace желательно найти все дефисы-переносы (см. whatsnew) и заменить их на мягкий перенос (в понимании FR). В большинстве случаев FR сам переносы детектирует и расставляет, но не всегда. Наличие мягкого переноса (а не просто дефиса) гарантирует, что слова с переносом будут правильно искаться, что в pdf, что в djvu.

Автор: SVK2I, Отправлено:12:04 21-04-2023

Уважаемый bolega!
Благодарю, теперь все понятно, процесс создания OCR в SK с помощью FR освоил успешно, стало всё получаться, теперь я доволен, хвала для Аллаха Величайшего за всех вас! Доброго здоровья и долгих лет жизни да даст Он вам! Буду ждать новой версии SK, тогда, возможно, снова засыплю вас всех вопросами.

Автор: NME, Отправлено:13:49 21-04-2023

bolega

Цитата:
копировал утилиту NME в папку проекта FR

не обязательно, парсеру достаточно путь до папки указать

Код:
ParserFR12.exe "D:\My Folder\data"

мне кажется удобнее будет сделать сделать команду что-то типа "добавить фр-ocr", по ней юзер должен будет указать только папку с проектом фр, а ск сам запустит парсер, дождется появления файла результ и скопирует что надо куда надо..

Автор: TelecomUral, Отправлено:16:19 21-04-2023


Цитата:
bolega
Лучше "(T)". Сделаю.

в ini ещё лучше.

Как я понимаю, парсер структуру документа не расчухивает? Абзацы, таблицы...


Цитата:
Туда бы еще маленький скриншотик Reports после ocr

добавлю.

Автор: Dimi7777, Отправлено:17:51 21-04-2023


Цитата:
Версия SK 6.9 работает безупречно, зря удалили ссылку!

Нет, не зря, с WIN10 (и может еще при каких-то условиях) работало небезупречно,
а за Вас рад, что у Вас на семерке работает прекрасно,
но я жду новой версии, а пока вернулся на 6.83

Автор: Dimi7777, Отправлено:07:09 22-04-2023

bolega
+
Вот еще заметил в версии 6.9 (баг/не баг?):
когда в режиме удаления мусора с зажатой ЛКМ выделяешь какую-то область, раньше просто удалялся мусор в выделенной области (или вообще всё, если режим полной очистки), а в 6.9 появляются еще настраиваемые границы выделения (стрелки). Это очень неудобно и сильно мешает. Возможно ли отключение где-нибудь в опциях такого режима, чтобы было как раньше?

Автор: bolega, Отправлено:09:54 22-04-2023

Dimi7777
Что есть стрелки?
Если вы про грипы, то в они появляются только если режимы чистки не активны. В режимах mouse-up-чистки никаких стрелок нет, не придумывайте.

Автор: Dimi7777, Отправлено:10:12 22-04-2023


Цитата:
Что есть стрелки?
Если вы про грипы, то в они появляются только если режимы чистки не активны. В режимах mouse-up-чистки никаких стрелок нет, не придумывайте.


что штриховая рамка не пропадает, когда отпускаю ЛКМ после завершения чистки

update

Я выделяю мышью участок для стирания, отпускаю ЛКМ, а внизу выделенного и очищенного участка справа остается двусторонняя стрелочка . Она мешает. Раньше такого не было



Автор: bolega, Отправлено:10:23 22-04-2023


Цитата:
что штриховая рамка не пропадает, когда отпускаю ЛКМ после завершения чистки

не могу такое воспроизвести. Как и раньше, в момент отпускания клавиши штриховая рамка исчезает

Автор: Dimi7777, Отправлено:10:30 22-04-2023


Цитата:
не могу такое воспроизвести. Как и раньше, в момент отпускания клавиши штриховая рамка исчезает

Да, рамка-то исчезает, а стрелка остается в нижнем правом углу выделения, пока не щелкнешь. Из-за этого приходится тратить время на лишние щелчки, чтобы ее убрать. а потом продолжить чистку.
Вы сравните, как было в 6.83 и 6.9: в 6.83 никаких стрелочек не оставалось


add:
Я бы не писал про это, если б не мешало, а так, когда приходится чистить много мусора, сразу же на это наткнулся, и оно замедляет работу...

Автор: bolega, Отправлено:10:38 22-04-2023

Ага, воспроизвел, появляется только когда красная линия.
Спасибо

Автор: SVK2I, Отправлено:10:49 22-04-2023

Dimi7777

Цитата:
Нет, не зря, с WIN10 (и может еще при каких-то условиях)  работало небезупречно,  
а за Вас рад, что у Вас на семерке работает прекрасно,  
но я жду новой версии, а пока вернулся на 6.83

Тогда почему Вашей любимой 6.83 нет в шапке странички форума для скачивания, а есть только 6.8?
Что-то какая-то мутная вода у вас всех относительно 6.9 и 6.83 – обе версии отсутствуют в шапке для скачивания… Тем более, когда будет новая версия? Кстати, не дадите ссылочку на версию 6.83, буду благодарен Вам за неё, хочу тоже попробовать на ней поработать...

Автор: Dimi7777, Отправлено:12:15 22-04-2023


Цитата:
Кстати, не дадите ссылочку на версию 6.83, буду благодарен Вам за неё, хочу тоже попробовать на ней поработать...

Если только с разрешения автора, то без проблем
add: Почему 6.83 нет в шапке, я не знаю (по идее это та же 6.8 с устраненными багами)

Автор: SVK2I, Отправлено:12:53 22-04-2023

Dimi7777

Цитата:
Если только с разрешения автора, то без проблем
add: Почему 6.83 нет в шапке, я не знаю (по идее это та же 6.8 с устраненными багами

А как получить разрешение автора, и если там устранены баги, то почему не выложить ссылку на эту версию вместо 6.8?
Иначе получается, что в шапке лежит версия с багами, а исправленный вариант раздается по блату...
Странное какое-то общество у вас получается...

Автор: TelecomUral, Отправлено:13:21 22-04-2023


Цитата:
А как получить разрешение автора

спросить, не?

Автор: SVK2I, Отправлено:14:00 22-04-2023

TelecomUral

Цитата:
спросить, не?

Конечно спросить, ведь Вы же даете ссылку, а я буду благодарить Аллаха Величайшего за вас обоих, а если выложите публично ссылку, то Аллах Величайший засчитает вам это в добродеяние обоим, потому что жадничать - это грех!

Автор: Dimi7777, Отправлено:14:22 22-04-2023


Цитата:
Странное какое-то общество у вас получается...

У кого "у вас" ? Мы же все здесь одно дело делаем, все в одном обществе.

Попросите здесь bolega напрямую скинуть Вам ссылку на нужную версию
или попросите выложить в шапку

Автор: SVK2I, Отправлено:14:32 22-04-2023

Dimi7777

Цитата:
У кого "у вас" ? мы все одно дело делаем, все в одном обществе.
Попросите здесь bolega напрямую скинуть Вам ссылку на нужную версию
или попросите выложить в шапку

Уважаемый автор прекраснейшей программы SK, bolega!
Прошу Вас ради славы Аллаха Величайшего, Который любит справедливость и доброхотность, дать мне ссылку на версию 6.83, являющуюся исправлением версии 6.8 по утверждению Мембера Dimi7777. А также, мне хотелось бы, опять же, ради славы нашего Единственного и Истинного Господина Аллаха Величайшего, устранить сложившийся моральный перекос в сторону блатного общества, нашего общества на данном сайте, – сделать доступными публике ссылки на версии 6.83 и 6.9, чтобы желающие могли бы быть также счастливыми, как счастливы мы с Dimi7777.
А то ведь многие, прочитав, как счастливы мы с Dimi7777 от этих двух версий, по Вашей вине не смогут обрести довольство, а это - грех, который ложится на Вас, поскольку ссылками владеете Вы!

Автор: bolega, Отправлено:14:47 22-04-2023

Поясню: было много промежуточных версий, они раздавались исключительно в целях бета-тестирования, без широкой огласки, во избежание широкого распространения сырых версий. Возможно даже, что разные версии выдавались разным пользователям, т.к. разные люди тестировали разные аспекты. Обсуждать сейчас эти временные версии, и тем более раздавать их считаю некорректным, Dimi7777. Временные версии плохи еще тем, что нет гарантии, что формат файлов (spt, skgli, и т.п.) будет полностью совместим с окончательными релизами. Т.е. файлы могут просто не открыться как надо, увы, это минус бета-тестирования. В публичных же версиях я обеспечиваю совместимость форматов, причем в обе стороны.
Критические баги, из-за которых я удалил новую версию, будут в ближайшее время исправлены, новая версия будет обновлена и опубликована, думаю, уже завтра.
Останутся баги, о которых говорил asku, там все сложнее, я даже не знаю до сих пор их причины. Нужно гораздо больше времени на изучение, у меня его сейчас не хватает. Баги не критические, ничего вроде принципиально не портят, просто затрудняют использование результатов поиска.


Автор: Benoni, Отправлено:14:54 22-04-2023


Цитата:
Критические баги, из-за которых я удалил новую версию, будут в ближайшее время исправлены, новая версия будет обновлена и опубликована.

Большое спасибо!

Автор: Dimi7777, Отправлено:15:10 22-04-2023

bolega

Цитата:
Обсуждать сейчас эти временные версии, и тем более раздавать их считаю некорректным, Dimi7777

Вас понял, ничего не раздавал и не раздаю. Просто мне казалось, что 6.83 уже была не временной, поэтому и упомянул её в обсуждении, извините

Автор: SVK2I, Отправлено:15:13 22-04-2023

Только Аллах Величайший знает истину и Он дает всем справедливый расчет. Да и что плохого в том, что промежуточные версии будут выложены? Даже в таких версиях, на определенных системах, может быть старых, люди найдут для себя счастье. А так получается, что автор решает за пользователей как им быть счастливыми. Ни что не напоминает вам это? Однако, автором дано обещание на то, что уже завтра будет новая версия, ин шэ Аллаh! Ради славы Аллаха Величайшего будем ждать завтрашнего дня! Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!

Автор: asku, Отправлено:16:04 22-04-2023

bolega
Добрый день. Я все еще работаю в последней (6.9) версии. Есть трудности. Возможно я что-то не так делаю.

Пробую внедрить текстовый слой в дежавю прямо в СканКромсаторе.
Все страницы в проекте внедряются, кроме предпоследней.
Вот тест с несколькими последними страницами проекта (в том числе с той, что не хочет принимать OCR — она в тесте тоже предпоследняя).

Ссылка

Пытаюсь внедрить кнопками под кнопкой Add OCR (см. рис)



И кстати, не понимаю, что делает кнопка Create result djvu (справа от Add OCR). Она же все время неактивна.

Если я все правильно делаю, то сначала надо сделать в СК дежавю, а потом уже жать на Add OCR.

Автор: TelecomUral, Отправлено:16:18 22-04-2023


Цитата:
что делает кнопка Create result djvu

она собирает файлы step1-step3 в готовый джву. Вы же можете по отдельным шагам дежавюшку (пере)создавать. UPD Но - да, кнопка неактивна! Странно.

Добавлено:

Цитата:
Все страницы в проекте внедряются, кроме предпоследней.

поменяйте в первой строчке обратный слэш на двоеточие. Вероятно, djvused это посчитал за экранирование и у него крыша поехала.

Автор: shch_vg, Отправлено:17:59 22-04-2023

bolega
Хочу вернуться к более старым фичам программы.
Сейчас приходится много работать в окне результатов в режиме "Compare".
Предварительно файлы пикчер-зон шахматных диаграмм заменяются на сделанные вне СК, т.е диаграмма слева представляют реальность из книги, диаграмма справа это та, которая должна ее заместить.
Теперь к сути просьбы.
Для удобства сравнения (а это очень важный момент для наиболее качественного проверки замены) левую и правую части приходится увеличивать в размере, чтобы диаграммы были как можно крупнее. При переходе на следующую страницу окно справа высвечивает страницу в том положении, в котором находилась предшествующая, а окно слева, начиная с левого верхнего угла.
Нельзя ли синхронизировать эти два окна возможно по опции.
Здесь же возникает следующая просьба. Если предыдущая реализуема, то при большом увеличении (диаграмма на все соответствующее окно) после перехода на следующую страницу приходится искать ее по всей странице.
Здесь помогло бы наличие пиктограммок с зонами, как в режиме зонного просмотра, чтобы после нажатия на нее сразу устанавливались соответствующие диаграммы, либо при поиске диаграммы в следующем окне синхронизировать перемещение фрагмента страницы слева и справа.

Автор: asku, Отправлено:18:57 22-04-2023


Цитата:
поменяйте в первой строчке обратный слэш на двоеточие.

Не понял В первой строчке это где?!

Автор: TelecomUral, Отправлено:19:05 22-04-2023

asku
на проблемной странице, естественно.
Там ocr: ЧИНЫДЖЫ ИС\, а надо ЧИНЫДЖЫ ИС:

bolega
а там ошибка любопытно приехала из djvused, вопросиками в логе. Я едва догадался, где конкретно сбой.

Result djvu name: I:\scanshik10\obrabotka\ot\asku\djvu_ne_formir\Чехов_test\out\Чехов_testaaw.djvu
page 00001: 318 words, 44 lines
page 00002: 306 words, 44 lines
page 00003: 307 words, 44 lines
page 00004: 344 words, 44 lines
page 00005: 335 words, 44 lines
page 00006: 139 words, 19 lines
page 00007: 78 words, 12 lines
page 00008: 79 words, 17 lines

Add text to djvu... Failed.
Error exit code = 10
*** Syntax error in text data: missing parenthesis,
    near '????????.")'
*** (..\..\..\tools\djvused.cpp:385)

DjvuLibre version = "3.5.25.3+4.9"

Command line :C:\Program Files (x86)\DjVuZone\DjVuLibre\djvused.exe "I:\scanshik10\obrabotka\ot\asku\djvu_ne_formir\Чехов_test\out\Чехов_testaaw.djvu" -f "C:\Users\User\AppData\Local\Temp\skocr42EC820A.txt" -s

Это так djvused выдал? Около "missing parenthesis".

К слову, было бы неплохо для анализа сохранять этот txt, подаваемый в djvused. Я его в temp не обнаружил.

Автор: asku, Отправлено:21:35 22-04-2023

TelecomUral
исправил в OCR ЧИНЫДЖЫ ИС\ на ЧИНЫДЖЫ ИС:
Спасибо. Вот как вы это поняли (в чем возможная ошибка), я не понял.

Автор: TelecomUral, Отправлено:05:02 23-04-2023

[more=оффтоп про ошибку]
Цитата:
asku
Вот как вы это поняли (в чем возможная ошибка), я не понял.


Я довольно давно вожусь с компами, и хоть никогда не обучался специально, знаю, что в конечном счёте всё приходит к обработке списков и к машине Тьюринга. Почитайте в википедии, полезно понимать, откуда уши растут.
Когда я прочитал ошибку djvused, что он не сумел синтаксически разложить входной список команд, и ему не нравится скобка около какого-то слова, я чисто по опыту предположил, что где-то в тексте есть такой значок, который файнридер посчитал текстом, а djvused посчитал за спецсимвол форматирования списка. А чаще всего это или обратный косой слэш, или символ ESC (код 27, управляющие последовательности). Возможны квадратные скобки, фигурные, обычные и т.п., чего только программисты не напридумывали за полвека. Самое вероятное в нынешнее время - слэш, к тому же в хелпе на djvused есть упоминание про восьмиричное кодирование потока букв \nnn, вот я и стал на проблемной страничке искать спецзнаки. Экспортировал ocr в Блокнот, ну а там на 7й странице эта косая черта в глаза бросается. Понятное дело, что алгоритм разбора потока внутри djvused поймал этот слэш как начало спецформатирования, ну а дальше не нашёл предполагаемого продолжения числа "nnn", вот и ругнулся на синтаксис, добежав до другого ожидаемого спецзнака правая скобка ")". Типа "лажу гоните, не может быть правая скобка без левой" Это предположение, но хорошее. А дальше дело техники, отредактировал слово и запихал ocr заново. Даже из визарда не выходил, всё ж на лету отрабатывает.
То есть я просто ранее работал с djvused и знал, что именно он посчитает за форматные символы в потоке, backslash для кода и скобки для метаданных. Это, конечно, чисто опыт.
[/more]

Автор: Dimi7777, Отправлено:07:15 23-04-2023


вопрос снят
А нельзя ли сделать, чтобы при сохранении библиотеки (или листа) глифов запрашивалось имя для сохраняемого файла? Сейчас не спрашивает, просто сохраняет под дефолтным именем (именем таска).
И чтобы было предупреждении о существовании файла, если файл с таким именем уже есть.



Автор: TelecomUral, Отправлено:07:46 23-04-2023

Dimi7777
вроде бы не вся библиотека, а конкретный sheet сохраняется под выбираемым именем, то есть для будущего обмена. По ПКМ на поле листка с глифами. Это логично и удобно: набрали пачку алфавита одного начертания, экспортировали в специальный skgli для последующего импорта в другую библиотеку другой книги. То есть "библиотека" - это комплект для обработки книги, а "лист" - это группировка по начертанию и кеглю. Как касса у наборщика.

Единственное что - уж больно это всё трудоёмко Как-то прочитал что гарнитура энциклопедическая кудряшовская, для БСЭ-3, потребовала создания более 11 тысяч значков.

bolega
Не соображу про назначение и применение команд именования листов. Show library desc, show sheet desc. И особенно - зачем такой сложный редактор именований, если имена фиг увидишь, а sheet именуется просто ListN, ещё с плюсиками впереди, если импортирован. Навожу мышку на лист - и описание никак увидеть не могу. Точнее, могу изредка. Ни ЛКМ, ни ПКМ не помогают. Но вдруг - рраз, и второй лист обозначается всплывшей подсказкой. Первый - вообще никогда.

Автор: Dimi7777, Отправлено:07:54 23-04-2023


Цитата:
вроде бы не вся библиотека, а конкретный sheet сохраняется под выбираемым именем

а если надо всю библиотеку сохранить? есть такая возможность?
p.s. имя листа также не запрашивается, к сожалению (может в тестовой версии есть, не знаю, я её удалил)

Автор: TelecomUral, Отправлено:08:00 23-04-2023

Dimi7777

Цитата:
а если надо всю библиотеку сохранить?

скопируйте прямо на диске


Цитата:
имя листа также не запрашивается

запрашивается:





Это 6.9. Свежая же фича.

Автор: Dimi7777, Отправлено:08:03 23-04-2023

TelecomUral


Цитата:
Это 6.9. Свежая же фича.


Может быть, не успел посмотреть, она у меня сбоила (выше про баг было), стёр и вернулся пока к стабильной версии
Насчет "плюсиков" тоже не понял, почему такое обозначение ...

Автор: TelecomUral, Отправлено:08:08 23-04-2023

[more=Del]
Цитата:
Dimi7777
Насчет "плюсиков" тоже не понял


[/more]

Автор: TelecomUral, Отправлено:18:40 23-04-2023

bolega
Вы не думали каким-либо способом выделить кнопки, имеющие своё меню по ПКМ? Контуром на иконке, или ещё как-то сходно. Жёлтой точкой в уголочке Забывается whatsnew, а для поиска он не предназначен. Я читал про ctrl для выбора имени библиотеки глифов, но когда приспичило - забыл.

Автор: bolega, Отправлено:20:10 23-04-2023

TelecomUral

Цитата:
Вы не думали каким-либо способом выделить кнопки

Нет, кнопки - стандартные элементы, рисуются системой. Можно взять рисование их на себя, но это слишком сложно. В планы точно не входит. И ctrl ведь к ПКМ отношение не имеет.

Добавлено:

Цитата:
Не соображу про назначение и применение команд именования листов. Show library desc, show sheet desc. И особенно - зачем такой сложный редактор именований, если имена фиг увидишь, а sheet именуется просто ListN, ещё с плюсиками впереди, если импортирован. Навожу мышку на лист - и описание никак увидеть не могу.

Не вижу ничего сложного. Description - это из новой версии, позволяет создавать подробное описание библиотеки в html-стиле. А так достаточно задать только caption - оно же будет и именем закладки.

Добавлено:
Все серьезные баги исправил, но пока выкладывать новый СК не буду. Подожду еще пару дней, может что еще вылезет

Автор: TelecomUral, Отправлено:20:48 23-04-2023


Цитата:
И ctrl ведь к ПКМ отношение не имеет

да.
Я имел ввиду в целом - дополнительные возможности на элементах интерфейса, о которых не всегда упомнишь без визуальной напоминалки.


Цитата:
Можно взять рисование их на себя,

хм, а я считал, что это тупо "resource". И не проблема его внутри собственного проекта сохранить и передать винде для отрисовки на указанном месте. Неужели все-все кнопки вы нашли в стандартных дллках винды. Есть сильно специфичные.
Ладно, как-нибудь сделаю по whatsnew путеводитель.

Автор: bolega, Отправлено:20:52 23-04-2023


Цитата:
хм, а я считал, что это тупо "resource".

Картинка на кнопке - да, из ресурса. Но есть кнопки без картинок, значит, там только рисовать самому.

Добавлено:
shch_vg

Цитата:
Нельзя ли синхронизировать эти два окна возможно по опции.

Этот вопрос всплывает не первый раз. На текущий день у меня нет решения, которое бы позволило синхронить два изображения. Чтобы выполнить синхронизацию, надо иметь функцию, которая бы для заданной точки обработанного файла возвращала бы координаты на исходном скане, и наоборот. Сейчас такой функции в СК нет, теоретически такую информацию можно получить в процессе обработки, но после обработки она нигде в СК не сохраняется.

Автор: asku, Отправлено:21:05 23-04-2023

bolega

Добрый вечер.
Есть проект СК (в новой версии — 6.9.).
Добавил туда OCR. Потом мне нужно было добавить еще один скан в проект.
На списке сканов слева жму правой кнопкой мыши, выбираю пункт Add images... и добавляю тифку.
Обрабатываю ее, хочу добавить и на новые страницы OCR. Делаю в Файнридере 15, создаю парсером result-файл и копирую его в соответсвующую папку (Out/Ocr)/

Потом в СК: Меню Result — OCR output files... — Current (В гл. окне СК, естественно, открыта нужный разворот).
СК дает сообщение:



Даю тест-папку (с файлом result от парсера):
Ссылка

Этот test я взял из проекта, который я сделал специально поэкспериментировать над таким добавлением OCR.
Дело в том, что я несколько дней назад работал с одной книгой. Много времени чистил в OCR, почти неделю работал над проектом. Потом мне понадобилось добавить страницу (первоначально среди сканов не было титула).
В итоге... я уже сам не помню что там понажимал... СК перестал видеть OCR во всем проекте.
На СК не грешу — сам накосячил, видимо.

Автор: TelecomUral, Отправлено:21:22 23-04-2023


Цитата:
bolega
которая бы для заданной точки обработанного файла возвращала бы координаты на исходном скане, и наоборот

транзитная зона не поможет?

Добавлено:

Цитата:
есть кнопки без картинок

восклицательный знак ставить вначале текста на кнопке

Автор: bolega, Отправлено:21:57 23-04-2023

asku

Цитата:
Делаю в Файнридере 15

Делаете что? Все страницы по новой или только добавленную?

Цитата:
первоначально среди сканов не было титула

А при чем тут титул, если на вашем скриншоте явно не титул.
В общем, не понятно, чего вы добавляли и куда, и что из этого дораспознавали.

Добавлено:
TelecomUral

Цитата:
транзитная зона не поможет?

нет.
Надо дорабатывать функционал, хранить в spt больше информации, в т.ч. о трансформациях обработки.

Автор: asku, Отправлено:22:07 23-04-2023


Цитата:
только добавленную?

Только добавленную.


Цитата:
А при чем тут титул, если на вашем скриншоте явно не титул.

Здесь не титул. Это тест отдельного, «экспериментального» проекта.

Когда работал с проектом, где полетел OCR, титул добавлял.

А в тесте, который я в прошлом сообщении здесь показал, я добавил вторую страницу (scan071.tif).

Автор: shch_vg, Отправлено:22:30 23-04-2023

bolega

Цитата:
теоретически такую информацию можно получить в процессе обработки, но после обработки она нигде в СК не сохраняется.

А вариант с пиктограммами, как в режиме Zone, не прокатит?

Автор: bolega, Отправлено:22:36 23-04-2023


Цитата:
создаю парсером result-файл и копирую его в соответсвующую папку (Out/Ocr)/

а сколько страниц распознано в result-файле - одна-две?
а те файлы, что до этого лежали в Out/Ocr они там и остались, или исчезли?

Добавлено:
shch_vg
поясню на примере: от исходного скана отрезали резаком пусть сверху 50 и слева 70, затем развернули на 10 градусов, затем добавили поле 75 сверху и 10 отрезали слева. Чтобы перейти от точки обработанного скана к точке исходного скана, нужно все эти операции проделать в обратном порядке.

Автор: asku, Отправлено:22:46 23-04-2023

bolega

Цитата:
а сколько страниц распознано в result-файле - одна-две?

В result-файле один добавленный разворот (scan071.tif), то есть после обработки Сканкромсатором (и разделения разворота) страниц две.


Цитата:
а те файлы, что до этого лежали в Out/Ocr они там и остались, или исчезли?

Остались.

Автор: bolega, Отправлено:22:53 23-04-2023

Я попозже опишу как лучше поступать в таком случае

Автор: shch_vg, Отправлено:23:22 23-04-2023

bolega
А если добавить еще один режим, например, "Сравнение зон"? В правую часть выбирается зона по пиктограмме, как в режиме "Zones", а в левую та же зона, но только из исходного скана, естественно с выравниванием дпи и желательно на всю половину RV.

Автор: mvk2006, Отправлено:06:55 24-04-2023

SK6.9 - При масштабе текста в системе (Win7-64) 125% в окошке Change word не помещаются для отображения кнопки:


В 6.83 такого нет

Автор: TelecomUral, Отправлено:07:01 24-04-2023

подправил схемку вставки ocr.



https://disk.yandex.ru/i/zo0K4JIoJQnmaw



Цитата:
asku
Дело в том, что я несколько дней назад работал с одной книгой. Много времени чистил в OCR, почти неделю работал над проектом. Потом мне понадобилось добавить страницу (первоначально среди сканов не было титула).

Это дело известное. Надо заранее вставлять пустые листки на такой случай, листок же должен там быть. А если уж не вставил заранее, то после раздельной его обработки. Независимый djvu сделал, со слоем ocr, и потом скопировал в основную книгу.
Кстати, вероятно, это можно в визарде сделать. Наличие слоя не должно быть помехой.


bolega

И вот такой ещё вопрос насчёт подсказок на кнопки. Помнится, одно время в серьёзных программах существовал контекстный хелп: нажав кнопочку с пиктограммой "курсорная стрелка плюс вопросик" можно было затем щёлкнуть по элементу интерфейса и получить окошко с более-менее подробной справкой. Вероятно, это как-то на основе html или chm работало, чувствовался специфический дизайн окна. Нельзя ли нечто подобное сваять в СК? Причём - как вариант - чтоб юзер сам мог подправить этот хелп. Что-то такое было в начале нулевых годов в некоторых прогах, затем не стали делать. Навскидку это будет куда полезнее смены языка интерфейса.

Автор: bolega, Отправлено:08:25 24-04-2023

TelecomUral

Цитата:
Это дело известное. Надо заранее вставлять пустые листки на такой случай, листок же должен там быть.

Это правильный подход. Я например так и делаю. Но бывает, что и сам не заметишь отсутствие страниц, и обнаруживаешь это уже после ocr. На такой случай я и предусмотрел команду attach bookmarks. По сути эта команда превращает номера, которые присутствуют в имени файла bookmark и являющиеся порядковыми номерами обработанных страниц (с точностью до смещения) в уникальные идентификаторы, привязанные к выходным файлам. После этого можно спокойно вызывать команду ocr даже после тасования файлов задания. Но вот добавление дополнительных bookmark-файлов после этого становится неочевидной процедурой. Сейчас я решил этот процесс максимально упростить. Во-первых, команда attach bookmarks будет выполняться автоматически, во-вторых, добавку (или частичную замену уже имеющихся ocr) достаточно положить туда же, в имени первый символ "+", в первой строке номера, куда вставить (т.к. внутри файла bookmarks нумерация с 1).



Добавлено:

Цитата:
существовал контекстный хелп

Все визуальные элементы поддерживают его, имеют спец. поле, в котором по замыслу надо хранить уникальное число - идентификатор топика справки. Но я его для других целей использую ((
Да и создание html-справки это целое направление. Чур меня.

Автор: Benoni, Отправлено:15:50 24-04-2023

Я о версии 6.9.
В RV появляется стрелка <-->. Что она значит?
Мне кажется она мешает. Непревычно. Раньше такого не было.

Автор: SVK2I, Отправлено:17:16 24-04-2023


Автор: Dimi7777, Отправлено:17:37 24-04-2023

Benoni


Цитата:
Я о версии 6.9.
В RV появляется стрелка <-->. Что она значит?
Мне кажется она мешает. Непревычно. Раньше такого не было.

аналогично этому багу? :
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=3480#12
http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=3480#15

Автор: Benoni, Отправлено:18:12 24-04-2023

Dimi7777
да

Автор: TelecomUral, Отправлено:20:24 24-04-2023


Цитата:
bolega
в первой строке номера, куда вставить (т.к. внутри файла bookmarks нумерация с 1)

расшифруйте этот квест...

UPD
допустим, на примере asku с забытым титулом: что куда надо было скопировать, как проименовать.
Ещё лучше если пропущенные страницы идут парой-тройкой, и в паре мест книги. Типа, прислали десяток выдранных из разных мест листков.

Автор: bolega, Отправлено:14:38 26-04-2023

TelecomUral

Цитата:
расшифруйте

Это будет так.
Пусть изначально есть одиночные сканы 1-10, out-файлы 1..10, out-focr-файлы и к ним bookmarks: result00001...result00010. Т.е. out-файлу с номером X соответствует bookmark-файл с таким же номером. Предположим, что к сканам надо добавить два новых файла и поместить их после 1 и после 6 номера. СК при добавлении и вообще при любом тасовании исходных файлов автоматически переименовывает out- и focr-файлы. Если файлы добавляются не в конец списка, то в итоге окажется, что соответствие между номерами out и номерами bookmarks будет нарушено, и повторно выполнить корректно OCR уже будет нельзя. Поэтому первым делом перед добавлением новых сканов пользователю необходимо самостоятельно дать команду Attach bookmarks. Эта команда "привяжет" текущие имена bookmark-файлов к их out-файлам, так что дальнейшая реорганизация файлов в списке не нарушит соответствие между ними. Кстати, что делать, если файлы добавили, а привязать все-таки забыли? В нашем примере имена out станут 1..12, а имена bookmarks останутся прежними, и например, скану с новым номером 3 (прежний 2) будет соответствовать bookmark с номером 3 (вместо правильного 2). Чтобы это исправить, достаточно переместить все вновь добавленные файлы в конец списка (это восстановит правильное соответствие имен), дать команду Attach bookmarks и после этого вернуть новые сканы на свои правильные места.
Далее мы распознаем в FR (в новом проекте) только вновь добавленные out-файлы: с номерами 2 и 8. Получаем новый result.bookmarks, в котором файлы имеют номера 1 и 2. Теперь нам надо сообщить СК, чтобы он подтянул в задание дополнительные bookmarks так, чтобы 1-й файл из result.bookmarks привязался к файлу 2, а 2-й – к файлу 8. Имена их станут result00011.bookmarks и result00012.bookmarks. То, что имена не соответствуют порядку следования сканов уже не имеет значения, т.к. после команды Attach bookmarks СК выдерживает соответствие по именам bookmarks (они уникальны), а не по порядковому номеру.
Чтобы СК сделал все правильно, нужно открыть новый result.bookmarks в любом текстовом редакторе (с поддержкой UTF-8), вставить перед самой первой строчкой новую строку с таким содержанием:
2,8
Затем переименовать новый «result.bookmarks» в «+resultЧ.bookmarks», где Ч в имени – строка из любых допустимых символов любой длины, в том числе и нулевой.
Как и ранее, «+resultЧ.bookmarks» положить в папку out/ocr и в СК вызвать команду OCR (только для новых сканов! Например, выделив их красным и вызвав OCR selected), либо OCR для каждого файла по отдельности (например, прямо в окне VR), либо новую команду Update OCR, которая обработает все имеющиеся bookmark-файлы (их может быть и несколько), начинающиеся на «+». После переобработки СК переименует новые bookmark-файлы, добавив впереди знак подчеркивания.

Автор: TelecomUral, Отправлено:14:51 26-04-2023

bolega
спасибо, логика понятна.

Но зачем так усложнять. По-моему, можно сначала сработать с новыми файлами, разместив их в самом конце пакета сканов книги, а затем перенести их в нужное место. Я не представляю, как может появиться задачка с несколькими добавляемыми +resultЧ.bookmarks

Автор: bolega, Отправлено:15:25 26-04-2023


Цитата:
Но зачем так усложнять.

Опишите свою логику
Последовательность действий

Автор: TelecomUral, Отправлено:16:00 26-04-2023


Цитата:
Опишите свою логику
Последовательность действий

1. имеем финализированные страницы. Пропущен, условно, 2й и 7й файлы. Распознаем текст, делаем attach bookmarks.
2. добавляем пропущенные файлы в конец.
3. обрабатываем, финализируем, подаем готовые страницы в файнридер, парсером получаем result.bookmark.
4. переименовываем в +result.bookmarks
5. встаем в MV на первый добавленный файл, это будет маркер для СК. Вызываем ocr output files\All или current, главное, пусть СК считает что для файла с плюсиком первый номер это там, где текущий файл. (Или даже пусть автоматом считает, что добавлять после последнего со слоем. хотя это чревато для вклеек и обложек.)
6. распределяем страницы по нужным местам в книге, т.е. после 1го и после 6го.

Автор: bolega, Отправлено:17:05 26-04-2023


Цитата:
Вызываем ocr output files\All

Учтите, что такая команда приведет к полной замене ocr для всех файлов (если в out/ocr будут лежать предыдущие отдельные resultXXXXX.bookmarks). Если были изменения ocr-слоя, то они будут утеряны.

Автор: Wobal, Отправлено:17:05 26-04-2023

Здравствуйте, bolega!


Я бы хотел предложить вам обновить справку для программы ScanKromsator или создать централизованный гайд по ее использованию. Я думаю, что это могло бы значительно улучшить пользовательский опыт и помочь пользователям быстрее и легче разобраться с функционалом программы, без необходимости искать информацию в разных ветках форума.

Я понимаю, что создание гайда может занять время и усилия, поэтому если у вас есть возможность рассмотреть мое предложение, я был бы очень благодарен. В любом случае, спасибо за вашу работу над этой программой.

Автор: bolega, Отправлено:17:06 26-04-2023


Цитата:
пусть СК считает что для файла с плюсиком первый номер это там, где текущий файл. (Или даже пусть автоматом считает, что добавлять после последнего со слоем. хотя это чревато для вклеек и обложек.)

ну и чем это надуманное ограничение лучше моего, более универсального варианта?

Автор: TelecomUral, Отправлено:20:55 26-04-2023


Цитата:
ну и чем это надуманное ограничение лучше моего, более универсального варианта?

тем, что простому юзеру не надо ломать голову над вашим сложным описанием как заставить СК принять дополнительный ocr. Совсем не надо. Для юзера эти добавленные файлы выглядят как независимое задание. Обработал он это допзадание, а потом теми "блинчиками на тарелочки" файлы из буфера обмена раскидал на нужные места. Минимум знаний, заморочек и условностей.

Цитата:
Учтите, что такая команда приведет к полной замене ocr для всех файлов

пусть СК учитывает наличие файла с плюсом. Есть файл - значит режим не "переобновить всё", а "дополнить с текущего".

Автор: shch_vg, Отправлено:13:16 27-04-2023

bolega
В чем может быть причина?
Открываю в версии 6.8 черно-белый скан размером 252 КБ. Перехожу в режим Show source files, копирую сравнительно небольшую часть скана и получаю сообщение "Недостаточно памяти". То же наблюдается и в версии 5.94.
Ирфанвью без проблем копирует ту же область из того же скана.

Автор: daa2013, Отправлено:13:54 27-04-2023


Цитата:
bolega
В чем может быть причина?
Открываю в версии 6.8 черно-белый скан размером 252 КБ. Перехожу в режим Show source files, копирую сравнительно небольшую часть скана и получаю сообщение "Недостаточно памяти". То же наблюдается и в версии 5.94.
Ирфанвью без проблем копирует ту же область из того же скана.



см "окончательное решение" в шапке

Автор: shch_vg, Отправлено:16:18 27-04-2023

daa2013

А Вы прежде, чем писать свою реплику, не пытались на любом своем бинарнике в 600дпи размером 300кб проверить мою ситуацию? У меня не копируется уже зона порядка 3 на 3 см, причем даже пространство без какого-либо текста.

Разве из моего описания непонятно, что копируется только НЕБОЛЬШАЯ часть скана общей величиной 252 КБ? Не надо все доводить до абсурда. Мне не будут легче, если кто-нибудь радостно сообщит, что в моем задании такая выборка работает замечательно. Свою систему я все равно предоставить не могу, а оперативной памяти в ней выше крыши.
Я просто спросил у СОЗДАТЕЛЯ программы, что могло бы повлиять на такое поведение ее.

P.S. Подобные копирования в прошлом делал часто, но сталкивался с этим только на цветных сканах большого размера.

P.P.S. К вышесказанному могу лишь добавить, что выдается системная ошибка 1418

И еще доп.информация: Из шахматной диаграммы на странице позволяет копировать только поле не более 6 на 6 клеток. 7 на 7 уже дает сообщение о нехватке памяти (скан бинарный)

Тот же Ирфан легко копирует всю страницу целиком.

Автор: TelecomUral, Отправлено:17:00 27-04-2023

shch_vg
я не daa2013, но я попробовал

Цитата:
на любом своем бинарнике в 600дпи размером 300кб проверить мою ситуацию

- и у меня всё прекрасно работает. В 6.8. Результирующий файл:
https://disk.yandex.ru/i/WWcTUBA0MCeuSQ
как только не изгалялся, никаких проблем.


Автор: daa2013, Отправлено:19:12 27-04-2023

А мысль, что что-то не так с файлом вам в голову не приходила ?
Кривой тифф, ложное значение дпи или еще какого-то параметра внутри.

Попытка смасштабировать с 1 дпи до 600 дпи (когда реальные 600) легко вешает систему.
Возможно параллельно переконвертация из flate или еще чего-то такого идёт. Альфа-канал кривой. Вы же исходник открываете, а не результирующий файл СК.

Кто больше всех ратовал за "окончательное решение" (я даже не помню, чтобы bolega такие слова использовал), а теперь, как бы это сформулировать. Игнорирует.

Хочу заметить, что все так и постят без примеров, так как именно и ожидают ответа "что могло бы повлиять на такое поведение" СК. И вы в ту же степь.

Автор: TelecomUral, Отправлено:19:21 27-04-2023

продолжу после daa2013:
нехватка места на диске
файл с атрибутом readonly, равно как и параллельно открытый в другой проге
UPD
проблемы с правами на файлы и папки. далее оффтоп: мы тут на работе третьи сутки "развлекаемся" с ACL (access control lists) на unix-серверах. с NFS и пятью железяками. Я там таких чудес навидался и наслушался!

Автор: daa2013, Отправлено:19:21 27-04-2023

Заодно хочу заметить, что не так давно сталкивался с ситуацией, когда СК при импорте пдф генерировал не тиффы, а мульти-тиффы , т.е. вроде как кажется добавлял альфа канал, которого в изображениях изначально не было.

Я не стал разбираться, может всё и нормально и правильно. (Не писал, так как сначала хотел убедиться, кажется мне это или нет. Но раз уж зашло такое обсуждение.)
Но тиффы в результате импорта вот этого файла мне показались подозрительными. (Повторюсь, может, они и нормальные на самом деле.) PS: смотрел их через ACDSee и видел "лишний" слой.

https://disk.yandex.ru/i/TVeo9ErJssPmyg

Автор: bolega, Отправлено:19:26 27-04-2023

shch_vg

Цитата:
Перехожу в режим Show source files

Т.е. не копирует только в этом режиме?
Используете hotkey, КМ, или кнопку?
Выделение прямоугольное? А если полигональное, то такой же итог?
У вас вроде Windows 2003?
Исходник - TIF? Ирфан что показывает по формату файла, нет ли там альфа-слоя?

Автор: daa2013, Отправлено:19:38 27-04-2023


Цитата:
проблемы с правами на файлы и папки.


Кстати да.

У меня после восстановления системы из бэкапа половина прог выдаёт странности.
Например, тот же АСDSee не показывает картинки в ряде папок. В частности, внутри Program Files.

Так что как вариант, система не дает СК прав редактировать файлы в папке с исходниками.


PS
хотя нет маленький же участок копируется. Значит, что-то с разрешением ИМХО.

Автор: shch_vg, Отправлено:15:41 28-04-2023

bolega
Поскольку дело для меня становится все более мистическим, решил все-таки выложить саб-таск.
В архиве находятся три тифа: один - выложенный TelecomUral, второй (р_p0021.tif) был вытащен из дежавю в СК в сером, третий (00021.tif - главный подозреваемый ) получен из второго в Ирфане при переводе в бинарик.
Первый файл приведен как пример того, что у него и у третьего одинаковые параметры, если не считать размеров и компрессии.
Итак: любые манипуляции по копированию после перехода по Alt+S на первых двух сканах никаких вопросов не вызывают.
Мистика с третьим.
Перехожу в режим По высоте и копирую всю страницу по Ctrl+C, СК проглатывает, но в меню по ПКМ не подсвечивается Paste. Приложенный к архиву гиф показывает нехватку памяти при выделении только одной диаграммы.

P.S. Тот же результат и в режиме просмотра, проверял только на прямоугольной области, уже три года использую комп с 10-кой и 6-ядерным процессором. Грешил, что м.б. это эффект 6 ядер, но тот же результат и на одном ядре.

P.P.S. Реальный глюк (а м.б. фича?) в 6.8.
Просматриваю сканы в главном окне в режиме Fit width (у меня это 25,79), предварительно зафиксировав это.
Сохраняю задание и закрываю CК.
При следующем входе в это задание скан в главном окне открывается при 100.

Автор: TelecomUral, Отправлено:18:35 28-04-2023

shch_vg
у меня ваш файл 00021 проблем с копированием в буфер и вставкой не вызывает.

Доведите уж тему до конца: сделайте в ирфане из проблемного скана новый с компрессией как у моего файлика. Потестируйте его. И станет понятнее причина.

Автор: shch_vg, Отправлено:19:02 28-04-2023

TelecomUral

Цитата:
Доведите уж тему до конца: сделайте в ирфане из проблемного скана новый с компрессией как у моего файлика.

А смысл, если у Вас нет проблем?
Похоже проблема в системе.

P.S. Вы умеете в Ирфане менять компрессию? Я не нашел.

Автор: TelecomUral, Отправлено:05:42 29-04-2023


Цитата:
shch_vg
Вы умеете в Ирфане менять компрессию? Я не нашел.

save as... и появится опция, окошечко tiff save options

Добавлено:

Цитата:
Похоже проблема в системе

похоже? а вам вообще ответ на ваш первоначальный вопрос - нужен?

Автор: shch_vg, Отправлено:15:06 29-04-2023

TelecomUral
Имею подозрение, что в плане копирования СК не дружит с моей системой win10.

Перевел файл 00021.tif в несжатый и три варианта для ч/б: по Хоффману, Fax3 и Faх4.
Также перевел его в png и jpg и получил любопытные результаты.
При копировании всей страницы не дал ошибку ни один вариант, но кроме jpg, после которого страница скопировалась, в остальных вариантах Paste неактивно.
Окно о нехватке памяти при копировании большой диаграммы дали всё те же варианты, кроме jpg, в котором копируется.
Почему я считаю, что к этому причастно СК?
В Ирфане со всеми этими вариантами нет проблем при любом копировании.

Интересно, у кого-нибудь в вин10 наблюдается такая аномалия?

Автор: 1234olexiy, Отправлено:00:08 30-04-2023

Интересно а когда-нибудь в Кромсаторе появится функция автоматического выделения картинок. Очень бы выручало. Вот в Тейлоре есть, но он ужасно неудобный.
Кто-нибудь знает?

Автор: TelecomUral, Отправлено:09:00 30-04-2023


Цитата:
1234olexiy
Интересно а когда-нибудь в Кромсаторе появится функция автоматического выделения картинок. Очень бы выручало. Вот в Тейлоре есть, но он ужасно неудобный.
Кто-нибудь знает?


анамнез смотрите тут:

http://forum.ru-board.com:9000/topic.cgi?forum=5&topic=50023&start=100#7

[more=копипаст оттуда]Nitrofest:
Я несколько лет не занимался сканированием книг, забросил как-то это дело. Вот сейчас возвращаюсь к делу. И возник вопрос, который долгое время раньше меня "мучал". Обычно я сканирую литературы по физ-мат тематике, с минимумом картинок. Расставить вручную десяток-другой picture зон никогда не было проблемой (обычно в книге больше не попадалось). А вот сейчас попалась книжица, где иллюстрации почти на каждой второй странице. Скажите, не появилось ли в СК функции с автоматическим выделением картинки? Или хотя бы чтобы по клику она автоматом "обводила" картинку по контуру... Можно было бы пользоваться ScanTailor, в котором эта функция кое-как реализована, но компенсировать тонкую настройку СК он, конечно, и близко не может. А вручную выделять зоны на >400-х страницах я задолбаюсь.

slava_kry:
Nitrofest
Нет, не появилось. Это принципиальный взгляд bolega.
По сути он прав, т.к. СТ картинки выделяет, но ты потом сидишь и "уточняешь" зоны картинок... дык какая разница?
Сам СК почти не пользуюсь.
Нормального сегментатора как не было, так и нет.

TelecomUral:
оффтоп

Цитата:
Нормального сегментатора как не было, так и нет

Угу. причём понасмотревшись сканов, я предполагаю, что и не будет, нормального-то. Художники как только не извращаются.
Правда, отсюда следует вывод: программировать "вспомогательные" инструменты, для типичных ситуаций. То есть оставлять на откуп обработчику, тыкать ему на конкретном скане в конкретном месте "найти картинку, она здесь такого-то типа", или нет. К примеру, типичный советский вариант НПС, НБЛ: фотки строго отделены от текста, овальные или прямоугольные. Цветной текст (слово, фразу) тоже можно задетектировать, исходя из соотношений геометрии (по аналогии с тем, как ищется блок текста на скане). А в целом - задача нерешаемая. Какая-нибудь подкладка акварельная, под синеньким шрифтом, как её опознаешь.

по сути:
Nitrofest
вы не забывайте, что есть режим mouse-up. Для однотипных картинок он идеален: растягиваете прямоугольник над картинкой, по отпусканию мышки зона создаётся автоматом. Простые книжки, без пиксельной точности выделения, зонируются за десяток минут, только успевай листать. Непрямоугольные - с помощью лассо.[/more]

Автор: rzia, Отправлено:12:31 30-04-2023

Здравствуйте

Подскажите, пожалуйста, как в программе сделать качественную обложку если всего несколько цветов. Есть инструкция?
Пример во вложении.
https://ibb.co/tYF8yZp

Автор: xMARx, Отправлено:12:49 30-04-2023

bolega
_Некоторые пожелания для одной из будущих версий СК:
1. Допустим Merge immediately отключен; включен ластик, выбран черный цвет. Вставляю глиф, начинаю его двигать, и на изображении появляется черная линия от ластика. Может, в этом случае, имеет смысл деактивировать ластик.
2. Допустим Merge immediately включен. Иногда, из-за неточного распознавания глиф вставляется достаточно далеко от той буквы, которую изначально хотелось заменить. Возможно, имеет смысл задать какое-то ограничение. Например, глиф вставляется на расстоянии не более 30 пикселей по горизонтали и 30 пикселей по вертикали от точки курсора. Просто, если изображение приближено, то вставляемый глиф может "улететь" за пределы текущего вида и заменить букву, которой не видно на экране. В принципе, подобный пример могу поискать
3. Обычное выделение и aux rectangle плохо видны в окне RV на фоне сетки при приближении. Возможно, имеет смысл как-то изменить линию выделения (например, увеличить толщину).
4. Сетку в окне RV тоже можно изменить: сделать основную более крупную сетку с шагом, например, 5 пикселей, и более мелкую сетку с шагом 1 пиксель. Первая видна лучше, вторая - меньше бросается в глаза (за счёт выбора подходящего цвета или толщины).
5. Допустим, я проанализировал все страницы на наличие глифа "О" (на вкладке OCR, окна Image adjustments), и нахожусь на последней букве "О", которая найдена на данной странице. Хотелось бы, чтобы при нажатии кнопки вниз, происходил автоматический выбор первого символа "О" на следующей странице. Если на следующей странице данного символа нет, то необходимо переключиться на ту страницу, где этот символ есть. Если мы находимся на последнем символе последней страницы, то при нажатии кнопки вниз ничего не происходит.
__По аналогии, пусть выбран первый символ "О" на данной странице. Если нажать вверх, то выбирается последний символ "О" предыдущей страницы. Если мы находимся на первом символе первой страницы, то ничего не происходит.
6. Сейчас при рисовании линии координаты выбранной точки привязываются к верхнему левому узлу сетки. Мне кажется, удобнее было бы, если бы они привязывались бы к ближайшему узлу.
7. Я не нашел черно-белого волшебного выделения в окне RV. Некоторые объекты с помощью этого инструмента было бы удобнее и быстрее выделять .

Автор: TelecomUral, Отправлено:13:20 30-04-2023

rzia
задача непонятна. Это пример чего, выхода или входа? Формат на выходе какой нужен (djvu|pdf|tiff)?

Автор: rzia, Отправлено:13:58 30-04-2023


Цитата:
задача непонятна. Это пример чего, выхода или входа? Формат на выходе какой нужен (djvu|pdf|tiff)?

Это уже обработанная в фотошопе обложка, готовый файл для кодировки в djvu.
Я обычно обложки обрабатываю отдельно от основной книги, кодирую по старинке при помощи DjVu Small.
Но, размер только обложки получается в 7 раз больше всей книги.
Подумал, может быть в сканкромсаторе можно как то сделать маленькую качественную обложку?
С зонами поигрался не получается. Когда два цвета понятно, а когда их 3 или 4?

Автор: TelecomUral, Отправлено:14:01 30-04-2023

rzia
щас видео запишу.

UPD
https://disk.yandex.ru/i/OVgjo_QPFwzPIw

Автор: rzia, Отправлено:14:32 30-04-2023

TelecomUral Большое спасибо за урок, сейчас буду пробовать


Добавлено:
TelecomUral Ещё раз большое спасибо, все получилось.

Автор: TelecomUral, Отправлено:18:08 30-04-2023

rzia
без особых изменений процесса вы можете и основной текст книги сделать в djvu. Только проверяйте режим потерь на step2, чтоб эффект ИНЬ не получить.

Автор: rzia, Отправлено:18:19 30-04-2023

TelecomUral да, с основным текстом особых проблем нет, и с цветным текстом тоже, были проблемы там где больше нескольких цветов, благодаря Вам теперь проблем нет, главное не забыть как это делать. Сканов обработать надо уйму, а времени как всегда мало, и паузы между обработками большие, вот и забывается.


Автор: TelecomUral, Отправлено:18:34 30-04-2023

rzia
составьте один раз письменную инструкцию либо прокомментируйте ключевые моменты в видео-напоминалке. Я тоже кое-какие моменты забываю, в СК очень много полезностей введено.

Автор: bolega, Отправлено:09:40 01-05-2023

xMARx

Цитата:
если изображение приближено, то вставляемый глиф может "улететь" за пределы текущего вида и заменить букву, которой не видно на экране

ограничение есть и сейчас. А что за улет? При каких условиях возникает, когда вставляете горячей клавишей или мышкой?


Цитата:
Сейчас при рисовании линии координаты выбранной точки привязываются к верхнему левому узлу сетки.

Сетка - это которая появляется при большом масштабе?
На самом деле специально к узлам не привязывается. Когда координата мышки пересчитывается в координату изображения, используются реальные вычисления с последующим округлением. Все дело в округлении, на это повлиять нельзя.


Цитата:
Я не нашел черно-белого волшебного выделения в окне RV. Некоторые объекты с помощью этого инструмента было бы удобнее и быстрее выделять .

Действительно, для ч/б изображений Ctrl-Shift-клик не выделяет, а стирает. Просто трудно придумать, зачем еще могло бы понадобится выделять черное или белое на b/w. Вот вам для чего надо выделять?

Добавлено:
shch_vg

Цитата:
в плане копирования СК не дружит с моей системой win10

Слегка изменил код. Посмотрим. У меня никогда таких проблем не возникало, ни в 7, ни в 10.

Автор: TelecomUral, Отправлено:10:34 01-05-2023


Цитата:
bolega
А что за улет?


daa2013 попросил закопипастить сюда его объяснение (сам не может, видимо, пароль не помнит )


Цитата:
Напишите плиз на руборде про улет:

Обе метелки отключены. Вставка по хоткею. ОЦР не выполнялся. Если кликнуть мышкой, а потом переместиться по экрану далеко. То фокус останется там, где был клик. Даже за пределами экрана. Поэтому стараюсь вставлять только при красной метелке. Не исключено, что это наблюдается не всегда, но достаточно часто. А это очень опасно, так как произошла или не произошла вставка в этом случае не видно, и я иногда только случайно при пролистывании джву обнаруживаю некорректные вставки. При включённой метелке фокус так не убегает.


Автор: Benoni, Отправлено:11:31 01-05-2023


Цитата:
Поэтому стараюсь вставлять только при красной метелке

И я также стараюсь вставлять глиф только при нажатой красной метелке. Если включена (нажата) кнопка Magic clear mode, то вставка приходится по её месту нахождения.

Автор: bolega, Отправлено:11:38 01-05-2023

TelecomUral
Понятно, старый глюк с хоткеем и мышкой. У меня за все время так ни разу не проявился. Я поэтому так и не понял, из-за чего это. Код сто раз проверил.

Автор: TelecomUral, Отправлено:11:40 01-05-2023

bolega
А можно тогда ввести для случая daa2013 звуковое оповещение, если вставка произошла вне области видимости экрана?

upd
а ещё лучше с одновременным логгированием переменных. Не люблю я плавающие баги.

Автор: bolega, Отправлено:11:57 01-05-2023

TelecomUral
ОК.
Посмотрел ваш последний ролик, напомню, что количество цветов в исходном скане можно узнать в СК в Reports > File information.
И еще вижу, что в визарде не хватает возможности кодить обложки как малоцветку, т.е. без привлечения зон. Давно стоит в планах эта фича.

Добавлено:
TelecomUral
Кстати, попробуйте сейчас увести курсор с изображения или даже навести его на скроллбар и нажать хоткей вставки, что будет?

Добавлено:
И еще напомню, что если имеется выделение, то вставка будет произведена в точку его верхнего левого угла, это нормальное поведение.

Автор: TelecomUral, Отправлено:13:25 01-05-2023


Цитата:
в визарде не хватает возможности кодить обложки как малоцветку

step4 ?

Автор: bolega, Отправлено:13:37 01-05-2023


Цитата:
step4 ?

step1

Автор: shch_vg, Отправлено:15:12 01-05-2023

bolega

Цитата:
Слегка изменил код.

В любой момент готов проверить.

Цитата:
в визарде не хватает возможности кодить обложки как малоцветку

А чем плохо засовывать обложки в step2?

Автор: TelecomUral, Отправлено:20:04 01-05-2023


Цитата:
А чем плохо засовывать обложки в step2?

автосегментер DEE мягко говоря неидеален. Его, конечно, можно заломать спецпрофилем, но смысла в этом мало. step1 и его фоторежим надежнее.

Автор: bolega, Отправлено:20:09 01-05-2023


Цитата:
А чем плохо засовывать обложки в step2

Даже фото-режим не застрахован от артефактов, пусть и небольших. Речь идет об областях вблизи стыков разных цветов. А малоцветку, насколько я понимаю, делают именно для того, чтобы вообще исключить артефакты. Если же юзер их допускает, то можно конечно же использовать хоть step2, хоть step1

Автор: TelecomUral, Отправлено:21:09 01-05-2023

bolega

Цитата:
TelecomUral
Кстати, попробуйте сейчас увести курсор с изображения или даже навести его на скроллбар и нажать хоткей вставки, что будет?

для версии 6.9.
Если курсор левее поля страницы то глиф появляется на краю левого поля на горизонтали щелчка. Аналогично для щелчков по другим краям - притягивается к ближайшей точке страницы.
Если на скроллбаре то сообщение "Mouse cursor out of image bounds or image not focused".

Автор: asku, Отправлено:00:15 02-05-2023

Добрый вечер.
Книга почти 700 страниц.
На каждом развороте вот такие буквицы. Можно ли в СК как-то упростить создание картинок для них, или придется всё вручную?




Автор: VadimirTT, Отправлено:00:35 02-05-2023

asku
Зачем сканировать в джипег? Характерные разводы, на контрастных участках.

Автор: asku, Отправлено:00:43 02-05-2023

VadimirTT

Я всегда сканирую в тифф, с разрешением 300.

Автор: VadimirTT, Отправлено:02:32 02-05-2023

asku

Цитата:
Я всегда сканирую в тифф

Тифф это контейнер, там и джипег сжатие предусмотрено, проверьте.

Автор: TelecomUral, Отправлено:05:06 02-05-2023

VadimirTT
вы вероятно путаете скан и скриншот. Предоставлены джипеги.


Цитата:
asku
как-то упростить создание картинок

Максимально допустимую по габаритам зону один раз создали, в буфер обмена ее, и хоткей Paste zone to cursor. К слову, bolega, именно в этом случае было бы удобнее вставлять зону не по верхнему левому углу. Не раз уже это ограничение мешало. Наверное, имеют смысл 4 хоткея.

Автор: U235, Отправлено:07:21 02-05-2023

asku буквицы ничем не отличаются от шахматных диаграмм. Разве что не такие квадратные (aspect) и поменьше размеры. Поэтому можно впользоваться для массового создания зон картинок:
https://github.com/U235a/chess4SK

Автор: asku, Отправлено:07:27 02-05-2023

U235
Ого, уже и утилиты под СК есть.
А в какой программе нужно открывать chess4SK.py ?

Автор: mvk2006, Отправлено:08:11 02-05-2023


Цитата:
А в какой программе нужно открывать chess4SK.py ?

asku


http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=1840#12

Автор: U235, Отправлено:08:21 02-05-2023

asku
Нужен интерпретатор Python,а. А он зависит от того, какая у вас ОС: версия win/lin, 32/64 бит. Скачивается с официального сайта. Также нужны будут две библиотеки opencv-python и numpy. Еще лучше, попросите shch_vg или Benoni поделится заархивированной папкой с embeded питоном, библиотеками и этим скриптом, запускался батником, насколько я помню. У меня просто в данный момент не под руками все это.

Автор: asku, Отправлено:11:51 02-05-2023


Цитата:
shch_vg или Benoni поделится заархивированной папкой  с  embeded питоном, библиотеками и этим скриптом, запускался батником, насколько я помню


Прошу у shch_vg и Benoni поделиться И прошу простыми словами объяснить как этим всем пользоваться. Никогда не имел дела со скриптами Питона. Судя по всему полезная в СК (и не только) вещь.

Автор: xMARx, Отправлено:13:08 02-05-2023

bolega
1)
Цитата:
ограничение есть и сейчас. А что за улет? При каких условиях возникает, когда вставляете горячей клавишей или мышкой?

__Я оставил себе картинку, но почему-то сейчас она обрабатывается нормально. улет есть, но терпимый. Проблема возникает тогда, когда розовыми рамками выделяется несколько букв, причем иногда выделяется две строки. У меня такое встречается в подрисуночных надписях, где шрифт мельче и толще. На данный момент, терпимый улет виден там, где розовыми рамками выделено по одной букве на верхней и нижней строке, и символ улетает на верх. но заметить это не сложно. В следующий раз, когда встречу случай, когда символ улетает дальше, постараюсь его сохранить. Перетаскиваю символы руками из панели глифов.

2)
Цитата:
Все дело в округлении, на это повлиять нельзя.

__Понятно, я просто думал, что достаточно где-то в коде заменить одно округление (округление к меньшему), на другое (округление числа до целого, которое расположено ближе всего).

3)
Цитата:
Просто трудно придумать, зачем еще могло бы понадобится выделять черное или белое на b/w. Вот вам для чего надо выделять?

__Честно, записал в текстовый документ эту хотелку, но не запомнил зачем она была нужна на тот момент... Сейчас подумал, во многих случаях волшебное выделение можно заменить применением элемента из панели глифов. При этом нужно добавить white transperancy.
__На ум пришел не самый удачный пример: выравнивание по высоте руками какой-то надписи, написанной курсивом или каким-то хитрым шрифтом. Выделить букву волшебной палочкой было бы легче, прямоугольным выделением неудобно - так как я выделю не только текущую, но и соседние буквы.
__Сейчас уже не уверен, что этого достаточно, для введения этого инструмента...

4) __Насчет выделения... Все-таки удобнее было бы, если бы при выделении, клавиши вверх и вниз двигали данное выделение. Уже как-то говорил об этом. Как только мы перестали работать с выделением, этим клавишам возвращается функция перелистывания страниц. Ctrl+вверх, ctrl+вниз как-то менее удобно.

Автор: shch_vg, Отправлено:13:21 02-05-2023

Срочно нужна помощь.
После многолетнего использования СК возникла необходимость воспользоваться свойством зоны Transparent. Ситуация следующая: на шахматную диаграмму нанесен какой-то произвольный рисунок. Создаю одну ч/б зону с шахматной диаграммой и другую с ч/б рисунком и располагаю их одну на другой. Хотел бы видеть появление диаграммы и рисунка на ней в резалт вью. Почитал Хрестоматию, почти ничего не понял, начал по интуиции подбирать вариант (проставлять галочки в свойстве Transparent зон, но ни один не прокатил.
Вопрос: возможно ли это сделать, и если да, то какие свойства нужно прописать в этих зонах.

U235

Цитата:
Поэтому можно впользоваться для массового создания зон картинок

Упомянутый Вами скрипт определяет на странице прямоугольные формы диаграмм, а что он будет определять на приведенной asku картинке? Подобные буквы можно зацепить параметрами скрипта?
Если да, то нужен не скрин экрана, а реальный скан для проверки этого.


Добавлено:
asku

Цитата:
На каждом развороте вот такие буквицы. Можно ли в СК как-то упростить создание картинок для них, или придется всё вручную?

А простой перевод в ч/б недостаточен?

Автор: asku, Отправлено:13:42 02-05-2023


Цитата:
А простой перевод в ч/б недостаточен?

Можно, но там у буквиц серая тень, и хотелось сделать как можно идентичнее.
В данном случае, не принципиально, конечно, но возможности скрипта заинтересовали. В будущем бы все равно пригодился. Освоить бы.

Автор: shch_vg, Отправлено:14:12 02-05-2023

asku

Цитата:
Если да, то нужен не скрин экрана, а реальный скан для проверки этого.

А Вы это не желаете сделать?

Автор: asku, Отправлено:14:18 02-05-2023


Цитата:
А Вы это не желаете сделать?

Что сделать? Я могу для проверки дать несколько реальных сканов, а не скрины.
Сам я пока не разобрался как работать со скриптами, ничего сказать не могу.

Автор: U235, Отправлено:14:19 02-05-2023

asku
Выложите исходный скан одной страницы с буквицами для пробы и подбора параметров.

Автор: asku, Отправлено:14:25 02-05-2023


Цитата:
Выложите исходный скан одной страницы с буквицами для пробы и подбора параметров.


Вот несколько сканов в архиве:
Ссылка

Автор: TelecomUral, Отправлено:14:29 02-05-2023


Цитата:
shch_vg
Срочно нужна помощь...

нихрена, простите, из вашего объяснения не понятно.
чб рисунок на чб диаграмме, вы пишете? так?





тогда на кой чёрт их делить, если рисунок по вашим словам УЖЕ нанесён?!

Это ж надо умудряться - специально так запутывать задачи!

Автор: bolega, Отправлено:15:04 02-05-2023

shch_vg

Цитата:
Создаю одну ч/б зону с шахматной диаграммой и другую с ч/б рисунком и располагаю их одну на другой. Хотел бы видеть появление диаграммы и рисунка на ней в резалт вью.

Если создадите две зоны одна над другой, то и на выходе они такими и останутся - одна над другой. Не понял, в чем проблема. И что даст такое разделение, учитывая, что обе зоны - b/w?
И для зон есть режим интерактивного задания прозрачности (кнопка после волшебной кисточки). Какую надо часть сделать прозрачной, такую и делайте.

xMARx

Цитата:
я просто думал, что достаточно где-то в коде заменить одно округление (округление к меньшему), на другое (округление числа до целого, которое расположено ближе всего).

Заменить то можно. Но упомянутая функция - одна из самых востребованных в граф. движке СК. Вызывается в тысяче мест. Проверить, как изменение повлияет на работу всех этих мест, нереальная задача. Скорее всего, что-то другое начнет неправильно работать.


Цитата:
Как только мы перестали работать с выделением, этим клавишам возвращается функция перелистывания страниц

ОК. Посмотрю.

Автор: TelecomUral, Отправлено:15:16 02-05-2023

bolega
СК когда будет? Меня индиец трясёт, дай ему 6.9

Автор: imwerden, Отправлено:15:22 02-05-2023

Может ухе писали, но я пропустил. В версии 6.9 две вещи беспокоят:

1. ластик к режиме обработки конечного изображения не имеет границ, раньше был квадратик.
2. исправление перекоса на страницах с небольшим количеством текста (парой слов) искривляет даже прямое расположение текста.

Надеюсь, что помог.

Автор: bolega, Отправлено:16:15 02-05-2023

imwerden

Цитата:
ластик к режиме обработки конечного изображения не имеет границ, раньше был квадратик.

Работа ластика вообще в новой версии не менялась. Возможно, темы windows повлияли.
И в новой версии вместо ластика лучше использовать clone stamp, для ч/б изображения он работает как ластик.


Цитата:
исправление перекоса на страницах с небольшим количеством текста (парой слов) искривляет даже прямое расположение текста.

это бывало в любой версии. Попробуйте для такой страницы включить deskew: art.

Автор: shch_vg, Отправлено:16:32 02-05-2023

bolega

Цитата:
И для зон есть режим интерактивного задания прозрачности (кнопка после волшебной кисточки). Какую надо часть сделать прозрачной, такую и делайте.

Прошу не пинать меня ногами, т.к. все это мне в новинку.
Упрощу задачу.
Есть ч/б диаграммы в зонах. На них изображены положения фигур, но кроме того еще различные геомерические фигуры. Диаграммы плохого качества, приходится их заменять.
С заменой шахматной диаграммы проблемы нет, но воспроизводить рисунок на вновь созданной затруднительно.
Пришла мысль выделить из плохой диаграммы только рисунок и нанести его на выходной скан под зоной с диаграммой.
Магическое слово "прозрачность" натолкнуло на мысль, что зоне над рисунком можно сказать, чтобы она пропускала для показа то, что лежит под зоной.
Можно ли это реализовать?
режим интерактивного задания прозрачности я похоже нашел, но как его применить, так и не понял.

P.S. И как с с прозрачностью связано окошко Transparent из свойства зоны?

Автор: TelecomUral, Отправлено:16:38 02-05-2023


Цитата:
shch_vg
Магическое слово "прозрачность" натолкнуло на мысль, что зоне над рисунком можно сказать, чтобы она пропускала для показа то, что лежит под зоной.
Можно ли это реализовать?

По ПКМ на выделенной зоне в режиме Zones. В окошке основной страницы. Команда "Get transparensy mask from page".

upd
примерно так
https://disk.yandex.ru/i/A2Pv4Ivs-xnxAQ

Автор: shch_vg, Отправлено:19:18 02-05-2023

TelecomUral

Цитата:
https://disk.yandex.ru/i/A2Pv4Ivs-xnxAQ

Спасибо за видео, но мне это особо не помогло.
Возникла проблема с появлением подложки в нужном месте.
До Get transparensy mask from page не видно как подложка расположена относительно закрывающей ее доски, и очень трудно поместить ее на место.
Вот, что у меня получилось.

Добавлено:
asku
Удалось заключить в зоны ВСЕ заглавные буквы выложенных сканов, но кроме того образовались еще и некоторое количество фальшивых зон, которые требуют ручного удаления, т.е. придется просматривать все развороты и удалять их. U235 взял тайм-аут на проверку и дополнительную настройку скрипта.

Автор: bolega, Отправлено:20:24 02-05-2023

shch_vg

Цитата:
Вот, что у меня получилось.

Я сделал по другому, наоборот. Для наглядности раскрасил
https://workupload.com/file/thcsLcs8wfK
Напомню про команду Selection > White transparent
В данном примере не нужно пытаться рисовать доску под решеткой, наоборот, нужно выделить решетку в отдельную зону, убрать на ней все лишнее, все белые пиксели сделать прозрачными. А область на скане под зоной - восстановить из похожего соседнего фрагмента, я сделал это через двухклеточный глиф.

Добавлено:
Для массовых операций над зонами пригодится такой прием, например нужно удалить какие-либо зоны по всей книге: 1) включить Zones > mouse-zone-click-action = toggle mark, 2) пройтись по всем сканам и просто щелкать по зонам, которые надо удалить - они будут маркироваться. 3) Zones > Bulk > Delete zones, only marked = галка, scope = All - удалить все отмаркированные зоны

Автор: shch_vg, Отправлено:22:12 02-05-2023

bolega
Спасибо за советы, но Вы, по-видимому, упустили момент, что я заменяю через зону и шахматную доску, поэтому мне непонятно взаимодействие двух зон, когда одна не видна из-за другой.

Автор: TelecomUral, Отправлено:04:28 03-05-2023


Цитата:
shch_vg
Возникла проблема с появлением подложки в нужном месте.

Тогда пробуйте сделать прозрачность, и откатывайте, если получается криво. Ну или запишите точный угол и смещения новой диаграммы, и крутите-смещайте подложку по этим числам.

Это, вероятно, происходит из-за того, что вы шахматную доску рисуете заново несколько в другом месте, да ещё и с поворотом. Впрочем, поворот может сам СК вводить.

оффтоп
Это называется "дурная голова ногам покоя не даёт". Делается ну просто всё возможное, чтобы ничего не получилось Развалена общая координатная система, а потом "а что ж мне делать-то теперь...".

оффтоп2
Смешно выглядит это вот всё. Крутить подложку вручную настолько времязатратно... Она же может быть не строго по центру диаграммы.

+ мысль
вероятно, всё же проще наложить отдельную зону с этим рисунком. Её и двигать проще, и повернуть можно один раз, и совмещение видно через просвечивание.

UPD
видео
https://disk.yandex.ru/i/eWtpulsS0uomsA

UPD2
ну и последний гвоздь в крышку гроба: можно было в примере shch_vg сделать прозрачность в диаграмме и двигать её над подложкой. Это не вполне универсальное решение, потому что рисунок в общем случае может быть в цвете, а подложка - в СК это чаще всего - ЧБ.

Автор: U235, Отправлено:08:19 03-05-2023

asku
https://www.upload.ee/files/15190920/py_3_10_10.zip.html
В архиве скрипт, Python 3.10.10 64-бит и библиотеки. Запускать двойным кликом start.cmd
Предварительно нужно создать файл-задание для SK, см. описание на gitHub.
Параметры такие: min size 0.037, max size 0.065, aspect 0.5, expand 0, dilation 4
После работы создатся новый файл-задание с суфиксом _new. На ваших сканах все буквицы выделились корректно, кроме 0013 файла, там вторая буквица из двух литер Дз, Д выделилась, а з -нет. Такие случаи надо поправить вручную. Думаю это в любом случае быстрее, чем выделять каждую буквицу руками.

Автор: asku, Отправлено:09:12 03-05-2023

U235
Спасибо! Буду пробовать.
А что значит:
Параметры такие: min size 0.037, max size 0.065, aspect 0.5, expand 0, dilation 4

Автор: U235, Отправлено:09:20 03-05-2023

asku
Там будет окно, в нем надо вбить эти параметры. Скрин окна на гитхабе.

Автор: asku, Отправлено:11:28 03-05-2023

U235

Сделал. Получилось. Спасибо!
Все страницы еще не смотрел — пока времени нет, проверил несколько разворотов и результат на них идеальный )



Теперь осталось вспомнить как в СК убрать галочки, чтобы расставить резаки. Может кто-нибудь подсказать?

Автор: mvk2006, Отправлено:12:02 03-05-2023


Цитата:
как в СК убрать галочки, чтобы расставить резаки

Убрать галочки можно в пункте "Сlear marks" (и в меню Edit и в контекстном меню в списке файлов)
Но для расставления резаков нет необходимости убирать маркеры

Автор: shch_vg, Отправлено:17:10 03-05-2023

TelecomUral
Спасибо за видео, так как из него я, наконец-то, узнал то, что спрашивал, а именно, как сделать выше расположенную зону прозрачной.

Осталась одна загадка: что делает в свойствах зоны Transparent?

Автор: TelecomUral, Отправлено:17:49 03-05-2023


Цитата:
Осталась одна загадка: что делает в свойствах зоны Transparent?

это вам тема для самостоятельного изучения

Я в своей статье Хрестоматии на примере гиперболоида вращения всё про уровень transparent чётко показал.

Автор: shch_vg, Отправлено:21:18 03-05-2023

TelecomUral

Цитата:
Я в своей статье Хрестоматии на примере гиперболоида вращения всё про уровень transparent чётко показал.

Вот там-то я ничего и не понял. Он как-то связан с прозрачностью в Вашем последнем видео?

Автор: daa2013, Отправлено:04:32 04-05-2023

bolega


Цитата:
Понятно, старый глюк с хоткеем и мышкой. У меня за все время так ни разу не проявился. Я поэтому так и не понял, из-за чего это. Код сто раз проверил.


Не совсем так, как старый. Во-первых, насколько я помню, раньше улетало и при метелках. Теперь нет. (Так что достаточно следить не за улётами, а просто включена ли метелка). Во-вторых, раньше точка прилета была непонятна. (Возможно, она непредсказуемо смещалась из-за зум ин - зум оут мышкой). Сейчас это участок, где ранее совершались некие действия (клик, или вставка, или чистка.) Т.е. прилетает в предшествующую зону внимания, так сказать. Так что, если сделал пасте (не сулчайно, а осознанно) и результата не увидел, то более-менее ясно, где проверять.



Цитата:
если имеется выделение, то вставка будет произведена в точку его верхнего левого угла


Вот совершенно не исключаю того, что не снимается какое-то "выделение" (невидимое пользователю) после обработки; или после клика ставится какое-то невидимое микро-выделение в условный пиксель; или где-то внутри СК взводится галочка, что пользователь начал выделение, а пользователь на самом деле переместился на другой край страницы и там пасте хоткеем делает, наводя мышку.

Автор: TelecomUral, Отправлено:04:35 04-05-2023

shch_vg
bolega разъяснял когда-то, что результирующая маска прозрачности рассчитывается в момент обработки зоны с учётом этого свойства зоны (порога).

Автор: bolega, Отправлено:07:58 04-05-2023

daa2013

Цитата:
совершенно не исключаю того, что не снимается какое-то "выделение" (невидимое пользователю) после обработки

В 6.9 именно так и произошло. Накосячил, когда делал вашу хотелку - корректировку круглого выделения после его создания. И глюк с мелкой стрелочкой по той же причине. Уже исправил.

TelecomUral

Цитата:
результирующая маска прозрачности рассчитывается в момент обработки зоны с учётом этого свойства зоны (порога).

Именно так. Все пикселы, цвет которых отличается от белого цвета на заданный порог, становятся прозрачными. Понятно, что для b/w и 0-го порога достаточно.
И еще эта опция применяется на лету в external picture зонах при создании djvu. Обычно при создании djvu все опции обработки, если и заданы, игнорируются. Кроме этой. Это сделано, чтобы уравнять поведение зон при создании djvu и pdf. Если в pdf поместить например ч/б зону поверх картинки (или текста), то она полностью закроет собой нижележащий контент, независимо от цвета пикселов зоны, т.е. белый пиксел зоны заэкранирует подложку так же, как и не белый. djvu же как известно обладает врожденной особенностью - ч/б или раскрашенные чанки всегда будут сверху, их невозможно экранировать фоном. Поэтому СК предпринимает дополнительные меры, чтобы фон (белый или любой) все-таки при необходимости закрыл собой все что ниже. Если же это не нужно, то достаточно включить опцию transparent, не прибегая к обработке или редактированию зоны.

Автор: DmitryKz, Отправлено:08:23 04-05-2023

Уважаемый bolega, позвольте три хотелки озвучить.
1. Добавить где-либо в VR контекстное меню типа Process all zones. Кнопка в свойствах зоны Copy to all zones at page есть, а чтобы все зоны на странице разом обработать — не хватает такой команды, когда зон на странице много.
2. Добавить в VR зумирование обведением курсором мыши нужного участка — имхо, очень удобно было бы приближаться к нужному участку, нежели чем крутить к нему колёсико мыши. Особенно если таких участков на странице много — участок, правка, F, новый участок, правка, F ...
3. Добавить в MW что-то типа статус бара с указанием информации о количестве зон на странице. Насчет последней хотелки я не уверен, нужна ли. Просто сталкивался несколько раз с ситуацией, когда мышка шумит и при обведении зоны обведение обрывается раньше времени и зона, иногда очень маленькая, всё же создаётся. Приходится ради перестраховки каждый раз использоваться Delete all zones, время тратить то есть — было бы очень удобно видеть и знать, есть ли зона/ы на странице. Повторюсь, может в СК этого и не нужно, так как при наличии зоны он в любом случае ее отрисует, какой бы маленькой она ни была и не заметить ее будет невозможно.

Может, что-то из этого уже сделано, тогда прошу прощения, what's new значит читал невнимательно.

Автор: TelecomUral, Отправлено:08:55 04-05-2023


Цитата:
Добавить в VR зумирование обведением курсором мыши нужного участка

есть по ПКМ "Zoom selection", и хоткей


Цитата:
Добавить в MW что-то типа статус бара с указанием информации о количестве зон на странице.

это вот да, такой инфы онлайн не хватает. Особенно при импорте PDF - совершенно нельзя разобраться, чего наимпортировано.
Где-нибудь слева внизу, где про скан написано.

Автор: bolega, Отправлено:09:18 04-05-2023


Цитата:
в VR контекстное меню типа Process all zones

Такая команда есть в MW. Не хватит?


Цитата:
Добавить в MW что-то типа статус бара с указанием информации о количестве зон на странице

В планах есть выводить инфу (статистику) по зонам в Reports. В статусбаре не планировал

Автор: DmitryKz, Отправлено:09:30 04-05-2023


Цитата:
есть по ПКМ "Zoom selection", и хоткей

Хм... Есть-то оно конечно есть... Только как с ней работать?
Пока я вижу что нужно отключить режим mouse up или ластик, сделать выделение, нажать горячую клавишу/и, включить режим mouse up или ластик, сделать правку, нажать F — и все эти манипуляии повторить для нового участка на странице.. Ну это как-то более чем громоздко и явно хуже моего нынешнего рабочего процесса — когда инструменты уже включены, остается только зумить колесом, затем F, снова кручение колеса, правка, F ...

Я имел в виду, что просто обвёл нужный участок/«нарисовал» воображаемый rectangle и этот участок сразу же зумится, и под рукой у тебя уже ластик или выделение. Я это видел то ли в Фотошопе, то ли в каком-то просмотрщике изображениц. Конечно, там обведение прямоугольником желаемой области сопровождалось нажатием дополнительной клавиши.


Цитата:
Такая команда есть в MW. Не хватит?

В смысле, предлагается выйти из VR в MW ради одной этой команды, затем вернуться в VR и если на следующей странице снова несколько зон, в свойства котороых скопированы одни и те же свойства, то снова идти в MW? Или кликать по каждой зоне в VR, чтобы ее переобработать?

Автор: asku, Отправлено:09:31 04-05-2023

bolega
А нет ли в СК что-то типа закладок? Например, просматриваю как расставлены резаки, часть посмотрел, закрыл СК, а потом когда открыл снова, то с помощью закладки, открыл ту же страницу.
И то же самое для VR.

Автор: bolega, Отправлено:09:36 04-05-2023

Кстати, из последних хотелок мне особо понравилась идея daa2013 ввести режим редактирования совмещенного изображения сразу двух страниц разворота. Очень интересная и нужная задача. Я конечно же ее расширил на случай нефинализированных страниц. Еще ничего в этом направлении не делал (времени нет), но по прикидкам это оказывается сложнейшей задачей (из-за расширения), потребует серьезной адаптации графического движка. Надеюсь, когда-нибудь осилю.


Добавлено:

Цитата:
А нет ли в СК что-то типа закладок? Например, просматриваю как расставлены резаки, часть посмотрел, закрыл СК, а потом когда открыл снова, то с помощью закладки, открыл ту же страницу.

При открытии задания СК перескакивает на первый скан, который помечен в списке красным выделением. Помечайте файл, на котором остановились, и получите что хотите.
Есть еще функционал на закладке subset. Очень полезная фича, позволяющая создавать собственные мини-списки файлов из общего списка.

Добавлено:

Цитата:
Хм...


Цитата:
В смысле, предлагается


Цитата:
видел то ли в Фотошопе, то ли в каком-то просмотрщике изображениц. Конечно, там обведение прямоугольником желаемой области сопровождалось нажатием дополнительной клавиши.

Пальцы веером и прочие "фи" - это конечно крутая манера, но тогда предложите какую клавишу. У меня идей нет, все клавиши уже заняты, даже capslock.

Добавлено:

Цитата:
Или кликать по каждой зоне в VR, чтобы ее переобработать?

Если уж правится так много зон, то включается режим автомаркировки исправленных зон, меняются свойства зон на нужных страницах, потом запускается команда переобработки маркированных зон на всех страницах.

Автор: DmitryKz, Отправлено:10:08 04-05-2023


Цитата:
Пальцы веером и прочие "фи"

Ну и с чего вы взяли, что у меня пальцы веером и я выражаю своё "фи"?? Вроде совершенно уважительно и к вам обратился, и хотелки выразил.
На мой взгляд, описанный мною предлагаемый СК рабочий процесс (каким я его вижу) для задачи хотелки № 2 действительно громоздок, как говорит мне собственный же практический опыт.


Цитата:
но тогда предложите какую клавиш

ВЫ же разработчик, неужели ничего не придумаете? Например, в программе PureRef обведение картинки для кропа осуществляется левой кнопкой мыши, при одновременно нажатой клавише "C".

Автор: TelecomUral, Отправлено:10:12 04-05-2023


Цитата:
DmitryKz
Конечно, там обведение прямоугольником желаемой области сопровождалось нажатием дополнительной клавиши.

bolega
а что, разве такой хоткей на обычную клавишу нельзя повесить?? Хоткей "N" (условно), жму его, и если я в mouse-up режиме, то он временно автоматически выключается и движок ожидает от юзера выделения области. Простой щелчок снимает режим, а прочие команды и кнопки перестают действовать пока хоткей активен. Можно вообще в режим полного отображения всей страницы автоматом прыгать по этому хоткею и ждать выделения для зуммирования.
Я сам крайне редко попадал на эти неудобства, привык ходить последовательно строку за строкой и страницу за страницей, но нечто вышеописанное действительно напрашивалось, изредка.

Или, допустим, можно предусмотреть что если при растягиваемом выделении ещё и правой кнопкой щелкнуть, то пусть ПКМ выскакивает, а не mouse-up исполняется.

Или кнопочку, которой не хватает, ввести на экране

Автор: daa2013, Отправлено:13:36 04-05-2023


Цитата:
все клавиши уже заняты, даже capslock


а что висит на капслоке ?

Автор: mvk2006, Отправлено:13:44 04-05-2023

daa2013

Цитата:
а что висит на капслоке ?


- VR: Нажатая клавиша CapsLock временно отключает (до момента отжатия) действие режима mouse-up clear.

Автор: xMARx, Отправлено:13:45 04-05-2023

bolega
__Можно сделать так, чтобы вкладка Preferences на панели глифов всегда была на одном фиксированном месте, например, сверху.
__Для удобства можно ввести опцию во вкладке Preferences, при включении которой глиф вставляется после выделенного в данный момент глифа.

Автор: TelecomUral, Отправлено:13:51 04-05-2023


Цитата:
Для удобства можно ввести опцию во вкладке Preferences, при включении которой глиф вставляется после выделенного в данный момент глифа.

помнится, это Insert glyph

Автор: xMARx, Отправлено:14:07 04-05-2023


Цитата:
помнится, это Insert glyph

__Спасибо, нашел.

Автор: DmitryKz, Отправлено:14:53 04-05-2023


Цитата:
Хоткей "N" (условно), жму его, и если я в mouse-up режиме, то он временно автоматически выключается и движок ожидает от юзера выделения области.

Имхо, не нужно никаких клавишей/кнопок, работающих по принципу toggle'а, нажатие которой должно временно отключать работу других toggle'ов — уверен, это только усложнит программирование.
Нужна просто назначаемая модулирующая клавиша, работающая также, как работают Ctrl, Alt, Shift. Нажатие и удерживание которой просто сигнализирует то, как воспринимать движение мыши — зум ин обведенного участка. Пример я привёл с PureRef.


Цитата:
Если уж правится так много зон, то включается режим автомаркировки исправленных зон, меняются свойства зон на нужных страницах, потом запускается команда переобработки маркированных зон на всех страницах.

Это очень неудобно — так как оценка результата откладывается на потом. Оперативней было бы вносить правки в зоне/ах, смотреть результат, делать новую возможную корректировку (не всегда угадываешь в параметрах с 1-го раза), пока ты находишься в VR на одной странице, чтобы не возвращаться к ней спустя неизвестно время, возможно даже забыв, что с конкретно с ней было не так.

Автор: TelecomUral, Отправлено:15:12 04-05-2023


Цитата:
не всегда угадываешь в параметрах с 1-го раза

э, не-ет
значит, у вас рука не набита. Это другое.

Автор: DmitryKz, Отправлено:15:38 04-05-2023


Цитата:
значит, у вас рука не набита. Это другое

ScanKromsator — это инструмент для набития рук? Сколько лет нужно потратить и книг сделать, чтобы прийти к ощущению набитости рук? Тогда это удел избранных
Думаю всё же, что с руками и глазомером у меня более-менее всё в порядке за годы пользования программой. А вот поэкспериментировать с параметрами и хочется, и приходится иногда.

Автор: TelecomUral, Отправлено:15:43 04-05-2023


Цитата:
Тогда это удел избранных

именно

Добавлено:

Цитата:
А вот поэкспериментировать с параметрами и хочется, и приходится иногда.

дело в принципе не моё. Захочет разработчик - сделает. Но для работы в СК это не нужно. Эксперименты на то и эксперименты, что делаются вдумчиво, аккуратно и не спеша. Массовые операции - это не эксперименты.

Автор: bolega, Отправлено:18:24 04-05-2023


Цитата:
daa2013 Цитата: а что висит на капслоке ? - VR: Нажатая клавиша CapsLock временно отключает (до момента отжатия) действие режима mouse-up clear.

если мне не изменяет память, именно вы просили такую возможность, чтобы можно было добавлять глиф не отключая режим чистки.


Цитата:
Нужна просто назначаемая модулирующая клавиша, работающая также, как работают Ctrl, Alt, Shift. Нажатие и удерживание которой просто сигнализирует то, как воспринимать движение мыши — зум ин обведенного участка. Пример я привёл с PureRef.

Согласен с этим.
Проблема в том, что СК поддерживает назначение горячих клавиш без обязательности нажатия спец клавиш, т.е. можно например задать hotkey Ctrl-R без обязательного Ctrl. Если вы предлагаете использовать обычную клавишу как модификатор поведения, то может возникнуть конфликт с какой-нибудь горячей клавишей, в том смысле, что не поймешь, кто же из них отработает первым. За этим придется как то следить...


Цитата:
Можно сделать так, чтобы вкладка Preferences на панели глифов всегда была на одном фиксированном месте, например, сверху.

Блокнотные закладки - это стандартный элемент интерфейса Windows. Такого поведения там не предусмотрено. При изменении размеров они там как-то сами реорганизуются, на это повлиять нельзя.


Автор: daa2013, Отправлено:13:19 05-05-2023


Цитата:
если мне не изменяет память, именно вы просили такую возможность, чтобы можно было добавлять глиф не отключая режим чистки.

Да.
Но как-то я это в whatsnew упустил.
Спасибо !

Автор: bolega, Отправлено:15:59 05-05-2023

DmitryKz

Цитата:
Нужна просто назначаемая модулирующая клавиша, работающая также, как работают Ctrl, Alt, Shift. Нажатие и удерживание которой просто сигнализирует то, как воспринимать движение мыши — зум ин обведенного участка.

Нажимаете Capslock в режиме mouse-up-чистки. Выделяете фрагмент, отпускаете клавишу мыши, отпускаете capslock, вызываете КМ > Zoom selection или горячую клавишу для этой команды. Это то, как работает сейчас в новой версии 6.9

Автор: shch_vg, Отправлено:16:36 05-05-2023

bolega
Не понял, глюк это или фича?
Хотел получить усредненный цвет с поля е4 обработанной зоны, а мне предлагается взять с исходного скана.
Версия 6.8

Вопрос: Можно в СК узнать RGB цвета, не прибегая к зонам?

Автор: mvk2006, Отправлено:17:09 05-05-2023

bolega
Вопрос по вкладке OCR в панели Image adjustment (CK6.9):
Нажатие Show adjust panel сбрасывает кнопку Sort by matching rating, если та нажата. Это так задумано?
И наоборот, при этом сброс кнопки вызова adjust-панели (нажатием кнопки сортировки) не убирает саму панель.

Автор: DmitryKz, Отправлено:17:33 05-05-2023

bolega, спасибо за рекомендацию, попробовал, интересный вариант — поработаю так, отпишусь, как впечатления накопятся.

Автор: bolega, Отправлено:18:26 05-05-2023

shch_vg

Цитата:
Хотел получить усредненный цвет с поля е4 обработанной зоны, а мне предлагается взять с исходного скана.

Через 15 лет вы наконец-то узнали, что в этом окошке preview исх.зоны и preview фильтров, но для них надо там кнопочку включить ))

Цитата:
Можно в СК узнать RGB цвета, не прибегая к зонам?

в статусной строке для текущего изображения. Если поверху зона, то цвет все равно изображения.

mvk2006

Цитата:
Это так задумано?

Баг

Автор: shch_vg, Отправлено:20:53 05-05-2023

bolega

Цитата:
Через 15 лет вы наконец-то узнали, что в этом окошке preview исх.зоны и preview фильтров, но для них надо там кнопочку включить ))

Старческий маразм никто не отменял . Только сейчас вспомнил, что выделял область, которая давала усредненный цвет.
На самом деле все сложнее. Я не забывал, что в превью нужно брать усредненный цвет, но возникла нестандартная ситуация. Очень грязная диаграмма в зоне. Пришлось усредненный цвет брать на этой же странице, но вне зоны. Взять-то я взял, а вот как ее загнать в фон диаграммы не мог сообразить.
Я ведь не даром спрашивал про RGB, готов был набирать этот цвет через эту тройку.
Попроще нет способа?

Автор: bolega, Отправлено:08:48 06-05-2023

shch_vg

Цитата:
а вот как ее загнать в фон диаграммы

есть кнопки для работы с цветом, есть команды в КМ, есть палитры. Снимите видео с вашими потугами, мне например, не понятно, что там может не получаться.


Автор: shch_vg, Отправлено:14:03 06-05-2023

bolega
Я не умею делать видео, да и показывать там бы было нечего, опишу это словами.[more]Для понимания моего вопроса нужно открыть sub-task, выложенный мной ранее и зайти в RV в виде отображения Zones.
Создана ч/б picture-зона на диаграмме для замены грязной как по фограунду, так и по бэкграунду. Вопрос касается передачи цвета заливки извне в свойства зоны, т.к. цвета на самой диаграмме слишком грязные и не подлежат выборке в окне превью свойства зоны.
Как я поступил.
В левой половине экрана в черно-желтой окантовке выбрал подходящий желтый квадрат, усреднил его цвет и в типе чистящего цвета Magic усреднил часть этого квадрата. Далее навел курсор на усредненную часть, переписал три числа RGB, которые и перенес в заливку бэкграунда зоны, не забыв отказаться от заливки части желтого квадрата.

Нельзя ли было вместо этой "пляски с бубном", проще передать полученный извне зоны усредненный цвет в заливку зоны?[/more]

Автор: bolega, Отправлено:20:36 06-05-2023

shch_vg
в КМ связанных с цветом кнопок есть команды копирования/вставки цвета

Автор: shch_vg, Отправлено:23:55 06-05-2023

bolega

Цитата:
в КМ связанных с цветом кнопок

Честно говоря, не осилил эту мысль. Мне бы конкретно показать, как передать усредненный цвет на любой желтой клетке орнамента моего примера в бэкграунд заливки зоны.

Автор: bolega, Отправлено:07:07 07-05-2023


Цитата:
Мне бы конкретно показать, как передать усредненный цвет на любой желтой клетке орнамента моего примера в бэкграунд заливки зоны.

ОК, только вы тогда точно сформулируйте, что вы понимаете под желтой клеткой и заливкой. Это участок изображения в редакторе/Preview или какая-то опция обработки. Откуда берется цвет - из изображения/кнопки/Preview? Где хранится усредненный цвет. Вот когда вы точно сформулируете вопрос, тогда можно будет и ответить точно. Каков вопрос - таков ответ.

Автор: shch_vg, Отправлено:11:11 07-05-2023

bolega

Цитата:
что вы понимаете под желтой клеткой и заливкой.

Мне казалось, что я достаточно понятно описал это в своем сообщении.
Попробую еще раз повторить, но не уверен, что могу сказать больше.
Я ссылаюсь на саб-таск, который выложил ранее.
Захожу в этом задании в RV, в котором выбираю вид отображения Zones.
В левой половине экрана развернутый "По высоте" исходный цветной скан, являющийся обложкой книги. Смысловую часть обложки окаймляет прямоугольный орнамент, состоящий из чередующихся черных и желтых полей. Выбираю в правой вертикальной части этого прямоугольника третье сверху желтое поле, создаю на нем маленький прямоугольник и жму вверху пиктограмму "Set clean color from selection.
Все, мне надо этот полученный усредненный цвет сделать фоновым в свойствах зоны на этой обложке.
Далее в своем вышеупомянутом сообщении я рассказал, как сделал я через RGB.
Нельзя ли это сделать проще.

P.S. Я сейчас готовлю пространную просьбу к Вам по Сканкромсатору, которую собираюсь послать в Ваш Личный Ящик. Если найдете время рассмотреть ее, прошу высказать таким же способом свое мнение о ней.

Автор: bolega, Отправлено:16:20 07-05-2023


Цитата:
Я ссылаюсь на саб-таск, который выложил ранее.

Я открыл это задание и перешел в свойства зоны.

Цитата:
в своем вышеупомянутом сообщении я рассазал, как сделал я через RGB.

В свойствах зоны я не увидел, чтобы был задан фон. Там нет ни цвета, ни галки на опциях цвета. Т.е. вы сделали одно, а в задании, которое якобы соответствует тому, что вы сделали, совсем другое. Мне это непонятно. Именно поэтому я еще раз спрашиваю: что вы имели ввиду под
Цитата:
сделать фоновым в свойствах зоны




Автор: shch_vg, Отправлено:16:44 07-05-2023

bolega
Опять же я это указал в своем more-сообщении.
Повторяю еще раз.
После получения усредненного цвета на указанном желтом поле закрасил часть этого поля этим цветом, навел курсор на закрашенную часть, записал RGB усредненного цвета.
Затем перешел в свойства зоны на закладку Paint, поставил галочку в Enable фона и нажал в этом же блоке пиктограмму ... В появившемся окне прописал полученные числа RGB и в окне фона получил нужный мне цвет.
Естественно, это я не включал в выложенный пример, так как хотел получить другой (более простой) возможный вариант заполнения цвета фона.

Автор: bolega, Отправлено:14:35 08-05-2023

shch_vg
цвет можно копировать/вставлять командами в КМ. Такие команды есть в КМ у:
- кнопки задания среднего цвета окна VR
- панельки опции цвета текста/фона зоны
- панельки с выбранным цветом в диалоге задания цвета

Автор: shch_vg, Отправлено:18:29 08-05-2023

bolega
К сожалению, мне так и не удалось расшифровать аббревиатуру "КМ".

Автор: mvk2006, Отправлено:18:33 08-05-2023


Цитата:
не удалось расшифровать аббревиатуру "КМ"

shch_vg
Контекстное Меню

Автор: shch_vg, Отправлено:19:06 08-05-2023

mvk2006
Спасибо!
А вообще какое-то странное чувство, что чем дольше нахожусь в этой теме, тем меньше понимаю написанное в ней.
Из трех вариантов bolega до конца вроде понял только один
Цитата:
- кнопки задания среднего цвета окна VR
, но как извлечь загадочное КМ из нее, так и не понял.
Думал, что по ПКМ, но в меню появляется только одна строка "Hide panel".
М.б. надо что-то настроить дополнительно?

Автор: mvk2006, Отправлено:19:41 08-05-2023


Цитата:
Думал, что по ПКМ

Да, КМ вызывается по ПКМ. В данном случае, думаю сама кнопка усредняет цвет (задает), который можно скопировать из соседней кнопки "Выбрать цвет"

Автор: shch_vg, Отправлено:19:51 08-05-2023

mvk2006

Цитата:
можно скопировать из соседней кнопки "Выбрать цвет"

А вот за это большое спасибо!
Все стало на свои места.

Автор: bolega, Отправлено:22:58 11-05-2023

Версия 6.91
Попытка №2, исправил баги, обновил whatsnew.
https://workupload.com/file/6KERr4qXUxf

Вспомогательные библиотеки остались прежние, от версии 6.75: https://workupload.com/file/BLuUj5mbpMx

Автор: TelecomUral, Отправлено:07:17 12-05-2023

bolega
не даёт покоя мысль про то, как устранять длинную линию от залома бумаги. Типа такой (лучше примера нету под рукой):



Нельзя ли как-то исхитриться и применить background cleaner вдоль вектора этой линии?

Автор: shch_vg, Отправлено:16:53 12-05-2023

bolega

Цитата:
Цитата:
в плане копирования СК не дружит с моей системой win10

Слегка изменил код. Посмотрим. У меня никогда таких проблем не возникало, ни в 7, ни в 10.

Если в 6.91 код изменен, то у меня проблема некопирования части бинарного скана в СК осталась.

Можно было бы думать на кривую операционку, но почему в Ирфане ее нет?

Автор: bolega, Отправлено:09:01 13-05-2023

shch_vg
Что-то я запамятывал:
- не копируется только в файле, полученном в какой-то определенной сторонней программе?
- копирование не идет в редакторе (панели) изображения [страницы/зоны/исходного файла]?
- проблема только для b/w?
Интересно, что никто на такое никогда не жаловался. Впрочем, 95% пользователей СК - молчуны.

Автор: shch_vg, Отправлено:20:01 13-05-2023

bolega

Цитата:
- не копируется только в файле, полученном в какой-то определенной сторонней программе?

В любой

Цитата:
- копирование не идет в редакторе (панели) изображения [страницы/зоны/исходного файла]?

Всюду

Цитата:
- проблема только для b/w?

Для цветных то же самое.

Просто я не придавал этому значения, т.к. никогда не копировал достаточно большие части цветных областей. В последнее время я стал работать на входе с б/ч сканами с плохими диаграммами и пытался копировать диаграмму с такой страницы в RV исходного скана для передачи ее на распознавание.
Вот тут меня и стал удивлять отказ от копирования.

Сейчас проделал такой эксперимент.
В вин10 запустил СК версии 6.8, в нем загрузил одну бинарную страницу и перешел в режим RV по Alt+S. Копирование диаграммы на ней дает ошибку.
Затем запустил старый комп с Сервер2003, зашел на него из вин10 по rdp.
Для чистоты эксперимента тот же модуль sk6.8 перенес на диск сервер2003, запустил его и загрузил ту же страницу. Перешел в RV по Alt+S и скопировал всю страницу. Скопировалось нормально, далее вставил скопированное в середину этого же файла.
Естественно, что и любая диаграмма копировалась и вставлялась в другое место без проблем.

Из этого следует, что есть какая-то проблема с вин10.
Но почему Ирфанвью в вин10 копирует без проблем?
Другой метод копирования?

Автор: TelecomUral, Отправлено:03:43 14-05-2023

shch_vg
читайте:
https://vebtech.ru/rukovodstva/bufer-obmena-ne-rabotaet-v-windows-10/


Цитата:
Буфер может не работать в Windows 10, версия которой была выпущена до октября 2018 года (1809). Проверьте, установлена ли у вас последняя версия операционной системы.


Вы мне писали ранее, что ваша версия винды 1709.

Автор: Dimi7777, Отправлено:09:18 14-05-2023

bolega

В версии 6.91 изменилась точность позиционирования вставляемой буквы из буфера обмена?

Например, я скопировал какую-то букву в буфер, хочу заменить в тексте плохую букву на нее (когда глифы нет смысла использовать, разовая акция)
Подношу курсор к верхнему левому углу заменяемой буквы, нажимаю "Вставить", а она вставляется криво (чуть выше или ниже нужного места). Раньше всё вроде вставлялось точно, а вот в 6.91 нет.
Если вставлять из таблицы глифов, то всё позиционируется точно.
Т.е. теперь если вставлять не из библиотеки глифов, а из буфера обмена, то автопозиционирование пропало?

p.s. Хотелось бы вернуть такую возможность (по возможности).
Особенно неудобно, когда вставляешь кусок слова, не букву. Потом приходится вручную двигать.


Автор: bolega, Отправлено:10:06 14-05-2023

Dimi7777

Цитата:
В версии 6.91 изменилась точность позиционирования вставляемой буквы из буфера обмена?

Не изменилось.
Отличие может быть в том, что когда кусок добавляется в глифы, он по умолчанию обрезается, избавляясь от лишней белой каемки. В случае кармана ничего не обрезается, и при вставке белая каемка отбирает на себя часть допуска на сдвиг, в итоге оставшегося допуска для правильного позиционирования может просто не хватить.

Цитата:
Подношу курсор к верхнему левому углу заменяемой буквы, нажимаю "Вставить",

что именно нажимаете?

Автор: Dimi7777, Отправлено:10:38 14-05-2023


Цитата:
что именно нажимаете?

Paste (Ctrl+V)

Автор: bolega, Отправлено:10:50 14-05-2023


Цитата:
Не изменилось.

Не, соврал. Действительно, когда вставка из кармана и это не глиф, автопозиционирование не задействуется. Сделал специально. Если надо, сделаю как опцию
Чтобы обойти это сейчас, копируйте в карман как непрямоугольное выделение

Автор: Dimi7777, Отправлено:11:34 14-05-2023


Цитата:
Если надо, сделаю как опцию

Да, сделайте, пожалуйста, такую опцию. Иногда очень удобно и нужно, когда надо вставить кусок слова/предложения или какого-то стандартизированого в пределах книги рисунка

Автор: shch_vg, Отправлено:13:38 14-05-2023

TelecomUral

Цитата:
Вы мне писали ранее, что ваша версия винды 1709.

Я все это помню, как и вот эти Ваши слова относительно Ирфана

Цитата:
Потому что они явно используют разные методы. Допустим, СК какую-нибудь стандартную библиотеку libtiff, а ирфан самописную или просто иную. Стандартная глюкует.

Скорее всего дело именно в этом, т.к. Ирфан тоже использует буфер, причем успешно.

Автор: bolega, Отправлено:14:20 14-05-2023

shch_vg

Цитата:
Ирфан тоже использует буфер, причем успешно.

Вы на одной странице уже раз десять упомянули про успешность ирфана, рекомендую вам перейти в топик http://forum.ru-board.com/topic.cgi?forum=5&topic=0373#1 и заниматься обработкой сканов там. А меня больше не беспокойте своими просьбами.

Автор: shch_vg, Отправлено:19:47 14-05-2023

bolega
Прошу прощения, если своими сообщениями затронул как-то Ваши чувства.
Однако считаю, что мои последние высказывания здесь не выходили на уровень оффтопа, так как я пытался выяснить, почему Ваша безусловно замечательная программа в моей операционной системе не выполняет действия, которые прекрасно выполняет у всех других пользователей.
Мне кажется, что мне это удалось выяснить.
Ваше право отвечать или не отвечать на пожелания и сообщения об обнаруженных ошибках, поэтому я учту Ваше пожелание не беспокоить Вас.
В заключение хочу заметить, что Ваша еще раз хочу отметить не имеющая аналогов программа вряд ли нуждается в ее защите путем подсчета того, сколько раз в этой теме упоминались другие программы.

Автор: MZN, Отправлено:02:24 15-05-2023

Если исходные файлы SK лежат в папке с длинным именем, то выходные SK помещает в новую папку с урезанным именем (больше 8 символов). Это неудобно. Приводить перечень программ, которые так не делают я уж не буду...

Автор: DmitryKz, Отправлено:06:03 15-05-2023

MZN
Пример бы показали, описание проблемы довольно абстрактное — что значит "папка с длинным именем" — у самой папки имя длинное, или у пути к ней, сколько символов в этой длине.

Специально создал папку, длина пути к которой 472 символа, положил туда несколько сканов. СК обработал их и сложил результат в папку out рядом с ними.
Извратился еще больше — в этой же папке создал еще одну с именем длина которого 99 символов — СК обработал их и сложил результат в папку out рядом с ними.
Длина пути к выходному скану — 583 символа. В пути имеются и кириллица и пробелы.

Может, у вас в самой Windows стоит ограничение на длину пути? Вряд ли СК будет сокращать имя — этим API самой операционной системы занимается.

Автор: MZN, Отправлено:06:25 15-05-2023

DmitryKz
Хм, спасибо! Вот так поговоришь с кем и поймешь. Я работал в сетевой папке, наверное в этом дело.

Автор: bolega, Отправлено:07:52 15-05-2023

shch_vg
Вы в каждое сообщение вставляли одну и ту же фразу, как в рекламе "папа может". Мне показалось, что это специально, чтобы подколоть.

Автор: aylocin, Отправлено:14:13 15-05-2023

bolega
SK, версия 6.91.
Несущественно, но все же:
Меню File, в списке последних открывавшихся теперь до 7 заданий, при попытке выбрать последние, 6-ое или 7-е задание ничего не происходит. Задание не загружается и не открывается. Первые пять из списка загружаются без проблем.

Автор: shch_vg, Отправлено:14:29 15-05-2023

bolega

Цитата:
Мне показалось, что это специально, чтобы подколоть

Зачем мне это нужно?
Просто довольно часто отвечают не те, кому вопрос задан, но более того читают только последнее сообщение, не вникая в суть вопроса. Если это не повторить, начинается сказка про белого бычка.

Добавлено:
MZN

Цитата:
Я работал в сетевой папке, наверное в этом дело.

Неверное предположение.
У меня это происходит и без сетевых папок.
Просто приведите конкретный пример полного имени папки и его урезанного варианта, тогда будет понятно, какой символ укорачивает имя папки.
Мой пример:
полная папка: d:\Обработка\0377. ЭЙВЕ М. Курс шахматных лекций. — М.-Л.; ФиТ,1930\
обрезанная папка: d:\Обработка\0377. ЭЙВЕ М. Курс шахматных лекций. - М.-Л

Похоже дело в ;, хотя и предшествующей ей точки тоже нет, так что возможно причина в их комбинации.

А если серьезно, там проблема более существенная, а именно, неуправляемость окном, вызываемом при попытке сменить адрес выходной папки на закладке Files. Вариант при достаточно длинном имени с разницей в последних символах неразличим в этом окне.
Подсказка выше обрывается на одном и том же символе от начала наименования.

Автор: shch_vg, Отправлено:01:05 16-05-2023

aylocin

Цитата:
Несущественно, но все же:

Так как нижнее задание в списке это то, с которым как правило ведется текущая работа, я бы не сказал, что это несущественно.

Автор: TelecomUral, Отправлено:08:09 16-05-2023


Цитата:
я бы не сказал, что это несущественно.

угу. очень неприятно.

Автор: bolega, Отправлено:09:16 16-05-2023

MZN
Да, shch_vg прав, проблема в символе ";". Эта фигня (в имени папки со сканами не должно быть этого символа) тянется еще с 1-й версии СК. Но именно в версии 6.91 я вроде бы эту проблему наконец-то решил.


Цитата:
именно, неуправляемость окном, вызываемом при попытке сменить адрес выходной папки на закладке Files

Диалоги выбора папок - стандартные windows. Они действительно убогие, я удивлен, почему столько лет (20? 30?) MS не мог предоставить разрабам нормальные шаблоны диалогов, включая всякие messagebox. Ситуация исправилась только начиная с win8, где MS наконец-то снизошли. Но мой компилятор их к сожалению не поддерживает, поэтому приходится пользоваться тем, что есть. Поищу что-нибудь кастомное.


Цитата:
очень неприятно

да. Исправлю

Автор: MZN, Отправлено:12:21 16-05-2023

bolega
Мистика. Версия 6.80
путь
\\Nas\work\0456. ЛЕВЕНФИШ Г.Я. Книга начинающего шахматиста.-Пер. со 2-го испр. изд.-Ереван; Айпетрат, 1963.-Арм\

проблема не проявилась...

Автор: TelecomUral, Отправлено:12:39 16-05-2023

у меня тоже точка с запятой в имени не вызывает проблем. проверял так:
g:\temp\ot\shch_vg\1923_pustaya_str\Обработка_0377. ЭЙВЕ М. Курс шахматных лекций. — М.-Л.; ФиТ,1930\0377. ЭЙВЕ М. Курс шахматных лекций. — М.-Л.; ФиТ,1930\SPT\

Автор: bolega, Отправлено:13:05 16-05-2023

MZN

Цитата:
проблема не проявилась...

Нужно сохранить задание. Проблема проявится только после загрузки задания в следующий раз. ";" парсится как сепаратор опций. В 6.91 для обхода неоднозначности я ввел кавычки.

Автор: MZN, Отправлено:15:00 16-05-2023

bolega
Сделал. Версия 6.91 создает папку
0456. ЛЕВЕНФИШ Г.Я. Книга начинающего шахматиста.-Пер. со 2-го испр. изд.-Ереван
6.80 аналогично. Может из-за того, что задание было создано в 6.80?

Автор: bolega, Отправлено:17:07 16-05-2023


Цитата:
Может из-за того, что задание было создано в 6.80?

Да. Сам факт сохранения задания в предыдущих версиях. Открытие его даже в 6.91 уже не вернет точку с запятой. Ну или вручную в spt в строке [A]=.... имя папки взять в двойные кавычки, тогда в 6.91 должно нормально отработать.

Автор: TelecomUral, Отправлено:05:27 17-05-2023

bolega
вы как-то писали, что метод Wolf для бинаризации не нужен. Его полностью заменяет закладочка illjumination.
Я получил сегодня скан (https://disk.yandex.ru/i/XLtaOvZLt4v8DQ) и никак мне не удаётся воспользоваться выравниванием фона. Подскажете? Я бы выложил задание, но оно уже с Wolf.
Получал либо огромное затемнение с краев листа (Normal), либо огромную чёрную полосу справа у левой половины разворота, в которой тонут буквы (Soft, Smart, иные варианты не пробовал, так как не разбираюсь в нюансах). Версия СК 6.91. Бинаризация всегда стояла Auto.

+
Кстати, я так и не научился, как показала нынешняя практика, пользоваться окошком preview закладочек Quality. Ну или СК сбоит, хотя это очень вряд ли. На методах Soft и Smart буквы стали белыми... на Normal вообще никаких изменений. Сколько лет у меня прям недружелюбные отношения с этим preview Одно время думал что уловил логику использования предпросмотра, на sharpen|unsharp, но нет.

Могу, конечно, записать полное видео утренних мучений.

Автор: bolega, Отправлено:08:30 17-05-2023

TelecomUral
preview для illumination не выполняется в окошке. Окошко используется только для локальных фильтров. illumination является глобальным в СК, его конечно можно применить к выделенному фрагменту, но результат будет совсем не тот, что при обработке. У закладки illumination есть свои две кнопочки для preview - для всего скана и для выделенного фрагмента.

У illumination есть такая особенность - они начинают свою "работу" с краев скана. В вашем же скане (редкий случай!) искусственно добавлена белая рамка, поэтому результаты всех методов за исключением normal, нулевые. Normal, s=1 с последующим bin=auto отрабатывает хорошо, я проверил на своем задании, вы свое не дали, поэтому что там у вас не пошло, судить не могу.
Для таких сканов по хорошему надо вводить новую опцию - перед illumination выполнять autocrop белой рамки.

Автор: TelecomUral, Отправлено:09:06 17-05-2023


Цитата:
Normal, s=1 с последующим bin=auto отрабатывает хорошо, я проверил на своем задании

задание с нуля, по рекомендации
https://disk.yandex.ru/d/IS7NzhZ15_8PYw


Автор: bolega, Отправлено:09:42 17-05-2023

TelecomUral
Уберите галку c protect pure colors. Она в большинстве случаев вообще не нужна.

Автор: TelecomUral, Отправлено:10:52 17-05-2023

хм. теперь хорошо. но эту галку я не взводил никогда, в голове моей пр неё ровно ноль...

Автор: shch_vg, Отправлено:19:19 17-05-2023

bolega
В главном окне 6.91 в КМ на зоне надо исправить clipborad

P.S. Какая-то мистика. Сегодня показывает нормально
Жалею, что не сделал скрин экрана.

P.P.S. Уф! Это на exclude-зоне.

Автор: SorokaSV, Отправлено:12:24 18-05-2023

Добрый день!
Скажите, что значит, что нет пункта меню о финализации файла в окне просмотра?

Автор: bolega, Отправлено:13:21 18-05-2023


Цитата:
что нет пункта меню о финализации файла в окне просмотра?

не рассчитан размер книги Calculate book size...
Либо страница обработана с опциями, не нуждающимися в финализации (тогда и на выходе не будет желтой подсветки)

Автор: shch_vg, Отправлено:23:36 18-05-2023

bolega
В 6.91 не работает hotkey Paste zone to cursor на полигональной зоне.

Автор: asku, Отправлено:21:22 19-05-2023

Добрый вечер. Такой вопрос.
В книге полно марашек. Вот они подсвечены красным:



И так практически на всех страницах.
Их можно убирать в режиме Mouse-up-Despeckle mode.

А нет ли функции/кнопки, чтобы одним махом все марашки убрать на всех страницах? Вот чтобы не глядя и без манипуляций, так сказать.

Автор: TelecomUral, Отправлено:11:03 21-05-2023

asku

а тогда не проще ли ФР использовать? Без проверки-то.

Автор: asku, Отправлено:12:43 21-05-2023

TelecomUral, Файнридер не может того, что может СК. Мне нужен был дежавю, а не текстовый файл.

Автор: TelecomUral, Отправлено:13:24 21-05-2023

bolega, прошу прощения за некоторый оффтоп.

asku
но ведь суть дежавю в сохранении внешнего вида, больше этот формат ни для чего не нужен. А вы предлагаете на точность плюнуть. Вполне себе ФР подойдёт. Он постраничность сохранит, рисунки сохранит, оформление сохранит.
Короче, вредная это опция, "всё везде стереть не глядя". Для книгообработки точно вредная.

Автор: shch_vg, Отправлено:15:59 27-05-2023

bolega
Возможно ли запомнить в файле задания размеры окна, открывающегося по Ctrl+I?
Если длинные пути, то приходится раздвигать это окно, но после перезапуска СК размер окна становится стандартным.

Автор: TelecomUral, Отправлено:07:59 01-06-2023

bolega
а это правильное поведение? Просматриваю нефинализированную страницу, ставлю её в fit width, сдвигаю к середине по вертикали. Мне надо приглядеться, как вышла обработка шрифта. Затем щёлкаю на кнопку "стрелка влево" и масштаб меняется на fit page. Страница, естественно, предыдущая стала.

Автор: bolega, Отправлено:10:43 01-06-2023

TelecomUral
Может, у вас включена опция fit page? Вы разово даете команду меню fit width, она исполняется, но при переходе на предыдущую страницу срабатывает режим fit page. По другому не смог воспроизвести ваш случай.

Автор: TelecomUral, Отправлено:13:11 01-06-2023

аа! ну да. fit page включена. спасибо.

Автор: bolega, Отправлено:14:41 01-06-2023

Добавил в filter-зоны опцию (галочку) Transformation. Напомню, что filter-зоны не генерируют на выходе файлы зон. Они просто применяют заданный фильтр к области скана в процессе его обработки. В данном случае выполняется либо поворот участка, либо исправление искажения, в зависимости от того, как заданы вершины зоны (их должно быть ровно 4). Если зона представляет собой повернутый прямоугольник, то он будет развернут так, чтобы его боковые стороны стали вертикально. Если зона представляет собой трапецию (любой формы, прямой, наклонной, косой) то она трактуется как форма перспективного искажения, которое и будет исправлено, т.е. трапеция распрямляется в прямоугольник.
Аналогичный функционал добавлен и в окно VR, только как новый режим, в интерактивной форме.

Автор: zvezdochiot, Отправлено:14:52 01-06-2023

bolega say:
[quota]
Если зона представляет собой трапецию (любой формы, прямой, наклонной, косой) то она трактуется как форма перспективного искажения, которое и будет исправлено, т.е. трапеция распрямляется в прямоугольник.
[/quota]
Крутая штука, наверное. Я в ScanTailor всегда о такой мечтал. Но реализовать удалось только в другом проекте. Помимо описанного вами подсчитывал так же площадь трапеции и использовал условие: area(source) == area(target). А для соотношения сторон результирующего прямоугольника расчитывал СКО координат углов трапеции: W/H == stdev(x)/stdev(y), при этом центр у прямоугольника и трапеции - одна и та же точка.


Автор: bolega, Отправлено:15:02 01-06-2023

zvezdochiot

Цитата:
использовал условие: area(source) == area(target).

Интересно. А что это дает?

Автор: zvezdochiot, Отправлено:15:27 01-06-2023

bolega say:

Цитата:

А что это дает?

Сохранение масштаба. Более достойного условия для этого я не нашёл. Второе же условие обеспечивает сохранение "пропорций" в известном смысле слова. И слегка я упростил, речь собственно ведётся не за трапецию, а за произвольный четырёхугольник. С трапециями то попроще как то можно, наверное.

Автор: TelecomUral, Отправлено:09:54 03-06-2023

bolega
импортирую пдф с длинным именем. Но не особенно. И заметил что СК режет название папки "на самом интересном месте":
i:\scanshik10\obrabotka\import_PDF_SK_1\Справочник по электрическим сетям 0.4-35 кВ и 110-1150 кВ, т.X\

А файлы называются как раз ...т.XI, ...XIII, ...XV
Получается всё в одну папку. Конечно, СК предлагает переименовать, но автоматом добавляет "1". Это поведение как-то можно отрегулировать?

Автор: bolega, Отправлено:12:38 03-06-2023

zvezdochiot

Цитата:
Сохранение масштаба.

При больших перспективных искажениях в СК с этим проблема...

TelecomUral
Добавил возможность увеличивать длину папки

shch_vg

Цитата:
Возможно ли запомнить в файле задания размеры окна, открывающегося по Ctrl+I?

Учел

Автор: zvezdochiot, Отправлено:14:45 03-06-2023

bolega say:

Цитата:

При больших перспективных искажениях в СК с этим проблема...


И как вы решаете эту "проблему"? Страницы с разным масштабом или с разным масштабом по высоте и ширине - это тоже как то не алё. Какие меры регулирования в данном вопросе принимаете?

Автор: shch_vg, Отправлено:17:57 03-06-2023

bolega

Цитата:
Учел

Апетит приходит во время еды!
Нельзя ли то же самое сделать с параметрами в окне Zones->Bulk operations?
В последнее время очень часто приходится переводить exclude-зоны в picture-зоны, поэтому удобно было бы запоминание в задании состояния по крайней мере трех параметров:
Operations, Scope, а также в появляющемся дополнительно блоке после выборки Operations=Change type значение блока Change type to.
В отношении последнего параметра кажется достаточным прописать по умолчанию значение Picture при выборке значения первого параметра, равного Change type.

Автор: bolega, Отправлено:10:16 04-06-2023

zvezdochiot

Цитата:
И как вы решаете эту "проблему"?

Пока никак. Те сканы, с которыми имел дело, имели небольшие искажения, и проблема не проявлялась. Встретится тяжелый случай - буду тогда думать. Это про обработку. В интерактивном же режиме можно исправлять масштаб вручную.

shch_vg
Кроме scope, учел. Scope намеренно по умолчанию выставляется на тек. страницу, и такое поведение останется.


Автор: zvezdochiot, Отправлено:13:27 04-06-2023

bolega say:

Цитата:

В интерактивном же режиме можно исправлять масштаб вручную.

Это, разумеется, понятно. Вопрос за выбор дефолтного состояния (или автонастройки, в зависимости от алгоритма). И наиболее интересен ваш рецепт сохранения пропорций. В данном преобразовании это больная тема.

PS: В SK полно неочевидных решений, которые дали мне много для размышлений и как результат мои правки в ST дали неожиданный даже для меня результат. Так что ваши "решения" мне интересны. И всё это только по описаниям и настройкам. Сам SK я ни разу не пользовал (не та ось).


Автор: D1D1D1D, Отправлено:00:32 14-06-2023

Можно ли в SK на изображения с текстом наложить одну и ту же картинку, в виде рамки?

Автор: zvezdochiot, Отправлено:01:02 14-06-2023

D1D1D1D say:

Цитата:

на изображения с текстом наложить одну и ту же картинку, в виде рамки?

Такие "фокусы-покусы" стоит делать вне пределов SK и ST. В них такие "колдунства" неэффективны (да и неуместны). Особенно в PDF, где можно создать одну страницу со штампом, после чего наложить этот один штамп (он так и останется одним, а не умножится на кол-во страниц) на все страницы с помощью PDFTK Builder. С DjVu уже такой "фокус-покус" не прокатит, там накладывать придётся на каждую страницу по отдельности.

PS: Ежели штамп для PDF в виде рамки, то её стоит разбить на 4 области (2 боковых, верхнюю и нижнюю), чтобы сердцевина осталась пустой. Иначе придётся возится с маской прозрачности.

Автор: D1D1D1D, Отправлено:01:56 14-06-2023

zvezdochiot
Видимо, проще будет в InDesign это сделать.

Автор: TelecomUral, Отправлено:06:28 14-06-2023


Цитата:
D1D1D1D
Можно ли в SK на изображения с текстом наложить одну и ту же картинку, в виде рамки?

можно.

Автор: bolega, Отправлено:07:55 14-06-2023

Если в Out-task наложить на страницу зону, например, рамку, потом размножить на нужные страницы, то в PDF СК поместит изображение только один раз, когда она встретится впервые. Последующие страницы будут просто ссылаться на рамку. Это для информации. Несомненно, в специализированных редакторах pdf это можно сделать лучше и быстрее, спорить не буду.


Добавлено:

Цитата:
проще будет в InDesign это сделать.

Сами спросили, сами ответили. Зачем вообще было вопрос поднимать? Вас так убедило мнение человека, который ни разу не юзал СК?

Автор: D1D1D1D, Отправлено:09:08 14-06-2023

bolega
Со специализированной я не работал, поэтому хотелось обойтись СК.

Автор: zvezdochiot, Отправлено:10:45 14-06-2023

bolega say:

Цитата:

убедило мнение человека, который ни разу не юзал СК?

Звиняюсь. Походу дал неверную инфу. Вот уж действительно SK полон неочевидных решений.

Автор: TelecomUral, Отправлено:13:35 14-06-2023

bolega

Цитата:
Если в Out-task наложить на страницу зону, например, рамку

а я не понял, почему в out-task? Как тогда сделать ее прозрачной в центре?

Автор: bolega, Отправлено:08:02 15-06-2023

TelecomUral

Цитата:
почему в out-task? Как тогда сделать ее прозрачной в центре?

Лучше конечно сделать зону-рамку с нужной прозрачностью в исходном задании, а в out просто размножить ее на все страницы.
Теоретически можно добавить сразу в out-задании как внешнюю pic-зону. Но здесь есть два нюанса. Первый, если добавить зону как png или tif-файл, в котором уже задана прозрачность, то из-за бага в СК прозрачность будет проигнорирована (баг уже исправил). Если же прозрачность задать на лету, т.е. включить в свойствах зоны transparent, то это решит проблему, но тогда, увы, СК будет делать это для каждой страницы с зоной, и внутри pdf будет не одна, а много копий зоны. Я поработаю над этим, чтобы оптимизировать и такой случай.

Автор: zvezdochiot, Отправлено:08:13 15-06-2023

bolega say:

Цитата:

Лучше конечно сделать...

А разбить рамку на 4 зоны (2 боковых, верхнюю и нижнюю) не вариант? На случай, когда хотелось бы иметь PDF без масок прозрачности?

Автор: TelecomUral, Отправлено:08:15 15-06-2023

bolega

Цитата:
а в out просто размножить ее на все страницы

это критично для создания пдф без дублирования объекта? Размножать именно в out-task?

Автор: bolega, Отправлено:10:35 15-06-2023

zvezdochiot

Цитата:
А разбить рамку на 4 зоны (2 боковых, верхнюю и нижнюю) не вариант?

Можно и так, это вообще проще.

TelecomUral

Цитата:
это критично для создания пдф без дублирования объекта? Размножать именно в out-task?

Вы должны понять, как СК избегает дублирования: перед отрисовкой в pdf очередной зоны СК проверяет имя файла зоны, если такое имя уже встречалось, и параметры сжатия те же, он использует ссылку на уже добавленный файл. Если имя другое, то файл добавляется. Таким образом, чтобы не было дублирования, нужно обеспечить одинаковость имен выходных файлов зон в исходном задании либо внешних зон в out-задании.

Автор: zvezdochiot, Отправлено:11:16 15-06-2023

bolega say:

Цитата:

СК проверяет имя файла зоны

А связку размер+SHA1 для проверки не стоит пользовать? Такая проверка полностью ликвидирует дубликаты блоков, независимо от имён.


Автор: TelecomUral, Отправлено:12:13 15-06-2023

bolega

Цитата:
Таким образом, чтобы не было дублирования, нужно обеспечить одинаковость имен выходных файлов зон в исходном задании либо внешних зон в out-задании

Вы не ответили на мой вопрос - стало просто ещё более непонятно.
Я же не знаю, что происходит в потрохах СК при размножении зон. Плюс с внешними зонами я вообще никогда плотно не работал, тупо использовал out-task для создания дежавюшек.

Автор: bolega, Отправлено:13:06 15-06-2023

TelecomUral
Ответ зависит от того, где брать рамку. Давайте с этого начнем. Вариант 1: рамка нарисована на какой-то (или всех??) странице сканов исх. задания. Вариант 2: у вас есть рамка отдельным файлом. Вариант 3: рамки нет, ее вы будете рисовать сами на псевдозоне после обработки исх. задания.

Автор: TelecomUral, Отправлено:14:10 15-06-2023

bolega
я предполагал отдельный файл. Вариант 2.

Автор: bolega, Отправлено:15:22 15-06-2023

Если вы непосредственно в исходном задании вставите рамку как внешнюю картинку на каждый скан и при этом в зоне будет включена хоть одна опция, например, transparent, то СК создаст столько разных файлов зон на выходе, сколько было их на входе. В этом случае дублирование неизбежно.
Поэтому рамку достаточно вставить только на одну страницу. Обработать. Создать out-задание, в котором эту единственную зону скопировать на все страницы. В этом случае дублирования не будет.
Вариант с контролем контрольных сумм обработанных файлов зон, о котором упомянул zvezdochiot, более универсальный, позволит находить одинаковые зоны даже в случае различия их имен. Но такой радикальный (и более трудоемкий) случай я никогда не рассматривал, т.к. проблема дублей никого до сих пор не волновала, и на повестке не стояла. Вариант с именами меня всегда устраивал, т.к. он безошибочный, но не оптимальный.

Автор: TelecomUral, Отправлено:15:24 15-06-2023

понятно, благодарю!

Автор: zvezdochiot, Отправлено:15:47 15-06-2023

bolega say:

Цитата:

и более трудоемкий

Ежели чисто на хэшах сравнивать, то да. Но ни одна "сравнивалка" файлов так не делает. Сначала сравнивают размер файла, потом первый символ, потом последний. И только если все перечисленные проверки не дали различий, сличаются хэши. Хотя в вашем случае наверное проще будет работать с полным списком хэшей (меньше мороки), да и затраты времени на их вычисление не такие большие, по сравнению с операциями с самими графическими файлами.
Но и ваше решение с именами файлов вполне годно по соотношению затраты/результат. И всё в руках пользователя, как говорится "чтобы ваша попка была сухой и чистой, сушите её и чистите".

PS: К тому же "поиск дубликатов" всегда можно внести отдельной опциональной функцией.

Автор: VadimirTT, Отправлено:15:23 17-06-2023

А есть ли в драфткромсейте кривое-фигурное выделение?
Правая граница, как это сделать?
Ссылка

Автор: TelecomUral, Отправлено:23:25 17-06-2023

VadimirTT
correct illjumination всё прекрасно вытягивает.

Автор: VadimirTT, Отправлено:00:01 18-06-2023

TelecomUral
Ещё бы рассказать, какие там нужны настройки.

Автор: TelecomUral, Отправлено:07:40 18-06-2023

VadimirTT
https://disk.yandex.ru/d/a1D4IP_EcWN5DQ

Автор: bolega, Отправлено:09:17 18-06-2023

VadimirTT
еще вариант. убрал марашки
https://workupload.com/file/B28ZzLUPB2C

Автор: VadimirTT, Отправлено:13:08 18-06-2023

TelecomUral
bolega
Спасибо!

Автор: shch_vg, Отправлено:13:25 18-06-2023

bolega
Хорошо бы в окне Find zone сразу устанавливать курсор в поле идентификатора.
Сейчас по инерции начинаешь набирать номер, но оказывается, что это впустую.

Автор: zvezdochiot, Отправлено:14:59 18-06-2023

bolega say:

Цитата:

еще вариант

А почём на выходе 300dpi? После применения порога буквы грубоватыми получаются. На 600dpi гораздо менее угловатые, а на 300dpi прям бросается в глаза.

PS: И неплохо бы применить горизонтальный dewarping хотя бы с помощью PhotoQuick:
70.jpg после горизонтального 9-ти точечного DeWarping без сглаживания

Автор: Benoni, Отправлено:18:34 19-06-2023

bolega

Цитата:
убрал марашки

Есть видео на эту тему?

Автор: Slavik2012, Отправлено:19:03 19-06-2023

Benoni

Цитата:
Есть видео на эту тему?

Да, если бы видео, было бы отлично!

Автор: mvk2006, Отправлено:19:30 19-06-2023


Цитата:
Есть видео на эту тему?

Benoni
Slavik2012
Я правильно понял, что видеоуроки из шапки (Туториалы по ScanKromsator v6.72 и выше) уже пройденный этап?

Автор: Benoni, Отправлено:20:00 19-06-2023

mvk2006
указать точнее название уроков на эту тему можете?

Автор: mvk2006, Отправлено:20:56 19-06-2023

Benoni
Если нажать на ссылку в шапке, то можно увидеть исчерпывающую картинку, где добавлять что-то еще по-моему излишне. Уже в названии уроков есть то, что вы спрашиваете. Есть главы, есть расписанный таймлайн на каждый нюанс.

Автор: Benoni, Отправлено:21:29 19-06-2023

mvk2006
Большое спасибо.

Автор: Slavik2012, Отправлено:21:51 19-06-2023

mvk2006
Большое спасибо!

Автор: asku, Отправлено:00:01 20-06-2023

Benoni, Slavik2012, навряд ли bolega для удаления марашек в примере VadimirTT использовал метод из видео. Скорее всего имелось в виду, что чуть подправив настройки, чтобы марашек стало меньше.


Автор: TelecomUral, Отправлено:07:01 20-06-2023

bolega

Цитата:
еще вариант. убрал марашки

Почему я пробую в вашем задании повторить обработку, и результат хоть и немного, но отличается??

Вот, слева "ваш" из zip, справа "мой". изменена только буква префикса выходного файла.



Например, в слове "жизней" в последней букве пропал кусочек сверху слева. марашки немного иначе идут, кое-где на буквах заметно иное сглаживание.

Автор: bolega, Отправлено:08:11 20-06-2023

TelecomUral

Цитата:
результат хоть и немного, но отличается??

я делал несколько вариантов, наверно, не сохранил опции


Цитата:
для удаления марашек в примере VadimirTT использовал метод из видео.

да вроде такой же. Включил подсветку, включил метелку despeckle, в КМ включил marashki mode. Сначала включил там же delight mode, справа вдоль последнего столбца очистил местами ложные марашки (красное ушло), затем нажал "d".
Вертикальные черточки справа, оставшиеся от тени, удалил через ctrl-click

Автор: VadimirTT, Отправлено:19:33 20-06-2023

Может это паранойя? Скачано из шапки.

[more=смотреть]
[/more]

Автор: shch_vg, Отправлено:23:40 20-06-2023

VadimirTT
Тот самый случай, когда "вся рота идет не в ногу, один поручик в ногу".

Автор: Dart Raiden, Отправлено:21:17 21-06-2023


Цитата:
Может это паранойя?

Это "ложное срабатывание".

Автор: daa2013, Отправлено:15:22 23-06-2023

У меня возникла какая-то странная ситуация. Несколько дней редактировал один файл (сложную картинку). В принципе, даже уже полностью его сделал. Дня три чистых трудозатрат - для меня это ОЧЕНЬ много.

Утром сбойнул и перезагрузился комп. В результате сейчас вместо тифа на 15-18 мегов в папке out лежит странный тиф на 300 kb и естественно не открывается. Работа нескольких дней пропала.

1. Вопрос - как он вообще мог перезаписаться в момент перезагрузки компьютера, если СК был открыт, файл был открыт, но активное редактирование в этот момент не велось ?

(Есть гипотеза, что пару дней назад я поправил ему яркость в фотошопе, потом сохранил. А в момент перезагрузки/или после перезагрузки фотошоп это вспомнил, и стал туда что-то повторно записывать, так и повредил. В момент перезагрузки я работал в Шопе. После перезагрузки тот файл, в котором я непосредственно работал, Шоп восстановил.)


2. Может, есть какая-то версия в папках temp или где еще она может быть ?
UPD посмотрел папки AppData - но там вроде SK нет. У меня Win7 , если что.


3. Есть ли в опциях СК какая-нибудь галка, чтобы принудительно создавать bak-файлы в папках out для потенциально геморройных проектов ?

Автор: TelecomUral, Отправлено:16:41 23-06-2023

оффтоп
daa2013
Вы прям как вчера родились. Навевает серединой 90х, нашей офисной секретаршей "ой... а я не сохранила, можно что-нибудь сделать, а то полдня работы пропало?" - это когда я перфоратором в 220 попал.

Я не очень верю, чтоб у фотошопа не было корректного бекапа и, главное, отката после восстановления.

(+
я никогда не работаю "чужими" прогами в папке хоть СК, хоть кого другого. Сделал копию, поработал с ней, записал вместо старого файла. плавали, знаем.)

Автор: bolega, Отправлено:17:05 23-06-2023


Цитата:
Вопрос - как он вообще мог перезаписаться в момент перезагрузки компьютера, если СК был открыт, файл был открыт, но активное редактирование в этот момент не велось ?

В отличие от многих программ, СК не блокирует файл в процессе редактирования. В окне RV файл считывается в память, после этого файл закрывается. Т.е. он никогда не держится открытым! Запись в файл производится только либо в момент перехода на другую страницу, либо по команде меню. Поэтому повредиться файл может только в одном случае: если выключение произошло в точности в момент записи на диск. Какие-то следы от файла могут остаться в системной temp-папке юзера, но это не полноценные копии, а undo-куски, восстановить из них изображение невозможно.

Кстати, если вы вызываете внешний графич. редактор прямо из меню СК, то СК сначала создает копию файла и именно ее загружает в редактор. И только получив от пользователя согласие, переносит копию обратно. Если вы вызывали ФШ таким способом, проблемы бы не случилось.


Добавлено:

Цитата:
Есть ли в опциях СК какая-нибудь галка, чтобы принудительно создавать bak-файлы в папках out для потенциально геморройных проектов ?

Могу сделать

Автор: daa2013, Отправлено:18:43 23-06-2023


Цитата:
Вы прям как вчера родились.


Естественно, всё было сохранено. В папке лежал исходник. В папке out лежал сохраненный обработанный файл, в который я время от времени вносил новый штрих-другой. Отвлекусь от работы, минут пять поредактирую. Потом по новой. Возможная потеря пяти минут работы меня не пугала.
Такого, чтобы файл полностью исчез (повредился) у меня с СК никогда не было, так что я даже о таком и не думал.

С вордом или эксплейном я регулярно сохраняю не просто файл, но файл с новой цифрой. Для текстов обычно 10-11 редакций. Хрестоматия 130 или 140 итераций было. Тоже такое проходили, файл исчезает (или безнадежно повреждается) ровно в момент сохранения.


Если СК выполняет операцию-запрос "Current image modified. Save changes?" копии файла нигде не создается, правильно ? Жалко.

Могло ли, теоретически, такое произойти, что где-то была нарушена цепочка Undo (терминировался из-за нехватки памяти процесс, или повредился файл с undo-кусками) и это сам СК вписал некорректность в файл ?

Кстати, заодно про Undo. Может уже такое и есть. Мне часто не хватает типа-Redo. Я ставлю выделение, а у меня зажата зеленая метелка и выделенное исчезает. Я делаю откат - оно восстанавливается. Но я при этом теряю выделение.
Нельзя ли сделать шорткат какой, чтобы далее вернулось выставленное перед этим выделение без связанного с ним действия ? (т.к. будет выполняться другое). ?


Добавлено:

Цитата:
Могу сделать

На грустном опыте обнаружилась определенная полезность этого.
Во всяком случае, когда я редактирую исходники в режиме show source file бекапы-то создаются. Иногда даже пригождаются.
UPD если я ничего не путаю, конечно.

Автор: TelecomUral, Отправлено:03:28 24-06-2023


Цитата:
Такого, чтобы файл полностью исчез (повредился)

может, чисто дисковый сбой. То есть операционка нагадила.

Автор: daa2013, Отправлено:10:54 26-06-2023

Я не знаю, что точно произошло. Это могло быть всё, что угодно.

Я подумал, что в окне RV была бы полезна кнопка "сделать бекап" Которая выполняла бы сохранение и одновременно генегрировала бы лишнюю копию результата. (Возможно, с увеличивающимся номером). По аналогии с кнопкой "сохранить библиотеку глифов" (Save glyphs). Я часто ею пользуюсь, когда библиотеку глифов собираю, и переживаю, что результаты пропадут. (А комп при этом не выключаю, и задание-таск не пересохраняю).

Это, естественно, будет полезно не когда книга из 600 однотипных страниц обрабатывается, а когда одна-две уникальных картинки много дней редактируются.

Автор: asku, Отправлено:21:17 28-06-2023

bolega
А как можно увеличить скорость перемещения скана в VR, когда используются Alt + стрелки вправо/влево?

В файле sk.6.91.whats.new.txt нашел такое:
- VR: В Clear options добавлен параметр scroll step - задает шаг смещения отображения скана при нажатии на кнопки полос прокрутки либо на
клавиши со стрелками на клавиатуре.


Увечил параметр до максимума — до 200, и скорость не увеличилась.

Автор: TelecomUral, Отправлено:07:08 29-06-2023

asku
"шаг сдвига изображения" сверху


Автор: bolega, Отправлено:10:41 29-06-2023

asku
Здесь возможна путаница: скролл регулирует отображение изображения, т.е. визуальное смещение страницы внутри панели, в случае если оно целиком не вмещается в него. Alt + стрелки выполняют сдвиг содержимого изображения, т.е. меняют его.

Автор: zvezdochiot, Отправлено:15:37 29-06-2023

bolega

А 64-битные версии есть в наличии? Хотелось бы под Wine запустить. Вроде как утверждается, что пашет. А захламлять систему кучей 32-битных библиотек ради одной проги как то не очень хочется.

Автор: bolega, Отправлено:17:09 29-06-2023

zvezdochiot

Цитата:
А 64-битные версии есть в наличии?

нет к сожалению...

Автор: shch_vg, Отправлено:00:11 30-06-2023

В рабочем варианте 6.8 вдруг в главном окне пропали окошки включения резаков.
В начальной версии этой программы все на месте.
Что и где я мог зацепить, не хочется заново перепрописывать все настройки.

Автор: bolega, Отправлено:03:28 30-06-2023

shch_vg
В разделе [CommandPanels] удалите строку MWCmdPanels=...
Удалите также все строки из раздела [VRCommandPanel]

Автор: SVK2I, Отправлено:09:37 30-06-2023

zvezdochiot

Цитата:
А 64-битные версии есть в наличии? Хотелось бы под Wine запустить. Вроде как утверждается, что пашет. А захламлять систему кучей 32-битных библиотек ради одной проги как то не очень хочется.


Вы, как надо понимать, работаете на Linux. И для работы с SK обязательно нужна Wine. Уж если будете захламлять, то не систему, а только Wine, и что из того, что там будут библиотеки одновременно 32-х и 64-х битные, как это помешает работе Wine?


Добавлено:
shch_vg

Цитата:
В рабочем варианте 6.8 вдруг в главном окне пропали окошки включения резаков.  
В начальной версии этой программы все на месте.
Что и где я мог зацепить, не хочется заново перепрописывать все настройки.


А что Вы так боитесь заново установить программу? Это не переустановка ОС. Вся программа содержится в одном файле: SK[номер версии].exe. Все настройки, по очень мудрому решению автора, сохраняются в INI-файле и в файле личного профиля. Запустите в отдельной папке чистую программу, потом запустите Вашу рабочую версию программы и открывайте настройки той и другой программы и просто сравнивайте их, и обнаружите моменты, в которых Вы "накосячили", исправив их, рабочая версия будет работать нормально. Я именно таким образом устранял свои косяки, потом из правильно настроенного варианта программы сохранял INI-файл и файлы личных профилей, и, если что-то не так пошло, просто перезаписывал эти файлы в испорченный вариант программы. И все восстанавливалось превосходно.

Автор: asku, Отправлено:12:42 30-06-2023



Интересно, кому мешает эта статья в Википедии?

Автор: zvezdochiot, Отправлено:13:22 30-06-2023

SVK2I

Цитата:

если будете захламлять, то не систему, а только Wine


Ежели не знаешь, то и не говори ничего:

Цитата:

please execute "dpkg --add-architecture i386 && apt-get update && apt-get install wine32"

После применения этих команд система станет свалкой 32-битных либ. Такие вот дела.

Автор: SVK2I, Отправлено:14:27 30-06-2023


Автор: zvezdochiot, Отправлено:14:42 30-06-2023

SVK2I say:

Цитата:

Команды, которые ты привел

Эти команды - это ответ 64-битного Wine на попытку запуска SK. Но вам виднее...

Цитата:

а мороки с оптимизацией – куча.

Делаю 32 и 64 битные версии тулз с одного кода без "кучей оптимизаций" в mingw. Но вам виднее...

Автор: shch_vg, Отправлено:14:42 30-06-2023

bolega
Большое спасибо, помогло!
Правда, методом сравнения удалось выяснить, что и при существующем разделе [VRCommandPanel] появляются окошки после замены 4-го параметра в строке MWCmdPanels с 1 на 0.
Без всего раздела [VRCommandPanel] тоже работает нормально с 4-м параметром, равным нулю.
Ваше мнение: оставить старый раздел [VRCommandPanel] или лучше удалить его?

Автор: SVK2I, Отправлено:14:57 30-06-2023

[more]
Цитата:
Эти команды - это ответ 64-битного Wine на попытку запуска SK. Но вам виднее...


Здесь я ничего не могу Вам возразить, потому что хотя и имею железо 64-х битное с гигабитным портом RJ-45, но, по ряду причин (после опробования 64-х битных систем и сравнения работы нужных программ с 32-х битной системой, пришел к выводу, что 64-х битные системы дадут много хлопот после того, как 32-х битные системы отлажены идеально), испльзуем Windows 32-х битные и на ней в основном работаем, особенно с SK.
Astra-Linux, естественно, 64-х битная. Но, мой сын, почему-то Wine не любит, поэтому я ее себе не ставлю. Однако, будет возможность, ин шэ Аллаh, поставлю специально для проверки Ваших утверждений Wine 64-х битную, чтобы посмотреть как на ней будет работать SK, и тогда отпишусь, ин шэ Аллаh!

Добавлено:

Цитата:
Делаю 32 и 64 битные версии тулз с одного кода без "кучей оптимизаций" в mingw. Но вам виднее...


Мой сын также считает, но я же не автор SK, зачем же меня подкалывать этим, нехорошо, товарищ, поступаете!


Добавлено:
asku

Цитата:
Интересно, кому мешает эта статья в Википедии?


Мне представляется, что эта статья мешает автору программы Scan Tailor, вот он и изощряется всякими путями убрать статью о превосходящей его программе SK. Я уже этому умнику там отписал три возражения, призываю всех форумчан сделать то же, потому что сейчас идет режим голосования (терпеть не могу голосования, но что же делать в данном случае), после чего будет решен вопрос окончательно!

Адрес обсуждения: https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F:%D0%9A_%D1%83%D0%B4%D0%B0%D0%BB%D0%B5%D0%BD%D0%B8%D1%8E/17_%D0%B8%D1%8E%D0%BD%D1%8F_2023#ScanKromsator

Возражения-ответы можно оставлять без регистрации в Википедии.

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
[/more]

Автор: zvezdochiot, Отправлено:15:55 30-06-2023

SVK2I say:

Цитата:

эта статья мешает автору программы Scan Tailor

Довольно странное умозаключение, учитывая что автор ST уже 10 лет к нему не прикасался. То же можно сказать и о его форке STA, автор которого уже 3 года как бросил проект. Короче говоря, все авторы ST (и его форков, за исключением STU) давно их бросили и проекты находятся в руках совсем других энтузиастов, которым не до жиру. Так кто кому мешает то? Очередная теория заговора?

А статью в вики хотят удалить, потому что автор SK русский и прога русская. Такие вот дела.

Автор: SVK2I, Отправлено:16:12 30-06-2023

[more]zvezdochiot

Цитата:
А статью в вики хотят удалить, потому что автор SK русский и прога русская. Такие вот дела.


Если бы это было так, то тогда взяли бы и просто удалили бы, а не давали возможность обсуждения, прежде удаления. А по признаку национальности в мире никто не принимает решения, потому что хотя среди русских много негодяев, но и есть порядочные люди, которые не только имеют право на существование, но и, фактически, правят в этом мире с дозволения Аллаха Величайшего.

Что же касается "теории заговора", которую пытаются представить как объект маргиналов, то прочитайте известную во всем мире книгу "Протоколы сионских мудрецов" (правильнее называть ее "Протоколы сионских идиотов"), её можно скачать с Флибусты. И Вы убедитесь, что он реально существует. Кроме того, это доказал американский ученый, порядочный человек, Эрик Дьюбэй, выпустив монументальные труды на эту тему и о том, что Земля не шар, а плоская, и никакого космоса не существует, как и полетов в космос, а все это глобальный обман закулисного мирового правительства. Эти книги называются так: "Заговор Атлантов", "Сокрытие ровной поверхности Земли" и "200 доказательств того, что Земля не шар". Эти книги есть на Флибусте.

Вход на Флибусту только с подменой IP, и адрес ее правильный: http://flibusta.is/

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!

Добавлено:
zvezdochiot

Цитата:
Эти команды - это ответ 64-битного Wine на попытку запуска SK. Но вам виднее...
Делаю 32 и 64 битные версии тулз с одного кода без "кучей оптимизаций" в mingw. Но вам виднее...


Сейчас сидел вечер на Astra-Linux, которая 64-бит, другой просто не бывает. Оказывается, сын установил Wine, поскольку надо было заставить работать WinRAR в графике и Total Commander в графике. Все у него получилось, эти программы отлично работают. Но они имеются в списке AppDB.

Действительно, в системе стоят два Wine – 64 и 32 бита, потому что эта песочница для программ 64 и 32 бита требует свою разрядность. И если у Вас при попытке запустить SK система потребовала установить 32 бита Wine, это правильно и надо делать. Но, к сожалению, несмотря на то, что вроде бы наши Wine установлены достаточно полностью, запустить SK у меня не получилось. Сын не стал этим заниматься, потому что эта программа ему неинтересна, и говорит, что хлопот, чтобы решить эту проблему слишком много, и проще автору скомпилировать ее для Linux, и тогда проблем не будет.

В списке AppDB ее тоже нет, а это значит, что разработчики Wine ее не тестировали, и все страдания переложили на плечи энтузиастов-любителей.

Если у Вас получится запустить SK на Wine, то, пожалуйста, отпишитесь, как это у Вас вышло, потому что мне хочется все же суметь запустить мою любимую программу на Астре, чтобы и там можно было бы работать с ней.

Благодарю Аллаха Величайшего за Вас и Вас, что подняли эту проблему. Всего доброго Вам.

Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
[/more]

Автор: kamenkapenza, Отправлено:14:44 02-07-2023

В программе есть функция копирования зон, т.е. Copy zones to clipboard - Zone - Paste zone to pages - From the nest to the last, и зоны проставляются на каждой странице в одном месте. Существует ли обратная функция: убрать зоны, проставленные ранее таким способом?

Автор: bolega, Отправлено:12:00 03-07-2023


Цитата:
Существует ли обратная функция: убрать зоны, проставленные ранее таким способом?

Да, если все размноженные зоны имеют одни и те же координаты вставки. Заходите в свойства любой такой зоны, нажимаете в разделе zone status кнопочку "инфо", запоминаете координаты вставки input location (первые два числа, это верхний левый угол). Вызываете команду Zones > Picture zones > mark zones. В разделе image ставите галки напротив left position, top position и задаете координаты. После того как СК найдет и отмаркирует все зоны, вызываете команду Bulk operations: delete zones, zone type=picture, галку на only marked zones, scope = all. Не забудьте на всякий случай сделать перед удалением копию задания.

Автор: asku, Отправлено:16:12 03-07-2023

Добрый день. При нажатии на кнопку Doubtful words появляется сообщение "No matching Hunspell dictionaries were found for the given languages"



В More2 язык указан; файлы hunspell-dicts.cfg и libhunspell.dll на месте. Словари тоже в соответствующей папке.
Что это может быть?

На всякий случай тест-файл:

Ссылка

Автор: bolega, Отправлено:08:53 04-07-2023


Автор: asku, Отправлено:11:06 05-07-2023

bolega
а сейчас уже не показывает это сообщение. Единственная причина по-моему -- может я при открытии проекта перепутал версии СК. Они у меня в соседних папках.

Автор: kamenkapenza, Отправлено:16:49 07-07-2023


Цитата:
Да, если все размноженные зоны имеют одни и те же координаты вставки. Заходите в свойства любой такой зоны, нажимаете в разделе zone status кнопочку "инфо", запоминаете координаты вставки input location (первые два числа, это верхний левый угол).  Вызываете команду Zones > Picture zones > mark zones. В разделе image ставите галки напротив left position, top position и задаете координаты. После того как СК найдет и отмаркирует все зоны, вызываете команду Bulk operations: delete zones, zone type=picture, галку на only marked zones, scope = all. Не забудьте на всякий случай сделать перед удалением копию задания.


bolega большое спасибо!

Никак не могу понять тонкостей меню Fiiters. В каких случаях нужна его активация (проставлять галочки в Smooth, bloor, sharpen, bloor2, sharpen2 и проставлять там числовые параметры? На что это влияет, на зону текста?

Тот же самый вопрос по поводу меню Bloor с параметрами Mean filter, C. Smooth, Smart bloor, Gauss bloor. Единственное понятное подменю это Descreen, про него было рассказано в видеоролике про удаление фона в зонах, что он отвечает за отображение картинок, например, для черно-белых картинок вместо foto ставить text line.

По меню Filters2 понятна правая его половина: внесение цвета фона для его исключения и восстановление контрастности после удаления фона (про это было рассказано в видеоролике про зоны картинок,удаление фона). Левая часть неизвестно: Inverse dithering, Denoise, в каких случаях активировать, на что влияет?

И та же самая неясность по меню Sharpen: в каких случаях активировать подменю Enhance control, Usharp masc?

Иногда попадаются книги, в которых проставлена цветная нумерация и названия глав на каждой странице цветными буквами. Если просто выбрать параметры бинаризации и внести цвет через Paint, буквы получаются не совсем четкими, размазанными. Я подозреваю, что не хватает активации именно этих меню. Может есть какой то тут специалист по этим меню, который мог бы поделится своими знаниями?




Автор: Dimi7777, Отправлено:18:59 07-07-2023

kamenkapenza


Цитата:
И та же самая неясность по меню Sharpen: в каких случаях активировать подменю Enhance control, Usharp masc?
Иногда попадаются книги, в которых проставлена цветная нумерация и названия глав на каждой странице цветными буквами. Если просто выбрать параметры бинаризации и внести цвет через Paint, буквы получаются не совсем четкими, размазанными. Я подозреваю, что не хватает активации именно этих меню. Может есть какой то тут специалист по этим меню, который мог бы поделится своими знаниями?


А Вы что, не пробовали экспериментировать?
Я опытным путем подобрал эти 2 параметра
Unsharp mask: Raduius=12 (максимум), strength=4 или 5, не больше, иначе много мусора будет
Enhance contour: Radius=10,strength=70 (улучшает контура букв, меньше корявости)

Возможно, я неправ, и bolega даст другие советы, но мне такие параметры помогают улучшить качество

Автор: kamenkapenza, Отправлено:20:36 07-07-2023

Dimi7777, хорошо. Спасибо! Что-то начало проясняться хотя бы по одному фильтру,а их там тьма тьмущая. Теории по этому поводу изначально нет ( по фильтрации), а практиковаться можно до одури, но безрезультатно, не зная сути вещей. Пялить глаза и чего то ждать (не изменилось ли чего то, хотя бы какую то малость). Знать бы ещё, что должно меняться от каждого фильтра, за что каждый отвечает - было бы проще экспериментировать.

Автор: TelecomUral, Отправлено:06:09 08-07-2023


Цитата:
kamenkapenza
Теории по этому поводу изначально нет

Не врите, теория описана в Хрестоматии. 7 разделов в блоке 3.7. И я практику про засечки дал в 3.9.
Цветные буквы лучше выходят, если в зоне дать им свой порог, а не дефолтный.

Практическое описание применения фильтров будет написано немедленно, как только кто-то сумеет алгоритмизировать описание проблемной буквы(объекта) на скане. Пойдёт значительно дальше слов типа "плохая печать" и "не совсем чётко" и даст недвусмысленные термины.

Меня давно преследует мысль, что стоит подобрать сканы букв с различными проблемами, для выдачи рекомендаций. Но, как правило, "одно лечится а другое калечится". Это тормозит.

Автор: kamenkapenza, Отправлено:18:37 09-07-2023


Цитата:
Не врите, теория описана в Хрестоматии. 7 разделов в блоке 3.7


Не врите, что про это написано в Хрестоматии. Там написано (цитирую):
"Позиция разработчика ScanKromsatora по вопросу описания фильтров, к сожалению, пока такова: "... Я никогда не пишу о внутренностях алгоритмов работы фильтров СК"..... Поэтому для создания общего представления, что делают инструменты группы "Image Enchance", здесь собраны более-менее релевантные куски из справок к другим программам."
Т.е. автор энциклопедии прямо указывает, что фильтры Скан Кромсатора это тайна о семи печатях, а то, что он описывал в Хрестоматии это домыслы, его подозрения, на которые он опирается по аналогии фильтров к другим программам, что совсем не раскрывает общую работу каждого фильтра именно Скан Кромсатора (для чего они нужны).

Автор: bolega, Отправлено:15:48 10-07-2023

kamenkapenza
Мне всегда казалось, что названия фильтров говорят сами за себя: blur, sharpen, smooth, contrast, brightness и т.п.
Практически все фильтры имеют preview (в главном окне, либо в окошке свойств зон), с помощью которого можно быстро увидеть, что они делают.
И уже не раз говорилось, что волшебного рецепта по их использованию ни у кого нет. Вопросы вида "у меня не получилось улучшить текст скана... , и да, поверьте мне на слово, задания я не дам, как я пытался, не покажу, что я получил, тоже не дам, сами гадайте" давно считаются риторическими. Собственно, в шапке про это давно написано.

Автор: zvezdochiot, Отправлено:17:08 10-07-2023

bolega say:

Цитата:

Вопросы вида "у меня не получилось улучшить текст скана..."

Скажу более, такой вопрос просто идиотский, т.к. не имеет числового выражения, а значит относится к чему угодно, но не к обработке изображений.
Можно понять вопрос: "Не удалось сделать изображение менее плохим по такому то критерию, несмотря на применение такого то фильтра". Вот здесь сразу вырисовывается "картина". И даже можно понять вопрос: "Не удалось сделать изображение менее плохим по визуальному восприятию", но здесь нужно приложение исходного изображения и результата фильтрации.


Автор: daa2013, Отправлено:17:51 10-07-2023

... не удалось сделать изображение более плохим ...

Автор: TelecomUral, Отправлено:18:02 10-07-2023

Между прочим, подтверждаю, что время от времени глифы вставляются куда угодно, но только не в окрестности щелчка. Бывало что и на полстраницы улетал. Главное - встаёт он совершенно не на буквы, чаще на чистое место.
СК 6.91. ocr не использую.
По признакам проявления ничего особенного сказать не могу. Разве что - происходит это довольно редко, где-то раз на сотню букв, и при этом я уже долго работал в VR, с множеством страниц. Никогда не бывало чтобы при переходе в VR был (почти) сразу глюк. Вроде бы, хотя я только изредка это примечал, вставка происходит в то место, где я несколько ранее щёлкал мышью, сбрасывая предыдущий глиф на страницу (типа делал "merge"). Сбой не повторяется, если приблизить место вставки, а вот нажатие CTRL на сбой не влияет. То есть делаю cancel paste, снова тащу глиф мышью на то же место, и он снова упрыгивает на сантиметр-полтора в сторону на то же самое место, где вообще никаких букв нет.
И еще засёк, что частота сбоя вставки растет при увеличении времени работы. При этом, вероятно, также что-то происходит с прокруткой страниц колёсиком. Один поворот может сместить страницу на на один, а два и даже четыре листа сразу. При этом повторяемости проблемы перескока нет, но когда она проявляется, то проявляется часто. Если выйти и обратно зайти в VR, длительное время никаких проблем нет. Букв 40-50 точно.

bolega, может вы всё же введёте какой-то дебаггинг для таких случаев? Даже при небольшой работе с глифами такие сбои вставки сильно мешают. Тем более, что, в общем, СК работает всегда безупречно. Добавьте какой-нибудь хоткей с записью переменных состояния, что ли.

Автор: kamenkapenza, Отправлено:22:21 10-07-2023

Маненько не понял,почему то не убирается "убирание фона", видеоролик здеся https://disk.yandex.ru/i/NQT_lp1erzu8PQ Примечание: под словом "коричневый" имеется в виду "серый"(торопился, когда записывал)

Автор: TelecomUral, Отправлено:05:08 11-07-2023

kamenkapenza
brightness = 30 уберите.

Автор: kamenkapenza, Отправлено:07:52 11-07-2023

TelecomUral, большое спасибо!
Это я попробовал самостоятельно изучить фильтры.))....... Пришлось кричать: "Караул!!! Помогите!!!" )))
Я так понимаю, что изучение следующей группы фильтров будет не лучше. )))
Хотел бы спросить, для чего B.point и W.point?
Слева стоит группа фильтров (Smooth, bloor, sharpen, bloor2, sharpen2) Это всё функционал вкладки "Filters", а есть ещё отдельно вкладки "Bloor", "Sharpen". Не совсем понятно.

Автор: TelecomUral, Отправлено:08:22 11-07-2023


Цитата:
для чего B.point и W.point

black point white point. Точки белого и черного. Применение растягивает гистограмму.

Скажем, так: яркостных отсчетов 256, это 8 бит. Если у изображения самая светлая точка 220, то можно указать ее как точку белого и пересчитать шкалу 0-220 в 0-255. При последующих операциях будет более плавный переход яркостей между точками.

А вообще - блок 3.8 хрестоматии.

Автор: kamenkapenza, Отправлено:12:10 11-07-2023

TelecomUral, спасибо! Но выясняется такая вещь, что глава 3.8 предательски ссылается на Фотошоп, про Кромсатор там ни слова. Я Фотошоп даже в глаза не видал (никогда не скачивал, не устанавливал, не лазал в нем), мне Сканкромсатор милее. )) Вроде в Хрестоматии чего то есть, а коснись конкретно меню Кромсатора - ничего конкретного не обсасывается. ))
Наверняка в Хрестоматии не написано, зачем во вкладке настройки зон Filters стоит группа фильтров Smooth, bloor, sharpen, bloor2, sharpen2, если есть отдельные вкладки Bloor, Sharpen? Чем то они друг друга дополняют, это совершенно разные вещи или при включении bloor, sharpen во вкладке Filters происходит активация вкладок Bloor, Sharpen?

Автор: MrLAG, Отправлено:03:55 12-07-2023

Обнаружил интересный баг. В данный момент я пользуюсь СК под win7 и как в старых версиях СК, так и в новых Options Clipboard не имеет кнопок в нижней части, которые собственно позволяют вставлять опции. Под ХР все в порядке, под Win7 само окно буфера есть, а кнопок нет. Даже если окошко растянуть на весь экран, кнопки не появляются.

Автор: zvezdochiot, Отправлено:04:12 12-07-2023

MrLAG say:

Цитата:

Options Clipboard не имеет кнопок... Под ХР все в порядке, под Win7 само окно буфера есть, а кнопок нет.

"А кто это сделал?..."
Думаю стоит обращаться с данным "багом" к Microsoft, но проще в спортлото.


Автор: bolega, Отправлено:10:02 12-07-2023

MrLAG

Цитата:
Под ХР все в порядке, под Win7 само окно буфера есть, а кнопок нет

Это очень странно. У меня под двумя разными версиями Win7 (одна - полноценно обновленная, другая - нет) такого никогда не наблюдалось. Можете скриншот скинуть в ПМ? Это окошко полупрозрачное, может это влияет, если у вас какая-то хитрая тема в винде используется.

Автор: niccolo, Отправлено:11:30 12-07-2023

Опять я с книгами из Архива...

Есть файл
https://archive.org/details/dorlandsillustra0000unse_q9t6/page/20/mode/2up
(только PDF).

Книга сфотографированная. В файле текст двухцветный и есть картинки. Можно ли как-то пакетно, а не как в видео покартиночно, обработать его с сохранением и приведением всех оттенков второго цвета текста (красно-бордовый) к одному - например красному.

Цвет ФР распознает точнее чем жирность оформления. Это потом проще использовать для дальнейшей обработки.

Возможно кто-то сталкивался с более новыми редакциями этой книги для Ebook.
(32 редакция в архиве негодная). Подскажите, где.

Автор: jourmager, Отправлено:11:56 12-07-2023

Сорри за офтоп
niccolo

Цитата:
Возможно кто-то сталкивался с более новыми редакциями этой книги для Ebook.

Есть 32nd Ed (2012) true PDF - либген
33rd Ed (2020) epub далеко tor - этот epub странный


Автор: niccolo, Отправлено:12:11 12-07-2023

jourmager
Судя по размеру - а он удивительно совпадает с размером файла с архива, true PDF там даже близко не пахнет.
Хотя, djvu там действительно текстовый. Сейчас скачаю pdf b проверю,
СПАСИБО ЗА ПОДСКАЗКУ

этот epub странный
Это что значит? Можете выложить его например на upload.ee

Автор: kamenkapenza, Отправлено:18:19 13-07-2023

Господа,может, кто знает, как улучшить вид цветных букв? Видеовопрос тута https://disk.yandex.ru/i/lO3UwtOdWAQ2ew

Автор: zvezdochiot, Отправлено:20:24 13-07-2023

kamenkapenza say:

Цитата:

кто знает, как

Так Blur вроде как включить надобно. Где радиус Blur будет определять минимальный радиус кривизны контуров букв. Вроде так должно быть.

PS: Ежели бы была ссылка на скан, можно было бы "похимичить", а так на уровне предположений.

Автор: kamenkapenza, Отправлено:22:41 13-07-2023


Цитата:
Ежели бы была ссылка на скан

Это могём предоставить! https://disk.yandex.ru/i/EENoX0uuEs4U0w


Цитата:
Так Blur вроде как включить надобно

А какой из блуров? Их там до фигища. В меню "Filters" слева один блур и блур 2.
Если заходить во вкладку "Bloor", то там тоже совсем непросто дело обстоит: куча "Радиусов", целых три штуки. Какой из этих радиусов употребить на пользу - неизвестно.




Автор: zvezdochiot, Отправлено:23:49 13-07-2023

kamenkapenza say:

Цитата:

А какой из блуров?

Про SK сказать не могу, но ежели верить bolega в том, что все фильтры стандартные, то это точно должен быть блюр. Проверил в GIMP: умножил изображение на само себя, фильтр GaussBlur{2,2) и Порог{Светимость:auto}, после чего раскрашивание маски.


Автор: kamenkapenza, Отправлено:18:10 14-07-2023

zvezdochiot. спасибо за старания помочь!
Жаль, что нет такого же (конкретно из Кромсатора) с перламутровыми пуговицами. )) "Будем искать"..
" Лично мне вот так кааца", что надо именно с радиусами поорудовать (менять числовые параметры), что именно они отвечают за настройку контура букв. " Лично мне вот так кааца"

Автор: bolega, Отправлено:18:26 14-07-2023

kamenkapenza
Т.к. субтаск вы не дали, исходя из видео и того, что буквы очень крупные, посоветовал бы включить обе галки на c.smooth (для обычных букв первую из них лучше не включать). Чтобы не было дырок в буквах, включите какой-нибудь из blur-фильтров, например, Blur2. Затягивать дырки просто поднимая порог бинаризации, не самый лучший способ.

Автор: kamenkapenza, Отправлено:18:55 14-07-2023

bolega, спасибо! Попробую.
Я ни разу не делал субтаски (нигде про это не показано), попробовал нажать на "Креатэ субтаск", получилась папка ТЕСТ, вот https://disk.yandex.ru/d/39ukscAO_ABaWw

Автор: bolega, Отправлено:20:43 14-07-2023

kamenkapenza
https://workupload.com/file/fFk3CkyzPjP
И заметьте, шрифт в оригинале там специально сделан грубым, рубленым, поэтому неровные контуры букв так и задуманы

Автор: kamenkapenza, Отправлено:21:07 14-07-2023

bolega, большое спасибо за помощь!

Хотел ещё спросить по похожей проблеме, когда жирные неровные буквы не в зоне рисунка,а в тексте. Можно как то улучшить без глифирования, воспользоваться какими то другими возможностями Кромсатора?
Пример. На этой странице вверху буквы жирные неровные, элементы сливаются. Если уменьшать бинаризацию для всей страницы, то возможно сверху буквы обретут более менее приличный вид, а внизу станут блеклыми. Или как то тоже какой то фильтр применить, если обвести плохонький текст и создать в нем зону, чтобы можно было включить фильтры... Ну или как то ещё, другими способами. До глифирования, честно сказать, я пока не дошел, не изучал видео, каюсь. ))
Вот тут субтаск https://disk.yandex.ru/d/-jHcr57JjzQ6gA

Автор: bolega, Отправлено:21:52 14-07-2023

Когда-то было пожелание сделать в СК вместо резаков рамку. Я добавил такую возможность. Рамка может работать в двух режимах: как аналог резаков и как рамка заданного фиксированного размера, причем ее размер строго выдерживается независимо от того, на какой угол эту рамку наклонили. По моему замыслу, это предназначено для обработки сканов, имеющих полноцветный фон на всю страницу, например, журналов.

Автор: zvezdochiot, Отправлено:22:29 14-07-2023

kamenkapenza say:

Цитата:

Можно как то улучшить без глифирования, воспользоваться какими то другими возможностями Кромсатора?

Вполне резонно: Префильтры EdgeDiv (EdgePlus + BlurDiv) (STA).
Так как идею для этих префильтров к порогу Otsu я почерпал из описания SK, то стопудово можно повторить в самом SK. Как именно? Понятия не имею.

Автор: kamenkapenza, Отправлено:09:11 15-07-2023


Цитата:
Вполне резонно: Префильтры EdgeDiv (EdgePlus + BlurDiv) (STA).


zvezdochiot, я никаких дополнительных функций в этой программе не применяю, чтобы ничего не менять в области текста и картинок, никаких фильтров не накладываю, только делаю правильную ориентацию страниц, режу и устанавливаю поля, все остальное в Кромсаторе, чтобы предварительно не портить страницы (на входе в Кромсатор получится какая то обработка, что недопустимо).


Цитата:
Когда-то было пожелание сделать в СК вместо резаков рамку. Я добавил такую возможность. Рамка может работать в двух режимах: как аналог резаков и как рамка заданного фиксированного размера, причем ее размер строго выдерживается независимо от того, на какой угол эту рамку наклонили. По моему замыслу, это предназначено для обработки сканов, имеющих полноцветный фон на всю страницу, например, журналов.


bolega, это для меня и для многих обработчиков замечательная новость!!! Не секрет, что достаточное количество людей, хороших обработчиков (к которым лично я себя не отношу, мне до них далеко) делают установку страниц в другой программе, чтобы побыстрее это делать.
Если есть возможность, можно показать, как это всё работает? Дополнительная функция установки страниц по другому методу (без резаков)

Я пока делаю установку так (ссылка на другую ветку, так как речь идет о другой программе)
http://forum.ru-board.com/topic.cgi?forum=5&bm=1&topic=32945&start=3480#lt ,от 09:09 15-07-2023


Автор: zvezdochiot, Отправлено:10:46 15-07-2023

kamenkapenza say:

Цитата:

я никаких дополнительных функций в этой программе не применяю

zvezdochiot say:

Цитата:

Так как идею для этих префильтров к порогу Otsu я почерпал из описания SK, то стопудово можно повторить в самом SK.



Автор: kamenkapenza, Отправлено:10:57 15-07-2023


Цитата:
к порогу Otsu

Знать бы ещё, где этот отец, который на пороге.

Автор: zvezdochiot, Отправлено:11:06 15-07-2023

kamenkapenza say:

Цитата:

Знать бы ещё, где этот отец

В вашем видео, на последнем этапе, там где вы вместо BW цветной выбираете.


Автор: kamenkapenza, Отправлено:11:34 15-07-2023


Цитата:
В вашем видео, на последнем этапе, там где вы вместо BW цветной выбираете
\\

А зачем я должен выбирать BW в ST? Эта программа обработает текст, т.е. внесет в него свои изменения. Мне это совсем не надо!!! Минимум воздействия ST. Поэтому я всё оставляю в цвете и закладываю в SK именно в цвете. Вынужденно пользуюсь ST на первой стадии обработки. геометрические составляющие (разворот, разрезка страниц, установка полезной области и полей) для удобства и быстроты, а всё остальное в SK, потому что SK обладает неограниченными возможностями (про все возможности знает только автор, нам дано знать меньше половины)) )

Вот бы "свистнуть" механизм установки полезной области и полей у ST и внедрить в SK для сплочения книгоообработчиков, так как часть "продолжают облупливать яйцо с тупого конца" - устанавливать размеры страниц и поля в ST, а часть "с острого", т.е. все стадии в ST.
Если бы был такой вариант (ссылку я выше давал), то можно было бы забыть про ST окончательно.

Автор: zvezdochiot, Отправлено:11:37 15-07-2023

kamenkapenza say:

Цитата:

А зачем я должен выбирать BW в ST?

zvezdochiot say:

Цитата:

Так как идею для этих префильтров к порогу Otsu я почерпал из описания SK, то стопудово можно повторить в самом SK.



Автор: kamenkapenza, Отправлено:11:28 16-07-2023


Цитата:
zvezdochiot
сказал:

Цитата:
Так как идею для этих префильтров к порогу Otsu я почерпал из описания SK, то стопудово можно повторить в самом SK. Как именно? Понятия не имею.

Значит будем вместе ждать, кто из сведущих поможет.


Потом ещё разок:

Цитата:
Так как идею для этих префильтров к порогу Otsu я почерпал из описания SK, то стопудово можно повторить в самом SK..



И на бис:

Цитата:
Так как идею для этих префильтров к порогу Otsu я почерпал из описания SK, то стопудово можно повторить в самом SK. .


zvezdochiot, пора возвращаться в обсерваторию и выключить бота-автооответчика.

Планета Шелезяка. Полезных ископаемых нет. Воды нет. Растительности нет. Населена роботами. )))


Добавлено:
Хотелось бы зайти к вопросу обработки текста с другой стороны, раз про фильтры мало кто знает (акромя автора). Вопрос про разнообразие обработки зон https://disk.yandex.ru/i/wklfpgtth738Rw

Автор: zvezdochiot, Отправлено:16:04 16-07-2023

kamenkapenza say:

Цитата:

Вопрос про разнообразие обработки зон

Вроде всё просмотрел, но нигде не увидел упоминания Края (Edge). А в том описании, с которого собственно и делал EdgePlus, было расписана регулировка именно параметра Edge.

Я понимаю, что толком мало знаю про SK, но возможности зон показались мне слабоватыми. А bw зона вообще "убила" своей никчёмностью, хотя возможно это локальный Otsu, а это бывает иногда нужно.

Для сравнения, рецепт того, "чего хотелось бы достичь" в GIMP:
  • 3 слоя (исходный + 2 копии)
  • верхний слой: Фильтр: Гауссово размывание {4,4}. Режим наложения слоя "Делить". Слить с предыдущим слоем.
  • осталось 2 слоя
  • верхний слой: Цвет: Авто: Выровнять. Режим наложения слоя "Экран". Слить с предыдущим слоем.
  • остался 1 слой
  • Порог: 50%.

    Результат.

    PS: В видео не было примера, когда для каждой строки своя bw зона. Может это решит хотя бы "проблему" блеклости нижних строк? Хотя, учитывая, что настройки порога только глобальные, вряд ли.


  • Автор: kamenkapenza, Отправлено:18:46 16-07-2023

    zvezdochiot, мне по секрету в личном сообщении один добрый человек открыл секрет, что черно-белая зона настраивается через левую сторону Кромсатора: пункт "Бинаризация", поставить галочка в "Порог черно-белой зоны" и поставить необходимые параметры Это я всё по русски пишу, там меню английское.

    Автор: zvezdochiot, Отправлено:18:55 16-07-2023

    kamenkapenza say:

    Цитата:

    через левую сторону Кромсатора: пункт "Бинаризация", поставить галочка в "Порог черно-белой зоны" и поставить необходимые параметры

    Так результата то удалось добиться? И с Edge совершенно непонятно: в твоём видео его нигде нет, а в том описании, про обработку текста он был. Так где же он?

    Автор: kamenkapenza, Отправлено:20:00 16-07-2023

    zvezdochiot,результат нормальный, так что можно строчки с жирными буквами (если они явно выделяются жирностью от других) выделять черно-белой зоной и уменьшать бинаризацию, а так же наоборот, если блеклые, то увеличить. Подозреваю, что к черно-белому тексту можно применить какую то фильтрацию,возможно через создание зон "Креатэ ушарп зоне" и "креатэ к.смуртф зоне"
    Про Эдге не знаю ничего, для чего оно нужно и присутствует ли тут. Это надо у
    более высшего звена спрашивать. ))


    Цитата:
    Так где же он?

    Есть подозрения, что кто-то упёр, умыкнул, свистнул. )))


    Автор: niccolo, Отправлено:17:16 18-07-2023

    Просто для информации.
    При попытке всосать 32 True PDF Dorland's Medical Dictionary 6.91 падает из-за нехватки памяти, хотя и памяти и места на диске хватает.

    Автор: kamenkapenza, Отправлено:19:45 19-07-2023

    Видеовопрос тут https://disk.yandex.ru/i/dg0Kg6Ds3DcdYQ. Нельзя ли всё это заранее поместить в папку с программой или дать ссылку на папку с этими прибамбуликами? В шапке темы до сих присутствуют какие то устаревшие рекомендации по программе 5.6, а современных необходимых вещей (ссылок на них) нет. Непорядок!

    Автор: zvezdochiot, Отправлено:19:53 19-07-2023

    kamenkapenza say:

    Цитата:

    Нельзя ли...

    "К пуговицам претензии есть?..."

    Автор: qwaxym, Отправлено:19:58 19-07-2023


    Цитата:
    Видеовопрос тут https://disk.yandex.ru/i/dg0Kg6Ds3DcdYQ. Нельзя ли всё это заранее поместить в папку с программой или дать ссылку на папку с этими прибамбуликами?

    В шапке есть "подключаемые утилиты"!

    Автор: kamenkapenza, Отправлено:20:03 19-07-2023


    Цитата:
    В шапке есть "подключаемые утилиты"!


    Еле заметил, спасибо за помощь! Предыдущая стабильная версия: ScanKromsator 6.00.5
    Устаревшие версии выделены от души, а тут всего лишь синеньким еле заметно "утилиты", и то для версии 6.7, для версии 6.9, может уже устарело, или что-то добавилось.. Фиг найдешь без посторонней помощи. Некому ужирнить?

    Автор: qwaxym, Отправлено:20:19 19-07-2023


    Цитата:
    и то для версии 6.7, для версии 6.9, может уже устарело, или что-то добавилось..

    Подходит для всех версий sk! Если бы устарело, об этом было бы упомянуто!

    Автор: daa2013, Отправлено:20:22 19-07-2023


    Цитата:
    Открытая шапка, изменяемая любым мембером, открыта для редактирования всем участникам форума со статусом не ниже Member (Подробнее о статусах http://forum.ru-board.com/topic.cgi?forum=13&topic=0727#1 ). Её всегда можно узнать по надписи "Внимание! Ты можешь отредактировать это сообщение, если у тебя есть новая информация по этой теме!" внизу шапки.

    Автор: mvk2006, Отправлено:21:11 19-07-2023

    Плохому танцору, оказывается, шапка мешает...

    Автор: kamenkapenza, Отправлено:21:28 19-07-2023

    Некорректно рассуждаешь. Плохому шапка мешает, а хороший любит в хорошей шапке выступать. Запомни, пригодится! Тем более шапка похорошела, пользуйся, не жалко.

    Автор: mvk2006, Отправлено:22:39 19-07-2023


    Цитата:

    Цитата:
    В шапке есть "подключаемые утилиты"!
    Еле заметил, спасибо за помощь!


    Цитата:
    Автор: kamenkapenza, Отправлено:11:56 03-10-2021
    Цитата (daa2013, Отправлено:11:30 03-10-2021):
    Вы не видите, что в слове "утилиты" спрятана ссылка на архивчик с этими файлами ?
    Пардон! Извините, был не прав! Увидел.

    не прошло и три года, а воз...

    Автор: kamenkapenza, Отправлено:19:59 29-09-2021
    Про глифы (глифирование, библиотеку глифов) нам всем не мешало бы послушать начальника транспортного цеха (Роман Карцев, юмор ))) ) многоуважаемого bolegу, потому что ничего про это никто толком не знает, а очень бы хотелось.

    Автор: kamenkapenza, Отправлено:17:52 11-04-2022
    Уважаемый bolega, будем ждать ролики, .... и побольше, побольше, чтобы все возможности программы показать.
    Марашек ещё никому не удалось победить, это будет грандиозный кибернетический нанопрорыв. Плюс восстановление покоцанных букв... !!!!!!!

    Цитата:
    Отправлено: 21:07 14-07-2023
    До глифирования, честно сказать, я пока не дошел, не изучал видео, каюсь.


    Цитата:
    ... что не дышишь? а как дышал.. как дышал....


    Автор: kamenkapenza, Отправлено:00:02 20-07-2023

    Хорошо, уговорил, будешь моим библиографом. )) Только изначально плохо работаешь, совсем не стараешься.

    Забыл, мой друг Санчо Пансо, добавить архиважные моменты между этими датированными постами, что практически все мои просьбы (указанные выше) были услышаны автором программы: появились бесценные ролики про обработку зон, про возможности новых версий, про глифирование,... А ролики смотрели все и открывали для себя неведомые вещи, скрытые возможности программы.
    Так что всё гоже!

    Автор: bolega, Отправлено:11:20 29-07-2023

    СК 6.95
    exe: https://workupload.com/file/sx4PFTSZyhh
    остальные добавки не изменились

    два примера:
    https://workupload.com/file/KpqqG5zwM5U
    https://workupload.com/file/jCVdPhaH7ep

    Автор: VadimirTT, Отправлено:17:23 29-07-2023

    А что нибудь можно с этим сделать.
    Ссылка

    Автор: zvezdochiot, Отправлено:18:52 29-07-2023

    bolega say:

    Цитата:

    exe:

    Немного по технологии распространения:

    Как альтернативу (2-ое средство распространения) добавляй архивы в раздачу торрент-клиентов, а сюда к ссылке рядом добавляй хэш этой раздачи. Так все дистрибутивы линукс распространяются (HTTP, P2P). На долю P2P приходится основной объём распространения.

    Особенность такого распространения:

  • Скачивать будут только сначала с тебя, потом с тех, кто уже скачал.
  • Хэш никогда не изменится, поэтому качать можно всегда, пока "жива" раздача хотя бы в одном клиенте.
  • Раздача не прекратиться после того, как ты удалишь её у себя в клиенте. Просто раздавать будут другие.
  • Ты всегда можешь хранить резервные торрент-файлы и восстановить раздачу в случае необходимости.

  • Автор: qwaxym, Отправлено:22:04 29-07-2023


    Цитата:
    А что нибудь можно с этим сделать.
    Ссылка

    Я не большой спец в sk, но кое что вышло Ссылка
    а потом лучше распознать в FR.

    Автор: VadimirTT, Отправлено:23:19 29-07-2023

    qwaxym
    Спасибо, но какие настройки то, да и ФР не вариант, это же журнал, нужно сделать графическую копию.

    Автор: qwaxym, Отправлено:10:54 30-07-2023


    Цитата:
    какие настройки то

    Сохранил задание(0001) Ссылка

    Цитата:
    ФР не вариант, это же журнал, нужно сделать графическую копию.

    Тогда придётся некоторые буквы(глифы) заменять.



    Автор: Dimi7777, Отправлено:13:53 30-07-2023

    bolega

    Цитата:
    СК 6.95
    exe: https://workupload.com/file/sx4PFTSZyhh
    остальные добавки не изменились

    Извините, не нашел в новой версии, где настроить автоматическое позиционирование вставляемой буквы или какого-то символа из буфера обмена (не глифа!!) и отключение такой опции ?
    Сейчас вроде бы по умолчанию автопозиционирование включено, как смотрю. А появилась ли возможность включать и отключать опцию?

    Автор: shch_vg, Отправлено:14:04 30-07-2023

    bolega
    Часто приходится запускать несколько сессий СК и работать в них параллельно, однако при закрытии их всех список ранее запускавшихся заданий в файле ini формируется при закрытии последнего задания.
    Если они закрывались не в том порядке, в каком открывались, то в последних строчках этого списка не будет упоминания о других закрывавшихся заданиях. Нельзя ли при закрытии задания формировать в файле ini список на основе текущего состояния файла ini, а не запомненного списка при старте закрываемой сессии?
    all
    Попались очень специфические сканы со странным фоном. Максимум, что мне удалось сделать, можно посмотреть по этой ссылке.
    Нельзя ли сделать более качественной обработки букв, естественно только в рамках СК?

    Автор: TelecomUral, Отправлено:06:33 31-07-2023


    Цитата:
    shch_vg
    в последних строчках этого списка не будет упоминания о других закрывавшихся заданиях

    ИМХО, такая задача элементарно решается копированием нескольких экземпляров sk.exe в различные папки.

    Автор: bolega, Отправлено:13:21 31-07-2023

    Dimi7777

    Цитата:
    Извините, не нашел в новой версии, где настроить автоматическое позиционирование вставляемой буквы или какого-то символа из буфера обмена (не глифа!!) и отключение такой опции ?

    Там же, где и всегда - glyph preferences. К сожалению, СК в текущей версии не может определить, что вставляется - глиф или не глиф. Это происходит потому, что вставка выполняется из стандартного буфера обмена windows, а в нем содержится просто картинка, и нет возможности определить, откуда она пришла в буфер: из глифа, команды copy to clipboard СК или команды copy to clipboard любого другого приложения.

    shch_vg

    Цитата:
    Нельзя ли при закрытии задания формировать в файле ini список на основе текущего состояния файла ini

    Я подумаю над этим.

    Цитата:
    Попались очень специфические сканы со странным фоном

    Это не оригинальные сканы. Оригинальные, судя по качеству, были скорее всего 150dpi в пережатом jpg. Затем сделали их апсеймплинг до 600dpi, причем обычным методом (без всяких топазов). Но от этого они не перестали быть 150dpi по сути. А что делать в таком случае, на форуме уже не раз писали. Поищите по фразе "как сделать конфетку из г-на"




    Автор: shch_vg, Отправлено:14:46 31-07-2023

    bolega

    Цитата:
    Это не оригинальные сканы. Оригинальные, судя по качеству, были скорее всего 150dpi в пережатом jpg. Затем сделали их апсеймплинг до 600dpi, причем обычным методом (без всяких топазов). Но от этого они не перестали быть 150dpi по сути.

    Даже интересно, как Вам удалось это определить.
    В это описание нужно добавить, что изначально из пдф СК импортировал сканы в 72дпи в цвете с абсолютно безобразным фоном. Немного удалось замаскировать фон, переведя сканы в грей.
    Затем, сравнивая с подобными нормальными сканами по ширине текстового блока, получил, что не 72 дпи, а где-то 125 дпи, а после этого только апсейплинг.
    Прежде чем последовать Вашему совету по поиску, хотелось бы знать, в принципе можно получить что-то лучшее в смысле букв, чем выложено мной?

    Добавлено:
    bolega
    А еще возникли вопросы по рамке, заявленной в новой версии.
    С ходу попробовал применить ее, прочитал вроде все, но обломался.
    Не удалось распространить рамку на последующие сканы, а создавать на каждой скане как-то влом.
    Хотелось бы знать, в чем ее преимущество по сравнению с резаками, кроме возможного поворота рамки?
    Еще интересно, а нельзя ли ее как-то создавать на этапе драфт кромсайта?

    Автор: bolega, Отправлено:14:58 31-07-2023


    Цитата:
    как Вам удалось это определить

    интуиция


    Цитата:
    в принципе можно получить что-то лучшее в смысле букв

    в СК нет. Но если делаете апсейплинг из 150dpi, используйте проги на основе н.сетей

    Автор: shch_vg, Отправлено:15:04 31-07-2023

    TelecomUral

    Цитата:
    ИМХО, такая задача элементарно решается копированием нескольких экземпляров sk.exe в различные папки.

    И сколько таких папок нужно заводить?
    А как потом искать, в какой из них находится нужное мне задание при последующем запуске системы?
    Такой вариант для разных версий еще можно рассматривать, но для одной и той же это перебор.

    Автор: TelecomUral, Отправлено:15:13 31-07-2023


    Цитата:
    shch_vg
    И сколько таких папок нужно заводить?
    А как потом искать, в какой из них находится нужное мне задание при последующем запуске системы?

    Встречный вопрос: а вы когда запускали несколько СК, то вообще-то соображали, зачем вам несколько заданий одновременно? Думаю, да. То есть была некая логическая система во всей параллельной работе. Ну так примените к своей системе моё частное техрешение. Допустим, в первом СК обложки книги, во втором СК ее страницы. В третьем СК допы к ней же. Никто не мешает держать сканы блоков "1-2-3" любой книги в соответствующих СК1, СК2, СК3.
    Если же системы запуска параллельных СК нет, то глупо требовать от СК под неё подстроиться

    upd
    я чего так подробно: мне не нравится идея взаимовлияния экземпляров программы. Так, насколько мне известно, не делают.

    Автор: shch_vg, Отправлено:15:30 31-07-2023

    TelecomUral
    Начнем с конца: я не требовал что-то от СК, а просто задал вопрос, который автор программы счел нужным рассмотреть.
    Кроме того, здесь, как и в большинстве случае в жизни, действует принцип, что не запрещено, то разрешено. Запрет от автора на запуск ТОЛЬКО одного экземпляра программы я нигде не видел.
    Есть программы, которые не разрешают параллельной запуск, но СК к ним не относится.
    И, наконец, не все так организованны, как Вы. Мне в любой момент может понадобиться запустить совсем другое задание, работа которого никак не связана с уже работающим. Получается, что по Вашей схеме, собираясь начать новую обработку, нужно создать папку, содержащую СК, именно с названием, связанным с именем задания?
    Вам никогда не доводилось, например, читать одновременно несколько книг, переходя от одной к другой?


    Добавлено:

    Цитата:
    мне не нравится идея взаимовлияния экземпляров программы.

    А вот это интересно: где Вы в моем предложении увидели взаимовлияние?

    Автор: TelecomUral, Отправлено:15:52 31-07-2023

    [more=оффтоп]
    Цитата:
    shch_vg
    Получается, что по Вашей схеме, собираясь начать новую обработку, нужно создать папку, содержащую СК, именно с названием, связанным с именем задания?
    Вам никогда не доводилось, например, читать одновременно несколько книг, переходя от одной к другой?

    нет, не "нужно". Я этого не писал.

    Доводилось. Но ни разу не было параллельного чтения целых книг одной темы. Допустим, есть пара книг по языку Си. Никогда я не читал обе с первой страницы до последней одновременно. Вот прочесть две главы из одной, начать третью главу, уяснить что написано неудачно, отложить, найти другую книгу, найти материал, изложенный тут более удачно, изучить его, отложить вторую книгу и вернуться к первой - это да, это сколько угодно. Но это: а) не есть параллельная работа и б) этих книг не два десятка и даже не четыре штуки. Ну и в) мне не требовалось держать эти книги строго в определённом порядке в изголовье кровати. В пределах пяти-шести процессов любой человек держит всё в уме.
    К слову, по памяти, даже когда я разбирался с обучением и багами СК, где-то в районе СК 6.00.5/6.21, я ни разу не открывал более четырех программ разных версий. Так что два, ну три, ну четыре экземпляра - предел, ИМХО.

    Взаимовлияние конечно есть - прога открылась с одним опциями, а потом ей подсунули другие опции.[/more]

    Автор: bolega, Отправлено:16:55 31-07-2023

    shch_vg

    Цитата:
    возникли вопросы по рамке

    изначально рамка предназначена для случая, представленного например в моем втором примере (вы его смотрели?). С резаками там пришлось бы месяц возиться, чтобы подогнать под один размер.

    Автор: shch_vg, Отправлено:16:57 31-07-2023

    TelecomUral
    Увы, не увидел ни малейшего зерна смысла в Вашем предложении, сорри
    Прошу прощения, возможно это применимо в варианте использования разных профилей, но я этим не пользуюсь.
    Добавлено:
    bolega

    Цитата:
    вы его смотрели?

    Нет, из-за его большого размера.
    Т.е. рамка это не замена резаков в общем случае, я имею в виду она выборочного действия?
    И если это так, то предложение по повороту межрезаковского пространства на повернутых страницах не реализуемо?

    Автор: bolega, Отправлено:17:19 31-07-2023


    Цитата:
    Нельзя ли при закрытии задания формировать в файле ini список на основе текущего состояния файла ini, а не запомненного списка при старте закрываемой сессии?

    Вы не учитываете, что к моменту закрытия задания от "запомненного списка при старте" может уже ничего не остаться. Например, если я в текущем задании открывал 7 заданий (у меня бывает и больше). Именно поэтому СК сохраняет не мифический стартовый список, а тот список, который сложился к моменту закрытия. Как в таком случае определять, что нужно брать из других сессий, а что из текущего списка - я не знаю. Думаю, ваше предложение невозможно реализовать, если не будет некой третьей стороны - которая централизовано хранила бы и обновляла бы на лету текущий список (как это делает windows для диалогов).

    Автор: shch_vg, Отправлено:18:39 31-07-2023

    bolega

    Цитата:
    Думаю, ваше предложение невозможно реализовать

    Честно говоря, я не до конца понял Ваши рассуждения.
    Сейчас я проделал эксперимент - стартовал последовательно три разных задания.
    После старта первого в его списке на седьмом месте появилось это задание.
    После старта второго - первое задание в списке второго задания перешло на шестое место, а второе задание появилось на седьмом.
    После старта третьего задания в его списке первое - на пятом месте, второе - на шестом и третье - на седьмом, т.е. видно, что начальные списки составлялись из списка из ini (шесть последних + текущее) и после очередного открытия они помещались в ini.
    Закрываю задания в обратном порядке, третье, второе и первое.
    Снова стартую СК и вижу, что в его списке ровно тот список, что был после старта первого задания, т.е. о втором и третьем задании в списке из ini нет никакой информации.
    Если же я при закрытии сохраню порядок закрытия тот же, что и порядок открытия, то в списке стартовавшего СК будут присутствовать все три ранее открывавшиеся задания и я могу любой из них стартовать из соответствующей строки.
    Получается, что чтобы не вспоминать, в каком порядке нужно закрывать задания текущего дня, достаточно при закрытии очередного задания взять список из ini, убрать из него закрываемое задание, а потом его же добавить на седьмое место и записать этот список в ini.
    Фактически требуется сделать те же действия, что и при старте задания.
    Дополнительный маленький бонус: будет видно, в каком порядке закрывались задания.

    Автор: TelecomUral, Отправлено:20:03 31-07-2023


    Цитата:
    shch_vg
    Увы, не увидел ни малейшего зерна смысла в Вашем предложении, сорри

    Да нет проблем.
    А я ведь сразу прямым текстом говорил: глупо что-то требовать от СК, если нет системы в вашей работе. Её и нет. Именно поэтому не видно смысла, т.е. применимости к работе.

    upd
    вроде бы ваше предложение насчет перезаписывать закрываемое задание вниз списка сработает. но мне всё равно сама идея не нравится.

    Автор: shch_vg, Отправлено:21:33 31-07-2023

    TelecomUral

    Цитата:
    Именно поэтому не видно смысла, т.е. применимости к работе.

    Я вроде бы выше описывал смысл.
    Запустив СК, я хочу продолжать обработку задания, стартовав его из списка выполняемых ранее заданий. Какой еще Вам нужен смысл?
    Вы считаете, что для каждого запускаемого задания нужно иметь экземпляр СК в отдельной папке.
    Вот в этом я не вижу смысла. С большой натяжкой я придумал смысл при использовании разных профилей, хотя и это не проблема в моем варианте.


    Добавлено:
    TelecomUral

    Цитата:
    Если же системы запуска параллельных СК нет, то глупо требовать от СК под неё подстроиться

    Вам не приходило в голову, что в этом случае вообще нет никакого смысла заводить список заданий в СК?
    Или Вам достаточно иметь этот список однострочный?
    Вы предпочитаете заходить в нужную Вам папку, запускать в ней СК и вызывать привязанное к этой папке задание.
    Я же всегда предпочитал и предпочитаю стартовать СК из панели задач, а потом либо стартовать нужное мне задание из списка заданий СК, либо создавать новое, если работа начинается с нуля. В крайнем случае если понадобится задание, которое уже вышло из числа последних семи, можно его найти по обычной схеме.
    Каждый работает, как ему удобней.
    Называть один вариант системой, а другой не системой, мягко выражаясь, странно.

    Добавлено:

    Цитата:
    мне всё равно сама идея не нравится

    А чем Вам она мешает, если в Вашей системе достаточно одной строки в списке заданий?

    Автор: asku, Отправлено:22:21 31-07-2023

    В новой версии (6.95) при выборе Метод Soft (вкладка Illumination) появляется такая ошибка.
    По умолчанию у меня стоит метож Safe, и другие я практически не использую. Но сейчас, из-за неудовлетворительного результата на выходе, решил «потыкать» опции и обнаружил такую ошибку. Могу subеtask предоставить, если нужно. Просто я ради интереса попробовал выбрать этот же метод (Soft) и в другом проекте, и там та же ошибка.




    Автор: TelecomUral, Отправлено:04:56 01-08-2023

    [more=оффтоп для shch_vg]
    Цитата:
    shch_vg
    Вы считаете, что для каждого запускаемого задания нужно иметь экземпляр СК в отдельной папке.


    Цитата:
    в Вашей системе достаточно одной строки в списке заданий?


    Давайте отмотаем ситуацию в точку ноль. Явно вы меня в первый момент неправильно поняли. Да и я вас.

    Вы обратили внимание разраба, что при открытии и хаотичном закрытии нескольких экземпляров СК результирующий список открывавшихся заданий может так "нарушаться", что в нём пропадают ранее открывавшиеся, но нужные вам задания (их надо снова открыть).
    Я предположил, что вы работаете так:
    1ый экз. СК
    таск 1
    таск 2
    таск 3
    2ой экз СК
    доп сканы для таск 2, генерация нескольких страниц джву для таск 2 или копирование глифов через буфер обмена в таск 2.
    таск 4.

    И если вы экз. СК №1 закроете раньше чем экз. СК №2, закроете СК №2, то в списке заданий при последующем открывании СК пропадет таск 3. (Никогда так не работал, но видимо пропадут также таски 1 и 2).

    Это я вас так понял. Сам я почти никогда на список открывавшихся заданий внимание не обращаю, интересуют максимум четыре последних. А не вижу в списке, так открываю с диска. Все папки со сканами упорядочены, найти нужное - дело полуминуты максимум.

    Я и предложил вести таск 2 и таск 4 всегда в одном СК (это, типа, целые большие книги - и про них я распространялся о чтении глав книг, то есть предлагаю открывать одномоментно не более одной цельной книги в одном СК), а все допы и вспомогательные открывания делать в другом СК, в другой папке. И плевать, соответственно, какие там задания в списке насохранялись. Значение имеет только список СК №1. Он же здоровый, на 10 позиций.
    Я именно так и работаю. Одна прога "главная", ежели чего еще надо открыть и обработать, я второй экземпляр СК открываю, ну и закрываю его обязательно раньше чем главный, первый. Умом соображаю "у меня пошла вторая вспомогательная ветка". Если я вдруг застопорился с таск 2, не хочу его обрабатывать, или обнаружил что сканов не хватает, уже другая книга просится - то я сначала доптаск 2 закрываю, СК №2 закрываю, затем таск 2, и из СК выхожу. У меня давняя привычка не держать в винде проги открытыми долго, ибо свет пропал (или BSOD всплыл) - и тю-тю несохранённая информация. Это на работе я sql девелопер неделями могу держать, у него автосохранение всех окошек и режимов при краше зашито в фичах и восстанавливается при следующем запуске. СК так не заточен, тогда зачем судьбу испытывать. Бывает, я реально много наколбасил редактуры зоны, больше часа над ней химичил, поэтому сразу всё сохраняю и выхожу отовсюду, если временно прекратил работу в СК.
    В такой моей работе список заданий важно иметь стабильным и независящим от экземпляра СК №2, этим ваше предложение писать свежачок из любого экземпляра мне и не нравится. Я веду одну линию обработки - там и особенности зон, и количество и качество набранных библиотек глифов, их имена и размещение на панели, там и цветовые гаммы, и особенности обработки конкретных упущенных мест, и распределение буферов обмена самого СК. Множество данных, которые для двух цельных книг я в голове не удержал бы.
    Причём доптаск 2 в списке заданий мне никогда не нужен. Это времянка.
    Если же меня вдруг потянуло, допустим, пдф импортировать, который вот только-только предложили к анализу на руборде в соседней ветке, я принимаю решение закрыть свой проект (таск 2) и открыть в СК №1 таск 4 (пдф).

    Ваше же описание я воспринял "как когда хочу, так и открываю таски, никакой системы нет, но обеспечьте мне хранение списка последних закрываемых, я их хочу видеть - то есть система есть". Бардак, попросту говоря. "На старте хаос, чего хочу впереди - никогда не предвижу, но уж если закончил работу, то сохраните состояние на момент закрытия, куда бы я ни забрёл в творческом процессе". По мне - ненормально так работать на результат. Киш-миш, а не трудовая деятельность. Ну и, конечно, моё предложение вам не подходит. Действительно, чего вы там "в экстазе" понаоткрывали, и как это затем искать и восстанавливать - фиг знает. Причём хаос-то вы генерируете сами, он вам зачем-то жизненно необходим в начале работы. Глупо требовать порядка в точке ноль, если сами впоследствии хаос генерите, третий раз подчёркиваю.

    Кстати, все доптаски книги я держу в субпапках основной книги. Даже если задания доптаск2 в списке не вижу, найти его - дело пяти щелчков.
    [/more]

    [more=upd]upd
    на вашем месте я бы держал в панели задач два значка, "Главный СК для списка заданий" и "СК для хаотичного открывания без сохранения списка". Эти СК в разных папках.[/more]

    Автор: bolega, Отправлено:08:36 01-08-2023

    asku

    Цитата:
    появляется такая ошибка

    Точно. Ошибка если сканы серые. Спасибо.

    shch_vg

    Цитата:
    Честно говоря, я не до конца понял Ваши рассуждения.

    Я имел ввиду, что если в одной из сессий открыть много заданий, т.е. не закрывая СК (главное меню Files > Close task, затем Files > Open task и так несколько раз), то история файлов этого задания перекроет все остальные сессии. При этом централизованная история, которую хранит windows в реестре, будет хронологически корректной всегда


    Цитата:
    Нет, из-за его большого размера.

    Да, с примерами я погорячился, получились слишком объемные. Пока удалил. Как-нибудь переделаю, чтобы покомпактнее было.

    Добавлено:
    TelecomUral
    Очень грамотные рассуждения. Я тоже последовательностью закрытия сам управляю, чтобы избавиться от засорения истории заданий всякими временными тасками.
    Но особенность работы shch_vg состоит видимо в том, что он открывает только реально нужные задания, случайных и временных как у нас с вами, не бывает. Поэтому выход вижу только один: сделать как опцию (не знаю как назвать). Если включена, то при каждом открытии задания СК посылает всем запущенным экземплярам уведомление, чтобы они сразу обновили список. Тогда список у всех будет идентичный и путаницы не будет.

    Автор: TelecomUral, Отправлено:11:04 01-08-2023


    Цитата:
    bolega
    не знаю как назвать

    task_broadcast

    Автор: shch_vg, Отправлено:13:12 01-08-2023

    [more=псевдооффтоп для TelecomUral]
    Цитата:
    Давайте отмотаем ситуацию в точку ноль.
    Хорошая мысль, потому что было столько сказано по казалось бы простому вопросу, что голова кругом идет. Но это, по-видимому, наше совковое свойство - усложнять все, что только можно .
    Ваше первое высказывание по рассматриваемому вопросу не имеет отношения в моему вопросу, т.к. разведение СК по разным папкам автоматически разводит привязанные к ним файлы ini.
    Теперь о том, почему у меня появилось такое предложение.
    В течение дня я мог запустить несколько сессий СК, возможно абсолютно не связанных с друг с другом, а внутри каждой сессии закрывать задание и открывать новое. В конце дня хочется спать и нужно выключить компьютер - здесь и появляется поставленный мной вопрос.
    Я хочу, запустив на следующий день СК, стартовать из списка заданий нужные мне (возможно в нескольких сессиях), на которых я остановился вчера, а не лихорадочно вспоминать, а что это были за задания и где их искать.
    Надеюсь суть моего вопроса я изложил понятно.
    Теперь по поводу возражений, которые мне удалось понять из ваших ответов.
    Вы напираете на какую-то системность в работе с СК, хотя, как мне кажется, изначально эта программа не делалась с такой целью.
    Если Вам так удобнее работать - ради бога, как известно "на вкус и цвет товарищей нет".

    Теперь как я вижу свое предложение (если я что-то излагаю некорректно, прошу меня поправить).
    При открытии сессии СК в список копируется содержимое списка из ini, при открытии в сессии конкретного задания оно тут же помещается в конец списка в ini с возможной корректировкой имеющегося списка.
    Поэтому каким бы ни было ненужным, временным задание, оно сейчас попадает в ini при его открытии.
    Поэтому я предлагаю при закрытии сессии не сохранять в ini локальный список этой сессии, а просто добавлять в конец списка из ini задание, находящееся в ней на момент закрытия, если оно есть.
    [/more]

    bolega

    Цитата:
    При этом централизованная история, которую хранит windows в реестре, будет хронологически корректной всегда

    А можно прояснить этот вопрос, т.к. в системном реестре мне не удалось найти этой истории?
    Цитата:
    Поэтому выход вижу только один: сделать как опцию (не знаю как назвать).

    А может не стоит все так усложнять, а воспользоваться предложением TelecomUral и запускать случайные и временные в СК, находящемся в другой папке?

    Автор: shch_vg, Отправлено:15:40 01-08-2023

    bolega
    В последнее время приходится плотно заниматься ручной чисткой грязных обработанных сканов, в связи с чем снова поднимаются одни и те же вопросы.
    1. При чистке приходится постоянно переходить от точечной чистки (щелчок на грязи при нажатых Контрол+Таб) к пространственной (заключении грязной территории в прямоугольник при включенном режиме mouse-up очистки). Все бы хорошо, но не всегда успеваешь отпустить два пальца для перехода на пространственную очистку.
    Нельзя ли реализовать эту очистку и при нажатых Контрол+Таб?
    2. В связи с этой проблемой есть вопрос, нельзя ли включить в хоткеях возможность замены в точечной очистке Контрол+Таб на более удобную комбинацию по усмотрению пользователя?

    Автор: Izich, Отправлено:19:51 01-08-2023

    Здравствуйте, супер программа, спасибо!
    Вопрос: Как автоматически подравнять строки абзацов на развороте (по верхним строкам или колонтитулам или как еще)?
    Чтобы они были на одном уровни на всех страницах книги.
    Заранее большое спасибо за ответ!

    Автор: TelecomUral, Отправлено:20:25 01-08-2023


    Цитата:
    Izich
    Как автоматически подравнять строки абзацов на развороте (по верхним строкам или колонтитулам или как еще)?

    центровкой (вверх, если колонтитулы или сам блок текста по верху выровнен). на панельке Page.

    Можно вручную, по опорной линии, но это для книг без твердоочерченного блока текста.

    Автор: bolega, Отправлено:20:53 01-08-2023


    Цитата:
    Вопрос: Как автоматически подравнять строки абзацов на развороте (по верхним строкам или колонтитулам или как еще)?

    а исходные изображения - цветные сканы или уже обработанные ч/б ?

    Добавлено:
    shch_vg

    Цитата:
    Контрол+Таб

    А это что за зверь такой?


    Цитата:
    нельзя ли включить в хоткеях возможность замены в точечной очистке Контрол+Таб

    Если на самом деле имеется ввиду удаление мусора через Ctrl-Shift-щелчок, то для него имеется hotkey под названием Ctrl+Shift+Click

    Автор: shch_vg, Отправлено:21:39 01-08-2023

    bolega

    Цитата:
    Цитата:
    Контрол+Таб

    А это что за зверь такой?

    Склероз не позволил мне вспомнить "Шифт" , почему-то написал первое, что пришло в голову.

    Добавлено:

    Цитата:
    имеется hotkey под названием Ctrl+Shift+Click

    Вот спасибо!
    Повесил его на "ё" - заиграло другими красками .

    Добавлено:
    bolega
    Часто приходится переобрабатывать отдельные страницы, после чего надо терять время на финализацию страницы.
    Вроде бы что-то писалось о возможности отключения такой финализации, или это мне показалось?

    Автор: Izich, Отправлено:00:11 02-08-2023

    bolega

    прежде всего чб (круто, если есть видео об этом),
    но если есть и для цветного примеры, то спасибо и за это.


    Автор: bolega, Отправлено:08:14 02-08-2023


    Цитата:
    прежде всего чб

    При обработке всегда происходит заданное выравнивание. Не с точностью до пикселя. По границе текста скана. Чувствительность определения к границе можно задать в Files > Options > Processing > Text v/h sensivity. Чувствительность нужна, чтобы мусор, который может быть на границе, не сильно влиял на результат. Если мусора нет, можно поставить максимальную чувствительность.
    Ну и на выходе в окне VR можно вручную двигать скан Alt-стрелками, шаг сдвига задается на панельке. В СК нет линейки, поэтому в качестве ориентира можно задать неподвижный прямоугольник: выделить его, затем в КМ Special > set aux rectangle. Так можно делать ручную точную подгонку например, по линии в колонтитуле, базовой линии первой строки и т.п.

    Автор: TelecomUral, Отправлено:08:24 02-08-2023


    Цитата:
    если есть видео об этом

    на ютьюбе от Никитина-Перенского ролики. Если не вру.

    Автор: SVK2I, Отправлено:11:31 02-08-2023

    bolega

    Цитата:
    Точно. Ошибка если сканы серые. Спасибо.

    У меня никаких ошибок с иллюминацией с методом Soft не появлялось. Более того, версия 6.95 работает очень стабильно, вовсе никаких ошибок не выдает пока, также с памятью вроде бы тоже ошибок нет. Очень понравилась рамка и коррекция перспективы в VR. Проделал задания, которые выкладывались форумчанами, с помощью рамки и без рамки – результат несколько различный в плане определения границ сканов, и больше понравился результат с рамкой.
    Вопрос: если использовать рамку, то все равно надо перед этим проставлять резаки? У меня не получилось использовать рамку, если до этого не определял границы изображения резаками. Или я что-то неверно делал?
    А в целом, огромная благодарность Аллаху Величайшему за bolega и bolege за эту версию, работать стало очень приятно.


    Добавлено:
    bolega

    Цитата:
    Так можно делать ручную точную подгонку например, по линии в колонтитуле, базовой линии первой строки и т.п.

    А не проще ли, в таких случаях, брать прямой участок линии, копировать его, а затем вставлять на место искривленного? Или, если линии простые, прорисовывать их вручную, используя метелку с черным или иным цветом?

    Автор: DmitryKz, Отправлено:11:54 02-08-2023


    Цитата:
    У меня никаких ошибок с иллюминацией с методом Soft не появлялось.

    Подтверждаю ошибку. После нажатия кнопки Process выскакивает AV.

    Автор: SVK2I, Отправлено:12:51 02-08-2023

    [more]DmitryKz

    Цитата:
    Подтверждаю ошибку. После нажатия кнопки Process выскакивает AV.

    Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему!
    Это потрясающе!
    Вот что вышло в итоге: когда я использовал субтаски форумчан, а они были и серые и цветные, но одиночные страницы, – никаких ошибок с методом Soft не возникало!
    Тогда я решил, после DmitryKz, проверить на своей испытанной для таких целей книге про грибы, а она у меня с разворотом.
    И вот что вышло: если на всех разворотах проставить метод Soft, ошибка возникает, и бинаризации не происходит. Но если, хотя бы на одном развороте снять метод Soft и заменить его другим, а на остальных разворотах этот метод оставить, то никаких ошибок не возникает!
    Все завернул в архив (два субтаска) и выложил по адресу: https://workupload.com/file/LyRyqXwseDH и можете это проверить.
    Эта книжка про грибы у меня специально для тестирования SK, поэтому, пожалуйста, не придирайтесь к качеству. Окончательный вариант этой книги с хорошим качеством у меня давно сделан и выложен на Флибусте.
    Аллах Единственный, Аллах Абсолютный, Аллах Величайший!
    Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!



    Добавлено:
    Еще более уточнил: менять метод Soft надо на любом развороте, но не на первом, иначе ошибка будет появляться.
    Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!


    [/more]

    Автор: Izich, Отправлено:13:58 02-08-2023

    TelecomUral
    Bolega,

    Спасибо!

    Автор: SVK2I, Отправлено:14:10 02-08-2023


    Автор: bolega, Отправлено:15:16 02-08-2023

    SVK2I

    Цитата:
    А не проще ли, в таких случаях, брать прямой участок линии, копировать его, а затем вставлять на место искривленного?

    Izich не предоставил ни примеров сканов, ни задания. Поэтому не берусь судить, что в его случае проще.


    Цитата:
    Вопрос: если использовать рамку, то все равно надо перед этим проставлять резаки?

    нет, резаки игнорируются.
    Рамка задумана для случая когда контент страницы занимает весь скан, т.е. нет белых полей. В этом случае искать полезную область бесполезно, она везде. Проще зафиксировать размеры рамки, обязательно включить везде ignore gaps и проставить рамку на всех сканах. Использовать рамку без включения ignore gaps смысла не имеет, в этом случае рамка ничем не лучше резаков.
    Не знаю, понятно ли я объяснил. Добавлю такой момент. Если СК обрезает по резакам, затем выполняет deskew, то из-за поворота размер изображения увеличивается (простая математика), т.е. резаки не дают гарантированно нужного размера. С рамкой все иначе: скан поворачивается на угол наклона рамки, затем обрезается по прямоугольной рамке. При этом итоговые размеры всегда будут в точности равны размерам рамки.

    Автор: SVK2I, Отправлено:16:04 02-08-2023

    [more]Хвала для Аллаха Господина миров Превознесен Он и хвалою Ему, за Вас, уважаемый bolega!
    Разъяснили Вы всё очень толково, более того, я понял сущности, которые в описании к программе не доходили до меня. Но, я думаю, что я не смог объяснить свою проблему. Суть в том, что для исследования я взял одностраничный файл и решил его оформить рамочкой, не проводя предварительно расстановки резаков кнопкой «Черновая расстановка резаков и инициализация опций». Так программа выдала ошибку, требуя провести эту операцию. Когда я черновую расстановку совершил, то рамка установилась и процесс пошел. И получается, что для того чтобы воспользоваться рамкой, надо предварительно провести черновое кромсание, иначе, как я ни крутил, ничего не получается, хотя в дальнейшем эти резаки должны игнорироваться, особенно, если включишь опцию «ignore gaps».
    И еще, простите за примитив. Но, сделав много книг Вашей программой, до включения опции «ignore gaps» дело не доходило, и результат получал тот, который мне нужен. Но сейчас я вижу и понимаю, что рамочка – это нечто, и хочется ей овладеть в совершенстве. Пожалуйста, подскажите, где находится эта опция «ignore gaps», целый день лазаю по Вашей программе во всех разделах, но хоть убей, не могу никак найти… С коррекцией перспективы, благодаря Аллаха Величайшего, разобрался, и мне очень понравилось. Это проще, чем возиться с кнопочкой «Повернуть выделенный фрагмент», хотя иногда были случаи, что и ее приходится использовать, но может быть, это еще от недостатка опыта.
    Да будет доволен Вами Аллах Величайший и да даст Он Вам здоровья и долгие года жизни.
    Аллахьу Ахад Аллахьу асСамад Аллахьу Экбэр!
    [/more]

    Автор: bolega, Отправлено:21:21 02-08-2023

    Я постараюсь, если получится, снять видео про рамку.
    Опция ignore gap находится на закладке Page > special > Main, т.е. там же, где задается вручную угол deskew

    Автор: shch_vg, Отправлено:22:05 02-08-2023

    Всем, кто удаляет мусор через Ctrl-Shift-щелчок в окне VR

    По подсказке bolega начал использовать VR-хоткей Ctrl+Shift+Click.
    Несмотря на его такое название этот хоткей действует по-другому, причем в гораздо лучшую сторону.
    В чем его преимущество?
    При удалении через Ctrl-Shift-щелчок задействуются два пальца одной руки для обязательного нажатия на клавиши Ctrl и Shift, другой рукой надо подвести курсор на удаляемую грязь и обязательно щелкнуть на ней.
    Если после этого, например, нужно удалить массив грязи прямоугольным выделением, то предварительно нужно отпустить клавиши Ctrl и Shift и т.д.
    Как происходит удаление грязи по VR-хоткею Ctrl+Shift+Click?
    Я его повесил на практически не применяемую мной букву клавиатуры "ё".
    При работе располагаю левую руку так, чтобы мизинец располагался НАД клавишей "ё", остальные рядом расположенные клавиши доступны для других пальцев этой руки.
    Но главное удобство заключается в том, что при этом не надо предварительно нажимать клавишу "ё", палец находится над ней. Правой рукой подвожу курсор в дельта-окрестность обнаруженной грязной точки и, не нажимая на КМ, жму мизинцем на клавишу "ё". Все!
    Кто-то может найти более удобную привязку этого хоткея к клавиатуре, но меня приведенный выше вариант устраивает на 100%.

    Для информации: Упомянутый хоткей впервые появился в СК версии 6.3.
    С другими возможностями этого хоткея можно ознакомиться в whats.new.

    Автор: shch_vg, Отправлено:16:11 03-08-2023

    bolega
    Что означает MW?
    До сих пор я думал, что это область, в которой высвечивается исходный скан, однако получилось, что это вся область программы.
    Обнаружил я это при использовании хоткея.
    Повесил один хоткей на букву "s", после чего лишился возможности проставлять эту букву в пути на закладке Files.

    Автор: mvk2006, Отправлено:17:46 03-08-2023


    Цитата:
    Что означает MW?

    http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2440#9

    Автор: aylocin, Отправлено:18:18 03-08-2023

    bolega
    У меня вопрос по теперешнему (в версии 6.95) режиму ручной вставки глифа/изображения из буфера - Paste (Ctrl+V), окно RV.
    В версии 6.8 я включал кнопку 'Remove specles that touch the pasted image', зачекивал 'Remove touching marashki', и после вставки глифа автоматически удалялся и возможный мусор вокруг. Было очень удобно.
    Теперь, в версии 6.95 при этих же условиях изображение при вставке вначале обрезается по контуру. В результате после вставки мусор вокруг вообще не удаляется, его может остаться еще больше за счет обрезки глифа. При этом результат вставки, кажется, не зависит от того, зачеканы или нет опции 'Remove touching marashki', 'Remove touching only'.
    Возможно ли теперь в версии 6.95 такое автоудаление мусора вокруг при ручной вставке (какие-то опции/настройки)?
    OCR не выполнялся.
    Еще замечено, опечатка в диалоге 'OCR replace option's helper' - 'Способ применениЕя'

    Автор: bolega, Отправлено:18:40 03-08-2023

    aylocin
    Вы уверены, что у вас не включена опция transparent merging?
    И что у вас задано в clear options > ocr > touching mode и какие размеры в clear options > despeckle

    Добавлено:
    shch_vg

    Цитата:
    Повесил один хоткей на букву "s", после чего лишился возможности проставлять эту букву в пути на закладке Files.

    Уверены? Я не смог воспроизвести. Все буквы проставляются без проблем

    Автор: shch_vg, Отправлено:19:21 03-08-2023

    bolega

    Цитата:
    Уверены? Я не смог воспроизвести

    У меня это проявляется на одном (?) хоткее: Paste zones, который висит на клавише "S" и в путь не могу вставить эту букву.
    Захожу в настройки и меняю S на L. после чего S могу вставить, а L нет.

    Добавлено:
    mvk2006
    Вы читаете только первое предложение каждого сообщения?

    Автор: bolega, Отправлено:19:47 03-08-2023

    -

    Автор: TelecomUral, Отправлено:19:48 03-08-2023

    shch_vg
    а винду-то вы обновили, после выявления что ваша версия с буфером обмена не фурычит?

    Добавлено:

    Цитата:
    bolega
    Я не смог воспроизвести

    хы! да, я попробовал на тот хоткей навесить "D", и, действительно, в путь до папки с выходными файлами невозможно влепить "d" и русскую "в"

    Автор: shch_vg, Отправлено:22:57 03-08-2023

    bolega

    Цитата:
    Используйте букву вместе с Ctrl или Alt, но включите опцию optional. Тогда сможете использовать букву и без Ctrl/Alt, и конфликта с меню не будет.

    Вроде работает, но вопрос остается.
    Чуть выше этого хоткея есть хоткей Paste zone to cursor (top-left), который у меня на букве D, но эта буква в путь вставляется.
    Похоже, что это особенный хоткей.

    И еще вопрос. Можете пояснить, что делает хоткей Clear selection в MW?

    TelecomUral

    Цитата:
    а винду-то вы обновили ...?

    А какое это имеет отношение к моему вопросу?

    Добавлено:

    Цитата:
    на тот хоткей навесить "D"

    как и любую другую букву

    Автор: bolega, Отправлено:00:30 04-08-2023

    shch_vg
    это баг, исправил

    Автор: aylocin, Отправлено:01:06 04-08-2023

    bolega

    Цитата:
    Вы уверены, что у вас не включена опция transparent merging?
    И что у вас задано в clear options > ocr > touching mode и какие размеры в clear options > despeckle


    Опцию с таким именем 'transparent merging' нигде не смог найти, если же речь о 'Merge with white transparence', то нет, выполнялся чистый Merge кликом на свободном месте.
    Touching mode не трогал вообще, там же написано Do not modify. По сравнению с v.6.8 там появились два новых чекбокса, зачеканных.
    Размеры Despeckle: 7, 4, 1, 4
    Я провел, считаю, чистый эксперимент:
    Скопировал полностью папку с SK 6.8 в другую папку, добавил туда новый exe-файл от 6.95, запустил, он создал новый sk6.95.ini.
    Далее в обеих версиях повторил создание нового таска для одного и того же скана, с одинаковыми параметрами обработки. Никаких опций дополнительно в версии 6.95 я не менял.
    Результат вставки одного и того же глифа в разных версиях пытался свести на картинке:




    Автор: mvk2006, Отправлено:05:14 04-08-2023


    Цитата:
    Опцию  с таким именем 'transparent merging' нигде не смог найти




    Автор: TelecomUral, Отправлено:08:57 04-08-2023


    Цитата:
    aylocin
    Размеры Despeckle: 7, 4, 1, 4

    ИМХО, выставьте через helper размер марашки. Для 600дпи он не менее 24, а у вас 7. Я вообще ставлю 40-46, если буквы крупные. Замеряю максимальную. Но, конечно, без OCR удалять такой крупняк чревато.

    Автор: bolega, Отправлено:09:14 04-08-2023

    Судя по тому, что после наложения мусор остался аж внутри глифа, явно включен режим прозрачности.

    TelecomUral

    Цитата:
    ИМХО, выставьте через helper размер марашки

    Допустимый размер удаляемых соседей зависит от заданного размера спекла на закладке despeckle (он же задается и через helper). Но это верно, если галка на опции Use optimal size for touching speckles (закладка OCR) снята. Когда галка стоит (по умолчанию именно так), СК сам подбирает пороги для удаления граничных спеклов (исходя из dpi). Если галка снята, пользователь должен сам следить за допустимыми размерами спеклов.
    Я сделал так, потому что многие не понимают важности задания размера спекла, отличного от дефолтного, при использовании touching despeckle.

    Автор: TelecomUral, Отправлено:09:25 04-08-2023


    Цитата:
    bolega
    СК сам подбирает пороги для удаления граничных спеклов (исходя из dpi)

    тогда надо бы как-то блокировать ручное изменение размера. Потому что галка установлена, а "40" мало того что можно ввести и сохранить, так реально 40 применяется - я нажимал "optimal", проставлялось "24", тащил глиф - марашка не чистилась. я ее померял, она 36, я ввел 40, снова потащил глиф и марашка исчезла. (естественно, откат вставки глифа делал перед этим, чтоб марашка снова коснулась буквы).

    Автор: aylocin, Отправлено:09:46 04-08-2023

    bolega

    Цитата:
    Судя по тому, что после наложения мусор остался аж внутри глифа, явно включен режим прозрачности.


    Не включен, что-то другое. Кнопка 'Transparent merging' у меня на панели не отображалась, добавил. Как я понимаю, ее нажатие эквивалентно применению 'Merge with white transparence' по ПКМ, и поведение при этом другое, содержимое глифа добавляется к скану. Пробовал включать, выключать. При включенной для приведенного мной примера изображение после вставки визуально остается без изменений.
    Я бы предположил, что-то алгоритмическое. Трудно судить...
    Может, выложить таски, скажем, добавив туда и ini-файлы от обеих версий?

    UPD: Выложил здесь
    https://drive.google.com/file/d/10Dy2LBDANOynouSdK6J3PlTWw9bi2eBU/view?usp=sharing

    Добавлено:
    Похоже, нашелся вариант при котором поведение, вроде, аналогично версии 6.8
    Если в Clear options=> OCR=> Touching mode (которое Do not modify) поставить Strength = 1 вместо дефолтных 2, то мусор в окрестностях удаляется. Всем спасибо.

    Автор: bolega, Отправлено:19:02 04-08-2023

    aylocin

    Цитата:
    Похоже, нашелся вариант при котором поведение, вроде, аналогично версии 6.8

    Да, прошу прощения, забыл, что при Strength = 2 (самый осторожный вариант чистки) СК делает частичную прозрачность с боков, по задумке чтобы не навредить соседним рваным буквам. Если рваности нет, то можно смело юзать Strength = 1.

    Добавлено:
    Версия 6.97
    https://workupload.com/file/a9XZujBCFvW
    исправлены обнаруженные в последнее время баги

    Автор: zvezdochiot, Отправлено:04:38 05-08-2023

    bolega

    Есть набор фильтров, позволяющих значительно управлять любым порогом: scantailor-experimental: ColorFilter.cpp. Возможно вам будет немного интересно. Особо полезен для "борьбы с фоном" фильтр screenFilter, а для выравнивания цветных надписей с "черными" - фильтр coloredSignificanceFilter+coloredDimmingFilter.

    Автор: TelecomUral, Отправлено:04:46 05-08-2023

    bolega
    При сохранении второго открывавшегося задания предлагается исходное имя первого задания.
    Был такой порядок открытия/закрытия:
    открыл СК.
    создал и сохранил vygodsky_kusok.spt
    создал в новом СК outtask vygodsky_kusok-out.spt
    закрыл оба СК, причём первым закрыл outtask.
    Открыл СК.
    открыл vygodsky_kusok.spt, поменял параметры.
    закрыл задание, при этом сохранил как vygodsky_kusok_v2_Wolf.spt.
    открыл через меню из запомненного списка vygodsky_kusok-out.spt (оно предпоследнее)
    поменял в визарде имя выходного файла джву.
    Закрыл СК, при этом в предложении "сохранить изменённое задание?" подставлено имя vygodsky_kusok.spt. А ожидалось vygodsky_kusok-out.spt

    Добавлено:
    почему-то paste by dbl click в preferencies б-ки глифов перестал сохраняться. хотя спрашивает при закрывании СК.

    Автор: bolega, Отправлено:11:19 05-08-2023

    TelecomUral
    Не смог воспроизвести. Такой баг был в какой-то версии, но я его исправлял.
    И странно вот что:
    если открыть vygodsky_kusok.spt и сохранить как vygodsky_kusok_v2_Wolf.spt, то vygodsky_kusok-out.spt станет как минимум третьим с конца, но никак не предпоследним как вы пишите, т.к. предпоследним станет vygodsky_kusok.spt

    dbl click исправлю.


    Добавлено:
    zvezdochiot

    Цитата:
    Особо полезен для "борьбы с фоном" фильтр screenFilter, а для выравнивания цветных надписей с "черными" - фильтр coloredSignificanceFilter+coloredDimmingFilter.

    А вкратце, что они делают? Что значит выравнивание?

    Автор: TelecomUral, Отправлено:14:15 05-08-2023


    Цитата:
    И странно вот что:

    Я, наверное, наврал, открывал его с диска. Потому что его в списке вообще не было. Точно не скажу уже, список следующими заданиями заполнился.

    Автор: zvezdochiot, Отправлено:15:34 05-08-2023

    bolega say:

    Цитата:

    А вкратце, что они делают? Что значит выравнивание?

    [more=Попробую...]
    screenFilter, - "выбеливает" изображение (так он делал изначально, когда я использовал наложение screen, теперь, когда я поменял наложение на overlay, эффект "слегка" иной). Фильтр на базе Blur. Принцип действия фильтра - он производит минимальное воздействие на компоненты изображения, совпадающие по размеру с окном данного фильтра (это оч хорошо, когда окно совпадает с толщиной литер). На всё остальное (не совпадающее) его воздействие значительно больше. Именно так он глушит всё, не совпадающее с литерами.

    coloredSignificanceFilter+coloredDimmingFilter - пара фильтров, работающаяя в связке для выравнивания цветного текста с "чёрным" по яркости. Фильтр coloredSignificanceFilte, используя модель YCbCr, определяет "цветность" пикселей (отличие Cb и Cr от медианного значения без знака). На основе цветности строит маску "яркости". Фильтр coloredDimmingFilter применяет маску "яркости" к конкретному изображению. После применения цветной текст становится тёмным и порог (любой) делает его чёрным. Без этого цветной текст зачастую порогом выбеливается.
    [/more]

    PS: Откуда взялись эти фильтры? Результаты моих "экспериментов" в GIMP.

    Автор: bolega, Отправлено:16:01 05-08-2023

    zvezdochiot
    Для удаления фона в СК несколько методов предусмотрено. Действуют по похожему принципу.

    Цитата:
    coloredSignificanceFilter+coloredDimmingFilter

    а нет ли, наоборот, фильтра, который выделяет именно цветной текст. Т.е. строит например, маску, которая включает только цветной текст. У меня есть фильтр, который выделяет черное, серое или близкое к нему, но иногда захватывает и темный "грязный" цветной текст
    Расцвечивать текст любят в словарях:
    https://workupload.com/file/dkUmtBXZJY2

    Автор: zvezdochiot, Отправлено:16:22 05-08-2023

    bolega

    Цитата:

    а нет ли, наоборот, фильтра, который выделяет именно цветной текст.

    Ну так примени порог (любой) к маске "цветности"/"яркости" и получишь заготовку того, что тебе нужно. Останется только отделить именно текст от просто цветных областей (нетекстовых, в твоих примерах таких нет).

    PS: Как вариант требуется доп. операция: Взять пиксели, попавшие в маску, и применить к ним Otsu либо BiModal. То что станет чёрным - текст, белым - муар вокруг текста.

    Автор: bolega, Отправлено:09:10 06-08-2023

    Если у кого будут проблемы с движениями резаков, особенно наклонных, пишите. Мне казалось, что я улучшил скорость. Но по крайней один пользователь говорит, что стало хуже. Возможно, это сильно зависит от размера (разрешения) монитора, но сейчас проверить на высоких разрешениях у меня нет возможности за неимением такого железа.

    Автор: shch_vg, Отправлено:19:07 09-08-2023

    bolega
    Впервые столкнулся с таким чудом: исходный и обработанный сканы нормальные, а при просмотре в RV выходной файл представлен в инверсном виде.
    Проверил на СК от 5.94 до 6.97.

    Автор: bolega, Отправлено:19:35 09-08-2023

    shch_vg
    Вы чего-то напутали. Выходной файл не является обработкой входного. Углы и края у доски совсем разные, хотя фигуры те же. Наверно, результат ручных манипуляций с зонами...

    Автор: shch_vg, Отправлено:20:06 09-08-2023

    bolega

    Цитата:
    Выходной файл не является обработкой входного.

    Естественно.
    Я применил эти названия, чтобы различить эти файлы.
    Обрабатывая книгу, получаю много зон с неважными диаграммами.
    По ним создаю фен-файл, с помощью которого затем получаю приемлемые для книги диаграммы.
    Прежде чем вставлять их вместо старых, нужно убедиться в их правильности сравнением с родными.
    Наиболее удобно это делать, загрузив старые в новую сессию СК и настроив на показ в RV новых диаграмм. Далее сохраняю это задание, закрываю его, открываю заново и в RV вижу новые диаграммы.
    Перехожу в режим сравнения и сравниваю старую диаграмму слева с новой справа.
    До сих пор не имел никаких проблем при таком сравнении, а с инверсией столкнулся впервые.

    Автор: bolega, Отправлено:20:24 09-08-2023

    Вы дали задание, которое я запустил и получил выход без всякой инверсии. Что вы еще хотите? Как по тому, что вы дали, можно что-то проверить??? Вы намешали кучу файлов из разных программ, нате, разбирайтесь. Так что-ли? Может вы опцию инверсии включили в зоне, или на странице.

    Автор: shch_vg, Отправлено:20:52 09-08-2023

    bolega
    Да, я вопрос поставил некорректно, только что сам понял.
    У меня другой вопрос.
    Загружаю файл diag0001.tif из папки out в СК и вижу его в главном окне в инверсном виде.
    Открываю в Ирфане и вижу в нормальном.
    У Вас так же или это выбрыки моей системы?

    Автор: bolega, Отправлено:21:56 09-08-2023

    shch_vg
    СК показывает инверсно

    Автор: shch_vg, Отправлено:22:07 09-08-2023

    bolega
    Получается, если создать файл тиф с компрессией CCITT Group 4 Fax Encoding, то он будет виден инверсно в СК? Как-то можно его предварительно преобразовать, т.к. этот файл просто создавался на стороне?

    Проверил, что не все тифы с компрессией CCITT Group 4 Fax Encoding высвечиваются инверсно.

    Автор: Izich, Отправлено:00:51 10-08-2023

    Здравствуйте, обязательно OCR ( FineReader) через прогу добавлять в СК? или есть другие методы (проще для восстановления книги глифами). Может лёгкая инструкция?

    Автор: bearjrgm, Отправлено:10:26 10-08-2023

    Izich
    Вы можете использовать OCR из FineReader или Tesseract (в комплекте). Дальше набираете глифы в данной книжке. Наиболее безопасно далее просматривать фрагментами и заменять. Быстро и легко не будет, но результат того стоит.
    Качество зависит от качества распознавания. По глифам естественно нужно создать набор для каждого шрифта в книжке.

    Автор: bolega, Отправлено:10:36 10-08-2023

    shch_vg
    Исправил баг. Спасибо!

    Добавлено:
    Я тут кстати недавно глифировал одну полностью убитую страницу. После FR создал список замен, почти все строки в списке замен были без галки из-за сильного отличия букв и глифов (при этом распознавание было практически без ошибок что облегчало проверку), затем шел по всему списку, и кнопками + включал галки, но приходилось каждую букву глазами проверять на соответствие кода начертанию (т.е. что "н" действительно "н", а не "и" например). Помогает конечно маленький preview под списком, т.к. там каждая проверяемая буква подсвечивается желтым (сделал кстати подсветку зеленым, если буква - заглавная). Но все равно приходилось переводить взгляд выше на список чтобы удостовериться что код буквы правильный. В итоге сделал, что при движении по списку, СК в момент отрисовки маленького preview (под списком) проговаривает заменяемую букву голосом. Вроде бы стало полегче, но надо привыкнуть.
    Звуки букв, цифр и знаков препинания на русском нашел в интернете. Для других языков пользователю можно настраивать звуки самому (каждая буква в отдельном wav-файле), имя файла - юникод-код буквы (символа) или сцепка нескольких кодов для диакритических букв.
    Не нашел произношение мат. знаков и спец. символов (+, =, *, /, $,% и т.п.). Если кто сможет с этим помочь, будет хорошо.
    В инете легко находятся произношения букв на английском и некоторых других языках. С остальными символами туго.

    Автор: zvezdochiot, Отправлено:12:01 10-08-2023

    bolega say:

    Цитата:

    Не нашел произношение мат. знаков и спец. символов (+, =, *, /, $,% и т.п.)

    Может стоит RHVoice пользовать для произношения?:

    Код:

    RHVoice-test -p elena <<< "+"
    RHVoice-test -p elena -o plus.wav <<< "+"
    RHVoice-test -p elena <<< "$"
    RHVoice-test -p elena <<< "%"

    Или давай список символов и названий файлов. С помощью RHVoice wav-ы нагенерю.

    Автор: jourmager, Отправлено:12:16 10-08-2023

    bolega

    Цитата:
    Не нашел произношение мат. знаков и спец. символов (+, =, *, /, $,% и т.п.)

    Или я что-то не так понял, или:
    открываем сайт translate.google.com
    в левом окне вводим символы по одному, можно все сразу. но тогда возможны сбои
    в левом окне принудительно выставляем нужный язык
    в левом окне в нижнем левом углу нажимаем кнопку динамика
    слушаем произношение символа

    Автор: bolega, Отправлено:12:40 10-08-2023

    zvezdochiot
    спасибо, попробую сгенерить недостающее.
    надо еще подумать, чем лучше заменить произношение знаков типа !? а то слишком долго звучат. Типа "ого" вместо "!", "да ну" вместо "?"

    jourmager

    Цитата:
    слушаем произношение символа

    зачем мне слушать в гугле? мне надо wav-файл для СК.
    да и умничает он. Мне надо произнести "тчк" (тэчэка), а он упорно произносит "точка".

    Добавлено:
    zvezdochiot

    Цитата:
    RHVoice
    не подходит. Она оказывается только для NVDA типа как плагин-синтезатор.
    А мне нужен просто готовый exe-синтезатор под windows.



    Добавлено:
    zvezdochiot
    если не сложно, сгенерируйте
    [more]
    RHVoice-test -p elena -o plus.wav <<< "+"
    RHVoice-test -p elena -o minus.wav <<< "-"
    RHVoice-test -p elena -o eq.wav <<< "="
    RHVoice-test -p elena -o div.wav <<< "/"
    RHVoice-test -p elena -o mul.wav <<< "*"
    RHVoice-test -p elena -o dol.wav <<< "$"
    RHVoice-test -p elena -o proc.wav <<< "%"
    RHVoice-test -p elena -o ogo.wav <<< "ого!"
    RHVoice-test -p elena -o danu.wav <<< "дану"
    RHVoice-test -p elena -o ii.wav <<< "ий"
    RHVoice-test -p elena -o da.wav <<< "да?"
    RHVoice-test -p elena -o da0.wav <<< "да"
    RHVoice-test -p elena -o mulr.wav <<< "муль"
    RHVoice-test -p elena -o divr.wav <<< "див"
    RHVoice-test -p elena -o procr.wav <<< "проц"
    RHVoice-test -p elena -o minus1.wav <<< "минус"
    RHVoice-test -p elena -o mya.wav <<< "мягкий"
    RHVoice-test -p elena -o tverd.wav <<< "твердый"
    RHVoice-test -p elena -o delit.wav <<< "делить"
    RHVoice-test -p elena -o yat.wav <<< "ять"
    RHVoice-test -p elena -o uh.wav <<< "ух!"
    RHVoice-test -p elena -o ah.wav <<< "ах"
    RHVoice-test -p elena -o net.wav <<< "нет"
    RHVoice-test -p elena -o men.wav <<< "<"
    RHVoice-test -p elena -o bol.wav <<< ">"
    RHVoice-test -p elena -o zpt.wav <<< "зпт"
    RHVoice-test -p elena -o zpt2.wav <<< ". зпт"
    [/more]

    Автор: zvezdochiot, Отправлено:14:29 10-08-2023

    bolega say:

    Цитата:

    А мне нужен просто готовый exe-синтезатор под windows.

    Govorilka

    bolega say:

    Цитата:

    сгенерируйте

    Щаз сгенерим... Я.диск wavs 583k

    Автор: mvk2006, Отправлено:15:54 10-08-2023

    Как вариант синтезатора
    несколько символов

    Автор: jourmager, Отправлено:16:21 10-08-2023

    del
    Не сразу понял задачу.

    Автор: bolega, Отправлено:16:57 10-08-2023

    zvezdochiot
    Спасибо. Неплохо.
    mvk2006
    Тут с интонацией получше.

    Автор: Izich, Отправлено:03:33 11-08-2023

    Нигде не могу найти ocr.dll Где он?
    И использую приложение, которое дает готовые hocr (из тессеракта) постранично. Как мне подключить их уже готовых hocr к СК?

    Автор: bolega, Отправлено:09:56 11-08-2023

    Izich
    Дайте пожалуйста несколько hocr-файлов и соответствующих им обработанных страниц.
    Подключение OCR через hOCR стоит у меня в планах (to do list).
    Tesseract должен запускаться с опцией hocr_char_boxes=1

    ocr2.dll: see
    http://forum.ru-board.com/topic.cgi?forum=5&topic=50023&start=2420#17
    >
    https://workupload.com/file/BLuUj5mbpMx

    Автор: Izich, Отправлено:15:16 11-08-2023

    Спасибо за ссылку на Парсер (до этого не мог найти)!
    Возможно провести замену глифами apply all для всех страниц книги после analyse all pages сразу, чтобы не приходилось это делать постранично?

    Автор: bolega, Отправлено:16:14 11-08-2023


    Цитата:
    Возможно провести замену глифами apply all для всех страниц книги после analyse all pages сразу, чтобы не приходилось это делать постранично?

    У кнопки Apply all есть выпадающая команда apply to files...
    Замена без предварительной тщательной проверки очень рискованна.
    Поэтому при выполнении apply to files СК создает bak-файлы перед изменением.

    Автор: Benoni, Отправлено:19:12 11-08-2023


    Цитата:
    СК создает bak-файлы перед изменением

    Очень ценная вещь...

    Автор: zvezdochiot, Отправлено:03:23 12-08-2023

    bolega say:

    Цитата:

    Подключение OCR через hOCR стоит у меня в планах (to do list).

    Тогда на всякий:
  • tesseract2djvused - конвертер с парсером на базе QXML.
  • hocr-tools - пайтоновские парсеры на базе lxml.

  • Автор: shch_vg, Отправлено:13:27 16-08-2023

    bolega
    Иногда возникает проблема из-за опасной близости двух пиктограмм в режиме просмотра, а именно, Next page и Last page. При последовательном просмотре обработанных сканов, используя первую пиктограмму, постепенно курсор мыши перемещается на вторую, а все внимание приковано к содержимому текущего скана, в результате вместо очередного скана мы оказываемся на последнем, не понимая, как найти скан, который мы просмотривали перед этим.
    [more=Знатокам СК]Я знаю все другие способы перемещения с одного обработанного скана на следующий за ним, но в данном вопросе речь идет о рядом стоящих пиктограммах в меню VR.[/more]
    Нельзя ли реализовать один из двух вариантов.
    1. Добавить пиктограмму возврата на предыдущий просмотренный скан наподобие пиктограммы Назад в программе WinDjView.
    2. Дать возможным делать disable|enable пиктограммы Last page по ПКМ перед началом такого просмотра.

    Автор: bolega, Отправлено:13:45 16-08-2023

    shch_vg

    Цитата:
    Добавить пиктограмму возврата на предыдущий просмотренный скан наподобие пиктограммы Назад

    В хрестоматии описан способ возврата - backspace

    Автор: kamenkapenza, Отправлено:16:08 16-08-2023

    Друзья, что это может быть, вот тут, что за ошибка https://disk.yandex.ru/i/pArrQPaeGUfqDQ ?

    Автор: shch_vg, Отправлено:17:02 16-08-2023

    bolega

    Цитата:
    backspace

    Спасибо, не знал.

    Автор: mvk2006, Отправлено:17:17 16-08-2023

    shch_vg
    А что в File - Options - Misc - OCR mode?
    и нет ли символов в protected chars (Exclusive Page options - вкладка protect) ?

    Зов о Помощи отменяется?

    Автор: bolega, Отправлено:18:28 16-08-2023


    Цитата:
    Друзья, что это может быть, вот тут, что за ошибка

    Припоминаю. Точно уже причину не помню, но это был редчайший баг. В какой-то из последующих версий я его исправил.

    Автор: shch_vg, Отправлено:19:10 16-08-2023

    mvk2006

    Цитата:
    А что в File - Options - Misc - OCR mode?

    Tesseract, но это никак не влияет, т.к. в моих безтессерактных заданиях стоит то же самое.

    Цитата:
    нет ли символов в protected chars (Exclusive Page options - вкладка protect) ?

    Это я просто не нашел, что и где?

    Все свелось к кнопке special... на закладке Page.
    Там на закладке Protect пришлось убирать все галочки слева, после чего обработка заработала.

    Добавлено:
    bolega

    Цитата:
    В какой-то из последующих версий я его исправил.

    В пору уже вводить правило, чтобы представляли работу в последнем выставленном варианте СК, а то так и будут находить старые ошибки.

    Автор: Izich, Отправлено:19:23 16-08-2023

    Здравствуйте,

    Есть тессеракт или finereader ocr уборка спеклов?
    Что после распознавания лишние спеклы не в радиусе букв автоматически убираются?

    И второй вопрос как как усилить убирание спеклов на всех файлах одновременно, не по файльно?

    Автор: mvk2006, Отправлено:20:30 16-08-2023


    Цитата:
    Это я просто не нашел, что и где?

    ну кнопка special и вызывает окно "Exclusive Page options"
    P.S.
    А в чем такая сложность подключения библиотеки?
    Это, на мой взгляд, неэффективное использование инструмента...

    Автор: shch_vg, Отправлено:22:08 16-08-2023

    mvk2006

    Цитата:
    вызывает окно "Exclusive Page options"

    Не хватало еще запоминать названия всех окон программы.

    Добавлено:

    Цитата:
    А в чем такая сложность подключения библиотеки?  
    Это, на мой взгляд, неэффективное использование инструмента...

    А зачем это нужно, если не используется?
    Очень эффективное использование - подключить и не использовать.

    Автор: mvk2006, Отправлено:22:57 16-08-2023


    Цитата:
    названия всех окон программы

    в названии есть информация и о назначении и о способе вызова и местонахождении. Хотя никто, в том числе и я не призывал ничего запоминать - дело хозяйское.

    Цитата:
    Очень эффективное использование - подключить и не использовать.

    ну в данном случае для запуска, анализа заданий пользователей, которые пользуются возможностями инструмента с большей эффективностью, наличие библиотеки уже имело бы смысл.
    Кроме того, автор может заложить в программу использование библиотеки и без ведома пользователя в самых разных случаях. Ну а уж демонстративно отказываться от использования возможностей инструмента, причем в большинстве своем добавленных по просьбе пользователей, на мой взгляд неразумно, хотя каждый волен сам решать за себя. Я же всего лишь спросил в чем трудность подключения библиотеки, но получил в ответ насмешку...

    Автор: asku, Отправлено:23:27 16-08-2023

    Добрый вечер.
    Подскажите пожалуйста. Сделал picture-зону (600 dpi, Color: B/W), указываю, что фон красный, а текст белый, но на выходе буквы красные, а фон белый.



    https://disk.yandex.ru/d/NZj-ZphEPZrqYg


    Автор: aylocin, Отправлено:00:29 17-08-2023

    asku
    Как возможный вариант, я бы поставил в свойствах этой зоны на закладке Filters2 Invert image=after process

    Автор: asku, Отправлено:00:37 17-08-2023

    aylocin
    Получилось. Спасибо!
    Никогда не трогал эти опции.

    Автор: TelecomUral, Отправлено:03:25 17-08-2023

    asku
    это называется заблудился в трёх соснах. СК не различает буквы и бумагу, он различает при раскраске более светлое и менее светлое. В вашем случае вы перепутали параметры "Text" (менее светлое, т.е. чёрное для BW) и "Background" (более светлое, для BW белое). Как выставили, так и раскрасилось - "чёрное" красить белым, "белое" красить красным. А в оригинале-то наоборот - красный фон менее светлый чем буквы.

    Я так думаю, в потрохах СК эти две области параметров просто от противоположных границ шкалы яркости идут. Text от 0 до указанного порога Tolerance, Background наоборот, от 255 до своего порога.

    Автор: bolega, Отправлено:10:50 17-08-2023

    TelecomUral

    Цитата:
    при раскраске более светлое и менее светлое

    Это же b/w-зона на выходе! Как бинаризовалась, так и раскрасилась: черное трактуется как текст, белое - как фон. Все условно. Это не значит, что СК распознал там какой-то текст.
    А Tolerance - это на случай, если зона не бинаризуется. Цветные зоны тоже можно раскрашивать.
    Использовать invert в данном случае не рекомендую. Проще задать цвет текста - красный (вместо фона) и не мучиться.
    Фон зоны в djvu кодируется с потерями (если только не задать для такой раскрашенной зоны опцию трактовки ее как малоцветки), раскрашенный текст - без. Поэтому если есть возможность обойтись без фона, лучше сделать без него.

    Автор: kamenkapenza, Отправлено:20:16 19-08-2023

    Перехожу на новую версию программы - 6.97. Вопрос: всё ли я положил в папку Кромсатора? https://disk.yandex.ru/i/xo36todmwHWv-A

    Автор: Izich, Отправлено:01:53 20-08-2023

    Здравствуйте,

    1. Есть тессеракт или finereader ocr уборка спеклов или точнее, как использовать clear options/Use ocr автоматически на всех страницах, а не постранично?
    2. Можете пояснить: "Tesseract должен запускаться с опцией hocr_char_boxes=1", более детально, чтобы получилось подключить эти hocr файлы, плиз, очень надо?

    Автор: TelecomUral, Отправлено:07:40 20-08-2023


    Цитата:
    всё ли я положил

    "дистрибутив" - штука стабильная, и к какому-то СК - вроде 6.72 - есть txt описание доп.модулей. Дальше разобраться и самому несложно, развернув дистрибутив в чистую папку.

    Автор: kamenkapenza, Отправлено:14:59 22-08-2023


    Цитата:
    вроде 6.72

    Где его искать этот 6.72, если даже в шапке он отсутствует, не говоря о текстовом документе,который к нему прикреплен....?
    Ладно,буду считать, что всё гоже.

    Автор: mvk2006, Отправлено:15:21 22-08-2023


    Цитата:
    и к какому-то СК - вроде 6.72 - есть txt описание доп.модулей

    Вероятно, имелось ввиду sk-readme.txt из состава SK 6.75




    Автор: TelecomUral, Отправлено:05:59 24-08-2023

    Можно ли в VR при вставке картинки из буфера обмена, пока она еще не слита со страницей, двигать ее размер за углы (увеличивать размер), но с сохранением пропорций? Никогда не делал. Думал что это с Ctrl, но нет.

    Автор: mvk2006, Отправлено:06:57 24-08-2023


    Цитата:
    Думал что это с Ctrl, но нет.

    А попробуйте c «Alt» ?

    Автор: TelecomUral, Отправлено:07:21 24-08-2023

    mvk2006
    да

    Добавлено:
    Ещё вопрос по этой же теме. Можно ли при увеличении ресемплировать картинку сглаживающими методами? А то я глиф увеличил в 20 раз, и квадратики пикселей в глаза бросаются.

    Автор: bolega, Отправлено:12:16 24-08-2023

    TelecomUral

    Цитата:
    Можно ли при увеличении ресемплировать картинку сглаживающими методами?

    для глифа - нет. А какой в этом смысл?

    Автор: TelecomUral, Отправлено:12:34 24-08-2023


    Цитата:
    bolega
    А какой в этом смысл?

    А хрен его знает. Вот занудная переписка с индийцем:

    [more]=========

    Ayaskanta Baral
    ayasbaral@yandex.com
    24 августа в 7:28
    I want one kind help and suggestions. Suppose we copy an image from external source and want to paste it over one of the page of Result Window, I paste it but I want to drag the corners of image it to adjust the image propertion.What is the Short Cut Key to maintain the original propertion of the pasted image?

    ============
    Ответ ему

    My English is not very good for full understanding your problem and question.

    As I understood:

    1. you stay in VR mode (View Result Window of SK)
    2. you have the image on your disk
    3. you take the image to the windows clipboard in external viewer (irfanview or photoshop for example)
    4. you made "paste" from clipboard to the actual page in VR of SK.
    5. I do not understand further your steps. If you want drag corners, why you want "ShortCut Key" ? You must have mouse only.
    5a. May be, you want not 'propertion', but 'proportion'? If that, I do not know. May be it is 'Ctrl' of the mouse. Try it. Or say more details to me.

    ============
    Плюсом от меня

    if you want 'save proportion' then Alt+mouse and drag the !corner!.

    ============
    Далее

    Ayaskanta Baral
    ayasbaral@yandex.com
    24 августа в 9:32
    https://youtu.be/jxxjuXS4bQs
    See this video. I want this in SK.So how can I?

    ============
    Ответ ему:

    alekseevalexey@yandex.ru
    alekseevalexey@yandex.ru
    24 августа в 10:59
    I see three various methodes in video. What kind you want? concretical and with example.

    ============

    Ayaskanta Baral
    ayasbaral@yandex.com
    24 августа в 10:35
    Sir any different ways of possible methods.Kindly teach me. I want to learn all methods of image propertion settings in SK. Because most of my projects are based on this.So I want to learn all of them. If possible kindly share me training video. I already saved all of the videos of you for my reference.

    ============
    Моё:

    alekseevalexey@yandex.ru
    alekseevalexey@yandex.ru
    24 августа в 11:17
    I do not know anything about rescaling
    I write the question to bolega on ru-board.

    But!
    I think, if you take external picture to SK, the best way to rescale image through external editor before paste. Because SK is not professional graphical editor, it was created for prepare ebooks from scans "one-to-one". Identical, not rescaling.


    =============
    Последнее:
    ---------------------

    Thank you sir. Kindly continue training video posting at it will be very helpful to us . https://youtube.com/@aawaawto?si=V4QsgSn4T0qdf4WJ

    Там я ничего не обнаруживаю, кроме базовой страницы с моими видео.
    [/more]

    Автор: bolega, Отправлено:13:10 24-08-2023

    TelecomUral
    Я думал, что речь идет об окошке detail глифа.
    А Вы о "ручном" ресэмлировании вставки?

    Автор: TelecomUral, Отправлено:13:11 24-08-2023

    bolega
    ну да. товарища можно понять только так, по-моему.

    Автор: zvezdochiot, Отправлено:13:17 24-08-2023

    TelecomUral say:

    Цитата:

    только так, по-моему.

    Коли речь за глифы, не стоит ли применять пиксельартные методики упскейпа?
    А то применять сглаживание к глифам? Что в результате вы намерены получить? Неужто нечто жирное и бесформенное?

    Автор: TelecomUral, Отправлено:13:38 24-08-2023

    zvezdochiot
    лично я вообще ничего не намерен получить. Намерен индиец. Всё что я смог понять из его писем - я запросил. С глифом я конечно переборщил, это неверное условие.

    Автор: bolega, Отправлено:14:54 24-08-2023

    TelecomUral
    Можно вручную изменять размеры вставки, но не более чем в 2-3 раза. Тут вы правильно ответили. Если нужно масштабировать на больший процент, то делать это надо специальными методами, а не путем растягивания мышкой. Иначе качество будет сильно деградировать.
    Если растягивание выполняется для зоны в задании для pdf (т.е. без последующего merge), то тогда можно растягивать сколько угодно. Т.к. масштабирование будет выполняться средствами вьера и только в момент рендеринга страницы.


    Добавлено:
    TelecomUral
    Я недавно обрабатывал известный вам двухтомник "250 лет...", там было по 2 тысячи зон в каждом. Как известно, расстановка зон в СК это дело муторное, особенно если на одной странице надо ставить несколько зон с разными свойствами. Для облегчения этого служат 5 зон-карманов, а также индексы зон, но все равно сложно. Я для убыстрения реализовал такую штуку: ввел action-ы, т.е. автоматические действия в ответ на какое-то другое действие. Это в некоторой мере облегчило процесс расстановки зон. Например, при загрузке четного файла активируется зона из кармана №1, если создать ее, СК автоматически активирует карман №2, после создания зоны №2 ее индекс меняется на значение такое-то, после создания четвертой по счету зоны включается измеритель угла и т.п. Таким образом, я просто шел по страницам, расставлял зоны, а СК сам назначал им нужные свойства в зависимости от их количества (благодаря тому, что зоны в основном однотипны на всех страницах, т.е. сначала идет зона-картинка, затем цветной номер страницы, затем цветные полоски и т.п.).
    Т.е. action - это набор: 1) событие (загрузка файла, создание зоны) 2) действия СК (активировать карман, поменять номер у только что созданной зоны и т.п.) 3) условия при которых применять действия (действия не выполняются, если не соблюдаются условия), например индекс зоны, ее тип, кол-во, исх. файл (четный/нечетный, выделенный или нет и т.п.) и т.п.
    Если у вас есть пожелания, что еще и при каких условиях нужно учесть в action, предлагайте.

    Автор: TelecomUral, Отправлено:15:43 24-08-2023


    Цитата:
    что еще и при каких условиях нужно учесть в action

    угу!
    Сходу не соображу, но подумаю.

    Помнится, бывали типовые задачи при малоцветке - когда штатными средствами размножения зон ничего не получалось ускорить. Зон 600-700 было, и не вполне простая логика создания. Я тогда подумывал предложить вам что-то типа сложного комплекса условий сгенерить, но отказался, потому что нормальный универсальный шаг это скрипт. А это сложно и не так уж часто надо. Потом появились группы и увеличилось число карманов. Ну и вопрос снялся.

    +
    Я так думаю, соотнесение с правилом прижима к стороне листа пригодится. Не просто чёт-нечет.

    Автор: TelecomUral, Отправлено:07:35 26-08-2023


    Цитата:
    Сходу не соображу, но подумаю.

    подумал.
    Можно выставлять условия на палитру. Бывает что группа зон нужна одна и та же, а вот в пределах страницы нужно три-четыре цвета раскраски поставить. Например, цветной текст колонтитула или страницы - они еще ладно, типовые по местоположению и их можно размножить заранее. А если цветом названия параграфов или точки около абзацев - то проблема. Хотя я буквально два раза с таким многообразием столкнулся, что карманов свойств не хватает. (как раз на учебниках зоологии или биологии конца 1980х гг - Трайтак и проч.) Поэтому нечто такое: если у созданной зоны цвет text|BG был активный такой-то, то в новой зоне поменяй его на такой-то". Или даже парой, условие "и text и BG".

    Хотя этот хитромудрый вариант наверное можно решить и через грамотное копирование свойств в карман и обратно. Всё равно вариантов не десятки. Больше 8 даже, пожалуй, не припомню.

    И крутится ещё занудное выставление конкретного фона для вычитания. Когда зоны в разных местах, страницы желтели по-разному, и надо вот прям конкретный участок проверить и с выделением его цвет уточнить. Но как тут action присобачить, сам не пойму.

    ---
    сканил тут "Русскую народную музыку" Бацера (#). Хо-ороший там указатель нот (с точки зрения перекрестных ссылок). Не думали вы расширить СК в направлении авторасстановки таких переходов?

    UPD

    важно! а нельзя ли учитывать откуда именно пришли свойства зоны - из кармана или вручную поменяны? Тогда нажатие кнопки кармана будет триггером цепочки.

    Автор: zvezdochiot, Отправлено:08:06 26-08-2023

    TelecomUral say:

    Цитата:

    подумал.

    А еще стоит применить простые вещи, упрощающие применение фильтров. Например, повесить reFilter на отрицательные радиусы:

    Код:

    filter(I,-r) = reFilter(I, Ir)
    Ir = filter(I, r)
    reFilter(I, Ir) = I + (I - Ir)

    PS: В STEX я такую штуку применяю более гибким образом, через коэффициенты фильтров:

    Код:

    Irc = coef * Ir + (1.0 - coef) * I
    coef = -2.0 .. 2.0

    И не знаю реализована ли возможность диффить/патчить изображения:

    Код:

    Id = diffImage(I1, I2) = (I1 - I2 + 127) % 256
    Ip = patchImage(I1, Id) = (I1 + Id - 127) % 256


    Автор: bolega, Отправлено:09:23 26-08-2023

    TelecomUral

    Цитата:
    Поэтому нечто такое: если у созданной зоны цвет text|BG был активный такой-то, то в новой зоне поменяй его на такой-то". Или даже парой, условие "и text и BG".

    Вообще-то использовать в качестве условий значения конкретных опций я не планировал. Только основные атрибуты: номер, тип. Иначе интерфейс задания этих action превзойдет по сложности диалоги свойств зон.
    А то, что вы хотите, я как раз и делаю с помощью номера группы. Не надо сразу пытаться задать цвет фона/текста. У раскрашенных зон все остальные опции одинаковы, поэтому при их создании можно использовать один карман. А вот номер группы можно менять с помощью action. И уже после расстановки всех зон присвоить всем зонам например с группой 1 цвет такой-то, с группой 2 - такой-то и т.д.

    Автор: TelecomUral, Отправлено:10:26 26-08-2023


    Цитата:
    bolega
    А вот номер группы можно менять с помощью action

    но его можно менять и шорткеем создания зоны. Зачем тогда action? Тогда я видимо совсем не уловил трудность с "250 лет...". Там всего два типа зон, фотка и коричневая краска.

    Я, может быть, и сам уже плохо помню, но вариант с шорткеем и номером группы тогда у меня не вышел. Чего-то не проходило по комбинаторике. Может просто не додумался

    Автор: bolega, Отправлено:10:43 26-08-2023


    Цитата:
    но его можно менять и шорткеем создания зоны. Зачем тогда action? Тогда я видимо совсем не уловил трудность с "250 лет...".

    Вы серьезно про шорткей? 600 страниц по пять зон на странице, 3000 раз нажимать левой рукой? Нафиг. Хватает и правой на мышке.
    Я иду по сканам и в режиме mouse-up расставляю зоны, свойства и группы проставляются сами в соответствии с заданным action. Я не хочу задействовать клавиатуру, вторая рука отдыхает.

    Гляньте на книгу. Там все линии как близнецы. Потому что в out-задании была автозамена одних зон на другие, эталонные. Их там 5 видов (одиночная, двойная короткая, двойная короткая перевернутая, такие же длинные). Как бы вы их заменили скопом без номера.


    Автор: asku, Отправлено:10:57 26-08-2023

    bolega
    Грустно, что пользователи как правило не хотят и даже не пытаются понять то, что я делаю.

    Если бы был видеопример, понял бы наверное. )

    Автор: TelecomUral, Отправлено:11:23 26-08-2023


    Цитата:
    Я не хочу задействовать клавиатуру, вторая рука отдыхает.

    аа! Я-то спокойно к этому отношусь. При моих объёмах работы со сканером 3000 раз клацнуть кнопочку плёвое дело. Ну, передохнул сутки, некритично.

    [more=оффтоп]Странный разговор. Вы спросили совета, я его дал. В итоге - негатив. Спрашивать чтобы погрустить?
    Если я никогда не работал с введенной фичей, да и книги делаю раз в пятилетку, чего ждать от меня понимания. К тому же никогда не размножал зоны автозаменой.
    + Профи всегда одинок. Обратная сторона реализации таланта.[/more]

    Автор: bolega, Отправлено:16:28 03-09-2023

    Для облегчения глифирования добавил две новых фичи

    1. Можно просматривать и контролировать замены глифов сразу на всех заданных страницах, в отдельном окне. Настраиваемый вид, размер, цвет. Сортировка, фильтрация, маркировка, пометка элементов.





    2. Словам (блокам слов) можно присваивать номер шрифта (от 0 до 6), а также признак bold и italic. Аналогичные характеристики есть и у каждого глифа. При выполнении анализа СК сравнивает глиф/буква только если они принадлежат одному шрифту. Это избавляет от включения в результат анализа ложных сравнений. Кроме того, теперь выполнять анализ можно не только для текущей активной библиотеки глифов, но и для любого набора библиотек. Те библиотеки, которые участвуют в анализе, помечаются в заголовке иконкой с красной буквой А.

    Для быстрого присвоения блокам слов нужного номера шрифта добавлена маленькая панелька с кнопками:

    На выбор пользователя, кнопки можно применять либо к выделенным словам на изображении, либо к выделенным словам в списке слов.
    Возможно также использовать для этих целей и горячие клавиши. Если удобные клавиши уже заняты (напр., 0..9), то можно будет создавать альтернативные наборы горячих клавиш (помимо основного), и переключать СК временно на использование их когда потребуется.

    Автор: Benoni, Отправлено:21:37 03-09-2023

    Боже, сколько проделано работы!
    Спасибо, bolega

    Автор: anatol1950, Отправлено:18:12 05-09-2023

    Подготовка к юбилею !

    Автор: Benoni, Отправлено:19:24 05-09-2023

    Да, к юбилею, наверное, седьмую версию bolega выпустит. По нумерации - совсем близко.

    Автор: zvezdochiot, Отправлено:13:20 11-09-2023

    Продолжение Редактирование PDF файлов

    TelecomUral say:

    Цитата:

    и дерьмовее.

    Никто же не заставляет. И откуда известно "что дерьмовее", ежели в SK этого нет? К тому же, как в сторонних программах учитывалось ограничение по маске порога при морфологии?

    Автор: TelecomUral, Отправлено:13:33 11-09-2023


    Цитата:
    откуда известно "что дерьмовее"

    я грохнул на изучение задачки почти пару лет жизни. Алгоритмов нет. Сумеете что продемонстрировать - родина вас наградит. У меня есть подборка сканов с CLA из личного архива, около 4Гб. После её получения и предложения доказать делом свои таланты обычно от "математиков" больше вопросов не поступает.

    По мне так то, что bolega реализовал в СК для малоцветки, задачу практически закрывает. Поднабравшись оценочного опыта картинки постеризуются менее чем за минуту. То есть обработчик укладывается в практическую оценку "1 скан - 5 раз быстрее 1 обработки".

    Автор: zvezdochiot, Отправлено:13:39 11-09-2023

    TelecomUral say:

    Цитата:

    bolega реализовал в СК

    Ни капли не возражаю. Наоборот.
    Но при этом указываю на упущенную возможность эксплуатации маски порога. За счёт того, что задача раскрашивания относится именно к маске, то ограничив все операции (включая стандартную морфологию) этой самый маской, мы получаем инструмент, "сдувающий" цветную оконтовку на раз-два. Понятное дело, что без ограничения маской стандартная морфология сможет только сгладить контуры, но с оконтовкой ничего сделать не сможет.

    PS: "Чёрный" == 1,1,1 - это чтоб "картинка" оставалась монолитной, а не делилась на черное == 0,0.0 и всё остальное.

    TelecomUral aka AAW. Вас же самого не устраивают контуры, получаемые раскрашиванием. Так почему бы изначально не застолбить контуры маской порога?

    Автор: TelecomUral, Отправлено:14:34 11-09-2023


    Цитата:
    Так почему бы изначально не застолбить контуры маской порога?

    а я что, разработчик программ? я обычный юзер, кушаю что дают. Сочтёт автор СК что нужна ещё какая-то внутренняя функциональность, введёт. Лично мне ваши термины незнакомы и непонятны. Типа там дилатации да морфологии.

    Автор: zvezdochiot, Отправлено:14:42 11-09-2023

    TelecomUral say:

    Цитата:

    я обычный юзер

    "Обычный юзер", который может к одной и той же картинке применить и порог, и раскрашивание, после чего дать запрос, что мол этот контур вполне ничего, а этот контур - не алё. Или не может? Кто из нас двоих пользователь SK?


    Автор: TelecomUral, Отправлено:14:50 11-09-2023


    Цитата:
    Кто из нас двоих пользователь SK?

    остальные - вон из ветки !!!
    шутка

    Я же объяснил: ваши термины мне неудобоваримы. => Я их нигде использовать неспособен.

    Автор: zvezdochiot, Отправлено:14:55 11-09-2023

    TelecomUral say:

    Цитата:

    ваши термины мне неудобоваримы.

    Не смотри на термины. Смотри на контуры. На том же или похожем материале, что в твоём видео, примени и порог, и раскрашивание. Дай оценку контурам. Ежели разницы нет, то проехали.


    Автор: TelecomUral, Отправлено:14:58 11-09-2023

    ну, это всё тут оффтоп. пишите в личку.

    Автор: kamenkapenza, Отправлено:14:16 12-09-2023

    В шапочке написано " Видео bolega про работу с автоглифами (третья из четырех частей про версию 6.72)" и ссылка. А где 1,2 и 4 серии кинофильма?

    Автор: TelecomUral, Отправлено:14:37 12-09-2023

    туториалы по 6.72 и выше

    Автор: bolega, Отправлено:10:42 14-09-2023

    по поводу морфологии: если AAW в своем видео ее не использовал, то это не значит, что ее нет. Она в СК есть, команды на закладке Selection. Я эти возможности в полной мере использовал когда делал 2-х томник историю градостроительного искусства.
    В видео AAW опасливо не стал включать режим Fill, а зря. Там есть опция безопасного распространения. Вокруг заданного цвета с помощью морфологии создается тонкий слой маски, которая не позволит заливке бесконтрольно расползтись, т.е. будет служить барьером. Ну и при необходимости барьеры можно создавать вручную с помощью FFL-зон.
    Кстати, в pdf малоцветка помещается ч/б слоями: один слой+маска на каждый цвет. Поэтому как и в djvu, кодирование по сути безпотерьное.

    Автор: zvezdochiot, Отправлено:10:55 14-09-2023

    bolega say:

    Цитата:

    в pdf малоцветка помещается ч/б слоями: один слой+маска на каждый цвет.

    Зачем? В Pdf DEFLATE самое родное сжатие. Хорошо пакует малоцветку целиком без всяких разделений на слои и масок прозрачностей.

    bolega say:

    Цитата:

    Она в СК есть, команды на закладке Selection.

    Значит возможность не упущена. Илу упущена не совсем. Как при морфологии учитывается маска порога? И есть ли вообще возможность ограничить расскрашивание маской порога? Речь опять за внешний контур, который у AAW получился во всех местах негодным. В видео AAW я увидел только тупое применение палитры к участкам изображения без предварительного отсечения порогом.


    Автор: bolega, Отправлено:14:00 14-09-2023

    zvezdochiot

    Цитата:
    В Pdf DEFLATE самое родное сжатие. Хорошо пакует малоцветку целиком без всяких разделений на слои и масок прозрачностей.

    Да, надо попробовать. Кстати, слои я потом оптимизирую в jbig2. А маска вообще ничего не стоит, т.к. один tif является одновременно и изображением, и маской.


    Цитата:
    Как при морфологии учитывается маска порога?

    никак. А порог по какому критерию должен быть? По расстоянию (т.е. по радиусу морфологии) или по цвету? По цвету не получалось, обычно на границе букв почти весь спектр, прям аберрации.
    Есть еще в СК такой фильтр, как сглаживающий контур фильтр. Изначально работал с ч/б, но я его приспособил и для малоцветки. Т.е. сначала постеризуется, потом фильтр, он по идее сглаживает линию соприкосновения соседних цветов.

    Автор: zvezdochiot, Отправлено:14:13 14-09-2023

    bolega say:

    Цитата:

    слои я потом оптимизирую в jbig2. А маска вообще ничего не стоит

    И даёт "классную" нагрузку на "просмотрщик". Остаётся только с секундомером постоять и позасекать "тормоза" в одном и другом случае.

    bolega say:

    Цитата:

    А порог по какому критерию должен быть?

    Ты немного не понял. Маска порога - это ограничитель всех операций. Она отдельно. Как её строить? Можно одним из видов стандартных глобальных/локальных порогов. Можно гибридные пороги. А можно и те, и те, но с учётом "цветности" (я это уже упоминал ранее в сочетании с YCbCr). За пределы этой маски пускается только один цвет BG, все остальные строго внутри маски FG. Так же можно для отделения BG и FG использовать схему noteshrink

    bolega say:

    Цитата:

    такой фильтр, как сглаживающий контур фильтр

    Стоять-бояться. Вот с этого момента поподробнее. Ссылку давай. Скажу ли спасибу? Не знаю. Но поинтересоваться стоит.

    Автор: daa2013, Отправлено:14:21 14-09-2023

    Если объектов немного я часто конверчу в ч.б., потом в RGB и раскрашиваю 2-3 цветами, кликая (при зажатом контрол-шифт) в соответствующие им участки. Светлые цвета можно делать самостоятельными bw-зонами.

    Есть также послойная технология сборки из битмапов. Удаляем лишние цвета, конвертим по порогу (тут у каждого цвета может быть свой порог, и соответственно столько самостоятельных проектов СК, сколько цветов), чистим. Потом собираем.
    Некоторые книги тоже так делал.

    Я как-то просил реализовать накидывание битмапов друг на друга в СК (папку с кучей картинок последовательно расставить поверх файлов существующего проекта, объявив их пикчер-зонами), но увы. Тгда можно было бы разделенные цвета воедино и собирать.

    Автор: Maz, Отправлено:21:57 14-09-2023

    Переезжаем в следующую часть: ScanKromsator | СканКромсатор (Часть 5)


    Реклама на форуме Ru.Board.

    Рейтинг.ru