apple16 сказал(а):
2 derbenat
Это акробат считает оптимизацией по умолчанию
Чудес не бывает - стало меньше стало меньше информации
Из всех видов сжатия OCR лучший
Чтобы не путаться в терминологии, я попробую ддать свои объяснения.
Оптимизация - понятие широкое и сюда можно добавить и сжатие картинок, пока они сохраняют приемлемое качаство. Но сжатие растровых изображений может происходить двояко:
1. Перевод картинок из несжимаемых растровых форматов (tiff, bmp) в сжатые растровые форматы с настройкой уровня сжатия (например, jpg). Здесь используется определенный алгоритм сжатия-восстановления. При этом качество картинок, для изображений с одинаковым разрешением, практически одинаковое в любом формате (это не является справедливым для профессиональной обработки изображений).
2. Уменьшение разрешения, что, по сути дела, является не сжатием, а изменением качества.. Обратное действие не восстанавливает качества картинок. То есть при увеличении разрешения со 150 пкс до 300 просто размазывает один пиксель, с определенным цветом, по четырем.
B PDF оптимизация происходит по двум направлениям. Первое - это уменьшение разрешения картинок до заданного разрешения и удаление ненужной служебной информации (внутренние ссылки и связи, комментарии, ява-скрипты и т.д.) из файла.
Перевод текста в качество OCR тоже нельзя считать сжатием, так как здесь мы переходим, в отношении текста, к абсолютно другому типу изображений - векторному, который можно перевести в растровый снятием скриншота, а обратно только распознаванием. То есть прямых переводов растра в вектор и обратно, пока не существует.
Так что OCR, это не сжатие изображений, а перевод их в абсолютно иной формат, причем не картинок, а набора стандартных изображений - текста, линий, фигурок. Перевод картинок в векторный формат пока проблематичен.