• Добро пожаловать на Черная дыра.
 

Срач Димы и Палыча про дежавю.

Автор Дмитрий Виницкий, 22.11.2022 20:34:43

« назад - далее »

0 Пользователи и 1 гость просматривают эту тему.

ShamgA

Цитата: Павел73 от 23.11.2022 06:37:56
Цитата: ShamgA от 22.11.2022 21:09:43
Цитата: Павел73 от 22.11.2022 09:41:44...Ради возможности выбора суверена. Это и есть свобода...

А если я на данной территории жил всегда, то имею право выбрать другое государство вместе с территорией, на которой живу.
Павел, вот тут Вы попадаете под ст. 208 УК РФ
Не надо меня стращать УК. Я под него не попадаю до тех пор, пока меня устраивают законы и правила моего государства. И поэтому не пытаюсь из него уехать или от него отделиться со своей территорией.

Собственно, задача государственного руководства в том и состоит, чтобы устанавливать такие законы и правила, чтобы они устраивали всех жителей данной территории, и никому не хотелось уезжать или отделяться.
ЦитироватьPS А процедура выбора суверена наглядно показана в «Доме Дракона»: либо принимаешь, либо умираешь.
Я не люблю фентези.
Так Вам и объясняют, что Вы «имеете право» ровно до тех пор, пока «не пытаетесь»
PS Собственно, пример с фильмом о том же: выбрать, конечно, можете...

ETO

Цитата: vlad7308 от 23.11.2022 01:02:34Djvu тоже контейнер.
Если и то, и то состоит из одних и тех же сканов, разницу в весе может составлять только служебная инфа контейнера. Да, в пдф ее чуть больше, но сравнению со сканами она не весит ничего. Так что... Не верю.
Нет. Это очень просто. pdf я вообще понять не могу. Самое главное - из чего он состоит, не видно для обработки. Я выдёргиваю страницы в tiff и начинаю резать, стирать мусор, делать контраст, осветлять. Но одни сканы ведут себя как лапочка, другие, например, из "Троицкого варианта" просто отвратной резкости. И тогда мне приходится в Фотошопе переводить их в тот же tiff прямо из pdf. И получается хорошо. И таких нюансов немало. Самое отвратное - надо вырезать, скажем, заметку в 1/10 часть листа. Лист - 100 кб. Так вот, если это djvu, то вырезка и будет примерно 10-11 кб. А если это pdf, то, как ни крути, он не уничтожает информацию, а делает её невидимой. Да ещё записывает об этом в служебный код всегда аж 4 кб. то есть будет выглядеть как вырезка, но весит она 104 кб.
djvu прост. Скан просматривается по 3 каналам (почти мгновенно) - кодируется а) фон (наверно, типа gif'а), б) отдельно кодируются рисунки (наверно. как jpg) и в) текст. Тут создаётся библиотека символов - если текст чёткий, то буква и есть символ, надо только закодировать положение. Если нечёткий, всё режется на чёрточки и фигурки (иероглифы), которые заносятся в библиотеку. Библиотека создаётся каждые 10-20 страниц. При раскодировании всё склеивается в обычную графику
А pdf - не графика
В борьбе за народное дело он был инородное тело

ETO

#42
Цитата: dmitryskey от 23.11.2022 01:01:55https://www.sumatrapdfreader.org/free-pdf-reader
О, похоже Суматра научилась читать и djvu
У меня стояли ранние версии. Прекрасная и очень маленькая программа. Не пользуюсь я лишь по одной причине - у меня вообще все файлы открываются уже в редакторских программах. Т.е. одновременно с чтением я их готов как-то обрабатывать. А суматра - просмотровщик. Но тоже - советую.
С pdf ещё бывают загвоздки - либо там защита, либо они вообще не открываются. А в других программах - свободно. Поэтому приходится включать другое, исправлять, а уж потом смотреть. В djvu нет защит и прочего.

Скачал. Офигенно. Но надо привыкнуть к дизайну
В борьбе за народное дело он был инородное тело

SOLDIER

Красава Старый. Еще одну тему родил. ;D
"Вся военная пропаганда, все крики, ложь и ненависть, исходят всегда от людей, которые на эту войну не пойдут". Джордж Оруэлл
Лунтик занесен в ЧС, ввиду клинической глупости и бессмысленности его сообщений

ETO

Кстати. Попробовал яндекс-переводчик. Переводит лучше, чем гугл, к тому же порциями по 10 000 знаков (а гугл - только по 5000 и всегда мне не хватало и предложение рвалось)
В борьбе за народное дело он был инородное тело

Настрел

Цитата: vlad7308 от 22.11.2022 23:08:25Нет никакой разницы между djvu из сканов и pdf из сканов. Размер будет примерно одинаковый, а качество - определяться качеством сканов.
ЕМНИП дежавю, оно типа мпега - кодирует следующую страницу, на основании информации из предыдущих. И если страниц много, то получается высокая степень сжатия. В разы выше чем для одиночной картинки. В этом весь смысл дежавю - получить отсканированную книжку в 10 раз меньше объемом, чем сумма объемов каждой страницы.
НАЯЗ, пдф так не умеет. Хотя может какие продвинутые версии и научились так делать тоже.

Настрел

Цитата: vlad7308 от 23.11.2022 00:52:38В них вечно скрываются ужасные сканы, на которых ни черта не разобрать. Но бывает увы, что других вариантов нет.
Вот именно поэтому и дежавю. Когда сканы хорошие, то их можно распознать, и получить обычный ебук или тот же пдф. А когда сканы не распознавабельные, то у вас два варианта: или дежавю размером в десятки метров, или пдф с картинками размером в сотни метров. Выбор очевиден для любого нормального человека кроме, дремучих ламеров и киприотов.

vlad7308

это оценочное суждение

vlad7308

Ну ладно, значит я не совсем правильно представлял себе, как устроен djvu.
Спасибо всем за науку
это оценочное суждение

ETO

Цитата: Sellin от 23.11.2022 11:19:04ЕМНИП дежавю, оно типа мпега - кодирует следующую страницу, на основании информации из предыдущих.
Это и называется - создавать библиотеку символов. Но не каждой страницы, и не всего, а определённого размера для быстроты раскодировки. Примерно 10-15 страниц. Но - когда рисунков много (особенно в цвете), то разница в весе уже не слишком. Страшно сказать, порой djvu получалось больше, чем pdf. Но тут тоже всё зависит от степени сжатия. В pdf очень сложно подбирать степени сжатия по нескольким параметрам. В djvu - просто. Я все сканы увеличиваю (или сканю) на 600 dpi, а кодирую по параметру 400. Если скан очень не очень, то можно сделать просто djvu в стиле "фото". И будет оно довольно большим, но некоторым это нравится.
И о распознавалке. И там и тут можно делать OCR с возможностью копирования текста (что совершенно невозможно в JPG и прочих форматах). Я сначала так и делал, но надо вычитывать, ошибки бывает и вес увеличивается - до 50%. Поэтому отказался. Кому надо, простенький djvu-редактор одним щелчком делает OCR всего файла или страницы.
Также есть элементарная конвертация любого формата в любой формат
В борьбе за народное дело он был инородное тело

Дмитрий Виницкий

Цитата: Sellin от 23.11.2022 11:22:50или дежавю размером в десятки метров, или пдф с картинками размером в сотни метров.
А это имеет какое-то значение?
+35797748398

ETO

Цитата: Дмитрий Виницкий от 23.11.2022 13:50:22А это имеет какое-то значение?
Какое-то имеет
Например, мой сайт сейчас ровно 100 Гб. А если бы он был в 2-3 раза больше, было бы неприятно
Да и архивы в pdf были бы не 20 Тб, а 60. Но фигня ещё в том, что djvu лучше ... чаще всего
В борьбе за народное дело он был инородное тело

Дмитрий Виницкий

Цитата: ETO от 23.11.2022 14:20:22сайт сейчас ровно 100 Гб
Хлынин, кому нужен сегодня твой сайт и тем более, хранить именно на сайте и вообще у себя на сервере что либо в 2023 почти году - дичь и маразм.
+35797748398

ОАЯ

Почему маразм? В шесть раз больше хранилище - маленькая коробочка на столе. Не затратно, под рукой, без хлопот с облаками. Иногда встречаются редкие документы.

Дмитрий Виницкий

Цитата: ОАЯ от 23.11.2022 15:07:30Почему маразм? В шесть раз больше хранилище - маленькая коробочка на столе. Не затратно, под рукой, без хлопот с облаками. Иногда встречаются редкие документы.
Ещё раз - зачем тебе хранить в коробочке то, что гораздо быстрее и независимо от твоего электричества доступно везде?
+35797748398

DiZed

#55
djvu - открытый формат, естественная и неотъемлемая составляющая экосистемы GNU/Linux, на которой сейчас держится весь мир. он возник именно для хранения отсканированных источников, в то время как пропиретарный PDF - для публикации изначально создаваемых в цифре текстов. большинство известных мне собраний сканов pdf были просто передраны из djvu - естественно с потерей качества. в линуксе нет ни малейших проблем с просмотром djvu, и никому не приходит в голову возиться с конвертацией архивов сканов в pdf; а если у кого-то с ним проблемы - значит ему это не нужно, так и радибога. в линуксе кстати брошюровка-разброшюровка pdf-ок вроде тоже проходит беспроблемно и без побочных эффектов
ради компактности, читаемости и содержательности форума в настройках аккаунта отключено отображение всего, что можно отключить; я не вижу ваши (и свои) юзерпики, подписи, посты персонажей из блеклиста  ("леорнер", "старый", "бендер","аникей", " nonconvex" etc ) и т.п. бесполезности

Дмитрий Виницкий

Цитата: DiZed от 23.11.2022 15:17:53в линуксе нет ни малейших проблем


Пользователей линукса в реальности еще меньше, чем п***расов.
+35797748398

ETO

Цитата: Дмитрий Виницкий от 23.11.2022 16:24:53Пользователей линукса в реальности еще меньше, чем п***расов.
А киприотов на общеевропейском фоне тоже меньше, чем п***расов. 
В борьбе за народное дело он был инородное тело

SOLDIER

ХромОС в общем и в целом тоже несколько Линукс...
https://ru.wikipedia.org/wiki/Chrome_OS
"Вся военная пропаганда, все крики, ложь и ненависть, исходят всегда от людей, которые на эту войну не пойдут". Джордж Оруэлл
Лунтик занесен в ЧС, ввиду клинической глупости и бессмысленности его сообщений

Дмитрий Виницкий

Цитата: ETO от 23.11.2022 16:50:46
Цитата: Дмитрий Виницкий от 23.11.2022 16:24:53Пользователей линукса в реальности еще меньше, чем п***расов.
А киприотов на общеевропейском фоне тоже меньше, чем п***расов.
А при чем тут киприоты?
+35797748398