Вычитка и сканирование...

Автор: B.X - 01.09/2002, вс - 17:08

Можем обсудить взаимодействие и совместную работу...

Комментарии

Готов взять на вычитку ТЕКСТЫ (DOC, RTF, TXT).
Всё равно на работе делать нечего...
Единственное условие - отсылка мне на мыло

К сожалению, мы работаем с тифами...
Хотел бы тратить и на распознавание, но даже на сканирование времени мало остается...

Если получать по 5-6 мб по почте для вас не проблема, то я могу посылать, но только картинки...

Если получать по 5-6 мб по почте для вас не проблема, то я могу посылать, но только картинки...

ХаЯ®
Та получать-то не проблема...
Просто с тифами дольше получиться...
Так что на книжку где-то дня три надо (если не особо напрягаться)...
А что на выбор есть????

Пока "на выбор" есть только одно произведение.
Джо Холдеман "Миры обетованные". Скоро будет Волфганг Хольбайн "Властелины космоса".

Да с тифами дольше вам, но быстрее мне. Я не тороплю. Как успеете, так успеете, главное качественно. Тут зависит от способностей отдельного человека, некоторые качественно вычитывают за один день. Буквально, утром закачали файлы, вечером уже присылают готовый роман. У других уходит неделя. Зависит также от свободного времени... и от программ, которые используются...

Пара вопросов. Во-первых, в планах, если не ошибаюсь, был Бова "Орион среди звезд", так он сейчас выложен у BiblioNeta. Ваш чи нет? Второе. Что-то не грузятся с раздела OCR новые файлы, не знаю почему. Ну и может быть имело смысл план сканирования организовать как-то по другому? Ведь если есть интересные книги на вычитку, за них кто-то может сразу ухватиться, а в гостевой обновления проходят медленно...

Спасибо за сообщение... из плана Бен Бова удален. Нет это был не мой, и я его еще не сканировал... Из раздела OCR файлы скачиваются.

Но на всякий случай, вот адреса, по которым также возможно получить доступ к файлам по http:
Книги из раздела OCR
Книги из раздела Фантастика

И также, тоже самое, через ftp:
Книги из раздела OCR
Книги из раздела Фантастика

Предложите, как "по-другому" можно было бы организовать план сканирования. Я учту ваши пожелания. А если кто-нибудь хочет вычитать книгу, то может мне написать письмо. У меня остался невычитанным до сих пор Полунин "Орфей".

Файлы через http скачались, спасибо. Насчет планов, может быть, был неправ... там обновление достаточно быстрое. Но, может быть, то, что уже выложено, оттуда сразу удалять? Еще маленький вопрос - как-то я натыкался, кажется у Локи, на "Гаваяту" Лонгфелло. Где бы его взять?

Но, может быть, то, что уже выложено, оттуда сразу удалять?

Я думаю не стоит. Следующие сообщения о новых книгах, я буду добавлять в новых сообщениях, как только эти будут выложены все... это дополнительная информация и она не помешает... в будущем...

на "Гаваяту" Лонгфелло. Где бы его взять?

Это было наверное тогда, когда у нас был раздел "Философия". К сожалению, этот архив погиб. Когда восстановим его не знаю...

Пока не отсканировал ничего нового, все в работе... Но как только отсканирую, сразу пришлю... 5 мб сможешь по почте получить?

А насчет времени, то это как получится... все свое свободное время тратят, поэтому ничего требовать невозможно...

Кстати, знаете ли Вы сайт Zmiy'a http://zmiy.by.ru? Там периодически публикуется файлы, выложенные в Сети и разыскиваемые (в виде каталога). Я когда сам готовлюсь сканировать книгу, смотрю обычно туда. Если ищите новые книги для архива, можно посмотреть там.

Знаю. Вообще-то у нас тоже есть такой каталог... что-то вроде рейтинга... Самые разыскиваемые книги... так что это теперь не проблема... проблема в том... где взять новые книги... и свободное время...

"проблема в том... где взять новые книги... и свободное время..."

Увы, проблема только во втором пункте. Первого - завались. У меня уже с десяток потенциальных книг на сканирование, я столько не потяну.

"Увы, проблема только во втором пункте. Первого - завались. У меня уже с десяток потенциальных книг на сканирование, я столько не потяну."

У меня чаще другая проблема - книг интересных мало, а время есть. Может, имеет смысл делать как В.Х. - сканировать текст в Tiff'ax и выкладывать здесь, что кто-нибудь вычитал?

Я уже давно предлагал тем кто сканирует, чтобы они не вычитывали сами, а тратили свое время только на сканирование. Потому что сканировщиков меньше, чем тех, кто может вычитать...

Сейчас даже выкладывать на фтп не надо (хотя и такая возможность есть), можно отсылать по почте. Я сжимаю тифы в формат djvu, а это примерно в два-три раза меньше получается...

Если правильно настроить сканер, то при 200dpi можно нормально сканировать... через Finereader (предпочитаю четвертый, он быстрее), так, чтобы сканер захватывал только текст, а края обрезал. Я например, установил 247 на 192. Почти для всех книг подходит...

Размер файла при этом, получается около 40-50кб, сжатый DjVuer Pro он получается 17-20. Вполне приемлимый размер для большинства...
Переконвертить обратно в тифы на месте можно IrfanView c плагинами (allplugins.exe). Вот и все...

Можно присылать файлы тифов мне, я могу и найти людей, которые нормально файл вычитают (им же этот файл и переслать или выложить у себя, но уже на фтп), укажу кто сканировал и вычитывал и прочее...
Размер почтового ящика у меня 20 мб... на несколько книг хватит...

"Я уже давно предлагал тем кто сканирует, чтобы они не вычитывали сами, а тратили свое время только на сканирование. Потому что сканировщиков меньше, чем тех, кто может вычитать..."

Не, ребят, я так не смогу. И потом - я сканирую в 300dpi, т.к. (я в этом специально убедился) увеличение до трехсот уменьшает количество ошибок почти на порядок. С двух десятков на страницу до двух-трех.

я и сканю при 400. Ошибок вообще минимум, но все равно есть.
кстати В.Х. ты как только отсканишь песчаные войны 3, присылай мне на вычитку. Сделаю только так, потому как книгу прочитать охота :)))

Ты опоздал с предложением. Книги уже вычитаны и я их сегодня выложу. А сканирование при 400 занимает много времени. У меня его нет, тем более если постараться, то и при 200 будет все нормально. Мне уже говорили те, с кем я сотрудничаю, что в большинстве своем качество хорошее. Был только один раз за все это время, когда я пересканировал страницу.