Всем привет! Проблема поиска уникального контента является неотъемлемой частью создания и продвижения почти любого сайта. Но как вы знаете цены на рерайт и копирайт зачастую при хорошем качестве оставляют желать лучшего и тогда вам на помощь придет сканированный контент или просто скан.
Давайте сразу скажем о преимуществах сканированного контента. Самым главным плюсом является цена при высокой уникальности. Средння стоимость 1 килознака такого контента — 2-3 рубля. Второй особенностью скана является то, что при хорошем качестве им можно вполне наполнять сайты для людей. Лично я знаю сайт посвященный авиастроению и вообще воздухоплаванию, который принят в ЯК и сделан полностью на скане. Но не на обычном, а из редких коллекционных изданий тиражом в 1000 экземпляров.
А теперь минусы. Прежде всего это артефакты. Очень редко вы получаете контент в идеальном качестве, как правило присутствуют огрехи, возникающие при сканировании или переводе из формата в формат. Также велик риск получения весьма специфического контента, написанного чуть ли не литературным языком 18 века, который очень хорошо «ловится» поисковыми системами. Так что перед покупкой скана обязательно просите кусок текста для примера.
Ну а теперь самое интересное — как добывать сканированный контент в промышленных масштабах.
Первое что нам потребуется это сканер + билет в библиотеку. Самый оптимальный вариант библиотека крупного ВУЗа — там просто глаза разбегаются от количества книг, которые можно использовать в дальнейшем для получения скана. Во вторых нужен спец. софт — ABBYY Finereader + любая проверялка на уникальность текста. Я использую Advego Plagiatus. Сразу скажу что есть 2 пути получения контента — с использованием сканера и без.
Метод 1. С использованием сканера. Приходим в библиотеку и выбираем книгу. Желательно с собой захватить любой девайс, имеющий доступ к интернету — коммуникатор, ноут, планшетник. Открываем книги где-то в середине и делаем выборки текста. Затем все это проверяем через адвего. Если текст уникален — берем книгу, если нет — ищем другую. Затем нужно отсканировать все страницы. Желательно в хорошем разрешении. Следующим этапом будет перевод картинок в текстовые документы с помощью ABBYY Finereader. Ну а дальше с помощью любого редактора, будь то тот же WORD — удаляем артефакты, появившиеся при сканировании и делаем огромный текстовый документ, содержащий всю книгу.
Метод 2. Без использования сканера. На самом деле кучи уникального контента валяются у вас «под ногами» и вы проходите мимо… Существуют огромные банки книг, журналов и тд. в формате PDF или djvu. Искать их можно и проще всего на торрентах и специализированных сайтах. Но не думайте что все так просто. Таких как и вы желающих поживиться в сети достаточное количество и поэтому скачивая очередную книгу или журнал не спешите сканировать и распознавать, а проверьте на уникальность. Ведь обидно будет проделать большой объем работы ради контента с нулевым процентом уника. Вот и весь метод
Что с этим делать дальше? Ну тут много путей. Самый простой — это продать пачку и пропить деньги)). Нейтральный — наклепать гавносайтов на том же контенте и продавать ссылки по 10-12 рублей в казапе. Ну и самый лучший — сделать сайт для людей.
Конечно скан — это прямое нарушение авторских прав и его использование мягко говоря не комильфо, но мы ( большинство) живем в странах бывшего СССР и пока интернет почти не «модерируется на авторские права». Нет, я не призываю вас отказываться от скана, просто вы должны понимать, что этот контент не Ваш.
Сейчас во всю ходят слухи, что поисковые системы якобы научились распознавать сканированный контент. Скажу на это лишь то, что если скан идеальный в плане качества, то он будет не хуже, а иногда и ручше рерайта или копирайта и что самое главное намного дешевле.
Всем хорошего дня!
Зачем пользоваться сканером. Ну не можешь ты текст оригинальный сам написать. Обратись, к тому кто может!
Чем отличается уникальный контент от сканированного?
Подскажите, пожалуйста! На сколько отсканированный контент хорош сейчас? Прошло уже более 2 лет со дня написания статьи. У меня просто есть возможность заполучить 800 тысяч знаков уникального текста (выше 85%).. хотел его на хороший СДЛ сайт… (на сегодняшний день на том СДЛ около 230 страниц копирайта).. стоит ли? Если этот отсканированный контент хорошенько «прочесать» от лишнего мусора и всё красиво оформить? Плюс журналы, которые там есть — существуют и по сей день, но выпуски старые. Не будет проблем с авторами этих журналов (как я понял статьи там пишут люди и присылают им)
если контент бесплатно — то всё как описал автор. Если покупаете — то просчитываете окупаемость