Всем привет! Проблема поиска уникального контента является неотъемлемой частью создания и продвижения почти любого сайта. Но как вы знаете цены на рерайт и копирайт зачастую при хорошем качестве оставляют желать лучшего и тогда вам на помощь придет сканированный контент или просто скан.
Давайте сразу скажем о преимуществах сканированного контента. Самым главным плюсом является цена при высокой уникальности. Средння стоимость 1 килознака такого контента — 2-3 рубля. Второй особенностью скана является то, что при хорошем качестве им можно вполне наполнять сайты для людей. Лично я знаю сайт посвященный авиастроению и вообще воздухоплаванию, который принят в ЯК и сделан полностью на скане. Но не на обычном, а из редких коллекционных изданий тиражом в 1000 экземпляров.
А теперь минусы. Прежде всего это артефакты. Очень редко вы получаете контент в идеальном качестве, как правило присутствуют огрехи, возникающие при сканировании или переводе из формата в формат. Также велик риск получения весьма специфического контента, написанного чуть ли не литературным языком 18 века, который очень хорошо «ловится» поисковыми системами. Так что перед покупкой скана обязательно просите кусок текста для примера.
Ну а теперь самое интересное — как добывать сканированный контент в промышленных масштабах.
Первое что нам потребуется это сканер + билет в библиотеку. Самый оптимальный вариант библиотека крупного ВУЗа — там просто глаза разбегаются от количества книг, которые можно использовать в дальнейшем для получения скана. Во вторых нужен спец. софт — ABBYY Finereader + любая проверялка на уникальность текста. Я использую Advego Plagiatus. Сразу скажу что есть 2 пути получения контента — с использованием сканера и без.
Метод 1. С использованием сканера. Приходим в библиотеку и выбираем книгу. Желательно с собой захватить любой девайс, имеющий доступ к интернету — коммуникатор, ноут, планшетник. Открываем книги где-то в середине и делаем выборки текста. Затем все это проверяем через адвего. Если текст уникален — берем книгу, если нет — ищем другую. Затем нужно отсканировать все страницы. Желательно в хорошем разрешении. Следующим этапом будет перевод картинок в текстовые документы с помощью ABBYY Finereader. Ну а дальше с помощью любого редактора, будь то тот же WORD — удаляем артефакты, появившиеся при сканировании и делаем огромный текстовый документ, содержащий всю книгу.
Метод 2. Без использования сканера. На самом деле кучи уникального контента валяются у вас «под ногами» и вы проходите мимо… Существуют огромные банки книг, журналов и тд. в формате PDF или djvu. Искать их можно и проще всего на торрентах и специализированных сайтах. Но не думайте что все так просто. Таких как и вы желающих поживиться в сети достаточное количество и поэтому скачивая очередную книгу или журнал не спешите сканировать и распознавать, а проверьте на уникальность. Ведь обидно будет проделать большой объем работы ради контента с нулевым процентом уника. Вот и весь метод
Что с этим делать дальше? Ну тут много путей. Самый простой — это продать пачку и пропить деньги)). Нейтральный — наклепать гавносайтов на том же контенте и продавать ссылки по 10-12 рублей в казапе. Ну и самый лучший — сделать сайт для людей.
Конечно скан — это прямое нарушение авторских прав и его использование мягко говоря не комильфо, но мы ( большинство) живем в странах бывшего СССР и пока интернет почти не «модерируется на авторские права». Нет, я не призываю вас отказываться от скана, просто вы должны понимать, что этот контент не Ваш.
Сейчас во всю ходят слухи, что поисковые системы якобы научились распознавать сканированный контент. Скажу на это лишь то, что если скан идеальный в плане качества, то он будет не хуже, а иногда и ручше рерайта или копирайта и что самое главное намного дешевле.
Всем хорошего дня!
А вот вроде бы можно еще брать контент с социалок, поскольку он не индексируется поисковиками
Кстати я тебе писал на счет прогона, но ответа так и не получил ( ты еще этим занимаешься? Желаю заказать прогон
Есть и свои заморочик из сканом и очень непритныне кстати. Был у меня совсем неплохой сайт на скане, приняли GGL даже с первого раза. Все бы хорошо но спустя недельку-две (точно не помню) пришла абуза хостеру со всеми соответствующими последствиями. В итоге сошлись на том что я весь скан удалю. Так я бы добавил невкоем случае не использовать новые книги особенно известных иноземных авторов
Да тема всем интересна по комментариям заметно
У меня есть блог с млм-тематикой. Компания выпускает шикарные оффлайн журналы и постить оттуда нет никаких проблем. Так как дело одно делаем. И ничьи права не нарушаются, и блог наполняется. Правда, всё равно приходится следить за уникальностью контента. Партнёров-то много