Спам база для хрумера. Stimul-Cash – Теория парсинга Бабла!
Спам база для хрумера
Позапрошлый пост я начал писать про то, как можно при помощи простого, а главное, и бесплатного софта собрать очень хорошую базу для хрумера или любой другой спамилки. Как видите я сдержал своё слово и сейчас, я напишу, как отпарсить пригодную для работы базу ( что такое плохая и злая база для хрума я тоже описывал в прошлом посте).
Генеральным спонсором является Stimul-Cash, партнёрка, которая создаёт почву, которая поможет вывести на новый уровень своих аффилетов, помогая им во всем! Они понимают, что в рунете мало полезных статей для того, чтобы хлынула новая волна фарма дилеров, и потому они сами готовы её создать при помощи интересных материалов. Статья посвящается Stimul-Cash и для конкурса Лучшая статья о Stimul-Cash. Я уже писал одну про положительные качества партенёрки, сейчас я же написал уже статью, которая, как говорят сами создатели, должна быть: полезная, как для новичков, так и для гуру фарма-бизнеса. Они стимулируют писать качественный контент, который будет полезен вам. Я не знал, какую выбрать: красивую, полезную или креативную. Сейчас появилась возможность воплотить все свои задумки.
Stimul-Cash – Теория парсинга Бабла!
Для начала новой жизни начните с в Stimul-Cash!
Итак, признаки. Что же такое признаки для парсинга базы для хрумера? Признаки — это схожие части сайта, по которым можно будет отфильтровать различные типы сайтов. В данном случае, мы, например, будем парсить гостевые книги.
Для чего нужны признаки? Признаки нужны для того чтоб отпрасить в свою базу, как можно больше гостевых книг. Гугл выдает только первые 10 страниц результатов, и потому у нас могут быть по какому-либо результату, только 100 гостевух ( в стандартных настройках Гугла, а если изменить в настройках чтобы выдавались по 100 результатов, то получится уже 1000 результатов. Уже хорошо, не правда ли).
Чем ещё хороши признаки для поиска базы для хрумера? Очень положительное качество использование признаков — это диверсификация серпа. Об этом я опишу ниже. Прикол в том, что у нас все будет по-полочкам.
Много ли этих самых признаков, и какие типы бывают? Их очень много, и чем больше у вас мозгов, тем лучше они и будут. Это, как бы, чем больше у вас креатива, тем больше их вы сможете и создать. Типов признаков, как таковых нет, потому я сам попробую ниже сделать классификацию. Просто мануала нет и это — первый ( хотя могу и заблуждаться, если кто укажет какой-либо достойный мануал — буду очень рад), можно сказать, в своём роде.
Ну, и напоминаю, что этот мануал был подготовлен при стимуле от Stimul-Cash! Они ждут вас!
Итак, начинаем наш мануал. Всю работу я буду показывать на примере программа Агрессора ( Гооо читать прошлый пост, где я писал про этого великого создателя до тупости простой программы).
Для того, чтобы начать парсить, надо определиться, что нам надо. Если нам нужны гостевые ( а на их примере я и буду показывать ) тогда мы будем стараться, в первую очередь собрать, как можно больше их, но в тоже время, среди них должно быть, как можно меньше форумов и каталогов. Это — и есть главный прикол признаков.
Начинаю делать спецификацию для того, чтобы добиться, как можно более совершенной спам базы для хрумера.
Итак, Let’s Go!
1) Сайт-овые:
• URL-овые.
• Текстовые. ( CMS-ные )
2) Региональные:
• По доменым зонам.
• По языкам.
3) Временные:
• Годовые — по дате последнего отзыва.
• Годовые — по Копирайту.
4) Титловые:
• Буквеные
• Символьные
• Словесные
5) Тематические:
• White List key
• Black List key
6) Url access:
• Url Yes — Где уже есть ссылка.
• Url No — Где уже нет ссылка.
7) Языки разметки станиц:
• Html
• Php
• Другие, если они есть!
Структурные:
• Цепочные
• Разделимые ( или простые )
Теперь описание более подробное:
Сайтовые:
• URL-овые
Данный вид признака являет включенным в URL. Как таковой может быть любое слово, которое так или иначе несёт в себе смысловую часть и является кеем для какой-либо страницы. Например, в данном случае это может быть такие слова:
Guestbook, gbook, guest, book и так далее.
Для того, чтобы сделать запрос гуглу, чтоб он выдал результаты, только по-этому признаку, мы делаем вот такие запросы:
inurl: Guestbook
inurl: gbook
inurl: guest
inurl: book
• Текстовые. ( CMS-ные )
К данному типу относятся стандартные “высказывания” какой-либо КМС системы. Все настолько просто, что просто ужас: Ну вот, например, я дам вам дам 2 примера на 2 очень популярные CMS системы и вы увидите, как легко отпарсить сайты, что на одном и том же движке. А для этого нам нужно сделать вот такой банальный запрос:
1)”Регистрация на сайте Напомнить пароль?” – ( набирать запрос с кавычками )Да, да, тут будут процентов, так 90 — одни сайты на DataLife.
2) “Powered by WordPress” – ( опять же, брать с кавычками ) Ну тут уже из запроса всё ясно, что в серпе будут одни сайты на WordPress.
Также работает этот принцип и для гестов, ну как, получается база для хрумера?
Региональные:
• По доменым зонам.
Тут идёт классификация уже по зонам. Как бы, просто идет парсинг для базы в одной или другой зоне. Я вам тут подготовил списочек зон, а пользоваться надо вот так.
site:.com
site:.net
site:.biz
и т.п...
Список можете скачать тут : Список зон by Maiami
• По языкам.
Не составит труда узнать, как будет слово «Регистрация» на различных языках. Ну, вы, думаю, уже уловили мысль. Для этого просто комбинируйте это слово с запросом из пункта 1 и всё! У вас совсем другой серп.
Запрос будет иметь такой формат:
Intext: Sing Up
Intext: Регистрация
Для ленивых — прошу:
Регистрация – русский
Inregistrare – Румынский
Sing Up – Английский
Join– Английский
Registration– Английский
Registro – Испанский
Registrierung – Немецкий
А ведь есть еще вот этот крутой список с языками мира
А скачать его можно вот тут: Список языков by Maiami
Временные:
• Годовые — по дате отзыва.
Так тут уже будет просто фильтровать по первому или последнему посту. Ну, просто вводим какой-либо формат даты и ждём. Очень узко уточняющий признак.
Вот примеры:
inurl:guestbook intext:20/06/2008
inurl:guestbook intext:20.06.2008
• Годовые — по Копирайту.
Когда был основан сайт. Тут тоже все просто. Просто делаем, что-то типа такого.
inurl:guestbook «Copyright © 2009»
inurl:guestbook «Copyright 2009»
inurl:guestbook «Copyright © 2007—2009»
И опять же, чем больше фантазий, тем лучше. Можете изменять цифры и формат, как хотите.
Титловые:
• Буквеные
Просто в Титле будем искать одну из букв. Это нам будет сужать очень сильно поиск и выдавать все новые гостевые книги, которые до этого Гугл нам не хотел выдавать.
Ну и как всегда примеры:
inurl:guestbook +intitle:b
inurl:guestbook +intitle:q
inurl:guestbook +intitle:r
Как видите, все равно результатов много, потому как, гостевые книги очень часто делают певцы, актёры и так далее, и в Титл домена они прописывают свои инициалы. Всё гениально и просто. А такие гесты в спам базе для хремера очень пиаристные, иногда.
• Символьные
Всё также, как и смотрим вверх ( о, как сказал ), но тут уже типа такого:
inurl:guestbook +intitle:&
inurl:guestbook +intitle:'s – ну тут и буква. Просто так уточняется, кому принадлежит гостевая книга. Многие и забыли про них, а мы нет!
• Словесные
Тут уже слова, что относятся к странице постинга. Нужны примеры? Прошу!
inurl:guestbook +intitle:add
inurl:guestbook +intitle:post
inurl:guestbook +intitle:write
И т.п...
Генеральным спонсором банки кофе, которую я выпиваю, пока пишу этот мануал, является: Stimul Cash – Теория парстинга Бабала?
Тематические:
• White List key
Очень хорошие гостевые книги, как я говорил, у актёров или у певцов, например. Также можно и спортсменов сюда подключить. Так вот, род их деятельности очень часто указывается в Титле. Мы же будем копать в Гугле, пока он не выдаст нам всё!
inurl:guestbook +intitle:music
inurl:guestbook +intitle:films
inurl:guestbook +intitle:dance
И т.п...
• Black List key
Всё тоже самое, но только уже мы убираем то что выше. Так как певцов и актёров у нас много, то наша база для хрумера станет ещё больше.
inurl:guestbook -intitle:music
inurl:guestbook -intitle:films
inurl:guestbook -intitle:dance
Url access:
• Url Yes — Где уже есть ссылка.
Тут мы будем выбирать гостевые книги, где уже есть ссылки. Это очень важно потому, как просто в одном или другом типе может быть запрещено использовать УРЛ. Итак, я бы разделил этот пункт ещё на 2 пункта.
1) Ссылки от людей
Это ссылки, которые люди оставили, так сказать, гостевая книга чистая и, если там и есть ссылки, то они только человеческие. Не поверите, до чего иногда бывают гениальные мысли у меня, и до чего гугл любезно нам предоставит информацию.
Пример запросов:
inurl:guestbook +intext:http://myspace
inurl:guestbook +intext:http://flickr
inurl:guestbook +intext:http://flickr
inurl:guestbook +intext:http://facebook.com
2) Ссылки от спама
inurl:guestbook +intext:http://viagra
inurl:guestbook +intext:http://Cialis
А можно и так ещё:
inurl:guestbook +intext:[url=http://
Как вы видите, у нас получается отличная база для хрумера.
• Url No — Где уже нет ссылки.
Чистые, без ссылок гостевые. Но тут есть вероятность, что и вы не можете оставить ссылку. А может быть и то, что вы со своим креативам вытащили из гула такие гостевые, которые никто раньше и не смог достать, и потому вы будете первый, и все сливки будут за вами!
inurl:guestbook -intext:<a href=http://
inurl:guestbook -intext:[url=http://
Струкрутные:
• Цепочный УРЛ.
В каком разделе находится гостевая книга, в том разделе и будем её парсить. Разные вебмастера ставят её в разные суб-категорий, и потому мы откопали ещё один признак!
inurl:guestbook/guestbook.html
inurl:gbook/guestbook.html
inurl:book/guestbook.html
• Раздельный УРЛ ( или простые )
inurl: Guestbook.html
Ну, и последнее, но не менее важное, это:
Языки разметки станиц:
• Html
Тольго гостевые на Html
inurl: Guestbook.html
inurl: Gbook.html
inurl: Guest.html
• Php
Тольго гостевые на PHP
inurl: Guestbook.php
inurl: Gbook.php
inurl: Guest.php
• Другие если конечно они есть
Все, с креативной частью мы уже завязали, и все наши признаки для парсинга базы данных для хрумера сохраняем в TXT файл.
Для того, чтобы не пропустить следующий мануал .
А я напоминаю, что данная статья является конкурсной для партнерской программы Stimul Cash.
Если вы только начинаете свои шаги в фарма бизнесе — советую вам делать это с Stimul Cash. Они стимулируют делать фарма рунет качественным! Они — двигатель, который генерирует кэш!
Так, теперь идём в программу Агрессора и там есть уже загрузить список запросов, что мы сделали, для этого есть кнопка «Из Файла» ( я на скрине отметил ). Ставим галку автосохранение и выбираем поисковик Google.txt
Всё, идём пить кофе. И опять же, не забываем, что кофе нам спонсирует: Stimul Cash – теория парсинга.
Так же не забываем подписаться на Rss ленту, так как скоро я буду писать про то, как работает парсер, самый элементарный, и при помощи которого вы сможете себе собрать отличную базу практически с любого сайта! Ну, а со спам базой для хрумера мы завязали. Желаю вам удачи и жду ваших комментариев.






21 Comments к записи “Спам база для хрумера. Stimul-Cash – Теория парсинга Бабла!”
скопировал я все запросы, напарсил 5к баз... и что с ними делать дальше?..
хрумер у меня пока 3ий (крекнутый) да простят меня разработчики, хочу понять смысо его работы...
Ну это уже другой вопрос. Смотри мануал по работе с хрумером
Он тебе поможет. Да простят и меня разработчики
Огромная просьба убрать копирайт с изображения созданного мной и без спроса взявшегося с моего блога и еще без упоминаний обо мне
Мистаке детектед:
Проверь на очепятки статью
Да, у меня всегда проблемы с этим
Вы, по содержанию делайте коменты
баян на самом деле)
а так нормa
Енот, коллега так нормально или баян. Ты уже определись
Как говорится : повторение мать учения, всегда полезно хорошие вещи повторять по нскольку раз, чтобы лучше засели в мыслях . Еще бы совет, как ожно полученную выборку распарсить на колеке под демо Хрумер.
Ты сам понял что спросил?
Да клавиатура непривычная , съехали буквы немного, — пока спрашива, свою парсилку написал, не люблю exe чужие, слишком много добрых дядей в сети, ладно пошел хрюшу напрягать.
За статью — зачёт!
Хех будет что-то интересное кидай мне в ЛС. Поставлю в новом Бренде KabeL'ьни.
джайте ссылку на базу яндекса?
Эм а ты про что
друг, а спамишь чем?
Что есть то и употребляй.
AGGRESS AutoPost Test
seregalast — Да да... надо прям там же и тестить спам где и прочитал
Во народ
Прям на лету схатывают!