Спам база для хрумера. Stimul-Cash – Теория парсинга Бабла!

Спам база для хрумера. Stimul-Cash – Теория парсинга Бабла!

Спам база для хрумера

Позапрошлый пост я начал писать про то, как можно при помощи простого, а главное, и бесплатного софта собрать очень хорошую базу для хрумера или любой другой спамилки. Как видите я сдержал своё слово и сейчас, я напишу, как отпарсить пригодную для работы базу ( что такое плохая и злая база для хрума я тоже описывал в прошлом посте).
Генеральным спонсором является Stimul-Cash, партнёрка, которая создаёт почву, которая поможет вывести на новый уровень своих аффилетов, помогая им во всем! Они понимают, что в рунете мало полезных статей для того, чтобы хлынула новая волна фарма дилеров, и потому они сами готовы её создать при помощи интересных материалов. Статья посвящается Stimul-Cash и для конкурса Лучшая статья о Stimul-Cash. Я уже писал одну про положительные качества партенёрки, сейчас я же написал уже статью, которая, как говорят сами создатели, должна быть: полезная, как для новичков, так и для гуру фарма-бизнеса. Они стимулируют писать качественный контент, который будет полезен вам. Я не знал, какую выбрать: красивую, полезную или креативную. Сейчас появилась возможность воплотить все свои задумки.
Stimul-Cash – Теория парсинга Бабла!
Для начала новой жизни начните с РЕГИСТРАЦИИ в Stimul-Cash!
Итак, признаки. Что же такое признаки для парсинга базы для хрумера? Признаки — это схожие части сайта, по которым можно будет отфильтровать различные типы сайтов. В данном случае, мы, например, будем парсить гостевые книги.
Для чего нужны признаки? Признаки нужны для того чтоб отпрасить в свою базу, как можно больше гостевых книг. Гугл выдает только первые 10 страниц результатов, и потому у нас могут быть по какому-либо результату, только 100 гостевух ( в стандартных настройках Гугла, а если изменить в настройках чтобы выдавались по 100 результатов, то получится уже 1000 результатов. Уже хорошо, не правда ли).
Чем ещё хороши признаки для поиска базы для хрумера? Очень положительное качество использование признаков — это диверсификация серпа. Об этом я опишу ниже. Прикол в том, что у нас все будет по-полочкам.
Много ли этих самых признаков, и какие типы бывают? Их очень много, и чем больше у вас мозгов, тем лучше они и будут. Это, как бы, чем больше у вас креатива, тем больше их вы сможете и создать. Типов признаков, как таковых нет, потому я сам попробую ниже сделать классификацию. Просто мануала нет и это — первый ( хотя могу и заблуждаться, если кто укажет какой-либо достойный мануал — буду очень рад), можно сказать, в своём роде.
Ну, и напоминаю, что этот мануал был подготовлен при стимуле от Stimul-Cash! Они ждут вас!
Итак, начинаем наш мануал. Всю работу я буду показывать на примере программа Агрессора ( Гооо читать прошлый пост, где я писал про этого великого создателя до тупости простой программы).
Для того, чтобы начать парсить, надо определиться, что нам надо. Если нам нужны гостевые ( а на их примере я и буду показывать ) тогда мы будем стараться, в первую очередь собрать, как можно больше их, но в тоже время, среди них должно быть, как можно меньше форумов и каталогов. Это — и есть главный прикол признаков.

Начинаю делать спецификацию для того, чтобы добиться, как можно более совершенной спам базы для хрумера.
Итак, Let’s Go!
1) Сайт-овые:
• URL-овые.
• Текстовые. ( CMS-ные )

2) Региональные:
• По доменым зонам.
• По языкам.

3) Временные:
• Годовые — по дате последнего отзыва.
• Годовые — по Копирайту.

4) Титловые:
• Буквеные
• Символьные
• Словесные

5) Тематические:
• White List key
• Black List key

6) Url access:
• Url Yes — Где уже есть ссылка.
• Url No — Где уже нет ссылка.

7) Языки разметки станиц:
• Html
• Php
• Другие, если они есть!

8) Структурные:
• Цепочные
• Разделимые ( или простые )

Теперь описание более подробное:

Сайтовые:
• URL-овые
Данный вид признака являет включенным в URL. Как таковой может быть любое слово, которое так или иначе несёт в себе смысловую часть и является кеем для какой-либо страницы. Например, в данном случае это может быть такие слова:
Guestbook, gbook, guest, book и так далее.
Для того, чтобы сделать запрос гуглу, чтоб он выдал результаты, только по-этому признаку, мы делаем вот такие запросы:
inurl: Guestbook
inurl: gbook
inurl: guest
inurl: book
• Текстовые. ( CMS-ные )
К данному типу относятся стандартные “высказывания” какой-либо КМС системы. Все настолько просто, что просто ужас: Ну вот, например, я дам вам дам 2 примера на 2 очень популярные CMS системы и вы увидите, как легко отпарсить сайты, что на одном и том же движке. А для этого нам нужно сделать вот такой банальный запрос:
1)”Регистрация на сайте Напомнить пароль?” – ( набирать запрос с кавычками )Да, да, тут будут процентов, так 90 — одни сайты на DataLife.
2) “Powered by WordPress” – ( опять же, брать с кавычками ) Ну тут уже из запроса всё ясно, что в серпе будут одни сайты на WordPress.
Также работает этот принцип и для гестов, ну как, получается база для хрумера?

Региональные:
• По доменым зонам.
Тут идёт классификация уже по зонам. Как бы, просто идет парсинг для базы в одной или другой зоне. Я вам тут подготовил списочек зон, а пользоваться надо вот так.
site:.com
site:.net
site:.biz
и т.п..
Список можете скачать тут : Список зон by Maiami
• По языкам.
Не составит труда узнать, как будет слово «Регистрация» на различных языках. Ну, вы, думаю, уже уловили мысль. Для этого просто комбинируйте это слово с запросом из пункта 1 и всё! У вас совсем другой серп.
Запрос будет иметь такой формат:
Intext: Sing Up
Intext: Регистрация
Для ленивых — прошу:
Регистрация – русский
Inregistrare – Румынский
Sing Up – Английский
Join– Английский
Registration– Английский
Registro – Испанский
Registrierung – Немецкий
А ведь есть еще вот этот крутой список с языками мира :) А скачать его можно вот тут: Список языков by Maiami

Временные:
• Годовые — по дате отзыва.
Так тут уже будет просто фильтровать по первому или последнему посту. Ну, просто вводим какой-либо формат даты и ждём. Очень узко уточняющий признак.
Вот примеры:
inurl:guestbook intext:20/06/2008
inurl:guestbook intext:20.06.2008
• Годовые — по Копирайту.
Когда был основан сайт. Тут тоже все просто. Просто делаем, что-то типа такого.
inurl:guestbook «Copyright (C) 2009»
inurl:guestbook «Copyright 2009»
inurl:guestbook «Copyright (C) 2007-2009»
И опять же, чем больше фантазий, тем лучше. Можете изменять цифры и формат, как хотите.

Титловые:
• Буквеные
Просто в Титле будем искать одну из букв. Это нам будет сужать очень сильно поиск и выдавать все новые гостевые книги, которые до этого Гугл нам не хотел выдавать.
Ну и как всегда примеры:
inurl:guestbook +intitle:b
inurl:guestbook +intitle:q
inurl:guestbook +intitle:r
Как видите, все равно результатов много, потому как, гостевые книги очень часто делают певцы, актёры и так далее, и в Титл домена они прописывают свои инициалы. Всё гениально и просто. А такие гесты в спам базе для хремера очень пиаристные, иногда.
• Символьные
Всё также, как и смотрим вверх ( о, как сказал ), но тут уже типа такого:
inurl:guestbook +intitle:&
inurl:guestbook +intitle:’s – ну тут и буква. Просто так уточняется, кому принадлежит гостевая книга. Многие и забыли про них, а мы нет!
• Словесные
Тут уже слова, что относятся к странице постинга. Нужны примеры? Прошу!
inurl:guestbook +intitle:add
inurl:guestbook +intitle:post
inurl:guestbook +intitle:write
И т.п..

Так, Coffee Break:
Генеральным спонсором банки кофе, которую я выпиваю, пока пишу этот мануал, является: Stimul Cash – Теория парстинга Бабала?


Тематические:
• White List key
Очень хорошие гостевые книги, как я говорил, у актёров или у певцов, например. Также можно и спортсменов сюда подключить. Так вот, род их деятельности очень часто указывается в Титле. Мы же будем копать в Гугле, пока он не выдаст нам всё!
inurl:guestbook +intitle:music
inurl:guestbook +intitle:films
inurl:guestbook +intitle:dance
И т.п..
• Black List key
Всё тоже самое, но только уже мы убираем то что выше. Так как певцов и актёров у нас много, то наша база для хрумера станет ещё больше.
inurl:guestbook -intitle:music
inurl:guestbook -intitle:films
inurl:guestbook -intitle:dance

Url access:
• Url Yes — Где уже есть ссылка.
Тут мы будем выбирать гостевые книги, где уже есть ссылки. Это очень важно потому, как просто в одном или другом типе может быть запрещено использовать УРЛ. Итак, я бы разделил этот пункт ещё на 2 пункта.
1) Ссылки от людей
Это ссылки, которые люди оставили, так сказать, гостевая книга чистая и, если там и есть ссылки, то они только человеческие. Не поверите, до чего иногда бывают гениальные мысли у меня, и до чего гугл любезно нам предоставит информацию.
Пример запросов:
inurl:guestbook +intext:http://myspace
inurl:guestbook +intext:http://flickr
inurl:guestbook +intext:http://flickr
inurl:guestbook +intext:http://facebook.com
2) Ссылки от спама
inurl:guestbook +intext:http://viagra
inurl:guestbook +intext:http://Cialis
А можно и так ещё:

inurl:guestbook +intext:<a href=http://
inurl:guestbook +intext:[url=http://


Как вы видите, у нас получается отличная база для хрумера.
• Url No — Где уже нет ссылки.
Чистые, без ссылок гостевые. Но тут есть вероятность, что и вы не можете оставить ссылку. А может быть и то, что вы со своим креативам вытащили из гула такие гостевые, которые никто раньше и не смог достать, и потому вы будете первый, и все сливки будут за вами!

inurl:guestbook -intext:http://
inurl:guestbook -intext:<a href=http://
inurl:guestbook -intext:[url=http://

Струкрутные:
• Цепочный УРЛ.
В каком разделе находится гостевая книга, в том разделе и будем её парсить. Разные вебмастера ставят её в разные суб-категорий, и потому мы откопали ещё один признак! :)
inurl:guestbook/guestbook.html
inurl:gbook/guestbook.html
inurl:book/guestbook.html
• Раздельный УРЛ ( или простые )
inurl: Guestbook.html
Ну, и последнее, но не менее важное, это:

Языки разметки станиц:
• Html
Тольго гостевые на Html
inurl: Guestbook.html
inurl: Gbook.html
inurl: Guest.html
• Php
Тольго гостевые на PHP
inurl: Guestbook.php
inurl: Gbook.php
inurl: Guest.php
• Другие если конечно они есть :)
Все, с креативной частью мы уже завязали, и все наши признаки для парсинга базы данных для хрумера сохраняем в TXT файл.
Для того, чтобы не пропустить следующий мануал подпишитесь на RSS.
А я напоминаю, что данная статья является конкурсной для партнерской программы Stimul Cash.
Если вы только начинаете свои шаги в фарма бизнесе — советую вам делать это с Stimul Cash. Они стимулируют делать фарма рунет качественным! Они — двигатель, который генерирует кэш!
Так, теперь идём в программу Агрессора и там есть уже загрузить список запросов, что мы сделали, для этого есть кнопка «Из Файла» ( я на скрине отметил ). Ставим галку автосохранение и выбираем поисковик Google.txt

Спам база для хрумера. Stimul-Cash – Теория парсинга Бабла!

Всё, идём пить кофе. И опять же, не забываем, что кофе нам спонсирует: Stimul Cash – теория парсинга.
Так же не забываем подписаться на Rss ленту, так как скоро я буду писать про то, как работает парсер, самый элементарный, и при помощи которого вы сможете себе собрать отличную базу практически с любого сайта! Ну, а со спам базой для хрумера мы завязали. Желаю вам удачи и жду ваших комментариев.

Понравился пост? Подпишись на RSS ленту!

Читать в


.

22 Comments к записи “Спам база для хрумера. Stimul-Cash – Теория парсинга Бабла!”

  • стос
    30 Янв 2010, 17:52 г.

    скопировал я все запросы, напарсил 5к баз… и что с ними делать дальше?…
    хрумер у меня пока 3ий (крекнутый) да простят меня разработчики, хочу понять смысо его работы…

  • 30 Янв 2010, 17:52 г.

    Ну это уже другой вопрос. Смотри мануал по работе с хрумером =) Он тебе поможет. Да простят и меня разработчики =)

  • stArik
    30 Янв 2010, 17:53 г.

    Огромная просьба убрать копирайт с изображения созданного мной и без спроса взявшегося с моего блога и еще без упоминаний обо мне

  • djahn
    30 Янв 2010, 17:54 г.

    Мистаке детектед:

    Генеральный спонсор банки кофе которую я выпиваю пока пишу этот мануал является: Stimul Cash – Теория парстинга Бабала?

    Проверь на очепятки статью :)

  • 30 Янв 2010, 17:54 г.

    Да, у меня всегда проблемы с этим :) Вы, по содержанию делайте коменты :)

  • енот
    30 Янв 2010, 17:57 г.

    баян на самом деле) ;)
    а так нормa

  • 30 Янв 2010, 17:58 г.

    Енот, коллега так нормально или баян. Ты уже определись :)

  • ownru
    31 Янв 2010, 21:48 г.

    Как говорится : повторение мать учения, всегда полезно хорошие вещи повторять по нскольку раз, чтобы лучше засели в мыслях . Еще бы совет, как ожно полученную выборку распарсить на колеке под демо Хрумер.

  • 31 Янв 2010, 21:49 г.

    Ты сам понял что спросил?

  • ownru
    31 Янв 2010, 21:50 г.

    Да клавиатура непривычная , съехали буквы немного, — пока спрашива, свою парсилку написал, не люблю exe чужие, слишком много добрых дядей в сети, ладно пошел хрюшу напрягать.

  • Aurum
    2 Фев 2010, 17:19 г.

    За статью — зачёт!

  • 2 Фев 2010, 17:19 г.

    Хех будет что-то интересное кидай мне в ЛС. Поставлю в новом Бренде KabeL’ьни.

  • рорп
    2 Фев 2010, 18:30 г.

    джайте ссылку на базу яндекса?

  • 2 Фев 2010, 18:54 г.

    Эм а ты про что :)

  • Filler
    9 Фев 2010, 14:14 г.

    друг, а спамишь чем?

  • Maiami
    9 Фев 2010, 15:58 г.

    Что есть то и употребляй.

  • seregalast
    20 Апр 2010, 17:38 г.

    AGGRESS AutoPost Test

  • Maiami
    20 Апр 2010, 18:15 г.

    seregalast — Да да… надо прям там же и тестить спам где и прочитал :-D Во народ :)

    Прям на лету схатывают!

  • Елена
    21 Ноя 2016, 3:47 г.

    И по описаным выше причинам я считаю, что заработок на фарме это элитный бизнес, доступный далеко не каждому. Владельцами Stimul-Cash является команда RX-Partners, которая на рынке фарма бизнеса присутствует очень давно и которым удалось вовремя приобрести стимул, перевернувший, в последствии, манимейкерскую блогосферу рунета.

Обратные ссылки

  1. Сказка про Стимула, Кэша и Фарма продавца. Палю тему про Дор на Ebay.com » Фарма
  2. Палю тему как парсить прокси и базу для хрумера » Умные дурости
  3. Парсинг. Быстрый Parsing Google » Парсинг

Оставить комментарий