1

Тема: Проверка внутренних параметров сайта

Есть такая проблемам, для некоторых доноров внутренние параметры (такие как: кол-во внутренних ссылок, кол-во внешних ссылок, текст ссылки, объем текста на странице и пр.) определяются как "-1" , но если их перепроверить то со второго, третьего, четвертого и т.д. раза данные все же определяются, а для некоторых так и остаются "-1", хотя страница доступна и если брать эти же страницы и проверить через модули Yazzle (пакетное определение показателей и проверка обратных ссылок) то все эти параметры определяется с первого раза.

Вот для примера две такие страницы, параметры которых sapemaster так и не смог определить даже с 10 попытки:
http://knowed.ru/index.php?name=pages&a … mp;num=395
http://sezann.ru/?item=cac4b481-35df-42 … 72b88a4dec
http://www.retail.ru/interviews/34604/

Отредактированно drdimaz (05.08.2010 13:23:11)

Re: Проверка внутренних параметров сайта

Спасибо за примеры! Пока могу сказать следующее:

1. Пока непонятно, не отдаётся HTML-код.

2. Некорректное сжатие страницы. В Sape Master используется сжатие данных для уменьшение траффика, а в Yazzle - не во всех инструментах. Без сжатия страница забирается нормально, а при распаковке - ошибка.

3. Возвращает 401 ошибку (Не авторизован), видимо сайт как-то определяет, что подключается не браузер.   

Если найдутся подобные доноры - приводите пожалуйста в данном топике, будем разбираться.

CS Support
Мои рефералки:
SeoBudget!
DriveLink

3

Re: Проверка внутренних параметров сайта

Да доноры еще подобные есть, еще пришлю.

4

Re: Проверка внутренних параметров сайта

Вот еще несколько:
http://www.rechnoy-kruiz.ru/page/news/6/view/391
http://www.teplohod-poezdka.ru/page/news/6/view/399
http://vysk.ru/index.php?name=Html_Cont … perec.html
http://web-avangard.net/pages-148.html

А что делать с теми, параметры по которым удается получить не с первого раза? а хорошо если с 4 или 5?

Re: Проверка внутренних параметров сайта

1, 2. Определилось нормально, однако данные забирались достаточно долго. В браузере, контент на странице тоже довольно долго подгружается. Попробуйте увеличить таймаут в настройках программы.

3, 4.  Отдаётся пустая страница, нужно смотреть подробнее.

В целом, могу посоветовать следующее:
Попробуйте увеличить таймаут в настройках сети программы ("Сервис" - "Параметры" - "Сеть").
После всех проверок, попробуйте повторно провести проверку неопределённых доноров.
Оставшиеся, можно посмотреть "вручную" - двойной клик по строке в таблице откроет донор в браузере.

CS Support
Мои рефералки:
SeoBudget!
DriveLink

6

Re: Проверка внутренних параметров сайта

Увеличил таймаут - помогло, спасибо.

7

Re: Проверка внутренних параметров сайта

Иногда, если донор в данный момент недоступен, или заголовки донора 4ХХ - тоже видим внешних ссылок '-1'. Можно как-то информативнее показывать проблемы с донором в этой колонке, а не глупое число '-1'? Спасибо.

Отредактированно mpolsky (23.08.2010 18:10:19)

Re: Проверка внутренних параметров сайта

mpolsky В принципе можно, однако непонятно что именно выводить. Какие Ваши предложения?

CS Support
Мои рефералки:
SeoBudget!
DriveLink

9

Re: Проверка внутренних параметров сайта

Семёныч, мне кажется, тот же  "n/a" чисто визуально будет более приемлимым. В идеале - отдавать ошибку полученную в заголовках донора, например e404, e403, e502 и т.п., а в случае недоступности донора - так и отдать - "timeout". Информативность лишней не бывает.

10

Re: Проверка внутренних параметров сайта

Обилие кодов ошибок не вызовет путанницы? Ведь привычное "-1" говорит что сайт недоступен, а коды ошибок несут дополнительную информацию, не всем нужную. В табличных фильтрах удобно отсеивать все неопределённые параметры по значению "-1". 

Попутно вопрос - а зачем нужно знать коды ошибки?

Запишу в листочки, если добавим вывод ошибок, то будет опция в настройках ("Показывать коды ошибок").

CS Support
Мои рефералки:
SeoBudget!
DriveLink

11

Re: Проверка внутренних параметров сайта

Попутно вопрос - а зачем нужно знать коды ошибки?

Лично для меня они важны. В подробности вдаваться не буду.

будет опция в настройках ("Показывать коды ошибок").

наверное, это лучший выход.