Статьи  : 

Простой скрипт для скачивания страниц сайтов

13 июля 2012, 08:44

Чтобы быстро скачать однотипные страницы какого–либо сайта (отличающиеся всего одним–двумя параметрами), необязательно использовать мощные даунлоадеры. Также необязательно настраивать cron (или планировщик заданий в windows). Все, что нам нужно – браузер и небольшой php–скрипт.

$page = file_get_contents(целевые_страницы);

// записываем
$fp1 = fopen( куда_записывать".txt", "w+" );
fwrite($fp1, $page);
fclose($fp1);

<script type="text/javascript">
function reload_page()
{
    location.href = "cron.php";
}

setTimeout("reload_page()", 15000);
</script>


Указанный скрипт достаточно открыть в браузере, и он будет перезапускаться кажыде 15 секунд (можно больше, можно меньше – зависит от ваших целей). Функцией file_get_contents мы скачиваем нужные нам страницы.

Естественно, для его работы нужно постоянно держать открытый браузер, но это не такое большое неудобство. Из плюсов можно отметить гибкую настройку времени между скачиваниями (в cron–е меньше минуты нельзя), и отображение информации по ходу скачивания (можно легко следить за процессом).