YouTube API v.3 — Парсинг видеороликов по ключевым фразам на php

YouTube позволяет бесплатно работать через своё API, поэтому парсить его сплошное удовольствие. А учитывая, что он еще и ищет отлично и релевантно — то парсинг в двойне приятнее. Для начала надо зарегистрироваться и получить свой API ключ. По идее для этих дел лучше создать отдельный аккаунт, а то вдруг забанят или еще что. Полная инструкция Читать дальше …

Яндекс.XML: Поиск в подразделе сайта

Столкнулся с задачкой организовать поиск по своему сайту в определенном разделе сайта. Т.е. мне надо, чтобы искало не по всему сайту, а только, например, по каталогу. Все решается с помощью языка запросов к Яндексу.

[/crayon] Конечно способ работает, при условии, что у вас человеко-понятные урлы и вы сможете отделить нужный вам раздел. Если страницы формируются Читать дальше …

Поиск по сайту с помощью Яндекс XML и CURL

Решил на одном новом проекте реализовать поиск по сайту на основе Яндекс.XML. Сложного ничего нету, тем более, что на Яндексе есть готовый пример реализации такого поиска. Его надо было только доработать немного напильником под свои нужды и все будет Ok. Но я все-равно столкнулся с проблемой. Хитрость в том, что надо в Яндексе зарегистрировать IP Читать дальше …

Проверка битых ссылок на файловые хранилища

У меня на балбесах сложилась очень неприятная ситуация с файловым архивом (клипарты, кисти для фотошопа и т.д.) Сейчас все эти разделы наполняются пользователями. Они размещают свои файлы на различных файловых хранилищах и для скачивания дают уникальную ссылку позволяющую скачать их файл. Это все достаточно удобно, за исключением одного момента. Если файл не скачивается определенное время Читать дальше …

Эмуляция браузера на php или парсер без проблем

Не так давно столкнулся с одной задачкой. Надо было взять 1000 урлов из поиска Яндекса и проверить наличие определенных признаков (строк) на странице. Пытался все сделать с помощью стандартной функции fsockopen, но возникла проблема — 70-80% серверов меня приравнивали к ДДОС атаке и банили по IP.  Убил часа 2-3 на подборы различных User-Agent, но меня всеравно Читать дальше …