$page = file_get_contents("http://www.harunalp.com");
preg_match_all("/href=\"([^\"]+)/i",$page,$link);
foreach ($link[0] as $row)
{
echo $row ."<br>";
}
Çıktı:
href=”http://www.harunalp.com/category/c-sharp/
href=”http://www.harunalp.com/category/javascript/
href=”http://www.harunalp.com/category/php/
href=”http://www.harunalp.com/category/jquery/
href=”http://www.harunalp.com/category/java/
… şeklinde olacaktır.Aynı şekilde sadece bir kategoriye ait yazıları almak istersek de site adresi/category yazarak erişebiliriz.
Eğer linklerin başındaki href yazısını kaldırmak isterseniz basit bir şekilde str_replace kullanarak ortadan kaldırabilirsiniz. Foreach içindeki alanı aşağıdaki gibi düzenleyerek href alanını temizleyebilirsiniz.
echo str_replace('href="','',$tek) ."<br>";
Bu şekilde php ile sayfalardan bilgi toplamak tüm linkleri çekme işlemini rahatlıkla yapabilirsiniz. Bot yapımının ilk ve önemli aşamalarındandır kendileri 🙂



