php脚本自动采集获取新闻实时热点

这个php脚本运行能获取百度的民生、体育、娱乐、搜狗的七天内3页、电影、电视剧、动漫、小说、音乐、游戏、汽车、人物的实时热点并且会在zylou文件夹生成采集后的txt文本,如果没保存到文件夹,自己新建一个文件夹名为zylou就行了~方便别人做一些关键词,或者查实时热点。

<?php
// www.zylou.cn  资源楼
// 搜狗百度热点采集生成:  
$strchulis="";  
$sgresult="";  
$baidustr1 = file_get_contents("http://top.baidu.com/buzz/top10.html");    
$baidustr2 = file_get_contents("http://top.baidu.com/buzz?b=11&c=513&fr=topcategory_c513");    
$baidustr3 = file_get_contents("http://top.baidu.com/buzz?b=344&c=513&fr=topcategory_c513");    
for ($x=1; $x<=3; $x++) {  
    $sgstr1 = file_get_contents("http://top.sogou.com/hot/sevendsnews_".$x.".html");    
    $sgstr2 = file_get_contents("http://top.sogou.com/hot/shishi_".$x.".html");    
    $sgstr3 = file_get_contents("http://top.sogou.com/movie/all_".$x.".html");    
    $sgstr4 = file_get_contents("http://top.sogou.com/tvplay/all_".$x.".html");    
    $sgstr5 = file_get_contents("http://top.sogou.com/tvshow/all_".$x.".html");    
    $sgstr6 = file_get_contents("http://top.sogou.com/animation/all_".$x.".html");    
    $sgstr7 = file_get_contents("http://top.sogou.com/book/all_".$x.".html");    
    $sgstr8 = file_get_contents("http://top.sogou.com/song/newsong_".$x.".html");    
    $sgstr9 = file_get_contents("http://top.sogou.com/game/all_".$x.".html");    
    $sgstr10 = file_get_contents("http://top.sogou.com/auto/all_".$x.".html");    
    $sgstr11 = file_get_contents("http://top.sogou.com/people/all_".$x.".html");    
    // for循环过滤搜狗  
    for ($i=1; $i<=11; $i++) {  
        preg_match_all('/<p class=\"p1\".*?>.*?<\/p>/ism', ${"sgstr".$i}, $matchestop);  
        preg_match_all('/<p class=\"p3\".*?>.*?<\/p>/ism', ${"sgstr".$i}, $matchesbottom);  
        $strtop = join("\r\n", $matchestop[0]); 
        $strbottom = join("\r\n", $matchesbottom[0]); 
        $sgresult.=$strtop.$strbottom; 
      }  
    $baidustr = mb_convert_encoding(${"baidustr".$x}, 'UTF-8', 'GB2312'); 
    preg_match_all('/<a class=\"list-title\".*?>.*?<\/a>/ism', $baidustr, $matches);  
    $baidustr = join("\r\n", $matches[0]); 
    $sgstrend=$sgresult.$baidustr; 
    $strchuli = strip_tags($sgstrend); 
    $strchulis.=$strchuli; 
  } 
    echo $strchulis; 
    file_put_contents('zylou/'.date("Y-m-d").'.txt', $strchulis);//存入txt
?>

 

常用代码

禁止百度保存快照代码,防止同行查看快照源码

2020-1-13 16:02:21

SEO辅助软件常用代码

php自动采集新闻内容脚本

2020-2-3 16:48:11

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
有新消息 消息中心
搜索