遍历sql文件和项目文件,查询表名出现过的文件
更新:HHH   时间:2023-1-7


最近在整理项目的数据库的内容,有两个问题是要解决的,一个问题是有些表已经没有在文件里跑了,我需要筛选掉,一个问题是还在用的那些表,分别是在哪些文件里跑的?

数据表我统计了一下,有200+。项目的控制器文件,当然是两个文件夹,一个关于前台的,一个关于后台的。

然后,逻辑上是这样的,先把sql文件遍历一遍,取出所有表名,再把每个表名去两个文件夹里跑一遍。

写这个程序,有三个头是必不可少的:

header("Content-type: text/html; charset=utf-8");
error_reporting(0);
set_time_limit(0);

其实一般都是等到出现问题,再加上这三个头的...

先说说遍历sql文件,取出表名,其实很容易,不过正则表达式我写不好,就用str_replace函数代替了。

    function sqlarr($mdir)
    {
        $str=file_get_contents($mdir);
        if(!$str)
        {
            echo '<script>';echo 'alert(\'文件路径不存在!\');';echo '</script>';return false;
        }
        $pattern = '/表的结构 \`.*\`/isU';
        preg_match_all($pattern, $str, $match);
        $match = array_unique($match[0]);
        static $arr = array();
        foreach ($match as $key => $value) 
        {
            $value = str_replace("`","",$value);
            $value = str_replace("表的结构 ","",$value);
            $v2 = str_replace("head_","",$value);
            //不能是带日期的错误文件
            $w = '/-/isU';
            preg_match_all($w,$v2,$mm);
                if (!$mm[0]) {
                    $arr[] = $v2;
                }
        }
      return $arr;
    }

$mdir就是sql文件的路径了,因为有些带日期的错误文件,也被我筛选掉了,值得一提,这是phpmyadmin导出来的sql文件,一般是可以用这个方法找出所有表名的。

然后就是将返回的数组进行循环,每个值都对文件进行遍历就行了。

    $mSqlArr = sqlarr('URL');
        foreach ($mSqlArr as $k => $v) {
        $k++;
        echo '<br/><br/><b><font color="green">'.$v.'('.$k.')</font></b><br/><br/>';
        listDir("./",$v);
    }

listDir()就是遍历函数了。这样子,会输出表名和表名的排序。对两百多个表名来说,这个查询过程很久,程序至少需要运行十几分钟。

下一步就是listDir这个递归函数了,这个没什么好说的,写出来调试就可以了,我的代码是这样的:

function listDir($dir,$keyword)
{
//前台的有效文件
$arrA = array();
//后台的有效文件
$arrB = array();
$a_files = '';
$b_files = '';
  if(is_dir($dir))
    {
      if ($dh = opendir($dir)) 
    {
          while (($file = readdir($dh)) !== false)
      {
          if((is_dir($dir."/".$file)) && $file!="." && $file!="..")
        { 
          if($file == 'Action')echo "<hr><b><font color='red'>Action路径:</font></b>",$dir.$file,"<br/>";
            listDir($dir.$file."/",$keyword);
          }
        else
        {
          $extension=substr(strrchr($file, '.'), 1);
                //这里加筛选条件
              if($file!="." && $file!=".." && $extension='php' )
          {
            $content=file_get_contents($dir.$file);
            $parameter = 'M(\''.$keyword.'\')';
            $match = strpos($content,$parameter);
            $num = substr_count($content,$parameter);
            if(!$match)
            {
              $con ='';
            }
            else
            { 
              $file = str_replace("Action.class.php","",$file);
              $con = '文件名:'.$file;
              $con .= '&nbsp;&nbsp;次数:'.$num;
              //前台
              if($dir == './A/Lib/Action/')
              {
                if(in_array($file,$arrA))
                {
                  $con .= '<b><font color="blue">(有效)</font></b><br/><br/>';
                  $a_files .= $file.'、';
                }
                else
                {
                  $con .= '<b><font color="red">(无效)</font></b><br/><br/>';
                }
              }
              elseif($dir == './B/Lib/Action/')
              {
                //后台
                if(in_array($file,$arrB))
                {
                  $con .= '<b><font color="blue">(有效)</font></b><br/><br/>';
                  $b_files .= $file.'、';
                }
                else
                {
                  $con .= '<b><font color="red">(无效)</font></b><br/><br/>';
                }
              }
              else
              {
                $con .= '<b><font color="green">(未知)</font></b><br/><br/>';
              }
            }
            //file_put_contents('../test.php',$match,FILE_APPEND);
              print_r($con);
              ob_flush();
              flush();
              }
          }
          }
          closedir($dh);
      }
    }
    print_r($a_files);
    print_r($b_files);
    return false;
}

这个函数的作用,就是让表名到两个文件夹里去循环,输出含有该表名的文件名称了,$arrA和$arrB就是给他判断哪些是有效文件了(有些文件我知道作废了)。

从路径上看可知,这是thinkphp的目录结构,是控制器放置的文件夹。

第一个参数是路径,第二个参数是关键字,也就是表名。

最后,我写了个可以简单查询单独一个表名情况的代码。

    $keyword = isset($_POST['keyword'])?$_POST['keyword']:'';
    //一律小写,删除空格
    $keyword = str_replace(' ','',strtolower($keyword));
    echo '<form method="post" action="'.GetCurUrl().'" ><input type="text" name="keyword"/><input type="submit" value="搜索表名" /></form>';
    echo '搜索的表名:'.$keyword.'<br/>';
    if(!$keyword){echo '<script>';echo 'alert(\'不能为空\');';echo '</script>';return false;}
    //开始运行
    listDir("./",$keyword);

这里有个得到当前域名的函数:

    function GetCurUrl()
    {
        if(!empty($_SERVER["REQUEST_URI"]))
        {
            $scriptName = $_SERVER["REQUEST_URI"];
            $nowurl = $scriptName;
        }
        else
        {
            $scriptName = $_SERVER["PHP_SELF"];
            if(empty($_SERVER["QUERY_STRING"]))
            {
              $nowurl = $scriptName;
            }
            else
            {
              $nowurl = $scriptName."?".$_SERVER["QUERY_STRING"];
            }
        }
        return $nowurl;
    }

最后,就大功告成了。

返回web开发教程...