$contenido = strtolower($contenido); //a minusculas $p = array('/À/', '/Â/', '/Ã/', '/Ä/', '/Å/', '/È/', '/Ê/', '/Ë/', '/Ì/', '/Î/', '/Ï/', '/Ò/', '/Ô/', '/Õ/', '/Ö/', '/Ø/', '/Ù/', '/Û/', '/Ü/', '/Á/', '/É/', '/Í/', '/Ó/', '/Ú/', '/á/', '/é/', '/í/', '/ó/', '/ú/', '/à/', '/è/', '/ì/', '/ò/', '/ù/', '/â/', '/ê/', '/î/', '/ô/', '/û/', '/ä/', '/ë/', '/ï/', '/ö/', '/ü/', '/ã/', '/å/', '/õ/', '/ø/', '/ç/', '/ÿ/', '/Ñ/', '//', '/1/', '/2/', '/3/', '/4/', '/5/', '/6/', '/7/', '/8/', '/9/', '/0/'); $r = array('a', 'a', 'a', 'a', 'a', 'e', 'e', 'e', 'i', 'i', 'i', 'o', 'o', 'o', 'o', 'o', 'u', 'u', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'a', 'o', 'o', 'c', 'y', 'ñ', '', '', '', '', '', '', '', '', '', '', ''); $contenido = preg_replace($p, $r, $contenido); //reemplazar vocales con acentos, entre otros. $contenido = preg_replace("/[^A-Za-z0-9 '\n'ñ]/", "", $contenido); //quitar caracteres especiales. $stopwords_file = "stopwords.txt"; //a esta funcion se le pasa la variable con el contenido limpio y el archivo que contiene las stopwords. //$contenido = stop_words($contenido, $stopwords_file); //funcion que elimina todas las stopwords $contenido = str_replace("\n", " ", $contenido); $contenido = str_replace("\r", " ", $contenido); $contenido = str_replace("\\b", " ", $contenido); $contenido = str_replace("\t", " ", $contenido); $contenido = quitar_espacios_dobles($contenido); //Se reemplaza el archivo que tenia el texto sin limpiar, con el texto limpio. $fp = fopen($dird, 'w'); fwrite($fp, $contenido, strlen($contenido)); fclose($fp); //////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////// } else { echo "no leyo nada"; } } else { echo "<font color=\"red\">Error: El archivo debe ser de extension PDF</font>"; } } ?> <!-- <br/><h3> Documentos Registrados</h3>
function limpiar_docs($dir) { $dird = $dir . ".txt"; exec("pdftotext {$dir} {$dird}"); $contenido = ""; $contenido = file_get_contents($dird); //leer el archivo .txt $contenido = strtolower($contenido); //a minusculas $p = array('/À/', '/Â/', '/Ã/', '/Ä/', '/Å/', '/È/', '/Ê/', '/Ë/', '/Ì/', '/Î/', '/Ï/', '/Ò/', '/Ô/', '/Õ/', '/Ö/', '/Ø/', '/Ù/', '/Û/', '/Ü/', '/Á/', '/É/', '/Í/', '/Ó/', '/Ú/', '/á/', '/é/', '/í/', '/ó/', '/ú/', '/à/', '/è/', '/ì/', '/ò/', '/ù/', '/â/', '/ê/', '/î/', '/ô/', '/û/', '/ä/', '/ë/', '/ï/', '/ö/', '/ü/', '/ã/', '/å/', '/õ/', '/ø/', '/ç/', '/ÿ/', '/Ñ/', '//', '/1/', '/2/', '/3/', '/4/', '/5/', '/6/', '/7/', '/8/', '/9/', '/0/'); $r = array('a', 'a', 'a', 'a', 'a', 'e', 'e', 'e', 'i', 'i', 'i', 'o', 'o', 'o', 'o', 'o', 'u', 'u', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'a', 'o', 'o', 'c', 'y', 'ñ', '', '', '', '', '', '', '', '', '', '', ''); $contenido = preg_replace($p, $r, $contenido); //reemplazar vocales con acentos, entre otros. $contenido = ereg_replace("[^A-Za-z0-9 '\n'ñ]", "", $contenido); //quitar caracteres especiales. $stopwords_file = "stopwords.txt"; //a esta funcion se le pasa la variable con el contenido limpio y el archivo que contiene las stopwords. $contenido = stop_words($contenido, $stopwords_file); //funcion que elimina todas las stopwords $contenido = str_replace("\n", " ", $contenido); $contenido = str_replace("\r", " ", $contenido); $contenido = str_replace("\\b", " ", $contenido); $contenido = str_replace("\t", " ", $contenido); $contenido = quitar_espacios_dobles($contenido); //Se reemplaza el archivo que tenia el texto sin limpiar, con el texto limpio. $fp = fopen($dird, 'w'); fwrite($fp, $contenido, strlen($contenido)); fclose($fp); }
//Si la forma de acceder al script es mediante el navegador web entonces redirige a la pagina principal if (strtolower($_SERVER['HTTP_X_REQUESTED_WITH']) != 'xmlhttprequest' && !isset($_SERVER['HTTP_REFERER'])) { header("Location:ingresar.php"); } $ruta_raiz = "../"; require_once $ruta_raiz . "conf/config.php"; require_once $ruta_raiz . "inc/all.inc.php"; require_once $ruta_raiz . "inc/verificar_sesion.inc.php"; require_once $ruta_raiz . "admin/inc/admin_db_functions.inc.php"; require_once $ruta_raiz . "admin/inc/admin_functions.inc.php"; $id_estudiante = $_REQUEST["id_usuario"]; $id_experiencia = $_REQUEST["id_exp"]; $accion = $_REQUEST["accion"]; $nombre = $_REQUEST["nombre"]; $usuario = $_REQUEST["usuario"]; $nombre = quitar_espacios_dobles(str_replace(".", " ", $nombre)); $conexion = dbConectarMySQL($config_host_bd, $config_usuario_bd, $config_password_bd, $config_bd); $exito = 0; if ($accion == 1) { $exito = dbAdminEditarEstudiante($id_estudiante, $nombre, $usuario, $conexion); echo $exito; } if ($accion == 2) { $_respuesta = dbAdminEstudianteEstadoExperiencia($id_estudiante, $id_experiencia, $conexion); $resp_experiencia = dbAdminEliminarEstudianteExperiencia($id_estudiante, $id_experiencia, $conexion); if ($resp_experiencia == 1) { $data = "<p><?php echo {$lang_admin_est_no_pertenece_exp}; ?></p> "; } else { $data = "<p>-<?php echo {$lang_admin_fallo_eliminacion_est_exp}; ?></p></br>"; } if (!is_null($_respuesta["grupo"])) {
$lista = explode(",", $_POST['txtConsulta']); $nkey = count($lista); for ($i = 0; $i < $nkey; $i++) { $lista[$i] = strtolower($lista[$i]); } $p = array('/À/', '/Â/', '/Ã/', '/Ä/', '/Å/', '/È/', '/Ê/', '/Ë/', '/Ì/', '/Î/', '/Ï/', '/Ò/', '/Ô/', '/Õ/', '/Ö/', '/Ø/', '/Ù/', '/Û/', '/Ü/', '/Á/', '/É/', '/Í/', '/Ó/', '/Ú/', '/á/', '/é/', '/í/', '/ó/', '/ú/', '/à/', '/è/', '/ì/', '/ò/', '/ù/', '/â/', '/ê/', '/î/', '/ô/', '/û/', '/ä/', '/ë/', '/ï/', '/ö/', '/ü/', '/ã/', '/å/', '/õ/', '/ø/', '/ç/', '/ÿ/', '/Ñ/', '//', '/1/', '/2/', '/3/', '/4/', '/5/', '/6/', '/7/', '/8/', '/9/', '/0/'); $r = array('a', 'a', 'a', 'a', 'a', 'e', 'e', 'e', 'i', 'i', 'i', 'o', 'o', 'o', 'o', 'o', 'u', 'u', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'e', 'i', 'o', 'u', 'a', 'a', 'o', 'o', 'c', 'y', 'ñ', '', '', '', '', '', '', '', '', '', '', ''); for ($i = 0; $i < $nkey; $i++) { $lista[$i] = preg_replace($p, $r, $lista[$i]); $lista[$i] = ereg_replace("[^A-Za-z0-9 '\n'ñ]", "", $lista[$i]); $lista[$i] = str_replace("\n", " ", $lista[$i]); $lista[$i] = str_replace("\r", " ", $lista[$i]); $lista[$i] = str_replace("\\b", " ", $lista[$i]); $lista[$i] = str_replace("\t", " ", $lista[$i]); $lista[$i] = stop_words($lista[$i], $stopwords_file); $lista[$i] = quitar_espacios_dobles($lista[$i]); } //Quitar los espacios que quedan cuando en la consulta un palabra clave es un stopword. for ($i = 0; $i < $nkey; $i++) { if ($lista[$i] == "") { unset($lista[$i]); } } $lista = array_values($lista); /* //Mostar resultado de la lista echo "Lista de palabras claves<br>"; for($i=0; $i<count($lista); $i++) echo "Palabra[".$i."]= ".$lista[$i]."<br>"; echo "<br>numero de grupos".$numclusters;