Todo empezó en el trabajo. Había veces que tenía que buscar referencias (cadenas de texto) en muchos muchos muchos archivos excel y pdf (unos 6 o 7 años de archivos). Como me volvía loco varios días, decidí hacer un script que me buscase los textos el solito . Empecé bien, pero ya sabeis como es esto a veces......dices: ya que estoy puesto voy a ver si hago que haga esto también, y esto, y esto otro, etc. Al final se complica el script una barbaridad . Y al final salió lo que hoy os voy a colgar.
El script es un programa de búsqueda de múltiples textos en multiples tipos de ficheros. Entre ellos están: Word y Excel (búsqueda por objeto o texto), ficheros de texto plano, web (búsqueda por texto plano (html) o por el objeto word), y pdf (búsqueda gracias al programa de consola pdftotext).
El código está sumamente sucio y casi sin comentar. Lo he revisado por encima, pero seguro que tiene algunos errores. No he podido depurarlo más ya que mañana a primera hora me voy de vacaciones 5 días a la playita (Almuñecar ) y se me ha echado el tiempo encima. Lo cuelgo para que lo vayais probando y me digais como os va, los fallos que encontrais, etc.
Ya he visto dos fallos que tengo que mirar con más detenimiento . Uno es gordo, y es que cuando compilo el script en w7 no me funciona como debería. Pero si lo ejecuto desde el scite me va de lujo . Será alguna opción de compilación???? Ya lo mirare el lunes cuando vuelva. Si encontrais la solución decirla.
El programa tiene un enlace a una pequeña ayuda. Dice así:
Cosas curiosas del programa:Esta es una pequeña ayuda del funcionamiento y funcionalidad del programa.
Como se puede observar se trata de un buscardor de múltiples textos en múltiples tipos de archivos.
En la pestaña resultados nos encontramos con una lista que nos muestra los archivos donde se ha encontrado algún texto de los buscados. Si pulsamos doble click en cualquiera de los archivos, se nos abrirá en su programa por defecto.
En la pestaña 'Opciones' tenemos 5 opciones, donde le diremos en que archivos debe buscar los textos, pudiendo ser éstos de texto, word, excel, web y pdf.
También encontramos una lista donde podemos introducir los textos a buscar.
En la pestaña 'Otros' vemos que podemos seleccionar entre una búsqueda sensitiva (busca el texto exacto que ponemos) o no sensitiva (busca el texto ignorando mayúsculas y minúsculas).
Debajo podemos observar unas opciones donde le diremos de que forma deben buscar el/los texto/s, en modo objeto (excel y word) o en modo texto.
Al lado vemos otra lista en el que podemos introducirle las extensiones sin punto de los archivos donde queremos buscar el/los texto/s. Para que funcione debemos marcar la casilla que pone 'Buscar extensiones'. Este método solamente busca en modo texto.
La lista de extensiones tiene una particularidad, y es que si le introducimos un asterisco ( * ), busca en el texto en todos los ficheros, ignorando todas la demás extensiones de la lista.
Cuidado con esta técnica. Si tiene muchos archivos y de gran tamaño el programa no responde bien. Pero aunque parezca que no responde, está funcionando ;).
Pues esto es todo. Espero que os guste y os sea de utilidad.
Saludos.
El método de cálculo de porcentaje al revisar los archivos es distinto al típico de contar todos los ficheros (muy lento). Parece que he encontrado uno más rápido, sacar el tamaño de la carpeta a analizar e ir restando la cantidad de los archivos que voy revisando hasta llegar a cero. He visto que falla un poquito, pero creo que se por donde van los tiros . Otra cosa que luego miraré (supongo).
Tratamiento de objetos word y excel, tanto directamente como con las udfs. Tuve que hacerlo casi todo directamente ya que con las funciones de las udfs el windows 7 con el office 2007 me fallaban bastante.
Tratamiento de errores cuando hay varios objetos.
Y supongo que alguna cosa más .
Algo curioso de la historia del script: No iba a acabarlo. Lo abandoné en abril, cuando ya tenía todo lo complicado hecho.
El mes pasado empecé a investigar códigos referentes a la descarga de archivos por partes, y varios a la vez. Creo que he encontrado una buena solución a la falta de multihilo de autoit (hombre....buena lo que se dice buena, no . Digamos pasable ). Y después de esto me quise embarcar en un proyecto parecido al jdownloader o al mipony. Pero me daba pena dejar el proyecto de búsqueda de archivos a medio, asi que me puse y dije: Hasta que no acabe esto no empiezo lo otro . Y hasta aquí hemos llegado por ahora.
Espero que el siguiente proyecto lo acabe, porque me interesa mucho mucho. Lo intentaré hacer más profesional. Habrá que esperar meses para que se vea algo a la luz.
Sin más dilación os dejo el script. Espero que os guste. No dudeis en preguntar si quereis saber algo. Intentaré aclararoslo .
El script está probado con win xp sp3 y office 2003, y con win7 y office 2007. Con el office 2010 no lo he probado ya que no lo tengo. Parece que con offices anteriores al 2003 no funciona.
Saludos.