Proyecto Programado #2 - Daniel Obaldía
miércoles, 15 de julio de 2020
Día 9
Hoy se hicieron pequeños arreglos en la interfaz, mas sus pruebas con diferentes ejemplos. Hoy también se termino la documentación.
martes, 14 de julio de 2020
Día 8
Hice unos pequeños arreglos a la interfaz para determinar el uso de los signos de puntuación, en otras palabras eliminándolos como tokens. Por otra parte empece mi parte de la documentación.
domingo, 12 de julio de 2020
Día 7
Desde el día 10 de julio hasta hoy 13 de julio he estado haciendo la interfaz gráfica que vamos a utilizar en nuestro proyecto. Finalmente hoy ya se tiene casi todo listo dentro de la interfaz. He aprendido a usar textbox, entry, label, y a poder aplicarlos de buena maera aprendiendo de la mayoria de sus funciones. Un elemento que me fue de gran ayuda fue el get() este método fue clave para que el texto que yo deseará fuera tokenizado o traducido. Aprendí tambien un poco mas sobre las librerías externas, ya que he investigado acerca de como traducir el texto que tokenizamos. Descubrí que se puede usar el traductor de google directamente para poder traducir el texto que se desee con "googletrans" y su función incorporada "Translator" de esta forma logré verificar cada token y realizar su respectiva traducción. Además de todo esto pude realizar algunos cambios en las funciones para que se pudieran aplizar en la interfaz gráfica.
Mi compañero y yo realizamos varios cambios para que la interfaz fuer mas funcional y no tuviera errores. Agregamos empty rows y columns para que estéticamente la interfaz se viera mucho mejor. Le dimos "commands" a cada una de los botones que necesitaremos. De esta forma dimos por hecha la interfaz.
jueves, 9 de julio de 2020
Día 6
Mi compañero y yo estamos investigando acerca de como implementar la interfaz gráfica en nuestra función .
Aprendí el metodo Text() y Scrollbar() para poder utilizar barras de textos y a su vez un "scroll" o un método para poder desplazarse en el texto.
Estuve investigando sobre las funcionalidades de "Button()" donde puedo crear diferentes botones que tengan una funcionalidad dentro de la interfaz.
Hice una parte de la interfaz, que utilizaremos en la entrega final, aprendiendo de coordenadas y aplicando métodos que vi en los días anteriores.
miércoles, 8 de julio de 2020
Día 5
Investigando acerca de la librería NLTK, he aprendido métodos tales como nltk.tokenize import sent_tokenize. En este proceso puedo tokenizar oraciones o párrafos. A su vez "word_tokenize" funciona como un tokenizador de palabras de una oración o párrafos.
Para tokenizar textos que no están en ingles se agrega un parámetro donde se indique el idioma que se quiera utilizar.
El método wordnet es una base de datos para el procesamiento del lenguaje natural donde incluye sinónimos y una definición.
martes, 7 de julio de 2020
Día 4
Hoy estuve revisando las funciones que mi compañero realizo como prueba para poder clasificar números, preposiciones, pronombres, artículos y no clasificados. Estuvimos arreglando un par de cosas de las funciones e investigando de como implementarlas en la interfaz gráfica.
Mientras tanto he realizado investigaciones sobre el uso del "nltk".
lunes, 6 de julio de 2020
Día 3
Hoy después de una larga investigación acerca de librerías externas hemos conseguido instalar la librería ntlk o Natural Language Toolkit. Una herrmanienta que nos ayudará para un buen uso de la tokenización y para el uso general de las palabras.
Suscribirse a:
Comentarios (Atom)
Día 9
Hoy se hicieron pequeños arreglos en la interfaz, mas sus pruebas con diferentes ejemplos. Hoy también se termino la documentación.