Use este identificador para citar ou linkar para este item: http://repositorio.ufgd.edu.br/jspui/handle/prefix/2574
Registro completo de metadados
Campo DCValorIdioma
dc.contributor.advisor1Batista Junior, Joinvile-
dc.contributor.advisor1Latteshttp://lattes.cnpq.br/7711394117839430pt_BR
dc.contributor.referee1Odakura, Valguima Victoria Viana Aguiar-
dc.contributor.referee1Latteshttp://lattes.cnpq.br/0165414661753032pt_BR
dc.contributor.referee2Barvinski, Carla Adriana-
dc.contributor.referee2Latteshttp://lattes.cnpq.br/2994481069591021pt_BR
dc.creatorCoutinho, Jeovano-
dc.creator.Latteshttp://lattes.cnpq.br/7711394117839430pt_BR
dc.date.accessioned2020-03-03T18:36:48Z-
dc.date.available2022-12-31-
dc.date.available2020-03-03T18:36:48Z-
dc.date.issued2019-11-22-
dc.identifier.citationCOUTINHO, Jeovano. Captura e extração de estrutura e sentenças de artigos técnicos disponíveis na web. 2019. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Faculdade de Ciências Exatas e Tecnologias, Universidade Federal da Grande Dourados, Dourados, MS, 2019.pt_BR
dc.identifier.urihttp://repositorio.ufgd.edu.br/jspui/handle/prefix/2574-
dc.description.abstractThis work presents an automated solution for structures and sentence extraction of technical articles available on the web in PDF format through an application with a friendly user interface. The application has a web scrapper for identification and download of the technical articles from the web. In the structures and sentence extraction process, heuristics are used with regular expressions for contents identifying present on technical articles as paragraphs, sections, footers, figures, items list, and references. The final result is an XML file describing the extracted structure from the processed technical articles. The obtained sentences from the structure of technical articles are used as input to many natural language processing activities.en
dc.description.resumoEste trabalho apresenta uma solução automatizada para extração de sentenças e estruturas de artigos técnicos disponíveis na web no formato PDF através de uma aplicação com interface gráfica amigável. A aplicação contém um Web Scrapper para identificação e realização de download dos artigos técnicos da web. No processo de extração de estruturas e sentenças, são utilizadas heurísticas junto a expressões regulares para identificações de conteúdos presentes em artigos técnicos como: parágrafos, seções, notas de rodapé, figuras, lista de itens, e referências. O resultado final é um arquivo XML descrevendo a estrutura extraída dos artigos técnicos processados. As sentenças obtidas a partir da estrutura do artigo são utilizadas como entrada para várias atividades de processamento de linguagem natural.pt_BR
dc.description.provenanceSubmitted by Alison Souza (alisonsouza@ufgd.edu.br) on 2020-03-03T18:36:48Z No. of bitstreams: 1 Documento embargado.pdf: 44487 bytes, checksum: 52b041d9608d3c7801de4e92dec51380 (MD5)en
dc.description.provenanceMade available in DSpace on 2020-03-03T18:36:48Z (GMT). No. of bitstreams: 1 Documento embargado.pdf: 44487 bytes, checksum: 52b041d9608d3c7801de4e92dec51380 (MD5) Previous issue date: 2019-11-22en
dc.languageporpt_BR
dc.publisherUniversidade Federal da Grande Douradospt_BR
dc.publisher.countryBrasilpt_BR
dc.publisher.departmentFaculdade de Ciências Exatas e Tecnologiapt_BR
dc.publisher.initialsUFGDpt_BR
dc.rightsAcesso Abertopt_BR
dc.subjectProcessamento de linguagem natural (Ciência da computação)pt_BR
dc.subjectNatural language processing (Computer science)en
dc.subjectColeta de dados webpt_BR
dc.subjectWeb scrapingen
dc.subject.cnpqCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::SISTEMAS DE INFORMACAOpt_BR
dc.titleCaptura e extração de estrutura e sentenças de artigos técnicos disponíveis na webpt_BR
dc.title.alternativeCapture and extract structure and sentences of technical articles available on the weben
dc.typeTrabalho de Conclusão de Cursopt_BR
Aparece nas coleções:Sistemas de Informação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
JeovanoDeOliveiraCoutinho.pdf979,84 kBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.