XisQuê O XisQuê (versão beta) é um serviço de resposta automática a perguntas para a Web dos documentos em língua portuguesa. Trata-se de um serviço independente do domínio e dedicado a perguntas factuais. É baseado num protótipo que foi desenvolvido, é mantido e continua a ser expandido pelo NLX-Grupo de Fala e Linguagem Natural na Universidade de Lisboa, Departamento de Informática. |
||
Características O XisQuê recebe um pedido na forma de uma pergunta em português para o qual procura encontrar uma resposta no conjunto dos documentos em língua portuguesa disponíveis na Web. Na versão actualmente disponível, são exibidas até cinco tentativas de resposta, ordenadas por ordem decrescente de plausibilidade. Para cada resposta, o serviço apresenta também a frase onde a resposta foi procurada, juntamente com uma hiper-ligação para o documento de origem. O serviço procura lidar com os seguintes tipos de perguntas factuais:
|
||
Desempenho O desempenho do sistema foi aferido através de um conjunto de testes com 60 perguntas — 15 de cada tipo suportado pelo sistema — seleccionadas ao acaso no jogo Trivial Pursuit®. Estas perguntas podem ser encontradas no anexo abaixo. Os resultados seguintes dizem respeito à versão testada em Março de 2008. Abrangência: É apresentada pelo menos uma tentativa de resposta curta para 57% das perguntas. Para além disso, algum tipo de resposta tentativa (curta ou longa) é apresentada para 98% das perguntas. Precisão: Tomando em consideração as cinco respostas tentativas por cada pergunta, é encontrada uma resposta correcta (curta ou longa) para 98% das perguntas do conjunto de teste. Para 55% das perguntas, é encontrada uma resposta curta correcta. Para informação mais pormenorizada, consultar esta publicação. |
||
Autoria O XisQuê está a ser desenvolvido por António Branco, Lino Rodrigues, João Silva e Sara Silveira, com a contribuição de Mariana Avelãs e de Carolina Silva (MultiWordnet) no NLX-Grupo de Fala e Linguagem Natural na Universidade de Lisboa, Departamento de Informática. |
||
Agradecimentos O desenvolvimento do XisQuê foi parcialmente apoiado pela FCT - Fundação para a Ciência e Tecnologia, do MCT - Ministério da Ciência, Tecnologia e Ensino Superior, através do projecto QueXting, com o contrato POSI/PLP/61490/2004, no âmbito do programa POS_Conhecimento. |
||
Publicações Branco, António, Lino Rodrigues, João Silva e Sara Silveira, 2008, "Real-time Open-Domain QA in the Portuguese Web". LNAI 5290, Springer. pp. 322-331. Branco, António, Lino Rodrigues, João Silva e Sara Silveira, 2008, "XisQuê: An Online QA Service for Portuguese", In Proceedings of the International Conference on the Computational Processing of Portuguese (PROPOR2008), Berlin, Springer. Avelãs, Mariana, António Branco, Rosa del Gaudio e Carolina Silva, subm., "Projecting a Portuguese Ontology by Triangulation to Support Open Domain Question-Answering". Ferreira, Eduardo, João Balsa e António Branco, 2007, "Combining Rule-based and Statistical Methods for Named Entity Recognition in Portuguese", Anais do XXVII Congresso da Sociedade Brasileira de Computação, pp.1615-1624, TIL2007 - V Workshop em Tecnologia da Informação e da Linguagem Humana. Rodrigues, Lino, 2007, Infra-estrutura de um Serviço Online de Resposta-a-Perguntas com base na Web Portuguesa, Dissertação de Mestrado, Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa. Branco, António, Francisco Costa e Filipe Nunes, 2007, "Processing Verb Inflection Ambiguity: Toward a characterization of the problem space", Actas do XXII Encontro Anual da Associação Portuguesa de Linguística, Faculdade de Letras de Coimbra. Silva, João, 2007, Shallow Processing of Portuguese: From Sentence Chunking to Nominal Lemmatization, Dissertação de Mestrado, Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa. Branco, António e João Silva, 2007, "Very High Accuracy Rule-based Nominal Lemmatization with a Minimal Lexicon", In Actas do XXII Encontro Anual da Associação Portuguesa de Linguística, Faculdade de Letras de Coimbra. Branco, António e Francisco Costa, 2007, "Identification and Handling of Dialectal Variation with a Single Grammar", In: Peter Dirix, Ineke Schuurman, Vincent Vandeghinste, and Frank Van Eynde (eds.) Proceedings of the 17th Meeting of Computational Linguistics in the Netherlands (CLIN17), Utrect, LOT, pp.5-19. Barreto, Florbela, António Branco, Eduardo Ferreira, Amália Mendes, Maria Fernanda Nascimento, Filipe Nunes e João Silva, 2006a, "Open Resources and Tools for the Shallow Processing of Portuguese", Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC2006), pp. 1438-1443. Barreto, Florbela, António Branco, Eduardo Ferreira, Amália Mendes, Maria Fernanda Nascimento, Filipe Nunes e João Silva, 2006b, "Linguistic Resources and Software for Shallow Processing", Actas do XXI Encontro Anual da Associação Portuguesa de Linguística, pp.203-218. Branco, António e João Silva, 2006a, "Dedicated Nominal Featurization of Portuguese". Lecture Notes in Artificial Intelligence 3960, Berlim, Springer, ISSN03029743, pp.244-247. Branco, António e Francisco Costa, 2006, "Noun Ellipsis without Empty Categories", Proceedings of the 13th International Conference on Head-Driven Phrase Structure Grammar, Stanford, CSLI Publications, pp.81-101. Branco, António e João Silva, 2006b, "LX-Suite: Shallow Processing Tools for Portuguese", Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics (EACL2006), Trento, Itália, pp.179-182. Rodrigues, Lino, 2006, Relatório Parcial de Implementação do Sistema QueXting, Dez. 2006, Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa. |
||
Contacte-nos Para contacto, use o endereço de e-mail: 'nlxgroup' concatenado com '@' concatenado com 'di.fc.ul.pt'. |
||
Anexo — Conjunto de teste
|