1 / 22

Plano de Doutoramento

Plano de Doutoramento. Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco. Estrutura da Apresentação. Objectivos Motivação Expectativas Plano Critérios de Sucesso. Objectivo. Criar uma Base de Conhecimento Lexical para o Português. Formalização de uma metodologia

emmet
Download Presentation

Plano de Doutoramento

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Plano de Doutoramento Construção de uma Base de Conhecimento Lexical para o Português Nuno Seco

  2. Estrutura da Apresentação • Objectivos • Motivação • Expectativas • Plano • Critérios de Sucesso

  3. Objectivo • Criar uma Base de Conhecimento Lexical para o Português. • Formalização de uma metodologia • Uma implementação da metodologia

  4. Objectivo • Tornar explícita a informação sobre conceitos (referenciados por termos). • O que é árvore? • “planta alta de caule (tronco) e ramos lenhosos” • Para que servem? São seres vivos? Se sim, como nascem? Quantos tipos existem?

  5. Definição de Base de Conhecimento Lexical “É um repositório de informação sobre conceitos que pode ser utilizado em áreas como a Linguística, IA e Ciências da Informação (…) contém informação sobre conceitos lexicais e as suas relações.” Robert Amsler (1984)

  6. Definição de Base de Conhecimento Lexical “É uma estrutura que fornece uma organização semântica aos termos do nosso léxico, tornando explícita as relações semânticas entre estes.”

  7. Motivação • O nosso sistema conceptual está organizado como uma rede de conceitos. (Miller, Quillan) • O sistema conceptual governa a forma como: pensamos, agimos e comunicamos. (Lackoff) • Conceitos esses que são referenciados por termos.

  8. Motivação Para as máquinas: • Recolha de Informação • Desambiguação Semântica e Sintáctica • Semelhança semântica entre Palavras • Pergunta e Resposta • Para os humanos: • Pode servir como um auxiliar de escrita, como um Dicionário ou Tesauro.

  9. Abordagens Estatísticas • Algoritmos estatísticos, como frequências de co-ocorrências, são semanticamente cegos. • carro • pneu • volante • motor • veículo • condutor

  10. Abordagens Manuais • Conhecimento é compilado manualmente. • WordNet, Cyc, HowNet • Problemas: • Muito moroso • Muito caro

  11. Abordagens Baseadas em Extracção de Informação • Procurar padrões que indicam a existência de uma relação semântica no texto: parte_de(pneu, carro) tipo_de(carro, veículo) parte_de(motor, veículo) usa(condutor, carro)

  12. Abordagem Proposta • Baseada em Extracção de Informação. • Análise das definições em dicionários. (Inspirada na abordagem do MindNet)

  13. Abordagem Proposta • Informação sintáctica • Substantivos • Verbos • Advérbios • Adjectivos • Informação predicativa • comida é o objecto_típico de verbo comer

  14. Abordagem Proposta • Informação sobre os diferentes sentidos de um termo • Um representação para lidar com homonímia: • parte_de(banco.1, jardim) • instância_de(BES, banco.2)

  15. Exemplo CARRO.1 Categoria: Substantivo Definição: Hiperónimos: veículo.1 Hipónimos: Merónimos: pneu, motor, volante Objecto_Típico_de: conduzir.2 (…)

  16. Expectativas • Existência de uma Ontologia Lexical para o Português. • Um sistema informático (semi-)automático de extracção de conhecimento. • Capaz de Evoluir • Adição de novo conhecimento • Refinamento do existente

  17. Exemplo de utilização • Sistema de Pergunta e Resposta: oraculo:\> Existe alguma bíblia muçulmana? oraculo:\> Corão, Alcorão

  18. Exemplo de Utilização Livro Sagrado Cristianismo Islamismo Corão Bíblia Cristão Muçulmano

  19. Planificação • Revisão Bibliográfica. • Identificação das relações semânticas mais importantes. • Procura de recursos para iniciar o processo de extracção. (Dicionários) • Definição do modelo de dados para armazenamento.

  20. Planificação • Protótipo do sistema de extracção. • Formalização do Processo de Extracção • Base de Conhecimento Lexical. • Análise do recurso gerado. • Aplicação em tarefas específicas. • Medição do Impacto • Melhoramentos.

  21. Critérios de Sucesso • Utilização do recurso por terceiros • Contribuição do recurso em tarefas relacionadas com PLN: • Recolha de Informação • Desambiguação • Semelhança Semântica • Sistemas de Pergunta e Resposta

  22. Plano de Doutoramento Construção de uma Ontologia Lexical para o Português Nuno Seco

More Related