Commencez. C'est gratuit
ou s'inscrire avec votre adresse courriel
EAP - KnEDLe par Mind Map: EAP - KnEDLe

1. Release 1

1.1. Viabilidade Técnica

1.1.1. Recrutamento

1.1.2. Treinamentos

1.1.2.1. Tutoriais de Python, Numpy, Pandas, SKlearn, e outras bibliotecas relevantes de Python.

1.1.2.2. Curso FastAI

1.1.2.3. Curso Writing in the Sciences

1.1.3. Gestão de riscos

1.1.4. Definição da metodologia e ritos

1.1.5. EAP - Estrutura Analítica de Projeto

1.2. Documentação

1.2.1. Documento de visão

1.2.2. Relatório de acompanhamento

1.2.3. Plano de trabalho

1.2.4. Planos individuais de pesquisa

1.3. Pesquisa

1.3.1. Revisão da literatura e estudo de técnicas do estado-da-arte

1.3.1.1. Extração de dados estruturados partir de imagens de tabelas

1.3.1.2. Representações de texto usando TF-IDF

1.3.1.3. Word embeddings

1.3.1.4. Visualização de dados

1.3.1.5. Reconhecimento de entidades nomeadas

1.3.1.6. Ligação de entidades nomeadas

1.3.1.7. Teoria do aprendizado de máquina

1.3.1.8. Aprendizado ativo

1.3.1.9. Aprendizado semi-supervisionado

1.3.2. Análise exploratória dos dados textuais usando ferramentas de visualização

1.3.3. Proposta de heurísticas e avaliações preliminares para extração de informações de documentos do DODF.

1.3.3.1. Aquisição de dados crús

1.3.3.2. Compreensão do objeto

1.3.3.3. Identificação de palavras chaves e entidades relevantes

1.3.3.4. Avaliação de reconhecimento de caracteres usando OCR padrão

1.3.3.5. Implementação de heurísticas

1.3.3.6. Avaliações qualitativas de resultados obtidos

1.3.4. Identificação de secretarias de origem usando somente texto

1.3.4.1. Construção de base de dados para experimentos iniciais, com auxílio do TCDF

1.3.4.2. Avaliação de classificador do estado-da-arte, baseado em Deep Learning e modelos de linguagem (ULMFiT)

1.3.4.3. Avaliação de classificadores clássicos (shallow learning)

1.3.4.4. Escrita de artigo científico

1.3.4.5. Publicação no PROPOR 2020

1.4. Produto

1.4.1. Biblioteca de extração

1.4.2. Front end

1.4.3. Detecção de palavras-chave

1.4.4. Pré-processamento dos dados usando expressões regulares

1.5. Disseminação de Resultados

1.5.1. Web page do projeto

1.5.1.1. Criação da primeira versão

1.5.1.2. Tradução para o português

1.5.1.3. Listagem de toda a equipe

1.5.1.4. Resumo do projeto

1.5.1.5. Disponibilização dos recursos do artigo do PROPOR2020.

1.5.1.5.1. Artigo

1.5.1.5.2. Apresentações

1.5.1.5.3. Base de dados

1.5.1.5.4. Código fonte

1.5.1.5.5. Parâmetros dos modelos treinados

1.5.2. Workshop de resultados (KnEDLe harvest, KnEDLe sharing ou colheita do NIDO ou hay harvest)

1.5.2.1. Criação da web page do evento

1.5.2.2. Divulgação do evento entre partes interessadas e acadêmicos

2. Release 2

2.1. Viabilidade Técnica

2.1.1. Implantação e acompanhamento da metodologia

2.1.2. Gestão estratégica OKR

2.1.3. Implantação de cultura DevOps

2.1.4. Gestão de pessoas

2.1.5. Roadmap das áreas

2.1.6. Acompanhamento de métricas e indicadores

2.1.7. Gestão de riscos

2.1.8. Aquisição de equipamentos

2.1.9. Definição das métricas e indicadores

2.2. Documentação

2.2.1. Relatório de acompanhamento

2.2.2. Mapa de Requisitos

2.2.3. Documento e especificação da arquitetura

2.3. Pesquisa

2.3.1. Atualização sobre o estado-da-arte

2.3.1.1. Extração de dados estruturados partir de imagens de tabelas

2.3.1.2. Ligação de entidades nomeadas

2.3.1.3. Aprendizado de máquina para anotação de documentos

2.3.1.3.1. Aprendizado ativo

2.3.1.3.2. Transferência de aprendizado

2.3.1.3.3. Zero-Shot Learning

2.3.2. Desenvolvimento da teoria do gargalo de informação para aprendizado profundo

2.3.3. Análise de documentos com uso de modelo de tópicos

2.3.3.1. Escrita de artigo científico visando submissão para congresso internacional

2.3.3.2. Modelos de tópicos iterativos

2.4. Produto

2.4.1. Primeira versão da ferramenta de anotação semi-automática de páginas do DODF

2.4.2. Rotulação de seções do DODF

2.4.3. Part-of-Speech Tagging - rotulação de elementos textuais.

2.4.4. Atualização da biblioteca de extração

2.4.5. Atualização do front end

2.4.6. Elaboração e correção de corpora em português com termos específico do domínio jurídico.

2.4.7. Elicitação de requisitos

2.5. Disseminação de Resultados

2.5.1. Disponibilização dos recursos criados pelo projeto

2.5.1.1. Biblioteca de software

2.5.1.2. Apresentações

2.5.1.3. Base de dados / corpora

2.5.1.4. Parâmetros dos modelos treinados

2.5.2. Atualização da web page do projeto

2.5.3. Workshop KnEDLe 2

2.5.3.1. Criação da web page do evento

2.5.3.2. Divulgação do evento entre partes interessadas e acadêmicos

3. Release 3

3.1. Viabilidade Técnica

3.1.1. Roadmap de papeis

3.1.2. Acompanhamento de métricas e indicadores

3.1.3. Gestão de riscos

3.1.4. Configuração de computadores e do servidor de processamento

3.1.4.1. Instalação de sistema operacional, GPUs e configuração da rede interna

3.1.4.2. Instalação de bibliotecas e pacotes de software

3.1.5. Gestão estratégica OKR

3.1.6. Gestão de pessoas

3.2. Documentação

3.2.1. Relatório de acompanhamento

3.3. Pesquisa

3.3.1. Atualização sobre o estado-da-arte

3.3.1.1. Extração de dados estruturados partir de imagens de tabelas

3.3.1.2. Aprendizado de máquina para anotação de documentos

3.3.1.3. Ligação de entidades nomeadas

3.3.1.4. Visualização exploratória de coleções de textos

3.3.2. Finalização de dissertações de mestrado

3.3.2.1. The information bottleneck theory of deep learning

3.3.2.2. From Documents to Entities: A journey through Natural Language Processing tasks and domains

3.3.3. Proposta e avaliação de novos métodos

3.3.3.1. Análise visual de documentos

3.3.3.2. Anotação semi-supervisionada de documentos

3.3.3.3. Ligação de entidades

3.3.3.4. Desenvolvimento de processo de visualização para apoiar tarefas de mineração de textos do DODF

3.3.4. Recuperação de Informação

3.3.4.1. Técnicas de exploração de dados textuais

3.3.4.2. Técnicas de Busca de dados textuais

3.4. Produto

3.4.1. Atualização da ferramenta de anotação semi-automática do DODF

3.4.2. Atualização da biblioteca de extração

3.4.3. Atualização do front end

3.4.4. Classificação de páginas usando análise visual

3.4.5. Atualização e correção de corpora em português com termos específico do domínio jurídico

3.5. Disseminação de Resultados

3.5.1. Atualização da web page do projeto

3.5.1.1. Atualização das páginas com recursos criados pelo projeto

3.5.2. Apresentações e publicações de dissertações de mestrado

3.5.2.1. The information bottleneck theory of deep learning

3.5.2.2. From Documents to Entities: A journey through Natural Language Processing tasks and domains

3.5.3. Workshop KnEDLe 3

4. Release 4

4.1. Viabilidade Técnica

4.1.1. Acompanhamento de métricas e indicadores

4.1.2. Gestão de riscos

4.1.3. Gestão estratégica OKR

4.1.4. Gestão de pessoas

4.2. Documentação

4.2.1. Relatório de acompanhamento

4.3. Pesquisa

4.3.1. Atualização sobre o estado-da-arte

4.3.1.1. Análise de imagens de documentos

4.3.1.2. Aprendizado de máquina para anotação de documentos

4.3.1.3. Ligação de entidades nomeadas

4.3.1.4. Visualização de tópicos extraídos de coleções de textos

4.3.2. Escrita de artigos cientificos

4.3.3. Continuação do trabalho com novos métodos

4.3.3.1. Análise de imagens de documentos

4.3.3.2. Ligação de entidades

4.3.3.3. Anotação semi-supervisionada de documentos

4.4. Produto

4.4.1. Ranque de entidades candidatas

4.4.2. Detecção de entidades não mencionáveis

4.4.3. Atualização da ferramenta de anotação semi-automática do DODF

4.4.4. Atualização da biblioteca de extração

4.4.5. Atualização do front end

4.4.6. Atualização e correção de corpora em português com termos específico do domínio jurídico

4.4.7. Classificação visual incremental de textos do DODF

4.5. Disseminação de Resultados

4.5.1. Atualização da web page do projeto

4.5.1.1. Atualização das páginas com recursos criados pelo projeto

4.5.2. Apresentações de trabalhos em congressos internacionais

4.5.3. Submissão de artigos para periódicos internacionais

4.5.4. Workshop KnEDLe 4

5. Release 5

5.1. Viabilidade Técnica

5.1.1. Acompanhamento de métricas e indicadores

5.1.2. Gestão de riscos

5.1.3. Gestão estratégica OKR

5.1.4. Gestão de pessoas

5.2. Documentação

5.2.1. Relatório de acompanhamento

5.3. Pesquisa

5.3.1. Atualização sobre o estado-da-arte

5.3.1.1. Análise de imagens de documentos

5.3.1.2. Aprendizado de máquina para anotação de documentos

5.3.1.3. Ligação de entidades nomeadas

5.3.1.4. Visualização de textos para reconhecimento e ligação de entidades nomeadas

5.3.2. Desenvolvimento de experimentos complementares

5.3.3. Escrita de artigos cientificos

5.3.4. Novos métodos

5.3.4.1. Análise visual de documentos

5.3.4.1.1. Detecção e reconhecimento de estruturas

5.3.4.1.2. Detecção de palavras chave

5.3.4.2. Anotação semi-supervisionada de documentos

5.3.4.3. Ligação de entidades

5.3.4.3.1. Detecção de anomalias

5.3.4.3.2. Detecção de fraude

5.3.4.4. Visualização de textos do DODF para apoiar o reconhecimento e ligação de entidades nomeadas

5.4. Produto

5.4.1. Atualização da ferramenta de anotação semi-automática do DODF

5.4.2. Atualização da biblioteca de extração com novas funcionalidades geradas pela frente de pesquisa

5.4.3. Atualização do front end

5.4.4. Corpus com anotações para detecção de anomalia em grafos

5.4.5. Visualização exploratória para apoiar mineração de textos do DODF

5.5. Disseminação de Resultados

5.5.1. Atualização da web page do projeto

5.5.1.1. Atualização das páginas com recursos criados pelo projeto

5.5.2. Apresentações de trabalhos em congressos internacionais

5.5.3. Workshop KnEDLe 5

6. Release 6

6.1. Viabilidade Técnica

6.1.1. Acompanhamento de métricas e indicadores

6.1.2. Gestão de riscos

6.1.3. Gestão estratégica OKR

6.1.4. Gestão de pessoas

6.2. Documentação

6.2.1. Relatório final

6.3. Pesquisa

6.3.1. Desenvolvimento de experimentos finais

6.3.2. Escrita de artigos cientificos

6.4. Produto

6.4.1. Versão final da biblioteca

6.4.1.1. Biblioteca contento todas funcionalidades geradas no projeto

6.4.2. Sistema online que demonstra diversas funcionalidades da biblioteca de software desenvolvida

6.5. Disseminação de Resultados

6.5.1. Versão final da web page do projeto

6.5.1.1. deve ficar no ar por pelo menos mais 3 anos

6.5.2. Apresentações de trabalhos em congressos internacionais

6.5.3. Submissão de artigos para periódicos internacionais

6.5.4. Workshop final do KnEDLe, com ampla divulgação