A Strategy for Selecting Classes of Symbols from Classes of Graphemes in HMM-Based Handwritten Word Recognition

Cinthia O. A. Freitas, Flávio Bortolozzi, Robert Sabourin

Resumo


Este artigo descreve uma metodologia para seleção de classes de símbolos a partir de classes
de grafemas em um sistema de reconhecimento de palavras manuscritas do extenso de cheques bancários
brasileiros baseado em HMM (Hidden Markov Models). Este artigo discute as definições de primitivas,
grafemas e símbolos considerando um enfoque Global para o reconhecimento das palavras, o qual evita a
segmentação das palavras em letras ou pseudo-letras utilizando HMM. Assim, a entrada para os modelos
consiste em uma descrição da palavra a partir de um alfabeto de símbolos gerados a partir dos grafemas
extraídos das imagens das palavras, sendo esta a representação visível para o HMM. Portanto, a idéia é
introduzir uma conceituação de alto nível, tais como primitivas perceptivas (laços, ascendentes,
descendentes, concavidades e convexidades) e fornecer um modo de retro-alimentação rápido e informativo
sobre a informação contida em cada classe de grafema, permitindo uma seleção de classes de símbolos. O
artigo apresenta o algoritmo com base na Informação Mútua (Mutual Information) e HMM, ambos
trabalhando em um mesmo processo de avaliação. Os resultados experimentais demonstram que é possível
selecionar a partir de um conjunto “original” de grafemas (composto por 94 grafemas) um alfabeto de
símbolos (composto por 29 símbolos). O artigo conclui que o poder discriminante dos grafemas é muito
importante para a consolidação de um alfabeto de símbolos.

Palavras-chave


Primitivas; Informação Mútua; HMM; Reconhecimento de Palavras

Texto completo:

PDF (English) PDF


DOI: https://doi.org/10.21529/RESI.2004.0301003