O novo acordo ortográfico e os correctores automáticos

O novo acordo ortogr?fico e os correctores autom?ticos

Helena Figueira, Afonso Mendes, Pedro Mendes, Cl?udia Pinto

Priberam Alameda D. Afonso Henriques, 41 - 2.? Esq.

1000-123 Lisboa, Portugal Tel.: +351 21 781 72 60 Fax: +351 21 781 72 79

{hgf, amm, prm, cp}@priberam.pt

Resumo

A an?lise que neste artigo se pretende fazer centra-se na aplica??o pr?tica das novas regras ortogr?ficas decorrentes do Acordo Ortogr?fico de 1990 em programas inform?ticos, como o FLiP ou o Novo Corretor Aur?lio, que incluem correc??o ortogr?fica e sint?ctica, e n?o tanto na pol?mica relativa aos aspectos positivos ou negativos do referido acordo, nem no seu impacto cultural, social ou econ?mico. Pretende-se apresentar alguns dos casos problem?ticos na implementa??o da nova ortografia na correc??o ortogr?fica e examinar tamb?m o impacto desta implementa??o em variados recursos lingu?sticos ou em m?dulos que podem ser integrados noutros produtos e servi?os.

Palavras-chave L?ngua portuguesa, ortografia, acordo(s) ortogr?fico(s), correc??o ortogr?fica.

1. Introdu??o

O "Acordo Ortogr?fico da L?ngua Portuguesa"1, assinado em 1990 pela Academia das Ci?ncias de Lisboa, Academia Brasileira de Letras e delega??es de Angola, Cabo Verde, Guin?-Bissau, Mo?ambique e S?o Tom? e Pr?ncipe, com a ades?o da delega??o de observadores da Galiza, passadas quase duas d?cadas, e ap?s a ratifica??o pelo Brasil (2004), por Cabo Verde (2006) e por S?o Tom? e Pr?ncipe (2006), teve a sua ratifica??o por Portugal publicada em 29 de Julho de 2008 no Di?rio da Rep?blica. Este documento resulta das altera??es feitas ao Acordo Ortogr?fico de 1986 (texto ? data veementemente contestado e discutido, sobretudo em Portugal2), atendendo assim a cr?ticas e reac??es que ent?o emergiram.

O presente artigo tem por intuito debater algumas quest?es que n?o s?o, geralmente, afloradas em discuss?es sobre o assunto, seja pela superficialidade ou pela paix?o com que o tema ? abordado, seja por manifesto desinteresse ou por desconhecimento3. No entanto, no ?mbito do trabalho que a Priberam vem realizando na ?rea do processamento da l?ngua natural (PLN)4, faz todo o sentido questionar em que medida as novas regras ortogr?ficas ir?o afectar o comportamento de correctores ortogr?ficos para o portugu?s de norma europeia, nomeadamente o FLiP, e para o portugu?s de norma brasileira, nomeadamente o Novo Corretor Aur?lio, ou ainda relativamente a produtos futuros, como pacotes de ferramentas lingu?sticas destinados a escreventes das diversas variedades africanas do portugu?s. O impacto ser? sentido com mais visibilidade pelos in?meros utilizadores da vers?o portuguesa do Microsoft Office.

1 Aprovado, para ratifica??o, na Assembleia da Rep?blica Portuguesa a 4 de Junho de 1991 e publicado a 23 de Agosto de 1991 em Di?rio da Rep?blica. O texto oficial anotado pela Priberam est? dispon?vel em . 2 Ver Castro et al. (1987) e A Quest?o do "Acordo Ortogr?fico" (1988). 3 A este respeito, ? de referir o debate realizado a 31 de Janeiro de 2008 na Casa Fernando Pessoa, com a participa??o dos escritores Jos? Eduardo Agualusa e Vasco Gra?a Moura, dos linguistas Ivo Castro e Jo?o Malaca Casteleiro e do editor Nelson de Matos, transmitido no programa Escrita em Dia, da Antena 1, nos dias 6 e 13 de Fevereiro de 2008. A audi??o do programa, dispon?vel em , permite constatar que se mant?m, embora menos marcadamente, o mesmo tipo de cr?ticas de que foi alvo o texto de 1986, as quais eram essencialmente de cariz lingu?stico, geopol?tico, purista ou nacionalista. 4 Sobre o desenvolvimento de ferramentas para PLN , levado a cabo pela Priberam, ver Amaral et al. (2003).

Como considera??o preliminar, ? pertinente estabelecer conceitos operat?rios de ortografia, erro ortogr?fico e norma (ver sec??o 1.1). Em seguida, analisa-se a problem?tica da correc??o ortogr?fica em que se inserem os correctores ortogr?ficos do FLiP e do Novo Corretor Aur?lio, cujo modo de funcionamento se descreve resumidamente (ver sec??o 2). Segue-se uma discuss?o da aplica??o do Acordo Ortogr?fico de 1990 aos correctores ortogr?ficos da Priberam (ver sec??o 3), referindo-se os casos mais problem?ticos na implementa??o (ver sec??o 3.1). Por fim, examina-se o impacto desta implementa??o em recursos lingu?sticos ou em m?dulos que podem ser individualizados e integrados noutros produtos e servi?os, a necessidade de cria??o de uma ferramenta de convers?o de texto para a nova ortografia e ainda a possibilidade de cria??o de produtos destinados a outras variedades de portugu?s (ver sec??o 3.2).

1.1. Ortografia, erro ortogr?fico e norma

A linguagem escrita, contrariamente ? linguagem oral, n?o ? adquirida por exposi??o a textos escritos, antes resulta de aprendizagem5, isto ?, de alfabetiza??o. Atrav?s de processos de repeti??o, de leitura e de memoriza??o h? uma aprendizagem formal, geralmente institucionalizada, da representa??o gr?fica da oralidade. Tal representa??o obedece a regras convencionadas, algumas das quais adquiridas de forma expl?cita.

Para a defini??o de um conceito de ortografia pode partir-se da consulta de um dicion?rio: "forma correcta de escrever as palavras; parte da gram?tica que ensina a escrever correctamente as palavras de uma l?ngua"6. Constitui ent?o a ortografia apenas a parte da l?ngua mais convencionada e menos natural, que corresponde ? forma gr?fica que esta assume nos seus suportes escritos. Esta considera??o ? tanto mais importante quanto ? falso o argumento, tantas vezes invocado, de que um acordo que pretenda uma "ortografia unificada" pretende tamb?m uma l?ngua unificada.

Sendo um compromisso convencionado entre a fon?tica e a tradi??o gr?fica, relacionada muitas vezes com a etimologia7, a ortografia foi objecto de avan?os e recuos, aproxima??es e distanciamentos na sua rela??o com a fon?tica e com a etimologia8 e ? sobre este movimento que muitas vezes recaem as opini?es e os argumentos apresentados em debates sobre o assunto. N?o nos pareceu prof?cuo fazer aqui uma cronologia da ortografia portuguesa9, mas ? importante verificar que muitos dos argumentos usados ao longo da hist?ria da ortografia portuguesa10 se repetem actualmente, para um e outro lado da argumenta??o.

Por outro lado, "a ortografia, ?ci?ncia de escrever dereitamente? [...], ? ci?ncia ?rida que todos aprendemos a desamar. Numa ?poca em que a mentalidade est? ?convertida? para uma valoriza??o quase exclusiva da intelig?ncia anal?tica e criadora [...] torna-se dif?cil de aceitar um estudo assente na mem?ria visual e auditiva, apresentado por vezes de uma forma agressiva e desencarnado de um contexto ideol?gico"11, sendo contudo "a bitola de uma certa efici?ncia e categoria sociais"12. Mais do que isto, a ortografia contempor?nea, sendo uma conven??o estabelecida e estabilizada, ? uma das partes menos problem?ticas da gram?tica, talvez a ?rea da l?ngua cujas d?vidas permitem respostas mais perempt?rias em termos de correc??o13. O reflexo deste facto ? o espa?o reduzido que a ortografia ocupa nas gram?ticas, uma vez que n?o h? margem para grande problematiza??o sobre algo previamente convencionado.

No caso da l?ngua portuguesa, a ortografia ? o ?nico aspecto em que h? uma regulamenta??o expl?cita atrav?s de textos legais. Presentemente, e no caso da norma europeia, at? 29 de Agosto de 2008 estavam em vigor dois textos legais, o Decreto n.? 35 228, de 8 de Dezembro de 194514 e a sua altera??o pelo artigo ?nico do Decreto-Lei n.? 32/73 de 6 de Fevereiro de 197315. A norma onom?stica est? regulamentada pelo Decreto-Lei n.? 131/95, de 6 de Junho, alterado pelo Decreto-Lei n.? 36/97, de 31 de

5 Ver Delgado-Martins (1996). 6 PRIBERAM, "ortografia", in Priberam - L?ngua Portuguesa On-line [em linha], 2008, [consultado em 2008-07-28]. 7 Em Castro et al. (1987: p. 37) afirma-se que "[...] a generalidade dos especialistas que se t?m ocupado de quest?es ortogr?ficas considera que, numa l?ngua de cultura com uma longa tradi??o gr?fica, como ? o caso do portugu?s, um sistema ortogr?fico ?, necessariamente, um compromisso mais ou menos equilibrado entre etimologia, tradi??o gr?fica e crit?rio fon?tico". 8 Sobre este assunto, ver Marquilhas (1987) e Mateus (2002). 9 Ver Cuesta e Luz (1971), Gon?alves (2003), Marquilhas (1987, 2000) e Tavani (1987). 10 Ver Gon?alves (2003). 11 Mateus (2002: pp. 92-93). 12 Mateus (2002: p. 93). 13 Nos servi?os de consultoria lingu?stica, como o que disponibiliza a Priberam em , este ? o ?mbito em que, estatisticamente, as respostas s?o mais curtas e dos poucos em que podem ser categ?ricas. 14 O texto oficial anotado pela Priberam est? dispon?vel em . 15 Dispon?vel em .

Janeiro16. No caso da norma brasileira, vigorava o Formul?rio Ortogr?fico17, aprovado pela Academia Brasileira de Letras em Agosto de 1943, com altera??es de 1971, pela Lei n? 5.765, de 18 de Dezembro18.

Acresce a estes dados a realidade portuguesa relativamente ? pol?tica lingu?stica, uma vez que n?o h?, em Portugal, uma institui??o com fun??es efectivas na defini??o de norma ou na normaliza??o lingu?stica. A este respeito, ? interessante verificar a posi??o da Academia das Ci?ncias de Lisboa, que, ao contr?rio, por exemplo, das cong?neres espanhola e francesa, ? uma "institui??o interdisciplinar"19, que n?o se assemelha ?quelas, que "nasceram s? para o estudo das [respectivas] L?nguas", como refere Pina Martins, Presidente da Academia ? data do seu pref?cio ao Dicion?rio da L?ngua Portuguesa Contempor?nea da Academia das Ci?ncias de Lisboa.

A par do que foi dito, ? de referir que "n?o se pode pensar no uso de uma l?ngua em termos de ?certo? ou ?errado? e em variante regional ?melhor? ou ?pior? [...]. No ensino da l?ngua escrita, contudo, procura-se neutralizar as marcas identificadoras de cada grupo social, a fim de atingir um padr?o ?nico abstrato e idealizado que seja supranacional."20 ? neste ?mbito da escrita, e sobretudo na ortografia, ligada a fen?menos socioculturais, que mais facilmente se chega ? determina??o do erro, enquanto desvio relativamente a uma norma21 e ao que ? considerado correcto, pois a norma ortogr?fica, dada a sua estabilidade, deve estar menos sujeita ? variabilidade e ? subjectividade, e n?o implica ju?zos lingu?sticos, mas apenas o respeito por uma conven??o. A no??o de erro ortogr?fico ? ent?o muito clara para o utilizador da l?ngua, uma vez que tem como refer?ncia um sistema r?gido, adquirido pela escolariza??o e objecto de legisla??o.

Ao contr?rio das no??es de ortografia e de erro ortogr?fico, a no??o de norma ? bem mais flutuante, sendo um termo gen?rico que pode incluir os crit?rios que regulam aquilo que ? considerado por um grupo maiorit?rio como linguisticamente correcto ou uma variante lingu?stica mais prestigiada sociocultural ou politicamente. Consultando novamente um dicion?rio geral de l?ngua, pode encontrar-se uma defini??o vaga de norma como "aquilo que ? de uso geral, relativamente ? l?ngua"22. Esta formula??o, obviamente n?o espec?fica, permite m?ltiplas leituras, sobretudo no que diz respeito ao que ? um uso geral, se nacional, se regional, se sociocultural, pressupondo necessariamente a (co)exist?ncia de v?rias normas, ainda que a norma ortogr?fica seja prescritiva e convencionalmente estabelecida. E, se para a escrita ? relativamente mais f?cil encontrar refer?ncias relativamente ? norma, para a pron?ncia estas refer?ncias s?o escassas e resumem-se aos (raros) dicion?rios com transcri??o fon?tica23 e ?s indica??es de orto?pia em dicion?rios24 e vocabul?rios25.

Para um corrector ortogr?fico, no entanto, a sinaliza??o do erro ortogr?fico tem de corresponder a um conceito operat?rio que permita um equil?brio entre crit?rios lingu?sticos, o respeito pela norma ortogr?fica, as exig?ncias dos utilizadores e as limita??es do PLN. Este equil?brio, j? dif?cil a priori, torna-se mais dif?cil perante altera??es ortogr?ficas significativas, sobretudo se o texto que as regula for amb?guo ou incongruente, principalmente num contexto de aus?ncia de obras de refer?ncia autorizadas.

2. Correc??o ortogr?fica

? nos primeiros anos de escolaridade que o aprendente se depara com a no??o de erro em geral, e de erro ortogr?fico em particular, em actividades como a realiza??o de ditados, por exemplo. Inerente a ela est? a no??o de correc??o (e a de correctivo, em ?pocas mais distantes). A ideia da detec??o de erros ortogr?ficos e da respectiva correc??o ? introduzida no primeiro contacto com a alfabetiza??o, mantendo-se mais ou menos presente ao longo da vida.

A correc??o ortogr?fica, nomeadamente a tipogr?fica, foi durante muito tempo apenas feita manualmente e sobre papel, mas a prolifera??o de textos electr?nicos criou a necessidade de outras formas de correc??o mais potentes e mais autom?ticas.

16 Sobre regulamenta??o dos nomes pr?prios, ver Castro (2003). 17 Dispon?vel em . 18 Dispon?vel em . 19 Dicion?rio da L?ngua Portuguesa Contempor?nea da Academia das Ci?ncias de Lisboa (2001: ix). 20 Ver Leite e Callou (2002: p. 57). 21 Sobre varia??o e norma, ver Mateus (2005) e Castro (2003). 22 PRIBERAM, "norma", in Priberam - L?ngua Portuguesa On-line [em linha], 2008, [consultado em 2008-07-28]. 23 Para o portugu?s europeu, em dicion?rios monolingues, ver Dicion?rio da L?ngua Portuguesa Contempor?nea da Academia das Ci?ncias de Lisboa (2001), Grande Dicion?rio L?ngua Portuguesa (2004) e Dicion?rio Gramatical de Verbos Portugueses (2007); em dicion?rios bilingues, ver sobretudo Grande Dicion?rio Portugu?s/Franc?s (1998) e Dicion?rio Verbo Portugu?s-Ingl?s (2000). 24 Para o portugu?s europeu, ver Houaiss (2002). 25 Para o portugu?s europeu, ver Gon?alves (1966) e Machado (2001).

Em termos de PLN, foi na d?cada de 70 do s?c. XX que se assistiu ao surgimento dos primeiros auxiliares inform?ticos de correc??o ortogr?fica26. Na sua fase inicial, os programas eram essencialmente verificadores ortogr?ficos, pois detectavam erros mas n?o apresentavam sugest?es de correc??o27, s? mais tarde evoluindo para correctores ortogr?ficos, que geralmente fornecem sugest?es para os erros detectados. Em menos de uma d?cada, os programas de correc??o ortogr?fica passaram a ser disponibilizados em processadores de texto, que conheceram nas d?cadas de 80 e 90 do s?culo passado franca expans?o. No in?cio do s?c. XXI, os correctores ortogr?ficos, cada vez mais robustos e sofisticados, cont?m j? verifica??o autom?tica e disp?em de op??es de correc??o autom?tica bastante seguras, podendo tamb?m ser encontrados em web browsers, servidores de correio electr?nico online ou s?tios de alojamento de blogues.

Na correc??o de um texto electr?nico h? a considerar diversos n?veis: ortogr?fico, sint?ctico e estil?stico. Sumariamente, um programa de correc??o ortogr?fica permite a detec??o de diferentes tipos de erros ortogr?ficos28, a saber, lingu?sticos ou cognitivos (ex.: *an?lize / an?lise), tipogr?ficos ou de digita??o (ex.: *casamneto / casamento) e de transmiss?o (ex.: confus?o de ? com c ou de rn com m, num texto digitalizado).

2.1. FLiP e Novo Corretor Aur?lio

Comercializado desde 1995, o FLiP ? Ferramentas para a L?ngua Portuguesa ? tem vindo a afirmar-se nos mercados portugu?s e internacional como uma ajuda indispens?vel ? escrita em computador ou ? revis?o de texto electr?nico de diversas origens, como o texto resultante de digitaliza??o por reconhecimento ?ptico de caracteres (ROC).

As ferramentas FLiP t?m como antecedente o corrector ortogr?fico Lince29, surgido em 1994, e que constituiu o primeiro corrector ortogr?fico comercializado para o portugu?s europeu. A primeira vers?o do FLiP, de 1995, continha um corrector ortogr?fico, um dicion?rio de sin?nimos e um hifenizador. A segunda vers?o, o FLiP 97, passou a incluir o primeiro corrector sint?ctico para o portugu?s.

A gama FLiP ? hoje constitu?da por um conjunto diversificado de produtos, dispon?veis para v?rias plataformas (Windows, Mac) e aplica??es (Office, InDesign, Milenium, etc.), tanto para o portugu?s europeu como para o portugu?s do Brasil. Alguns dos componentes do FLiP foram licenciados pela Microsoft para serem inclu?dos na vers?o portuguesa do Microsoft Office desde a vers?o XP.

Na presente vers?o do pacote de ferramentas lingu?sticas FLiP 630, est?o inclu?dos, para o portugu?s europeu, um corrector ortogr?fico, um corrector sint?ctico e estil?stico, oito dicion?rios tem?ticos, um hifenizador, um dicion?rio de sin?nimos, um conjugador de verbos, quatro auxiliares de tradu??o e um editor de texto, bem como correctores ortogr?ficos para alem?o, espanhol, franc?s, ingl?s e italiano.

Actualmente, o corrector ortogr?fico da Priberam est? integrado nos blogues do Sapo31. Al?m da correc??o ortogr?fica e sint?ctica, a tecnologia FLiP e os seus componentes t?m sido usados em diversas ?reas do PLN a que a Priberam se dedica, como seja na indexa??o do LegiX32, na ?rea de motores de pesquisa (atrav?s da participa??o nos projectos TRUST33 e MCAST34), na ?rea da recolha de informa??o em respostas a perguntas (atrav?s da participa??o no CLEF35), na ?rea da extrac??o de informa??o (sistema de pesquisa nos sites da TSF36 e do JN37) ou na ?rea do processamento de fala

26 Ver Peterson (1980). 27 O primeiro verificador ortogr?fico usava um dicion?rio com as 10 000 palavras mais comuns em l?ngua inglesa e remonta a 1961 (cf. ); ver Earnest (1963). 28 Para uma tipologia de erros ortogr?ficos e uma breve an?lise das estrat?gias envolvidas na sua correc??o em PLN, veja-se Medeiros (1995: pp. 60-107). 29 Ver Andrade (1992). 30 Est? dispon?vel em uma vers?o de demonstra??o que apresenta algumas das funcionalidades do FLiP. 31 Ver . 32 LegiX ? um conjunto de ferramentas de informa??o jur?dica da Priberam; ver legix.pt para mais informa??o. 33 TRUST ? Text Retrieval Using Semantic Technologies ? foi um projecto co-financiado pela Comiss?o Europeia (IST-199956416), com vista ao desenvolvimento de um motor de pesquisa multilingue, capaz de responder a perguntas em l?ngua natural, formuladas em ingl?s, franc?s, italiano, polaco e portugu?s. 34 M-CAST ? Multilingual Content Aggregation System based on TRUST Search Engine ? foi um projecto co-financiado pela Comiss?o Europeia (EDC 22249 M-CAST), com vista ao desenvolvimento de uma infra-estrutura multilingue que permitisse aos produtores de conte?dos pesquisar, consultar e integrar recursos de vastas colec??es multilingues de textos (e multim?dia), tais como bibliotecas digitais, recursos de editoras, ag?ncias de not?cias e bases de dados de publica??es cient?ficas (). 35 CLEF ? Cross Language Evaluation Forum ? ? um projecto de avalia??o internacional, financiado pelo 6? Programa Quadro da Comiss?o Europeia, que visa promover a investiga??o na ?rea dos sistemas multilingues (). Sobre a participa??o da Priberam na campanha de Question Answering do ?ltimo CLEF, veja-se Amaral et al. (2007). 36 Ver . 37 Ver .

(atrav?s da participa??o no projecto Tecnovoz38). O desempenho nestas ?reas tem assim sido testado e avaliado exaustivamente, com vista ? consequente melhoria das suas capacidades.

No final dos anos 90 do s?c. XX, a Priberam adquiriu um l?xico que seria o ponto de partida para as ferramentas do portugu?s do Brasil. As primeiras vers?es do corrector ortogr?fico e do hifenizador para portugu?s do Brasil foram integradas no sistema Unisys' Hermes e s?o usadas desde 2001 por O Estado de S?o Paulo39, um dos maiores jornais do Brasil.

O primeiro produto espec?fico apenas para o portugu?s do Brasil foi o FLiP:mac Brasil40 (2003), seguindo-se o FLiP Brasil (2004) e o Novo Corretor Aur?lio (2007). Presentemente, as ferramentas lingu?sticas da Priberam para o portugu?s do Brasil incluem um corrector ortogr?fico, um corrector sint?ctico e estil?stico, oito dicion?rios tem?ticos, um hifenizador, um dicion?rio de sin?nimos e ant?nimos e um conjugador verbal. Ainda que os recursos lingu?sticos sejam diferentes, estas ferramentas baseiam-se no software que a Priberam vem desenvolvendo h? mais de 15 anos.

Contrariamente ao que sucede com o l?xico, que ? individualizado para o portugu?s europeu e para o portugu?s do Brasil, a estrutura b?sica da gram?tica ? partilhada pelos correctores sint?cticos da variedade portuguesa e da variedade brasileira. Tal acontece porque, salvaguardadas as devidas diferen?as, a generalidade das regras sint?cticas para a escrita do portugu?s do Brasil ? semelhante ? do portugu?s europeu e porque os mesmos fen?menos ocorrem em ambas as variedades do portugu?s, embora por vezes em diferentes registos de l?ngua. As especificidades do portugu?s do Brasil foram no entanto consideradas, nomeadamente constru??es lexicais fixas e erros ortogr?ficos com implica??es sint?cticas (por exemplo, o uso problem?tico da crase).

2.1.1. Corrector ortogr?fico: modo de funcionamento

O corrector ortogr?fico tem como objectivo detectar erros de ortografia e apresentar sugest?es para a sua correc??o. O funcionamento do corrector ortogr?fico do FLiP baseia-se na compara??o das palavras utilizadas num documento com uma lista de palavras (designada por dicion?rio) reconhecidas pelo m?dulo de correc??o ortogr?fica41. O conjunto das palavras conhecidas pelo corrector ortogr?fico ? constitu?do pela reuni?o da lista de palavras geral, das listas de palavras dos dicion?rios tem?ticos42 seleccionados e das palavras adicionadas aos dicion?rios de utilizador43 activos. Se uma determinada palavra n?o for reconhecida, esta ? assinalada como errada e s?o apresentadas sugest?es para a sua correc??o.

Nas vers?es mais recentes da maioria das aplica??es da Microsoft, a verifica??o ortogr?fica ? feita automaticamente enquanto se escreve. Neste caso, os erros ortogr?ficos aparecem sublinhados a vermelho. Clicando sobre a palavra assinalada, geralmente com o bot?o do lado direito do rato, o utilizador poder? seleccionar uma das sugest?es de substitui??o, ignorar a palavra ou adicion?-la ao dicion?rio de utilizador. Normalmente, ser? seleccionada uma das sugest?es apresentadas para substituir a palavra incorrecta que se encontra no documento. As sugest?es s?o apresentadas por ordem decrescente de probabilidade de se tratar da palavra correcta. Na ordena??o das sugest?es s?o considerados factores como a semelhan?a fon?tica, a semelhan?a gr?fica (importante em textos digitalizados com ROC), adjac?ncias no teclado e frequ?ncia das palavras.

O corrector ortogr?fico n?o se limita a assinalar erros ortogr?ficos, mas veicula op??es no reconhecimento de palavras. Assim, o corrector pode assinalar como desconhecidas palavras dicionarizadas que deliberadamente n?o quer ver reconhecidas, como palavras obsoletas ou de baixa frequ?ncia cujo reconhecimento pode mascarar erros em palavras muito comuns (ex.: demostra??o/demonstra??o, gustar/gostar, trenador/treinador) ou palavras tabu?sticas ou ofensivas (ex.: cagar, merda, puta)44.

38 O projecto Tecnovoz pretende desenvolver novas compet?ncias nas tecnologias da fala (). 39 Ver . 40 Ver . 41 A inclus?o de novos voc?bulos, seja por sugest?o de utilizadores, seja por pesquisas em corpora, quando n?o atestados, ? efectuada se a sua forma??o respeitar as regras ortogr?ficas e morfol?gicas da l?ngua portuguesa e se consagrados pelo uso. Os neologismos, estrangeirismos e aportuguesamentos pol?micos ou muito recentes s?o, em geral, exclu?dos, at? se tornarem consagrados pelo uso e/ou registo lexicogr?fico. 42 Os dicion?rios tem?ticos s?o listas de palavras agrupadas por dom?nios t?cnicos ou cient?ficos; ver . 43 Um dicion?rio de utilizador permite adicionar palavras n?o reconhecidas ? lista de palavras reconhecidas pelo corrector ortogr?fico do FLiP. 44 Na aprecia??o que fez do FLiP 5, Fernando Ven?ncio critica esta op??o: "Quando os dicion?rios j? cont?m vulgarismos sexuais e escatol?gicos, a Priberam mant?m-se invulgarmente virginal. Por convic??es morais? Longe disso. Trata-se de uma exig?ncia da Microsoft, que n?o deseja ter de apresentar alternativas disf?ricas. E, assim, tendo voc? grafado ?cavalho?, o programa sup?e-lhe a

................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download