Linhas de Orientação Calimera



Linhas de Orientação Calimera

Multilingualismo | |

|OBJECTIVOS |

Os assuntos tratados nesta linha de orientação incluem:

Línguas europeias

Inclusão social

Mímica

Recuperação da informação

Thesauri multilingue

Websites multilingue

Documentos originais

Tipos de letras e teclados

Transliteração, transcrição e ficheiros de autoridade

Máquina de tradução

Tradução voz a voz

|TEMAS RELATIVOS À POLITICA |

Voltar aos objectivos

“A linguagem é a base da comunicação entre o povo e é também parte dos seu património cultural. Para muitos a língua tem associações grandemente emotivas e culturais e valores enraizados na sua literacia e na sua herança de património histórico, filosófico e educacional. Por esta razão a linguagem dos utilizadores não deveria ser um obstáculo no acesso ao património multicultural, disponível no espaço cibernético. Por isso, o desenvolvimento harmonioso da sociedade de informação só é possível, se a disponibilidade da informação multilingue e multicultural for encorajada. [1].

O artigo 12 da Carta Europeia para as Linguagens Regionais ou Minoritárias [2] relaciona-se especialmente, com actividades culturais e facilidades - “especialmente bibliotecas, bibliotecas de vídeos, centros culturais, museus, arquivos, academias, teatros e cinemas, bem como trabalho literário e produção de filmes, formas vernáculas de expressão cultural, festivais e indústrias culturais, incluindo entre todas o uso das novas tecnologias”. Os signatários a este (por exemplo os estados membros do Conselho da Europa) “Encarregaram-se de tomar as medidas apropriadas …para as linguagens regionais ou minoritária es as culturas que elas reflectem”.

As instituições culturais desejariam poder alcançar um público, tão vasto quanto possível. Os websites podem chegar a um público global e estima-se que haja para cima de 6.000 línguas no mundo. A União Europeia está apostada na integração nos seus estados membros, mas promove também, a diversidade linguística e cultural dos seus povos, promovendo o ensino e a aprendizagem de línguas, incluindo as línguas minoritárias e regionais. O plano de acção sobre aprendizagem de linguas e a diversidade linguística para o período 2004-2006 [3], declara que “ a aprendizagem da língua é para todos os cidadãos, durante todas as suas vidas. Ter conhecimento de outras línguas, ouvir outras línguas, ensinar e aprender outras línguas:estas coisas precisam de acontecer em todas as casas e em todas as rua, em todas as bibliotecas e centros culturais, bem como em todas as instituições de educação e aprendizagem e em todos os negócios.” 2001 foi designado o Ano Europeu das Línguas [4] e as suas actividades continuam, anualmente, através da celebração do Dia Europeu das Línguas, em 26 de Setembro [5].

Os museus, as bibliotecas e os arquivos necessitam de considerar o fornecimento de serviços em:

• línguas oficiais da União Europeia;

• línguas indígenas minoritárias;

• línguas de imigrantes;

• línguas não europeias – em certo sentido isto dependerá da natureza das suas colecções e do presumível interesse fora da Europa;

• mímica

Voltar aos objectivos

Línguas Europeias

Há 20 línguas oficiais na União Europeia – Alemã, Checa, Dinamarquesa, Eslovaca, Eslovena, Espanhola, Estónia, Finlandesa, Francesa, Grega, Holandesa, Húngara, Inglesa, Italiana, Latviana, Lituana, Maltesa, Polaca, Portuguesa e Sueca. O termo “linguagem oficial” é definido como uma linguagem que pode ser usada para o relacionamento com as autoridades públicas e em documentos oficiais, incluindo documentos comerciais. Um cidadão pode escrever para uma instituição da União Europeia em qualquer destas línguas e pode receber resposta na mesma língua.

Pode encontrar-se informação acerca das linguagens regionais e ou minoritárias no website do Mercator [6], uma rede de pesquisa e um serviço de informação constituídos com o apoio da Comissão Europeia. Estima-se que haja para cima de 150 línguas minoritárias indígenas ou autóctones, dentro da União Europeia, não incluindo dialectos de qualquer das línguas oficiais ou qualquer das línguas faladas pelas comunidades de imigrantes. O Gabinete Europeu para as Línguas Menos Usadas (EBLUL) [7] estima que para cima de 40 milhões de pessoas falem, na União Europeia, uma língua, que não é a língua oficial do seu país de origem.

A Europa proporciona alguma espécie de reconhecimento a determinadas línguas minoritárias, mesmo dentro do país onde são faladas, mas não a todas. O estatuto oficial de línguas minoritárias da Europa pode encontrar-se no website Mercator [6]. Há três categorias aceites, de línguas regionais e minoritárias:

• línguas específicas a uma região, que pode estar total ou parcialmente, num ou mais estado membro. Isto respeita línguas como o Basco, o Bretão, o Catalão, o Frísio, o Galês, o Sardenho, etc.;

• línguas faladas por uma minoria, num estado, mas que são línguas oficiais noutro país da União Europeia. Esta definição abrange por exemplo, o Alemão do sul da Dinamarca, o Francês no Vale de Aosta, no norte de Itália, o Húngaro na Eslováquia, etc.;

• línguas não territoriais, tais como as das comunidades de Roma ou Judia (Romany e Yiddish), ou Arménia.

Algumas línguas minoritárias são línguas completamente desenvolvidas, de ensino cultural nas escolas, com ortografias estabelecidas, literaturas extensivas e uma grande divulgação. A outras podem faltar alguns, ou mesmo todos estes atributos e pode ser difícil tomar medidas para elas. Contudo, as minorias linguísticas indígenas tendem a não apresentar os mesmos desafios, como fazem as línguas imigrantes. Por exemplo:

• são muitas vezes totalmente bilingues e não necessitam de ensino na maioria da língua ou cultura;

• não há duvida quanto aos seus números ou permanência ou circunstância sócio-económica.

Há também, muitas línguas, não indígenas, faladas na Europa, principalmente por imigrantes. Estas incluem:

• Turco (principalmente na Bélgica, Alemanha e Países Baixos);

• Magreb Arábico (principalmente na França e Bélgica);

• Urdu, Bengali e Hindi (principalmente no Reino Unido);

• Línguas Balcãs (faladas em muitas partes da União Europeia por imigrante e refugiados que deixaram a região devido a guerras recentes e à insegurança).

Voltar aos objectivos

Inclusão social

Não há qualquer protecção oficial da União Europeia para proteger estas línguas, mas as instituições de património cultural precisarão de ser socialmente incluídas (ver as Linhas de Orientação Inclusão Social e Identidade e Coesão Cultural) e desse modo, considerar a necessidade de resolver a questão da língua. As minorias étnicas estabelecidas poderão bem ser bilingues, ou mesmo, em caso de segundas ou terceiras gerações, monolingues, na língua maioritária. As recentes vagas de imigrantes põem mais de que um problema. Tanto os museus, como as bibliotecas e os arquivos têm de conhecer as línguas usadas nas suas comunidades. Bem como fornecer um serviço em qualquer língua relevante minoritária, têm que reconsiderar também, a sua responsabilidade no modo de comentar e preservar a identidade cultural de todos os membros das suas comunidades, que pode levar à necessidade de ter de coligir materiais e a criar conteúdo, em línguas diferentes. Os serviços aos imigrantes podem envolver:

• o recrutamento de pessoal que fale a(s) língua(s), preferencialmente como falantes nativos;

• assegurar que todos os panfletos, letreiros e publicidade estejam disponíveis, em todas as línguas relevantes;

• fornecer materiais de leitura e materiais audiovisuais, em todas as línguas relevantes;

• providenciar facilidades de processamento da palavra, em todas as línguas relevantes;

• providenciar um serviço de tradução;

• propor websites, em mais que uma língua.

Voltar aos objectivos

Mímica

Esta não pode ser menosprezada. Há muitas versões diferentes de mímica e embora não reconhecida como linguagem oficial da União Europeia, uma Council of Europe's Recommendation 1598 (2003) sobre a protecção da mímica nos estados membros do Conselho da Europa encoraja os estados membros “a dar um reconhecimento formal à mímica usada no seu território” [8]. Alguns países, incluindo a Dinamarca, a Finlândia, Portugal, o Reino Unido e a Suécia, já dão reconhecimento oficial, à mímica.

|LINHAS DE ORIENTAÇÃO PARA UMA UTILIZAÇÃO CORRECTA |

Voltar aos objectivos

Estas Linhas de Orientação incidem sobre o multilingualismo na arena digital. Na prática, as organizações têm enfrentado um certo número de dificuldades na criação e manutenção de conteúdo digital multilingue e em produtos e serviços pan-europeus, para os trabalhos, em redes globais. Algumas destas dificuldades são técnicas e algumas estão relacionadas com os custos e dificuldades de tradução. Em reconhecimento a isto, a União Europeia criou uma action line, dirigida a temas multilingues no programa, estrategicamente importante, a e-Conteúdo [9].

Voltar aos objectivos

Recuperação da informação

Quanto mais digitalizado é o acesso aos recursos culturais, mais alargado o é a um público global. O desafio posto aos museus, bibliotecas e arquivos é o de assegurar o acesso a estes recursos, enquanto que ao mesmo tempo respeitam a cultura e a diversidade linguística. Vários projectos foram estabelecidos para trabalhar nesta área, incluindo o MACS (Multilingual Access to Subjects) [10].

Voltar aos objectivos

Thesauri multilingue

Um thesaurus é um conjunto de palavras controladas para a indexação de assuntos específicos de (originalmente) documentos impressos.

Um thesaurus mostrará as relações, tais como a hierarquia e a equivalência, entre as palavras que usa. Um problema importante na construção de um thesaurus, em mais de uma língua, é que as palavras de uma língua podem não abranger os mesmos campos semânticos da outra, por exemplo a palavra inglesa “teenager” abrange um campo semântico mais relativo, do que a palavra francesa “ adolescente”.

Há padrões para a compilação de thesauri e palavras equivalentes nas línguas (ver ISO 5964:1985 “Linhas de Orientação para o estabelecimento e desenvolvimento de thesauri multilingue” [11].) Este padrão é um complemento do ISO 2788:1986 [12], que abrange thesauri monolingues e que por isso não está completo, sendo que muitos dos problemas na construção dos thesauri são comuns à construção dos thesuri monolingues e multilingues. Está em progresso, uma revisão de ambos os padrões. Está planeado um novo padrão, o BS 8723: Vocabulário estruturados para a recuperação da informação – guia, para abranger tanto thesauri monolingues como multilingues. Será dividido em cinco partes, como se segue:

Parte 1: Definições, símbolos e abreviações (minuta publicada em Novembro 2004);

Parte 2: Thesauri (minuta publicada em Novembro 2004);

Parte 3: Vocabulários têm a preferência sobre os thesauri;

Parte 4: Interoperação entre vocabulários múltiplos;

Parte 5: Interoperação entre vocabulários e outros componentes de armazenagem de informação e sistemas de recuperação [13].

O Instituto de Informação Getty produziu Linhas de orientação para a Formação de Equivalentes da Língua: Um Modelo baseado no Thesaurus de Arte e Arquitectura [14] (). O capítulo sobre a construção de um thesaurus multilingue de Jean Aitchison, Alan Gilchrist [e] David Bawden: A construção de um Thesaurus e a sua utilização: um manual prático. 4ª edição. ASLIB: Londres, 2000. ISBN 0-85142-446-5 [15] é, também muito útil.

Voltar aos objectivos

Websites multilingues

“Um websit,e com qualidade, tem de estar atento à importância do multilingualismo, providenciando um nível de acesso mínimo, a mais do que uma língua” [16]. A estrutura de um website multingue ou bilingue deveria ser, cuidadosamente, tida em conta desde o princípio, pelo que o multilingualismo é uma parte essencial dele e não propriamente uma resposta tardia. O projecto MINERVA sugeriu alguns criteria para definir um website multilingue [17], sendo o grau de multilingualidade dependente do número dos que são encontrados. São:

• certo conteúdo deveria estar disponível em mais do que uma língua;

• certo conteúdo deveria estar disponível em mímica;

• certo conteúdo deveria estar disponível em línguas de imigrantes, de fora da União Europeia;

• a identidade do site e o perfil deveriam estar disponíveis em mais de uma língua;

• a funcionalidade prioritária do site (pesquisa, navegação), deveria estar disponível em mais de uma língua;

• imagens estáticas (imagens, descrições, etc.) deveriam estar disponíveis em mais de uma língua;

• a estrutura do site e a linguagem de interface do utilizador deveriam estar, logicamente separados, de modo que a base não varie com a linguagem;

• a multilingualidade deveria ser gerida por uma política formal de multilingualidade;

• o website deveria ser revisto para solucionar esta politica.

Em certos casos seria apropriado um website bilingue, oposto a um multilingue. Os websites bilingues podem ser usados:

• em países ou regiões onde haja, principalmente, linguagem minoritária, por exemplo, no País de Gales;

• dirigido a leitores de universidades, que se espera sejam indivíduos bilingues;

• dirigido a pessoas que possam falar uma ou outra de duas línguas;

• tomar como ponto social ou político, o relembrar os membros da maioria comunitária, acerca da existência de uma minoria.

Os websites multilingues serão necessários:

• em países onde há um número de línguas minoritárias indígenas;

• para ir ao encontro de minorias étnicas, incluindo imigrantes exilados, nas suas próprias línguas;

• se o conteúdo do website é passível de ser de interesse para um público pan-europeu ou global.

Há várias decisões políticas a serem feitas, que têm efeitos de longo alcance com o aparecimento do website:

• os enquadramentos podem ser difíceis, num contexto multilingue;

• é suposto que as páginas multilingue contenham uma grande quantidade de textos e possam ter uma aparência poderosa;

• alguns tipos são mais apropriados a uma língua do que a outra e é preferível usar sempre o mesmo tipo, do que parecer que uma língua é mais legível do que as outras;

• a língua de logos deve ser cuidadosamente, escolhida. O uso de uma língua minoritária num .logo, pode alienar línguas minoritárias dos utilizadores;

• haverá um papel para a tecnologia touchscreen, no projecto dos websites multilingues.

É de lembrar também, que um website multilingue não é uma opção barata, e que, à semelhança de outros websites, requererá ser actualizado e isso não será um assunto tão simples como actualizar um site monolingue.

Há um certo número de maneiras, através das quais se pode ordenar um website:

• pode ser dada, de uma vez para sempre, uma oportunidade aos utilizadores, sobre qual a língua que eles querem usar na primeira página e no caso de a desejarem mudar, poderem ter de ser forçados a voltar para aquela página. Isto pode ser apropriado em certas regulamentações, por exemplo num país, no qual são usadas duas línguas, mas de modo algum qualquer pessoa é bilingue, por exemplo no caso da Bélgica e da Suiça;

• pode-lhes ser dada a oportunidade de escolher a língua, em cada página do site. Isto pode ser feito através de um botão ou de um filing tab, que são convenções familiares para a maioria dos utilizadores da Internet. As ligações da língua deveriam estar de preferência, ao cimo da página, do que no fundo, porque essa é a parte da página mostrada por descuido, e a ligação deveria levar o utilizador exactamente, para a mesma página, mas noutra língua – não para outra parte do site. À língua dever-se-ia dar o seu nome nativo, isto é a palavra French deveria ser dita Français;

• todas as páginas podem oferecer o mesmo texto, em todas as línguas. De notar que o mesmo texto pode tomar em diferentes línguas, diferentes quantidades de espaços; normalmente um texto original deveria ser mais pequeno que a tradução;

• os sites deveriam ser assimétricos, por exemplo, certa informação pode ser relevante para os oradores de uma só língua, isto é, um clube social de galeses pode ter a sua organização de sócios, só de galeses, mas noutros aspectos pode ser bilingue.

A escolha de ordenamento pode ser afectada por:

• a que tipo de público é dirigida – pessoas que falam mais que uma língua ou pessoas que falam uma língua. Os indivíduos bilingues poderão desejar ser capazes de ver, na maioria do tempo, duas línguas, como um meio de verificação dupla de que compreendem correctamente o texto;

• num site bilingue, como são diferentes duas línguas, uma da outra. Algumas línguas são, mutuamente compreensíveis até um determinado ponto, por exemplo, o espanhol e o catalão, enquanto que outras não o são, por exemplo, o inglês e o galês. Alguns conceitos também não aparecem, de modo algum, em qualquer língua.

O website do Welsh Language Board [18] contem opiniões da School of Education, da University of Wales, de Bangor e da Escola Superior Politécnica, da Universitat Pompeu Fabra, Barcelona, no projecto de websites bilingues, incluindo recomendações quanto aos melhores modos de incorporar o bilingualismo no projecto de um website, sem dar excessiva proeminência a uma língua em detrimento de outra e evitando ofender, através do uso de símbolos emotivos, com selo político, tais como bandeiras para representar línguas, tantas quantas as faladas, em mais de um país e muitos países são bilingues.

Voltar aos objectivos

Documentos originais

Os computadores armazenam letras e outros caracteres, atribuindo um número a cada um. A enorme diversidade de línguas e documentos originais leva a centenas de diferentes sistemas de codificação para atribuição destes números.Em meados de 1980 começou a desenvolver-se o Unicode [19]. Atribui um único número de código binário a cada caracter de cada língua, sem que interesse a plataforma, o programa ou a língua. O Consórcio Unicode é uma organização não lucrativa, fundada para desenvolver, divulgar e promover o uso do padrão. O Unicode está, continuamente em expansão, mesmo hoje em dia, para incluir coisas tais, como alfabetos arcaicos como o Ogham (um antido documento Céltico) e o cuneiforme; pode copiar números, símbolos, pontuação e padrões Braille, etc. Embora, o padrão Unicode Version 4.0. 2º e o ISO/IEC 10646:2003 [21] não sejam a mesma coisa, o conjunto de caracteres, nomes e representações que contêm, são idênticos. A Unicode Version 4.0 abrange para cima de 96.000 caracteres dos escritos originais, de todo o mundo. Embora, de modo algum, o único padrão no campo, seja favorecido pela indústria IT, como a adopção de um método, tem obviamente vantagens para o mundo da comunicação, disponibilidade de software, troca de dados e publicidade. O ISO/IEC 10646:2003 tem sido, largamente adoptado na nova Internet nos protocolos W3C e nas línguas mark up, tais como XML e HTML e ainda é implementado nos modernos sistemas operativos e nas línguas de programação de computadores.

Voltar aos objectivos

Tipos de letras e teclados

Podem comprar-se pequenas tampas, que cobrem as teclas de um teclado normal, para ajudar na dactilografia de línguas, usando versões alargadas de documentos romanos, por exemplo, ð å þ ñ ç æ ć ł etc. Este método simples pode, até mesmo, possibilitar que os documentos Kanji dos japoneses sejam processados, em todo o mundo.

Teclados macios ou teclados mostrados num ecrã de toque, podem ser um modo flexível de nos relacionarmos com alguns dos problemas de escritos não românicos ou exóticos.

As línguas com milhares de caracteres, como a chinesa, requerem um software especial, antes de poderem beneficiar do processo electrónico da palavra. Para os chineses, um teclado normal usa-se para entrar numa soletração fonética de uma palavra chinesa, de acordo com o sistema Pinyin de transliteração e o software distribui esses caracteres, que são pronunciados desse modo - deve haver cerca de dez, mais ou menos. O caracter correcto ou caracteres são escolhidos e entram no documento. A escolha errada será o equivalente a um erro de pronúncia. Este sistema é muito adaptável, possibilitando que os caracteres chineses tradicionais e os simplificados sejam processados, mundialmente. O uso do sistema Pinyin significa, na verdade, que o operador tem de saber a pronúncia do chinês Mandarim ou o Pequinês, que não é necessário saber, para escrever chinês, à mão. Contudo é possível, comprar software baseado na pronúncia de Cantão [22]. O software ocupa mais espaço na memória do que o processamento da palavra de uma língua escrita no alfabeto romano, mas, em cidades onde há um considerável número de chineses, justifica-se a compra deste software e de o pôr à disposição, numa máquina destinada a esse fim. Os documentos originais arábicos apresentam menos problema, quando os teclados disponíveis, estão especialmente, adaptados.

È importante ter em conta tipos de letras, comerciais, software e teclados para computação multilingue, tais como os vendidos pelo Fingertip Software [23], que se baseiam em Unicode.

Voltar aos objectivos

Transliteração, transcrição e ficheiros de autoridade

Em muitos casos, como por exemplo para a produção de catálogos, índexes, listas toponímicas e outros trabalhos de natureza bibliográfica, que se deseja venham a ser usados por pessoas que se espera estarem familiarizadas com o alfabeto latino, ou por razões tipográficas, não seria possível ou prático usar os caracteres de um documento, não escrito em Latim. Nesse caso, a transcrição ou a transliteração será necessária.

A transliteração é um processo através do qual as letras de um sistema de escrita alfabética são convertidas em símbolos de outro sistema alfabético, por exemplo, Cirílico ou Grego para o alfabeto latino. Há problemas causados pelos sistemas alternativos de transliteração, por exemplo, Чехов pode ser transliterado para Tchehov ou Chekhov.

A transcrição é o processo, pelo qual os sons de uma língua são convertidos para símbolos de outra língua. A transcrição pode, em princípio, ser usada por sons de qualquer língua, mas é o único sistema que pode ser usado para converter os sons de línguas não alfabéticas, tais como o Chinês, para símbolos do Latim ou de quaisquer outros sistemas alfabéticos.

Na verdade, há problemas de estandardização como resultado de transliteração e transcrição. Sistemas diferentes ou variação na prática, causarão dificuldades nas pesquisas, em bases de dados. De momento, não há nenhum formato relevante para registo estandardizado de nome, que se adeque às necessidades das instituições culturais europeias, mas foi desenvolvido um protótipo, através do projecto LEAF (Linking and Exploring Authority Files) [24] patrocinado pela Comunidade Europeia em Março - 2001 a 2004. Os resultados do projecto serão implementados difundindo MALVINE, um serviço de pesquisa online para manuscritos pós-medievais, num serviço de informação global multilingue, acerca de pessoas e de órgãos cooperativos [25].

Os padrões internacionais estão a ser desenvolvidos para a transliteração de uma variedade de línguas. Por exemplo, há um padrão para a transliteração de documentos em Indi ISO 15919:2001, Transliteration of Devanagari and related Indic Scripts into Latin Characters [26].

Voltar aos objectivos

Máquina de tradução (MT)

Outrora tiveram-se, em consideração, grandes expectativas acerca da MT, mas em vista ao esforço nela dispendido nos últimos 50 anos, os resultados podem considerar-se desapontadores. A espécie de problemas, que são encontrados e que, até ao momento, tem provado serem impossíveis de solucionar é, por exemplo:

• ambiguidades nos significados de palavras;

• diferenças na ordem das palavras;

• no entanto, ainda não foi encontrado qualquer meio de dar, aos computadores, conhecimento do mundo real ou contexto ou cargo de leitor universitário.

A efectivação de sistemas MT está dependente do número de factores, isto é, os documentos devem estar livres de quaisquer erros tipográficos ou gramaticais, de palavras não existentes no dicionário do sistema, ou de falta de estruturas complexas de frases.

A MT é a aplicação de computadores, na tarefa de traduzir textos de uma língua natural para outra e, hoje em dia, inclui software que vai de programas de procura de palavras num dicionário simples, usado como um processador de palavras acrescentadas a sistemas sofisticados de certas quantidades de tradução. Aplicações possíveis para a MT incluem:

• cópia de conteúdo, isto é usar um sistema de tradução, simplesmente com o fim de obter um rascunho tosco que possa alcançar o ponto principal e geral de um texto;

• o visionar de um grande número de documentos, para identificar os que garantam uma tradução humana;

• apoiar os tradutores humanos – o software de computad de ajuda à tradução, (CAT), usa uma determinada variedade de ferramentas linguísticas, para melhorar a produtividade dos tradutores, particularmente na tradução de textos, altamente repetitivos, tais como em documentação técnica.

Há um grande número de websites que oferecem serviços de tradução, tanto gratuitos como pagos, na World Wide Web. Se um URL (Uniform Resource Locator), entra no software MT, pode traduzir uma página web e os documentos podem ser, automaticamente traduzidos. Estes sites oferecem, também muitas vezes, tradução por seres humanos, por exemplo AltaVista Babelfish, Google Language Tools, World Lingo, Free Translatione, Systran. A página Yahoo Language Translation and Interpretation Resources é uma fonte de informação útil para os sites MT [27]. O Babblefish [28] é uma saída para um bom número de serviços de tradução baseada na web, incluindo dispositivos de pesquisa na Internet.

Para ter mais informação sobre a MT, é de ver o website da European Association for Machine Translation [29].

|AGENDA FUTURA |

Voltar aos objectivos

O trabalho para estabelecer um portal multilingue para o património cultural europeu, já está em andamento. MICHAEL, o Multilingual Inventory of Cultural Heritage in Europe [30], é um prolongamento do projecto MINERVA [31]. Irá desenvolver um inventário trans--europeu do património cultural digital de Itália, da França e do Reino Unido, que será posto à disposição do público, utilizando uma plataforma de fonte livre, que irá permitir a divulgação para outros países.

A European Library [32] fomentada pelo projecto TEL, irá ser inaugurada em 2005, como um portal que oferece acesso a recursos combinados de 43 bibliotecas nacionais, da Europa. Usará MACS, de modo a permitir a recuperação da linguagem cruzada. Este tipo de serviço possibilita uma plataforma para a pesquisa de assuntos relacionados com o acesso multilingue.

Seria útil ter mais recursos centrais de materiais, em linguagens minoritárias, ao longo das linhas da Indvandrerbiblioteket da Dinamarca, um centro nacional de recursos para livros e outra media em línguas estrangeiras, para minorias étnicas, na Dinamarca. Um recurso central é, especialmente útil, onde os falantes em língua minoritária estão muito dispersos pela sociedade e não só concentrados em locais particulares, fazendo com que as provisões locais não sejam económicas.

O EC Joint Interpreting and Conference Service (SCIC – do acrónimo Francês) [33], tem como um dos seus objectivos explorar as possibilidades oferecidas pelas novas tecnologias. Estabeleceu uma unidade constituída por membros de funcionários que testam novas ferramentas de comunicação e que procuram meios de trazer o multilingualismo para canais de comunicação, tais como chats multilingues na Internet, comunicações multilingues na media e conferências virtuais multilingues.

O Cross-Language Evaluation Forum (CLEF) e o CLEF 2004 [34] fizeram uma grande quantidade de pesquisa na recuperação da informação multilingue. Espera-se que tal trabalho sirva de base para futuros desenvolvimentos.

Embora de muitas maneiras imperfeita, será útil ter alguma forma de máquina tradutora para línguas minoritárias, especialmente as faladas por minorias e não propriamente as maiores línguas da Europa.

Voltar aos objectivos

Tradução voz a voz

A tradução voz a voz é uma máquina, que traduz língua falada de uma língua para outra, sendo ainda ficção científica, mas pode ser desenvolvida num futuro, comparativamente distante. Tal instrumento envolverá a perfeição de um certo número de tecnologias complexas, cada uma das quais, presentemente, tem muitas falhas, incluindo:

• reconhecimento de voz, isto é, uma máquina que converte, exactamente, a língua falada para texto escrito;

• máquina tradutora, isto é, uma máquina que traduz texto de uma língua para outra;

• transformar o texto em fala.

O software de reconhecimento do falar comercial, que converte a fala em texto, está disponível, mas os resultados, ainda não são satisfatórios. Há 95% de meios exactos, 5% inexactos ou 5 erros em cada 100 palavras (isto é, 20 neste parágrafo). Já têm sido discutidas as falhas da tradução, através da máquina de texto para texto. Para que a máquina de tradução tenha alguma hipótese de trabalhar, o input tem de ser perfeito e todos os softwares de reconhecimento de voz geram erros. O texto pode ser convertido, com algum sucesso, em fala; esta é a única parte da tecnologia necessária que está ainda, agora, numa condição adequada.

Os desenvolvimentos futuros deveriam ser melhoramentos no acesso multilingue à nossa herança comum, através por exemplo, de inventários multilingues de conteúdo digital, ficheiros de autoridade multilingues, tradução automática online e padrões para websites multilingues.

|REFERÊNCIAS |

Voltar aos objectivos

[1] A Carta Europeia para as Línguas Regionais ou Minoritárias



[2] Diversidade Cultural e Linguística na Sociedade de Informação. UNESCO, 2003.



[3] Plano de acção na Aprendizagem da Língua e na Diversidade Linguística para 2004 – 2006



[4] Ano Europeu das Línguas



[5] O Dia Europeu das Línguas



[6] Mercator

[7] Gabinete Europeu para Línguas menos usadas (EBLUL)



[8] Recomendação do Conselho da Europa 1598 (2003) Protecção de línguas símbolo, no Conselho Europeu dos Estados Membros.



[9] Programa e-Conteúdo

[10] MACS (Acesso Multilingue a Assuntos)

[11] ISO 5964:1985 Linhas de Orientação para o estabelecimento e desenvolvimento de thesauri multilingues



[12] ISO 2788:1986 Linhas de Orientação para o estabelecimento e desenvolvimento de thesauri monolingues



[13] BS 9723: Um novo Padrão Britânico para vocabulários estruturados [por] Stella G. Dextre Clarke.



[14] Linhas de Orientação para a formação de Linguagens equivalentes: Um Modelo baseado na Arte e Arquitectura do Thesaurus. Instituto de Informação Getty.



[15] Jean Aitchison, Alan Gilchrist [e] David Bawen: Construção e uso do Thesaurus: um manual prático. 4ª edição. Aslib: Londres, 2000. ISBN 0-85142-446-5

[16] Website Cultural dos Princípios de Qualidade. Projecto Minerva, 2003.



[17] Comentário e exploração dos dez “princípios de qualidade” publicados pelo projecto Minerva e acordados no 5º NRG encontro, em Parma.



[18] Comissão da Língua Galesa

[19] Unicode

[20] The Unicode Standard, Version 4.0 (Padrão Unicode, Versão 4.0) Boston, MA, Addison-Wesley, 2003. ISBN 0-321-18578-1



[21] ISO/IEC 10646:2003 Tecnologia de Informação – Conjunto de caracteres universais codificados Multiple-Octet (UCS)



[22] AsiaSoft

[23] Software Fingertip



[24] Projecto LEAF (Ligação e Exploração de Ficheiros de Autoridade)



[25] MALVINE (Manuscritos e Cartas via rede integrada, na Europa)



[26] ISO 15919:2001, Transliteração de Devanagari e escritos relacionados com o indi para caracteres latinos.



[27] AltaVista Babelfish

Ferramentas da Linguagem do Google



World Lingo



Tradução Livre ;

Systran

Linguagem Yahoo, tradução e Recursos de Interpretação



[28] Babblefish

[29] Associação Europeia de Máquinas de Tradução



[30] MICHAEL, Inventário Multilingue do Património Cultural na Europa



[31] Projecto MINERVA

[32] Biblioteca Europeia

[33] Interpretação Conjunta da Comunidade Europeia e Serviços de Conferências (SCIC)



[34] Forum de Avaliação da Linguagem Cruzada (CLEF) e CLEF 2004

|LINKS |

Voltar aos objectivos

Alemanha

Online-Auskunft

O Zentral–e Landesbibliothek em Berlim é a primeira biblioteca de língua alemã que utiliza o QuestionPoint por referência virtual (traduziu o interface em alemão). O utilizador pode escolher, para fazer uma pergunta, entre várias línguas diferentes (Inglês, Alemão, Francês, Espanhol, Português, Holandês, Eslovaco, Chinês, Japonês e Coreano).



Dinamarca

Danish Central Library for Immigrant Literature (Indvandrerbiblioteket)

Destinado a lidar com as necessidades culturais de imigrantes recentes, contem para cima de 146.000 items, em cerca de 100 línguas. As colecções são conservadas em cerca de 50 línguas.



FINFO – Information for Ethnic Minorities in Denmark

A finalidade da Finfo é a de dar representantes a minorias étnicas com melhor acesso à informação, nas próprias línguas, acerca dos seus direitos, obrigações e oportunidades, na sociedade dinamarquesa.



Noruega

BAZAR

É um portal multilingue para a informação acerca da sociedade e cultura norueguesa, destinado às minorias étnicas que vivem na Noruega. Este website dá, também, ligações a jornais, em diferentes línguas. O BAZAR está disponível em 14 línguas.



Detektor

É um directório pesquisável e de assuntos anotados, de recursos da Internet, em norueguês, dinamarquês, sueco, inglês e outras línguas. Os elementos usados para descrever os recursos são os Dublin Core, mas com ajustamentos locais.



Reino Unido

Multikulti

É um projecto conjunto estabelecido pela London Advice Services Alliance e pela London Libraries Development Agency para dar informação acerca de assuntos relacionados com a assistência social, numa grande variedade de línguas. Foi premiado com o prémio “Communications Social Innovations” para 2004 pelo Global Ideas Bank (Instituto para Invenções Sociais) (). O website está baseado no MKDoc Content Management System (), que permite que sejam criadas websites que vão ao encontro de padrões de acessibilidade normal. Devido ao uso do Unicode no website, é possível visualiza-l’o em todos os browsers e em todas as plataformas de computadores.



Norfolk Country @ your service

São planfletos de boas vindas, em 33 línguas estrangeiras, disponíveis online.



................
................

In order to avoid copyright disputes, this page is only a partial summary.

Google Online Preview   Download