The Corpus of Contemporary American English (COCA) is the largest freely-available corpus of English, and the only large and balanced corpus of American English.
It contains more than 450 million words of text and is equally divided among spoken, fiction, popular magazines, newspapers, and academic texts. It includes 20 million words each year from 1990-2012 and the corpus is also updated regularly (the most recent texts are from Summer 2012).
The interface allows you to search for exact words or phrases, wildcards, lemmas, part of speech, or any combinations of these.
The corpus also allows you to easily limit searches by frequency and compare the frequency of words, phrases, and grammatical constructions, in at least two main ways:
By genre: comparisons between spoken, fiction, popular magazines, newspapers, and academic, or even between sub-genres (or domains), such as movie scripts, sports magazines, newspaper editorial, or scientific journals
Over time: compare different years from 1990 to the present time
You can also easily carry out semantically-based queries of the corpus. For example, you can contrast and compare the collocates of two related words (little/small, democrats/republicans, men/women), to determine the difference in meaning or use between these words. You can find the frequency and distribution of synonyms for nearly 60,000 words and also compare their frequency in different genres, and also use these word lists as part of other queries. Finally, you can easily create your own lists of semantically-related words, and then use them directly as part of the query.
Source: COCA
Português é a 5º língua mais usada na web
Com 83 milhões de usuários de internet no mundo, idioma superou árabe, francês e alemão e, em alguns anos, deve desbancar o japonêsA língua portuguesa já é o quinto idioma mais “falado” na internet. Dados divulgados pela União Internacional de Telecomunicações apontam que o português já superou o árabe, francês e o alemão entre as línguas com o maior número de usuários navegando pela web.
Para a entidade, a expansão da web no Brasil nos últimos dez anos explica em grande parte essa posição de destaque da língua. Seriam pelo menos 83 milhões de pessoas no mundo usando o português na rede. Na avaliação dos especialistas, em poucos anos o português poderá superar o japonês - hoje com 99 milhões de usuários na rede - e ocupar a quarta colocação.
Isso porque a expansão da rede no Brasil, em Angola e em Moçambique ainda teria um amplo caminho a percorrer até atingir os mesmos níveis de penetração dos países ricos, enquanto no Japão a realidade é de uma “maturidade” da tecnologia.
Prova disso é que já há mais lusófonos na web que os 75 milhões de alemães e 60 milhões de usuários que usam o francês. O árabe, apesar de espalhada por diversas regiões do mundo, tem hoje uma população de usuários da internet inferior ao português, com 65 milhões.
A língua preponderante da internet continua sendo o inglês, com uma população de usuários de 565 milhões. Mas, se esse domínio era total há dez anos, hoje ele já enfrenta a ameaça da China. O número de pessoas que usam prioritariamente o chinês na web já chega a 510 milhões de pessoas. A terceira colocação é do espanhol, com 165 milhões de usuários. Para especialistas, parte da influência de uma língua será medida em alguns anos no mundo justamente pelo seu uso na internet.
Política
A contabilidade do número de usuários em cada língua não serve apenas como indicador da influência de uma cultura. Governos de países emergentes vêm pressionando a União Internacional de Telecomunicações a adotar uma posição mais forte em relação à defesa de que haja um controle maior por parte de governos sobre uma rede que hoje é amplamente dominada por empresas de tecnologia de países ricos. Nesta semana, em Genebra, a UIT realiza outro debate sobre o assunto e, uma vez mais, países emergentes pressionarão por uma ingerência maior dos Estados sobre o futuro da rede.Existem pelo menos três grupos de países que não disfarçam o choque de opiniões. De um lado, americanos e europeus insistem que a internet precisa continuar sua trajetória semiprivada, sem um maior envolvimento do Estado. Países emergentes acusam essa posição de ser “cínica”, já que a própria empresa que estabelece os domínios de sites teve sua origem por um projeto do governo americano. “O que os EUA querem é o não envolvimento de outros governos na web. Mas eles continuariam com sua influência clara”, apontou um conselheiro de uma agência reguladora sul-americana.
Controle
No outro extremo estão países como a Rússia, que defendem controle estatal total sobre a web. Em uma posição intermediária está o Brasil, ainda que Brasília insista que uma de suas metas é garantir maior “democratização” na gestão mundial da internet.
Autor: Jamil Chade
Fonte: O Estado de S.Paulo
Sugestão de leitura
Aqui vai uma sugestão de leitura e um trecho de mais uma ótima postagem do blog “Esboços, rascunhos e ensaios”, de William C. Cruz.
“Adler fala de quatro diferentes níveis de leitura – leitura elementar, leitura inspecional, leitura analítica e, por fim, leitura sintópica. A leitura elementar, de maneira bem grosseira, é aquele nível de leitura suficiente para que se considere uma pessoa alfabetizada. É elementar porque ainda restrita à mera decodificação de sinais gráficos, seguido de sua respectiva conversão em sons, sem que necessariamente se chegue às ideias propriamente ditas. O segundo e o terceiro níveis de leitura são os mais decisivos para o trabalho do revisor, e vou tratar de pontos específicos adiante. A leitura sintópica é aquele tipo de leitura em que nos esforçamos sobretudo para relacionar ideias afins de livros ou autores diferentes.”
Fonte: Esboços, rascunhos e ensaios.
O inferno vivido e traduzido pelos tradutores do Dan Brown
Muito bacana essa matéria sobre as condições de trabalho e de segurança impostas aos tradutores de “Inferno” o mais novo livro do Dan Brown.
Aqui vão os trechos mais interessantes:
Tudo começou no dia 18 de fevereiro, em um esconderijo subterrâneo vigiado por dois seguranças armados, apelidado de “o bunker”. Lá dentro, 11 indivíduos que não falam a mesma língua: ouvem-se frases em alemão, francês, português, espanhol, catalão e italiano. Dada a segurança da operação, o bunker fica no último lugar em que alguém iria procurá-lo: embaixo de um prédio frequentado diariamente por 400 jornalistas — o edifício Mondadori, sede da editora de mesmo nome, projetado por Oscar Niemeyer, às portas de Milão. Assim que entram no bunker, as 11 pessoas têm seus celulares apreendidos, bem como quaisquer outros dispositivos com que possam se comunicar com o exterior. Tudo o que têm é um crachá e alguns cigarros — para os que fumam. Lá fora, o dia. Logo vai nevar, mas o clima pouco importa quando se é obrigado a permanecer em um bunker durante dois meses, incluindo os domingos. Não interessa em quantas semanas os “reclusos” levarão a missão a cabo. Nenhum deles poderia abandonar o local definitivamente antes de 5 de abril.
(…)
Os “reclusos” são os tradutores do livro (dias depois, dois editores se somariam a eles), chegados da França, da Espanha, da Alemanha, do Brasil e da Itália. A cada manhã, uma van particular os levava até o bunker. Todos trabalhavam ali, sem descanso, diariamente, até as nove da noite, quando novamente entravam na van e eram conduzidos de volta. Cada movimento deles era anotado num registro. Consultá-lo, agora, significa ter uma ideia mais precisa do seu dia a dia: “Pausa para fumar”, “Passeio rápido”, “Refeição”, “Olhar a neve”. Sim, a neve. Fabiano Morais, um dos tradutores do Brasil, nunca a tinha visto. Quando notou, através de frestas nas janelas, que caíam alguns flocos de neve, pediu para sair, para descobrir que efeito tinha.
Tudo aconteceu sob os olhares de guardas armados, segundo um rígido código de segurança: nenhum documento podia sair do bunker. Nenhum telefonema era admitido. Os computadores em que se faziam as traduções não tinham acesso à internet: havia terminais à parte, para pesquisas, vigiados por membros da segurança. Nenhum dos tradutores podia sequer revelar o motivo pelo qual estava ali: cada um tinha uma espécie de “álibi”, uma história para despistar os curiosos, que também não pode ser revelada, nem mesmo agora que a operação de tradução já está concluída e os documentos em papel (que, obviamente também eram secretos), destruídos.