Home - Convergência Digital

Equipe PUC-Rio/IBM vence desafio internacional

Convergência Digital - Carreira
:: Da redação - 22/06/2012
Um programa de computador elaborado por três pesquisadores brasileiros — Cícero Nogueira dos Santos, da IBM Research, Eraldo Rezende Fernandes e Ruy Luiz Milidiú, ambos da PUC-Rio - conquistou oprimeiro lugar na Conference on Natural Language Learning (CoNLL) Shared Task, a mais importante competição internacional em Linguística Computacional.

O programa desenvolvido está baseado em resultados originais de duas pesquisas, obtidos inicialmente na tese de doutorado em informática de Cícero dos Santos e estendidos na tese em elaboração de Eraldo Fernandes, ambas sob a orientação do professor Ruy Luiz Milidiú, do Departamento de Informática da PUC-Rio. É uma conquista que demonstra a qualidade da tecnologia da informação gerada no Brasil, bem como o vigor científico de nossos pesquisadores.

A Linguística Computacional estuda a linguagem humana sob um ponto de vista computacional. Desta forma, permite a construção de tecnologias para processamento de textos, amplamente utilizadas por gigantes da Internet, tais como Google, Facebook e Twitter.

Um exemplo bem simples são os chamados filtros antispam, aqueles programas que automaticamente detectam mensagens lixo que são encaminhadas para nossos endereços de correio eletrônico. Uma variante similar, porém mais sofisticada, são os detectores de mensagens contendo ameaças à segurança pública.

A variante correspondente no mundo dos negócios são os detectores de mensagens com oportunidades de comercialização ou serviços. Hoje em dia, as grandes empresas têm equipes de profissionais monitorando as mensagens que circulam nas redes sociais, visando identificar necessidades de atendimento a clientes e também proteger a imagem de suas marcas. Os volumes de mensagens em meio digital atingem cifras colossais. Desta forma, automatizar o processamento do conteúdo desses documentos viabiliza diversos novos modelos de negócios.

Desde 1999, a CoNLL define uma tarefa anual, que estabelece um novo patamar no processamento automático da linguagem humana. Neste ano, a tarefa escolhida foi multilingue, abrangendo três idiomas: o inglês, o chinês e o árabe.

“A cada ano, a competição é mais acirrada e, agora em 2012, foi uma satisfação enorme sermos a melhor do mundo”, revela Ruy Milidiú. Mesmo não sendo os idiomas nativos dos brasileiros, a equipe da PUC-Rio conquistou a maior média de acertos entre as três línguas, sendo primeiro lugar no inglês e no árabe, e quinto no chinês, superando até mesmo concorrentes desses países. Para cada um destes idiomas, os sistemas participantes da competição tiveram que identificar todas as diferentes menções a uma mesma entidade ou fato e agrupá-las.

Por exemplo, numa notícia reportando declarações da Presidente Dilma Roussef encontraremos diferentes menções a nossa Presidente, tais como “Dilma”, ou simplesmente “a Presidente” ou ainda o uso do pronome “ela”. Esta tarefa linguística, denominada Resolução de Correferências, vem sendo atacada sem sucesso há algumas décadas. É exatamente aí que o time dos três pesquisadores brasileiros mostrou sua criatividade e engenhosidade.

Aplicando técnicas de reconhecimento estatístico de padrões, também conhecido como Aprendizado de Máquina, os cientistas elaboraram um método que captura os padrões de correferências em textos, que pode ser aplicado a qualquer idioma. Para a seguinte sentença em chinês abaixo, por exemplo, os ideogramas azuis foram corretamente identificados pelo sistema brasileiro como diferentes menções a uma mesma entidade e os vermelhos a uma outra entidade.

Enviar por e-mail   ...   Imprimir texto
 

Veja mais artigos
Veja mais artigos

Um passo além

:: Luiz Gonzaga Bertelli

Ao invés de reclamar da dificuldade em encontrar colaboradores qualificados, as empresas devem abrir as portas para jovens estudantes e dar um passo à frente na qualificação de mão de obra.

Destaques
Destaques

Engenheiro de software é uma das profissões de 2013

Função está entre as três melhores do ano, segundo ranking do site CareerCast.

Brasileiro tem um dos piores níveis de inglês no mundo

Estudo mundial coloca o Brasil com uma nota de 3,27 e na 70ª posição entre os 78 países analisados.

Microsoft quer gerar empregos para 60 milhões de jovens na América Latina

Durante o Forum de Líderes Governamentais, o presidente da companhia para a região, Hernan Rincon, revelou que um em cada cinco jovens latinoamericanos está sem emprego.

Mercado busca analistas de ERP no Brasil

Levantamento mostra que há uma forte demanda por profissionais nesta área. Salários podem chegar a R$ 19,5 mil.

Há vagas em TIC. Mas onde estão os interessados?

Comissão Europeia cria programa para atrair cerca de 900 mil profissionais. No Brasil, a caça aos talentos também é um desafio.

Veja mais vídeos
Veja mais vídeos da CDTV

Copyright © 2013 Convergência Digital ... Todos os direitos reservados ... É proibida a reprodução total ou parcial do conteúdo deste site