Algoritmo desenvolvido por cientista israelense reconhece humor em textos

É possível treinar um algoritmo para analisar um texto e dizer quão engraçado ele é? O cientista de dados Josh Friedlander, do PerceptiveAI, se propôs a tarefa acima oito semanas após começar o programa de concentração em Data Science do Israel Tech Challenge.

friends-group-happy-1368494Com a tarefa de desenvolver um projeto de conclusão em Machine Learning e frustrado por nunca ter vencido o concurso de legendas para charge da revista New Yorker, Friedlander decidiu se arriscar pelo mundo real dos dados abertos e, usando Processamento Natural de Linguagem, responder à seguinte questão: “O que é engraçado?”.

Depois de aprender sobre os fundamentos teóricos e a prática de muitos aspectos do ML, o pesquisador passou à criação de um projeto de ML de ponta a ponta: da manipulação de dados à exploração, da engenharia de recursos à modelagem, e tudo mais.

Usando a base de dados do próprio concurso de legendas do New Yorker, que desde 2005 premia semanalmente a legenda mais divertida enviada por leitores para a charge estampada na última página de cada edição, a ideia inicial era substituir a “torre de marfim” dos julgamentos dos editores de charge por uma pontuação científica, quantificável e replicável – entra o FunnyScore ™.

Após inúmeras tentativas e diferentes testes de formulação, Friedlander observou que, usando apenas o conhecimento humano das palavras de uma legenda, o algoritmo foi capaz de prever uma pontuação agregada com uma taxa de erro razoavelmente pequena. Também foi possível usá-lo para testar ideias próprias de legenda, a fim de ter uma ideia antecipada de como elas seriam recebidas pela comunidade de usuários que classificam as legendas do New Yorker on-line.

Leia AQUI a reportagem completa.

fonte: Israel Trade and Investment Brazil.